paint-brush
¡Ejecute Llama sin GPU! LLM cuantificado con LLMWare y Quantized Dragonpor@shanglun
2,627 lecturas
2,627 lecturas

¡Ejecute Llama sin GPU! LLM cuantificado con LLMWare y Quantized Dragon

por Shanglun Wang12m2024/01/07
Read on Terminal Reader

Demasiado Largo; Para Leer

A medida que los recursos de GPU se vuelven más limitados, la miniaturización y los LLM especializados están ganando importancia lentamente. Hoy exploramos la cuantización, una técnica de miniaturización de vanguardia que nos permite ejecutar modelos de altos parámetros sin hardware especializado.
featured image - ¡Ejecute Llama sin GPU! LLM cuantificado con LLMWare y Quantized Dragon
Shanglun Wang HackerNoon profile picture
Shanglun Wang

Shanglun Wang

@shanglun

Quant, technologist, occasional economist, cat lover, and tango organizer.

0-item

STORY’S CREDIBILITY

Original Reporting

Original Reporting

This story contains new, firsthand information uncovered by the writer.

L O A D I N G
. . . comments & more!

About Author

Shanglun Wang HackerNoon profile picture
Shanglun Wang@shanglun
Quant, technologist, occasional economist, cat lover, and tango organizer.

ETIQUETAS

Languages

ESTE ARTÍCULO FUE PRESENTADO EN...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite