paint-brush
Execute o Llama sem GPU! LLM Quantizado com LLMWare e Dragão Quantizadopor@shanglun
2,601 leituras
2,601 leituras

Execute o Llama sem GPU! LLM Quantizado com LLMWare e Dragão Quantizado

por Shanglun Wang12m2024/01/07
Read on Terminal Reader

Muito longo; Para ler

À medida que os recursos da GPU se tornam mais limitados, a miniaturização e os LLMs especializados estão lentamente ganhando destaque. Hoje exploramos a quantização, uma técnica de miniaturização de ponta que nos permite executar modelos de altos parâmetros sem hardware especializado.
featured image - Execute o Llama sem GPU! LLM Quantizado com LLMWare e Dragão Quantizado
Shanglun Wang HackerNoon profile picture
Shanglun Wang

Shanglun Wang

@shanglun

Quant, technologist, occasional economist, cat lover, and tango organizer.

0-item

STORY’S CREDIBILITY

Original Reporting

Original Reporting

This story contains new, firsthand information uncovered by the writer.

L O A D I N G
. . . comments & more!

About Author

Shanglun Wang HackerNoon profile picture
Shanglun Wang@shanglun
Quant, technologist, occasional economist, cat lover, and tango organizer.

Rótulos

Languages

ESTE ARTIGO FOI APRESENTADO EM...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite