paint-brush
Exécutez Llama sans GPU ! LLM quantifié avec LLMWare et Quantized Dragonpar@shanglun
2,627 lectures
2,627 lectures

Exécutez Llama sans GPU ! LLM quantifié avec LLMWare et Quantized Dragon

par Shanglun Wang12m2024/01/07
Read on Terminal Reader

Trop long; Pour lire

À mesure que les ressources GPU deviennent de plus en plus limitées, la miniaturisation et les LLM spécialisés gagnent lentement en importance. Aujourd'hui, nous explorons la quantification, une technique de miniaturisation de pointe qui nous permet d'exécuter des modèles à paramètres élevés sans matériel spécialisé.
featured image - Exécutez Llama sans GPU ! LLM quantifié avec LLMWare et Quantized Dragon
Shanglun Wang HackerNoon profile picture
Shanglun Wang

Shanglun Wang

@shanglun

Quant, technologist, occasional economist, cat lover, and tango organizer.

0-item

STORY’S CREDIBILITY

Original Reporting

Original Reporting

This story contains new, firsthand information uncovered by the writer.

L O A D I N G
. . . comments & more!

About Author

Shanglun Wang HackerNoon profile picture
Shanglun Wang@shanglun
Quant, technologist, occasional economist, cat lover, and tango organizer.

ÉTIQUETTES

Languages

CET ARTICLE A ÉTÉ PARU DANS...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite