paint-brush
LLM pour les nuls – Guide pas à pas et glossairepar@reneeeshaw
2,893 lectures
2,893 lectures

LLM pour les nuls – Guide pas à pas et glossaire

par Renee4m2024/01/26
Read on Terminal Reader

Trop long; Pour lire

Il y a des mots que vous ne connaissez peut-être pas en IA. Voici comment je les expliquerais à un enfant de 5 ans.
featured image - LLM pour les nuls – Guide pas à pas et glossaire
Renee HackerNoon profile picture
0-item

C'est toi 👆 ? Vous n'avez pas fait de CompSci, alors maintenant vous êtes le bouffon de la cour, essayant rapidement d'étendre les connaissances dans l' industrie __ à l'évolution la plus rapide __ que le monde ait jamais connue ?

Respirez. Voici un article qui revient aux sources où vous pouvez poser « une question vraiment bête » et ne pas vous sentir jugé.

Un petit glossaire des termes LLM pour ceux qui apprennent

Transformateur — Plus que ce que l'on voit… Un type de modèle utilisé dans l'apprentissage automatique, en particulier pour gérer des séquences de données telles que du texte ou de l'audio. Il permet de comprendre le contexte des phrases et peut être utilisé pour traduire des langues, résumer du texte ou générer des réponses de chatbot.


Large Language Model (LLM) — C'est comme une énorme base de données de connaissances linguistiques qui peut rédiger des articles, répondre à des questions ou créer des dialogues réalistes.

crédit : auteur réalisé en excallidraw


Un transformateur est une technique utilisée en IA pour traiter le langage. Un LLM est un grand modèle d'IA pour les tâches linguistiques, souvent construit à l'aide de la technique Transformer.


Interface — La partie d'un système informatique ou d'un logiciel qui permet aux utilisateurs d'interagir avec lui. Considérez-le comme le frontal d'un programme dans lequel vous tapez votre question ou votre commande et le programme répond.


Inférence — En IA, cela signifie utiliser un modèle entraîné pour faire des prédictions ou des décisions. Par exemple, après avoir entraîné un modèle à reconnaître les chats sur des images, l'inférence se produit lorsque le modèle regarde une nouvelle image et décide s'il y a un chat dedans.🐈‍⬛


Apprentissage supervisé – Un moyen de former des machines où vous donnez des exemples de modèles avec des réponses. C'est comme montrer à un programme de nombreuses photos de chats et lui dire « Ceci est un chat » pour qu'il apprenne à quoi ressemblent les chats.


Apprentissage non supervisé ( heeeyo) — Entraîner une machine sans lui donner les réponses. Le modèle examine les données et tente de trouver lui-même des modèles ou des groupes. Par exemple, il peut trier différents types de musique en genres sans connaître les noms des genres.

un exemple de crédit « fewshot learning » : auteur réalisé en excallidraw



Apprentissage par renforcement – Enseigner aux machines par essais et erreurs. La machine fait des choix dans une situation et obtient des récompenses ou des pénalités selon que ses choix sont bons ou mauvais, apprenant au fil du temps à prendre de meilleures décisions ( ou à devenir irritée et secrète).


Réseau neuronal — Conçu pour fonctionner un peu comme un cerveau humain. Il se compose de nombreuses petites unités (comme les cellules cérébrales) qui travaillent ensemble pour traiter les informations et résoudre des problèmes.

Créer un LLM

Rassembler vos données


Commencez par collecter une grande variété de données textuelles. Cela peut inclure des livres, des articles en ligne ou des données provenant de bases de données. Plus vos données sont diversifiées, meilleur sera votre LLM pour comprendre les différents aspects du langage.


Kaggle dispose d'excellentes données pour les projets de ML et de science des données. Découvrez Jeremy Howard, local australien et grand maître de Kaggle .


GitHub héberge souvent des ensembles de données publiés par des chercheurs et des développeurs. Bon endroit pour chercher.


À mentionner - Google Scholar pour les ensembles de données liés aux articles et aux sites gouvernementaux

Données de prétraitement


Maintenant, nettoyez ces données. Cette étape consiste à corriger les erreurs, à supprimer les parties inutiles et à les organiser afin que votre IA puisse en tirer efficacement des leçons.


Considérations

Comment allez-vous gérer les valeurs manquantes, résoudre les problèmes de formatage et gérer les données en double ?


Choisir une architecture modèle

L'architecture du modèle est essentiellement la conception ou la structure du modèle, agissant comme un modèle guidant la manière dont l'IA traite les informations.


L'architecture du transformateur est particulièrement adaptée pour gérer des données séquentielles telles que du texte, en se concentrant sur la compréhension du contexte au sein des données, et nous nous en tiendrons à cela pour aujourd'hui.

Entraîner le modèle

Introduisez les données préparées dans votre modèle d’IA. C’est là que votre IA commence à apprendre les subtilités du langage. La formation peut prendre du temps et des ressources, surtout avec beaucoup de données. (C'est ici que j'aimerais mentionner mes copains d' Unsloth , le podcast à venir)

Test et affinage

Après la formation, évaluez dans quelle mesure votre IA comprend et génère le langage. En fonction des résultats, vous devrez peut-être vous ajuster et vous recycler pour améliorer ses performances.


crédit : auteur réalisé en excallidraw


Exécuter le LLM

Maintenant, comment piloter la bête ?

Au lieu de créer un LLM à partir de zéro, vous pouvez utiliser Hugging Face pour accéder à des modèles déjà formés sur des quantités folles de données. Vous pouvez exécuter ces modèles sur leur service cloud ou les télécharger pour les exécuter localement sur votre machine.


Quel que soit votre choix, la clé est d'avoir un modèle LLM formé et les moyens d'interagir avec lui, que ce soit via Internet ou directement sur votre ordinateur.

crédit auteur réalisé en excallidraw


Il s'agit de la première partie d'une série d'articles visant à réduire les obstacles à la compréhension et à l'adoption de l'IA open source.


J'écris et produis des podcasts ici-

Apprentissage (non)supervisé


Autres liens ici https://linktr.ee/Unsupervisedlearning


Également publié ici