C'est toi 👆 ? Vous n'avez pas fait de CompSci, alors maintenant vous êtes le bouffon de la cour, essayant rapidement d'étendre les connaissances dans l' __ que le monde ait jamais connue ? Respirez. Voici un article qui revient aux sources où vous pouvez poser « et ne pas vous sentir jugé. industrie __ à l'évolution la plus rapide une question vraiment bête » Un petit glossaire des termes LLM pour ceux qui apprennent — Plus que ce que l'on voit… Un type de modèle utilisé dans l'apprentissage automatique, en particulier pour gérer des séquences de données telles que du texte ou de l'audio. Il permet de comprendre le des phrases et peut être utilisé pour traduire des langues, résumer du texte ou générer des réponses de chatbot. Transformateur contexte C'est comme une énorme base de données de connaissances linguistiques qui peut rédiger des articles, répondre à des questions ou créer des dialogues réalistes. Large Language Model (LLM) — Un transformateur est une technique utilisée en IA pour traiter le langage. Un LLM est un grand modèle d'IA pour les tâches linguistiques, souvent construit à l'aide de la technique Transformer. — La partie d'un système informatique ou d'un logiciel qui permet aux utilisateurs d'interagir avec lui. Considérez-le comme le frontal d'un programme dans lequel vous tapez votre question ou votre commande et le programme répond. Interface — En IA, cela signifie utiliser un modèle entraîné pour faire des prédictions ou des décisions. Par exemple, après avoir entraîné un modèle à reconnaître les chats sur des images, l'inférence se produit lorsque le modèle regarde une nouvelle image et décide s'il y a un chat dedans.🐈⬛ Inférence – Un moyen de former des machines où vous donnez des exemples de modèles avec des réponses. C'est comme montrer à un programme de nombreuses photos de chats et lui dire « Ceci est un chat » pour qu'il apprenne à quoi ressemblent les chats. Apprentissage supervisé — Entraîner une machine sans lui donner les réponses. Le modèle examine les données et tente de trouver lui-même des modèles ou des groupes. Par exemple, il peut trier différents types de musique en genres sans connaître les noms des genres. ( Apprentissage non supervisé heeeyo) – Enseigner aux machines par essais et erreurs. La machine fait des choix dans une situation et obtient des récompenses ou des pénalités selon que ses choix sont bons ou mauvais, apprenant au fil du temps à prendre de meilleures décisions ( Apprentissage par renforcement ou à devenir irritée et secrète). — Conçu pour fonctionner un peu comme un cerveau humain. Il se compose de nombreuses petites unités (comme les cellules cérébrales) qui travaillent ensemble pour traiter les informations et résoudre des problèmes. Réseau neuronal Créer un LLM Rassembler vos données Commencez par collecter une grande variété de données textuelles. Cela peut inclure des livres, des articles en ligne ou des données provenant de bases de données. Plus vos données sont diversifiées, meilleur sera votre LLM pour comprendre les différents aspects du langage. Kaggle dispose d'excellentes données pour les projets de ML et de science des données. Découvrez . Jeremy Howard, local australien et grand maître de Kaggle héberge souvent des ensembles de données publiés par des chercheurs et des développeurs. Bon endroit pour chercher. GitHub À mentionner - Google Scholar pour les ensembles de données liés aux articles et aux sites gouvernementaux Données de prétraitement Maintenant, Cette étape consiste à corriger les erreurs, à supprimer les parties inutiles et à les organiser afin que votre IA puisse en tirer efficacement des leçons. nettoyez ces données. Considérations Comment allez-vous gérer les valeurs manquantes, résoudre les problèmes de formatage et gérer les données en double ? Choisir une architecture modèle L'architecture du modèle est essentiellement la conception ou la structure du modèle, agissant comme un modèle guidant la manière dont l'IA traite les informations. L'architecture du transformateur est particulièrement adaptée pour gérer des données séquentielles telles que du texte, en se concentrant sur la compréhension du contexte au sein des données, et nous nous en tiendrons à cela pour aujourd'hui. Entraîner le modèle Introduisez les données préparées dans votre modèle d’IA. C’est là que votre IA commence à apprendre les subtilités du langage. La formation peut prendre du temps et des ressources, surtout avec beaucoup de données. (C'est ici que j'aimerais mentionner mes copains d' , le podcast à venir) Unsloth Test et affinage Après la formation, évaluez dans quelle mesure votre IA comprend et génère le langage. En fonction des résultats, vous devrez peut-être vous ajuster et vous recycler pour améliorer ses performances. Exécuter le LLM Maintenant, comment piloter la bête ? Au lieu de créer un LLM à partir de zéro, vous pouvez utiliser pour accéder à des modèles déjà formés sur des quantités folles de données. Vous pouvez exécuter ces modèles sur leur service cloud ou les télécharger pour les exécuter localement sur votre machine. Hugging Face Quel que soit votre choix, la clé est d'avoir un modèle LLM formé que ce soit via Internet ou directement sur votre ordinateur. et les moyens d'interagir avec lui, Il s'agit de la première partie d'une série d'articles visant à réduire les obstacles à la compréhension et à l'adoption de l'IA open source. J'écris et produis des podcasts ici- Apprentissage (non)supervisé Autres liens ici https://linktr.ee/Unsupervisedlearning Également publié ici