Nous avons vu l'émergence d'un nouveau géant de l'IA générative, OpenAI, avec l'introduction de ChatGPT en novembre 2022. ChatGPT sert d'interface orientée chat pour le modèle sous-jacent qu'il utilise. La première version du chatbot reposait sur un grand modèle de langage appelé GPT-3.5. Mais le mardi 14 mars 2023, 4 mois après le premier lancement de ChatGPT, OpenAI donne du peps avec la sortie de GPT-4, un modèle plus performant que les versions précédentes. Initialement conçu pour interagir avec GPT-3.5, le chatbot fonctionne désormais comme un moyen d'interagir avec GPT-4.
La même chose que GPT-3.5 peut faire, mais plus. La société a déclaré dans un article de blog,
"GPT-4 est plus fiable, créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5."
Depuis 2018, OpenAI diffuse des modèles de langage GPT, mais de tous les énormes modèles de langage d'Open AI, GPT-4 n'est pas seulement le plus récent, mais aussi le plus puissant. OpenAI a indiqué avoir utilisé Microsoft Azure pour former le modèle. Voici quelques comparaisons entre GPT-4 et GPT-3.5
GPT-4 accepte les entrées visuelles, et GPT-3.5 ne le fait pas
Étant donné que GPT-4 est "multimodal", comme spécifié par OpenAI, et peut comprendre de nombreuses "modalités" d'informations, il peut être invité à produire du contenu par des signaux visuels et textuels, tandis que GPT-3.5 était essentiellement capable de lire et d'écrire du texte. . Néanmoins, la société ne déploie pas sa capacité de description d'image immédiatement, et la version GPT-4 reste disponible uniquement pour les abonnés des utilisateurs et développeurs ChatGPT Plus d'OpenAI, et ne prend en charge que le texte.
Comparé à GPT-3.5, GPT-4 a un tampon plus grand
En termes simples, le GPT-4 a une mémoire plus longue que le modèle précédent. Avec GPT-3.5 et l'itération précédente de ChatGPT, le maximum était de 4 096 "jetons", soit environ 8 000 mots, tandis que le nombre maximum de jetons pour GPT-4 est de 32 768, soit environ 64 000 mots. C'est 8 fois plus de capacité de mémoire.
GPT-4 a une variété de "personas". ou la maniabilité, contrairement au GPT-3.5
La dirigeabilité fait référence à la capacité de contrôler ou d'influencer la sortie d'un modèle de langage dans une direction ou un style spécifique. En d'autres termes, il permet aux utilisateurs de guider le modèle de langage pour produire un texte qui correspond à un ton, un style ou un sujet particulier. Alors que GPT-3 n'a pas de fonctions de direction intégrées, GPT-4 en a. Avec GPT-4, les développeurs et les utilisateurs de ChatGPT peuvent spécifier le style et la tâche de leur IA en donnant ces instructions dans le message "système", par opposition à la personnalité ChatGPT traditionnelle avec une verbosité, un ton et un style définis. La société a déclaré que bien que cette fonctionnalité ne soit actuellement accessible qu'aux développeurs, elle sera bientôt également disponible pour les utilisateurs de ChatGPT.
GPT-4 a une gamme de langues plus large.
Cela signifie que GPT-4 peut comprendre et générer du texte dans une plus grande variété de langues que son prédécesseur GPT-3.5. Il s'agit d'une avancée significative dans le domaine du traitement du langage naturel. Selon OpenAI, GPT-4 bat les performances en anglais de GPT-3.5 et d'autres LLM dans 24 des 26 langues testées. En conséquence, GPT-4 peut répondre avec précision à un grand nombre de questions à choix multiples dans 26 langues différentes.
GPT-4 a moins d'"hallucinations" sur les faits
Même s'il n'arrête pas complètement les hallucinations, le GPT-4 les diminue considérablement par rapport aux variantes précédentes. Cependant, il y a une mise en garde, GPT-4 n'est toujours pas entièrement fiable. La société a déclaré que le modèle de langage mis à jour continue d'"halluciner" les faits et de présenter une logique erronée, mais pas aussi mauvaise que GPT-3.5. Les hallucinations dans le contexte d'un logiciel de modèle de langage font référence à la génération d'un texte qui semble cohérent et significatif mais qui n'est pas réellement pris en charge par les données d'entrée. Cela peut se produire lorsqu'un modèle de langage génère un texte qui n'est pas ancré dans le contexte ou qui n'est pas cohérent avec la signification sémantique du texte d'entrée.
En d'autres termes, un modèle de langage peut parfois générer un texte qui n'est pas précis ou plausible sur la base des informations sur lesquelles il a été entraîné, ce qui entraîne ce que l'on appelle communément des "hallucinations". Le modèle intègre également des préjugés sociaux et des invites contradictoires en plus de la restriction ci-dessus. Le billet de blog d'OpenAI a déclaré,
"Le GPT-4 obtient un score de 40 % supérieur au dernier GPT-3.5 sur les évaluations internes contradictoires des faits."
Selon le Washington Post, les LLM ont appris à imiter les préjugés humains de race, de sexe, de religion et de classe à la suite de leur formation sur le texte et les visuels sur Internet.
GPT-4 a également des restrictions supplémentaires similaires à celles trouvées dans GPT-3.5, dont l'une est qu'il n'a toujours pas connaissance des événements survenus après septembre 2021. La capacité des autres à lui enseigner de nouvelles choses est également limitée par le fait qu'il n'apprend pas de ses expériences. Quoi qu'il en soit, GPT-4 est toujours plus intelligent ; car il est plus précis, plus précis et possède une meilleure expertise.
Le modèle linguistique a également montré qu'il est capable de réussir les examens. Selon OpenAI, il a obtenu un score au 90e centile lors d'un examen fictif du barreau, au 93e centile lors d'un test de lecture SAT et au 89e centile lors d'un test de mathématiques SAT.
GPT-4 a le potentiel d'être utilisé dans un large éventail d'applications qui nécessitent la compréhension et la génération du langage naturel. Le logiciel d'apprentissage des langues Duolingo, le fournisseur de paiement Stripe, la plateforme d'apprentissage en ligne Khan Academy et la société de services financiers Morgan Stanley faisaient partie des entreprises mentionnées dans la déclaration d'OpenAI qui utilisent actuellement le nouveau modèle.
Microsoft a également signalé que son chatbot, BingAI, utilisait GPT-4 depuis le début, même avant la sortie publique du modèle.
"Nous sommes heureux de confirmer que le nouveau Bing fonctionne sur GPT-4, que nous avons personnalisé pour la recherche. Si vous avez utilisé le nouvel aperçu Bing à tout moment au cours des cinq dernières semaines, vous avez déjà expérimenté un début version de ce modèle puissant.
Yusuf Mehdi, vice-président d'entreprise et directeur du marketing pour les consommateurs chez Microsoft, a écrit dans un communiqué.
GPT-4 "excelle dans les tâches qui nécessitent un raisonnement avancé, une compréhension d'instructions compliquées et plus de créativité", selon OpenAI.
Les utilisateurs ont signalé avoir utilisé GPT-4 de diverses manières inventives dans le court laps de temps qui s'est écoulé depuis sa sortie :
On pense que les possibilités de ce nouvel outil sont infinies.
\Fondamentalement, pour accéder à ChatGPT, vous devez d'abord vous inscrire sur l'OpenAI
Puisque Microsoft a confirmé que le nouveau Bing fonctionne sur le nouveau modèle de GPT, il est alors évident que des millions d'utilisateurs de Bing peuvent déjà y accéder via le chatbot.
Le nouveau modèle est également accessible via l'API, la société a déclaré qu'elle accordait la priorité à l'accès à l'API pour les développeurs qui donnent des évaluations de modèle exceptionnelles à OpenAI Evals pendant le lent déploiement de GPT-4 afin d'apprendre comment ils peuvent améliorer le modèle pour tout le monde.