ChatGPT a pris le contrôle de Twitter et de presque tout Internet, grâce à sa puissance et au potentiel de mème qu'il offre. Nous savons tous à quel point pouvoir générer des mèmes est le meilleur moyen de conquérir Internet, et cela a donc fonctionné. Puisque vous avez vu de nombreux exemples, vous savez peut-être déjà que ChatGPT est une , avec laquelle vous pouvez discuter. Il est également appelé chatbot, ce qui signifie que vous pouvez interagir avec lui de manière conversationnelle, imitant une discussion humaine en tête-à-tête. IA récemment rendue publique par OpenAI Ce que vous ne savez peut-être pas, c'est ce que c'est et comment ça marche... Regardez la vidéo pour en savoir plus ! Références ►Essayez-le : ►Article de blog d'OpenAI : ►Qu'est-ce que GPT-3 : ►Qu'est-ce que l'apprentissage par renforcement : ►Rejoignez notre communauté Discord : ►Twitter : ►Soutenez-moi sur Patreon : https://chat.openai.com/ https://openai.com/blog/chatgpt/ https://youtu.be/gDDnTZchKec https://youtu.be/C5_NfQy_kZU https://www.louisbouchard.ai/learn-ai-together/ https://twitter.com/Whats_AI https://www.patreon.com/whatsai Transcription vidéo 0:00 vous l'avez vu partout Chad GPT a 0:02 pris sur Twitter et à peu près le 0:04 tout internet grâce à sa puissance et 0:06 le potentiel de mème qu'il nous offre à tous 0:08 savoir être capable de générer des mèmes est le 0:11 meilleur moyen de conquérir Internet et ainsi de suite 0:13 cela a fonctionné puisque vous en avez vu de nombreux 0:14 exemples que vous connaissez peut-être déjà 0:16 chatgpt est une IA récemment publiée pour 0:19 le public par openai vous permettant de 0:21 discuter avec lui c'est aussi appelé un chatbot 0:24 ce qui signifie que vous pouvez interagir avec lui 0:25 imitant par conversion un tête-à-tête 0:28 discussion humaine ce que vous ne savez peut-être pas 0:30 c'est ce que c'est et comment ça marche 0:32 chadjupiti est un modèle basé sur 0:35 apprentissage par renforcement et GPT 0:37 série de modèles d'openai je vais 0:39 vous référer à une vidéo sur le renforcement 0:41 apprenant que nous avons récemment publié avec mon 0:43 ami Elias pour en savoir plus sur le 0:46 sous-domaine de l'IA mais rapidement renforcé 0:48 l'apprentissage est un moyen d'entraîner des algorithmes en 0:51 essais et erreurs visant juste des récompenses 0:54 comme les humains le feraient en apprenant avec 0:56 commentaires positifs plus spécifiquement chat 0:58 GPT a été construit en trois étapes 1:02 était d'abord de prendre un déjà puissant 1:04 modéliser et affiner avec supervisé 1:06 apprendre ce que cela veut dire 1:08 qu'ils ont pris un modèle spécifiquement son 1:11 GPT 3.5 et amélioré et à jour 1:14 version de gpd3 qu'ils ont formé une fois 1:17 en savoir plus sur les exemples de conversation 1:19 spécifiquement au lieu d'être formé sur 1:21 à peu près tout leur internet en tant que gpt3 1:24 est-ce que cela signifie qu'ils essaient de réduire 1:26 ses potentiels strictement aux conversations 1:28 le rendant théoriquement meilleur à 1:31 conversation par rapport à gpt3 depuis un 1:34 spécialiste est presque toujours meilleur que 1:36 un généraliste à une tâche spécifique si vous 1:38 ne sont toujours pas familiers avec le GPT 1:40 série de modèles que je suggérerais 1:42 regarder la courte vidéo d'introduction I 1:44 fait couvrant gpt3 quand il est sorti le 1:47 la deuxième étape consiste à ajouter notre renfort 1:49 l'apprentissage de la magie qui permettra au 1:51 modèle pour pratiquer et s'améliorer à mesure que vous 1:53 savoir que la pratique rend parfait plus 1:55 précisément dans cette étape, nous utiliserons le 1:57 modèle pour discuter avec les humains directement avoir 2:00 il fournit plusieurs réponses possibles et 2:03 demander à l'humain d'évaluer les réponses de 2:05 du meilleur au pire ces données seront alors 2:07 utilisé pour former un autre modèle appelé notre 2:10 modèle de récompense apprenant à reproduire notre 2:12 annotateurs humains cela nous amène à notre dernier 2:15 étape où notre nouveau modèle de récompense 2:18 donner des commentaires au modèle de chat GPT 2:20 répond comme une fonction de récompense pour l'aider 2:22 converger vers les meilleures réponses sur 2:24 fois cette dernière étape est de continuer à former 2:27 notre algorithme après l'amende initiale 2h30 étape de réglage nous l'avons expliqué c'est pourquoi il 2:32 ce sont des entreprises comme l'IA ouverte qui libèrent 2:34 ce genre de modèles incroyablement puissants 2:37 ce sera irréalisable pour les universités 2:39 ou des particuliers, car cela nécessite beaucoup trop 2:42 beaucoup d'informatique et de temps pour la formation 2:44 encore ce qu'ils réalisent est tout à fait 2:46 remarquables et je crois qu'ils valent 2:48 à faire et à partager pour l'Avent 2:50 la science et le tour est joué après avoir couplé le 2:54 GPT déjà puissant et le plus récent 2:56 modèle de langage basé sur le réglage fin pour 2:59 conversations et enfin en utilisant 3:01 renforcement apprendre à le faire 3:03 pratiquer ses compétences de conversation vous 3:05 obtenir le chat GPD comme vous l'avez vu auparavant 3:07 le modèle est assez prometteur mais aussi 3:10 parfois très stupide et ne semble pas 3:12 avoir quelque logique que ce soit c'est quand même 3:15 juste un algorithme et loin d'être 3:17 soit intelligent ou conscient cependant 3:20 cela dépendra de la façon dont nous le définissons à la fois 3:22 a certainement ses limites 3:24 néanmoins les sorties qu'il donne sont 3:27 souvent étonnamment intéressant et 3:29 chatgpt pertinent est définitivement une étape 3:31 en avant dans la conversation Ai et tout à fait 3:34 prometteur notamment en travaillant sur 3:36 côté ingénierie rapide du modèle pour 3:38 tirer parti de son véritable potentiel et limiter 3:41 cas d'échec j'espère que vous avez apprécié cela 3:43 vidéo et j'aimerais voir votre 3:45 expériences s'il vous plaît taguez-moi sur Twitter à 3:47 qu'est-ce que l'IA si vous les partagez ou rejoignez notre 3:50 Communauté Discord où nous avons créé un 3:52 chaîne spécialement pour ça je verrai bien 3:54 vous la semaine prochaine avec une autre IA incroyable 3:57 rechercher 4:00 étranger 4:04 [Musique]