ChatGPT se ha apoderado de Twitter y de casi todo Internet, gracias a su poder y al potencial de memes que ofrece. Todos sabemos que ser capaz de generar memes es la mejor forma de conquistar internet, y así funcionó. Como ha visto numerosos ejemplos, es posible que ya sepa que ChatGPT es una , con la que puede chatear. También se llama chatbot, lo que significa que puede interactuar con él de forma conversacional, imitando una discusión humana uno a uno. IA recientemente lanzada al público por OpenAI Lo que quizás no sepas es qué es y cómo funciona... ¡Mira el video para obtener más información! Referencias ►Pruébalo: ►Publicación de blog de OpenAI: ►Qué es GPT-3: ►Qué es el Aprendizaje por Refuerzo: ►Únete a nuestra comunidad Discord: ►Twitter: ►Apóyame en Patreon: https://chat.openai.com/ https://openai.com/blog/chatgpt/ https://youtu.be/gDDnTZchKec https://youtu.be/C5_NfQy_kZU https://www.louisbouchard.ai/learn-ai-together/ https://twitter.com/Whats_AI https://www.patreon.com/whatsai Transcripción del video 0:00 lo has visto en todas partes Chad GPT tiene 0:02 tomado en Twitter y más o menos el 0:04 todo internet gracias a su poder y 0:06 el potencial de meme que nos proporciona a todos 0:08 saber que poder generar memes es el 0:11 mejor manera de conquistar internet y así 0:13 funcionó ya que has visto numerosos 0:14 ejemplos que quizás ya conozcas 0:16 chatgpt es una IA lanzada recientemente para 0:19 al público por openai permitiéndole 0:21 chatea con él también se llama chatbot 0:24 lo que significa que puedes interactuar con él 0:25 imitando conversacionalmente un uno-a-uno 0:28 discusión humana lo que quizás no sepas 0:30 es lo que es y como funciona 0:32 chadjupiti es un modelo basado en 0:35 aprendizaje por refuerzo y el GPT 0:37 serie de modelos de openai lo haré 0:39 referirte a un video sobre refuerzo 0:41 aprendizaje que publicamos recientemente con mi 0:43 amigo Elias para aprender más sobre el 0:46 subcampo de IA pero refuerzo rápido 0:48 El aprendizaje es una forma de entrenar algoritmos mediante 0:51 prueba y error con el objetivo de obtener recompensas 0:54 como lo harían los humanos aprendiendo con 0:56 retroalimentación positiva más específicamente chat 0:58 GPT se construyó siguiendo tres pasos: 1:02 primero fue tomar un ya poderoso 1:04 modelo y ajustarlo con supervisión 1:06 aprender qué significa esto significa 1:08 que tomaron un modelo específicamente su 1:11 GPT 3.5 y mejorado y actualizado 1:14 versión de gpd3 que entrenaron una vez 1:17 más sobre ejemplos de conversación 1:19 específicamente en lugar de ser entrenado en 1:21 casi todo su internet como gpt3 1:24 ¿Esto significa que están tratando de reducir 1:26 sus potenciales estrictamente a las conversaciones 1:28 haciéndolo teóricamente mejor en 1:31 conversando en comparación con gpt3 ya que un 1:34 especialista es casi siempre mejor que 1:36 un generalista en una tarea específica si 1:38 todavía no están familiarizados con el GPT 1:40 serie de modelos que sugeriría 1:42 viendo el breve video de introducción I 1:44 hecho cubriendo gpt3 cuando salió el 1:47 segundo paso es agregar nuestro refuerzo 1:49 aprendiendo magia que permitirá al 1:51 modelo para practicar y mejorar a medida que 1:53 Saber que la práctica hace más perfecto 1:55 precisamente en este paso usaremos el 1:57 modelo para chatear con humanos directamente tiene 2:00 proporciona múltiples respuestas posibles y 2:03 Pídele al humano que califique las respuestas de 2:05 de mejor a peor estos datos serán entonces 2:07 solía entrenar a otro modelo llamado nuestro 2:10 modelo de recompensa aprendiendo a replicar nuestro 2:12 anotadores humanos esto lleva a nuestro último 2:15 paso donde nuestro nuevo modelo de recompensa 2:18 enviar comentarios a los modelos de GPT de chat 2:20 respuestas como una función de recompensa para ayudarlo 2:22 converger hacia las mejores respuestas sobre 2:24 tiempo este último paso es entrenar más 2:27 nuestro algoritmo después de la multa inicial 2:30 paso de ajuste que explicamos es por eso que 2:32 ¿Son empresas como la IA abierta las que lanzan 2:34 ese tipo de modelos increíblemente poderosos 2:37 será inviable para las universidades 2:39 o individuos, ya que requiere demasiado 2:42 mucha Informática y tiempo para entrenar 2:44 todavía lo que logran es bastante 2:46 notables y creo que valen la pena 2:48 hacer y vale la pena compartir a Adviento 2:50 ciencia y listo después de acoplar el 2:54 GPT ya potente y más reciente 2:56 modelo de lenguaje basado en ajustarlo para 2:59 conversaciones y finalmente usando 3:01 refuerzo de aprendizaje para hacerlo 3:03 practicar sus habilidades de conversación usted 3:05 obtener chat GPD como has visto antes 3:07 el modelo es bastante prometedor pero también 3:10 a veces un muy tonto y no parece 3:12 para tener alguna lógica sigue siendo 3:15 solo un algoritmo y lejos de ser 3:17 aunque sea inteligente o consciente 3:20 dependerá de cómo lo definamos ambos 3:22 definitivamente tiene sus limitaciones 3:24 sin embargo, las salidas que da son 3:27 a menudo sorprendentemente interesante y 3:29 chatgpt pertinente es definitivamente un paso 3:31 adelante en Ai conversacional y bastante 3:34 prometedor especialmente trabajando en el 3:36 pronto el lado de ingeniería del modelo para 3:38 aprovechar su verdadero potencial y limitar 3:41 casos de fracaso espero que hayas disfrutado esto 3:43 video y me encantaría ver tu 3:45 experimentos por favor etiquétenme en Twitter en 3:47 ¿Qué es la IA si los compartes o te unes a nuestro 3:50 Discord Community donde creamos un 3:52 canal específicamente para eso voy a ver 3:54 la semana que viene con otra IA increíble 3:57 investigar 4:00 extranjero 4:04 [Música]