ChatGPT se ha apoderado de Twitter y de casi todo Internet, gracias a su poder y al potencial de memes que ofrece. Todos sabemos que ser capaz de generar memes es la mejor forma de conquistar internet, y así funcionó.
Como ha visto numerosos ejemplos, es posible que ya sepa que ChatGPT es una IA recientemente lanzada al público por OpenAI , con la que puede chatear. También se llama chatbot, lo que significa que puede interactuar con él de forma conversacional, imitando una discusión humana uno a uno.
Lo que quizás no sepas es qué es y cómo funciona... ¡Mira el video para obtener más información!
►Pruébalo: https://chat.openai.com/
►Publicación de blog de OpenAI: https://openai.com/blog/chatgpt/
►Qué es GPT-3:
►Qué es el Aprendizaje por Refuerzo:
►Únete a nuestra comunidad Discord: https://www.louisbouchard.ai/learn-ai-together/
►Twitter: https://twitter.com/Whats_AI
►Apóyame en Patreon: https://www.patreon.com/whatsai
0:00
lo has visto en todas partes Chad GPT tiene
0:02
tomado en Twitter y más o menos el
0:04
todo internet gracias a su poder y
0:06
el potencial de meme que nos proporciona a todos
0:08
saber que poder generar memes es el
0:11
mejor manera de conquistar internet y así
0:13
funcionó ya que has visto numerosos
0:14
ejemplos que quizás ya conozcas
0:16
chatgpt es una IA lanzada recientemente para
0:19
al público por openai permitiéndole
0:21
chatea con él también se llama chatbot
0:24
lo que significa que puedes interactuar con él
0:25
imitando conversacionalmente un uno-a-uno
0:28
discusión humana lo que quizás no sepas
0:30
es lo que es y como funciona
0:32
chadjupiti es un modelo basado en
0:35
aprendizaje por refuerzo y el GPT
0:37
serie de modelos de openai lo haré
0:39
referirte a un video sobre refuerzo
0:41
aprendizaje que publicamos recientemente con mi
0:43
amigo Elias para aprender más sobre el
0:46
subcampo de IA pero refuerzo rápido
0:48
El aprendizaje es una forma de entrenar algoritmos mediante
0:51
prueba y error con el objetivo de obtener recompensas
0:54
como lo harían los humanos aprendiendo con
0:56
retroalimentación positiva más específicamente chat
0:58
GPT se construyó siguiendo tres pasos:
1:02
primero fue tomar un ya poderoso
1:04
modelo y ajustarlo con supervisión
1:06
aprender qué significa esto significa
1:08
que tomaron un modelo específicamente su
1:11
GPT 3.5 y mejorado y actualizado
1:14
versión de gpd3 que entrenaron una vez
1:17
más sobre ejemplos de conversación
1:19
específicamente en lugar de ser entrenado en
1:21
casi todo su internet como gpt3
1:24
¿Esto significa que están tratando de reducir
1:26
sus potenciales estrictamente a las conversaciones
1:28
haciéndolo teóricamente mejor en
1:31
conversando en comparación con gpt3 ya que un
1:34
especialista es casi siempre mejor que
1:36
un generalista en una tarea específica si
1:38
todavía no están familiarizados con el GPT
1:40
serie de modelos que sugeriría
1:42
viendo el breve video de introducción I
1:44
hecho cubriendo gpt3 cuando salió el
1:47
segundo paso es agregar nuestro refuerzo
1:49
aprendiendo magia que permitirá al
1:51
modelo para practicar y mejorar a medida que
1:53
Saber que la práctica hace más perfecto
1:55
precisamente en este paso usaremos el
1:57
modelo para chatear con humanos directamente tiene
2:00
proporciona múltiples respuestas posibles y
2:03
Pídele al humano que califique las respuestas de
2:05
de mejor a peor estos datos serán entonces
2:07
solía entrenar a otro modelo llamado nuestro
2:10
modelo de recompensa aprendiendo a replicar nuestro
2:12
anotadores humanos esto lleva a nuestro último
2:15
paso donde nuestro nuevo modelo de recompensa
2:18
enviar comentarios a los modelos de GPT de chat
2:20
respuestas como una función de recompensa para ayudarlo
2:22
converger hacia las mejores respuestas sobre
2:24
tiempo este último paso es entrenar más
2:27
nuestro algoritmo después de la multa inicial
2:30
paso de ajuste que explicamos es por eso que
2:32
¿Son empresas como la IA abierta las que lanzan
2:34
ese tipo de modelos increíblemente poderosos
2:37
será inviable para las universidades
2:39
o individuos, ya que requiere demasiado
2:42
mucha Informática y tiempo para entrenar
2:44
todavía lo que logran es bastante
2:46
notables y creo que valen la pena
2:48
hacer y vale la pena compartir a Adviento
2:50
ciencia y listo después de acoplar el
2:54
GPT ya potente y más reciente
2:56
modelo de lenguaje basado en ajustarlo para
2:59
conversaciones y finalmente usando
3:01
refuerzo de aprendizaje para hacerlo
3:03
practicar sus habilidades de conversación usted
3:05
obtener chat GPD como has visto antes
3:07
el modelo es bastante prometedor pero también
3:10
a veces un muy tonto y no parece
3:12
para tener alguna lógica sigue siendo
3:15
solo un algoritmo y lejos de ser
3:17
aunque sea inteligente o consciente
3:20
dependerá de cómo lo definamos ambos
3:22
definitivamente tiene sus limitaciones
3:24
sin embargo, las salidas que da son
3:27
a menudo sorprendentemente interesante y
3:29
chatgpt pertinente es definitivamente un paso
3:31
adelante en Ai conversacional y bastante
3:34
prometedor especialmente trabajando en el
3:36
pronto el lado de ingeniería del modelo para
3:38
aprovechar su verdadero potencial y limitar
3:41
casos de fracaso espero que hayas disfrutado esto
3:43
video y me encantaría ver tu
3:45
experimentos por favor etiquétenme en Twitter en
3:47
¿Qué es la IA si los compartes o te unes a nuestro
3:50
Discord Community donde creamos un
3:52
canal específicamente para eso voy a ver
3:54
la semana que viene con otra IA increíble
3:57
investigar
4:00
extranjero
4:04
[Música]