O ChatGPT conquistou o Twitter e praticamente toda a Internet, graças ao seu poder e ao potencial de memes que ele oferece. Todos nós sabemos que poder gerar memes é a melhor forma de conquistar a internet, e assim deu certo.
Como você viu vários exemplos, talvez já saiba que o ChatGPT é uma IA lançada recentemente ao público pela OpenAI , com a qual você pode conversar. Também é chamado de chatbot, o que significa que você pode interagir com ele por meio de uma conversa, imitando uma discussão humana individual.
O que talvez você não saiba é o que é e como funciona... Assista ao vídeo para saber mais!
►Experimente: https://chat.openai.com/
►Postagem no blog da OpenAI: https://openai.com/blog/chatgpt/
►O que é GPT-3:
►O que é Aprendizagem por Reforço:
►Junte-se à nossa comunidade Discord: https://www.louisbouchard.ai/learn-ai-together/
►Twitter: https://twitter.com/Whats_AI
►Apoie-me no Patreon: https://www.patreon.com/whatsai
0:00
você já viu em todos os lugares que Chad GPT tem
0:02
tirado no Twitter e praticamente o
0:04
toda a internet graças ao seu poder e
0:06
o potencial de meme que fornece a todos nós
0:08
sei que ser capaz de gerar memes é o
0:11
melhor forma de conquistar a internet e assim
0:13
funcionou desde que você viu vários
0:14
exemplos que talvez você já conheça
0:16
chatgpt é uma IA lançada recentemente para
0:19
o público por openai permitindo que você
0:21
converse com ele também é chamado de chatbot
0:24
o que significa que você pode interagir com ele
0:25
imitando conversivamente uma conversa cara-a-cara
0:28
discussão humana o que você talvez não saiba
0:30
é o que é e como funciona
0:32
chadjupiti é um modelo baseado em
0:35
aprendizado por reforço e o GPT
0:37
série de modelos da openai vou
0:39
encaminhá-lo para um vídeo sobre reforço
0:41
aprendizado que publicamos recentemente com meu
0:43
amigo Elias para saber mais sobre o
0:46
subcampo de AI, mas rapidamente reforço
0:48
aprendizagem é uma maneira de treinar algoritmos por
0:51
tentativa e erro visando recompensas apenas
0:54
como os humanos fariam aprendendo com
0:56
feedback positivo mais especificamente chat
0:58
O GPT foi construído seguindo três passos que o
1:02
primeiro foi pegar um já poderoso
1:04
modelo e ajustá-lo com supervisão
1:06
aprendendo o que isso significa significa
1:08
que eles pegaram um modelo especificamente seu
1:11
GPT 3.5 e melhorado e atualizado
1:14
versão do gpd3 que eles treinaram uma vez
1:17
mais em exemplos de conversa
1:19
especificamente em vez de ser treinado em
1:21
praticamente toda a sua internet como gpt3
1:24
isso significa que eles estão tentando restringir
1:26
seus potenciais estritamente para conversas
1:28
tornando-o teoricamente melhor em
1:31
conversando em comparação com gpt3 desde um
1:34
especialista é quase sempre melhor do que
1:36
um generalista em uma tarefa específica se você
1:38
ainda não estão familiarizados com o GPT
1:40
série de modelos que eu sugeriria
1:42
assistindo ao pequeno vídeo de introdução I
1:44
feito cobrindo gpt3 quando saiu o
1:47
segundo passo é adicionar nosso reforço
1:49
aprender magia que permitirá ao
1:51
modelo para praticar e melhorar conforme você
1:53
saiba que a prática leva a perfeição mais
1:55
justamente nesta etapa usaremos o
1:57
modelo para conversar com humanos diretamente tem
2:00
fornece várias respostas possíveis e
2:03
peça ao humano para avaliar as respostas de
2:05
do melhor para o pior, esses dados serão então
2:07
usado para treinar outro modelo chamado nosso
2:10
modelo de recompensa aprendendo a replicar nosso
2:12
anotadores humanos, isso leva ao nosso último
2:15
etapa em que nosso novo modelo de recompensa
2:18
dar feedback para o modelo de GPT de bate-papo
2:20
responde como uma função de recompensa para ajudá-lo
2:22
convergem para as melhores respostas sobre
2:24
esta etapa final é treinar ainda mais
2:27
nosso algoritmo após a multa inicial
2:30
passo de ajuste que explicamos é por isso que
2:32
são empresas como IA aberta que lançam
2:34
esses tipos de modelos incrivelmente poderosos
2:37
será inviável para as universidades
2:39
ou indivíduos, pois requer muito
2:42
muita computação e tempo para treinamento
2:44
ainda o que eles conseguem é bastante
2:46
notáveis e acredito que valem a pena
2:48
fazendo e vale a pena compartilhar no Advento
2:50
ciência e voila depois de acoplar o
2:54
já poderoso e mais recente GPT
2:56
modelo de linguagem baseado em ajustá-lo para
2:59
conversas e, finalmente, usando
3:01
aprendizagem de reforço para fazê-lo
3:03
praticar suas habilidades de conversação você
3:05
obtenha chat GPD como você viu antes
3:07
o modelo é bastante promissor, mas também
3:10
às vezes muito burro e não parece
3:12
para ter qualquer lógica que seja ainda é
3:15
apenas um algoritmo e longe de ser
3:17
seja inteligente ou consciente embora
3:20
vai depender de como definimos tanto
3:22
definitivamente tem suas limitações
3:24
no entanto, as saídas que ele dá são
3:27
muitas vezes surpreendentemente interessante e
3:29
chatgpt pertinente é definitivamente um passo
3:31
avançar em conversação Ai e bastante
3:34
promissor especialmente trabalhando no
3:36
solicitar lado de engenharia do modelo para
3:38
alavancar seu verdadeiro potencial e limitar
3:41
casos de falha espero que tenham gostado
3:43
vídeo e eu adoraria ver o seu
3:45
experimentos, marque-me no Twitter em
3:47
o que é IA se você os compartilhar ou se juntar ao nosso
3:50
Comunidade do Discord onde criamos um
3:52
canal especificamente para isso vou ver
3:54
você na próxima semana com outra IA incrível
3:57
pesquisar
4:00
estrangeiro
4:04
[Música]