paint-brush
A força motriz por trás do ChatGPTpor@whatsai
3,039 leituras
3,039 leituras

A força motriz por trás do ChatGPT

por Louis Bouchard1m2023/06/04
Read on Terminal Reader

Muito longo; Para ler

O aprendizado por reforço é a força motriz por trás do ChatGPT e de outros avanços da IA. Inspirado nos seres vivos, o aprendizado por reforço ensina as máquinas a coletar recompensas positivas e evitar as negativas em seu ambiente. Pense no aprendizado por reforço como uma evolução matematicamente orientada, adaptando-se para melhorar ao longo do tempo.
featured image - A força motriz por trás do ChatGPT
Louis Bouchard HackerNoon profile picture
0-item
1-item

🧠 Você sabia que o aprendizado por reforço é a força motriz por trás do ChatGPT e de outros avanços da IA?


Ele permite que os robôs caminhem, abram portas e ainda permite que o ChatGPT simule discussões conosco (incluindo leitura e envio de e-mails para você)! 🤖


🏆 Inspirado nos seres vivos, o aprendizado por reforço ensina as máquinas (ou agentes) a coletar recompensas positivas e evitar as negativas em seu ambiente.


Eles evoluem para tomar melhores decisões por meio de tentativa e erro, assim como os humanos aprendem. 📈


Um agente aprende coisas como se aproximar de um bolo ou se esquivar de um incêndio por tentativa e erro, determinando recompensas favoráveis.


Da mesma forma, o ChatGPT domina respostas semelhantes às humanas e evita respostas “semelhantes a robôs” em seu ambiente.🍰🔥🗣️


🍕 Pense no aprendizado por reforço como uma evolução matematicamente orientada, adaptando-se para melhorar ao longo do tempo.


Quanto a uma definição mais formal, Simplilearn define aprendizagem por reforço como:


“O aprendizado por reforço é um sub-ramo do aprendizado de máquina que treina um modelo para retornar uma solução ideal para um problema, tomando uma sequência de decisões por si só.”


Seja para jogos de IA, robótica ou ChatGPT, a lógica de aprendizado permanece consistente: explore, adapte e melhore! 🔍


No vídeo de hoje, explico mais sobre como o aprendizado por reforço é a força motriz por trás do ChatGPT e como ele funciona.


Saiba mais no vídeo!