paint-brush
ChatGPT 背后的驱动力经过@whatsai
2,926 讀數
2,926 讀數

ChatGPT 背后的驱动力

经过 Louis Bouchard1m2023/06/04
Read on Terminal Reader

太長; 讀書

强化学习是 ChatGPT 和其他 AI 进步背后的驱动力。受生物的启发,强化学习教会机器在其环境中收集积极的奖励并避免消极的奖励。将强化学习视为一种数学驱动的进化,适应随着时间的推移做得更好。
featured image - ChatGPT 背后的驱动力
Louis Bouchard HackerNoon profile picture
0-item
1-item

🧠 您是否知道强化学习是 ChatGPT 和其他 AI 进步背后的驱动力?


它允许机器人行走、开门,甚至让ChatGPT能够模拟与我们的讨论(包括为您阅读和发送电子邮件)! 🤖


🏆 受生物的启发,强化学习教导机器(或代理)在其环境中收集积极的奖励并避免消极的奖励。


它们不断进化,通过反复试验做出更好的决策,就像人类的学习方式一样。 📈


代理人通过反复试验学习诸如接近蛋糕或躲避火灾之类的事情,从而确定有利的回报。


同样,ChatGPT 掌握类似人类的答案,避免在其环境中出现“类似机器人”的答案。🍰🔥🗣️


🍕 将强化学习视为一种数学驱动的进化,随着时间的推移适应做得更好。


至于更正式的定义, Simplilearn 将强化学习定义为:


“强化学习是机器学习的一个分支,它训练模型通过自行做出一系列决策来返回问题的最佳解决方案。”


无论是 AI 游戏、机器人还是 ChatGPT,学习逻辑始终如一:探索、适应和改进! 🔍


在今天的视频中,我详细解释了强化学习如何成为 ChatGPT 背后的驱动力及其工作原理。


在视频中了解更多信息!