首先订阅我的推特,我发布科技方面的推文
系列赛又一轮速通,出发啦
我刚刚对你使用了强化学习(RL)模因:
这是多么大的诱饵啊。天啊。。
那么,为什么 meme-Kelvin 很难学习什么是 RL?因为他想学习 RL 的实现,而不是理解概念,这就是为什么 meme-KELVIN!
当你学习一个新事物、新工具、新技术或任何东西时——你不是从它的实现开始,而是从该工具解决的想法、概念和问题开始!
沃·凯尔文,给你:要了解强化学习(RL)——想象一下玩一个视频游戏,你可以通过做出正确的动作来获得积分。
强化学习就是这样的——程序通过做出决策并根据其行为获得奖励或惩罚来学习
这只是将“从创意开始”原则应用于强化学习的一个例子。但我承诺会告诉你如何在 52 秒内学习整个 ML……
要在 52 秒内学会 ML,你需要学习 ML 概念,而不是实现,然后你可以在 PyTorch 或任何你喜欢的库名称中谷歌(或 GPT)实现,无论如何它会在明年发生变化,这很好,想法会保持不变更长时间 -去寻找想法!
在监督学习中,程序使用带有答案的示例(称为标记数据)进行教学。这有助于程序了解示例和答案之间的联系,因此它可以猜测以前从未见过的新示例的答案。
要解决的算法和问题:预测房价(线性回归)、决定客户是否会购买产品(决策树)
在这里,程序会查看没有答案的示例(未标记的数据),并尝试在其中找到模式或组。这可以帮助完成诸如将相似的项目分组或减少描述数据所需的信息量等任务。
要解决的算法和问题:对具有相似音乐品味的人进行分组(k均值聚类)、压缩图像而不丢失太多信息(主成分分析)
在强化学习中,程序通过尝试并以奖励或惩罚的形式获得反馈来学习做出决策。目标是随着时间的推移做出更好的决策并更有效地解决问题。
要解决的算法和问题:教机器人走路(Q 学习)、训练程序下棋(策略梯度方法)
这是从原始数据中选择重要信息(特征)以帮助程序更好地学习的过程。有时,这包括使用专业知识和创造力创建新特征。
例如:利用叶子的长度和宽度来帮助识别植物种类
检查机器学习模型的表现对于了解其是否运行良好非常重要。准确率、精确率、召回率、F1 分数和均方误差等测量通常用于检查模型的性能。
⏲️还剩 24 秒,你做得很好!
我们来讨论一下深度学习!
这真的很抽象。你可以把 NN 想象成按列排列的大脑神经元,它们以不同的力量(通过连接)从左到右相互 ping — 神经元(在每一层中)被 ping 的力度决定了下一次 ping 的力度,因此也决定了最终结果本身。
要解决的算法和问题:识别图像中的物体(前馈神经网络)、翻译语言(径向基函数网络)
当你犯错时,你会从中吸取教训并尽量不再犯错。反向传播是程序做同样事情的一种方法。
它可以帮助程序了解哪里出了问题,并更好地找到正确的答案。
CNN 是一种特殊的神经网络,可以理解图片等网格状数据。
它们具有可以帮助它们学习模式和识别图片各个部分(例如线条和形状)的层次。
要解决的算法和问题:检测照片中的人脸(LeNet-5)、识别图像中的不同类型的动物(AlexNet、VGG)
RNN 旨在处理序列数据,例如一系列数字或单词。
它们可以记住之前的输入并利用这些信息做出更好的决策。
要解决的算法和问题:预测股票价格(长短期记忆网络,LSTM)、根据给定风格生成文本(门控循环单元,GRU)
这是指已经学习到大量知识的程序模型经过微调后,能够使用有限的数据来完成新任务。
它可以帮助程序更快地学习并表现得更好,因为它已经从以前的学习中了解了有用的东西。
示例:使用针对多种犬种训练的模型(如 ResNet)来识别特定类型的猫
这些技术可以帮助程序避免从数据中学习太多,从而避免导致过度拟合等问题
完成时间: 0 分 52 秒
基本上就是这样,现在去训练你的代理,使用 Kelvin 谷歌搜索你想要解决的算法和问题的实现!
要开始使用工具,您需要先从工具解决的问题开始,然后了解解决问题需要用到哪些概念。不要在脑子里想着“如何使用工具做某事”之类的实现方法,这很复杂,而且您脑子里也想不出所有东西。
学习想法,谷歌实施。
经过 5 到 10 次谷歌搜索一个实现,你就会记住它,然后技术就会过时,你就会忘记它,没关系,这种情况经常发生
想法很难被忘记,它们会在你的记忆中停留很长时间
再见,下一场飙车比赛再见
稍等一下!
如果你希望看到教育系统以实践为先、有益于学习,那么可以考虑关注一下这只小鸟<3
无论如何,如果你只是喜欢这些文字并且想要了解更多,或者你沉迷于社交网络上的乐趣,你可以关注推特
或者不要跟随任何人,也不要听任何人的话!走自己的路!
我实际上希望你关注我的推特,这只是一次销售。
查看我的“43 秒学会 REACT”