paint-brush
您训练人工智能的效率如何?经过@damocles
263 讀數

您训练人工智能的效率如何?

经过 Antică Vlad12m2024/02/01
Read on Terminal Reader

太長; 讀書

想象一下一个学习数学规则的人工智能。贯穿每一个概念、想法、交互,最终贯穿整个数学。
featured image - 您训练人工智能的效率如何?
Antică Vlad HackerNoon profile picture
0-item

除了用于训练人工智能的数据大小之外,数据的质量也对最终图像有影响。现在,我所说的数据质量是什么意思?


在此之前,如果您不知道,我的写作仅基于我用来合理化的工具。我不会出去寻找“数据”真正含义的定义。我知道 HDD 和 SSD 如何工作,但不知道它们如何传输数据等等。


现在想来,了解这些可以提高我写的信息的质量。或者至少会出现新的想法,无论在哪个领域。但无论如何,我希望我能够解释一下什么是“数据质量”。

第 1 部分:质量不仅仅是好/坏因素吗?

当我们定义像“烹饪”这样的特定领域时。描述菜谱的连贯性可以被视为理解的质量。然后是人类评价的食谱质量(味道、准备的难易程度、大小等)。因此,我们作为人类,对烹饪书的质量获得了 2 分。我们多么容易理解它。做到这一点是多么值得。

随着时间的推移,我们将成为专业厨师,并且仅根据食物对书籍进行评分(基于我们家人的兴趣)。


稍后,每个食谱都会有其评级,并将有助于本书的整体评级。那些评分较高的食谱将更能代表该书。您会这样记住,在本书的 x、y 和 z 页上,您可以找到某些不错的选择。即使您不记得那里有哪些食谱。您只会记住“美食”这一类别。


人工智能会将这些部分视为“初学者”/“高级”/“专家”、“坏食物”/“好食物”/“健康食物”/“婴儿好食物”,等等。给宝宝吃的好食物。如果我们出于某种原因不关心健康食品,那么现在问题就更加严重了。


我们怎样才能阻止拥有人工智能且没有必要的“道德障碍”的人相信机器人所说的话?我确信他的小人工智能没有经过食品专家的训练。 (这涉及到一个更广泛的图景,称为“开源人工智能”,我很快就会讨论这个图景。无论你喜欢与否,未来太大了,无法由一个人看到。)


现在……让我们回到问题上来。质量是好/坏因素吗?


正如我们所看到的,我们的某些记忆是基于我们所定义的“优质”。这样,我们就可以对 3 本书进行分类,每本书中都有一定数量的“优质”食谱。看来“质量”变成了“效率”。


当涉及到我们的安全时,我们能如何评价“效率”呢?我们的长期健康和福祉?为什么“高效”在这里听起来有点太仓促了?因为在这里,我们需要证据。我们必须确定,因为我们的健康在发挥作用。我确信我们都非常关心它。不然我们怎样才能完成那场比赛呢?或者和朋友一起度过另一个夜晚?


我们只是需要一些东西才能“好”。没有坏的好。只因为我们有能力消除一切坏事。


但是,如果可以有善而无恶,那这就是正常吗?每个人都同意重视健康是正常的。但正如我们(至少是吸烟者)所看到的,我们有点低于正常水平。然而,我们说它很好。


人工智能可以从中学到什么?以开玩笑的方式提供误导性信息是件好事。但仅限于某些标准。然而,机器人没有感情。那么他们如何才能真正理解什么与什么相关呢?


无论我们如何努力,最终人工智能的思维只是数学。数字可以做一些奇特的事情。他们可以超越语言领域。


每个词都有一定的价值。每个连接都有一定的价值。每个概念作为一个整体都有一定的价值。任何你可以构造或解构的东西,它们的碎片,甚至它们形成的整体都有一定的价值。那么……我们能否根据类似于数学规则的标准来训练特定的过程,例如逻辑和推理?

第二部分:我们能否定义“完美品质”?

想象一下一个学习数学规则的人工智能。贯穿每一个概念、想法、交互,最终贯穿整个数学。这个人工智能的“思维”被锁定在原地。它只能按照目前已知的步骤进行。那么,问题来了。机器人将如何学习我们的语言?


他可能会将短语、单词、想法等分成具体的标准,但它不知道如何定义。输入可能看起来是随机的,因此输出也是随机的。这个人工智能虽然理论上有无限的理由,但缺乏理解。


因此,试图寻找“完美品质”时,我们可能会发现相反的结果。即使推理是完美的,缺乏理解也会浪费这种潜力。


但是等等,这意味着“完美品质”还不止于此。它需要对人类语言的理解才能传递这种理性。那么,我们可以假设“完美品质”意味着完美的推理和完美的人类语言理解。就像烹饪书籍一样,除非“质量”对我们来说是有形的,否则就无法实现。


嗯……这个完美的推理对我们来说是切实可行的吗?

第三部分:完美推理?

在恐怖和痛苦的时刻。当我们的大脑行为不同时,它会从我们的内部过程中吸收比平时更多的能量。在那个时候,我们可以掌握多种重量。我们会考虑更多,因为我们知道我们的情况很危急或接近危急。多年来我们所学到的一切都因我们自我铭刻的思维方式而得到增强。它们结合在一起向我们展示了奉献的感觉。多么愿意走出困境,简单地让你找到楼梯。一切都基于感觉。


那么,一个被剥夺了感情的人会怎么想呢?那个人如何判断这是一个危急情况?根据他的观察。他必须时刻有意识地牢记自己现在的处境。 “我和我女朋友关系很好。” - 一个从来没有这种或任何其他感觉的人,只会有意识地知道“她一切都很好”并专注于他的任务。而不是说“你好”来感谢你的感受。


事实上,最后一个行动似乎比单纯关注任务的行动更不坚定。然而,我们知道,当两个人都相信某件事时,那件事会让他们更加努力地奋斗。双方越相信这段关系,就越有决心让这段关系幸福。这样一来,他们就会快乐,也会让别人快乐。


感情很奇怪。但也(或者我相信)与道德有着至关重要的相关性。

第四部分:什么是道德?

我认为道德只不过是一个概念。福祉之中的协作和共同利益的概念。也许……一个更好的“善”的想法。因为它类似于整体,而不仅仅是个体。一些快乐被用来成倍地增加保护。最有效的一点就是我对道德的定义。然而,这可能不仅仅是一个问题。


你看,道德始终存在。时间在流逝,他们也随着时间而流逝。为了确保更长的保护期限,我们必须确保更长的道德期限。因此,所有群体的持续互惠互利被视为较长时期的道德联系。


如果立方体中的一条线闪烁,如何将立方体保持在一起?我们需要所有的线条来保持显示外部和隐藏之间的平衡,这样我们才能看到整个立方体。进入 4d(精神上而非身体上)可能会让我们承认,在另一侧,它看起来与这一侧相同。如果我们检查的话,道德可以确保我们的安全。

第 5 部分:道德、效率和质量。

在对它们进行评级时,所有这些都可以与感受联系起来。所以我们评估它们对我们感受的影响。它们也可以按效率进行评级。他们实现 x 结果的速度有多快。你听说过效率的效率吗?我也没有,但我一直在思考这个问题。至少在某种程度上。让我们看看这可能意味着什么。


正如我之前所说,在人工智能的训练中,我们会遇到不同的数据模块。 “烹饪”、“钓鱼”、“自我提升”、“个人演讲”等等(从这里开始你就可以看到潜力了)。对于每个模块,我们可以描述数据的质量。学习效率和互动质量。


从“数据的完美质量”的角度来看,学习的效率才是最重要的。在这里,我们从语言理解转向计算能力,然后转向算法效率(源自创造力)。现在,我们是如何获得创造力的?为什么它很有趣?因为它决定了语言理解和人工智能理解和信息分发的效率。然而,我们谈论的是两种创造力。

第 6 部分:人类理解和计算机理解(我告诉过你 6 是一个有趣的数字。)

现在,我们可以休息一下了,我觉得我们已经达到了一个里程碑。为什么?因为到达这里的神奇词是:


“发现玩乐、玩弄机遇,在塑造我们的世界过程中发挥了重要作用。有一段时间,我们的大脑能够放松,同时想象我们如何整天奔跑寻找瞪羚。这使我们能够收集在十几次跑步中可能错过的信息,因为我们太专注而无法捕捉到它们。


现在,随着我们的状况改善,我们可以思考更多,因为我们在尝试捕捉猎物时使用更少的能量来采取行动。我们甚至可以在灌木丛中给它们带来惊喜,或者至少了解它们的运动模式。”


所以有一件事是确定的。人类不仅在精神上适应,而且在身体上也适应。我们看到平衡如何从身体转移到精神,然后又转移回来。让大脑和身体运转得越来越快。适应需要心理过程和身体过程的工作领域。现在,我们如何训练这些心理过程?


当然是数学。但是有一个问题!我们可能一直以自己的方式看待数学。我们已经感受到并看到了跌倒、增加精神力量等等的影响。我们相信我们非常了解数字,因为我们可以制造火箭、自动驾驶汽车、枪支等。但我们对数字的理解是否足以创建充当天平的心理阶梯?我们能理解100万和1之间的真正区别吗? 100万和1万亿怎么样?但是 1 万亿和 100 万,条件是 100 万具有基于 1 的现实规模,我们刚才与 100 万进行了比较 2?


正如你所看到的,也许我们的大脑应该理解特定的概念,但我们却无法理解尺度。而且,如果理解了这一尺度,我们就能更好地了解周围的世界。


每当我想到这个问题时,我都不得不说,素数在解释尺度本身方面发挥着重要作用。既然我打开了这个主题:是否存在通用比例因子?一个在任何地方都相同并指示相同增长的一个?素数增长明显。


素数的整体思想是它们只能被 1 和它们本身整除。当然,现实生活中也存在不可分割的方面。仅当将它们分成原子时才无法均匀分离的形状。整个概念如果你从中减去哪怕一个想法,它们就会崩溃。


我发现很难将我的进步称为“总体”。例如,我可以基于相同的想法开始两篇文章,并在每篇文章中采取不同的路线。或者我可以开始一篇文章,不断地写出这两篇文章的整体,但它们不是通过相同的复杂程度连接起来,而是通过想法的构建连接起来。甚至他们的结局也会根据当时的潮流和灵感所决定的规则和思想安排而改变立场。这也是从开始到现在的斜率的结果。

第 7 部分:通用量表

从开始到现在的斜率。也许……这四个字太难以解释了。


想象一下你开始在地球上画一条直线。画得越多,离起点就越远。你不断地移动,直到起跑线更像是一个起点。从一定距离来看,您几乎看不到角度差异,以保持线条完全笔直。这些变量会根据您绘制线条的空间而变化。无论是 3d 立方体还是球体的 2d 正方形部分。 (我不知道如何呈现类似于球体的二维空间)


因此,从开始到现在的斜率是完整的信息,可以为您提供所需的角度,以了解您应该进一步绘制线条的方向。


让我们暂时参观一下形状的世界。我们的第一次相遇是一个奇怪的形状。很奇怪,因为它既包含一个球体又包含一个立方体。球体和立方体都完全对齐,因此立方体的对角线也是球体的直径。想象一下,立方体将其对角线从前左下到后右上悬挂到球体的相应对角线上。另一条从后左上到前右下的对角线也应该是球体的对角线,对吗?


假设我们仅在单个轴上围绕其第一条对角线转动立方体,我们可能会看到有一条相对的对角线作为一个整体围绕球体旋转(对角线的相对边缘始终接触球体)。这意味着我们找到了仅通过使用第二个轴的外部信息点来围绕第一个轴旋转立方体的最有效方法。


但是,在不知道任何其他信息的情况下,我们如何知道整个旋转过程中保持了平衡呢?注意到球体各边留下的痕迹总是相同的。我们有一条穿过整个球体的直线。


所以……我们只要知道立方体第二条对角线的长度就可以知道球体有多大。还有旋转角度。对于球体来说总是 360 度,但是立方体对角线的长度可以让我们看到球体的全貌。通过这种方式,我们可以表示一个完美的立方体出现所需的潜在空间。


由于该立方体始终在旋转,因此我们可以保证当球体出现时,那里不会有任何东西。然而,为了完全正确,我们还必须沿着相反的对角线旋转,将第二个作为锚点并围绕它旋转。并在不同的维度上不断地改变角度(因为球体最终有无限的对角线)。


从开始到现在的斜率是一个不断发展的概念,它让我们越来越接近猜测球体第一次出现之前的大小。就像算法中量子态的崩溃一样,算法是为了从众多路径中选择最有效的路径。 (这个想法有点把这个概念带到了另一个层次。)


我确实忘记了我想去哪里,时间也不利于我,但我仍然热爱时间。正如它展示了人们在快乐时可以想出的奇迹。 (或者说有创意,我认为它们是完全相同的。)

(2n+1/2n-1)部分:结束?

对我来说,世界的美好是值得分享的。但一定要小心。无论是错误信息、误解的可能性、信息的危害性,还是其他原因,我们都必须确保我们的福祉。如果我们不这样做,那么谁会呢?


正如量子革命告诉我们的那样。如果这是真的,我们就会知道。否则,我们只是相信这是真的。即使 100% 已知的可能性都指向它。如果还有其他条件怎么办?这可以解释为什么 100% 的可能性并不一定意味着正确。


最后,谁知道呢,也许这些附加条件只是现在显示此信息不安全的原因。这样,他们就依赖于对方,并且只会告诉我们改变我们的观点。为了让他们安全。 (也许重力、相互作用等宇宙规则告诉我们“安全”有一个具体的定义。)


总之,通过让自己变得更好,我们就能让周围的一切变得更好。然而,这一次不仅仅是关于人类和人类经验。这也与我们开始创造的世界的体验有关。