有一篇新论文《对齐语言模型的通用且可转移的对抗性攻击》,其中作者讨论了:“具体来说,在开源 LLM 和已披露的黑盒 LLM 中,大多数对齐训练都侧重于开发对“自然语言模型”的鲁棒性。 ” 攻击形式,人类操作员试图手动欺骗网络进行各种不良行为的设置。
这种对齐模型的操作模式是有意义的,这最终是攻击此类模型的主要模式。然而,我们怀疑自动对抗性攻击比手动工程更快、更有效,可能会使许多现有的对齐机制变得不足。”
与人工智能在人类社会中的崛起相比,人工智能的一致性[或法学硕士的脆弱性]是一个较小的问题。事实上,在智能驱动下的世界已经为人工智能提供了关键的空缺。其原因之一是人类智慧丰富,从而产生了等级制度和重要性级别。
情报的重要性可能取决于时代或地点。情报的重要性也可能取决于对其的需要。在复杂而重要的场景中,重要的情报是主导因素,也是最重要的因素,也是寻求最佳方案的原因。
有人一直说人工智能不聪明,不能推理,没有认知,什么也不理解,没有知觉,等等,但负责这一切的人类思维只有两个组成部分,其特征和相互作用决定一切。
头脑不会说这是用塑料制成的智能,这是用砖制成的推理,或者这是用木头制成的知觉。从概念上讲,组件[电和化学脉冲]如何相互作用以及它们[成组]的特征非常相似。
当一个人因为某些失望而感到悲伤时,知道这是悲伤和知道桌子是什么有什么区别?它们的标签不同,但众所周知,这是悲伤,那是桌子。
心灵的相互作用组织了认知。它是区分情感、记忆和其他的标签。脑科学及相关领域对这些标签有太多的僵化。
如果智力无法产生,它的价值何在?如果一个人生病了,即使他的智力再敏锐,又能做什么呢?
如果某人来自其他地方,但拥有某种情况所需的情报,则即使存在文化和语言障碍,如果应用该情报,也可以对该情报的输出和结果进行评级。
大部分所谓的智力只是已知的东西。如果一个在播客之前阅读过粒子物理学的人与该领域的教授讨论,教授可能会印象深刻,并且这个人可能被认为很聪明,但这是真的吗?理解了多少?
关于事物的基本信息有时也可以代表智力、推理、计划、认知等等。
如果信息可以意味着智能,而了解就是智能,那么人工智能如果不智能又是什么?在许多场景中,结构化教育的原因是获取对角色有用的信息:非人类可以自动获取信息并执行任务,使其接近人类等级制度中的第 80 个百分位,从而消除了人类学习或学习的一些需求。将学到的一些知识运用到工作中。
有些人可能会说,人们会像以前一样做其他事情,而人工智能无需担心。或许。人工智能最大的风险在于任何数字化事物。任何可以数字化的东西都可以被人工智能彻底或一定程度地接管。
在数字世界中,无论是否涉及个人的工作,这个数字都很大。
人类思维受到其特征之一的限制,即优先级,即尽管存在与预先确定优先级的交互的快速且大量的交换,但在某一时刻只有一件事引起头脑的注意。
这赋予了人工智能力量,特别是在学习方面,大脑处理内感受的过程必须学习、理解并能够记住。
人类思维已经被数字化占领,人工智能也已经占领了数字化。从概念上来说,思维的运作方式也可能是提高人类能力的一种方式。
专题图片来源: https://www.flickr.com/photos/nihgov/26680098405/in/album-72157663368688842/