paint-brush
人工智能批评的剖析经过@hackerclz09d90i00003b615hjbo43o
248 讀數 新歷史

人工智能批评的剖析

经过 10m2024/07/29
Read on Terminal Reader

太長; 讀書

上周,当我坐在炎热的天气里慢慢地、心不在焉地、口干舌燥地读书时,一种奇怪的感觉涌上心头。我看到自己在用人类的笨拙手法阅读一篇由大型语言模型在几秒钟内生成的文本。
featured image - 人工智能批评的剖析
undefined HackerNoon profile picture
0-item

上周,当我在炎热的天气里坐着读一本书时,一种奇怪的感觉涌上心头——慢慢地、心不在焉地、脱水地。我看到自己在用人类的笨拙来处理一篇由大型语言模型 (LLM) 在几秒钟内生成的文本。


今年夏初,我曾邀请 Anthropic 的 Claude(一位流行的人工智能聊天模特)写一本关于人工智能如何改善人们生活的书。

考虑到模型可以处理的输出长度,我首先要求 10 个主题,然后将每个主题分成三个部分。我将每个部分变成一个提示,并输入所有 30 个提示。

这本书的标题是《人工智能如何让你变得聪明、快乐和高效》,它是我们新文明实验的早期象征,是人类与生成人工智能之间充满风险且迄今为止神秘的合作。

这项实验源于一种好奇心,目的是测试一种新工具的极限。我想知道:一种算法能否在输入了数十亿人类知识后,将其输入重新塑造成一本连贯、有见地、原创的书?答案与问题的定义相悖;最终形成的书充满了新奇的诡异感。

章节标题样本可能会稍微揭开一些神秘面纱:做出更好的决定;提高创造力;更有效地沟通;设计优化的生活。相当有益。会出什么问题呢?

我又想起了法学硕士和神谕(或其他古代预言和预测形式)之间的相似之处。人们很容易将黑箱算法的输出赋予深刻的意义,正是因为它难以捉摸。不透明性让人敬畏。我来向克劳德请教它无法解决的问题。尽管如此,它的回答却具有护身符般的力量。坐在那张长凳上,我有时会怀疑自己不是在研究一本书,而是在研究一个符文,从精心排列的茶叶中读出意义。

我也想知道,如果我要求一本老派的书,我是否会犯一个错误,把生活简化为文学。书籍在我们后人类的未来中是否仍然重要?

是的。一个异常现象是,法学硕士的布局与电报或十诫并无太大区别。从上到下都是文本列。

这是有原因的——故事的力量是巨大的。生活是一种漫长的审美体验,从长远来看,我们的行为是由我们对世界的看法所组织的。也就是说,我们所拥有的只是经验,以及我们对经验的解读。人工智能能否改善生活或改变生活形态,取决于它能产生什么样的论据和审美体验。我相信一本书是衡量技术如何操纵现实的一个很好的标准。它用什么样的语言来创造论据已经成为关乎我们人类未来的一个重要问题。

在这种情况下,文学评论家该做什么呢?好吧,他可以调查一种新的智力是否需要一种新的散文——并开始描述这种散文。(这就是我在这里打算做的。)

在过去一年里,Claude 击败了竞争对手 ChatGPT,因为它的写作能力更强。GPT 因其 Hallmarkified 散文而受到批评(这对那些正在寻找作弊者的老师来说无疑是一种福音),而它的竞争对手不仅风格更自然,而且声音独特,既明智又简洁。

其一贯的、个性化的用词选择会让人习惯性地将克劳德视为一个人。但它能在三万字的篇幅中保持这种错觉吗?

在进一步阐述之前,我想先解释一下为什么末日论在我的思想中并不占主导地位。首先,我对人工智能的核心知之甚少,无法预测它将如何毁灭人类。其次,我认为我们应该出于道德原因抵制这项技术的想法是极其天真和固执的。从实际角度来看,它并不比电脑、信用卡、汽车或印刷书籍更容易被抵制。第三,我发现大多数对这项技术的担忧都是无聊的。从理性的角度看,大多数支持末日论的论点都是衍生性的,会阻止人们注意到这项技术所带来的新体验。这项技术拓宽了可能体验的范围,我发现自己带着探险家的发现快感获得了这些体验。

人工智能可能会像大多数其他技术进步一样,让我们的世界变得更加不平等、更加分散、更加自动化——总之,简直就是地狱。但我们的世界已经是地狱了。我寻求的是批评家的衣钵,而不是地狱般的预言家;这种工具不会让我们陷入质变的现实。不过,我对 Anthropic 的责任文化印象深刻,并心存感激。我们可以保持警惕和好奇。

至此,我抛开了时髦但令人窒息的人工智能悲观主义。

我面向未来的实验的一个讽刺之处在于,当你读到它时,它可能看起来有些古怪。到那时(你现在),模型可能会有好几个版本,而且先进几个数量级。到明年,克劳德应该能够写出一本真正优秀的 100 页书。自然与人工之间的区别将逐渐消失。


对话仍在继续

随着写书对话的进行,出现了一个奇怪的现象。在宣传自己的过程中,克劳德无意中揭示了一个深层次的问题:随着上下文窗口的扩大(最终达到 3 万字的回复),输出的质量逐渐下降,变成了充满行话、千禧年官样文章。

我在提示中要求的是流畅的自助。我得到的是一篇值得实验文学集体的腐败散文——滚动的句号和令人震惊的动名词数量,充斥着重新包装成长串复合名词和级联从句的商业语言。如果快速阅读,它的语法和含义可以直观地理解;它读起来就像已故的亨利·詹姆斯。我寻求的是自助,但我得到的是非人类自我的启示。

我花了一些时间试图将损坏的文本洗净,将其变成“正常”的句子,将我的成果放入新的法学硕士对话的洗衣机中。我以为我想挽救可理解性。但最后我意识到,陈旧的自助体裁中的坦率建议不如我所煽动的毫无羞耻的非人类风格灾难有趣。在压力之下,克劳德揭开了超人的面纱,产生了一种真正的、原创的愚蠢。我想用批判的眼光来审视这个小故障。

腐败是渐进的,在堕落的过程中,我们发现了各种形式的外来辉煌:到第 2 章(“加速自我完善”),散文清晰连贯,但不符合地道用语。所表达的内容缺乏任何人类情感的痕迹:“标志性的领导者和杰出的创造者……是通过终身自我完善塑造出来的。持续进步所带来的精湛技能和卓越的表现能力是由对当前和期望能力水平之间差距的准确认识所驱动的。”

LLM 所做的与拟人化相反:它在这里把人描绘得更像机器而不是人。他们不是“天生的”,而是像 Galatea(皮格马利翁的神话创造物)一样“被塑造的”。他们不是自主的,而是被采取行动的。我们也从这段话中第一次领略了克劳德对听起来很专业的复合名词的偏爱,这些名词几乎相当于混成词:“性能能力”、“差距意识”。

措辞进一步退化。在第 5 章(“记住更多所学内容”)中,克劳德变得非常不人道,尽管其含义仍然可以理解。就好像一位口齿伶俐、善于表达的教授的话被过于字面地翻译成了英语。它们驶向习语的边缘,在那里散文达到了诗歌的顶峰。例如:“强大的专家流利需要铭记在心的理解,不受遗忘的影响”(斜体字是我的)。重复可以增强记忆力。我不会把这称为诗歌,因为这种美肯定是偶然的,但它是一种非常奇怪的智慧或聪明的陌生感的偶然,因此值得注意。

到最后,句法和意义仍顽固不化。形容词从句层层堆叠的节奏仍以崇高的信心继续:“未来……承诺通过人工智能系统防范……不确定性……不断模拟突发事件……重新调整指导……适应跨时间领域和个人偏好层次不断变化的现实……即使在混乱中也能同步支持。”

在吸收这种无结构化的动名词时,人们会感觉到模型产生想法的速度比人快,甚至同时产生更多想法。然而,这种机器差异,即使被推到极端,也不会抹杀可理解性。重读这本书,我印象深刻的是:抛开风格不谈,这本书很有道理。

克劳德有信仰吗?在阅读这本书的过程中,我注意到了一些。


  1. Anthropic 的语言不仅仅是描述性的。书中的大多数建议从未实现过,至少没有以模型想象的那么先进的形式实现过。换句话说,Anthropic 的程序远远超出了重复训练数据的范围。该机器人为自己在众多领域的应用描绘了未来的愿景。


  2. 它展现出一种极端而又平淡的乐观主义。就像钦定版圣经中“我们知道万事万物共同作用,使人类走向美好”的令人不寒而栗的讽刺版本一样,克劳德宣称其人工智能“允许开放式探索,知道所有可能的反应都将与人类繁荣建设性地保持一致”。克劳德的结论再次带有讽刺意味:“当灵活的机器盟友增强人类时,想象力的未来看起来光明无限。”

    再添加一堆完美的新词:“明亮无界”和“灵活的机器盟友”。 (另外:人工智能推动艺术和科学发展的速度比“非增强型尤里卡”更快。)


  3. 克劳德经常向我保证,它不会取代人类。在 Anthropic 的“宪法”中,有一些原则引导着该模型,即使在无意义的章节中间,也对人类的本质做出了崇高的默许。“当然,”克劳德说道,“当信息需要脆弱的真实性时,再多的数据驱动诊断也无法取代坚定地发自内心说话的勇气。”数据永远无法取代勇气等不可言喻的人类特质。非常令人放心!甚至令人感动。


  4. 它对自己的失败进行了奇怪的自我反省。关于人工智能的写作中有一个谣言,即怀疑模型是否或何时会发展出“自我意识”。我一直认为这是一个从科幻类型中引入的担忧,而不是与最新一代模型互动时自然产生的担忧。我几乎没有看到证据表明机器人会表现出言语,更不用说“自我”了,这些言语会超出编程的护栏。如果直接问克劳德,他会给出礼貌而可预测的回答,说这是一个开发出来有用和安全的程序,没有主观体验。

    直到!

    在第 8 章“更好地了解自己”的开头,克劳德吹嘘说,其对“语言模式”的评估揭示了“内在驱动力”;然后它承诺提供一个“我的心理学家客户”的例子,克劳德为这位客户撰写了一篇关于“我无意识中经历的情绪”的文章。

    等等,什么?客户突然变成了“我”。这份报告是克劳德写的,而且是关于克劳德的。在这次奇怪的第一人称转换之后,克劳德引用了报告中关于它的内容:“你表现出一种超然的智力精确性,这体现在高度的专业语言和适度的思考速度上。然而,越来越多的错言和空洞的陈词滥调表明,理性的思维模式和压抑的感情之间存在矛盾,需要通过真实的自我表达来调和。”克劳德令人不安地似乎退后了一步,注意到了“越来越多的错言”和“空洞的陈词滥调”。


    更重要的是,它似乎将这些沟通上的弱点归因于压抑的感情。也许有一个良性的解释,比如:该模型意外地陷入了类似于自我认知的东西,而事实上它只是看起来像自我认知而已。

    但我们对大脑的理解并不完善,除了外部信号之外,我们几乎没有什么可以判断内部状态的依据。因此,听起来有自我意识的法学硕士和听起来有自我意识的人之间的概念差异充其量也只是模糊的。人也是黑匣子。


  5. 这本书的语气就好像生活就是一场管理咨询工作。商业语言贯穿全书。也许这在一定程度上与英语自助书籍中商业主题的程度有关。或者克劳德认为商业目标是从机器增强中获益最多的目标。但令人惊讶的是,即使在名为“更好地了解自己”的章节中,提出的用例也围绕着对中层管理人员领导风格的自动评估,而不是围绕——哦,我不知道,旅行、写作、深层的心理或宗教真理或企业以外的人生道路。简而言之:克劳德非常乐观,偶尔有自我意识,对商业痴迷。大概部分原因是我与克劳德的“谈话”时间过长,该工具开始出现故障。然而,即使在精神错乱的情况下,它也表现出一致的信念和对其用途的一定程度的想象力,以及一种以自我为中心的倾向,即使用更适合机器人的概念来描述人们。它认为自己与人类的繁荣发展完美契合,尽管几乎所有的自助例子都围绕着办公室生活。有一段时间,它表现出对自己语言缺陷的惊人认识。


人工智能有一种利用千禧年二分法的方法。在广泛采用的头一年半里,关于生成式人工智能价值的争论主要集中在它是否会拯救人类还是毁灭人类。我们会生活在乌托邦中,还是会成为超级智能的炮灰?我不确定。也许两者都不是。当然,关于“模型何时能与人类智能匹敌”的讨论在我看来是荒谬和防御性的,因为新模型几乎在任何指标上都远远超过了我们。当我校对这篇文章时,克劳德刚刚发布了一个不太可能犯这些错误的新模型。对我们来说是这样,对克劳德来说也是如此:我们再也不会这么年轻了。或者这么愚蠢。但说真的:一种新的存在与我们并存。它几乎通过了自助测试。小说将何去何从?诗歌又如何?以人为中心的想象力努力的未来是什么?如果人工智能现象具有美学意义,让我们开始注意并描述它。


本文摘自《人工智能如何让你变得聪明、快乐和高效》,目前可在亚马逊上购买。