Machines That Play系列分为 7 个部分。
本系列涵盖人工智能和游戏的历史(直到深蓝),重点关注下棋、跳棋和西洋双陆棋的机器。涵盖以下主题:如何构建国际象棋机器,香农的国际象棋工作,图灵的国际象棋工作,土耳其人,El Ajedrecista,MANIAC,伯恩斯坦国际象棋程序,塞缪尔跳棋,Mac Hack VI,Cray Blitz,BKG,HiTech,Chinook, Deep Thought、TD-Gammon 和 Deep Blue。
这是该系列的第 1 部分,概述了与游戏相关的 AI 工作:国际象棋、跳棋、双陆棋。它还提出(并试图回答)以下问题:什么是理想的游戏?为什么我们对人工智能 (AI) 和游戏感兴趣?
在我们谈论游戏和机器之前,我们先来谈谈游戏和人类。
游戏是有规则和目标的东西。当我们执行受这些规则约束的行动时,我们“玩”了一场游戏,以实现既定目标。
我们(人类)似乎需要玩耍,就像我们需要食物、水、空气、住所和工具来生存一样。那么,对于我们人类来说,怎样才能使游戏变得理想呢?这是一个很难回答的问题,但我想一个理想的游戏可能至少具有以下一些特征:
我不知道是否有理想的游戏,但在我看来,以下示例非常接近于一个;它不仅满足前面列出的许多特征,而且挑战和模糊了这些相同的特征。
死神:嗯,我是一个相当熟练的棋手。
奈特:但我敢打赌你不如我。
死神:你为什么要我和我下棋?
奈特:那是我的事。
死神:确实。
骑士:条件是只要我能与你抗衡,你就让我活下去。
骑士:如果我赢了,你就放我走。
玩家选择只要他活着(或可以)就玩。赌注太高了,他忍不住还是要试试。
[视频剪辑]这是我的手。我可以转动它。我的血液涌入其中。太阳还在天上,风还在吹。而我……我,Antonius Block,正在和魔鬼下棋。
我们从不与死神比赛(几乎赢了)。在大多数游戏中,我们的行为远没有拯救其他人的生命那么“有意义”。我们的游戏既没有让我们有机会接受我们不可避免的绝望,也没有从根本上改变(或超越)我们自己或他人的生活。
实际上,可能没有理想的游戏。那我们为什么还要玩呢?一个模糊而简单的答案是“因为游戏很有趣和/或有用”,但这似乎还不够。我们继续创造和玩游戏,我们继续,因为游戏仍然表现出上述特征的不同组合。
我们一直在玩游戏。游戏是我们最古老的游戏来源之一。早期的人类可能会玩游戏来练习为狩猎和战斗做好准备的技能。例如,弓箭是上旧石器时代末期发明的。
射箭是使用弓箭射箭的技能。在大多数史前文化中,射箭是一项重要的军事和狩猎技能。练习射箭(或练习或提高)会提高射手成功的可能性。从这个意义上说,这样的体育游戏可能是为了增加我们生存和成功的机会。
后来,人类开始在一个地方定居,这意味着他们不再经常四处走动。这给了他们一些常规和实体游戏开始转化为棋盘游戏。这些游戏满足了我们的各种欲望。一些最古老的游戏是:
纵观历史,我们创造和玩游戏来挑战我们的智力、力量、策略、情感等等。在游戏中,我们走到一起并同意一套任意规则。我们竞争和合作,我们制定战略以克服机会和不确定性,我们设定并实现目标,我们锻炼想象力并体验成功的喜悦。
游戏很难。游戏很有趣。游戏是人工智能的试验台。
随着技术的发展,我们的游戏也在发展。最近的技术以机器的形式为我们提供了新的队友和新的对手。尽管游戏的历史引人入胜,但我们将在本系列中专注于自动化、人工智能 (AI) 和游戏。更具体地说,我们将专注于人工智能已经学会玩得和我们一样好或更好的游戏。这段旅程将成为一个谦虚的提醒:
无论人类的进步速度如何,一旦机器开始学习,我们就很难跟上它们的步伐——它们的学习和进步最终会以指数方式衡量。而我们的不会。
自计算机诞生之初,人们就想知道机器是否可以匹敌或超越人类智能。人工智能是关于制造能够执行(我们认为)需要“智能”的任务的机器。但早期的人工智能方法和算法由于其复杂和模棱两可的性质,不足以解决现实世界的问题。编程机器玩游戏成功地成为计算机学习策略和策略的一种方式,这些策略和策略以后可以应用于其他现实生活领域。
在游戏中模拟人类思维过程
早期的人工智能研究人员强调在游戏中模拟人类思维过程,因为他们相信最好的游戏机器可以通过教他们如何模仿人类思维来创造。他们推断,如果机器能够成功处理游戏,那么它们很可能会表现出某种类型的智能。
了解人类思维的运作方式
早期的人工智能研究人员希望,成功地玩游戏的编程机器将有助于了解人类的思维方式、思维方式、解决问题的方式,以及最终的智能是什么。他们假设建造机器来执行需要智能的任务可以让我们一窥我们自己的智能是如何工作的。
我们将看到,即使机器在游戏中超越了人类,它们也不一定能洞察我们的思维方式。然而,它们确实帮助推动了计算机科学(以及其他相关领域)的进步。后来,这项研究帮助我们正面解决了一些复杂的现实问题。
“游戏很有趣,而且很容易衡量。谁赢谁输一目了然,而且你总是有人类的基准……你能比人类做得更好吗?”默里坎贝尔
游戏,特别是棋盘游戏,是 AI 最古老的分支之一,始于 1950 年的 Shannon 和 Turing。它们提供了一种衡量 AI 想法能力的好方法,因为 1)它们的目标简单,2)定义明确的规则和3) 实现最终目标的多种可能策略。每次 AI 征服游戏时,它都会帮助我们正面解决至少一些复杂的现实问题。
在开始之前,让我们看一些衡量游戏复杂性的方法。
游戏的状态空间复杂度是从游戏的初始位置可以到达的合法游戏位置的数量。
博弈树大小是可以玩的可能博弈的总数:博弈树中植根于博弈初始位置的叶节点数。
分支因子是每个节点的子节点数。例如,国际象棋,假设一个“节点”被认为是一个合法位置,那么平均分支因子估计约为 35。这意味着,平均而言,一个玩家每回合有大约 35 个合法移动可用。相比之下,围棋游戏的平均分支因子为 250!
最佳状态:不可能表现得更好(其中一些条目是由人类解决的)
超人:表现比所有人都好
现在,让我们谈谈机器。
该博客系列将涵盖以下主题。图片链接在原始博客中。
该系列的重点是人工智能和游戏中的一些“第一”(有时是这些程序的一些前身),而不是包括*所有*或*尽可能多的*游戏程序。
我们平时是怎么玩这个游戏的?我们执行以下操作:
从这个角度来看,几乎所有的国际象棋计算机都必须处理这些基本步骤。为此,国际象棋计算机必须解决以下关键问题:
开发国际象棋计算机有两种主要的哲学方法:仿真与工程——计算机应该模仿人类的知识和决策,还是计算机应该通过蛮力改进搜索?那些专注于第一种方法的人将构建具有大量国际象棋知识和相对较小的搜索重点的程序。那些专注于工程方法的人将专注于计算能力,通过使用专用硬件和搜索创新。我们将看到最好的国际象棋计算机使用第二种方法,但即使它们最终也使用了大量的国际象棋知识和复杂的评估启发式。
阅读更多……
阅读更多……
从 1940 年代到 1950 年代初,早期的先驱者专注于制造可以像人类一样下棋的机器,因此早期的国际象棋进展很大程度上依赖于国际象棋启发式(经验法则)来选择最佳棋步。他们强调模拟人类国际象棋思维过程,因为他们相信教机器如何模仿人类思维会产生最好的国际象棋机器。
阅读更多……
1950年代计算能力有限,机器只能玩很基础的水平。这是研究人员开发评估国际象棋位置和搜索可能的移动(以及对手的反移动)的基本技术的时期。这些想法今天仍在使用。
游戏:国际象棋。年份:1948–1953
1953 年,艾伦·图灵在 B. Bowden 的《比思想更快》一书中发表了一篇关于他的国际象棋程序(应用于游戏的数字计算机)的文章。香农在他的论文中没有谈到任何特定的程序。图灵编写了第一个国际象棋程序。他在计算机出现之前就写好了!他知道计算机即将到来,一旦它们足够强大,它们就可以下棋了。 2012 年,加里·卡斯帕罗夫与 Turochamp 交手,仅用 16 步就将其击败。 卡斯帕罗夫说(视频) , “我想你可能会称之为原始,但我会把它比作早期的汽车——你可能会嘲笑他们,但它仍然是一个令人难以置信的成就......
[图灵] 在没有计算机的情况下编写算法——许多年轻科学家永远不会相信这是可能的。这是一项了不起的成就。”
阅读更多……
伯恩斯坦国际象棋程序使用香农 B 型(选择性搜索)策略。
到 1960 年代末,计算机国际象棋程序已经足够好,偶尔可以击败俱乐部级或业余棋手。
在 1970 年代和80年代,重点是硬件速度。在 1950 年代和 1960 年代,早期的先驱者专注于国际象棋启发式(经验法则)来选择最好的下一步棋。 1970 年代和 1980 年代的程序也使用了一些国际象棋启发式算法,但更加关注软件改进以及使用更快、更专业的硬件。定制的硬件和软件允许程序对博弈树进行更深入的搜索(例如:涉及数百万个国际象棋位置),这是人类没有做到的(因为他们做不到)。
阅读更多……
游戏:跳棋。年:(1989-1996)
在塞缪尔研究跳棋之后,人们产生了一种错误的印象,即跳棋是一种“已解决”的游戏。结果,研究人员转向国际象棋,几乎忽略了跳棋,直到 Jonathan Schaeffer 于 1989 年开始研究 Chinook。Schaeffer 的目标是开发一个能够击败最好的跳棋选手的程序。最好的球员是马里昂·廷斯利。在一场比赛中,奇努克赢了一场与廷斯利的比赛,谢弗回应说,
“我们仍然是人类的一员,而奇努克在一场比赛中击败了廷斯利,这意味着计算机在国际跳棋领域以及最终在国际象棋等其他游戏中的至高无上只是时间问题。”
阅读更多内容,了解 Chinook 与 Tinsley 的比赛结果。
1990 年代,国际象棋项目开始挑战国际象棋大师和后来的国际象棋大师。一台名为“深蓝”的专业国际象棋机器最终将击败最优秀的人类棋手加里·卡斯帕罗夫。我们还看到了强化学习的成功应用(AlphaGo 几年后会这样做)。
游戏:国际象棋。年份:1996–1997
这个很长(而且非常有趣)。一定要读。
深蓝在 1996 年面对加里·卡斯帕罗夫时只有两周大的婴儿。它的创造者之一许说:“会不会是赫拉克勒斯的婴儿赫拉克勒斯勒死了女神赫拉派来的两条蛇?还是我们派了一个无助的婴儿来安抚海怪希图斯,但没有珀尔修斯的帮助?我们担心会是后者。”它与卡斯帕罗夫的第一场比赛就赢了——这促使卡斯帕罗夫质疑自己并问道:“ ……如果这东西是无敌的怎么办?”它不会是无敌的,卡斯帕罗夫会以 4-2 击败它。这场比赛比大多数人想象的要近得多(阅读更多)。
赛后卡斯帕罗夫说(关于深蓝),
“我能感觉到——我能闻到——桌子对面的一种新型智能。”
“我根本没有心情玩……我是一个人。当我看到一些超出我理解范围的东西时,我很害怕。''
阅读更多(深蓝色)...
人们认为卡斯帕罗夫仍然是一名更好的球员,但他的情绪阻碍了他。无论哪种方式,这场比赛最大的收获之一是我们集体低估了比赛的生理和心理方面。
我们的情绪、恐惧、欲望和怀疑有办法让我们变得最好……这是人类独有的问题,我们的机器对手不会担心。
阅读更多(发布深蓝) ……
以Garry Kasparov 的 TED 演讲和他对这次经历的看法结束似乎是正确的。
“我从自己的经验中学到的是,如果我们想充分利用我们的技术,我们必须面对我们的恐惧,如果我们想充分利用我们的人性,我们就必须克服这些恐惧。
在舔舐伤口的同时,我从与深蓝的战斗中获得了很多灵感。正如俄罗斯老话所说,如果你不能打败他们,那就加入他们。然后我想,如果我可以玩电脑——和我身边的电脑一起玩,结合我们的优势,人类的直觉加上机器的计算,人类的策略,机器的战术,人类的经验,机器的记忆。这可能是曾经玩过的完美游戏吗?但与过去不同的是,当机器取代农场动物和体力劳动时,现在它们正在追逐具有大学学历和政治影响力的人。作为一个与机器战斗并失败的人,我在这里告诉你这是一个极好的消息。最终,每个职业都将不得不感受到这些压力,否则这将意味着人类已经停止进步。我们无法选择技术进步何时何地停止。
我们不能放慢脚步。事实上,我们必须加快速度。我们的技术擅长消除生活中的困难和不确定性,因此我们必须寻找越来越困难、越来越不确定的挑战。机器有计算。我们有理解。机器有指令。我们有目的。机器具有客观性。我们有激情。我们不应该担心我们的机器今天能做什么。相反,我们应该担心他们今天仍然无法做到的事情,因为我们需要新的智能机器的帮助才能将我们最伟大的梦想变为现实。如果我们失败了,如果我们失败了,那不是因为我们的机器太智能,或者不够智能。如果我们失败了,那是因为我们变得自满并限制了我们的野心。我们的人性不是由任何技能来定义的,比如挥动锤子甚至下棋。只有人类才能做的一件事。那是梦想。所以让我们梦想成真。”
https://www.youtube.com/watch?v=NP8xt8o4_5Q&feature=emb_imp_woyt
所以让我们梦想成真。