Machines That Playシリーズは 7 つのパートに分かれています。
このシリーズでは、人工知能とゲーム (Deep Blue まで) の歴史を取り上げ、チェス、チェッカー、バックギャモンをプレイしたマシンに焦点を当てています。次のトピックがカバーされています。ディープ ソート、TD-ギャモン、ディープ ブルー。
これはシリーズのパート 1 で、ゲーム (チェス、チェッカー、バックギャモン) に関連する AI の取り組みの概要を説明します。また、次の質問をします (そして答えようとします): 理想的なゲームとは?なぜ私たちは人工知能 (AI) やゲームに興味を持っているのでしょうか?
ゲームと機械について話す前に、まずゲームと人間について話しましょう。
ゲームとは、ルールと目的があるものです。確立された目的を達成するために、これらのルールによって制約されたアクションを実行するときに、ゲームを「プレイ」します。
私たち (人間) は、生き残るために必要な食料、水、空気、避難所、道具とほぼ同じくらい遊びを必要としているようです。では、私たち人間にとって理想的なゲームとはどのようなものでしょうか。これは答えるのが難しい質問ですが、理想的なゲームには次のような特徴が少なくともいくつかあると思います。
理想的なゲームがあるかどうかはわかりませんが、私の意見では、次の例はその 1 つにかなり近づいています。前述の特性の多くを満たすだけでなく、同じ特性に挑戦し、あいまいにします。
死:まあ、私はかなり熟練したチェス プレーヤーです。
Knight:しかし、きっとあなたは私ほど上手ではありません。
死: なぜ私とチェスをしたいのですか?
騎士: それは私の仕事です。
死:確かに。
ナイト: 条件は、私があなたに立ち向かえる限り、私を生きさせてくれることです.
ナイト: 私が勝ったら、あなたは私を行かせてくれます。
プレイヤーは、生きている間 (またはできる限り) プレイすることを選択します。賭け金が高すぎるので、彼はやむを得ず、それでも試みます。
【動画】これは私の手です。回せます。そこに私の血が噴き出す。太陽はまだ空にあり、風が吹いています。そして私は…私、アントニウス・ブロックは悪魔とチェスをしています。
私たちは死と対戦することはありません(そしてほとんど勝ちます)。ほとんどのゲームでの私たちの行動は、他の人間の命を救うほど「意味のある」ものではありません。私たちのゲームは、避けられない絶望を受け入れる機会も、自分自身や他人の人生を根本的に変える (または超越する) 機会も与えてくれません。
実際には理想的なゲームはおそらくないでしょう。なぜ私たちはまだ遊んでいるのですか?漠然とした単純な答えは「ゲームが楽しくて便利だから」ですが、それだけでは十分ではないようです。私たちはゲームの作成とプレイの両方を続けています。これは、ゲームがまだ上記の特性のさまざまな組み合わせを示しているためです。
私たちはいつもゲームをしてきました。ゲームは、私たちの最も古い遊びの源の 1 つです。初期の人類は、狩猟や戦闘に備えたスキルを練習するためにゲームをプレイした可能性があります。たとえば、弓矢は後期旧石器時代の終わりまでに発明されました。
アーチェリーは、弓を使って矢を放つスキルです。ほとんどの先史時代の文化では、アーチェリーは重要な軍事および狩猟技術でした。アーチェリーの練習 (または練習や改善のためにプレーすること) は、射手の成功の確率を高めたでしょう。この意味で、このような物理的なゲームは、生存と成功の可能性を高めるために行われた可能性があります。
その後、人間は一か所に定住するようになり、あまり動き回らなくなりました。これにより、いくつかの日常的なゲームが与えられ、物理的なゲームがボードゲームに変換され始めました.これらのゲームは、私たちのさまざまな欲求を利用しました。最も古いゲームのいくつかは次のとおりです。
歴史を通じて、私たちは知性、強さ、戦略、感情などに挑戦するゲームを作成し、プレイしてきました。ゲームでは、私たちは集まり、一連の恣意的なルールに同意します。私たちは競争し、協力し、チャンスと不確実性を克服するために戦略を立て、目標を設定して達成し、想像力を働かせ、成功の喜びを体験します。
ゲームは難しいです。ゲームは面白いです。ゲームは AI のテストベッドです。
テクノロジーが進化するにつれて、ゲームも進化しました。最近のテクノロジーは、マシンの形で新しいチームメイトと新しい対戦相手を提供してくれました。ゲームの歴史は興味深いものですが、このシリーズでは自動化、人工知能 (AI)、およびゲームに焦点を当てます。より具体的には、AI が私たちと同じかそれ以上にプレイすることを学習したゲームに焦点を当てます。この旅は、謙虚なリマインダーとして役立つことが判明します。
人間の改善率がどれほどであっても、機械が学習を開始すると、私たちが機械についていくのは難しくなります。機械の学習と進歩は、指数関数的に測定されることになります。そして、私たちのものはしません。
コンピューティングの黎明期から、人々はマシンが人間の知性に匹敵するか、それとも超えることができるか疑問に思っていました。人工知能とは、「知性」を必要とする (私たちが考える) タスクを実行できる機械を構築することです。しかし、以前の AI のアプローチとアルゴリズムは、複雑で曖昧な性質のため、現実世界の問題に取り組むには十分ではありませんでした。ゲームをプレイするようにマシンをプログラミングすることは、コンピューターが戦術や戦略を学習するための 1 つの方法として機能し、後で他の現実の領域に適用できるようになりました。
ゲームで人間の思考プロセスをエミュレートする
初期の AI 研究者は、ゲームにおける人間の思考プロセスのエミュレーションを重視していました。人間の思考を模倣する方法を教えることで、最高のゲームプレイ マシンを作成できると信じていたからです。彼らは、マシンがゲームにうまく取り組むことができれば、ある種の知性を発揮する可能性が高いと考えました.
人間の心の仕組みを理解する
初期の AI 研究者は、ゲームをうまくプレイできるように機械をプログラミングすることで、人間の心がどのように機能し、どのように考え、どのように問題を解決し、最終的に知性とは何かを理解するのに役立つことを期待していました。彼らは、知性を必要とするタスクを実行する機械を構築することで、私たち自身の知性がどのように機能するかを垣間見ることができると考えていました。
ゲームで機械が人間を凌駕したときでさえ、私たちの心の働きについて洞察を与えるとは限らないことがわかります。しかし、それらはコンピューター サイエンス (およびその他の関連分野) の進歩を促進するのに役立ちました。その後、この研究は、いくつかの複雑な現実世界の問題に正面から取り組むのに役立ちました。
「ゲームは楽しく、簡単に測定できます。誰が勝って誰が負けたかは明らかで、常に人間のベンチマークを持っています...人間よりもうまくやれますか?」マレー・キャンベル
ゲーム、特にボードゲームは、1950 年のシャノンとチューリングに始まる AI の最も古い分野の 1 つです。1) 目的の単純さ、2) 明確に定義されたルール、および3) 最終目的に到達するための膨大な範囲の可能な戦略。 AI がゲームを征服するたびに、少なくともいくつかの複雑な現実世界の問題に正面から取り組むことができました。
始める前に、ゲームの複雑さを測定する方法をいくつか見てみましょう。
ゲームの状態空間複雑度は、ゲームの初期位置から到達可能な正当なゲーム位置の数です。
ゲーム ツリーのサイズは、プレイできるゲームの総数です。つまり、ゲームの初期位置をルートとするゲーム ツリーのリーフ ノードの数です。
分岐係数は、各ノードの子の数です。たとえば、チェスでは、「ノード」が正当な位置であると見なされると仮定すると、平均分岐係数は約 35 と推定されます。これは、平均して、プレイヤーは各ターンで約 35 の正当な動きを利用できることを意味します。比較すると、囲碁ゲームの平均分岐係数は 250 です。
最適なステータス: これ以上のパフォーマンスはありません (これらのエントリの一部は人間によって解決されました)
超人: すべての人間よりも優れたパフォーマンスを発揮する
さて、機械の話をしましょう。
このブログ シリーズでは、次のトピックについて説明します。画像へのリンクは元のブログにあります。
このシリーズの焦点は、AI とゲーム (および場合によってはそれらのプログラムの前身) の「最初」のいくつかにあり、*すべて* または *できるだけ多くの* ゲーム プログラムを含めることではありません。
私たちは通常、このゲームをどのようにプレイしますか?私たちは次のことを行います。
この観点から、ほとんどすべてのチェス コンピューターは、これらの基本的な手順を処理する必要があります。そのためには、チェス コンピューターは次の主要な問題に対処する必要があります。
チェス コンピューターの開発には、主に 2 つの哲学的アプローチがありました。エミュレーションとエンジニアリングです。コンピューターは人間の知識と意思決定をエミュレートする必要がありますか、それとも力ずくで検索を改善する必要がありますか?最初のアプローチに焦点を当てている人は、チェスの知識が豊富で、検索に比較的重点を置いていないプログラムを構築します。工学的アプローチに焦点を当てている人は、専用ハードウェアを使用して計算能力に焦点を当て、イノベーションを検索します。最高のチェス コンピューターが 2 番目のアプローチを使用したことがわかります。
1940 年代から 1950 年代初頭にかけて、初期のパイオニアは人間と同じようにチェスをプレイするマシンの構築に重点を置いていたため、初期のチェスの進歩はチェスの経験則 (経験則) に大きく依存して最善の手を選択していました。彼らは、人間の思考を模倣する方法を機械に教えることで、最高のチェス マシンが生み出されると信じていたため、人間のチェスの思考プロセスのエミュレーションを強調しました。
1950 年代には計算能力が限られていたため、マシンは非常に基本的なレベルでしか機能しませんでした。これは、研究者がチェスの位置を評価し、可能な動き (および対戦相手の反撃) を検索するための基本的な技術を開発した時期です。これらのアイデアは現在でも使用されています。
ゲーム: チェス。年: 1948–1953
1953 年、アラン チューリングは、B. ボーデンの著書 Faster than Thought でチェス プログラム (ゲームに適用されるデジタル コンピューター) に関する記事を発表しました。シャノンは彼の論文で特定のプログラムについて話していませんでした。最初のチェスプログラムを書いたのはチューリングでした。そして、彼はコンピューターが存在する前にそれを書きました!彼はコンピューターが登場することを知っていました。コンピューターが十分に強力になれば、チェスができるようになるでしょう。 2012 年、Garry Kasparov は Turochamp と対戦し、わずか 16 手で倒しました。 Kasparov 氏は、(ビデオ) 、 「原始的と呼ぶかもしれませんが、初期の車と比較します。笑われるかもしれませんが、それでも信じられないほどの成果です...
[チューリング] はコンピューターを持たずにアルゴリズムを書きました — 多くの若い科学者は、それが可能だとは決して信じませんでした。それは傑出した成果でした。」
バーンスタイン チェス プログラムは、シャノン タイプ B (選択的探索) 戦略を使用しました。
1960 年代の終わりまでには、コンピューター チェス プログラムは、クラブ レベルのプレーヤーやアマチュア プレーヤーに時折打ち負かすのに十分なほど優れていました。
1970 年代と1980年代には、ハードウェアの速度が重視されていました。 1950 年代と 1960 年代に、初期のパイオニアはチェスのヒューリスティック (経験則) に焦点を当てて、次の最良の動きを選択しました。 1970 年代と 1980 年代のプログラムでもチェスのヒューリスティックが使用されていましたが、ソフトウェアの改善と、より高速で特殊なハードウェアの使用に重点が置かれていました。カスタマイズされたハードウェアとソフトウェアにより、プログラムはゲーム ツリーのより深い検索 (例: 何百万ものチェスの位置を含む) を実行できるようになりました。
ゲーム: チェッカー。年: (1989–1996)
サミュエルがチェッカーに取り組んだ後、チェッカーは「解決された」ゲームであるという誤った印象がありました。その結果、研究者はチェスに移行し、ジョナサン・シェーファーが 1989 年にチヌークの研究を開始するまで、ほとんどチェッカーを無視していました。シェーファーの目標は、最高のチェッカー プレーヤーを倒すことができるプログラムを開発することでした。最高の選手はマリオン・ティンズリーでした。試合中、チヌークはティンズリーとの試合に勝利し、シェーファーは次のように答えました。
「私たちはまだ人類の一員であり、チヌークが 1 つのゲームでティンズリーを破ったということは、コンピュータがチェッカーで、そして最終的にはチェスのような他のゲームで最高になるのは時間の問題であることを意味します。」
詳細を読んで、チヌーク対ティンズリーがどのようにプレーしたかを確認してください。
1990 年代、チェス プログラムは国際的なチェス マスターとその後のグランドマスターに挑戦し始めました。ディープ・ブルーと名付けられた特殊なチェス・マシンは、人間最高のチェス・プレイヤーであるガリー・カスパロフを打ち負かすことになるでしょう。また、強化学習 (AlphaGo が数年後に行うもの) の成功したアプリケーションも見ました。
ゲーム: チェス。年: 1996–1997
これは長い(そして非常に興味深い)。必ず読んでください。
ディープ ブルーは、1996 年にガリー カスパロフと対決したとき、生後 2 週間の赤ちゃんでした。その作成者の 1 人であるスーは、次のように述べています。それとも、ペルセウスの助けを借りずに、海の怪物シータスをなだめるための賛辞として無力な赤ちゃんを送ったのでしょうか?後者になるのではないかと心配していました。」カスパロフと対戦した最初のゲームで、勝利しました — カスパロフに自問自答を促し、「 ...これが無敵だとしたらどうなるか?」と尋ねました。無敵ではなく、カスパロフが 4 対 2 で打ち負かしました。この試合は、ほとんどの人が考えているよりもずっと接戦でした (続きを読む)。
試合後、カスパロフは(ディープ・ブルーについて)こう言った。
「私は感じることができました — 私は嗅ぐことができました — テーブル全体で新しい種類の知性を感じました。」
「まったくプレーする気分ではなかった..私は人間だ。自分の理解をはるかに超えたものを見ると、恐れます。」
続きを読む(ディープブルー)…
人々はカスパロフの方が優れた選手だと信じていたが、彼の感情が邪魔をした。いずれにせよ、この試合から得られた最大の教訓の 1 つは、試合の生理学的側面と心理的側面の両方をまとめて過小評価していたことです。
私たちの感情、恐怖、欲望、疑念は、私たちを最大限に活用する方法を持っていました…そして、これは人間特有の問題であり、機械の敵は心配していません.
Garry Kasparov の TED トークとその経験に関する彼の見解で締めくくるのが正しいようです。
「私自身の経験から学んだことは、テクノロジーを最大限に活用したいのであれば、恐怖に直面しなければならず、人間性を最大限に活用したいのであれば、それらの恐怖を克服しなければならないということです.
傷をなめながら、Deep Blueとの戦いから多くのインスピレーションを得ました。古いロシアのことわざにあるように、彼らを倒すことができない場合は、彼らに参加してください。それから私は考えました コンピューターで遊ぶことができたらどうだろうと考えました — 人間の直感と機械の計算、人間の戦略、機械の戦術、人間の経験、機械の記憶など、私たちの強みを組み合わせて、私の側にあるコンピューターと一緒に。それは今までプレイされた中で完璧なゲームでしょうか?しかし、機械が家畜や肉体労働に取って代わった過去とは異なり、今では大卒者や政治的影響力を持つ人々を追い求めています。そして、機械と戦って負けた者として、これは非常に素晴らしいニュースであるとお伝えするためにここにいます。最終的には、すべての職業がこうしたプレッシャーを感じなければならなくなるでしょう。技術の進歩がいつ、どこで止まるかを選択することはできません。
減速することはできません。実際、スピードアップする必要があります。私たちのテクノロジーは、私たちの生活から困難や不確実性を取り除くことに優れているため、私たちはますます困難で不確実な課題を探し出さなければなりません。機械には計算があります。理解があります。機械には指示があります。私たちには目的があります。機械には客観性があります。私たちは情熱を持っています。現在、機械が何をできるかについて心配する必要はありません。代わりに、彼らがまだできないことを心配する必要があります。なぜなら、私たちの最も壮大な夢を実現するには、新しいインテリジェントな機械の助けが必要になるからです。もし私たちが失敗したとしても、失敗したとしても、それは私たちのマシンがあまりにも知性が高いからでも、十分に知的でないからでもありません。私たちが失敗した場合、それは自己満足に陥り、野心を制限したためです。私たちの人間性は、ハンマーを振ることやチェスをすることなど、スキルによって定義されるものではありません。人間にしかできないことが 1 つあります。それは夢です。だから大きな夢を見よう。」
https://www.youtube.com/watch?v=NP8xt8o4_5Q&feature=emb_imp_woyt
ですから、大きな夢を見ましょう。