著者:
(1)Shih-Tang Su、ミシガン大学アナーバー校([email protected])
(2)Vijay G. Subramanian、ミシガン大学アナーバー校([email protected])
(3)グラント・シェーネベック、ミシガン大学アナーバー校([email protected])。
3 二段階試験における二値結果実験と3.1 スクリーニングを伴う実験
4 多段階試験におけるバイナリ結果実験と4.1 多段階試験におけるバイナリ結果実験のモデル
我々は、送信者が一連のシグナルを介して受信者に特定の行動を取るよう説得しようとするベイズ説得問題を検討する。我々は、以前の実験の結果に基づいて実施される異なる実験による多段階試験を検討することによってこれをモデル化する。ほとんどの文献とは対照的に、我々は送信者に課せられたシグナルに対する制約を伴う問題を検討する。これは、いくつかの実験を外生的に固定することによって達成される。これらは決定された実験と呼ばれる。このモデリングは、これが発生する実際の状況を理解するのに役立つ。例えば、FDA がいくつかの実験を決定する多段階の薬物試験、潜在的な買収者が後期段階の評価を決定する大企業による新興企業の買収、候補者が最初に資格を提示することによってシグナルを送るが、残りのスクリーニング手順は面接官によって決定される複数ラウンドの就職面接などである。多段階試験における決定されていない実験 (シグナル) は、受信者を最も説得するために送信者が選択する。バイナリの世界の状態を使用して、バイナリ結果の実験を伴う 2 段階のトライアルの唯一の非自明な構成で最適なシグナリング ポリシーを導出します。次に、決定された実験をトライアル ツリーの任意のノードに配置できるバイナリ結果の実験を伴う多段階のトライアルに一般化します。ここでは、2 段階のトライアル ソリューションの構造的洞察を使用して最適なシグナリング ポリシーを導出する動的プログラミング アルゴリズムを紹介します。また、最適なシグナリング ポリシー構造を従来のベイジアン説得戦略と比較し、シグナリング制約が送信者に与える影響を強調します。
キーワード: 情報デザイン、ベイズ説得、シグナリングゲーム。
情報デザインは、ゲームにおいて情報開示を通じて情報提供者(送信者)が情報提供者でないエージェント(受信者)の信念に影響を与え、特定の行動を取るよう説得する方法を研究する。標準的なカメニカ・ゲンツコウモデル [16] は、送信者が真の状態を知る前に情報開示ポリシー(シグナリング戦略)にコミットできるモデルである。状態が実現されると、対応する(ランダム化された)シグナルが受信者に送信される。次に、受信者がアクションを取ると、送信者と受信者の両方に利益がもたらされる。情報デザインの問題における送信者は、適切に選択されたシグナルで受信者の信念を操作するだけでよい。操作された信念は、受信者が自発的に送信者に利益をもたらす特定の行動を取るための適切なインセンティブを生み出す(期待において)。しかし、(古典的な)メカニズム設計では話は別です。設計者はエージェントの個人情報を知らず、エージェントは自分の個人情報を設計者に伝え、設計者は(金銭的な)移転やその他の手段でインセンティブを提供する必要があります。情報設計によって得られる柔軟性により、送信者は効用移転メカニズムを実装することなく情報開示から利益を得ることができます。この方法論の適用範囲は広がり、さまざまなモデルや理論が [3] や [15] などの調査論文に示されています。
私たちの研究は、説得スキームを適用できるが、送信者は情報設計に使用できるシグナルの選択に制約があるという現実世界の多くの問題に動機付けられています。具体的には、中間結果によって後続の実験が決定される多段階試験によって自然にモデル化される問題に関心があります。さらに、一部の実験は外生的に行われることを主張します。この機能は送信者のシグナリング空間に制限を課し、これがなければ、拡大されたシグナル空間を持つ古典的なベイズ説得問題になります。私たちの目標は、このような制約が最適なシグナリングスキームに与える影響を研究し、特に、古典的なベイズ説得における最適なシグナリングスキームと比較することです。
次の例は、現実世界で起こり得るシナリオを説明しています。
例 1 (動機付けの例 - ベンチャー キャピタル会社からの資金獲得) 。新興企業がベンチャー キャピタル会社から資金を獲得しようとしているシナリオを考えてみましょう。このプロセスには通常、複数回の交渉と評価が含まれます。これらの一部は新興企業の中核となるビジネス アイデアのデモンストレーションであり、その他はベンチャー キャピタル会社が独自の審査手順に従って行う評価です。新興企業はベンチャー キャピタル会社の審査手順に従う必要がありますが、製品のデモンストレーションは自分で選択します。これらの規定に基づいて、新興企業はデモンストレーションを設計し、資金調達の可能性を最大化する必要があります。
上記の例では、スタートアップ企業 (送信者) は、ベンチャーキャピタル企業 (受信者) から必要な資金を得るために情報開示スキームを作成する必要があります。ベンチャーキャピタル企業によって設定されたスクリーニング手順は、決定された実験に類似しており、スタートアップ企業によって実行されるデモンストレーションは (送信者) が設計した実験です。たとえば、図 1 では、スタートアップ企業がデモンストレーション A、B、C (図の円) を設計し、ベンチャーキャピタル企業が事前に決定したスクリーニング検査 W、X、Y、Z (図の四角形) を持っているという、考えられる 1 つのインタラクションを示しています。この例はバランスの取れたツリーで示しましたが、受信者が途中で決定したためにバランスの取れていないツリーがある場合は、必要な数のダミーステージを追加することでバランスの取れたツリーに変更できます。
送信者の任意の位置と情報量を伴ういくつかの事前に決定された実験の下でのシグナリング戦略の柔軟性の低下は、動的情報設計に関する増加している文献と私たちの研究を区別するものである。私たちのモデルは、静的な状態空間、順次的な情報開示環境、および提案された単一化スキームに依存する可能性のあるいくつかの外生的制約によって制限されたシグナリング空間という特徴を持つ問題を検討する。静的な状態空間、制限のない信号空間だがさまざまな順次的な情報開示環境を持つモデルが、さまざまな現実の問題の特徴を捉えるために研究されてきた。たとえば、複数の送信者 [12,19]、コストのかかる通信 [14,22]、順次的な意思決定を可能にする [10]、または部分的なコミットメント [1,22] を持つモデルなどである。動的状態と順次的な情報開示環境を持つモデルは通常、動的に変化する状態についての知識を持つ情報を持つ送信者の下で研究され、このカテゴリには状態変化検出 [9,11] やルーティングゲーム [21] のさまざまな研究がある。いくつかの研究 [7,13,18] も制約付きシグナリング方式を検討しているが、これらの研究では、信号空間がアクション空間よりも小さいと見なしているか [13,7]、ノイズの多いシグナリング環境を検討しているかのいずれかである [18]。外生情報を含むモデル [17,5,4] は、外生的に決定された実験が決定されたフェーズに配置された順次情報開示問題として考えることができる。私たちのモデルの順次情報開示は、実際に信号空間を拡大するため、上記の研究とは異なる。本論文の焦点を順次試行に保つため、オンライン版 [23] では、制約付き送信者、アルゴリズム情報設計、受信者の実験設計に関連する研究 [1] に関するより広範な文献について議論する。
図 1 に示されている動機付けの例によると、説得問題では、ツリーのさらに先の実験が前のフェーズの結果に依存する一連の実験が検討されます。各フェーズで実行される実験は、外生的に決定されるか、送信者によって選択されます。ゲームでは、送信者は、事前条件、決定された実験、受信者の効用関数に関する知識を持ち、世界の状態が実現される前に、設計された実験を選択します。送信者が実験 (つまり、シグナリング戦略) にコミットすると、世界の状態が実現され、基礎となるランダム変数の実現に基づいて特定の一連の実験が実行されます。次に、受信者は結果のシーケンス全体に応じてアクションを実行します。事前条件、送信者と受信者の効用関数、決定された実験、および設計された実験 (送信者がそれらを確定した後) は、共通の知識であると想定されます。私たちはこの問題を世界のバイナリ状態について研究し、まず2段階のバイナリ結果試行について研究し、次に多段階のバイナリ結果試行に一般化しました。次に、非バイナリ実験(依然として基礎となるバイナリ状態空間を使用)に一般化しました。オンラインバージョン[23]では、受信者が送信者より先に動いて、決定された実験の一部またはすべてを決定する追加ステージを備えたゲームを追加しました。これには、おそらくいくつかの制約があります。
貢献: この研究の主な貢献は次のとおりです。
私たちの知る限り、多段階ベイズ説得フレームワーク内で、任意の位置で外生的に決定された実験を伴う送信者のシグナリングスキームの設計を研究したのは私たちが初めてです。私たちの結果は、動的情報設計における「外生的に決定された実験」と「外生的に与えられた情報」の違いを強調しており、前者はより大きな柔軟性を提供し、より多くの異質性を可能にします。
我々は、2 段階の試行における最適なシグナリング方式を明示的に解きます。さらに、2 段階の試行から得られた構造的洞察を使用して、後方反復により一般的な多段階の試行における最適なシグナリングを導出する動的プログラミング アルゴリズムを提示します。
我々は、送信者が制約されているときに古典的なベイズ説得設定とパフォーマンスを比較し、古典的なベイズ説得最適シグナリングスキームを使用した場合のパフォーマンスを比較することにより、決定された実験を通じて送信者に対する制約の影響を分析します。この一環として、潜在的に拡大された信号空間を持つ古典的なベイズ説得と連続試行が同等である場合の十分な条件を提供します。
この論文はCC 4.0ライセンスの下でarxivで公開されています。
[1] 詳細は[23]の第5節を参照。