Автори:
(1) Ши-Танг Су, Мічиганський університет, Енн-Арбор ([email protected]);
(2) Віджай Г. Субраманіан, Мічиганський університет, Енн-Арбор та ([email protected]);
(3) Грант Шонебек, Мічиганський університет, Енн-Арбор ([email protected]).
2.1 Модель експериментів з бінарним результатом у двофазних дослідженнях
3 Експерименти з бінарними результатами в двофазних дослідженнях і 3.1 Експерименти з скринінгами
3.2 Припущення та індуковані стратегії
3.3 Обмеження, встановлені експериментами фази II
3.4 Коефіцієнт переконання та оптимальна структура сигналізації
3.5 Порівняння з класичними байєсівськими стратегіями переконання
4.2 Експерименти, визначені та сплановані відправником
4.3 Багатофазова модель і класичне баєсівське переконання та література
Ми розглядаємо проблему байєсівського переконання, коли відправник намагається переконати одержувача виконати певну дію за допомогою послідовності сигналів. Ми моделюємо це, розглядаючи багатофазові випробування з різними експериментами, проведеними на основі результатів попередніх експериментів. На відміну від більшості літератури, ми розглядаємо проблему з обмеженнями на сигнали, накладені на відправника. Цього ми досягаємо, фіксуючи деякі експерименти в екзогенний спосіб; вони називаються визначеними експериментами. Це моделювання допомагає нам зрозуміти реальні ситуації, в яких це відбувається: наприклад, багатофазові випробування ліків, де FDA визначає деякі експерименти, початкове придбання великими фірмами, де потенційний покупець визначає пізню стадію оцінювання, багаторазові співбесіди при прийомі на роботу де кандидати спочатку сигналізують, представляючи свою кваліфікацію, але інші процедури перевірки визначаються інтерв'юером. Недетерміновані експерименти (сигнали) у багатофазному випробуванні повинні бути обрані відправником, щоб найкраще переконати одержувача. З бінарним станом світу ми виводимо оптимальну політику сигналізації в єдиній нетривіальній конфігурації двофазного випробування з експериментами з бінарними результатами. Потім ми узагальнюємо багатофазні випробування з експериментами з бінарними результатами, де визначені експерименти можна розмістити в довільних вузлах дерева випробувань. Тут ми представляємо алгоритм динамічного програмування для отримання оптимальної політики сигналізації, яка використовує структурні ідеї двофазного пробного рішення. Ми також порівнюємо оптимальну структуру політики сигналізації з класичними байєсівськими стратегіями переконання, щоб підкреслити вплив обмежень сигналізації на відправника.
Ключові слова : Інформаційний дизайн · Байєсівське переконання · Сигнальні ігри.
Інформаційний дизайн вивчає, як поінформовані агенти (відправники) переконують необізнаних агентів (одержувачів) вжити певних дій, впливаючи на переконання необізнаних агентів через розкриття інформації в грі. Канонічна модель Камениці-Генцкова [16] — це модель, у якій відправник може прийняти політику розкриття інформації (стратегію сигналізації) до того, як дізнається справжній стан. Як тільки стан реалізовано, відповідний (рандомізований) сигнал надсилається до приймача. Потім одержувач виконує дію, що призводить до виграшу як для відправника, так і для одержувача. Відправникам у проблемах інформаційного дизайну потрібно лише маніпулювати переконаннями одержувачів за допомогою правильно підібраних сигналів. Маніпульовані переконання створять правильні стимули для одержувача спонтанно вжити конкретних дій, які принесуть користь відправнику (в очікуванні). У (класичному) проектуванні механізму, однак, історія інша: розробник не знає про особисту інформацію агентів, і агенти повідомляють свою особисту інформацію розробнику, який потім повинен забезпечити стимули за допомогою (грошових) переказів або інших засобів . Гнучкість, яку забезпечує інформаційний дизайн, який дозволяє відправнику отримати вигоду від розкриття інформації без впровадження механізмів передачі корисності, призвела до більшої застосовності методології: різні моделі та теорії можна знайти в оглядових роботах, таких як [3] і [15].
Наша робота мотивована багатьма проблемами реального світу, де схеми переконання застосовні, але відправник обмежений у виборі сигналів, доступних для розробки інформації. Зокрема, нас цікавлять проблеми, які природно моделюються за допомогою багатофазних випробувань, де проміжні результати визначають подальші експерименти. Крім того, ми наполягаємо на тому, що деякі експерименти проводяться екзогенним способом. Ця функція накладає обмеження на сигнальний простір відправника, і без неї ми мали б класичну байєсівську проблему переконання зі збільшеним сигнальним простором. Наша мета полягає в тому, щоб вивчити вплив таких обмежень на оптимальну сигнальну схему, і, зокрема, порівняти її з оптимальними сигнальними схемами в класичному байєсівському переконанні.
Наступний мотивуючий приклад описує можливий сценарій реального світу.
Приклад 1 (Мотиваційний приклад - Залучення коштів у фірми венчурного капіталу) . Ми розглядаємо сценарій, коли стартап шукає кошти у компанії венчурного капіталу. Процес для цього, як правило, включатиме кілька раундів переговорів і оцінювання: деякі з них будуть демонстрацією основної бізнес-ідеї стартапу, а інші будуть оцінками фірми венчурного капіталу відповідно до власних процедур перевірки. Стартап повинен буде дотримуватися процедур перевірки фірми венчурного капіталу, але обирає демонстрацію свого продукту. Виходячи з цих умов, стартап повинен розробити свої демонстрації, щоб максимізувати свої шанси на отримання фінансування.
У наведеному вище прикладі стартап (відправник) має створити схему розкриття інформації, щоб отримати бажані кошти від фірми венчурного капіталу (одержувача). Тоді процедури скринінгу, встановлені компанією венчурного капіталу, є аналогічними нашим детермінованим експериментам, а демонстрації, проведені стартапом, є розробленими (відправником) експериментами. Наприклад, на малюнку 1 ми представляємо одну вірогідну взаємодію, де компанія-початківець розробляє демонстрації A, B і C (кружки на малюнку), а компанія венчурного капіталу заздалегідь визначила скринінгові перевірки W, X, Y і Z (на малюнку прямокутники). Оскільки ми проілюстрували цей приклад за допомогою збалансованого дерева, якщо у нас є незбалансоване дерево через те, що приймач приймає рішення посередині, ми можемо змінити його на збалансоване дерево, додавши необхідну кількість фіктивних етапів.
Знижена гнучкість відправника щодо її сигнальних стратегій під час деяких заздалегідь визначених експериментів із довільними позиціями та інформативністю відрізняє нашу роботу від зростаючої літератури з динамічного інформаційного дизайну. Наша модель розглядає проблему з такими характеристиками: статичний простір станів, середовище послідовного розкриття інформації та простір сигналізації, обмежений деякими екзогенними обмеженнями, жорсткість яких може залежати від запропонованих схем виділення. Моделі зі статичним простором станів, необмеженим простором сигналу, але різноманітними середовищами послідовного розкриття інформації були вивчені для захоплення особливостей у різних проблемах реального світу: наприклад, із кількома відправниками [12,19], із дорогим зв’язком [14,22]. ], що дозволяє приймати рішення послідовно [10] або з частковим зобов’язанням [1,22]. Моделі з динамічними станами та середовищами послідовного розкриття інформації зазвичай вивчаються під керівництвом поінформованого відправника, який знає динамічні зміни стану(ів); різноманітність робіт у цій категорії стосується виявлення зміни стану [9,11] або ігор маршрутизації [21]. Хоча кілька робіт [7, 13, 18] також розглядають обмежені схеми сигналізації, ці роботи або вважають, що простір сигналу є меншим, ніж простір дії [13, 7], або розглядають середовище сигналізації з шумом [18]. Моделі з екзогенною інформацією [17,5,4] можна розглядати як послідовні проблеми розкриття інформації з екзогенними детермінованими експериментами, розміщеними на визначених фазах. Послідовне розкриття інформації в нашій моделі, яке фактично збільшує сигнальний простір, робить нашу роботу відмінною від вищезазначених. Щоб зберегти фокус статті на послідовних випробуваннях, ми обговорюємо ширшу літературу про обмежені відправники, алгоритмічний дизайн інформації та роботи, пов’язані з дизайном експерименту приймача [1] в нашій онлайн-версії [23].
Відповідно до мотивуючого прикладу, зображеного на малюнку 1, проблема переконання розглядає послідовність експериментів, де експерименти, що знаходяться далі в дереві, залежать від результатів попередніх фаз. Експеримент, який буде проводитися на кожній фазі, визначається екзогенно або вибирається відправником. У грі відправник вибирає сплановані експерименти зі знанням попереднього, детермінованих експериментів і функції корисності одержувача, але до того, як буде усвідомлено стан світу. Після того, як відправник зобов’язується провести експерименти (тобто стратегію сигналізації), усвідомлюється стан світу, і проводиться певна послідовність експериментів на основі реалізації базових випадкових змінних. Потім одержувач виконує дії залежно від усієї послідовності результатів. Передбачається, що попередні, корисні функції відправника та одержувача, визначені експерименти та сплановані експерименти (після їх завершення відправником) є загальновідомими. Ми вивчаємо цю проблему для бінарних станів світу, спочатку для двофазних випробувань бінарних результатів, а потім узагальнених для багатофазних випробувань бінарних результатів. Потім ми узагальнюємо небінарні експерименти (все ще з основним бінарним простором станів). В онлайн-версії [23] ми додаємо ігри з додатковим етапом, де одержувач рухається перед відправником, щоб вирішити деякі або всі визначені експерименти, можливо, з деякими обмеженнями.
Внески : Основні внески цієї роботи:
Наскільки нам відомо, в рамках багатофазної байєсівської системи переконання ми перші досліджували дизайн схем сигналізації відправника з екзогенно визначеними експериментами в довільних положеннях. Наші результати підкреслюють різницю між «екзогенно визначеними експериментами» та «екзогенно наданою інформацією» в динамічному інформаційному дизайні, де перший забезпечує більшу гнучкість і допускає більшу неоднорідність.
Ми явно вирішуємо оптимальну схему сигналізації в двофазних випробуваннях. Крім того, використовуючи структурне розуміння, отримане в результаті двофазних випробувань, ми представляємо алгоритм динамічного програмування для отримання оптимальної сигналізації в загальних багатофазних випробуваннях за допомогою зворотної ітерації.
Ми аналізуємо вплив обмежень на відправника за допомогою детермінованих експериментів, порівнюючи продуктивність із класичним параметром переконання Байєса та використовуючи оптимальні схеми сигналізації класичного переконання Байєса, коли відправник обмежений. У рамках цього ми надаємо достатню умову, коли послідовне випробування еквівалентне класичному байєсівському переконанню з потенційно збільшеним простором сигналу.
Цей документ доступний на arxiv під ліцензією CC 4.0.
[1] Додаткову інформацію дивіться в Розділі 5 у [23].