paint-brush
Ako obmedzenia signálu ovplyvňujú Bayesovské presviedčanie vo viacfázových skúškach?podľa@bayesianinference
107 čítania

Ako obmedzenia signálu ovplyvňujú Bayesovské presviedčanie vo viacfázových skúškach?

podľa Bayesian Inference7m2024/11/10
Read on Terminal Reader

Príliš dlho; Čítať

Tento článok skúma Bayesovské presviedčanie vo viacfázových pokusoch so zameraním na scenáre, v ktorých odosielateľ čelí obmedzeniam signálu v dôsledku externe určených experimentov. Zavádza dynamický programovací prístup na optimalizáciu signalizačných politík a porovnáva ich s klasickými stratégiami.
featured image - Ako obmedzenia signálu ovplyvňujú Bayesovské presviedčanie vo viacfázových skúškach?
Bayesian Inference HackerNoon profile picture
0-item

Autori:

(1) Shih-Tang Su, University of Michigan, Ann Arbor ([email protected]);

(2) Vijay G. Subramanian, University of Michigan, Ann Arbor a ([email protected]);

(3) Grant Schoenebeck, University of Michigan, Ann Arbor ([email protected]).

Tabuľka odkazov

Abstrakt a 1. Úvod

2. Formulácia problému

2.1 Model experimentov s binárnym výsledkom v dvojfázových pokusoch

3 experimenty s binárnym výsledkom v dvojfázových skúškach a 3.1 experimenty so skríningom

3.2 Predpoklady a vyvolané stratégie

3.3 Obmedzenia dané experimentmi fázy II

3.4 Pomer presviedčania a optimálna štruktúra signalizácie

3.5 Porovnanie s klasickými bayesovskými stratégiami presviedčania

4 Experimenty s binárnym výsledkom vo viacfázových pokusoch a 4.1 Model experimentov s binárnym výsledkom vo viacfázových pokusoch

4.2 Určené verzus experimenty navrhnuté odosielateľom

4.3 Viacfázový model a klasické bayesovské presviedčanie a odkazy


Abstraktné

Uvažujeme o bayesovskom presviedčacom probléme, keď sa odosielateľ pokúša presvedčiť príjemcu, aby vykonal konkrétnu akciu prostredníctvom sledu signálov. Toto modelujeme zvážením viacfázových skúšok s rôznymi experimentmi vykonanými na základe výsledkov predchádzajúcich experimentov. Na rozdiel od väčšiny literatúry uvažujeme o probléme s obmedzeniami signálov kladenými na odosielateľa. To dosiahneme fixovaním niektorých experimentov exogénnym spôsobom; tieto sa nazývajú určené experimenty. Toto modelovanie nám pomáha porozumieť situáciám v reálnom svete, kde k tomu dochádza: napr. viacfázové štúdie liekov, kde FDA určuje niektoré z experimentov, začínajúce akvizície veľkými firmami, kde potenciálny nadobúdateľ určuje hodnotenia v neskoršom štádiu, viackolové pracovné pohovory kde kandidáti najprv signalizujú predložením svojej kvalifikácie, ale ostatné postupy preverovania určuje osoba, ktorá vedie pohovor. Neurčené experimenty (signály) vo viacfázovom teste si vyberie odosielateľ, aby čo najlepšie presvedčil prijímača. S binárnym stavom sveta odvodzujeme optimálnu signalizačnú politiku v jedinej netriviálnej konfigurácii dvojfázového pokusu s experimentmi s binárnymi výsledkami. Potom zovšeobecníme na viacfázové pokusy s experimentmi s binárnym výsledkom, kde určené experimenty možno umiestniť na ľubovoľné uzly v skúšobnom strome. Tu uvádzame dynamický programovací algoritmus na odvodenie optimálnej signalizačnej politiky, ktorá využíva štrukturálne poznatky dvojfázového skúšobného riešenia. Porovnávame tiež optimálnu štruktúru signalizačnej politiky s klasickými bayesovskými stratégiami presviedčania, aby sme zdôraznili vplyv signalizačných obmedzení na odosielateľa.


Kľúčové slová : Informačný dizajn · Bayesovské presviedčanie · Signalizačné hry.

1 Úvod

Informačný dizajn študuje, ako informovaní agenti (odosielatelia) presviedčajú neinformovaných agentov (príjemcov), aby podnikli konkrétne kroky ovplyvňovaním presvedčenia neinformovaných agentov prostredníctvom zverejnenia informácií v hre. Kanonický model Kamenica-Gentzkow [16] je model, v ktorom sa odosielateľ môže zaviazať k politike zverejňovania informácií (signalizačnej stratégii) predtým, ako sa dozvie o skutočnom stave. Po realizácii stavu sa do prijímača odošle zodpovedajúci (náhodný) signál. Potom prijímateľ vykoná akciu, ktorá má za následok odmenu pre odosielateľa aj príjemcu. Odosielatelia v problémoch s dizajnom informácií potrebujú iba manipulovať s presvedčeniami príjemcov pomocou správne zvolených signálov. Zmanipulované presvedčenia vytvoria správne stimuly pre príjemcu, aby spontánne podnikol konkrétne kroky, ktoré sú prospešné pre odosielateľa (v očakávaní). V (klasickom) dizajne mechanizmu je však príbeh iný: dizajnér si nie je vedomý súkromných informácií agentov a agenti oznámia svoje súkromné informácie dizajnérovi, ktorý potom musí poskytnúť stimuly prostredníctvom (peňažných) prevodov alebo iných prostriedkov. . Flexibilita poskytovaná informačným dizajnom, ktorý umožňuje odosielateľovi profitovať zo zverejnenia informácií bez implementácie mechanizmov prenosu užitočnosti, viedla k väčšej použiteľnosti metodológie: rôzne modely a teórie možno nájsť v prieskumných prácach ako [3] a [15].


Naša práca je motivovaná mnohými problémami reálneho sveta, kde sú použiteľné schémy presviedčania, ale odosielateľ je obmedzený vo výbere signálov dostupných pre návrh informácií. Konkrétne nás zaujímajú problémy, ktoré sú prirodzene modelované prostredníctvom viacfázových skúšok, kde predbežné výsledky určujú následné experimenty. Ďalej trváme na tom, že niektoré experimenty sú uvedené exogénnym spôsobom. Táto funkcia ukladá obmedzenia na signálny priestor odosielateľa a bez nej by sme mali klasický bayesovský problém s presviedčaním so zväčšeným priestorom signálu. Naším cieľom je študovať vplyv takýchto obmedzení na optimálnu signalizačnú schému a najmä porovnať ju s optimálnymi signalizačnými schémami v klasickom bayesovskom presviedčaní.


Nasledujúci motivujúci príklad popisuje možný scenár v reálnom svete.


Príklad 1 (Motivačný príklad – Získanie prostriedkov od firmy rizikového kapitálu) . Uvažujeme o scenári, keď začínajúci podnik hľadá prostriedky od firmy rizikového kapitálu. Tento proces bude zvyčajne zahŕňať viacero kôl rokovaní a hodnotenia: niektoré z nich budú demonštráciou hlavnej podnikateľskej myšlienky startupu a ostatné budú hodnoteniami zo strany spoločnosti rizikového kapitálu na základe vlastných skríningových postupov. Začínajúci podnik bude musieť dodržiavať postupy preverovania spoločnosti rizikového kapitálu, ale vyberá si ukážky svojich produktov. Na základe týchto ustanovení musí start-up navrhnúť svoje demonštrácie, aby maximalizoval svoje šance na získanie financovania.


Obr. 1. Príklad vyjednávacieho procesu – startup vs. firma rizikového kapitálu.


Vo vyššie uvedenom príklade musí start-up (odosielateľ) vytvoriť schému zverejňovania informácií, aby získal požadované prostriedky od firmy rizikového kapitálu (príjemcu). Potom sú skríningové postupy stanovené firmou rizikového kapitálu analogické s našimi určenými experimentmi a demonštrácie, ktoré vykonáva start-up, sú experimenty navrhnuté (odosielateľom). Napríklad na obrázku 1 predstavujeme jednu prijateľnú interakciu, kde začínajúca spoločnosť navrhuje demonštrácie A, B a C (kruhy na obrázku) a spoločnosť rizikového kapitálu má vopred určené skríningové vyšetrenia W, X, Y a Z. (obdĺžniky na obrázku). Zatiaľ čo sme tento príklad ilustrovali pomocou vyváženého stromu, ak máme nevyvážený strom vďaka tomu, že prijímač rozhoduje v strede, môžeme ho upraviť na vyvážený strom pridaním požadovaného počtu figurín štádií.


Znížená flexibilita odosielateľa pri jej signalizačných stratégiách v rámci niektorých vopred určených experimentov s ľubovoľnými polohami a informatívnosťou odlišuje našu prácu od rastúcej literatúry o dynamickom informačnom dizajne. Náš model zvažuje problém s nasledujúcimi vlastnosťami: statický stavový priestor, prostredie sekvenčného zverejňovania informácií a signalizačný priestor obmedzený niektorými exogénnymi obmedzeniami, ktorých tvrdosť môže závisieť od navrhovaných schém singlu. Boli študované modely so statickým stavovým priestorom, neobmedzeným priestorom signálov, ale rôznymi prostrediami postupného zverejňovania informácií, aby sa zachytili funkcie v rôznych problémoch reálneho sveta: napr. s viacerými odosielateľmi [12,19], s nákladnou komunikáciou [14,22 ], čo umožňuje postupné rozhodovanie [10] alebo s čiastočným záväzkom [1,22]. Modely s dynamickými stavmi a prostrediami postupného zverejňovania informácií sa zvyčajne študujú pod informovaným odosielateľom so znalosťou dynamicky sa meniacich stavov; rôzne práce v tejto kategórii spočívajú v detekcii zmeny stavu [9,11] alebo smerovacích hrách [21]. Aj keď viaceré práce [7,13,18] zvažujú aj obmedzené signalizačné schémy, tieto práce buď považujú priestor signálu za menší ako akčný priestor [13,7], alebo uvažujú o hlučnom signalizačnom prostredí [18]. Modely s exogénnymi informáciami [17,5,4] možno považovať za sekvenčné problémy s odhalením informácií s exogénnymi určenými experimentmi umiestnenými v určených fázach. Postupné zverejňovanie informácií v našom modeli, ktoré v skutočnosti zväčšuje priestor signálu, robí našu prácu odlišnou od vyššie uvedených prác. Aby sme zachovali zameranie článku na sekvenčné pokusy, diskutujeme o širšej literatúre o obmedzených odosielateľoch, návrhu algoritmických informácií a prácach súvisiacich s návrhom experimentu prijímača[1] v našej online verzii [23].


Podľa motivujúceho príkladu znázorneného na obrázku 1, problém presviedčania zohľadňuje postupnosť experimentov, kde experimenty ďalej v strome závisia od výsledkov predchádzajúcich fáz. Experiment, ktorý sa má spustiť v každej fáze, je buď exogénne určený alebo vybraný odosielateľom. Odosielateľ si v hre vyberá navrhnuté experimenty so znalosťou predchádzajúceho, určených experimentov a úžitkovej funkcie príjemcu, ale ešte pred realizáciou stavu sveta. Potom, čo sa odosielateľ zaviaže k experimentom (tj signalizačnej stratégii), je realizovaný stav sveta a je vykonaná špecifická sekvencia experimentov na základe realizácie základných náhodných premenných. Príjemca potom vykoná akciu v závislosti od celej postupnosti výsledkov. Predpokladá sa, že predchádzajúce, úžitkové funkcie odosielateľa a prijímača, určené experimenty a navrhnuté experimenty (po ich dokončení odosielateľom) sú všeobecne známe. Študujeme tento problém pre binárne stavy sveta, najprv pre dvojfázové pokusy s binárnym výsledkom a potom zovšeobecníme na viacfázové pokusy s binárnym výsledkom. Potom zovšeobecníme na nebinárne experimenty (stále so základným binárnym stavovým priestorom). V online verzii [23] pridávame hry s dodatočnou fázou, kde sa príjemca pohybuje pred odosielateľom, aby rozhodol o niektorých alebo všetkých určených experimentoch, možno s určitými obmedzeniami.


Príspevky : Hlavnými príspevkami tejto práce sú:


  1. Podľa našich najlepších vedomostí sme v rámci viacfázového bayesovského presvedčovacieho rámca prví, ktorí študovali návrh signálnych schém odosielateľa s exogénne určenými experimentmi v ľubovoľných pozíciách. Naše výsledky zdôrazňujú rozdiel medzi „exogénne určenými experimentmi“ a „exogénne danými informáciami“ v dynamickom informačnom dizajne, kde prvé poskytujú väčšiu flexibilitu a umožňujú väčšiu heterogenitu.


  2. Optimálnu signalizačnú schému riešime explicitne v dvojfázových pokusoch. Okrem toho pomocou štrukturálnych poznatkov získaných z dvojfázových skúšok predstavujeme dynamický programovací algoritmus na odvodenie optimálnej signalizácie vo všeobecných viacfázových skúškach spätnou iteráciou.


  3. Vplyv obmedzení na odosielateľa analyzujeme prostredníctvom určených experimentov porovnaním výkonu s klasickým nastavením bayesovského presviedčania a pri použití klasických bayesovských optimálnych signalizačných schém, keď je odosielateľ obmedzený. V rámci toho poskytujeme dostatočnú podmienku, kedy je sekvenčný pokus ekvivalentný klasickému bayesovskému presviedčaniu s potenciálne zväčšeným priestorom signálu.


Tento dokument je dostupný na arxiv pod licenciou CC 4.0.


[1] Podrobnosti nájdete v časti 5 v [23].