paint-brush
Paano Naaapektuhan ng Signal Constraints ang Bayesian Persuasion sa Multi-Phase Trials?sa pamamagitan ng@bayesianinference
107 mga pagbabasa

Paano Naaapektuhan ng Signal Constraints ang Bayesian Persuasion sa Multi-Phase Trials?

sa pamamagitan ng Bayesian Inference7m2024/11/10
Read on Terminal Reader

Masyadong mahaba; Upang basahin

Sinusuri ng papel na ito ang Bayesian persuasion sa mga multi-phase na pagsubok, na tumutuon sa mga senaryo kung saan nahaharap ang nagpadala sa mga hadlang sa signal dahil sa mga eksperimento na tinutukoy sa labas. Ito ay nagpapakilala ng isang dynamic na diskarte sa programming upang i-optimize ang mga patakaran sa pagbibigay ng senyas at ihambing ang mga ito sa mga klasikal na diskarte.
featured image - Paano Naaapektuhan ng Signal Constraints ang Bayesian Persuasion sa Multi-Phase Trials?
Bayesian Inference HackerNoon profile picture
0-item

Mga may-akda:

(1) Shih-Tang Su, Unibersidad ng Michigan, Ann Arbor ([email protected]);

(2) Vijay G. Subramanian, Unibersidad ng Michigan, Ann Arbor at ([email protected]);

(3) Grant Schoenebeck, Unibersidad ng Michigan, Ann Arbor ([email protected]).

Talaan ng mga Link

Abstrak at 1. Panimula

2. Pagbubuo ng Suliranin

2.1 Modelo ng Binary-Resulta na mga Eksperimento sa Dalawang-Yung-Phase na Pagsubok

3 Binary-outcome Experiment sa Two-phase Trials at 3.1 Experiment na may screening

3.2 Mga pagpapalagay at sapilitan na mga estratehiya

3.3 Mga hadlang na ibinigay ng mga eksperimento sa phase-II

3.4 Persuasion ratio at ang pinakamainam na istraktura ng pagbibigay ng senyas

3.5 Paghahambing sa mga klasikal na diskarte sa panghihikayat ng Bayesian

4 Binary-outcome Experiment sa Multi-phase trial at 4.1 Modelo ng binary-outcome experiments sa multi-phase trial

4.2 Determinado kumpara sa mga eksperimentong dinisenyo ng nagpadala

4.3 Multi-phase na modelo at klasikal na Bayesian na panghihikayat at Mga Sanggunian


Abstract

Isinasaalang-alang namin ang isang problema sa Bayesian persuasion kung saan sinusubukan ng nagpadala na hikayatin ang receiver na gumawa ng isang partikular na aksyon sa pamamagitan ng pagkakasunod-sunod ng mga signal. Ginawa namin itong modelo sa pamamagitan ng pagsasaalang-alang sa mga multi-phase na pagsubok na may iba't ibang mga eksperimento na isinagawa batay sa mga kinalabasan ng mga naunang eksperimento. Sa kaibahan sa karamihan ng mga literatura, isinasaalang-alang namin ang problema sa mga hadlang sa mga signal na ipinataw sa nagpadala. Nakamit namin ito sa pamamagitan ng pag-aayos ng ilan sa mga eksperimento sa isang exogenous na paraan; ang mga ito ay tinatawag na mga determinadong eksperimento. Ang pagmomodelo na ito ay tumutulong sa amin na maunawaan ang mga totoong sitwasyon kung saan ito nangyayari: hal, multi-phase na mga pagsubok sa gamot kung saan tinutukoy ng FDA ang ilan sa mga eksperimento, panimulang pagkuha ng malalaking kumpanya kung saan tinutukoy ng potensyal na makakuha ng mga late-stage na pagtatasa, multi-round job interview. kung saan ang mga kandidato ay unang sumenyas sa pamamagitan ng paglalahad ng kanilang mga kwalipikasyon ngunit ang iba pang mga pamamaraan ng screening ay tinutukoy ng tagapanayam. Ang mga hindi natukoy na eksperimento (mga signal) sa multi-phase na pagsubok ay pipiliin ng nagpadala upang mahikayat ang tatanggap nang pinakamahusay. Sa isang binary na estado ng mundo, nakukuha namin ang pinakamainam na patakaran sa pagbibigay ng senyas sa nag-iisang di-trivial na configuration ng isang two-phase trial na may binary na mga eksperimento sa kinalabasan. Pagkatapos ay i-generalize namin ang mga multi-phase na pagsubok na may binary-outcome na mga eksperimento kung saan maaaring ilagay ang mga tukoy na eksperimento sa mga arbitrary na node sa trial tree. Dito ay nagpapakita kami ng isang dynamic na algorithm ng programming upang makuha ang pinakamainam na patakaran sa pagbibigay ng senyas na gumagamit ng mga insight sa istruktura ng two-phase trial solution. Inihahambing din namin ang pinakamainam na istraktura ng patakaran sa pagbibigay ng senyas sa mga klasikal na diskarte sa panghihikayat ng Bayesian upang i-highlight ang epekto ng mga hadlang sa pagbibigay ng senyas sa nagpadala.


Mga Keyword : Disenyo ng impormasyon · Bayesian na panghihikayat · Mga larong nagbibigay-senyas.

1 Panimula

Pinag-aaralan ng disenyo ng impormasyon kung paano hinihikayat ng mga may-alam na ahente (mga nagpadala) ang mga hindi alam na ahente (mga tatanggap) na magsagawa ng mga partikular na aksyon sa pamamagitan ng pag-impluwensya sa mga paniniwala ng mga hindi alam na ahente sa pamamagitan ng pagbubunyag ng impormasyon sa isang laro. Ang canonical Kamenica-Gentzkow model [16] ay isa kung saan ang nagpadala ay maaaring mangako sa isang patakaran sa pagsisiwalat ng impormasyon (diskarte sa pagsenyas) bago matutunan ang totoong estado. Kapag ang estado ay natanto, ang isang kaukulang (randomized) na signal ay ipapadala sa receiver. Pagkatapos, ang receiver ay gumawa ng isang aksyon, na nagreresulta sa mga kabayaran para sa parehong nagpadala at ang receiver. Ang mga nagpadala sa mga problema sa disenyo ng impormasyon ay kailangan lamang na manipulahin ang mga paniniwala ng mga tatanggap gamit ang mga tamang piniling signal. Ang mga manipuladong paniniwala ay lilikha ng mga tamang insentibo para sa tatanggap na kusang gumawa ng mga partikular na aksyon na makikinabang sa nagpadala (sa inaasahan). Sa (klasikal) na disenyo ng mekanismo, gayunpaman, iba ang kuwento: hindi alam ng taga-disenyo ang pribadong impormasyon ng mga ahente, at ipinapaalam ng mga ahente ang kanilang pribadong impormasyon sa taga-disenyo, na pagkatapos ay kailangang magbigay ng mga insentibo sa pamamagitan ng (monetary) na paglipat o iba pang paraan . Ang kakayahang umangkop na ibinibigay ng disenyo ng impormasyon na nagpapahintulot sa nagpadala na makinabang mula sa pagsisiwalat ng impormasyon nang hindi nagpapatupad ng mga mekanismo ng paglilipat ng utility ay humantong sa higit na kakayahang magamit ng pamamaraan: ang iba't ibang mga modelo at teorya ay matatagpuan sa mga papeles ng survey tulad ng [3] at [15].


Ang aming trabaho ay udyok ng maraming problema sa totoong mundo kung saan naaangkop ang mga iskema ng panghihikayat, ngunit ang nagpadala ay napipilitan sa pagpili ng mga signal na magagamit para sa disenyo ng impormasyon. Sa partikular, interesado kami sa mga problema na natural na namodelo sa pamamagitan ng mga multi-phase na pagsubok kung saan tinutukoy ng mga pansamantalang resulta ang mga kasunod na eksperimento. Dagdag pa, iginigiit namin na ang ilan sa mga eksperimento ay ibinigay sa isang exogenous na paraan. Ang feature na ito ay nagpapataw ng mga paghihigpit sa signaling space ng nagpadala, at kung wala ito, magkakaroon tayo ng klasikal na problema sa Bayesian persuasion na may pinalaki na espasyo ng signal. Ang aming layunin ay pag-aralan ang epekto ng naturang mga hadlang sa pinakamainam na scheme ng pagbibigay ng senyas, at sa partikular, upang ihambing ito sa pinakamainam na mga scheme ng pagbibigay ng senyas sa klasikal na Bayesian na panghihikayat.


Ang sumusunod na nakakaganyak na halimbawa ay naglalarawan ng isang posibleng real-world na senaryo.


Halimbawa 1 (Pagganyak na halimbawa - Pagkuha ng mga pondo mula sa isang venture capital firm) . Isinasaalang-alang namin ang isang senaryo kung saan ang isang start-up ay naghahanap ng mga pondo mula sa isang venture capital firm. Ang proseso para dito ay karaniwang magsasangkot ng maraming round ng negosasyon at pagsusuri: ang ilan sa mga ito ay mga demonstrasyon ng pangunahing ideya sa negosyo ng start-up, at ang iba ay mga pagtatasa ng venture capital firm na sumusunod sa sarili nilang mga pamamaraan sa screening. Kailangang sundin ng start-up ang mga pamamaraan ng screening ng venture capital firm ngunit pinipili ang mga demonstrasyon ng produkto nito. Batay sa mga itinatakdang ito, kailangang idisenyo ng start-up ang mga demonstrasyon nito para mapakinabangan ang pagkakataon nitong mapondohan.


Fig. 1. Halimbawa ng proseso ng negosasyon – isang startup kumpara sa isang venture capital firm.


Sa halimbawa sa itaas, ang start-up (nagpadala) ay kailangang bumuo ng scheme ng pagsisiwalat ng impormasyon upang makuha ang ninanais na pondo mula sa venture capital firm (receiver). Pagkatapos, ang mga pamamaraan ng screening na itinakda ng venture capital firm ay kahalintulad sa aming mga natukoy na eksperimento, at ang mga demonstrasyon na isinagawa ng start-up ay ang (nagpadala) na dinisenyong mga eksperimento. Halimbawa, sa Figure 1 ay nagpapakita kami ng isang posibleng pakikipag-ugnayan kung saan ang panimulang kumpanya ay nagdidisenyo ng mga demonstrasyon A, B, at C (mga bilog sa figure) at ang venture capital firm ay may paunang natukoy na mga pagsusuri sa screening W, X, Y, at Z (mga parihaba sa figure). Bagama't inilarawan natin ang halimbawang ito sa pamamagitan ng isang balanseng puno, kung mayroon tayong hindi balanseng puno dahil sa pagpapasya ng receiver sa gitna, maaari natin itong baguhin sa isang balanseng puno sa pamamagitan ng pagdaragdag ng kinakailangang bilang ng mga dummy na yugto.


Ang pinababang flexibility ng nagpadala sa kanyang mga diskarte sa pagbibigay ng senyas sa ilalim ng ilang paunang natukoy na mga eksperimento na may mga arbitrary na posisyon at pagiging informative ay nagpapaiba sa aming trabaho mula sa lumalaking literatura sa dynamic na disenyo ng impormasyon. Isinasaalang-alang ng aming modelo ang isang problema sa mga sumusunod na tampok: isang static na puwang ng estado, isang sequential na kapaligiran sa pagsisiwalat ng impormasyon, at isang puwang sa pagbibigay ng senyas na pinaghihigpitan ng ilang exogenous na mga hadlang na ang kalupitan ay maaaring depende sa mga iminungkahing singling scheme. Ang mga modelong may static na state space, isang hindi pinaghihigpitang espasyo ng signal ngunit ang iba't ibang sequential information disclosure environment ay pinag-aralan upang makuha ang mga feature sa iba't ibang real-world na problema: hal, na may maraming nagpadala [12,19], na may magastos na komunikasyon [14,22]. ], na nagpapahintulot para sa sunud-sunod na paggawa ng desisyon [10], o may bahagyang pangako [1,22]. Ang mga modelong may mga dynamic na estado at sequential information disclosure environment ay karaniwang pinag-aaralan sa ilalim ng isang matalinong nagpadala na may kaalaman sa dynamic na pagbabago ng (mga) estado; ang iba't ibang mga gawa sa kategoryang ito ay nasa pagtukoy ng pagbabago ng estado [9,11] o mga laro sa pagruruta [21]. Bagama't ang ilang mga gawa [7,13,18] ay isinasaalang-alang din ang mga napiling scheme ng pagbibigay ng senyas, ang mga gawang ito ay maaaring isaalang-alang ang espasyo ng signal na mas maliit kaysa sa espasyo ng pagkilos [13,7] o isaalang-alang ang isang maingay na kapaligiran sa pagbibigay ng senyas [18]. Ang mga modelong may exogenous na impormasyon [17,5,4], ay maaaring tingnan bilang mga problema sa pagbubunyag ng mga sunud-sunod na impormasyon sa mga exogenous na tinutukoy na mga eksperimento na inilagay sa mga tukoy na yugto. Ang sunud-sunod na pagsisiwalat ng impormasyon sa aming modelo, na talagang nagpapalaki sa espasyo ng signal, ay nagpapaiba sa aming trabaho sa mga gawa sa itaas. Upang mapanatili ang pokus ng papel sa mga sunud-sunod na pagsubok, tinatalakay namin ang mas malawak na literatura sa mga napipigilan na nagpadala, disenyo ng algorithmic na impormasyon, at mga gawaing nauugnay sa disenyo ng eksperimento ng tagatanggap[1] sa aming online na bersyon [23].


Ayon sa nakakaganyak na halimbawa na inilalarawan sa Figure 1, ang problema sa panghihikayat ay isinasaalang-alang ang isang pagkakasunud-sunod ng mga eksperimento kung saan ang mga eksperimento sa kahabaan ng puno ay nakasalalay sa mga kinalabasan ng mga nakaraang yugto. Ang eksperimento na isasagawa sa bawat yugto ay exogenously tinutukoy o pinili ng nagpadala. Sa laro, pinipili ng nagpadala ang mga idinisenyong eksperimento na may kaalaman sa nauna, natukoy na mga eksperimento, at utility function ng receiver, ngunit bago maisakatuparan ang estado ng mundo. Pagkatapos gumawa ang nagpadala sa mga eksperimento (ibig sabihin, ang diskarte sa pagbibigay ng senyas), ang estado ng mundo ay maisasakatuparan, at ang isang partikular na pagkakasunud-sunod ng mga eksperimento ay isinasagawa batay sa pagsasakatuparan ng mga pinagbabatayan na random na mga variable. Ang receiver ay nagsasagawa ng isang aksyon depende sa buong pagkakasunud-sunod ng mga kinalabasan. Ang nauna, ang mga function ng tagapadala at tagatanggap, ang natukoy na mga eksperimento, at ang mga idinisenyong eksperimento (pagkatapos na tapusin ng nagpadala ang mga ito) ay ipinapalagay na karaniwang kaalaman. Pinag-aaralan namin ang problemang ito para sa binary states ng mundo, una para sa two-phase binary-outcome na mga pagsubok, at pagkatapos ay i-generalize sa multiphase na binary-outcome na mga pagsubok. Pagkatapos ay nagsa-generalize kami sa mga hindi binary na eksperimento (may pinagbabatayan pa rin na binary state space). Sa online na bersyon [23] nagdaragdag kami ng mga laro na may karagdagang yugto kung saan ang receiver ay gumagalaw bago ang nagpadala upang magpasya ng ilan o lahat ng mga tukoy na eksperimento, marahil ay may ilang mga hadlang.


Mga Kontribusyon : Ang mga pangunahing kontribusyon ng gawaing ito ay:


  1. Sa abot ng aming kaalaman, sa loob ng multi-phase na Bayesian persuasion framework, kami ang unang nag-aaral ng disenyo ng mga scheme ng pagbibigay ng senyas ng nagpadala na may mga eksperimentong exogeneously tinutukoy sa mga arbitrary na posisyon. Itinatampok ng aming mga resulta ang pagkakaiba sa pagitan ng "mga exogenously natukoy na mga eksperimento" at "exogenously given information" sa dynamic na disenyo ng impormasyon, kung saan ang una ay nagbibigay ng higit na flexibility at nagbibigay-daan para sa higit pang heterogeneity.


  2. Tahasang nilulutas namin ang pinakamainam na scheme ng pagbibigay ng senyas sa dalawang yugto ng mga pagsubok. Bukod dito, gamit ang mga istrukturang insight na nakuha mula sa mga two-phase na pagsubok, nagpapakita kami ng isang dynamic na programming algorithm upang makuha ang pinakamainam na pagbibigay ng senyas sa mga pangkalahatang multi-phase na pagsubok sa pamamagitan ng pabalik na pag-ulit.


  3. Sinusuri namin ang epekto ng mga hadlang sa nagpadala sa pamamagitan ng natukoy na mga eksperimento sa pamamagitan ng paghahambing ng pagganap sa klasikal na setting ng Bayesian persuasion at kapag gumagamit ng klasikal na Bayesian persuasion na pinakamainam na mga scheme ng pagbibigay ng senyas kapag ang nagpadala ay napipilitan. Bilang bahagi nito, nagbibigay kami ng sapat na kundisyon para sa kapag ang isang sunud-sunod na pagsubok ay katumbas ng klasikal na Bayesian na panghihikayat na may potensyal na pinalaki na espasyo ng signal.


Ang papel na ito ay makukuha sa arxiv sa ilalim ng CC 4.0 na lisensya.


[1] Tingnan ang Seksyon 5 sa [23] para sa mga detalye.