paint-brush
Hur påverkar signalbegränsningar Bayesian Persuasion i flerfasförsök?förbi@bayesianinference
107 avläsningar

Hur påverkar signalbegränsningar Bayesian Persuasion i flerfasförsök?

förbi Bayesian Inference7m2024/11/10
Read on Terminal Reader

För länge; Att läsa

Denna artikel undersöker Bayesiansk övertalning i flerfasförsök, med fokus på scenarier där avsändaren möter signalbegränsningar på grund av externt bestämda experiment. Den introducerar ett dynamiskt programmeringssätt för att optimera signaleringspolicyer och kontrasterar dessa med klassiska strategier.
featured image - Hur påverkar signalbegränsningar Bayesian Persuasion i flerfasförsök?
Bayesian Inference HackerNoon profile picture
0-item

Författare:

(1) Shih-Tang Su, University of Michigan, Ann Arbor ([email protected]);

(2) Vijay G. Subramanian, University of Michigan, Ann Arbor och ([email protected]);

(3) Grant Schoenebeck, University of Michigan, Ann Arbor ([email protected]).

Tabell över länkar

Abstrakt och 1. Introduktion

2. Problemformulering

2.1 Modell av binära resultatexperiment i tvåfasförsök

3 experiment med binärt resultat i tvåfasförsök och 3.1 experiment med screeningar

3.2 Antaganden och inducerade strategier

3.3 Restriktioner givna av fas II-experiment

3.4 Övertalningsförhållande och optimal signaleringsstruktur

3.5 Jämförelse med klassiska Bayesianska övertalningsstrategier

4 binära utfallsexperiment i flerfasförsök och 4.1 Modell av binära utfallsexperiment i flerfasförsök

4.2 Bestämda kontra avsändardesignade experiment

4.3 Flerfasmodell och klassisk Bayesiansk övertygelse och referenser


Abstrakt

Vi betraktar ett Bayesianskt övertalningsproblem där avsändaren försöker övertala mottagaren att vidta en viss åtgärd via en sekvens av signaler. Detta modellerar vi genom att överväga flerfasförsök med olika experiment som utförts baserat på resultaten av tidigare experiment. I motsats till det mesta av litteraturen överväger vi problemet med begränsningar av signaler som åläggs avsändaren. Detta uppnår vi genom att fixa några av experimenten på ett exogent sätt; dessa kallas bestämda experiment. Denna modellering hjälper oss att förstå verkliga situationer där detta inträffar: t.ex. läkemedelsprövningar i flera faser där FDA bestämmer några av experimenten, uppstartsförvärv av stora företag där den potentiella förvärvaren avgör bedömningar i sena skeden, jobbintervjuer i flera omgångar där kandidaterna signalerar initialt genom att presentera sina kvalifikationer men resten av screeningprocedurerna bestäms av intervjuaren. De obestämda experimenten (signalerna) i flerfasförsöket ska väljas av avsändaren för att övertyga mottagaren bäst. Med ett binärt tillstånd i världen härleder vi den optimala signaleringspolicyn i den enda icke-triviala konfigurationen av ett tvåfasförsök med binära resultatexperiment. Vi generaliserar sedan till flerfasförsök med binära utfallsexperiment där de bestämda experimenten kan placeras vid godtyckliga noder i försöksträdet. Här presenterar vi en dynamisk programmeringsalgoritm för att härleda den optimala signaleringspolicyn som använder tvåfasförsökslösningens strukturella insikter. Vi kontrasterar också den optimala signaleringspolitikstrukturen med klassiska Bayesianska övertalningsstrategier för att belysa effekten av signaleringsbegränsningarna på avsändaren.


Nyckelord : Informationsdesign · Bayesiansk övertalning · Signalspel.

1 Introduktion

Informationsdesign studerar hur informerade agenter (avsändare) övertalar oinformerade agenter (mottagare) att vidta specifika åtgärder genom att påverka de oinformerade agenternas tro via informationsutlämnande i ett spel. Den kanoniska Kamenica-Gentzkow-modellen [16] är en där avsändaren kan förbinda sig till en policy för informationsutlämnande (signaleringsstrategi) innan han lär sig det sanna tillståndet. När väl tillståndet är realiserat skickas en motsvarande (randomiserad) signal till mottagaren. Sedan vidtar mottagaren en åtgärd, vilket resulterar i utdelning för både avsändaren och mottagaren. Avsändare i informationsdesignproblem behöver bara manipulera mottagarnas övertygelser med korrekt valda signaler. De manipulerade föreställningarna kommer att skapa rätt incitament för mottagaren att spontant vidta specifika åtgärder som gynnar avsändaren (i förväntan). I (klassisk) mekanismdesign är historien dock annorlunda: designern är omedveten om agenternas privata information, och agenterna kommunicerar sin privata information till designern, som sedan måste ge incitament via (monetära) överföringar eller andra sätt . Den flexibilitet som informationsdesign ger som gör att avsändaren kan dra nytta av informationsutlämnande utan att implementera verktygsöverföringsmekanismer har lett till större tillämpbarhet av metodiken: olika modeller och teorier kan hittas i enkätpapper som [3] och [15].


Vårt arbete är motiverat av många verkliga problem där övertalningsscheman är tillämpliga, men avsändaren är begränsad i valet av tillgängliga signaler för informationsdesign. Specifikt är vi intresserade av problem som naturligt modelleras via flerfasförsök där de interimistiska resultaten avgör de efterföljande experimenten. Vidare insisterar vi på att några av experimenten ges på ett exogent sätt. Denna funktion sätter begränsningar på avsändarens signalutrymme, och utan det skulle vi ha ett klassiskt Bayesiansk övertalningsproblem med ett förstorat signalutrymme. Vårt mål är att studera effekten av sådana begränsningar på det optimala signaleringsschemat, och i synnerhet att kontrastera det med de optimala signaleringsscheman i klassisk Bayesiansk övertalning.


Följande motiverande exempel beskriver ett möjligt scenario i verkligheten.


Exempel 1 (Motiverande exempel - Skaffa medel från ett riskkapitalföretag) . Vi överväger ett scenario där en nystartad företag söker pengar från ett riskkapitalföretag. Processen för detta kommer vanligtvis att involvera flera förhandlings- och utvärderingsrundor: några av dessa kommer att vara demonstrationer av startupens kärnverksamhetsidé, och de andra kommer att vara bedömningar av riskkapitalföretaget efter deras egna screeningprocedurer. Nystartaren kommer att behöva följa riskkapitalbolagets screeningprocedurer men väljer sina produktdemonstrationer. Baserat på dessa bestämmelser måste nystartade företag designa sina demonstrationer för att maximera sin chans att få finansiering.


Fig. 1. Exempel på en förhandlingsprocess – en startup kontra ett riskkapitalföretag.


I exemplet ovan måste nystartaren (avsändaren) generera ett informationssystem för att få de önskade medlen från riskkapitalföretaget (mottagaren). Då är screeningprocedurerna som fastställts av riskkapitalföretaget analoga med våra bestämda experiment, och demonstrationerna som utförs av uppstarten är de (avsändaren) designade experimenten. Till exempel, i figur 1 presenterar vi en rimlig interaktion där det nystartade företaget designar demonstrationerna A, B och C (cirklar i figuren) och riskkapitalföretaget har förutbestämda screeningundersökningar W, X, Y och Z (rektanglar i figuren). Medan vi har illustrerat detta exempel via ett balanserat träd, om vi har ett obalanserat träd på grund av att mottagaren bestämmer i mitten, kan vi modifiera det till ett balanserat träd genom att lägga till det nödvändiga antalet dummysteg.


Avsändarens minskade flexibilitet i sina signaleringsstrategier under några förutbestämda experiment med godtyckliga positioner och informativitet skiljer vårt arbete från den växande litteraturen om dynamisk informationsdesign. Vår modell betraktar ett problem med följande funktioner: ett statiskt tillståndsutrymme, en miljö för sekventiell informationsavslöjande och ett signaleringsutrymme begränsat av några exogena begränsningar vars hårdhet kan bero på de föreslagna singlingsschemana. Modeller med ett statiskt tillståndsutrymme, ett obegränsat signalutrymme men en mängd olika miljöer för sekventiell informationsavslöjande har studerats för att fånga funktioner i olika verkliga problem: t.ex. med flera avsändare [12,19], med kostsam kommunikation [14,22 ], vilket möjliggör sekventiellt beslutsfattande [10], eller med partiellt åtagande [1,22]. Modeller med dynamiska tillstånd och miljöer för sekventiell informationsavslöjande studeras vanligtvis under en informerad avsändare med kunskap om dynamiskt föränderliga tillstånd; en mängd olika verk i denna kategori ligger i tillståndsändringsdetektering [9,11] eller routingspel [21]. Även om flera verk [7,13,18] också överväger begränsade signaleringsscheman, anser dessa verk antingen att signalutrymmet är mindre än handlingsutrymmet [13,7] eller överväger en bullrig signaleringsmiljö [18]. Modeller med exogen information [17,5,4] kan ses som problem med sekventiella informationsavslöjande med exogena bestämda experiment placerade i bestämda faser. Den sekventiella informationsavslöjandet i vår modell, som faktiskt förstorar signalutrymmet, gör att vårt arbete skiljer sig från ovanstående. För att hålla fokus i artikeln på sekventiella försök diskuterar vi den bredare litteraturen om begränsade avsändare, algoritmisk informationsdesign och arbeten relaterade till mottagarens experimentdesign[1] i vår onlineversion [23].


Enligt det motiverande exemplet som illustreras i figur 1, betraktar övertalningsproblemet en sekvens av experiment där experiment längre fram i trädet beror på resultaten från tidigare faser. Experimentet som ska köras i varje fas är antingen exogent bestämt eller valt av avsändaren. I spelet väljer avsändaren designade experiment med kunskap om de tidigare, de bestämda experimenten och mottagarens nyttofunktion, men innan tillståndet i världen är realiserat. Efter att avsändaren har förbundit sig till experimenten (dvs. signaleringsstrategin), realiseras världens tillstånd och en specifik sekvens av experiment genomförs baserat på realiseringen av de underliggande slumpvariablerna. Mottagaren vidtar sedan en åtgärd beroende på hela sekvensen av utfall. De föregående, avsändarens och mottagarens nyttofunktioner, de bestämda experimenten och de designade experimenten (efter att avsändaren slutfört dem) antas vara allmänt känt. Vi studerar detta problem för binära tillstånd i världen, först för tvåfas binära utfallsförsök och sedan generaliserat till flerfas binära utfallsförsök. Vi generaliserar sedan till icke-binära experiment (fortfarande med ett underliggande binärt tillståndsutrymme). I onlineversionen [23] lägger vi till spel med ytterligare ett steg där mottagaren rör sig före avsändaren för att bestämma några eller alla av de bestämda experimenten, kanske med vissa begränsningar.


Bidrag : De viktigaste bidragen från detta arbete är:


  1. Så vitt vi vet är vi inom det flerfasiga Bayesianska övertalningsramverket de första som studerar designen av avsändarens signaleringsscheman med exogent bestämda experiment i godtyckliga positioner. Våra resultat lyfter fram skillnaden mellan "exogent bestämda experiment" och "exogent given information" i den dynamiska informationsdesignen, där den förra ger större flexibilitet och möjliggör mer heterogenitet.


  2. Vi löser uttryckligen det optimala signaleringsschemat i tvåfasförsök. Dessutom, med hjälp av strukturella insikter från tvåfasförsök, presenterar vi en dynamisk programmeringsalgoritm för att härleda den optimala signaleringen i allmänna flerfasförsök via bakåt iteration.


  3. Vi analyserar effekten av begränsningar på avsändaren via de bestämda experimenten genom att kontrastera prestandan med den klassiska Bayesianska övertalningsinställningen och när vi använder klassisk Bayesiansk övertalning optimala signaleringsscheman när avsändaren är begränsad. Som en del av detta tillhandahåller vi ett tillräckligt villkor för när en sekventiell rättegång är likvärdig med klassisk Bayesiansk övertalning med ett potentiellt förstorat signalutrymme.


Detta dokument är tillgängligt på arxiv under CC 4.0-licens.


[1] Se avsnitt 5 i [23] för detaljer.