paint-brush
Hoe beïnvloeden signaalbeperkingen de Bayesiaanse overtuiging in multifase-onderzoeken?door@bayesianinference
107 lezingen

Hoe beïnvloeden signaalbeperkingen de Bayesiaanse overtuiging in multifase-onderzoeken?

door Bayesian Inference7m2024/11/10
Read on Terminal Reader

Te lang; Lezen

Dit artikel onderzoekt Bayesiaanse overtuiging in multi-fase proeven, met de focus op scenario's waarin de zender te maken krijgt met signaalbeperkingen vanwege extern bepaalde experimenten. Het introduceert een dynamische programmeringsaanpak om signaleringsbeleid te optimaliseren en contrasteert deze met klassieke strategieën.
featured image - Hoe beïnvloeden signaalbeperkingen de Bayesiaanse overtuiging in multifase-onderzoeken?
Bayesian Inference HackerNoon profile picture
0-item

Auteurs:

(1) Shih-Tang Su, Universiteit van Michigan, Ann Arbor ([email protected]);

(2) Vijay G. Subramanian, Universiteit van Michigan, Ann Arbor en ([email protected]);

(3) Grant Schoenebeck, Universiteit van Michigan, Ann Arbor ([email protected]).

Tabel met links

Samenvatting en 1. Inleiding

2. Probleemformulering

2.1 Model van binaire-uitkomst experimenten in twee-fase proeven

3 Binaire-uitkomst experimenten in twee-fase proeven en 3.1 Experimenten met screenings

3.2 Veronderstellingen en geïnduceerde strategieën

3.3 Beperkingen gegeven door fase-II experimenten

3.4 Overtuigingsverhouding en de optimale signaleringsstructuur

3.5 Vergelijking met klassieke Bayesiaanse overtuigingsstrategieën

4 Experimenten met binaire uitkomsten in proeven met meerdere fasen en 4.1 Model van experimenten met binaire uitkomsten in proeven met meerdere fasen

4.2 Vastberaden versus door de zender ontworpen experimenten

4.3 Multifasemodel en klassieke Bayesiaanse overtuiging en referenties


Abstract

We beschouwen een Bayesiaans overtuigingsprobleem waarbij de zender de ontvanger probeert te overtuigen om een bepaalde actie te ondernemen via een reeks signalen. Dit modelleren we door multifaseproeven te beschouwen met verschillende experimenten die zijn uitgevoerd op basis van de uitkomsten van eerdere experimenten. In tegenstelling tot de meeste literatuur beschouwen we het probleem met beperkingen op signalen die aan de zender worden opgelegd. Dit bereiken we door een aantal experimenten op een exogene manier vast te leggen; dit worden bepaalde experimenten genoemd. Deze modellering helpt ons om situaties in de echte wereld te begrijpen waarin dit voorkomt: bijvoorbeeld multifasegeneesmiddelenproeven waarbij de FDA een aantal experimenten bepaalt, start-up-acquisitie door grote bedrijven waarbij de potentiële verwerver beoordelingen in de laatste fase bepaalt, sollicitatiegesprekken met meerdere rondes waarbij de kandidaten in eerste instantie hun kwalificaties presenteren, maar de rest van de screeningsprocedures worden bepaald door de interviewer. De niet-bepaalde experimenten (signalen) in de multifaseproef moeten door de zender worden gekozen om de ontvanger het beste te overtuigen. Met een binaire toestand van de wereld leiden we het optimale signaleringsbeleid af in de enige niet-triviale configuratie van een tweefasenproef met binaire uitkomstexperimenten. Vervolgens generaliseren we naar meerfaseproeven met binaire uitkomstexperimenten waarbij de bepaalde experimenten op willekeurige knooppunten in de proefboom kunnen worden geplaatst. Hier presenteren we een dynamisch programmeeralgoritme om het optimale signaleringsbeleid af te leiden dat gebruikmaakt van de structurele inzichten van de tweefasenproefoplossing. We contrasteren ook de optimale signaleringsbeleidstructuur met klassieke Bayesiaanse overtuigingsstrategieën om de impact van de signaleringsbeperkingen op de verzender te benadrukken.


Trefwoorden : Informatieontwerp · Bayesiaanse overtuiging · Signaalspellen.

1 Inleiding

Informatieontwerp bestudeert hoe geïnformeerde agenten (zenders) ongeïnformeerde agenten (ontvangers) overtuigen om specifieke acties te ondernemen door de overtuigingen van de ongeïnformeerde agenten te beïnvloeden via informatieopenbaarmaking in een spel. Het canonieke Kamenica-Gentzkow-model [16] is er een waarbij de zender zich kan committeren aan een informatieopenbaarmakingsbeleid (signaalstrategie) voordat hij de ware staat leert. Zodra de staat is gerealiseerd, wordt een overeenkomstig (gerandomiseerd) signaal naar de ontvanger gestuurd. Vervolgens onderneemt de ontvanger een actie, wat resulteert in uitbetalingen voor zowel de zender als de ontvanger. Zenders in informatieontwerpproblemen hoeven alleen de overtuigingen van de ontvangers te manipuleren met goed gekozen signalen. De gemanipuleerde overtuigingen zullen de juiste prikkels creëren voor de ontvanger om spontaan specifieke acties te ondernemen die de zender ten goede komen (in verwachting). In (klassiek) mechanismeontwerp is het verhaal echter anders: de ontwerper is zich niet bewust van de privé-informatie van de agenten, en de agenten communiceren hun privé-informatie aan de ontwerper, die vervolgens prikkels moet bieden via (geldelijke) overboekingen of andere middelen. De flexibiliteit die informatieontwerp biedt, waardoor de verzender kan profiteren van de openbaarmaking van informatie zonder dat er mechanismen voor nutsoverdracht hoeven te worden geïmplementeerd, heeft geleid tot een grotere toepasbaarheid van de methodologie: verschillende modellen en theorieën zijn te vinden in onderzoeksrapporten zoals [3] en [15].


Ons werk wordt gemotiveerd door veel echte problemen waar overtuigingsschema's toepasbaar zijn, maar de zender beperkt is in de keuze van signalen die beschikbaar zijn voor informatieontwerp. We zijn specifiek geïnteresseerd in problemen die op natuurlijke wijze worden gemodelleerd via multifaseproeven waarbij de tussentijdse uitkomsten de daaropvolgende experimenten bepalen. Verder staan we erop dat sommige experimenten op een exogene manier worden gegeven. Deze eigenschap legt beperkingen op aan de signaleringsruimte van de zender, en zonder deze zouden we een klassiek Bayesiaans overtuigingsprobleem hebben met een vergrote signaalruimte. Ons doel is om de impact van dergelijke beperkingen op het optimale signaleringsschema te bestuderen, en in het bijzonder om het te contrasteren met de optimale signaleringsschema's in klassieke Bayesiaanse overtuiging.


Het volgende motiverende voorbeeld beschrijft een mogelijk scenario uit de praktijk.


Voorbeeld 1 (Motiverend voorbeeld - Fondsen verwerven van een durfkapitaalbedrijf) . We beschouwen een scenario waarin een start-up fondsen zoekt van een durfkapitaalbedrijf. Het proces hiervoor omvat doorgaans meerdere rondes van onderhandelingen en evaluaties: sommige hiervan zijn demonstraties van het kernbedrijfsidee van de start-up, en de andere zijn beoordelingen door het durfkapitaalbedrijf volgens hun eigen screeningprocedures. De start-up moet de screeningprocedures van het durfkapitaalbedrijf volgen, maar kiest zijn productdemonstraties. Op basis van deze bepalingen moet de start-up zijn demonstraties ontwerpen om zijn kans op financiering te maximaliseren.


Figuur 1. Voorbeeld van een onderhandelingsproces – een startup versus een durfkapitaalbedrijf.


In het bovenstaande voorbeeld moet de start-up (zender) een informatie-openbaarmakingsschema genereren om de gewenste fondsen van de durfkapitaalfirma (ontvanger) te krijgen. Dan zijn de screeningprocedures die door de durfkapitaalfirma zijn ingesteld analoog aan onze vastgestelde experimenten, en de demonstraties die door de start-up zijn uitgevoerd, zijn de (zender) ontworpen experimenten. In Figuur 1 presenteren we bijvoorbeeld een plausibele interactie waarbij de start-up demonstraties A, B en C (cirkels in de afbeelding) ontwerpt en de durfkapitaalfirma vooraf bepaalde screeningsonderzoeken W, X, Y en Z (rechthoeken in de afbeelding) heeft. Hoewel we dit voorbeeld hebben geïllustreerd via een gebalanceerde boom, kunnen we, als we een ongebalanceerde boom hebben omdat de ontvanger in het midden beslist, deze aanpassen naar een gebalanceerde boom door het vereiste aantal dummy-fasen toe te voegen.


De verminderde flexibiliteit van de verzender in haar signaleringsstrategieën onder bepaalde vooraf bepaalde experimenten met willekeurige posities en informatiefheid onderscheidt ons werk van de groeiende literatuur over dynamisch informatieontwerp. Ons model beschouwt een probleem met de volgende kenmerken: een statische toestandsruimte, een sequentiële informatie-openbaarmakingsomgeving en een signaleringsruimte die beperkt is door enkele exogene beperkingen waarvan de hardheid kan afhangen van de voorgestelde singelingsschema's. Modellen met een statische toestandsruimte, een onbeperkte signaalruimte maar een verscheidenheid aan sequentiële informatie-openbaarmakingsomgevingen zijn bestudeerd om kenmerken vast te leggen in verschillende problemen in de echte wereld: bijvoorbeeld met meerdere verzenders [12,19], met kostbare communicatie [14,22], waardoor sequentiële besluitvorming mogelijk is [10], of met gedeeltelijke toewijding [1,22]. Modellen met dynamische toestanden en sequentiële informatie-openbaarmakingsomgevingen worden gewoonlijk bestudeerd onder een geïnformeerde verzender met kennis van dynamisch veranderende toestand(en); een verscheidenheid aan werken in deze categorie ligt in detectie van toestandsverandering [9,11] of routeringsspellen [21]. Hoewel verschillende werken [7,13,18] ook beperkte signaleringsschema's beschouwen, beschouwen deze werken de signaalruimte als kleiner dan de actieruimte [13,7] of beschouwen ze een ruisende signaleringsomgeving [18]. Modellen met exogene informatie [17,5,4] kunnen worden gezien als sequentiële informatie-openbaarmakingsproblemen met exogene bepaalde experimenten die in bepaalde fasen zijn geplaatst. De sequentiële informatie-openbaarmaking in ons model, die de signaalruimte feitelijk vergroot, maakt ons werk anders dan bovenstaande werken. Om de focus van het artikel op sequentiële proeven te houden, bespreken we de bredere literatuur over beperkte verzenders, algoritmisch informatieontwerp en werken gerelateerd aan het experimentele ontwerp van de ontvanger [1] in onze online versie [23].


Volgens het motiverende voorbeeld in Figuur 1 beschouwt het overtuigingsprobleem een reeks experimenten waarbij experimenten verderop in de boom afhankelijk zijn van de uitkomsten van eerdere fasen. Het experiment dat in elke fase moet worden uitgevoerd, wordt ofwel exogeen bepaald of gekozen door de zender. In het spel kiest de zender ontworpen experimenten met kennis van de prior, de bepaalde experimenten en de nutsfunctie van de ontvanger, maar voordat de staat van de wereld is gerealiseerd. Nadat de zender zich heeft gecommitteerd aan de experimenten (d.w.z. de signaleringsstrategie), wordt de staat van de wereld gerealiseerd en wordt een specifieke reeks experimenten uitgevoerd op basis van de realisatie van de onderliggende willekeurige variabelen. De ontvanger onderneemt vervolgens een actie afhankelijk van de volledige reeks uitkomsten. De prior, de nutsfuncties van de zender en de ontvanger, de bepaalde experimenten en de ontworpen experimenten (nadat de zender ze heeft afgerond) worden verondersteld algemene kennis te zijn. We bestuderen dit probleem voor binaire toestanden van de wereld, eerst voor twee-fase binaire-uitkomst proeven, en vervolgens gegeneraliseerd naar multifase binaire-uitkomst proeven. Vervolgens generaliseren we naar niet-binaire experimenten (nog steeds met een onderliggende binaire toestandsruimte). In de online versie [23] voegen we spellen toe met een extra fase waarin de ontvanger voor de zender beweegt om enkele of alle bepaalde experimenten te beslissen, mogelijk met enkele beperkingen.


Bijdragen : De belangrijkste bijdragen van dit werk zijn:


  1. Voor zover wij weten, zijn wij binnen het multi-fase Bayesiaanse overtuigingskader de eersten die het ontwerp van signaleringsschema's van de zender met exogeen bepaalde experimenten in willekeurige posities bestuderen. Onze resultaten benadrukken het verschil tussen "exogeen bepaalde experimenten" en "exogeen gegeven informatie" in het dynamische informatieontwerp, waarbij de eerste meer flexibiliteit biedt en meer heterogeniteit toelaat.


  2. We lossen expliciet het optimale signaleringsschema op in tweefaseproeven. Bovendien presenteren we, met behulp van structurele inzichten verkregen uit tweefaseproeven, een dynamisch programmeringsalgoritme om de optimale signalering af te leiden in algemene multifaseproeven via achterwaartse iteratie.


  3. We analyseren de impact van beperkingen op de zender via de vastgestelde experimenten door de prestaties te vergelijken met de klassieke Bayesiaanse overtuigingsinstelling en bij het gebruik van klassieke Bayesiaanse overtuigingsoptimale signaleringsschema's wanneer de zender beperkt is. Als onderdeel hiervan bieden we een voldoende voorwaarde voor wanneer een sequentiële proef gelijkwaardig is aan klassieke Bayesiaanse overtuiging met een potentieel vergrote signaalruimte.


Dit artikel is beschikbaar op arxiv onder de CC 4.0-licentie.


[1] Zie sectie 5 in [23] voor details.