paint-brush
محدودیت‌های سیگنال چگونه بر متقاعدسازی بیزی در آزمایش‌های چند مرحله‌ای تأثیر می‌گذارند؟توسط@bayesianinference
107 قرائت

محدودیت‌های سیگنال چگونه بر متقاعدسازی بیزی در آزمایش‌های چند مرحله‌ای تأثیر می‌گذارند؟

توسط Bayesian Inference7m2024/11/10
Read on Terminal Reader

خیلی طولانی؛ خواندن

این مقاله اقناع بیزی را در آزمایش‌های چند مرحله‌ای بررسی می‌کند، با تمرکز بر سناریوهایی که در آن فرستنده با محدودیت‌های سیگنال به دلیل آزمایش‌های تعیین‌شده خارجی مواجه می‌شود. این یک رویکرد برنامه‌نویسی پویا را برای بهینه‌سازی سیاست‌های سیگنالینگ معرفی می‌کند و آنها را با استراتژی‌های کلاسیک مقایسه می‌کند.
featured image - محدودیت‌های سیگنال چگونه بر متقاعدسازی بیزی در آزمایش‌های چند مرحله‌ای تأثیر می‌گذارند؟
Bayesian Inference HackerNoon profile picture
0-item

نویسندگان:

(1) Shih-Tang Su، دانشگاه میشیگان، Ann Arbor ([email protected]);

(2) Vijay G. Subramanian، دانشگاه میشیگان، آن آربور و ([email protected]);

(3) Grant Schoenebeck، دانشگاه میشیگان، آن آربور ([email protected]).

جدول پیوندها

چکیده و 1. مقدمه

2. فرمول مسئله

2.1 مدل آزمایش‌های باینری نتیجه در آزمایش‌های دو فازی

3 آزمایش با نتیجه دودویی در آزمایشات دو فازی و 3.1 آزمایش با غربالگری

3.2 مفروضات و راهبردهای القایی

3.3 محدودیت های ارائه شده توسط آزمایش های فاز دوم

3.4 نسبت متقاعدسازی و ساختار سیگنال دهی بهینه

3.5 مقایسه با راهبردهای متقاعدسازی بیزی کلاسیک

4 آزمایش با نتیجه باینری در آزمایش‌های چند مرحله‌ای و 4.1 مدل آزمایش‌های باینری نتیجه در آزمایش‌های چند مرحله‌ای

4.2 آزمایش های تعیین شده در مقابل آزمایش های طراحی شده توسط فرستنده

4.3 مدل چند مرحله ای و متقاعدسازی بیزی کلاسیک و مراجع


چکیده

ما یک مشکل متقاعدسازی بیزی را در نظر می گیریم که در آن فرستنده سعی می کند گیرنده را متقاعد کند تا از طریق دنباله ای از سیگنال ها اقدامی خاص انجام دهد. ما این را با در نظر گرفتن کارآزمایی‌های چند مرحله‌ای با آزمایش‌های مختلف انجام‌شده بر اساس نتایج آزمایش‌های قبلی مدل‌سازی می‌کنیم. برخلاف بسیاری از متون، ما مشکل محدودیت‌های سیگنال‌های اعمال‌شده بر فرستنده را در نظر می‌گیریم. این را با تثبیت برخی از آزمایشات به صورت برون زا به دست می آوریم. به این آزمایشات معین می گویند. این مدل‌سازی به ما کمک می‌کند موقعیت‌های دنیای واقعی را که در آن اتفاق می‌افتد، درک کنیم: به عنوان مثال، آزمایش‌های دارویی چند مرحله‌ای که FDA برخی از آزمایش‌ها را تعیین می‌کند، خرید راه‌اندازی توسط شرکت‌های بزرگ که در آن خریدار بالقوه ارزیابی‌های مرحله آخر را تعیین می‌کند، مصاحبه‌های شغلی چند مرحله‌ای. که در آن داوطلبان ابتدا با ارائه مدارک خود علامت می دهند اما بقیه مراحل غربالگری توسط مصاحبه کننده تعیین می شود. آزمایش‌ها (سیگنال‌ها) نامشخص در آزمایش چند مرحله‌ای باید توسط فرستنده انتخاب شوند تا گیرنده را به بهترین نحو متقاعد کنند. با وضعیت باینری جهان، ما سیاست سیگنال دهی بهینه را در تنها پیکربندی غیر پیش پا افتاده یک آزمایش دو فازی با آزمایش‌های نتیجه باینری استخراج می‌کنیم. سپس به کارآزمایی‌های چند مرحله‌ای با آزمایش‌های باینری نتیجه تعمیم می‌دهیم که در آن آزمایش‌های تعیین‌شده را می‌توان در گره‌های دلخواه در درخت آزمایش قرار داد. در اینجا ما یک الگوریتم برنامه نویسی پویا را برای استخراج خط مشی سیگنالینگ بهینه ارائه می کنیم که از بینش ساختاری راه حل آزمایشی دو فازی استفاده می کند. ما همچنین ساختار سیاست سیگنال دهی بهینه را با استراتژی های متقاعدسازی بیزی کلاسیک مقایسه می کنیم تا تأثیر محدودیت های سیگنال دهی را بر فرستنده برجسته کنیم.


کلمات کلیدی : طراحی اطلاعات · متقاعدسازی بیزی · بازی های سیگنال دهی.

1 مقدمه

طراحی اطلاعات مطالعه می‌کند که چگونه عوامل آگاه (فرستنده‌ها) عوامل ناآگاه (گیرنده) را متقاعد می‌کنند تا با تأثیرگذاری بر باورهای عوامل ناآگاه از طریق افشای اطلاعات در یک بازی، اقدامات خاصی انجام دهند. مدل متعارف Kamenica-Gentzkow [16] مدلی است که فرستنده می تواند قبل از یادگیری وضعیت واقعی، به یک خط مشی افشای اطلاعات (استراتژی سیگنال دهی) متعهد شود. پس از تحقق وضعیت، سیگنال مربوطه (تصادفی) به گیرنده ارسال می شود. سپس، گیرنده اقدامی را انجام می دهد که نتیجه آن برای فرستنده و گیرنده است. فرستنده ها در مسائل طراحی اطلاعات فقط باید باورهای گیرنده را با سیگنال هایی که به درستی انتخاب شده اند دستکاری کنند. باورهای دستکاری شده، انگیزه های مناسبی را برای گیرنده ایجاد می کند تا به طور خود به خود اقدامات خاصی را انجام دهد که به نفع فرستنده (در انتظار) باشد. اما در طراحی مکانیزم (کلاسیک) داستان متفاوت است: طراح از اطلاعات خصوصی عوامل بی اطلاع است و عوامل اطلاعات خصوصی خود را به طراح منتقل می کنند، و سپس او باید انگیزه هایی را از طریق نقل و انتقالات (پولی) یا ابزارهای دیگر ارائه دهد. . انعطاف‌پذیری ارائه شده توسط طراحی اطلاعات که به فرستنده اجازه می‌دهد از افشای اطلاعات بدون پیاده‌سازی مکانیسم‌های انتقال سودمندی بهره‌مند شود، منجر به کاربرد بیشتر روش‌شناسی شده است: مدل‌ها و نظریه‌های مختلفی را می‌توان در مقالات نظرسنجی مانند [3] و [15] یافت.


انگیزه کار ما بسیاری از مشکلات دنیای واقعی است که در آن طرح‌های متقاعدسازی قابل اجرا هستند، اما فرستنده در انتخاب سیگنال‌های موجود برای طراحی اطلاعات محدود است. به طور خاص، ما علاقه مند به مشکلاتی هستیم که به طور طبیعی از طریق آزمایش‌های چند مرحله‌ای مدل‌سازی می‌شوند، جایی که نتایج موقت آزمایش‌های بعدی را تعیین می‌کنند. علاوه بر این، ما اصرار داریم که برخی از آزمایش‌ها به شیوه‌ای برون‌زا ارائه شوند. این ویژگی محدودیت‌هایی را بر فضای سیگنال فرستنده اعمال می‌کند و بدون آن، با یک فضای سیگنال بزرگ‌شده، با مشکل متقاعدسازی بیزی کلاسیک مواجه می‌شویم. هدف ما مطالعه تأثیر چنین محدودیت‌هایی بر روی طرح سیگنال‌دهی بهینه، و به‌ویژه، مقایسه آن با طرح‌های سیگنال‌دهی بهینه در متقاعدسازی بیزی کلاسیک است.


مثال انگیزشی زیر یک سناریوی ممکن در دنیای واقعی را توصیف می کند.


مثال 1 (مثال انگیزشی - کسب وجوه از یک شرکت سرمایه گذاری خطرپذیر) . ما سناریویی را در نظر می گیریم که در آن یک استارت آپ به دنبال سرمایه از یک شرکت سرمایه گذاری خطرپذیر است. فرآیند این امر معمولاً شامل چندین دور مذاکره و ارزیابی می‌شود: برخی از این‌ها نشان‌دهنده ایده اصلی کسب‌وکار استارت‌آپ است و بقیه ارزیابی‌هایی توسط شرکت سرمایه‌گذاری خطرپذیر به دنبال روش‌های غربالگری خودشان است. استارت آپ باید رویه های غربالگری شرکت سرمایه گذاری خطرپذیر را دنبال کند اما نمایش محصول خود را انتخاب می کند. بر اساس این شرایط، استارت‌آپ باید نمایش‌های خود را طراحی کند تا شانس خود را برای دریافت بودجه به حداکثر برساند.


شکل 1. مثالی از یک فرآیند مذاکره - یک استارتاپ در مقابل یک شرکت سرمایه گذاری خطرپذیر.


در مثال بالا، استارت آپ (فرستنده) باید یک طرح افشای اطلاعات ایجاد کند تا وجوه مورد نظر را از شرکت سرمایه گذاری خطرپذیر (دریافت کننده) دریافت کند. سپس رویه‌های غربالگری تعیین‌شده توسط شرکت سرمایه‌گذاری خطرپذیر مشابه آزمایش‌های تعیین‌شده ما هستند، و نمایش‌هایی که توسط استارت‌آپ انجام می‌شود، آزمایش‌های طراحی‌شده (فرستنده) هستند. به عنوان مثال، در شکل 1 یک تعامل قابل قبول را ارائه می دهیم که در آن شرکت نوپا، نمایش های A، B، و C (دایره هایی در شکل) را طراحی می کند و شرکت سرمایه گذاری خطرپذیر، معاینات غربالگری W، X، Y، و Z از پیش تعیین شده را دارد. (مستطیل در شکل). در حالی که ما این مثال را از طریق یک درخت متعادل نشان داده‌ایم، اگر یک درخت نامتعادل به دلیل تصمیم گیرنده در وسط داشته باشیم، می‌توانیم آن را با اضافه کردن تعداد مورد نیاز مراحل ساختگی به درخت متعادل تغییر دهیم.


کاهش انعطاف پذیری فرستنده در استراتژی های سیگنال دهی او تحت برخی آزمایش های از پیش تعیین شده با موقعیت های دلخواه و اطلاعاتی بودن، کار ما را از ادبیات رو به رشد در مورد طراحی اطلاعات پویا متمایز می کند. مدل ما مشکلی را با ویژگی‌های زیر در نظر می‌گیرد: یک فضای حالت ایستا، یک محیط افشای اطلاعات متوالی، و یک فضای سیگنالینگ محدود شده توسط برخی محدودیت‌های برون‌زا که سختی آن ممکن است به طرح‌های منفرد پیشنهادی بستگی داشته باشد. مدل‌هایی با فضای حالت ایستا، فضای سیگنال نامحدود اما انواع محیط‌های افشای اطلاعات متوالی برای به تصویر کشیدن ویژگی‌ها در مسائل مختلف دنیای واقعی مورد مطالعه قرار گرفته‌اند: به عنوان مثال، با فرستنده‌های متعدد [12،19]، با ارتباطات پرهزینه [14،22]. ]، اجازه تصمیم گیری متوالی [10]، یا با تعهد جزئی [1،22] را می دهد. مدل‌های دارای وضعیت‌های پویا و محیط‌های افشای اطلاعات متوالی معمولاً تحت یک فرستنده آگاه با آگاهی از وضعیت(های) در حال تغییر پویا مطالعه می‌شوند. انواع کارها در این دسته در تشخیص تغییر حالت [9،11] یا بازی های مسیریابی [21] نهفته است. اگرچه چندین کار [7،13،18] نیز طرح‌های سیگنالینگ محدود را در نظر می‌گیرند، این آثار یا فضای سیگنال را کوچک‌تر از فضای عمل در نظر می‌گیرند [13،7] یا یک محیط سیگنال‌دهی نویزدار را در نظر می‌گیرند [18]. مدل‌های دارای اطلاعات برون‌زا [17،5،4]، می‌توانند به‌عنوان مشکلات افشای اطلاعات متوالی با آزمایش‌های تعیین‌شده برون‌زا که در فازهای تعیین‌شده قرار گرفته‌اند، مشاهده شوند. افشای متوالی اطلاعات در مدل ما، که در واقع فضای سیگنال را بزرگ می‌کند، کار ما را از کارهای بالا متفاوت می‌کند. برای حفظ تمرکز مقاله بر روی آزمایش‌های متوالی، ما ادبیات گسترده‌تری را در مورد فرستنده‌های محدود، طراحی اطلاعات الگوریتمی، و کارهای مربوط به طراحی آزمایش گیرنده[1] در نسخه آنلاین خود [23] مورد بحث قرار می‌دهیم.


با توجه به مثال انگیزشی نشان‌داده‌شده در شکل 1، مسئله متقاعدسازی دنباله‌ای از آزمایش‌ها را در نظر می‌گیرد که در آن آزمایش‌های بیشتر در درخت به نتایج مراحل قبلی بستگی دارد. آزمایشی که در هر فاز اجرا می شود یا به صورت برون زا تعیین می شود یا توسط فرستنده انتخاب می شود. در بازی، فرستنده آزمایش‌های طراحی‌شده را با آگاهی از آزمایش‌های قبلی، تعیین‌شده و عملکرد سودمند گیرنده انتخاب می‌کند، اما قبل از اینکه وضعیت جهان مشخص شود. پس از اینکه فرستنده به آزمایش‌ها (یعنی استراتژی سیگنال دهی) متعهد شد، وضعیت جهان مشخص می‌شود و یک دنباله خاص از آزمایش‌ها بر اساس تحقق متغیرهای تصادفی زیربنایی انجام می‌شود. سپس گیرنده بسته به توالی کل نتایج، اقدامی را انجام می دهد. توابع سودمند قبلی، فرستنده و گیرنده، آزمایش‌های تعیین‌شده و آزمایش‌های طراحی‌شده (پس از نهایی‌سازی فرستنده) به عنوان دانش عمومی فرض می‌شوند. ما این مشکل را برای حالت‌های باینری جهان، ابتدا برای آزمایش‌های باینری نتیجه دو فازی، و سپس به آزمایش‌های باینری-نتیجه چند فازی تعمیم می‌دهیم. سپس به آزمایش‌های غیر باینری تعمیم می‌دهیم (هنوز با فضای حالت باینری زیربنایی). در نسخه آنلاین [23] ما بازی‌هایی را با یک مرحله اضافه اضافه می‌کنیم که در آن گیرنده قبل از فرستنده حرکت می‌کند تا برخی یا همه آزمایش‌های تعیین‌شده را تصمیم‌گیری کند، شاید با برخی محدودیت‌ها.


مشارکت ها : مشارکت های اصلی این کار عبارتند از:


  1. با بهترین دانش ما، در چارچوب متقاعدسازی بیزی چند فازی، ما اولین کسی هستیم که طراحی طرح‌های سیگنال دهی فرستنده را با آزمایش‌های برون‌زای تعیین‌شده در موقعیت‌های دلخواه مطالعه می‌کنیم. نتایج ما تفاوت بین «آزمایش‌های تعیین‌شده برون‌زا» و «اطلاعات داده‌شده برون‌زا» را در طراحی اطلاعات پویا نشان می‌دهد، جایی که اولی انعطاف‌پذیری بیشتری می‌دهد و امکان ناهمگونی بیشتری را می‌دهد.


  2. ما به صراحت طرح سیگنالینگ بهینه را در آزمایشات دو فازی حل می کنیم. علاوه بر این، با استفاده از بینش‌های ساختاری به‌دست‌آمده از آزمایش‌های دو فازی، ما یک الگوریتم برنامه‌نویسی پویا را برای استخراج سیگنال‌دهی بهینه در آزمایش‌های چند فازی عمومی از طریق تکرار به عقب ارائه می‌کنیم.


  3. ما تأثیر محدودیت‌ها بر فرستنده را از طریق آزمایش‌های تعیین‌شده با تضاد عملکرد با تنظیم متقاعدسازی بیزی کلاسیک و هنگام استفاده از طرح‌های سیگنال‌دهی بهینه ترغیب بیزی کلاسیک در زمانی که فرستنده محدود است، تجزیه و تحلیل می‌کنیم. به عنوان بخشی از این، ما شرایط کافی را برای زمانی که یک آزمایش متوالی معادل ترغیب بیزی کلاسیک با فضای سیگنال بالقوه بزرگ‌شده است، فراهم می‌کنیم.



[1] برای جزئیات بیشتر به بخش 5 در [23] مراجعه کنید.

L O A D I N G
. . . comments & more!

About Author

Bayesian Inference HackerNoon profile picture
Bayesian Inference@bayesianinference
At BayesianInference.Tech, as more evidence becomes available, we make predictions and refine beliefs.

برچسب ها را آویزان کنید

این مقاله در ارائه شده است...