Autores:
(1) Shih-Tang Su, Universidad de Michigan, Ann Arbor ([email protected]);
(2) Vijay G. Subramanian, Universidad de Michigan, Ann Arbor y ([email protected]);
(3) Grant Schoenebeck, Universidad de Michigan, Ann Arbor ([email protected]).
2.1 Modelo de experimentos de resultados binarios en ensayos de dos fases
3.2 Supuestos y estrategias inducidas
3.3 Restricciones dadas por los experimentos de la fase II
3.4 Relación de persuasión y estructura óptima de señalización
3.5 Comparación con las estrategias clásicas de persuasión bayesiana
4.2 Experimentos determinados versus experimentos diseñados por el remitente
4.3 Modelo multifásico y persuasión bayesiana clásica y Referencias
Consideramos un problema de persuasión bayesiana en el que el emisor intenta persuadir al receptor para que realice una acción particular mediante una secuencia de señales. Esto lo modelamos considerando ensayos multifásicos con diferentes experimentos realizados en función de los resultados de experimentos anteriores. A diferencia de la mayor parte de la literatura, consideramos el problema con restricciones sobre las señales impuestas al emisor. Esto lo logramos fijando algunos de los experimentos de manera exógena; estos se denominan experimentos determinados. Este modelo nos ayuda a comprender situaciones del mundo real en las que esto ocurre: por ejemplo, ensayos de medicamentos multifásicos en los que la FDA determina algunos de los experimentos, adquisiciones de empresas emergentes por parte de grandes empresas en las que el potencial comprador determina las evaluaciones de última etapa, entrevistas de trabajo de varias rondas en las que los candidatos señalan inicialmente presentando sus calificaciones, pero el resto de los procedimientos de selección los determina el entrevistador. Los experimentos no determinados (señales) en el ensayo multifásico deben ser elegidos por el emisor para persuadir mejor al receptor. Con un estado binario del mundo, derivamos la política de señalización óptima en la única configuración no trivial de un ensayo de dos fases con experimentos de resultados binarios. Luego generalizamos a ensayos multifásicos con experimentos de resultados binarios donde los experimentos determinados se pueden colocar en nodos arbitrarios en el árbol de ensayos. Aquí presentamos un algoritmo de programación dinámica para derivar la política de señalización óptima que utiliza los conocimientos estructurales de la solución de ensayo de dos fases. También contrastamos la estructura de la política de señalización óptima con las estrategias de persuasión bayesianas clásicas para resaltar el impacto de las restricciones de señalización en el remitente.
Palabras clave : Diseño de información · Persuasión bayesiana · Juegos de señalización.
El diseño de información estudia cómo los agentes informados (emisores) persuaden a los agentes desinformados (receptores) a realizar acciones específicas al influir en las creencias de los agentes desinformados a través de la divulgación de información en un juego. El modelo canónico de Kamenica-Gentzkow [16] es uno en el que el emisor puede comprometerse con una política de divulgación de información (estrategia de señalización) antes de conocer el estado verdadero. Una vez que se realiza el estado, se envía una señal correspondiente (aleatoria) al receptor. Luego, el receptor realiza una acción, que resulta en pagos tanto para el emisor como para el receptor. Los emisores en problemas de diseño de información solo necesitan manipular las creencias de los receptores con señales elegidas adecuadamente. Las creencias manipuladas crearán los incentivos correctos para que el receptor realice espontáneamente acciones específicas que beneficien al emisor (en expectativa). Sin embargo, en el diseño de mecanismos (clásico), la historia es diferente: el diseñador desconoce la información privada de los agentes, y los agentes comunican su información privada al diseñador, quien luego tiene que proporcionar incentivos a través de transferencias (monetarias) u otros medios. La flexibilidad que ofrece el diseño de la información, que permite al remitente beneficiarse de la divulgación de información sin implementar mecanismos de transferencia de utilidad, ha llevado a una mayor aplicabilidad de la metodología: se pueden encontrar varios modelos y teorías en artículos de investigación como [3] y [15].
Nuestro trabajo está motivado por muchos problemas del mundo real en los que los esquemas de persuasión son aplicables, pero el emisor está limitado en la elección de señales disponibles para el diseño de la información. En concreto, nos interesan los problemas que se modelan de forma natural mediante ensayos multifásicos en los que los resultados provisionales determinan los experimentos posteriores. Además, insistimos en que algunos de los experimentos se dan de forma exógena. Esta característica impone restricciones al espacio de señalización del emisor y, sin ella, tendríamos un problema de persuasión bayesiana clásica con un espacio de señales ampliado. Nuestro objetivo es estudiar el impacto de dichas restricciones en el esquema de señalización óptimo y, en particular, contrastarlo con los esquemas de señalización óptimos en la persuasión bayesiana clásica.
El siguiente ejemplo motivador describe un posible escenario del mundo real.
Ejemplo 1 (ejemplo motivador: obtención de fondos de una empresa de capital de riesgo) . Consideramos un escenario en el que una empresa emergente busca fondos de una empresa de capital de riesgo. El proceso para esto normalmente implicará múltiples rondas de negociación y evaluación: algunas de ellas serán demostraciones de la idea de negocio principal de la empresa emergente, y las otras serán evaluaciones por parte de la empresa de capital de riesgo siguiendo sus propios procedimientos de selección. La empresa emergente tendrá que seguir los procedimientos de selección de la empresa de capital de riesgo, pero elige las demostraciones de sus productos. En función de estas estipulaciones, la empresa emergente debe diseñar sus demostraciones para maximizar sus posibilidades de obtener financiación.
En el ejemplo anterior, la empresa emergente (emisora) tiene que generar un esquema de divulgación de información para obtener los fondos deseados de la empresa de capital de riesgo (receptora). Luego, los procedimientos de selección establecidos por la empresa de capital de riesgo son análogos a nuestros experimentos determinados, y las demostraciones llevadas a cabo por la empresa emergente son los experimentos diseñados (por la emisora). Por ejemplo, en la Figura 1 presentamos una interacción plausible en la que la empresa emergente diseña las demostraciones A, B y C (círculos en la figura) y la empresa de capital de riesgo ha predeterminado los exámenes de selección W, X, Y y Z (rectángulos en la figura). Si bien hemos ilustrado este ejemplo a través de un árbol equilibrado, si tenemos un árbol no equilibrado debido a que el receptor decide en el medio, podemos modificarlo a un árbol equilibrado agregando el número requerido de etapas ficticias.
La flexibilidad reducida del remitente en sus estrategias de señalización bajo algunos experimentos predeterminados con posiciones arbitrarias e informatividad diferencia nuestro trabajo de la creciente literatura sobre diseño de información dinámica. Nuestro modelo considera un problema con las siguientes características: un espacio de estado estático, un entorno de divulgación de información secuencial y un espacio de señalización restringido por algunas restricciones exógenas cuya dureza puede depender de los esquemas de singularización propuestos. Se han estudiado modelos con un espacio de estado estático, un espacio de señal sin restricciones pero una variedad de entornos de divulgación de información secuencial para capturar características en diferentes problemas del mundo real: por ejemplo, con múltiples remitentes [12,19], con comunicación costosa [14,22], lo que permite la toma de decisiones secuencial [10], o con compromiso parcial [1,22]. Los modelos con estados dinámicos y entornos de divulgación de información secuencial generalmente se estudian bajo un remitente informado con el conocimiento de estados que cambian dinámicamente; una variedad de trabajos en esta categoría se encuentran en la detección de cambio de estado [9,11] o juegos de enrutamiento [21]. Aunque varios trabajos [7,13,18] también consideran esquemas de señalización restringida, estos trabajos consideran que el espacio de la señal es más pequeño que el espacio de acción [13,7] o consideran un entorno de señalización ruidoso [18]. Los modelos con información exógena [17,5,4] pueden verse como problemas de divulgación de información secuencial con experimentos determinados exógenos colocados en fases determinadas. La divulgación de información secuencial en nuestro modelo, que en realidad amplía el espacio de la señal, hace que nuestro trabajo sea diferente de los trabajos anteriores. Para mantener el enfoque del artículo en los ensayos secuenciales, discutimos la literatura más amplia sobre remitentes restringidos, diseño de información algorítmica y trabajos relacionados con el diseño de experimentos del receptor [1] en nuestra versión en línea [23].
Según el ejemplo motivador ilustrado en la Figura 1, el problema de la persuasión considera una secuencia de experimentos donde los experimentos posteriores en el árbol dependen de los resultados de las fases anteriores. El experimento que se realizará en cada fase se determina exógenamente o lo elige el emisor. En el juego, el emisor elige experimentos diseñados con conocimiento de los experimentos previos, los experimentos determinados y la función de utilidad del receptor, pero antes de que se realice el estado del mundo. Después de que el emisor se compromete con los experimentos (es decir, la estrategia de señalización), se realiza el estado del mundo y se lleva a cabo una secuencia específica de experimentos en función de la realización de las variables aleatorias subyacentes. Luego, el receptor realiza una acción que depende de toda la secuencia de resultados. Se supone que los experimentos previos, las funciones de utilidad del emisor y del receptor, los experimentos determinados y los experimentos diseñados (después de que el emisor los finaliza) son de conocimiento común. Estudiamos este problema para estados binarios del mundo, primero para ensayos de resultado binario de dos fases y luego generalizados a ensayos de resultado binario multifase. Luego generalizamos a experimentos no binarios (aún con un espacio de estados binario subyacente). En la versión en línea [23] agregamos juegos con una etapa adicional donde el receptor se mueve antes que el emisor para decidir algunos o todos los experimentos determinados, quizás con algunas restricciones.
Contribuciones : Las principales contribuciones de este trabajo son:
Hasta donde sabemos, dentro del marco de persuasión bayesiana multifase, somos los primeros en estudiar el diseño de esquemas de señalización del emisor con experimentos determinados exógenamente en posiciones arbitrarias. Nuestros resultados resaltan la diferencia entre “experimentos determinados exógenamente” e “información dada exógenamente” en el diseño de información dinámica, donde los primeros brindan mayor flexibilidad y permiten más heterogeneidad.
Resolvemos explícitamente el esquema de señalización óptimo en ensayos de dos fases. Además, utilizando conocimientos estructurales obtenidos a partir de ensayos de dos fases, presentamos un algoritmo de programación dinámica para derivar la señalización óptima en ensayos generales de múltiples fases mediante iteración hacia atrás.
Analizamos el impacto de las restricciones en el remitente a través de los experimentos determinados, contrastando el rendimiento con el entorno de persuasión bayesiana clásica y al utilizar esquemas de señalización óptimos de persuasión bayesiana clásica cuando el remitente está restringido. Como parte de esto, proporcionamos una condición suficiente para cuando un ensayo secuencial es equivalente a la persuasión bayesiana clásica con un espacio de señal potencialmente ampliado.
Este artículo está disponible en arxiv bajo licencia CC 4.0.
[1] Véase la Sección 5 en [23] para más detalles.