paint-brush
Equilibrio de sesgo y varianza en experimentos de red: ¿cuándo debería agruparse?por@escholar
343 lecturas
343 lecturas

Equilibrio de sesgo y varianza en experimentos de red: ¿cuándo debería agruparse?

Demasiado Largo; Para Leer

Profundice en el proceso de toma de decisiones al elegir entre diseños de clúster y Bernoulli en experimentos. Este artículo explora a fondo el sesgo y la varianza del peor de los casos, ofreciendo información valiosa sobre el uso óptimo de los diseños de conglomerados. Descubra escenarios en los que los diseños de conglomerados superan a los diseños de Bernoulli y obtenga implicaciones prácticas para las consideraciones de sesgo experimental. Descubra una regla general para tomar decisiones informadas, especialmente en presencia de grupos del mismo tamaño, garantizando que su diseño experimental se alinee con sus objetivos de investigación.
featured image - Equilibrio de sesgo y varianza en experimentos de red: ¿cuándo debería agruparse?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

Autores:

(1) Davide Viviano, Departamento de Economía, Universidad de Harvard;

(2) Lihua Lei, Escuela de Graduados en Negocios, Universidad de Stanford;

(3) Guido Imbens, Escuela de Graduados en Negocios y Departamento de Economía, Universidad de Stanford;

(4) Brian Karrer, FAIR, Meta;

(5) Okke Schrijvers, Ciencias Aplicadas de Meta Central;

(6) Liang Shi, Ciencias Aplicadas de Meta Central.

Tabla de enlaces

Resumen e introducción

Configuración

(¿Cuándo) deberías agruparte?

Elegir el diseño del cluster

Ilustración empírica y estudios numéricos.

Recomendaciones para la práctica

Referencias

A) Notación

B) Efectos endógenos entre pares

C) Pruebas

3 (¿Cuándo) deberías agruparte?


3.1 Sesgo del peor de los casos


3.2 Variación en el peor de los casos

El lema 3.2 establece que dos resultados obtenidos tienen covarianza cero si dos individuos (i) están en dos grupos diferentes, de modo que ninguno de los dos grupos contiene un amigo del otro individuo, y (ii) no son amigos ni comparten un amigo común ( set), y si no hay ningún amigo de j en un cluster que contiene un amigo de i (set Gi). Tenga en cuenta que el Lema 3.2 equivale a decir que µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] tienen covarianza cero si Bi ∩ Bj = ∅. A continuación, analizamos las covarianzas para las unidades restantes.


Observación 5 (No observado A). Supongamos que A no se observa o se observa parcialmente, y que los investigadores tienen una prioridad sobre A. En este caso, la caracterización del sesgo y la varianza continúa manteniéndose una vez que tomamos las expectativas con respecto a la distribución de A, donde la prioridad sobre A puede depender sobre información parcial de la red [por ejemplo, Breza et al., 2020].

3.3 Comparación con un diseño de Bernoulli


ahora el número de conglomerados es de orden n (por ejemplo, los conglomerados contienen pocos individuos cada uno). Entonces el diseño del cluster es óptimo.


Tabla 1: Implicaciones prácticas del Teorema 3.5. La regla general se calcula para λ = 1, en presencia de conglomerados de igual tamaño con resultados que toman valores entre cero y uno, y el sesgo del agrupamiento es igual (o menor que) 50% (es decir, para cada individuo, el 50% de sus conexiones están en su mismo grupo). Aquí ψ¯ ≤ 4 cuando los resultados son binarios.



Para λ = 1, conocido como ψ¯, la regla general proporciona los efectos de desbordamiento más pequeños que garantizarían que el diseño de conglomerados domine al diseño de Bernoulli.


La última columna de la Tabla 1 recoge las implicaciones de la regla general, asumiendo (i) grupos de igual tamaño, (ii) el sesgo de la agrupación es como máximo del 50% como límite superior conservador, y (iii) los resultados están acotados entre cero y uno (en cuyo caso ψ¯ ≤ 4). En este contexto, los investigadores deberían realizar un experimento de conglomerados cuando ϕ¯ n √ Kn es mayor que 2,3 cuando ψ¯ = 4. La Figura 2 ilustra la regla general en función del sesgo y los conglomerados.





[10] La condición Kn/n = o(1), puede relajarse mediante una condición de muestra finita Kn ≤ nδ′ (ψ/ψ¯) para algunos δ ′ ∈ [0, 1). En particular, bajo los supuestos de la Sección 4.2, ψ = ψ¯ y la condición es equivalente a que una fracción fija de conglomerados tenga más de una observación.


Este documento está disponible en arxiv bajo licencia CC 1.0.