paint-brush
Equilibrio de sesgo y varianza en experimentos de red: ¿cuándo debería agruparse?por@escholar
356 lecturas
356 lecturas

Equilibrio de sesgo y varianza en experimentos de red: ¿cuándo debería agruparse?

por EScholar: Electronic Academic Papers for Scholars
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

EScholar: Electronic Academic Papers for Scholars

@escholar

We publish the best academic work (that's too often lost...

3 min read2024/01/30
Read on Terminal Reader
Read this story in a terminal
Print this story

Demasiado Largo; Para Leer

Profundice en el proceso de toma de decisiones al elegir entre diseños de clúster y Bernoulli en experimentos. Este artículo explora a fondo el sesgo y la varianza del peor de los casos, ofreciendo información valiosa sobre el uso óptimo de los diseños de conglomerados. Descubra escenarios en los que los diseños de conglomerados superan a los diseños de Bernoulli y obtenga implicaciones prácticas para las consideraciones de sesgo experimental. Descubra una regla general para tomar decisiones informadas, especialmente en presencia de grupos del mismo tamaño, garantizando que su diseño experimental se alinee con sus objetivos de investigación.
featured image - Equilibrio de sesgo y varianza en experimentos de red: ¿cuándo debería agruparse?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture
EScholar: Electronic Academic Papers for Scholars

EScholar: Electronic Academic Papers for Scholars

@escholar

We publish the best academic work (that's too often lost to peer reviews & the TA's desk) to the global tech community

Autores:

(1) Davide Viviano, Departamento de Economía, Universidad de Harvard;

(2) Lihua Lei, Escuela de Graduados en Negocios, Universidad de Stanford;

(3) Guido Imbens, Escuela de Graduados en Negocios y Departamento de Economía, Universidad de Stanford;

(4) Brian Karrer, FAIR, Meta;

(5) Okke Schrijvers, Ciencias Aplicadas de Meta Central;

(6) Liang Shi, Ciencias Aplicadas de Meta Central.

Tabla de enlaces

Resumen e introducción

Configuración

(¿Cuándo) deberías agruparte?

Elegir el diseño del cluster

Ilustración empírica y estudios numéricos.

Recomendaciones para la práctica

Referencias

A) Notación

B) Efectos endógenos entre pares

C) Pruebas

3 (¿Cuándo) deberías agruparte?

image


3.1 Sesgo del peor de los casos

image

image


3.2 Variación en el peor de los casos
image

El lema 3.2 establece que dos resultados obtenidos tienen covarianza cero si dos individuos (i) están en dos grupos diferentes, de modo que ninguno de los dos grupos contiene un amigo del otro individuo, y (ii) no son amigos ni comparten un amigo común ( set), y si no hay ningún amigo de j en un cluster que contiene un amigo de i (set Gi). Tenga en cuenta que el Lema 3.2 equivale a decir que µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] tienen covarianza cero si Bi ∩ Bj = ∅. A continuación, analizamos las covarianzas para las unidades restantes.


image

image

Observación 5 (No observado A). Supongamos que A no se observa o se observa parcialmente, y que los investigadores tienen una prioridad sobre A. En este caso, la caracterización del sesgo y la varianza continúa manteniéndose una vez que tomamos las expectativas con respecto a la distribución de A, donde la prioridad sobre A puede depender sobre información parcial de la red [por ejemplo, Breza et al., 2020].

3.3 Comparación con un diseño de Bernoulli

image

image


ahora el número de conglomerados es de orden n (por ejemplo, los conglomerados contienen pocos individuos cada uno). Entonces el diseño del cluster es óptimo.


Tabla 1: Implicaciones prácticas del Teorema 3.5. La regla general se calcula para λ = 1, en presencia de conglomerados de igual tamaño con resultados que toman valores entre cero y uno, y el sesgo del agrupamiento es igual (o menor que) 50% (es decir, para cada individuo, el 50% de sus conexiones están en su mismo grupo). Aquí ψ¯ ≤ 4 cuando los resultados son binarios.


image


Para λ = 1, conocido como ψ¯, la regla general proporciona los efectos de desbordamiento más pequeños que garantizarían que el diseño de conglomerados domine al diseño de Bernoulli.


La última columna de la Tabla 1 recoge las implicaciones de la regla general, asumiendo (i) grupos de igual tamaño, (ii) el sesgo de la agrupación es como máximo del 50% como límite superior conservador, y (iii) los resultados están acotados entre cero y uno (en cuyo caso ψ¯ ≤ 4). En este contexto, los investigadores deberían realizar un experimento de conglomerados cuando ϕ¯ n √ Kn es mayor que 2,3 cuando ψ¯ = 4. La Figura 2 ilustra la regla general en función del sesgo y los conglomerados.


image




[10] La condición Kn/n = o(1), puede relajarse mediante una condición de muestra finita Kn ≤ nδ′ (ψ/ψ¯) para algunos δ ′ ∈ [0, 1). En particular, bajo los supuestos de la Sección 4.2, ψ = ψ¯ y la condición es equivalente a que una fracción fija de conglomerados tenga más de una observación.


Este documento está disponible en arxiv bajo licencia CC 1.0.




L O A D I N G
. . . comments & more!

About Author

EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture
EScholar: Electronic Academic Papers for Scholars@escholar
We publish the best academic work (that's too often lost to peer reviews & the TA's desk) to the global tech community

ETIQUETAS

ESTE ARTÍCULO FUE PRESENTADO EN...

Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite
X REMOVE AD