paint-brush
Equilibrando preconceito e variação em experimentos de rede: quando você deve agrupar?por@escholar
343 leituras
343 leituras

Equilibrando preconceito e variação em experimentos de rede: quando você deve agrupar?

Muito longo; Para ler

Aprofunde-se no processo de tomada de decisão de escolha entre designs de cluster e Bernoulli em experimentos. Este artigo explora minuciosamente o viés e a variância do pior caso, oferecendo insights valiosos sobre o uso ideal de designs de cluster. Descubra cenários onde os projetos de cluster superam os projetos de Bernoulli e obtenha implicações práticas para considerações de viés experimental. Descubra uma regra prática para tomar decisões informadas, especialmente na presença de clusters de tamanhos iguais, garantindo que seu projeto experimental esteja alinhado com seus objetivos de pesquisa.
featured image - Equilibrando preconceito e variação em experimentos de rede: quando você deve agrupar?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

Autores:

(1) Davide Viviano, Departamento de Economia, Universidade de Harvard;

(2) Lihua Lei, Escola de Pós-Graduação em Administração, Universidade de Stanford;

(3) Guido Imbens, Escola de Pós-Graduação em Administração e Departamento de Economia, Universidade de Stanford;

(4) Brian Karrer, FAIR, Meta;

(5) Okke Schrijvers, Meta Central de Ciência Aplicada;

(6) Liang Shi, Ciência Aplicada Meta Central.

Tabela de Links

Resumo e introdução

Configurar

(Quando) você deve agrupar?

Escolhendo o design do cluster

Ilustração empírica e estudos numéricos

Recomendações para prática

Referências

A) Notação

B) Efeitos endógenos de pares

C) Provas

3 (Quando) você deve agrupar?


3.1 Viés de pior caso


3.2 Variância do pior caso

O Lema 3.2 afirma que dois resultados realizados têm covariância zero se dois indivíduos (i) estiverem em dois clusters diferentes, de modo que nenhum dos dois clusters contenha um amigo do outro indivíduo, e (ii) não sejam amigos ou compartilhem um amigo comum ( conjunto), e se não houver nenhum amigo de j em um cluster que contém um amigo de i (conjunto Gi). Observe que o Lema 3.2 equivale a dizer que µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] têm covariância zero se Bi ∩ Bj = ∅. A seguir, analisamos as covariâncias para as unidades restantes.


Observação 5 (A não observado). Suponha que A não seja observado ou seja parcialmente observado, e os pesquisadores tenham um anterior sobre A. Nesse caso, a caracterização do viés e da variância continua a ser válida, uma vez que tomamos expectativas em relação à distribuição de A, onde o anterior sobre A pode depender em informações parciais da rede [por exemplo, Breza et al., 2020].

3.3 Comparação com um projeto de Bernoulli


agora o número de clusters é de ordem n (por exemplo, clusters contêm poucos indivíduos cada). Então o design do cluster é ideal.


Tabela 1: Implicações práticas do Teorema 3.5. A regra prática é calculada para λ = 1, na presença de clusters de tamanhos iguais com resultados assumindo valores entre zero e um, e o viés do agrupamento igual (ou menor que) 50% (ou seja, para cada indivíduo, 50% de suas conexões estão no mesmo cluster). Aqui ψ¯ ≤ 4 quando os resultados são binários.



Para λ = 1, ψ¯ conhecido, a regra prática fornece os menores efeitos de transbordamento que garantiriam que o design do cluster dominasse o design de Bernoulli.


A última coluna da Tabela 1 coleta as implicações da regra prática, assumindo (i) clusters de tamanhos iguais, (ii) o viés do agrupamento é de no máximo 50% como um limite superior conservador e (iii) os resultados são limitados entre zero e um (nesse caso ψ¯ ≤ 4). Neste cenário, os pesquisadores devem realizar um experimento de agrupamento quando ϕ¯ n √ Kn for maior que 2,3 quando ψ¯ = 4. A Figura 2 ilustra a regra prática em função do viés e dos agrupamentos.





[10] A condição Kn/n = o(1), pode ser relaxada por uma condição de amostra finita Kn ≤ nδ′ (ψ/ψ¯) para algum δ ′ ∈ [0, 1). Em particular, sob as suposições da Seção 4.2, ψ = ψ¯ e a condição é equivalente a que uma fração fixa de clusters tenha mais de uma observação.


Este artigo está disponível no arxiv sob licença CC 1.0.