Auteurs:
(1) Davide Viviano, Département d'économie, Université Harvard ;
(2) Lihua Lei, École supérieure de commerce, Université de Stanford ;
(3) Guido Imbens, Graduate School of Business et Département d'économie, Université de Stanford ;
(4) Brian Karrer, FAIR, Meta ;
(5) Okke Schrijvers, Meta Central Applied Science ;
(6) Liang Shi, Sciences appliquées Meta Central.
(Quand) devriez-vous vous regrouper ?
Choisir la conception du cluster
Illustration empirique et études numériques
Recommandations pour la pratique
Le lemme 3.2 stipule que deux résultats réalisés ont une covariance nulle si deux individus (i) sont dans deux clusters différents, de telle sorte qu'aucun des deux clusters ne contient d'ami de l'autre individu, et (ii) ne sont pas amis ou ne partagent pas un ami commun ( set), et s'il n'y a pas d'ami de j dans un cluster qui contient un ami de i (set Gi). Notons que le lemme 3.2 équivaut à dire que µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] ont une covariance nulle si Bi ∩ Bj = ∅. Ensuite, nous analysons les covariances pour les unités restantes.
Remarque 5 (Inobservé A). Supposons que A ne soit pas observé ou partiellement observé et que les chercheurs aient un a priori sur A. Dans ce cas, la caractérisation du biais et de la variance continue de s'appliquer une fois que nous prenons en compte les attentes concernant la distribution de A, où l'a priori sur A peut dépendre sur les informations partielles du réseau [par exemple Breza et al., 2020].
maintenant, le nombre de grappes est d'ordre n (par exemple, les grappes contiennent chacune quelques individus). La conception du cluster est alors optimale.
Tableau 1 : Implications pratiques du théorème 3.5. La règle empirique est calculée pour λ = 1, en présence de clusters de taille égale avec des résultats prenant des valeurs comprises entre zéro et un, et le biais du clustering étant égal (ou inférieur à) 50 % (c'est-à-dire, pour chaque individu, 50 % de ses connexions sont dans son même cluster). Ici ψ¯ ≤ 4 lorsque les résultats sont binaires.
Pour λ = 1, connu ψ¯, la règle empirique fournit les plus petits effets de débordement qui garantiraient que la conception en cluster domine la conception de Bernoulli.
La dernière colonne du tableau 1 rassemble les implications de la règle empirique, en supposant (i) des clusters de taille égale, (ii) le biais du regroupement est d'au plus 50 % en tant que limite supérieure conservatrice, et (iii) les résultats sont limités entre zéro et un (auquel cas ψ¯ ≤ 4). Dans ce contexte, les chercheurs doivent mener une expérience de cluster lorsque ϕ¯ n √ Kn est supérieur à 2,3 lorsque ψ¯ = 4. La figure 2 illustre la règle empirique en fonction du biais et des clusters.
[10] La condition Kn/n = o(1), peut être assouplie par une condition d'échantillon fini Kn ≤ nδ′ (ψ/ψ¯) pour certains δ ′ ∈ [0, 1). En particulier, sous les hypothèses de la section 4.2, ψ = ψ¯ et la condition est équivalente à ce qu'une fraction fixe de clusters ait plus d'une observation.
Cet article est disponible sur arxiv sous licence CC 1.0.