paint-brush
Équilibrer les biais et la variance dans les expériences de réseau : quand devriez-vous regrouper ?par@escholar
308 lectures
308 lectures

Équilibrer les biais et la variance dans les expériences de réseau : quand devriez-vous regrouper ?

Trop long; Pour lire

Plongez dans le processus de prise de décision consistant à choisir entre les conceptions de cluster et de Bernoulli dans les expériences. Cet article explore en profondeur les biais et la variance des pires cas, offrant des informations précieuses sur l'utilisation optimale des conceptions de clusters. Découvrez des scénarios dans lesquels les conceptions de clusters surpassent les conceptions de Bernoulli et obtenez des implications pratiques pour les considérations de biais expérimentaux. Découvrez une règle empirique pour prendre des décisions éclairées, en particulier en présence de clusters de taille égale, en vous assurant que votre conception expérimentale s'aligne sur vos objectifs de recherche.
featured image - Équilibrer les biais et la variance dans les expériences de réseau : quand devriez-vous regrouper ?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

Auteurs:

(1) Davide Viviano, Département d'économie, Université Harvard ;

(2) Lihua Lei, École supérieure de commerce, Université de Stanford ;

(3) Guido Imbens, Graduate School of Business et Département d'économie, Université de Stanford ;

(4) Brian Karrer, FAIR, Meta ;

(5) Okke Schrijvers, Meta Central Applied Science ;

(6) Liang Shi, Sciences appliquées Meta Central.

Tableau des liens

Résumé et introduction

Installation

(Quand) devriez-vous vous regrouper ?

Choisir la conception du cluster

Illustration empirique et études numériques

Recommandations pour la pratique

Les références

A) Notations

B) Effets endogènes des pairs

C) Preuves

3 (Quand) devriez-vous regrouper ?


3.1 Biais du pire des cas


3.2 Écart dans le pire des cas

Le lemme 3.2 stipule que deux résultats réalisés ont une covariance nulle si deux individus (i) sont dans deux clusters différents, de telle sorte qu'aucun des deux clusters ne contient d'ami de l'autre individu, et (ii) ne sont pas amis ou ne partagent pas un ami commun ( set), et s'il n'y a pas d'ami de j dans un cluster qui contient un ami de i (set Gi). Notons que le lemme 3.2 équivaut à dire que µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] ont une covariance nulle si Bi ∩ Bj = ∅. Ensuite, nous analysons les covariances pour les unités restantes.


Remarque 5 (Inobservé A). Supposons que A ne soit pas observé ou partiellement observé et que les chercheurs aient un a priori sur A. Dans ce cas, la caractérisation du biais et de la variance continue de s'appliquer une fois que nous prenons en compte les attentes concernant la distribution de A, où l'a priori sur A peut dépendre sur les informations partielles du réseau [par exemple Breza et al., 2020].

3.3 Comparaison avec un plan de Bernoulli


maintenant, le nombre de grappes est d'ordre n (par exemple, les grappes contiennent chacune quelques individus). La conception du cluster est alors optimale.


Tableau 1 : Implications pratiques du théorème 3.5. La règle empirique est calculée pour λ = 1, en présence de clusters de taille égale avec des résultats prenant des valeurs comprises entre zéro et un, et le biais du clustering étant égal (ou inférieur à) 50 % (c'est-à-dire, pour chaque individu, 50 % de ses connexions sont dans son même cluster). Ici ψ¯ ≤ 4 lorsque les résultats sont binaires.



Pour λ = 1, connu ψ¯, la règle empirique fournit les plus petits effets de débordement qui garantiraient que la conception en cluster domine la conception de Bernoulli.


La dernière colonne du tableau 1 rassemble les implications de la règle empirique, en supposant (i) des clusters de taille égale, (ii) le biais du regroupement est d'au plus 50 % en tant que limite supérieure conservatrice, et (iii) les résultats sont limités entre zéro et un (auquel cas ψ¯ ≤ 4). Dans ce contexte, les chercheurs doivent mener une expérience de cluster lorsque ϕ¯ n √ Kn est supérieur à 2,3 lorsque ψ¯ = 4. La figure 2 illustre la règle empirique en fonction du biais et des clusters.





[10] La condition Kn/n = o(1), peut être assouplie par une condition d'échantillon fini Kn ≤ nδ′ (ψ/ψ¯) pour certains δ ′ ∈ [0, 1). En particulier, sous les hypothèses de la section 4.2, ψ = ψ¯ et la condition est équivalente à ce qu'une fraction fixe de clusters ait plus d'une observation.


Cet article est disponible sur arxiv sous licence CC 1.0.