paint-brush
네트워크 실험의 편향과 분산 균형: 언제 클러스터링해야 합니까?~에 의해@escholar
343 판독값
343 판독값

네트워크 실험의 편향과 분산 균형: 언제 클러스터링해야 합니까?

너무 오래; 읽다

실험에서 클러스터 설계와 베르누이 설계 중 하나를 선택하는 의사 결정 과정을 살펴보세요. 이 문서에서는 최악의 편향과 분산을 철저하게 조사하여 클러스터 설계의 최적 사용에 대한 귀중한 통찰력을 제공합니다. 클러스터 설계가 Bernoulli 설계보다 성능이 뛰어난 시나리오를 발견하고 실험적 편향 고려 사항에 대한 실질적인 의미를 얻습니다. 특히 동일한 크기의 클러스터가 있는 경우 정보에 입각한 결정을 내리기 위한 경험 법칙을 발견하여 실험 설계가 연구 목표에 부합하도록 하세요.
featured image - 네트워크 실험의 편향과 분산 균형: 언제 클러스터링해야 합니까?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

저자:

(1) Davide Viviano, 하버드 대학교 경제학과;

(2) 스탠포드 대학교 경영 대학원 Lihua Lei;

(3) Guido Imbens, 스탠포드 대학교 경영 대학원 및 경제학과;

(4) 브라이언 카러(Brian Karrer), FAIR, Meta;

(5) Okke Schrijvers, Meta Central 응용과학;

(6) Liang Shi, Meta Central 응용과학.

링크 표

개요 및 소개

설정

(언제) 클러스터링을 해야 할까요?

클러스터 디자인 선택

경험적 설명 및 수치 연구

연습을 위한 권장 사항

참고자료

가) 표기법

B) 내생적 동료 효과

다) 증명

3 (언제) 클러스터링을 해야 할까요?


3.1 최악의 편향


3.2 최악의 경우의 분산

Lemma 3.2에서는 두 개인이 (i) 두 개의 서로 다른 클러스터에 있고 두 클러스터 중 어느 것도 다른 개인의 친구를 포함하지 않고 (ii) 친구가 아니거나 공통 친구를 공유하는 경우 두 개의 실현된 결과는 공분산이 0이라고 명시합니다( set), i의 친구가 포함된 클러스터에 j의 친구가 없는 경우(set Gi). Lemma 3.2는 Bi ∩ Bj = ∅인 경우 µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1]의 공분산이 0이라고 말하는 것과 동일합니다. 다음으로 나머지 단위에 대한 공분산을 분석합니다.


비고 5 (관찰되지 않은 A). A가 관찰되지 않거나 부분적으로 관찰되고 연구자가 A에 대한 사전 예측을 갖고 있다고 가정합니다. 이 경우 A에 대한 사전 예측이 의존할 수 있는 A의 분포에 대한 기대치를 취하면 편향과 분산의 특성이 계속 유지됩니다. 부분적인 네트워크 정보에 대해 [예: Breza et al., 2020].

3.3 베르누이 설계와의 비교


이제 클러스터 수는 n차입니다(예: 클러스터에는 각각 소수의 개체가 포함됨). 그러면 클러스터 디자인이 최적입니다.


표 1: 정리 3.5의 실제적 의미. 경험 법칙은 결과가 0과 1 사이의 값을 취하고 클러스터링 편향이 50%(즉, 각 개인에 대해 그녀의 연결은 동일한 클러스터에 있습니다). 여기서 결과가 이진수인 경우 ψ̅ ≤ 4입니다.



ψ̅로 알려진 λ = 1의 경우 경험 법칙은 군집 설계가 베르누이 설계를 지배하도록 보장하는 가장 작은 파급 효과를 제공합니다.


표 1의 마지막 열은 (i) 동일한 크기의 클러스터, (ii) 클러스터링의 편향이 보수적 상한으로 최대 50%이고, (iii) 결과가 두 클러스터 사이에 국한된다는 가정하에 경험 법칙의 의미를 수집합니다. 0과 1(이 경우 ψ̅ ≤ 4). 이 설정에서 연구자는 ψ̅ = 4일 때 ψ̅ n √ Kn이 2.3보다 클 때 클러스터 실험을 실행해야 합니다. 그림 2는 편향과 클러스터의 함수로 경험 법칙을 보여줍니다.





[10] 조건 Kn/n = o(1)은 일부 δ ′ ∈ [0, 1)에 대해 유한 표본 조건 Kn ≤ nδ′ (ψ/ψ̅)에 의해 완화될 수 있습니다. 특히, 4.2절의 가정 하에서 ψ = ψ̅이고 조건은 클러스터의 고정된 부분이 둘 이상의 관측값을 갖는다는 것과 동일합니다.


이 문서는 CC 1.0 라이선스에 따라 arxiv에서 볼 수 있습니다 .