paint-brush
ネットワーク実験におけるバイアスと分散のバランスをとる: いつクラスター化すべきか?@escholar
336 測定値
336 測定値

ネットワーク実験におけるバイアスと分散のバランスをとる: いつクラスター化すべきか?

長すぎる; 読むには

実験でクラスター計画とベルヌーイ計画のどちらを選択するかの意思決定プロセスを詳しく調べます。このペーパーでは、最悪の場合のバイアスと分散を徹底的に調査し、クラスター設計の最適な使用に関する貴重な洞察を提供します。クラスター設計がベルヌーイ設計よりも優れたパフォーマンスを発揮するシナリオを明らかにし、実験バイアスの考慮事項に対する実用的な意味を獲得します。特に同じサイズのクラスターが存在する場合に、情報に基づいた意思決定を行うための経験則を発見し、実験計画が研究目標と一致していることを確認します。
featured image - ネットワーク実験におけるバイアスと分散のバランスをとる: いつクラスター化すべきか?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

著者:

(1) Davide Viviano、ハーバード大学経済学部。

(2) スタンフォード大学経営大学院、Lihua Lei氏。

(3) グイド・インベンス、スタンフォード大学経営大学院および経済学部。

(4) ブライアン・カーラー、FAIR、メタ。

(5) Okke Schrijvers、メタ セントラル アプライド サイエンス。

(6) Liang Shi、メタセントラル応用科学。

リンク表

要約と紹介

設定

(いつ) クラスター化する必要がありますか?

クラスター設計の選択

実証例と数値研究

練習のための推奨事項

参考文献

A) 表記法

B) 内生ピア効果

C) 証拠

3 (いつ) クラスター化する必要がありますか?


3.1 最悪の場合のバイアス


3.2 最悪の場合の分散

補助定理 3.2 は、2 人の個人が (i) 2 つの異なるクラスターに属し、2 つのクラスターのいずれにももう一方の個人の友人が含まれておらず、(ii) 友人ではない、または共通の友人を共有している場合、2 つの実現された結果の共分散はゼロであると述べています ( set)、i の友人を含むクラスター内に j の友人が存在しない場合 (set Gi)。補題 3.2 は、Bi ∩ Bj = ∅ の場合、μi(Di , D−i)[2Di − 1], μj (Dj , D−j )[2Dj − 1] の共分散がゼロであると言うのと同じであることに注意してください。次に、残りのユニットの共分散を分析します。


備考 5 (未観察 A)。 A が観測されていないか部分的に観測されており、研究者が A に対する事前分布を持っていると仮定します。この場合、A の分布に関する期待値を取得すると、バイアスと分散の特徴付けは維持され続けます。A に対する事前分布は依存する可能性があります。部分的なネットワーク情報について [例: Breza et al., 2020]。

3.3 ベルヌーイ計画との比較


ここで、クラスターの数は n 個になります (たとえば、クラスターにはそれぞれ少数の個体が含まれます)。この場合、クラスター設計は最適になります。


表 1: 定理 3.5 の実際的な意味。経験則は、結果が 0 から 1 の間の値をとる等しいサイズのクラスターが存在し、クラスター化のバイアスが 50% に等しい (またはそれ以下) (つまり、各個人について、彼女の接続は同じクラスタ内にあります)。ここで、結果が 2 値の場合、ψ ̄ ≤ 4 となります。



既知の ψ ̄ である λ = 1 の場合、経験則により、クラスター設計がベルヌーイ設計を支配することを保証する最小の波及効果が得られます。


表 1 の最後の列は、(i) クラスターのサイズが等しい、(ii) クラスター化の偏りが保守的な上限として最大 50% である、および (iii) 結果が以下の範囲内であると仮定した経験則の意味をまとめています。 0 と 1 (この場合、ψ ̄ ≤ 4)。この設定では、研究者は、ψ ̄ = 4 で ϕ ̄ n √ Kn が 2.3 より大きい場合にクラスター実験を実行する必要があります。図 2 は、経験則をバイアスとクラスターの関数として示しています。





[10] 条件 Kn/n = o(1) は、ある δ ' ∈ [0, 1) について有限サンプル条件 Kn ≤ nδ' (ψ/ψ ̄) によって緩和できます。特に、セクション 4.2 の仮定の下では、ψ = ψ ̄ であり、この条件は、クラスターの固定部分が複数の観測値を持つことと等価です。


この論文は、CC 1.0 ライセンスに基づいてarxiv で入手できます