paint-brush
平衡网络实验中的偏差和方差:什么时候应该聚类?经过@escholar
343 讀數
343 讀數

平衡网络实验中的偏差和方差:什么时候应该聚类?

太長; 讀書

深入研究在实验中选择集群设计和伯努利设计的决策过程。本文彻底探讨了最坏情况的偏差和方差,为集群设计的最佳使用提供了宝贵的见解。揭示集群设计优于伯努利设计的场景,并获得对实验偏差考虑的实际影响。发现做出明智决策的经验法则,尤其是在存在相同大小的簇的情况下,确保您的实验设计与您的研究目标保持一致。
featured image - 平衡网络实验中的偏差和方差:什么时候应该聚类?
EScholar: Electronic Academic Papers for Scholars HackerNoon profile picture

作者:

(1) Davide Viviano,哈佛大学经济系;

(2) 雷丽华,斯坦福大学商学院;

(3) Guido Imbens,斯坦福大学商学院和经济系;

(4) Brian Karrer,FAIR,Meta;

(5) Okke Schrijvers,Meta Central 应用科学;

(6) 石梁,Meta Central 应用科学。

链接表

摘要与简介

设置

(什么时候)你应该集群?

选择集群设计

实证说明和数值研究

实践建议

参考

A) 符号

B) 内生同伴效应

C) 证明

3(何时)应该集群?


3.1 最坏情况偏差


3.2 最坏情况方差

引理 3.2 指出,如果两个个体 (i) 位于两个不同的簇中,使得两个簇都不包含另一个个体的朋友,并且 (ii) 不是朋友或有一个共同的朋友,则两个实现的结果具有零协方差( set),并且如果在包含 i 的友元的簇中没有 j 的友元(集合 Gi)。请注意,引理 3.2 相当于说,如果 Bi ∩ Bj = ∅,则 µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] 协方差为零。接下来,我们分析其余单位的协方差。


备注 5 (未观察到的 A)。假设 A 未被观察到或部分观察到,并且研究人员对 A 有先验。在这种情况下,一旦我们对 A 的分布做出期望,偏差和方差的表征就会继续成立,其中 A 的先验可能取决于部分网络信息[例如 Breza 等人,2020]。

3.3 与伯努利设计的比较


现在簇的数量是n 阶(例如,每个簇包含几个个体)。那么集群设计就是最优的。


表 1:定理 3.5 的实际含义。根据经验法则计算 λ = 1,存在大小相等的聚类,其结果取值在 0 到 1 之间,并且聚类的偏差等于(或小于)50%(即,对于每个个体,聚类的偏差为 50%)。她的连接在同一个集群中)。这里,当结果是二元时,ψ¯ ≤ 4。



对于 λ = 1(已知 ψ¯),经验法则提供了最小的溢出效应,这将保证集群设计主导伯努利设计。


表 1 中的最后一列收集了经验法则的含义,假设 (i) 聚类大小相同,(ii) 聚类偏差作为保守上限最多为 50%,并且 (iii) 结果介于零和一(在这种情况下 ψ ≤ 4)。在这种情况下,当 ψ¯ = 4 时,当 ψ¯ n √ Kn 大于 2.3 时,研究人员应该进行聚类实验。图 2 说明了作为偏差和聚类函数的经验法则。





[10] 对于某些 δ ′ ∈ [0, 1),条件 Kn/n = o(1) 可以通过有限样本条件 Kn ≤ nδ′ (ψ/ψ¯) 来放宽。特别是,在第 4.2 节的假设下,ψ = ψ¯ 并且该条件相当于固定部分的簇具有多个观测值。