356 讀數

平衡网络实验中的偏差和方差：什么时候应该聚类？

经过 EScholar: Electronic Academic Papers for Scholars3 分钟 read2024/01/30

太長; 讀書

深入研究在实验中选择集群设计和伯努利设计的决策过程。本文彻底探讨了最坏情况的偏差和方差，为集群设计的最佳使用提供了宝贵的见解。揭示集群设计优于伯努利设计的场景，并获得对实验偏差考虑的实际影响。发现做出明智决策的经验法则，尤其是在存在相同大小的簇的情况下，确保您的实验设计与您的研究目标保持一致。

featured image - 平衡网络实验中的偏差和方差：什么时候应该聚类？

作者：

(1) Davide Viviano，哈佛大学经济系；

(2) 雷丽华，斯坦福大学商学院；

(3) Guido Imbens，斯坦福大学商学院和经济系；

(4) Brian Karrer，FAIR，Meta；

(5) Okke Schrijvers，Meta Central 应用科学；

(6) 石梁，Meta Central 应用科学。

链接表

3（何时）应该集群？

3.1 最坏情况偏差

3.2 最坏情况方差

引理 3.2 指出，如果两个个体 (i) 位于两个不同的簇中，使得两个簇都不包含另一个个体的朋友，并且 (ii) 不是朋友或有一个共同的朋友，则两个实现的结果具有零协方差（ set)，并且如果在包含 i 的友元的簇中没有 j 的友元（集合 Gi）。请注意，引理 3.2 相当于说，如果 Bi ∩ Bj = ∅，则 µi(Di , D−i)[2Di − 1], µj (Dj , D−j )[2Dj − 1] 协方差为零。接下来，我们分析其余单位的协方差。

备注 5 （未观察到的 A）。假设 A 未被观察到或部分观察到，并且研究人员对 A 有先验。在这种情况下，一旦我们对 A 的分布做出期望，偏差和方差的表征就会继续成立，其中 A 的先验可能取决于部分网络信息[例如 Breza 等人，2020]。

3.3 与伯努利设计的比较

现在簇的数量是n 阶（例如，每个簇包含几个个体）。那么集群设计就是最优的。

表 1：定理 3.5 的实际含义。根据经验法则计算 λ = 1，存在大小相等的聚类，其结果取值在 0 到 1 之间，并且聚类的偏差等于（或小于）50%（即，对于每个个体，聚类的偏差为 50%）。她的连接在同一个集群中）。这里，当结果是二元时，ψ¯ ≤ 4。

对于 λ = 1（已知 ψ¯），经验法则提供了最小的溢出效应，这将保证集群设计主导伯努利设计。

表 1 中的最后一列收集了经验法则的含义，假设 (i) 聚类大小相同，(ii) 聚类偏差作为保守上限最多为 50%，并且 (iii) 结果介于零和一（在这种情况下 ψ ≤ 4）。在这种情况下，当 ψ¯ = 4 时，当 ψ¯ n √ Kn 大于 2.3 时，研究人员应该进行聚类实验。图 2 说明了作为偏差和聚类函数的经验法则。

[10] 对于某些 δ ′ ∈ [0, 1)，条件 Kn/n = o(1) 可以通过有限样本条件 Kn ≤ nδ′ (ψ/ψ¯) 来放宽。特别是，在第 4.2 节的假设下，ψ = ψ¯ 并且该条件相当于固定部分的簇具有多个观测值。

本文可在 arxiv 上使用 CC 1.0 许可证获取。

L O A D I N G
. . . comments & more!

About Author

EScholar: Electronic Academic Papers for Scholars@escholar

We publish the best academic work (that's too often lost to peer reviews & the TA's desk) to the global tech community

Read my stories

这篇文章刊登在...

Terminal

Lite

Join HackerNoon

Latest technology trends. Customized Experience. Curated Stories. Publish Your Ideas

平衡网络实验中的偏差和方差：什么时候应该聚类？

EScholar: Electronic Academic Papers for Scholars

@escholar

太長; 讀書

EScholar: Electronic Academic Papers for Scholars

链接表

3（何时）应该集群？

3.1 最坏情况偏差

3.2 最坏情况方差

3.3 与伯努利设计的比较

About Author

標籤

这篇文章刊登在...

相關故事