データ サイエンス: 中心極限定理の説明
長すぎる; 読むには
中心極限定理は次の現象を捉えています。
あらゆるディストリビューションを受け取りましょう! (サッカーの試合におけるパス数の分布を例に挙げます)
その分布 (n = 5 など) から n 個のサンプルを複数回 (m = 1000 など) 取得し始めます。
各サンプルセットの平均値を取得します (つまり、m = 1000 の平均値になります)。
平均値の分布は (多かれ少なかれ) 正規分布になります。 (平均を X 軸に、その頻度を Y 軸にプロットすると、あの有名な釣鐘曲線が得られます。)
標準偏差を小さくするには n を大きくし、正規分布によりよく近似するには m を大きくします。