Science des données : le théorème central limite expliqué
Trop long; Pour lire
Le théorème central limite capture le phénomène suivant :
Prenez n'importe quelle distribution ! (disons une répartition du nombre de passes dans un match de football)
Commencez à prélever n échantillons de cette distribution (disons n = 5) plusieurs fois [disons m = 1 000] fois.
Prenez la moyenne de chaque ensemble d'échantillons (nous aurions donc m = 1000 moyennes)
La répartition des moyens serait (plus ou moins) normalement répartie. (Vous obtiendrez cette fameuse courbe en cloche si vous tracez les moyennes sur l'axe des x et leur fréquence sur l'axe des y.)
Augmentez n pour obtenir un écart type plus petit et augmentez m pour obtenir une meilleure approximation de la distribution normale.