Écarts carrés par rapport à la moyenne - Squared deviations from the mean

Les écarts au carré de la moyenne (SDM) sont impliqués dans divers calculs. Dans la théorie des probabilités et les statistiques , la définition de la variance est soit la valeur attendue de la MJS (lorsqu'on considère une distribution théorique ), soit sa valeur moyenne (pour les données expérimentales réelles). Les calculs pour l' analyse de la variance impliquent le partitionnement d'une somme de SDM.

introduction

Une compréhension des calculs impliqués est grandement améliorée par une étude de la valeur statistique

, où est l'opérateur de valeur attendue.

Pour une variable aléatoire avec moyenne et variance ,

Par conséquent,

À partir de ce qui précède, les éléments suivants peuvent être déduits:

Échantillon de variance

La somme des carrés des écarts nécessaires pour calculer la variance de l'échantillon (avant de décider de diviser par n ou n  - 1) est le plus facilement calculée comme suit:

Des deux attentes dérivées au-dessus de la valeur attendue de cette somme est

ce qui implique

Cela prouve effectivement l'utilisation du diviseur n  - 1 dans le calcul d'une estimation par échantillon sans biais de  σ 2 .

Partition - analyse de la variance

Dans le cas où des données sont disponibles pour k groupes de traitement différents de taille n i i varie de 1 à k , on suppose que la moyenne attendue de chaque groupe est

et la variance de chaque groupe de traitement est inchangée par rapport à la variance de la population .

Sous l'hypothèse nulle que les traitements n'ont aucun effet, alors chacun des sera nul.

Il est maintenant possible de calculer trois sommes de carrés:

Individuel
Traitements

Sous l'hypothèse nulle que les traitements ne provoquent aucune différence et que tous sont nuls, l'espérance se simplifie à

Combinaison

Sommes des écarts au carré

Sous l'hypothèse nulle, la différence de toute paire de I , T et C ne contient aucune dépendance sur , seulement .

écarts totaux au carré, c'est-à-dire somme totale des carrés
les écarts de traitement au carré, c'est-à-dire la somme des carrés expliquée
écarts carrés résiduels aka somme résiduelle des carrés

Les constantes ( n  - 1), ( k  - 1) et ( n  -  k ) sont normalement appelées le nombre de degrés de liberté .

Exemple

Dans un exemple très simple, 5 observations découlent de deux traitements. Le premier traitement donne trois valeurs 1, 2 et 3, et le second traitement donne deux valeurs 4 et 6.

Donnant

Écarts carrés totaux = 66 - 51,2 = 14,8 avec 4 degrés de liberté.
Traitement au carré des écarts = 62 - 51,2 = 10,8 avec 1 degré de liberté.
Écarts carrés résiduels = 66 - 62 = 4 avec 3 degrés de liberté.

Analyse bidirectionnelle de la variance

L'exemple hypothétique suivant donne les rendements de 15 plantes soumises à deux variations environnementales différentes et à trois engrais différents.

CO 2 supplémentaire Humidité supplémentaire
Pas d'engrais 7, 2, 1 7, 6
Nitrate 11, 6 10, 7, 3
Phosphate 5, 3, 4 11, 4

Cinq sommes de carrés sont calculées:

Facteur Calcul Somme
Individuel 641 15
Engrais × Environnement 556,1667 6
Engrais 525,4 3
Environnement 519,2679 2
Composite 504,6 1

Enfin, les sommes des écarts au carré nécessaires à l' analyse de la variance peuvent être calculées.

Facteur Somme Le total Environnement Engrais Engrais × Environnement Résiduel
Individuel 641 15 1 1
Engrais × Environnement 556,1667 6 1 −1
Engrais 525,4 3 1 −1
Environnement 519,2679 2 1 −1
Composite 504,6 1 −1 −1 −1 1
Écarts carrés 136,4 14,668 20,8 16 099 84 833
Degrés de liberté 14 1 2 2 9

Voir également

Les références

  1. ^ Mood & Graybill: Une introduction à la théorie des statistiques (McGraw Hill)