ANOVA sur les rangs - ANOVA on ranks

En statistique , un des objectifs de l' analyse de variance (ANOVA) est d'analyser les différences de moyennes entre les groupes. La statistique de test, F , suppose l' indépendance des observations, des variances homogènes et la normalité de la population . L'ANOVA sur les rangs est une statistique conçue pour les situations où l'hypothèse de normalité a été violée.

Logique du test F sur les moyennes

La statistique F est un rapport entre un numérateur et un dénominateur. Considérons des sujets choisis au hasard qui sont ensuite assignés au hasard aux groupes A, B et C. En vertu de l' hypothèse nulle , la variabilité (ou somme des carrés) des scores sur une variable dépendante sera la même dans chaque groupe. Lorsqu'il est divisé par les degrés de liberté (c'est-à-dire en fonction du nombre de sujets par groupe), le dénominateur du rapport F est obtenu.

Traitez la moyenne de chaque groupe comme un score et calculez la variabilité (encore une fois, la somme des carrés) de ces trois scores. Lorsqu'il est divisé par ses degrés de liberté (c'est-à-dire en fonction du nombre de groupes), le numérateur du rapport F est obtenu.

En vertu de l'hypothèse nulle, la distribution d'échantillonnage du rapport F dépend des degrés de liberté pour le numérateur et le dénominateur.

Modélisez un traitement appliqué au groupe A en augmentant chaque score de X. (Ce modèle maintient l'hypothèse sous-jacente de variances homogènes. En pratique, il est rare, voire impossible, qu'une augmentation de X dans une moyenne de groupe se produise via une augmentation de le score de chaque membre par X.) Cela déplacera les unités de distribution X dans le sens positif, mais n'aura aucun impact sur la variabilité au sein du groupe. Cependant, la variabilité entre les scores moyens des trois groupes va maintenant augmenter. Si le rapport F résultant élève la valeur à un point tel qu'il dépasse le seuil de ce qui constitue un événement rare (appelé niveau Alpha), le test Anova F est dit rejeter l'hypothèse nulle d'égalité des moyennes entre les trois groupes, en en faveur de l'hypothèse alternative selon laquelle au moins un des groupes a une moyenne plus grande (qui dans cet exemple, est le groupe A).

Gestion de la violation de la normalité de la population

Le classement est l'une des nombreuses procédures utilisées pour transformer des données qui ne répondent pas aux hypothèses de normalité . Conover et Iman ont passé en revue les quatre principaux types de transformations de rangs (RT). Une méthode remplace chaque valeur de données d'origine par son rang (de 1 pour la plus petite à N pour la plus grande). Cette procédure basée sur les rangs a été recommandée comme étant robuste aux erreurs non normales, résistante aux valeurs aberrantes et hautement efficace pour de nombreuses distributions. Il peut aboutir à une statistique connue (par exemple, dans les résultats de classement de disposition des deux échantillons indépendants dans le test Wilcoxon rank-sum / Mann – Whitney U ), et fournit la robustesse souhaitée et l'augmentation de la puissance statistique recherchée. Par exemple, des études de Monte Carlo ont montré que la transformation de rang dans les deux échantillons indépendants test t mise en page peut être étendue avec succès aux échantillons indépendants à sens unique ANOVA, ainsi que les deux échantillons indépendants à plusieurs variables de Hotelling T 2 mises en page commerciales logiciels statistiques paquets (p. ex. SAS) a suivi avec des recommandations aux analystes de données pour qu'ils utilisent une procédure de classement (p. ex., PROC RANK) avant d'effectuer des analyses standard à l'aide de procédures paramétriques.

Échec du classement dans l'ANOVA factorielle et d'autres schémas complexes

ANOVA sur les rangs signifie qu'une analyse standard de la variance est calculée sur les données transformées par rangs. La réalisation d'une ANOVA factorielle sur les rangs des scores originaux a également été suggérée. Cependant, les études de Monte Carlo et les études asymptotiques subséquentes ont montré que la transformation de rang n'est pas appropriée pour tester les effets d'interaction dans un plan factoriel 4x3 et 2x2x2. Au fur et à mesure que le nombre d'effets (c'est-à-dire l'interaction principale) devient non nul et que l'ampleur des effets non nuls augmente, il y a une augmentation de l' erreur de type I , entraînant un échec complet de la statistique avec une valeur aussi élevée que une probabilité de 100% de prendre une fausse décision positive. De même, il a été constaté que la transformation de rang échoue de plus en plus dans la disposition à deux échantillons dépendants à mesure que la corrélation entre les scores prétest et post-test augmente. On a également découvert que le problème du taux d'erreur de type I était exacerbé dans le contexte de l'analyse de la covariance, en particulier lorsque la corrélation entre la covariable et la variable dépendante augmentait.

Transformer les rangs

Une variante de la transformation de rang est la «normalisation quantile» dans laquelle une transformation supplémentaire est appliquée aux rangs de telle sorte que les valeurs résultantes aient une distribution définie (souvent une distribution normale avec une moyenne et une variance spécifiées). D'autres analyses de données normalisées quantiles peuvent alors supposer cette distribution pour calculer les valeurs de signification. Cependant, il a été démontré que deux types spécifiques de transformations secondaires, les scores normaux aléatoires et la transformation attendue des scores normaux, gonflent considérablement les erreurs de type I et réduisent considérablement la puissance statistique.

Violer l'homoscédasticité

L'ANOVA sur les rangs n'a jamais été recommandée lorsque l'hypothèse sous-jacente de variances homogènes a été violée, soit par elle-même, soit en conjonction avec une violation de l'hypothèse de normalité de la population. En général, les statistiques basées sur le rang deviennent encore plus rapides en ce qui concerne les erreurs de type I pour les écarts par rapport à l'homoscédasticité que les homologues paramétriques qui partagent la même hypothèse.

Informations complémentaires

Kepner et Wackerly ont résumé la littérature en notant qu'à la fin des années 80, le volume de la littérature sur les méthodes de RT augmentait rapidement à mesure que de nouvelles connaissances, à la fois positives et négatives, étaient acquises concernant l'utilité de la méthode. Sawilowsky et al. (1989, p. 255) ont averti les praticiens d'éviter l'utilisation de ces tests «sauf dans les situations spécifiques où les caractéristiques des tests sont bien comprises». " Selon Hettmansperger et McKean, "Sawilowsky (1990) fournit une excellente revue des approches non paramétriques pour tester l'interaction" dans ANOVA.

Remarques