Différence absolue moyenne - Mean absolute difference

La différence absolue moyenne (univariée) est une mesure de la dispersion statistique égale à la différence absolue moyenne de deux valeurs indépendantes tirées d'une distribution de probabilité . Une statistique connexe est la différence absolue moyenne relative , qui est la différence absolue moyenne divisée par la moyenne arithmétique , et égale à deux fois le coefficient de Gini . La différence moyenne absolue est également connue sous le nom de différence moyenne absolue (à ne pas confondre avec la valeur absolue de la différence moyenne signée ) et la différence moyenne de Gini (GMD). La différence absolue moyenne est parfois notée ou MD.

Définition

La différence absolue moyenne est définie comme étant la « moyenne » ou « moyen », formellement la valeur attendue , de la différence absolue de deux variables aléatoires X et Y , indépendamment et identiquement distribués avec la même distribution appelé désormais (de inconnue) Q .

Calcul

Plus précisément, dans le cas discret,

  • Pour un échantillon aléatoire de taille n d'une population distribuée uniformément selon Q , par la loi de l'espérance totale, la différence absolue moyenne (empirique) de la séquence de valeurs d'échantillon y i , i = 1 à n peut être calculée comme la moyenne arithmétique de la valeur absolue de toutes les différences possibles :

Dans le cas continu,

Différence absolue moyenne relative

Lorsque la distribution de probabilité a une moyenne arithmétique finie et non nulle AM, la différence absolue moyenne relative, parfois notée Δ ou RMD, est définie par

La différence absolue moyenne relative quantifie la différence absolue moyenne par rapport à la taille de la moyenne et est une quantité sans dimension. La différence absolue moyenne relative est égale à deux fois le coefficient de Gini qui est défini en fonction de la courbe de Lorenz . Cette relation donne des perspectives complémentaires à la fois à la différence absolue moyenne relative et au coefficient de Gini, y compris des façons alternatives de calculer leurs valeurs.

Propriétés

La différence absolue moyenne est invariante aux traductions et à la négation, et varie proportionnellement à une mise à l'échelle positive. C'est-à-dire, si X est une variable aléatoire et c est une constante :

  • MD( X + c ) = MD( X ),
  • MD(− X ) = MD( X ), et
  • MD( c X ) = | c | MD( X ).

La différence absolue moyenne relative est invariante par rapport à une mise à l'échelle positive, commute avec la négation et varie sous translation proportionnellement au rapport des moyennes arithmétiques originales et traduites. C'est-à-dire, si X est une variable aléatoire et c est une constante :

  • RMD( X + c ) = RMD( X ) · moyenne( X )/(moyenne( X ) + c ) = RMD( X ) / (1 + c / moyenne( X )) pour c ≠ −moyenne( X ),
  • RMD(− X ) = −RMD( X ), et
  • RMD( c X ) = RMD( X ) pour c > 0.

Si une variable aléatoire a une moyenne positive, alors sa différence absolue moyenne relative sera toujours supérieure ou égale à zéro. Si, en plus, la variable aléatoire ne peut prendre que des valeurs supérieures ou égales à zéro, alors sa différence absolue moyenne relative sera inférieure à 2.

Par rapport à l'écart type

La différence absolue moyenne est le double de l' échelle L (le deuxième moment L ), tandis que l'écart type est la racine carrée de la variance par rapport à la moyenne (le deuxième moment central conventionnel). Les différences entre les moments L et les moments conventionnels sont d'abord observées en comparant la différence absolue moyenne et l'écart type (le premier moment L et le premier moment conventionnel sont tous deux la moyenne).

L' écart-type et la différence absolue moyenne mesurent la dispersion, c'est-à-dire l'étalement des valeurs d'une population ou des probabilités d'une distribution. La différence absolue moyenne n'est pas définie en termes de mesure spécifique de tendance centrale, alors que l'écart type est défini en termes d'écart par rapport à la moyenne arithmétique. Étant donné que l'écart type correspond au carré de ses différences, il a tendance à donner plus de poids aux différences plus importantes et moins de poids aux différences plus petites par rapport à la différence absolue moyenne. Lorsque la moyenne arithmétique est finie, la différence absolue moyenne sera également finie, même lorsque l'écart type est infini. Voir les exemples pour quelques comparaisons spécifiques.

L' écart type de distance récemment introduit joue un rôle similaire à la différence absolue moyenne, mais l'écart type de distance fonctionne avec des distances centrées. Voir aussi E-statistiques .

Échantillons d'estimateurs

Pour un échantillon aléatoire S d'une variable aléatoire X , constitué de n valeurs y i , la statistique

est un estimateur cohérent et sans biais de MD( X ). La statistique :

est un estimateur cohérent de RMD( X ), mais n'est pas, en général, sans biais .

Les intervalles de confiance pour RMD( X ) peuvent être calculés à l'aide de techniques d'échantillonnage bootstrap.

Il n'existe pas, en général, d'estimateur sans biais pour RMD( X ), en partie à cause de la difficulté de trouver une estimation sans biais pour multiplier par l'inverse de la moyenne. Par exemple, même lorsqu'on sait que l'échantillon est tiré d'une variable aléatoire X ( p ) pour un p inconnu et que X ( p ) − 1 a la distribution de Bernoulli , de sorte que Pr( X ( p ) = 1) = 1 −  p et Pr( X ( p ) = 2) = p , alors

RMD( X ( p )) = 2 p (1 −  p )/(1 +  p ) .

Mais la valeur attendue de tout estimateur R ( S ) de RMD( X ( p )) sera de la forme :

où les r i sont des constantes. Donc E( R ( S )) ne peut jamais être égal à RMD( X ( p )) pour tout p compris entre 0 et 1.

Exemples

Exemples de différence absolue moyenne et de différence absolue moyenne relative
Distribution Paramètres Signifier Écart-type Différence absolue moyenne Différence absolue moyenne relative
Uniforme continu
Normal ;
Exponentiel
Pareto ;
Gamma ; ?? ??
Gamma ;
Gamma ;
Gamma ;
Gamma ;
Bernoulli
t de Student , 2 df indéfini
† est la régularisé fonction incomplète Beta

Voir également

Les références