Moyenne arithmétique - Arithmetic mean

En mathématiques et statistiques , la moyenne arithmétique ( / ˌ æ r ɪ & thetav m ɛ t ɪ k m i n / , le stress sur les premier et troisième syllabes de « arithmétique »), ou tout simplement la moyenne ou la moyenne (lorsque le contexte est clair), est la somme d'une collection de nombres divisée par le nombre de nombres dans la collection. La collection est souvent un ensemble de résultats d'une expérience ou d'une étude d'observation , ou fréquemment un ensemble de résultats d'une enquête . Le terme "moyenne arithmétique" est préféré dans certains contextes mathématiques et statistiques, car il permet de le distinguer d'autres moyens , tels que la moyenne géométrique et la moyenne harmonique .

En plus des mathématiques et des statistiques, la moyenne arithmétique est fréquemment utilisée dans de nombreux domaines divers tels que l' économie , l' anthropologie et l' histoire , et elle est utilisée dans presque tous les domaines universitaires dans une certaine mesure. Par exemple, le revenu par habitant est le revenu moyen arithmétique de la population d'un pays.

Bien que la moyenne arithmétique soit souvent utilisée pour signaler les tendances centrales , il ne s'agit pas d'une statistique robuste , ce qui signifie qu'elle est fortement influencée par les valeurs aberrantes (valeurs très supérieures ou inférieures à la plupart des valeurs). Pour les distributions asymétriques , telles que la distribution des revenus pour laquelle les revenus de quelques personnes sont nettement supérieurs à ceux de la plupart des personnes, la moyenne arithmétique peut ne pas coïncider avec la notion de « moyen », et des statistiques solides, telles que la médiane , peuvent fournir une meilleure description de tendance centrale.

Définition

Étant donné un ensemble de données , la moyenne arithmétique (ou moyenne ou moyenne ), notée (lire la barre ), est la moyenne des valeurs .

La moyenne arithmétique est la mesure de tendance centrale la plus couramment utilisée et la plus facilement comprise dans un ensemble de données. En statistique, le terme moyenne fait référence à l'une des mesures de tendance centrale. La moyenne arithmétique d'un ensemble de données observées est définie comme étant égale à la somme des valeurs numériques de chaque observation, divisée par le nombre total d'observations. Symboliquement, si nous avons un ensemble de données composé des valeurs , alors la moyenne arithmétique est définie par la formule :

(pour une explication de l' opérateur de sommation , voir sommation .)

Par exemple, considérons le salaire mensuel de 10 employés d'une entreprise : 2500, 2700, 2400, 2300, 2550, 2650, 2750, 2450, 2600, 2400. La moyenne arithmétique est

Si l'ensemble de données est une population statistique (c'est-à-dire qu'il comprend toutes les observations possibles et pas seulement un sous-ensemble d'entre elles), alors la moyenne de cette population est appelée moyenne de la population et désignée par la lettre grecque . Si l'ensemble de données est un échantillon statistique (un sous-ensemble de la population), alors nous appelons la statistique résultant de ce calcul une moyenne d'échantillon (qui pour un ensemble de données est notée ).

La moyenne arithmétique peut être définie de la même manière pour les vecteurs à dimensions multiples, pas seulement pour les valeurs scalaires ; c'est ce qu'on appelle souvent un centroïde . Plus généralement, parce que la moyenne arithmétique est une combinaison convexe (somme des coefficients à 1), elle peut être définie sur un espace convexe , pas seulement un espace vectoriel.

Propriétés motivantes

La moyenne arithmétique a plusieurs propriétés qui la rendent utile, notamment comme mesure de tendance centrale. Ceux-ci inclus:

  • Si les nombres ont une moyenne , alors . Puisque est la distance d'un nombre donné à la moyenne, une façon d'interpréter cette propriété est de dire que les nombres à gauche de la moyenne sont équilibrés par les nombres à droite de la moyenne. La moyenne est le seul nombre pour lequel la somme des résidus (écarts par rapport à l'estimation) est nulle.
  • S'il est nécessaire d'utiliser un seul nombre comme valeur « typique » pour un ensemble de nombres connus , alors la moyenne arithmétique des nombres le fait le mieux, dans le sens de minimiser la somme des écarts au carré par rapport à la valeur typique : la somme de . (Il s'ensuit que la moyenne de l'échantillon est également le meilleur prédicteur unique dans le sens d'avoir l' erreur quadratique moyenne la plus faible .) Si la moyenne arithmétique d'une population de nombres est souhaitée, alors l'estimation de celle-ci qui est sans biais est la moyenne arithmétique d'un échantillon tiré de la population.

Contraste avec la médiane

La moyenne arithmétique peut être contrastée avec la médiane . La médiane est définie de telle sorte que pas plus de la moitié des valeurs soient supérieures et pas plus de la moitié soient inférieures à la médiane. Si les éléments des données augmentent arithmétiquement , lorsqu'ils sont placés dans un certain ordre, alors la médiane et la moyenne arithmétique sont égales. Par exemple, considérons l'échantillon de données . La moyenne est de , tout comme la médiane. Cependant, lorsque nous considérons un échantillon qui ne peut pas être arrangé de manière à augmenter arithmétiquement, tel que , la médiane et la moyenne arithmétique peuvent différer considérablement. Dans ce cas, la moyenne arithmétique est de 6,2, tandis que la médiane est de 4. En général, la valeur moyenne peut varier considérablement par rapport à la plupart des valeurs de l'échantillon et peut être supérieure ou inférieure à la plupart d'entre elles.

Il existe des applications de ce phénomène dans de nombreux domaines. Par exemple, depuis les années 1980, le revenu médian aux États-Unis a augmenté plus lentement que la moyenne arithmétique des revenus.

Généralisations

Moyenne pondérée

Une moyenne pondérée, ou moyenne pondérée, est une moyenne dans laquelle certains points de données comptent plus que d'autres, en ce sens qu'ils reçoivent plus de poids dans le calcul. Par exemple, la moyenne arithmétique de et est , ou de manière équivalente . En revanche, une moyenne pondérée dans laquelle le premier nombre reçoit, par exemple, deux fois plus de poids que le second (peut-être parce qu'il est supposé apparaître deux fois plus souvent dans la population générale à partir de laquelle ces nombres ont été échantillonnés) serait calculée comme . Ici, les poids, qui somment nécessairement à la valeur un, sont et , le premier étant le double du dernier. La moyenne arithmétique (parfois appelée « moyenne non pondérée » ou « moyenne équipondérée ») peut être interprétée comme un cas particulier de moyenne pondérée dans laquelle tous les poids sont égaux les uns aux autres (égal à dans l'exemple ci-dessus, et égal à dans une situation où les nombres sont moyennés).

Distributions de probabilités continues

Comparaison de deux distributions log-normales avec une médiane égale , mais une asymétrie différente , résultant en des moyennes et des modes différents

Si une propriété numérique, et tout échantillon de données à partir de celle-ci, pouvait prendre n'importe quelle valeur d'une plage continue, au lieu, par exemple, de simples entiers, alors la probabilité qu'un nombre tombe dans une plage de valeurs possibles peut être décrite en intégrant une distribution de probabilité continue sur cette plage, même lorsque la probabilité naïve pour un nombre d'échantillons prenant une certaine valeur parmi une infinité de nombres est nulle. L'analogue d'une moyenne pondérée dans ce contexte, dans lequel il existe un nombre infini de possibilités pour la valeur précise de la variable dans chaque plage, est appelé la moyenne de la distribution de probabilité . Une distribution de probabilité la plus répandue est appelée distribution normale ; il a la propriété que toutes les mesures de sa tendance centrale, y compris non seulement la moyenne mais aussi la médiane susmentionnée et le mode (les trois M), sont égales les unes aux autres. Cette égalité ne s'applique pas aux autres distributions de probabilité, comme illustré ici pour la distribution log-normale .

Angles

Des précautions particulières doivent être prises lors de l'utilisation de données cycliques, telles que des phases ou des angles . Prendre naïvement la moyenne arithmétique de 1° et 359° donne un résultat de 180°. Ceci est incorrect pour deux raisons :

  • Premièrement, les mesures d'angle ne sont définies que jusqu'à une constante additive de 360° (ou 2π, si la mesure est en radians ). Ainsi on pourrait aussi bien appeler ces 1° et -1°, ou 361° et 719°, puisque chacun d'eux donne une moyenne différente.
  • Deuxièmement, dans cette situation, 0° (équivalent à 360°) est géométriquement une meilleure valeur moyenne : il y a une plus faible dispersion à son sujet (les points sont à la fois à 1° d'elle et à 179° de 180°, la moyenne putative).

En application générale, un tel oubli conduira à déplacer artificiellement la valeur moyenne vers le milieu de la fourchette numérique. Une solution à ce problème est d'utiliser la formulation d'optimisation ( c'est-à-dire définir la moyenne comme le point central : le point autour duquel on a la plus faible dispersion), et redéfinir la différence comme une distance modulaire (c'est-à-dire la distance sur le cercle : donc la distance modulaire entre 1° et 359° est de 2°, pas de 358°).

Démonstration sans mots de l' inégalité des moyennes arithmétiques et géométriques :
PR est un diamètre d'un cercle centré sur O ; son rayon AO est la moyenne arithmétique de a et b . En utilisant le théorème de la moyenne géométrique , l' altitude du triangle PGR GQ est la moyenne géométrique . Pour tout rapport a : b , AO GQ.

Symboles et encodage

La moyenne arithmétique est souvent indiquée par une barre (alias vinculum ou macron ), par exemple comme dans (read bar ).

Certains logiciels ( traitements de texte , navigateurs Web ) peuvent ne pas afficher correctement le symbole x̄. Par exemple, le symbole x̄ en HTML est en fait une combinaison de deux codes - la lettre de base x plus un code pour la ligne ci-dessus (̄ ou ¯).

Dans certains textes, tels que les fichiers PDF , le symbole x̄ peut être remplacé par un symbole cent (¢) ( Unicode ¢), lorsqu'il est copié dans un traitement de texte tel que Microsoft Word .

Voir également

Preuve géométrique sans mots qui max  ( a , b ) > moyenne quadratique ( RMS ) ou quadratique moyenne ( QM ) > moyenne arithmétique ( AM ) > moyenne géométrique ( GM ) > moyenne harmonique ( HM ) > min  ( a , b ) de deux nombres positifs a et b

Les références

Lectures complémentaires

Liens externes