Écart quadratique moyen - Root-mean-square deviation
Statistiques |
---|
L' écart quadratique moyen ( RMSD ) ou l' erreur quadratique moyenne ( RMSE ) est une mesure fréquemment utilisée des différences entre les valeurs (valeurs d'échantillon ou de population) prédites par un modèle ou un estimateur et les valeurs observées. Le RMSD représente la racine carrée du deuxième moment d'échantillonnage des différences entre les valeurs prédites et les valeurs observées ou la moyenne quadratique de ces différences. Ces écarts sont appelés résidus lorsque les calculs sont effectués sur l'échantillon de données utilisé pour l'estimation et sont appelés erreurs (ou erreurs de prédiction) lorsqu'ils sont calculés hors échantillon. Le RMSD sert à agréger les amplitudes des erreurs dans les prédictions pour divers points de données en une seule mesure de la puissance prédictive. Le RMSD est une mesure de précision , pour comparer les erreurs de prévision de différents modèles pour un ensemble de données particulier et non entre des ensembles de données, car il dépend de l'échelle.
Le RMSD est toujours non négatif, et une valeur de 0 (presque jamais atteinte dans la pratique) indiquerait un ajustement parfait aux données. En général, un RMSD inférieur est meilleur qu'un RMSD supérieur. Cependant, les comparaisons entre différents types de données seraient invalides car la mesure dépend de l'échelle des nombres utilisés.
RMSD est la racine carrée de la moyenne des erreurs au carré. L'effet de chaque erreur sur le RMSD est proportionnel à la taille de l'erreur au carré ; ainsi, des erreurs plus importantes ont un effet disproportionné sur le RMSD. Par conséquent, RMSD est sensible aux valeurs aberrantes.
Formule
La RMSD d'un estimateur par rapport à un paramètre estimé est définie comme la racine carrée de l' erreur quadratique moyenne :
Pour un estimateur sans biais , le RMSD est la racine carrée de la variance, appelée écart type .
Le RMSD des valeurs prédites pour les temps t d'une variable dépendante d'une régression avec des variables observées sur T temps, est calculé pour T différentes prédictions comme la racine carrée de la moyenne des carrés des écarts :
(Pour les régressions sur données transversales , l'indice t est remplacé par i et T est remplacé par n .)
Dans certaines disciplines, le RMSD est utilisé pour comparer les différences entre deux choses qui peuvent varier, dont aucune n'est acceptée comme la « norme ». Par exemple, lors de la mesure de la différence moyenne entre deux séries temporelles et , la formule devient
Normalisation
La normalisation du RMSD facilite la comparaison entre des ensembles de données ou des modèles à différentes échelles. Bien qu'il n'y ait pas de moyen de normalisation cohérent dans la littérature, les choix courants sont la moyenne ou la plage (définie comme la valeur maximale moins la valeur minimale) des données mesurées :
- ou .
Cette valeur est communément appelée écart ou erreur quadratique moyenne normalisée (NRMSD ou NRMSE), et souvent exprimée en pourcentage, où des valeurs inférieures indiquent moins de variance résiduelle. Dans de nombreux cas, en particulier pour les échantillons plus petits, la gamme d'échantillons est susceptible d'être affectée par la taille de l'échantillon, ce qui entraverait les comparaisons.
Une autre méthode possible pour faire du RMSD une mesure de comparaison plus utile consiste à diviser le RMSD par l' intervalle interquartile . Lors de la division du RMSD avec l'IQR, la valeur normalisée devient moins sensible aux valeurs extrêmes de la variable cible.
- où
avec et où CDF −1 est la fonction quantile .
Lors de la normalisation par la valeur moyenne des mesures, le terme coefficient de variation du RMSD, CV(RMSD) peut être utilisé pour éviter toute ambiguïté. Ceci est analogue au coefficient de variation avec le RMSD prenant la place de l' écart type .
Erreur absolue moyenne
Certains chercheurs ont recommandé l'utilisation de l' erreur absolue moyenne (MAE) au lieu de la déviation quadratique moyenne. Le MAE possède des avantages en termes d'interprétabilité par rapport au RMSD. MAE est la moyenne des valeurs absolues des erreurs. La MAE est fondamentalement plus facile à comprendre que la racine carrée de la moyenne des erreurs au carré. De plus, chaque erreur influence la MAE en proportion directe de la valeur absolue de l'erreur, ce qui n'est pas le cas pour RMSD.
Applications
- En météorologie , pour voir avec quelle efficacité un modèle mathématique prédit le comportement de l' atmosphère .
- En bioinformatique , la déviation quadratique moyenne des positions atomiques est la mesure de la distance moyenne entre les atomes de protéines superposées .
- Dans la conception de médicaments basée sur la structure , le RMSD est une mesure de la différence entre une conformation de cristal du ligand de conformation et d' un amarrage prédiction.
- En économie , le RMSD est utilisé pour déterminer si un modèle économique correspond aux indicateurs économiques . Certains experts ont fait valoir que le RMSD est moins fiable que l'erreur absolue relative.
- En psychologie expérimentale , le RMSD est utilisé pour évaluer dans quelle mesure les modèles de comportement mathématiques ou informatiques expliquent le comportement observé empiriquement.
- Dans les SIG , le RMSD est une mesure utilisée pour évaluer la précision de l'analyse spatiale et de la télédétection.
- En hydrogéologie , RMSD et NRMSD sont utilisés pour évaluer le calibrage d'un modèle d'eau souterraine.
- En science de l'imagerie , le RMSD fait partie du rapport signal sur bruit de crête , une mesure utilisée pour évaluer les performances d'une méthode de reconstruction d'une image par rapport à l'image d'origine.
- En neurosciences computationnelles , le RMSD est utilisé pour évaluer dans quelle mesure un système apprend un modèle donné.
- En spectroscopie de résonance magnétique nucléaire des protéines , le RMSD est utilisé comme mesure pour estimer la qualité du faisceau de structures obtenu.
- Les soumissions pour le prix Netflix ont été jugées à l'aide du RMSD à partir des valeurs « vraies » non divulguées de l'ensemble de données de test.
- Dans la simulation de la consommation énergétique des bâtiments, le RMSE et le CV(RMSE) sont utilisés pour calibrer les modèles sur la performance mesurée du bâtiment.
- En cristallographie aux rayons X , RMSD (et RMSZ) est utilisé pour mesurer l'écart des coordonnées internes moléculaires par rapport aux valeurs de la bibliothèque de contraintes.
Voir également
- Racine quadratique moyenne
- Erreur absolue moyenne
- Écart absolu moyen
- Écart moyen signé
- Écart moyen au carré
- Écarts au carré
- Erreurs et résidus dans les statistiques
Les références
- ^ Hyndman, Rob J.; Koehler, Anne B. (2006). "Un autre regard sur les mesures de l'exactitude des prévisions". Journal international de prévision . 22 (4) : 679-688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .
- ^ un b Ponce, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). « Composants d'informations pour la comparaison de résolutions multiples entre des cartes qui partagent une variable réelle ». Statistiques écologiques environnementales . 15 (2) : 111-142. doi : 10.1007/s10651-007-0043-y .
- ^ Willmott, Cort; Matsuura, Kenji (2006). « Sur l'utilisation de mesures d'erreur dimensionnées pour évaluer les performances des interpolateurs spatiaux ». Revue internationale des sciences de l'information géographique . 20 : 89-102. doi : 10.1080/13658810500286976 .
- ^ "Coastal Inlets Research Program (CIRP) Wiki - Statistics" . Consulté le 4 février 2015 .
- ^ "FAQ : Quel est le coefficient de variation ?" . Consulté le 19 février 2019 .
- ^ Armstrong, J. Scott; Collopy, Fred (1992). « Mesures d'erreur pour la généralisation des méthodes de prévision : comparaisons empiriques » (PDF) . Journal international de prévision . 8 (1) : 69-80. CiteSeerX 10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .
- ^ Anderson, député; Woessner, WW (1992). Modélisation appliquée des eaux souterraines : simulation de l'écoulement et du transport adventif (2e éd.). Presse académique.
- ^ Modèle de réseau de neurones d'ensemble
- ^ ANSI/BPI-2400-S-2012 : Pratique standard pour la qualification normalisée des prévisions d'économies d'énergie dans toute la maison par étalonnage en fonction de l'historique de la consommation d'énergie