Réponse moyenne et prévue - Mean and predicted response

Dans la régression linéaire , la réponse moyenne et la réponse prédite sont des valeurs de la variable dépendante calculées à partir des paramètres de régression et d'une valeur donnée de la variable indépendante. Les valeurs de ces deux réponses sont les mêmes, mais leurs variances calculées sont différentes.

Contexte

En montage en ligne droite, le modèle est

où est la variable de réponse , est la variable explicative , ε i est l'erreur aléatoire et et sont des paramètres. La valeur de réponse moyenne et prévue pour une valeur explicative donnée, x d , est donnée par

alors que la réponse réelle serait

Les expressions des valeurs et des variances de et sont données en régression linéaire .

Réponse moyenne

Puisque les données dans ce contexte sont définies comme étant des paires ( x , y ) pour chaque observation, la réponse moyenne à une valeur donnée de x , disons x d , est une estimation de la moyenne des valeurs y dans la population au x valeur de x d , c'est-à-dire . La variance de la réponse moyenne est donnée par

Cette expression peut être simplifiée en

m est le nombre de points de données.

Pour démontrer cette simplification, on peut utiliser l'identité

Réponse prévue

La distribution de réponse prédite est la distribution prévue des résidus au point donné x d . Donc la variance est donnée par

La deuxième ligne découle du fait qu'il est égal à zéro car le nouveau point de prédiction est indépendant des données utilisées pour ajuster le modèle. De plus, le terme a été calculé plus tôt pour la réponse moyenne.

Puisque (un paramètre fixe mais inconnu qui peut être estimé), la variance de la réponse prédite est donnée par

Intervalles de confiance

Les intervalles de confiance sont calculés comme . Ainsi, l'intervalle de confiance pour la réponse prédite est plus large que l'intervalle pour la réponse moyenne. Ceci est attendu intuitivement - la variance de la population de valeurs ne diminue pas quand on en fait un échantillonnage, car la variable aléatoire ε i ne diminue pas, mais la variance de la moyenne de la diminue avec un échantillonnage accru, car la variance de et diminuer, de sorte que la réponse moyenne (valeur de réponse prévue) se rapproche de .

Ceci est analogue à la différence entre la variance d'une population et la variance de la moyenne d'échantillon d'une population: la variance d'une population est un paramètre et ne change pas, mais la variance de la moyenne de l'échantillon diminue avec l'augmentation des échantillons.

Régression linéaire générale

Le modèle linéaire général peut être écrit comme

Par conséquent, puisque l'expression générale de la variance de la réponse moyenne est

S est la matrice de covariance des paramètres, donnée par

Les références

  • Draper, NR; Smith, H. (1998). Analyse de régression appliquée (3e éd.). John Wiley. ISBN 0-471-17082-8.