Endogénéité (économétrie) - Endogeneity (econometrics)

En économétrie , l' endogénéité se réfère globalement à des situations dans lesquelles une variable explicative est corrélée avec le terme d' erreur . La distinction entre variables endogènes et exogènes trouve son origine dans les modèles à équations simultanées , où l'on sépare les variables dont les valeurs sont déterminées par le modèle des variables qui sont prédéterminées ; ignorer la simultanéité dans l'estimation conduit à des estimations biaisées car cela viole l'hypothèse d'exogénéité du théorème de Gauss-Markov . Le problème de l'endogénéité est souvent, malheureusement, ignoré par les chercheurs qui mènent des recherches non expérimentales et cela empêche de faire des recommandations politiques. Les techniques de variables instrumentales sont couramment utilisées pour résoudre ce problème.

En plus de simultanéité, la corrélation entre les variables explicatives et le terme d'erreur peut se produire lorsqu'une ou non observée variable omise est confondait les deux variables indépendantes et dépendantes, ou lorsque les variables indépendantes sont mesurées avec une erreur .

Exogénéité versus endogénéité

Dans un modèle stochastique , la notion de exogénéité habituelle , exogénéité séquentielle , exogénéité forte / stricte peut être définie. L'exogénéité est articulée de telle manière qu'une ou plusieurs variables sont exogènes pour le paramètre . Même si une variable est exogène pour le paramètre , elle peut être endogène pour le paramètre . ${\style d'affichage \alpha }$ ${\style d'affichage \alpha }$ $\beta$

Lorsque les variables explicatives ne sont pas stochastiques, alors elles sont fortement exogènes pour tous les paramètres.

Si la variable indépendante est corrélée avec le terme d'erreur dans un modèle de régression , alors l'estimation du coefficient de régression dans une régression des moindres carrés ordinaires (MCO) est biaisée ; cependant, si la corrélation n'est pas contemporaine, l'estimation du coefficient peut toujours être cohérente . Il existe de nombreuses méthodes de correction du biais, notamment la régression des variables instrumentales et la correction de sélection de Heckman .

Modèles statiques

Voici quelques sources courantes d'endogénéité.

Variable omise

Dans ce cas, l'endogénéité provient d'une variable de confusion non contrôlée , une variable qui est corrélée à la fois à la variable indépendante dans le modèle et au terme d'erreur. (De manière équivalente, la variable omise affecte la variable indépendante et affecte séparément la variable dépendante.)

Supposons que le « vrai » modèle à estimer soit

y_{i}=\alpha +\beta x_{i}+\gamma z_{i}+u_{i}

mais est omis du modèle de régression (peut-être parce qu'il n'y a aucun moyen de le mesurer directement). Alors le modèle qui est réellement estimé est ${\style d'affichage z_{i}}$

y_{i}=\alpha +\beta x_{i}+\varepsilon _{i}

où (ainsi, le terme a été absorbé dans le terme d'erreur). $\varepsilon _{i}=\gamma z_{i}+u_{i}$ ${\style d'affichage z_{i}}$

Si la corrélation de et n'est pas 0 et affecte séparément (c'est-à-dire ), alors est corrélé avec le terme d'erreur . ${\style d'affichage x}$ ${\style d'affichage z}$ ${\style d'affichage z}$ ${\style d'affichage y}$ $\gamma \neq 0$ ${\style d'affichage x}$ $\varepsilon$

Ici, n'est pas exogène pour et , puisque, étant donné , la distribution de dépend non seulement de et , mais aussi de et . ${\style d'affichage x}$ ${\style d'affichage \alpha }$ $\beta$ ${\style d'affichage x}$ ${\style d'affichage y}$ ${\style d'affichage \alpha }$ $\beta$ ${\style d'affichage z}$ ${\style d'affichage \gamma }$

Erreur de mesure

Supposons qu'une mesure parfaite d'une variable indépendante soit impossible. C'est-à-dire qu'au lieu d'observer , ce qui est réellement observé, c'est où se trouve l'erreur de mesure ou le "bruit". Dans ce cas, un modèle donné par $x_{i}^{*}$ $x_{i}=x_{i}^{*}+\nu _{i}$ ${\style d'affichage \nu _{i}}$

y_{i}=\alpha +\beta x_{i}^{*}+\varepsilon _{i}

peut être écrit en termes d'observables et de termes d'erreur comme

{\begin{aligned}y_{i}&=\alpha +\beta (x_{i}-\nu _{i})+\varepsilon _{i}\\[3pt]y_{i}& =\alpha +\beta x_{i}+(\varepsilon _{i}-\beta \nu _{i})\\[3pt]y_{i}&=\alpha +\beta x_{i}+u_ {i}\quad ({\text{where }}u_{i}=\varepsilon _{i}-\beta \nu _{i})\end{aligned}}

Étant donné que les deux et dépendent de , ils sont corrélés, de sorte que l'estimation MCO de sera biaisée à la baisse. ${\style d'affichage x_{i}}$ ${\style d'affichage u_{i}}$ ${\style d'affichage \nu _{i}}$ $\beta$

L'erreur de mesure dans la variable dépendante, , n'entraîne pas d'endogénéité, bien qu'elle augmente la variance du terme d'erreur. ${\style d'affichage y_{i}}$

Simultanéité

Supposons que deux variables soient codéterminées, chacune affectant l'autre selon les équations "structurelles" suivantes :

y_{i}=\beta _{1}x_{i}+\gamma _{1}z_{i}+u_{i}

z_{i}=\beta _{2}x_{i}+\gamma _{2}y_{i}+v_{i}

L'estimation de l'une ou l'autre équation en elle-même entraîne une endogénéité. Dans le cas de la première équation structurelle, . Résoudre tout en supposant que cela donne ${\style d'affichage E(z_{i}u_{i})\neq 0}$ ${\style d'affichage z_{i}}$ $1-\gamma _{1}\gamma _{2}\neq 0$

z_{i}={\frac {\beta _{2}+\gamma _{2}\beta _{1}}{1-\gamma _{1}\gamma _{2}}}x_ {i}+{\frac {1}{1-\gamma _{1}\gamma _{2}}}v_{i}+{\frac {\gamma _{2}}{1-\gamma _{ 1}\gamma _{2}}}u_{i}

.

En supposant que et ne soient pas corrélés avec , ${\style d'affichage x_{i}}$ $v_{i}$ ${\style d'affichage u_{i}}$

\operatorname {E} (z_{i}u_{i})={\frac {\gamma _{2}}{1-\gamma _{1}\gamma _{2}}}\operatorname { E} (u_{i}u_{i})\neq 0

.

Par conséquent, les tentatives d'estimation de l'une ou l'autre équation structurelle seront entravées par l'endogénéité.

Modèles dynamiques

Le problème de l'endogénéité est particulièrement pertinent dans le contexte de l' analyse des séries chronologiques des processus causaux . Il est courant que certains facteurs au sein d'un système causal dépendent pour leur valeur à la période t des valeurs d'autres facteurs du système causal à la période t − 1. Supposons que le niveau d'infestation de ravageurs soit indépendant de tous les autres facteurs au sein d'un période donnée, mais est influencée par le niveau des précipitations et des engrais de la période précédente. Dans ce cas, il serait correct de dire que l'infestation est exogène dans la période, mais endogène dans le temps.

Soit le modèle y = f ( x , z ) + u . Si la variable x est séquentiellement exogène pour le paramètre , et que y ne provoque pas x au sens de Granger , alors la variable x est fortement/strictement exogène pour le paramètre . ${\style d'affichage \alpha }$ ${\style d'affichage \alpha }$

Simultanéité

D'une manière générale, la simultanéité se produit dans le modèle dynamique tout comme dans l'exemple de simultanéité statique ci-dessus.

Voir également

Les références

Lectures complémentaires

Greene, William H. (2012). Analyse économétrique (sixième éd.). Rivière supérieure de la selle : Pearson. ISBN 978-0-13-513740-6.
Kennedy, Pierre (2008). Un guide d'économétrie (sixième éd.). Malden : Blackwell. p. 139. ISBN 978-1-4051-8257-7.
Kmenta, Jan (1986). Éléments d'économétrie (deuxième éd.). New York : MacMillan. p. 651-733 . ISBN 0-02-365070-2.

Languages

In other projects

Endogénéité (économétrie) - Endogeneity (econometrics)

Contenu

Exogénéité versus endogénéité

Modèles statiques

Variable omise

Erreur de mesure

Simultanéité

Modèles dynamiques

Simultanéité

Voir également

Les références

Lectures complémentaires

Liens externes