Modèle d'équations simultanées - Simultaneous equations model

Les modèles d'équations simultanées sont un type de modèle statistique dans lequel les variables dépendantes sont des fonctions d'autres variables dépendantes, plutôt que de simples variables indépendantes. Cela signifie que certaines des variables explicatives sont déterminées conjointement avec la variable dépendante, ce qui en économie est généralement la conséquence d'un mécanisme d'équilibre sous-jacent . Prenons le modèle typique de l' offre et de la demande : alors que généralement on déterminerait la quantité fournie et demandée en fonction du prix fixé par le marché, il est également possible que l'inverse soit vrai, où les producteurs observent la quantité demandée par les consommateurs et puis fixez le prix.

La simultanéité pose des défis pour l' estimation des paramètres statistiques d'intérêt, car l' hypothèse de Gauss – Markov d' exogénéité stricte des régresseurs est violée. Et s'il serait naturel d'estimer toutes les équations simultanées à la fois, cela conduit souvent à un problème d'optimisation non linéaire coûteux en calcul, même pour le système d'équations linéaires le plus simple . Cette situation a incité le développement, dirigé par la Commission Cowles dans les années 40 et 50, de diverses techniques qui estiment chaque équation dans le modèle en série, notamment le maximum de vraisemblance à information limitée et les moindres carrés en deux étapes .

Forme structurelle et réduite

Supposons qu'il existe m équations de régression de la forme

i est le numéro de l'équation, et t = 1, ..., T est l'indice d'observation. Dans ces équations x c'est le vecteur k i × 1 des variables exogènes, y c'est la variable dépendante, y −i, t est le vecteur n i × 1 de toutes les autres variables endogènes qui entrent dans la i ème équation à droite- côté de la main, et u ce sont les termes d'erreur. La notation «- i » indique que le vecteur y −i, t peut contenir n'importe lequel des y sauf y it (car il est déjà présent sur le côté gauche). Les coefficients de régression β i et γ i sont de dimensions k i × 1 et n i × 1 proportionnellement. En empilant verticalement les observations T correspondant à la i ème équation, nous pouvons écrire chaque équation sous forme vectorielle comme

y i et u i sont des vecteurs T × 1, X i est une matrice T × k i de régresseurs exogènes, et Y −i est une matrice T × n i de régresseurs endogènes sur le côté droit de la i ème équation . Enfin, nous pouvons déplacer toutes les variables endogènes vers le côté gauche et écrire les m équations conjointement sous forme vectorielle comme

Cette représentation est connue sous le nom de forme structurelle . Dans cette équation, Y = [ y 1 y 2 ... y m ] est la matrice T × m des variables dépendantes. Chacune des matrices Y -i est en fait un n i -columned sous - matrice de la présente Y . La matrice m × m Γ, qui décrit la relation entre les variables dépendantes, a une structure compliquée. Il a des uns sur la diagonale, et tous les autres éléments de chaque colonne i sont soit les composantes du vecteur −γ i, soit des zéros, selon les colonnes de Y incluses dans la matrice Y −i . La matrice T × k X contient tous les régresseurs exogènes de toutes les équations, mais sans répétitions (c'est-à-dire que la matrice X doit être de rang complet). Ainsi, chaque X i est un k i -columned de sous - matrice X . La matrice Β a la taille k × m , et chacune de ses colonnes est constituée des composantes des vecteurs β i et des zéros, selon lesquels des régresseurs de X ont été inclus ou exclus de X i . Enfin, U = [ u 1 u 2 ... u m ] est une matrice T × m des termes d'erreur.

Après avoir multiplié l'équation structurelle par Γ  −1 , le système peut s'écrire sous la forme réduite comme

Il s'agit déjà d'un modèle linéaire général simple , et il peut être estimé par exemple par les moindres carrés ordinaires . Malheureusement, la tâche de décomposition de la matrice estimée en facteurs individuels Β et Γ  −1 est assez compliquée, et donc la forme réduite est plus appropriée pour la prédiction mais pas l'inférence.

Hypothèses

Premièrement, le rang de la matrice X des régresseurs exogènes doit être égal à k , à la fois dans les échantillons finis et dans la limite comme T → ∞ (cette dernière exigence signifie qu'à la limite l'expression doit converger vers une matrice k × k non dégénérée ) . La matrice Γ est également supposée non dégénérée.

Deuxièmement, les termes d'erreur sont supposés être indépendants en série et répartis de manière identique . Autrement dit, si la t ème ligne de la matrice U est notée u ( t ) , alors la séquence de vecteurs { u ( t ) } devrait être iid, avec une moyenne nulle et une matrice de covariance Σ (qui est inconnue). En particulier, cela implique que E [ U ] = 0 , et E [ U′U ] = T  Σ .

Enfin, des hypothèses sont nécessaires pour l'identification.

Identification

Les conditions d'identification exigent que le système d'équations linéaires puisse être résolu pour les paramètres inconnus.

Plus précisément, la condition d'ordre, condition nécessaire à l'identification, est que pour chaque équation k i + n i ≤ k , qui peut être formulée comme «le nombre de variables exogènes exclues est supérieur ou égal au nombre de variables endogènes incluses» .

La condition de rang , une condition plus forte qui est nécessaire et suffisante, est que le rang de Π i 0 est égal à n i , où Π i 0 est une matrice ( k - k i ) × n i qui s'obtient à partir de Π en barrant ces les colonnes qui correspondent aux variables endogènes exclues et les lignes qui correspondent aux variables exogènes incluses.

Utilisation de restrictions d'équations croisées pour parvenir à l'identification

Dans les modèles d'équations simultanées, la méthode la plus courante pour réaliser l' identification consiste à imposer des restrictions de paramètres à l'intérieur de l'équation. Pourtant, l'identification est également possible en utilisant des restrictions d'équations croisées.

Pour illustrer comment les restrictions d'équations croisées peuvent être utilisées pour l'identification, considérons l'exemple suivant de Wooldridge

où les z ne sont pas corrélés avec les u et les y sont des variables endogènes . Sans autres restrictions, la première équation n'est pas identifiée car il n'y a pas de variable exogène exclue. La deuxième équation est simplement identifiée si δ 13 ≠ 0 , ce qui est supposé être vrai pour le reste de la discussion.

Maintenant, nous imposons la restriction d'équation croisée de δ 12 = δ 22 . Puisque la deuxième équation est identifiée, nous pouvons traiter δ 12 comme étant connu à des fins d'identification. Ensuite, la première équation devient:

Ensuite, nous pouvons utiliser ( z 1 , z 2 , z 3 ) comme instruments pour estimer les coefficients dans l'équation ci-dessus car il y a une variable endogène ( y 2 ) et une variable exogène exclue ( z 2 ) sur le côté droit. Par conséquent, des restrictions d'équations croisées au lieu de restrictions intra-équations peuvent permettre l'identification.

Estimation

Moindres carrés en deux étapes (2SLS)

La méthode d'estimation la plus simple et la plus courante pour le modèle d'équations simultanées est la méthode des moindres carrés en deux étapes , développée indépendamment par Theil (1953) et Basmann (1957) . Il s'agit d'une technique d'équation par équation, dans laquelle les régresseurs endogènes du côté droit de chaque équation sont instrumentés avec les régresseurs X de toutes les autres équations. La méthode est dite «en deux étapes» car elle effectue une estimation en deux étapes:

Étape 1 : régresser Y −i sur X et obtenir les valeurs prédites ;
Étape 2 : Estimer γ i , β i par la régression des moindres carrés ordinaires de y i on et X i .

Si la i ème équation du modèle s'écrit

Z i est une matrice T × ( n i  + k i ) des régresseurs endogènes et exogènes dans la i ème équation, et δ i est un vecteur ( n i  + k i ) -dimensionnel des coefficients de régression, alors l'estimateur 2SLS de δ i sera donné par

P = X  ( X  ' X ) -1 X  ' est la matrice de projection sur l'espace linéaire engendré par les régresseurs exogènes X .

Moindres carrés indirects

Les moindres carrés indirects sont une approche en économétrie où les coefficients dans un modèle d'équations simultanées sont estimés à partir du modèle de forme réduite en utilisant les moindres carrés ordinaires . Pour cela, le système structurel d'équations est d'abord transformé en forme réduite. Une fois les coefficients estimés, le modèle est remis sous sa forme structurelle.

Maximum de vraisemblance d'information limitée (LIML)

La méthode du maximum de vraisemblance «à information limitée» a été suggérée par MA Girshick en 1947, et officialisée par TW Anderson et H. Rubin en 1949. Elle est utilisée lorsque l'on s'intéresse à estimer une seule équation structurelle à la fois (d'où son nom d'information limitée ), disons pour l'observation i:

Les équations structurelles pour les variables endogènes restantes Y −i ne sont pas spécifiées, et elles sont données sous leur forme réduite:

La notation dans ce contexte est différente de celle du cas IV simple . L'un a:

  • : La ou les variables endogènes.
  • : La ou les variables exogènes
  • : Le ou les instruments (souvent désignés )

La formule explicite du LIML est:

M = I - X  ( X  ′ X ) −1 X  ′ , et λ est la plus petite racine caractéristique de la matrice:

où, de manière similaire, M i = I - X i  ( X i X i ) −1 X i .

En d'autres termes, λ est la plus petite solution du problème généralisé des valeurs propres , voir Theil (1971 , p. 503):

Estimateurs de classe K

Le LIML est un cas particulier des estimateurs de classe K:

avec:

Plusieurs estimateurs appartiennent à cette classe:

  • κ = 0: OLS
  • κ = 1: 2SLS. A noter en effet que dans ce cas, la matrice de projection habituelle du 2SLS
  • κ = λ: LIML
  • κ = λ - α (nK): estimateur de Fuller (1977) . Ici, K représente le nombre d'instruments, n la taille de l'échantillon et α une constante positive à spécifier. Une valeur de α = 1 donnera un estimateur approximativement sans biais.

Moindres carrés à trois degrés (3SLS)

L'estimateur des moindres carrés en trois étapes a été introduit par Zellner et Theil (1962) . Il peut être vu comme un cas particulier de GMM multi-équations où l'ensemble des variables instrumentales est commun à toutes les équations. Si tous les régresseurs sont en fait prédéterminés, alors 3SLS se réduit à des régressions apparemment non liées (SUR). Ainsi, il peut également être considéré comme une combinaison de moindres carrés en deux étapes (2SLS) avec SUR.

Applications en sciences sociales

Dans tous les domaines et disciplines, des modèles d'équations simultanées sont appliqués à divers phénomènes d'observation. Ces équations sont appliquées lorsque les phénomènes sont supposés être réciproquement causaux. L'exemple classique est l'offre et la demande en économie . Dans d'autres disciplines, il existe des exemples tels que les évaluations des candidats et l'identification des partis ou l'opinion publique et la politique sociale en science politique ; les investissements routiers et la demande de déplacements en géographie; et le niveau de scolarité et l'entrée en matière de parentalité en sociologie ou en démographie . Le modèle d'équation simultanée nécessite une théorie de la causalité réciproque qui inclut des caractéristiques spéciales si les effets causaux doivent être estimés comme une rétroaction simultanée par opposition à des `` blocs '' unilatéraux d'une équation où un chercheur s'intéresse à l'effet causal de X sur Y tout en maintenant l'effet causal de Y sur X constant, ou lorsque le chercheur connaît le temps exact qu'il faut pour que chaque effet causal se produise, c'est-à-dire la longueur des décalages causaux. Au lieu d'effets décalés, la rétroaction simultanée signifie estimer l'impact simultané et perpétuel de X et Y l'un sur l'autre. Cela nécessite une théorie selon laquelle les effets causaux sont simultanés dans le temps, ou si complexes qu'ils semblent se comporter simultanément; un exemple courant est l'humeur des colocataires. Pour estimer les modèles de rétroaction simultanée, une théorie de l'équilibre est également nécessaire - que X et Y sont dans des états relativement stables ou font partie d'un système (société, marché, salle de classe) qui est dans un état relativement stable.

Voir également

Références

Lectures complémentaires

Liens externes