Modèle mixte - Mixed model

Un modèle mixte , un modèle à effets mixtes ou un modèle mixte à composantes d' erreur est un modèle statistique contenant à la fois des effets fixes et des effets aléatoires . Ces modèles sont utiles dans une grande variété de disciplines des sciences physiques, biologiques et sociales. Ils sont particulièrement utiles dans les contextes où des mesures répétées sont effectuées sur les mêmes unités statistiques ( étude longitudinale ), ou lorsque les mesures sont effectuées sur des groupes d'unités statistiques connexes. En raison de leur avantage dans le traitement des valeurs manquantes, les modèles à effets mixtes sont souvent préférés aux approches plus traditionnelles telles que l' analyse de la variance à mesures répétées .

Cette page traitera principalement des modèles linéaires à effets mixtes (LMEM) plutôt que des modèles linéaires mixtes généralisés ou des modèles non linéaires à effets mixtes .

Historique et état actuel

Ronald Fisher a introduit des modèles à effets aléatoires pour étudier les corrélations des valeurs des traits entre les parents. Dans les années 1950, Charles Roy Henderson a fourni les meilleures estimations linéaires non biaisées des effets fixes et les meilleures prédictions linéaires non biaisées des effets aléatoires. Par la suite, la modélisation mixte est devenue un domaine majeur de la recherche statistique, y compris les travaux sur le calcul des estimations du maximum de vraisemblance, les modèles à effets mixtes non linéaires, les données manquantes dans les modèles à effets mixtes et l' estimation bayésienne des modèles à effets mixtes. Des modèles mixtes sont appliqués dans de nombreuses disciplines où plusieurs mesures corrélées sont effectuées sur chaque unité d'intérêt. Ils sont largement utilisés dans la recherche impliquant des sujets humains et animaux dans des domaines allant de la génétique au marketing, et ont également été utilisés dans le baseball et les statistiques industrielles.

Définition

En notation matricielle, un modèle mixte linéaire peut être représenté par

  • est un vecteur d'observations connu, de moyenne ;
  • est un vecteur inconnu d'effets fixes ;
  • est un vecteur inconnu d'effets aléatoires, avec moyenne et matrice de variance-covariance ;
  • est un vecteur inconnu d'erreurs aléatoires, de moyenne et de variance ;
  • et sont des matrices de conception connues reliant les observations à et , respectivement.

Estimation

La densité articulaire de et peut s'écrire : . En supposant la normalité, , et , et en maximisant la densité de joint sur et , donne les « équations de modèle mixtes » (MME) de Henderson pour les modèles linéaires mixtes :

Les solutions du MME, et sont les meilleures estimations et prédicteurs linéaires sans biais pour et , respectivement. Ceci est une conséquence du théorème de Gauss-Markov lorsque la variance conditionnelle du résultat n'est pas extensible à la matrice d'identité. Lorsque la variance conditionnelle est connue, l'estimation des moindres carrés pondérés de la variance inverse est la meilleure estimation linéaire sans biais. Cependant, la variance conditionnelle est rarement, voire jamais, connue. Il est donc souhaitable d'estimer conjointement la variance et les estimations des paramètres pondérés lors de la résolution des MME.

Une méthode utilisée pour ajuster ces modèles mixtes est celle de l' algorithme d'espérance-maximisation où les composantes de la variance sont traitées comme des paramètres de nuisance non observés dans la vraisemblance conjointe. Actuellement, c'est la méthode implémentée pour les principaux progiciels statistiques R (lme dans le package nlme, ou linear mixed-effects dans le package lme4), Python ( package statsmodels ), Julia (package MixedModels.jl) et SAS (proc mixte). La solution des équations du modèle mixte est une estimation du maximum de vraisemblance lorsque la distribution des erreurs est normale.

Voir également

Les références

Lectures complémentaires

  • Gałecki, Andrzej; Burzykowski, Tomasz (2013). Modèles linéaires à effets mixtes utilisant R : une approche pas à pas . New York : Springer. ISBN 978-1-4614-3900-4.
  • Milliken, Géorgie ; Johnson, DE (1992). Analyse des données désordonnées : Vol. I. Expériences conçues . New York : Chapman & Hall.
  • Ouest, BT ; Welch, Ko ; Galecki, AT (2007). Modèles linéaires mixtes : un guide pratique utilisant un logiciel statistique . New York : Chapman & Hall/CRC.