Cartographie des associations - Association mapping

En génétique, la cartographie d'association , également connue sous le nom de « mapping de déséquilibre de liaison », est une méthode de cartographie des loci de traits quantitatifs (QTL) qui tire parti du déséquilibre de liaison historique pour lier les phénotypes (caractéristiques observables) aux génotypes (la constitution génétique des organismes), découvrir des associations génétiques .

Théorie

La cartographie d'association est basée sur l'idée que les traits qui ne sont entrés dans une population que récemment seront toujours liés à la séquence génétique environnante de l'ancêtre évolutif d'origine, ou en d'autres termes, seront plus souvent trouvés dans un haplotype donné qu'en dehors de celui-ci. . Il est le plus souvent effectué en scannant l'ensemble du génome pour rechercher des associations significatives entre un panel de polymorphismes nucléotidiques simples (SNP) (qui, dans de nombreux cas, sont repérés sur des lames de verre pour créer des « puces SNP ») et un phénotype particulier. Ces associations doivent ensuite être vérifiées de manière indépendante afin de montrer qu'elles (a) contribuent directement au trait d'intérêt, ou (b) sont liées à/en déséquilibre de liaison avec un locus de trait quantitatif (QTL) qui contribue au trait de intérêt.

La cartographie d'association cherche à identifier des variantes génétiques fonctionnelles spécifiques (loci, allèles) liées à des différences phénotypiques dans un trait pour faciliter la détection des polymorphismes de séquence d'ADN et la sélection de génotypes qui ressemblent étroitement au phénotype. Afin d'identifier ces variantes fonctionnelles, il faut des marqueurs à haut débit comme les SNP.

Utiliser

L'avantage de la cartographie d'association est qu'elle peut cartographier des traits quantitatifs avec une haute résolution d'une manière statistiquement très puissante. La cartographie des associations, cependant, nécessite également une connaissance approfondie des SNP au sein du génome de l'organisme d'intérêt, et est donc difficile à réaliser chez les espèces qui n'ont pas été bien étudiées ou qui n'ont pas de génomes bien annotés . La cartographie des associations a été le plus largement appliquée à l'étude des maladies humaines, en particulier sous la forme d'une étude d'association pangénomique (GWAS). Une étude d'association à l'échelle du génome est réalisée en scannant un génome entier pour les SNP associés à un trait d'intérêt particulier ou, dans le cas d'une maladie humaine, à une maladie d'intérêt particulière. À ce jour, des milliers d'études d'associations à l'échelle du génome ont été réalisées sur le génome humain pour tenter d'identifier les SNP associés à une grande variété de maladies humaines complexes (par exemple, le cancer , la maladie d'Alzheimer et l' obésité ). Les résultats de tous ces GWAS publiés sont conservés dans une base de données du NIH (figure 1). L'utilité clinique et/ou thérapeutique de ces études reste cependant controversée.

Figure 1. Associations à l'échelle du génome publiées jusqu'en 6/2009, 439 GWA publiés à p  < 5 × 10 -8 .

Types et variantes

(A) Cartographie des associations dans la population où les membres sont supposés être indépendants.

Plusieurs méthodes standard pour tester l'association. Études cas-témoins – Les études cas-témoins ont été parmi les premières approches utilisées pour déterminer si une variante génétique particulière est associée à un risque accru de maladie chez l'homme. Woofle, en 1955, a proposé une statistique de risque relatif qui pourrait être utilisée pour évaluer le risque dépendant du génotype. Cependant, la préoccupation persistante concernant ces études est l'adéquation des cas et des témoins appariés. En particulier, la stratification de la population peut produire des associations faussement positives. En réponse à cette préoccupation, Falk et Rubenstein (1987) ont suggéré une méthode d'évaluation du risque relatif qui utilise des contrôles basés sur la famille, évitant cette source d'erreur potentielle. Fondamentalement, la méthode utilise un échantillon témoin des allèles parentaux ou des haplotypes non transmis à la progéniture affectée.

(B) Population de cartographie d'association où les membres sont supposés être liés

Dans le monde réel, il est très difficile de trouver des individus indépendants (non apparentés). La cartographie d'association basée sur la population a été modifiée pour contrôler la stratification ou la parenté de la population dans la cartographie d'association imbriquée . Il existe néanmoins une autre limitation dans la cartographie QTL basée sur la population ; lorsque la fréquence de l'allèle favorable doit être relativement élevée pour être détectée. Les allèles généralement favorables sont des allèles mutants rares (par exemple, un parent résistant peut généralement être 1 sur 10 000 génotypes). Une autre variante de la cartographie des associations dans les populations apparentées est la cartographie des associations familiales. Dans la cartographie d'association basée sur la famille au lieu de plusieurs individus non apparentés, plusieurs familles ou pedigrees non apparentés sont utilisés. La cartographie d'association basée sur la famille peut être utilisée dans des situations où les allèles mutants ont été introgressés dans des populations. Une cartographie d'association familiale populaire est le test de déséquilibre de transmission. Pour plus de détails, voir Mappage QTL basé sur la famille .

Avantages

Les avantages de la cartographie d'association basée sur la population, utilisant un échantillon d'individus des collections de matériel génétique ou d'une population naturelle, par rapport à la cartographie traditionnelle des QTL dans les croisements biparentaux, sont principalement dus à la disponibilité de variations génétiques plus larges avec un contexte plus large pour les corrélations de marqueurs et de traits. L'avantage de la cartographie d'association est qu'elle peut cartographier des traits quantitatifs avec une haute résolution d'une manière statistiquement très puissante. La résolution de la cartographie dépend de l'étendue de la LD , ou association non aléatoire de marqueurs, qui s'est produite dans le génome. La cartographie des associations offre la possibilité d'étudier divers matériels génétiques et d'identifier potentiellement plusieurs allèles et mécanismes de traits sous-jacents. Il utilise des événements de recombinaison qui se sont produits sur une longue période de temps. La cartographie d'association permet la possibilité d'exploiter les données de traits historiquement mesurées pour l'association, et enfin n'a pas besoin de développer des populations biparentales coûteuses et fastidieuses qui rendent l'approche rapide et rentable.

Limites

Un problème majeur avec les études d'association est la tendance à trouver des faux positifs. Les populations présentant un trait souhaité portent également une variante génétique spécifique non pas parce que la variante contrôle réellement le trait, mais en raison d'une parenté génétique. En particulier, les associations indirectes qui ne sont pas causales ne seront pas éliminées en augmentant la taille de l'échantillon ou le nombre de marqueurs. Les principales sources de ces faux positifs sont les liens entre les sites causaux et non causaux, plusieurs sites causaux et l'épistasie. Ces associations indirectes ne sont pas distribuées au hasard dans tout le génome et sont moins fréquentes que les faux positifs résultant de la structure de la population.

De même, la structure de la population est toujours restée un problème constant. La structure de la population conduit à de fausses associations entre les marqueurs et le trait. Ce n'est généralement pas un problème dans l'analyse de liaison car les chercheurs connaissent la structure génétique de la famille qu'ils ont créée. Mais dans la cartographie des associations, où les relations entre diverses populations ne sont pas nécessairement bien comprises, les associations marqueur-trait résultant de la parenté et de l'histoire évolutive peuvent facilement être confondues avec des associations causales. Cela peut être expliqué avec les modèles mixtes MLM. Également appelé modèle Q+K, il a été développé pour réduire davantage le taux de faux positifs en contrôlant à la fois la structure de la population et les liens familiaux cryptiques.

Voir également

Les références

  1. ^ un b Gibson, G.; Muse SV (2009). Une amorce de la science du génome . MA : Sinauer Associates.
  2. ^ Hoeschele, I. (2004-07-15). « Cartographier les loci de traits quantitatifs dans les pedigrees non consanguins ». Manuel de génétique statistique . Chichester : John Wiley & Sons, Ltd. doi : 10.1002/0470022620.bbc17 . ISBN 978-0470022627.
  3. ^ Yu, J.; Hollande, JB ; McMullen, MD; Buckler, ES (2008). "Conception génétique et puissance statistique de la cartographie des associations emboîtées dans le maïs" . Génétique . 178 (1) : 539-551. doi : 10.1534/génétique.107.074245 . PMC  2206100 . PMID  18202393 .
  4. ^ un b Nussbaum, RL; McInnes, RR ; Willard, HF (2007). Génétique en médecine . Philadelphie, Pennsylvanie : Saunders Elsevier.
  5. ^ Rosyara UR, JL Gonzalez-Hernandez, KD Glover, KR Gedye et JM Stein. 2009. Cartographie familiale des loci de caractères quantitatifs dans les populations de sélection végétale présentant une résistance à la brûlure de l'épi causée par Fusarium chez le blé à titre d'illustration Génétique théorique et appliquée 118:1617-1631 lien externe
  6. ^ Abdurakhmonov I., Abdukarimov A. (2008). Application de la cartographie des associations à la compréhension de la diversité génétique des ressources génétiques végétales. Journal international de génomique végétale. doi: 10.1155/2008/574927.
  7. ^ Kraakman, ATW (2004-09-01). " Cartographie du déséquilibre de liaison du rendement et de la stabilité du rendement dans les cultivars d'orge de printemps modernes " . Génétique . 168 (1) : 435-446. doi : 10.1534/génétique.104.026831 . ISSN  0016-6731 . PMC  1448125 . PMID  15454555 .
  8. ^ Platt, A.; Vilhjalmsson, BJ; Nordborg, M. (2010-09-02). « Conditions dans lesquelles les études d'association pangénomique seront positivement trompeuses » . Génétique . 186 (3) : 1045-1052. doi : 10.1534/génétique.110.121665 . ISSN  0016-6731 . PMC  2975277 . PMID  20813880 .
  9. ^ Yu, Jianming; Pressoir, Gaël ; Briggs, William H ; Vroh Bi, Irie; Yamasaki, Masanori ; Doebley, John F; McMullen, Michael D; Gaut, Brandon S; Nielsen, Dahlia M (2005-12-25). « Une méthode de modèle mixte unifiée pour la cartographie d'association qui tient compte de plusieurs niveaux de parenté ». Génétique de la nature . 38 (2) : 203-208. doi : 10.1038/ng1702 . ISSN  1061-4036 . PMID  16380716 .