Problème d'héritabilité manquant - Missing heritability problem

Le problème de « l'héritabilité manquante » est le fait que des variations génétiques uniques ne peuvent pas expliquer une grande partie de l' héritabilité des maladies, des comportements et d'autres phénotypes . Il s'agit d'un problème qui a des implications importantes pour la médecine, car la susceptibilité d' une personne à la maladie peut dépendre davantage de « l'effet combiné de tous les gènes en arrière-plan que des gènes de la maladie au premier plan », ou le rôle des gènes peut avoir été fortement surestimé.

Le problème de « l'héritabilité manquante » a été nommé ainsi en 2008 (d'après le « problème du baryon manquant » en physique ). Le projet du génome humain a conduit à des prévisions optimistes selon lesquelles les importantes contributions génétiques à de nombreux traits et maladies (qui ont été identifiées par la génétique quantitative et la génétique comportementale en particulier) seraient bientôt cartographiées et associées à des gènes spécifiques et à leurs variantes génétiques par des méthodes telles que le candidat -des études de gènes utilisant de petits échantillons avec un séquençage génétique limité pour se concentrer sur des gènes spécifiques supposés être impliqués, examinant les types de variantes SNP . Bien que de nombreux hits aient été trouvés, ils ne se sont souvent pas reproduits dans d'autres études.

La baisse exponentielle des coûts de séquençage du génome a conduit à l'utilisation d' études GWAS qui pourraient examiner simultanément tous les gènes candidats dans des échantillons plus grands que la découverte initiale, où les résultats du gène candidat se sont avérés presque toujours des faux positifs et seulement 2 à 6 % de réplication ; dans le cas spécifique des hits de gène candidat de l' intelligence , un seul hit de gène candidat s'est répliqué, les 25 principaux gènes candidats de la schizophrénie n'étaient pas plus associés à la schizophrénie qu'au hasard, et sur 15 hits de neuroimagerie, aucun ne l'a été. Le comité de rédaction de Behaviour Genetics a noté, en fixant des exigences plus strictes pour les publications de gènes candidats, que "la littérature sur les associations de gènes candidats est pleine de rapports qui n'ont pas résisté à une réplication rigoureuse... il semble maintenant probable que bon nombre des les résultats publiés de la dernière décennie sont erronés ou trompeurs et n'ont pas contribué à de réels progrès dans la connaissance ». D'autres chercheurs ont caractérisé la littérature comme ayant « donné une infinité de publications avec très peu de réplications cohérentes » et ont appelé à une élimination progressive des études de gènes candidats en faveur des scores polygéniques .

Cela a conduit à un dilemme. Les méthodes génétiques standard ont longtemps estimé de grandes héritabilités telles que 80% pour des traits tels que la taille ou l'intelligence, mais aucun des gènes n'avait été trouvé malgré des tailles d'échantillons qui, bien que petites, auraient dû être capables de détecter des variantes de taille d'effet raisonnable telles que 1 pouces ou 5 points de QI. Si les gènes ont des effets cumulatifs si forts, où étaient-ils ? Plusieurs résolutions ont été proposées, que l'héritabilité manquante est une combinaison de :

  1. Les études sur les jumeaux et d'autres méthodes étaient grossièrement biaisées par des problèmes soulevés depuis longtemps par leurs détracteurs ; il y avait peu d'influence génétique à trouver. Par conséquent, il a été proposé que les gènes qui sont censés sous-tendre les estimations génétiques du comportement de l'héritabilité n'existent tout simplement pas.
  2. Les effets génétiques sont en fait épigénétiques .
  3. Les effets génétiques sont généralement non additifs et dus à des interactions complexes. Parmi de nombreuses propositions, un modèle a été introduit qui prend en compte l' hérédité épigénétique sur le risque et le risque de récurrence d'une maladie complexe. Le modèle de voie limitante (LP) a été introduit dans lequel un trait dépend de la valeur des entrées k qui peuvent avoir des limitations de vitesse en raison des rapports stoechiométriques , des réactifs requis dans une voie biochimique ou des protéines requises pour la transcription d'un gène. Chacune de ces k entrées est un trait strictement additif qui dépend d'un ensemble de variantes communes ou rares. Lorsque k = 1, le modèle LP est simplement un trait additif standard.
  4. Les effets génétiques ne sont pas dus aux SNP courants examinés dans les études sur les gènes candidats et les GWAS, mais dus à des mutations très rares, des variations du nombre de copies et d'autres types exotiques de variantes génétiques. Ces variantes ont tendance à être nocives et maintenues à de basses fréquences par la sélection naturelle. Le séquençage du génome entier serait nécessaire pour retrouver des variantes rares spécifiques.
  5. Les traits sont tous des diagnostics erronés : la « schizophrénie » d'une personne est due à des causes entièrement différentes de celles d'une autre, et ainsi, même s'il peut y avoir un gène impliqué dans un cas, il ne sera pas impliqué dans un autre, ce qui rend les GWAS futiles.
  6. Les GWAS sont incapables de détecter les gènes ayant des effets modérés sur les phénotypes lorsque ces gènes se séparent à des fréquences élevées.
  7. Les traits sont authentiques mais diagnostiqués de manière incohérente ou influencés génétiquement d'un pays à l'autre et de temps en temps, ce qui entraîne une erreur de mesure , qui, combinée à l'hétérogénéité génétique, due à l'origine ethnique ou à l'environnement, biaisera les résultats GWAS et GCTA méta-analysés vers zéro.
  8. L'hypothèse de plasticité indique que les maladies complexes sont principalement le résultat de modes de vie sélectionnés et que l'ADN donne au corps une capacité de plasticité pour s'adapter à nos choix. Le mécanisme sous-jacent qui permet au corps de posséder une telle capacité est l' épigénétique . Par conséquent, mesurer le risque génétique au niveau individuel n'est pas fructueux parce que les gens choisissent des modes de vie différents. Cette hypothèse est résumée comme suit : Mode de vie sélectionné → Changements épigénétiques → Résultat de la maladie
  9. Les effets génétiques sont en effet à travers des SNP communs agissant de manière additive, mais sont hautement polygéniques : dispersés sur des centaines ou des milliers de variantes chacune de petit effet comme une fraction de pouce ou un cinquième d'un point de QI et avec une faible probabilité a priori : suffisamment inattendu pour qu'un candidat -L'étude des gènes est peu susceptible de sélectionner le bon SNP parmi des centaines de milliers de SNP connus, et les GWAS jusqu'en 2010, avec n < 20 000, seraient incapables de trouver des résultats qui atteignent des seuils de signification statistique à l'échelle du génome. Des tailles d'échantillons GWAS beaucoup plus grandes, souvent n > 100 000, seraient nécessaires pour trouver des résultats, et augmenteraient régulièrement par la suite.
Cette résolution du problème d'héritabilité manquante a été soutenue par l'introduction de l' analyse des traits complexes à l'échelle du génome (GCTA) en 2010, qui a démontré que la similitude des traits pouvait être prédite par la similitude génétique d'étrangers non apparentés sur les SNP communs traités de manière additive, et pour de nombreux traits l'héritabilité du SNP était en effet une fraction substantielle de l'héritabilité globale. Les résultats de la GCTA ont été renforcés par les découvertes selon lesquelles un faible pourcentage de la variance des traits pouvait être prédit dans les GWAS sans aucun impact statistiquement significatif à l'échelle du génome par un modèle linéaire incluant tous les SNP, quelle que soit la valeur p ; s'il n'y avait pas de contribution de SNP, cela serait peu probable, mais ce serait ce que l'on attend des SNP dont les effets sont estimés de manière très imprécise par un échantillon trop petit. Combiné avec la limite supérieure des tailles d'effet maximales fixées par les GWAS jusqu'alors, cela impliquait fortement que la théorie hautement polygénique était correcte. La taille, l'intelligence et la schizophrénie sont des exemples de traits complexes où des GWAS de plus en plus à grande échelle ont donné les résultats initiaux, puis un nombre croissant de résultats à mesure que la taille des échantillons passait de n <20 000 à n > 100 000 ou n > 300 000 .

Les références