Typage de séquence multilocus - Multilocus sequence typing

Le typage de séquences multilocus ( MLST ) est une technique de biologie moléculaire pour le typage de loci multiples . La procédure caractérise les isolats d'espèces microbiennes à l'aide des séquences d'ADN de fragments internes de plusieurs gènes domestiques . Environ 450-500 pb des fragments internes de chaque gène sont utilisés, car ils peuvent être séquencés avec précision sur les deux brins à l'aide d'un séquenceur d'ADN automatisé. Pour chaque gène domestique, les différentes séquences présentes au sein d'une espèce bactérienne sont attribuées en tant qu'allèles distincts et, pour chaque isolat, les allèles à chacun des loci définissent le profil allélique ou le type de séquence (ST).

Le premier schéma MLST développé était pour Neisseria meningitidis , l' agent causal de la méningite à méningocoques et de la septicémie . Depuis son introduction pour la recherche de l'histoire de l'évolution, MLST a été utilisé non seulement pour les agents pathogènes humains mais aussi pour les agents pathogènes des plantes.

Principe

MLST mesure directement les variations de séquence d'ADN dans un ensemble de gènes de ménage et caractérise les souches par leurs profils alléliques uniques. Le principe du MLST est simple : la technique consiste en une amplification par PCR suivie d' un séquençage d'ADN . Les différences nucléotidiques entre les souches peuvent être vérifiées à un nombre variable de gènes en fonction du degré de discrimination souhaité.

Le flux de travail de MLST comprend : 1) la collecte de données, 2) l'analyse des données et 3) l'analyse des séquences multilocus. Dans l'étape de collecte de données, l'identification définitive de la variation est obtenue par détermination de la séquence nucléotidique des fragments de gènes. Dans l'étape d'analyse des données, toutes les séquences uniques se voient attribuer des numéros d'allèle et sont combinées en un profil allélique et un type de séquence (ST) est attribué. Si de nouveaux allèles et ST sont trouvés, ils sont stockés dans la base de données après vérification. Dans l'étape d'analyse finale du MLST, la parenté des isolats est établie en comparant les profils alléliques. Les chercheurs réalisent des études épidémiologiques et phylogénétiques en comparant les ST de différents complexes clonaux. Un vaste ensemble de données est produit au cours du processus de séquençage et d'identification, de sorte que des techniques bioinformatiques sont utilisées pour organiser, gérer, analyser et fusionner toutes les données biologiques.

Pour trouver l'équilibre entre la puissance d'identification acceptable, le temps et le coût du typage de la souche, environ sept à huit gènes de ménage sont couramment utilisés dans les laboratoires. Citant Staphylococcus aureus comme exemple, sept gènes de ménage sont utilisés dans le typage MLST. Ces gènes comprennent la carbamate kinase ( arcC ), la shikimate déshydrogénase ( aroE ), la glycérol kinase ( glpF ), la guanylate kinase ( gmk ), la phosphate acétyltransférase ( pta ), la triosephosphate isomérase ( tpi ) et l'acétyl coenzyme A acétyltransférase ( yqiLtransférase ) comme spécifié par le Site Web du MLST. Cependant, il n'est pas rare que jusqu'à dix gènes d'entretien soient utilisés. Pour Vibrio vulnificus , les gènes d'entretien utilisés sont la glucose-6-phosphate isomérase ( glp ), l'ADN gyrase, la sous-unité B ( gyrB ), la malate-lactate déshydrogénase ( mdh ), la méthionyl-ARNt synthétase ( metG ), la phosphoribosylaminoimidazole synthétase ( purM ), la thréonine déshydrogénase ( dtdS ), la diaminopimélate décarboxylase ( lysA ), la sous-unité alpha de la transhydrogénase ( pntA ), la dihydroorotase ( pyrC ) et la tryptophanase ( tnaA ). Ainsi, le nombre et le type de gènes de ménage interrogés par MLST peuvent différer d'une espèce à l'autre.

Pour chacun de ces gènes de ménage, les différentes séquences sont attribuées en tant qu'allèles et les allèles au niveau des loci fournissent un profil allélique. Une série de profils peut alors être le marqueur d'identification pour le typage des souches. Les séquences qui diffèrent même au niveau d'un seul nucléotide sont attribuées en tant qu'allèles différents et aucune pondération n'est donnée pour prendre en compte le nombre de différences de nucléotides entre les allèles, car nous ne pouvons pas distinguer si les différences au niveau de plusieurs sites nucléotidiques sont le résultat de plusieurs mutations ponctuelles ou d'un seul échange recombinatoire. Le grand nombre d'allèles potentiels à chacun des loci permet de distinguer des milliards de profils alléliques différents, et une souche avec l'allèle le plus courant à chaque locus ne devrait apparaître par hasard qu'environ une fois sur 10 000 isolats. Bien que le MLST fournisse un pouvoir discriminatoire élevé, l'accumulation de modifications nucléotidiques dans les gènes d'entretien est un processus relativement lent et le profil allélique d'un isolat bactérien est suffisamment stable dans le temps pour que la méthode soit idéale pour l'épidémiologie mondiale.

La parenté des isolats est affichée sous la forme d'un dendrogramme construit à l'aide de la matrice des différences par paires entre leurs profils alléliques, eBURST ou un arbre couvrant minimum (MST). Le dendrogramme n'est qu'un moyen pratique d'afficher les isolats qui ont des profils alléliques identiques ou très similaires qui peuvent être supposés être dérivés d'un ancêtre commun ; les relations entre les isolats qui diffèrent à plus de trois loci sur sept sont susceptibles d'être peu fiables et ne doivent pas être considérées comme inférant leur phylogénie. Le MST connecte tous les échantillons de manière à ce que la distance additionnée de toutes les branches de l'arbre soit minimale.

Alternativement, la parenté des isolats peut également être analysée avec Analyse de séquence multilocus ( MLSA ). Cela n'utilise pas les allèles attribués, mais concatène à la place les séquences des fragments de gènes des gènes de ménage et utilise cette séquence concaténée pour déterminer les relations phylogénétiques. Contrairement à MLST, cette analyse attribue une similitude plus élevée entre les séquences ne différant que d'un seul nucléotide et une similitude plus faible entre les séquences avec de multiples différences de nucléotides. En conséquence, cette analyse est plus adaptée aux organismes à évolution clonale et moins adaptée aux organismes dans lesquels des événements de recombinaison se produisent très souvent. Il peut également être utilisé pour déterminer les relations phylogénétiques entre des espèces étroitement apparentées. Les termes MLST et MLSA sont très souvent considérés comme interchangeables. Ceci n'est cependant pas correct car chaque méthode d'analyse a ses particularités et ses utilisations. Il faut veiller à utiliser le terme correct.

Comparaison avec d'autres techniques

Des approches de typage sérologique antérieures avaient été établies pour différencier les isolats bactériens, mais le typage immunologique présente des inconvénients tels que le recours à quelques loci antigéniques et des réactivités imprévisibles d'anticorps avec différents variants antigéniques. Plusieurs schémas de typage moléculaire ont été proposés pour déterminer la parenté des agents pathogènes tels que l'électrophorèse sur gel en champ pulsé ( PFGE ), le ribotypage et les empreintes digitales basées sur la PCR . Mais ces méthodes de sous-typage basées sur les bandes d'ADN ne fournissent pas d'analyses évolutives significatives. Bien que la PFGE soit considérée par de nombreux chercheurs comme le «gold standard», de nombreuses souches ne sont pas typables par cette technique en raison de la dégradation de l'ADN au cours du processus (frottis de gel).

L'approche de la MLST est distincte de l'électrophorèse enzymatique multi-locus (MLEE), qui est basée sur différentes mobilités électrophorétiques (EM) de plusieurs enzymes métaboliques de base. Les allèles de chaque locus définissent le ME de leurs produits, car différentes séquences d'acides aminés entre les enzymes entraînent des mobilités différentes et des bandes distinctes lorsqu'elles sont exécutées sur un gel. La parenté des isolats peut ensuite être visualisée avec un dendrogramme généré à partir de la matrice des différences par paires entre les types électrophorétiques. Cette méthode a une résolution inférieure à celle du MLST pour plusieurs raisons, toutes découlant du fait que la diversité phénotypique enzymatique n'est qu'une approximation de la diversité des séquences d'ADN. Premièrement, les enzymes peuvent avoir des séquences d'acides aminés différentes sans avoir un ME suffisamment différent pour donner des bandes distinctes. Deuxièmement, des "mutations silencieuses" peuvent altérer la séquence d'ADN d'un gène sans altérer les acides aminés codés. Troisièmement, le phénotype de l'enzyme peut facilement être modifié en réponse aux conditions environnementales et affecter gravement la reproductibilité des résultats de la MLEE - les modifications courantes des enzymes sont la phosphorylation, la liaison au cofacteur et le clivage des séquences de transport. Cela limite également la comparabilité des données MLEE obtenues par différents laboratoires, alors que MLST fournit des données de séquence d'ADN portables et comparables et a un grand potentiel d'automatisation et de normalisation.

Le MLST ne doit pas être confondu avec le code-barres ADN . Ce dernier est une méthode taxonomique qui utilise des marqueurs génétiques courts pour reconnaître des espèces particulières d'eucaryotes. Il est basé sur le fait que l'ADN mitochondrial (ADNmt) ou certaines parties du cistron de l' ADN ribosomique ont des taux de mutation relativement rapides, ce qui donne une variation significative des séquences entre les espèces. Les méthodes ADNmt ne sont possibles que chez les eucaryotes (car les procaryotes manquent de mitochondries), alors que la MLST, bien qu'initialement développée pour les procaryotes, trouve maintenant une application chez les eucaryotes et pourrait en principe être appliquée à n'importe quel règne.

Avantages et applications

MLST est très clair et portable. Les matériaux nécessaires à la détermination de ST peuvent être échangés entre les laboratoires. Les séquences d'amorces et les protocoles sont accessibles par voie électronique. Il est reproductible et évolutif. MLST est automatisé, combine les avancées en matière de séquençage à haut débit et de bioinformatique avec des techniques de génétique des populations établies. Les données MLST peuvent être utilisées pour étudier les relations évolutives entre les bactéries. MLST offre un bon pouvoir de discrimination pour différencier les isolats.

L'application de MLST est énorme et fournit une ressource pour les communautés scientifiques, de santé publique et vétérinaires ainsi que pour l'industrie alimentaire. Voici des exemples d'applications MLST.

Campylobacter

Campylobacter est l'agent causal commun des maladies intestinales infectieuses bactériennes, résultant généralement de la volaille insuffisamment cuite ou du lait non pasteurisé. Cependant, son épidémiologie est mal comprise car les épidémies sont rarement détectées, de sorte que les sources et les voies de transmission des épidémies ne sont pas faciles à retracer. De plus, lesgénomes de Campylobacter sont génétiquement divers et instables avec de fréquentes recombinaisons inter et intragénomiques, ainsi qu'une variation de phase, ce qui complique l'interprétation des données de nombreuses méthodes de typage. Jusqu'à récemment, avec l'application de la technique MLST, letypage de Campylobacter a obtenu un grand succès et a été ajouté à la base de données MLST. Au 1er mai 2008, labase de données Campylobacter MLST contient 3516 isolats et environ 30 publications qui utilisent ou mentionnent MLST dans la recherche sur Campylobacter ( http://pubmlst.org/campylobacter/ ).

Neisseria meningitidis

MLST a fourni une image plus richement texturée des bactéries au sein des populations humaines et sur les variantes de souches qui peuvent être pathogènes pour l'homme, les plantes et les animaux. La technique MLST a été utilisée pour la première fois par Maiden et al. (1) pour caractériser Neisseria meningitidis en utilisant six loci. L'application du MLST a clairement résolu les principales lignées méningococciques connues pour être responsables de maladies invasives dans le monde. Pour améliorer le niveau de pouvoir discriminant entre les principales lignées invasives, sept loci sont maintenant utilisés et ont été acceptés par de nombreux laboratoires comme méthode de choix pour caractériser les isolats méningococciques. C'est un fait bien connu que les échanges recombinaisons se produisent couramment chez N. meningitidis , conduisant à une diversification rapide des clones méningococciques. MLST a fourni avec succès une méthode fiable pour la caractérisation de clones au sein d'autres espèces bactériennes dans lesquelles les taux de diversification clonale sont généralement plus faibles.

Staphylococcus aureus

S. aureus provoque un certain nombre de maladies. Le S. aureus résistant à la méthicilline ( SARM ) a suscité des inquiétudes croissantes quant à sa résistance à presque tous les antibiotiques, à l'exception de la vancomycine. Cependant, lesinfections à S. aureus les plus gravesdans la communauté, et beaucoup dans les hôpitaux, sont causées par des isolats sensibles à la méthicilline (SASM) et il y a eu peu de tentatives pour identifier les clones MSSA hypervirulents associés à une maladie grave. Le MLST a donc été développé pour fournir une méthode sans ambiguïté de caractérisation des clones de SARM et pour l'identification des clones de MSSA associés à une maladie grave.

Streptocoque pyogène

S. pyogenes provoque des maladies allant de la pharyngite à l'impétigo potentiellement mortel, y compris la fasciite nécrosante. Un schéma MLST pour S. pyogenes a été développé. À l'heure actuelle, la base de données ( mlst.net ) contient les profils alléliques des isolats qui représentent la diversité mondiale de l'organisme et des isolats de maladies invasives graves.

Candida albicans

C. albicans est un pathogène fongique de l'homme et est responsable d'infections sanguines nosocomiales. La technique MLST a été utilisée pour caractériser lesisolats de C. albicans . La combinaison des allèles aux différents loci donne des types de séquences diploïdes uniques qui peuvent être utilisés pour discriminer les souches. MLST s'est avéré appliqué avec succès pour étudier l'épidémiologie de C. albicans à l'hôpital ainsi que la diversité desisolatsde C. albicans obtenus à partir de diverses niches écologiques comprenant des hôtes humains et animaux.

Cronobacter

Le genre Cronobacter est composé de 7 espèces. Avant 2007, le nom d'espèce unique Enterobacter sakazakii était appliqué à ces organismes. Le Cronobacter MLST a été initialement appliqué pour faire la distinction entre C. sakazakii et C. malonaticus car le séquençage de l'ADNr 16S n'est pas toujours assez précis et le biotypage est trop subjectif. Le schéma Cronobacter MLST utilise 7 allèles ; atpD , fusA , glnS , gltB , gyrB , infB et ppsA donnant une séquence concaténée de 3036 pb pour l'analyse phylogénétique (MLSA) et la génomique comparative. MLST a également été utilisé dans la reconnaissance formelle de nouvelles espèces de Cronobacter . La méthode a révélé une forte association entre une lignée génétique, une séquence de type 4 (ST4) et des cas de méningite néonatale. Le site Cronobacter MLST se trouve à l' adresse http://www.pubMLST.org/cronobacter .

Limites

Le MLST apparaît le mieux dans l'étude génétique des populations, mais il est coûteux. En raison de la conservation des séquences dans les gènes de ménage, la MLST n'a parfois pas le pouvoir discriminant de différencier les souches bactériennes, ce qui limite son utilisation dans les enquêtes épidémiologiques. Pour améliorer le pouvoir discriminant du MLST, une approche de typage de séquences multi-locus de virulence (MVLST) a été développée en utilisant Listeria monocytogenes . La MVLST élargit les avantages de la MLST mais cible les gènes de virulence, qui peuvent être plus polymorphes que les gènes domestiques. La génétique des populations n'est pas le seul facteur pertinent dans une épidémie. Les facteurs de virulence sont également importants pour provoquer la maladie, et les études de génétique des populations ont du mal à les surveiller. En effet, les gènes impliqués sont souvent hautement recombinés et mobiles entre les souches par rapport au cadre génétique de la population. Ainsi, par exemple chez Escherichia coli , l'identification des souches portant des gènes de toxines est plus importante que d'avoir une évaluation basée sur la génétique des populations des souches prévalentes.

L'avènement des technologies de séquençage de deuxième génération a permis d'obtenir des informations de séquence sur l'ensemble du génome bactérien à un coût et des efforts relativement modestes, et la MLST peut désormais être attribuée à partir des informations de séquence du génome entier, plutôt que de séquencer chaque locus séparément comme c'était le cas pour pratique lorsque MLST a été développé pour la première fois. Le séquençage du génome entier fournit des informations plus riches pour différencier les souches bactériennes (MLST utilise environ 0,1% de la séquence génomique pour attribuer le type tout en ignorant le reste du génome bactérien). Par exemple, le séquençage du génome entier de nombreux isolats a révélé que la seule lignée MLST ST258 de Klebsiella pneumoniae comprend deux clades génétiques distincts, fournissant des informations supplémentaires sur l'évolution et la propagation de ces organismes multirésistants, et réfutant l'hypothèse précédente d'un seul origine clonale pour ST258.

Bases de données

Les bases de données MLST contiennent les séquences alléliques de référence et les types de séquences pour chaque organisme, et isolent également les données épidémiologiques. Les sites Web contiennent des logiciels d'interrogation et d'analyse qui permettent aux utilisateurs d'interroger leurs séquences alléliques et leurs types de séquences. Le MLST est largement utilisé comme outil pour les chercheurs et les travailleurs de la santé publique.

La majorité des bases de données MLST sont hébergées sur 2 serveurs Web actuellement situés à l'Imperial College de Londres ( mlst.net ) et à l'Université d'Oxford ( pubmlst.org ).

Les bases de données hébergées sur chaque site sont différentes et contiennent les séquences d'allèles de référence spécifiques à l'organisme et les listes de ST pour les organismes individuels.

Pour faciliter la collecte et la mise en forme des séquences utilisées, un plug-in simple et gratuit pour Firefox a été développé ( lien ).

Les références

Liens externes

Articles de journaux