Élément cis-régulateur - Cis-regulatory element

Cis éléments -regulatory ( CRE ) ou Cis modules -regulatory ( les MRC ) sontrégions d' ADN non codant qui régulent la transcription des voisins gènes . Les CRE sont des composants essentiels des réseaux de régulation génétique , qui à leur tour contrôlent la morphogenèse , le développement de l' anatomie et d'autres aspects du développement embryonnaire , étudiés en biologie du développement évolutif .

Les CRE se trouvent à proximité des gènes qu'elles régulent. Les CRE régulent généralement la transcription des gènes en se liant à des facteurs de transcription . Un seul facteur de transcription peut se lier à de nombreux CRE et donc contrôler l'expression de nombreux gènes ( pléiotropie ). Le préfixe latin cis signifie « de ce côté », c'est-à-dire sur la même molécule d'ADN que le ou les gènes à transcrire.

Les MRC sont des segments d' ADN , généralement longs de 100 à 1 000 paires de bases d'ADN, où un certain nombre de facteurs de transcription peuvent se lier et réguler l'expression des gènes voisins et réguler leurs taux de transcription. Ils sont étiquetés comme cis car ils sont généralement situés sur le même brin d'ADN que les gènes qu'ils contrôlent, par opposition à trans , qui fait référence aux effets sur des gènes qui ne sont pas situés sur le même brin ou plus loin, tels que les facteurs de transcription. Un élément cis -régulateur peut réguler plusieurs gènes, et inversement, un gène peut avoir plusieurs modules cis -régulateurs. Les modules cis- régulateurs remplissent leur fonction en intégrant les facteurs de transcription actifs et les cofacteurs associés à un moment et à un endroit précis dans la cellule où cette information est lue et une sortie est donnée.

Les CRE sont souvent mais pas toujours en amont du site de transcription. Les CRE contrastent avec les éléments trans-régulateurs (TRE) . Code TRE pour les facteurs de transcription.

Aperçu

Diagramme montrant à quelles étapes de l'expression de la voie ADN-ARNm-protéine peut être contrôlée

Le génome d'un organisme contient de quelques centaines à des milliers de gènes différents, tous codant pour un produit singulier ou plus. Pour de nombreuses raisons, notamment la maintenance organisationnelle, la conservation de l'énergie et la génération de variance phénotypique , il est important que les gènes ne soient exprimés que lorsqu'ils sont nécessaires. Le moyen le plus efficace pour un organisme de réguler l'expression des gènes est au niveau transcriptionnel. Les CRE fonctionnent pour contrôler la transcription en agissant à proximité ou à l'intérieur d'un gène. Les types de CRE les mieux caractérisés sont les activateurs et les promoteurs . Ces deux éléments de séquence sont des régions structurelles de l'ADN qui servent de régulateurs transcriptionnels .

Les modules de régulation cis sont l'un des nombreux types d' éléments de régulation fonctionnels . Les éléments régulateurs sont des sites de liaison pour les facteurs de transcription, qui sont impliqués dans la régulation des gènes. Les modules de régulation cis effectuent une grande quantité de traitement d'informations de développement. Les modules de régulation cis sont des clusters non aléatoires sur leur site cible spécifié qui contiennent des sites de liaison aux facteurs de transcription.

La définition originale présentait les modules de régulation cis comme des amplificateurs de l'ADN agissant en cis, qui augmentaient le taux de transcription à partir d'un promoteur lié . Cependant, cette définition a changé pour définir les modules de régulation cis comme une séquence d'ADN avec des sites de liaison de facteur de transcription qui sont regroupés dans des structures modulaires, y compris - mais sans s'y limiter - des régions de contrôle de locus, des promoteurs, des amplificateurs, des silencieux, des éléments de contrôle des frontières et d'autres modulateurs.

Les modules cis- régulateurs peuvent être divisés en trois classes ; des activateurs , qui régulent positivement l'expression des gènes ; les isolateurs , qui fonctionnent indirectement en interagissant avec d'autres modules de régulation cis à proximité ; et des silencieux qui désactivent l'expression des gènes.

La conception des modules de régulation cis est telle que les facteurs de transcription et les modifications épigénétiques servent d'entrées, et la sortie du module est la commande donnée à la machinerie de transcription, qui à son tour détermine le taux de transcription des gènes ou s'il est activé ou éteint . Il existe deux types d'entrées de facteurs de transcription : celles qui déterminent quand le gène cible doit être exprimé et celles qui servent de moteurs fonctionnels , qui n'entrent en jeu que lors de situations spécifiques au cours du développement. Ces entrées peuvent provenir de différents moments, peuvent représenter différents ligands de signal ou peuvent provenir de différents domaines ou lignées de cellules. Cependant, beaucoup de choses restent encore inconnues.

De plus, la régulation de la structure de la chromatine et de l'organisation nucléaire joue également un rôle dans la détermination et le contrôle de la fonction des modules de régulation cis. Ainsi, les fonctions de régulation des gènes (GRF) fournissent une caractéristique unique d'un module de régulation cis (CRM), reliant les concentrations de facteurs de transcription (entrée) aux activités du promoteur (sortie). Le défi est de prédire les GRF. Ce défi n'est toujours pas résolu. En général, les fonctions de régulation des gènes n'utilisent pas la logique booléenne , bien que dans certains cas, l'approximation de la logique booléenne soit toujours très utile.

L'hypothèse de la logique booléenne

Dans l'hypothèse de la logique booléenne, les principes guidant le fonctionnement de ces modules incluent la conception du module qui détermine la fonction de régulation. En ce qui concerne le développement, ces modules peuvent générer à la fois des sorties positives et négatives. La sortie de chaque module est un produit des diverses opérations effectuées sur celui-ci. Les opérations courantes incluent la porte OU - cette conception indique que dans une sortie sera donnée lorsque l'une ou l'autre des entrées est donnée [3], et la porte ET - dans cette conception, deux facteurs réglementaires différents sont nécessaires pour s'assurer qu'une sortie positive en résulte. "Interrupteurs à bascule" - Cette conception se produit lorsque le ligand du signal est absent alors que le facteur de transcription est présent ; ce facteur de transcription finit par agir comme un répresseur dominant. Cependant, une fois que le ligand signal est présent, le rôle du facteur de transcription en tant que répresseur est éliminé et la transcription peut se produire.

D'autres opérations logiques booléennes peuvent également se produire, telles que des répresseurs transcriptionnels spécifiques à une séquence, qui, lorsqu'ils se lient au module de régulation cis, conduisent à une sortie de zéro. De plus, outre l'influence des différentes opérations logiques, la sortie d'un module de régulation "cis" sera également influencée par des événements antérieurs. 4) Les modules de régulation cis doivent interagir avec d'autres éléments de régulation. Pour la plupart, même avec la présence d'un chevauchement fonctionnel entre les modules de régulation cis d'un gène, les entrées et les sorties des modules ont tendance à ne pas être les mêmes.

Alors que l'hypothèse de la logique booléenne est importante pour la biologie des systèmes , des études détaillées montrent qu'en général la logique de la régulation des gènes n'est pas booléenne. Cela signifie, par exemple, que dans le cas d'un module de régulation cis régulé par deux facteurs de transcription, les fonctions de régulation génique déterminées expérimentalement ne peuvent pas être décrites par les 16 fonctions booléennes possibles de deux variables. Des extensions non booléennes de la logique de régulation des gènes ont été proposées pour corriger ce problème.

Classification

Les modules cis- régulateurs peuvent être caractérisés par le traitement de l'information qu'ils codent et l'organisation de leurs sites de liaison aux facteurs de transcription. De plus, les modules de régulation cis sont également caractérisés par la manière dont ils affectent la probabilité, la proportion et le taux de transcription. Les modules cis- régulateurs hautement coopératifs et coordonnés sont classés comme des Enhanceosomes . L'architecture et l'agencement des sites de liaison des facteurs de transcription sont critiques car une perturbation de l'agencement pourrait annuler la fonction. Les modules de régulation cis flexibles fonctionnels sont appelés panneaux d'affichage. Leur sortie transcriptionnelle est l'effet de sommation des facteurs de transcription liés. Les amplificateurs affectent la probabilité d'activation d'un gène, mais n'ont que peu ou pas d'effet sur le taux. Le modèle de réponse binaire agit comme un interrupteur marche/arrêt pour la transcription. Ce modèle augmentera ou diminuera la quantité de cellules qui transcrivent un gène, mais il n'affecte pas le taux de transcription. Le modèle de réponse rhéostatique décrit les modules cis-régulateurs en tant que régulateurs du taux d'initiation de la transcription de son gène associé.

Promoteur

Les promoteurs sont des CRE constitués de séquences d'ADN relativement courtes qui incluent le site où la transcription est initiée et la région approximativement 35 pb en amont ou en aval du site d'initiation (pb). Chez les eucaryotes , les promoteurs ont généralement les quatre composants suivants : la boîte TATA , un site de reconnaissance TFIIB , un initiateur et l' élément promoteur central en aval . Il a été découvert qu'un seul gène peut contenir plusieurs sites promoteurs. Afin d'initier la transcription du gène en aval, un hôte de protéines de liaison à l'ADN appelées facteurs de transcription (TF) doit se lier séquentiellement à cette région. Ce n'est qu'une fois que cette région a été liée à l'ensemble approprié de TF, et dans le bon ordre, que l' ARN polymérase peut se lier et commencer à transcrire le gène.

Améliorateurs

Les amplificateurs sont des CRE qui influencent (renforcent) la transcription de gènes sur la même molécule d'ADN et peuvent être trouvés en amont, en aval, au sein des introns , voire relativement loin du gène qu'ils régulent. Plusieurs amplificateurs peuvent agir de manière coordonnée pour réguler la transcription d'un gène. Un certain nombre de projets de séquençage à l'échelle du génome ont révélé que les amplificateurs sont souvent transcrits en ARN long non codant (lncRNA) ou en ARN amplificateur (eRNA), dont les changements de niveaux sont fréquemment en corrélation avec ceux de l'ARNm du gène cible.

Silencieux

Les silencieux sont des CRE qui peuvent lier des facteurs de régulation de la transcription (protéines) appelés répresseurs , empêchant ainsi la transcription d'un gène. Le terme "silencieux" peut également se référer à une région dans la région 3' non traduite de l'ARN messager, qui lie les protéines qui suppriment la traduction de cette molécule d'ARNm, mais cet usage est distinct de son utilisation pour décrire un CRE.

Les opérateurs

Les opérateurs sont des CRE chez les procaryotes et certains eucaryotes qui existent au sein des opérons , où ils peuvent se lier à des protéines appelées répresseurs pour affecter la transcription.

Rôle évolutif

Les CRE ont un rôle évolutif important. Les régions codantes des gènes sont souvent bien conservées parmi les organismes ; pourtant, différents organismes présentent une diversité phénotypique marquée. Il a été découvert que les polymorphismes apparaissant dans des séquences non codantes ont un effet profond sur le phénotype en modifiant l'expression des gènes . Les mutations survenant au sein d'un CRE peuvent générer une variance d'expression en modifiant la façon dont les TF se lient. Une liaison plus étroite ou plus lâche des protéines régulatrices conduira à une transcription régulée à la hausse ou à la baisse.

Cis -module de régulation dans le réseau de régulation génique

La fonction d'un réseau de régulation génique dépend de l'architecture des nœuds , dont la fonction dépend des multiples modules cis- régulateurs. La disposition des modules de régulation cis peut fournir suffisamment d'informations pour générer des modèles spatiaux et temporels d'expression génique. Au cours du développement, chaque domaine, où chaque domaine représente une région spatiale différente de l'embryon, de l'expression génique sera sous le contrôle de différents modules de régulation cis . La conception de modules de réglementation aide à produire des boucles de rétroaction , d'anticipation et de réglementation croisée.

Mode d'action

Les modules de régulation cis peuvent réguler leurs gènes cibles sur de grandes distances. Plusieurs modèles ont été proposés pour décrire la manière dont ces modules peuvent communiquer avec leur promoteur de gène cible. Ceux-ci incluent le modèle de balayage d'ADN, le modèle de boucle de séquence d'ADN et le modèle de suivi facilité. Dans le modèle de balayage d'ADN, le facteur de transcription et le complexe de cofacteur se forment au niveau du module de régulation cis , puis continuent de se déplacer le long de la séquence d'ADN jusqu'à ce qu'il trouve le promoteur du gène cible. Dans le modèle de bouclage, le facteur de transcription se lie au module de régulation cis , qui provoque alors le bouclage de la séquence d'ADN et permet l'interaction avec le promoteur du gène cible. Le complexe facteur de transcription- cis -module de régulation provoque le bouclage de la séquence d'ADN lentement vers le promoteur cible et forme une configuration en boucle stable. Le modèle de suivi facilité combine des parties des deux modèles précédents.

Identification et prédiction informatique

Outre la détermination expérimentale des CRM, il existe divers algorithmes bioinformatiques pour les prédire. La plupart des algorithmes tentent de rechercher des combinaisons significatives de sites de liaison aux facteurs de transcription ( sites de liaison à l'ADN ) dans les séquences de promoteurs de gènes co-exprimés. Des méthodes plus avancées combinent la recherche de motifs significatifs avec la corrélation dans les ensembles de données d' expression génique entre les facteurs de transcription et les gènes cibles. Les deux méthodes ont été implémentées, par exemple, dans le ModuleMaster . D'autres programmes créés pour l'identification et la prédiction des modules de régulation cis comprennent :

INSECT 2.0 est un serveur Web qui permet de rechercher des modules de régulation Cis à l'échelle du génome. Le programme repose sur la définition de restrictions strictes parmi les Transcription Factor Binding Sites (TFBS) qui composent le module afin de diminuer le taux de faux positifs. INSECT est conçu pour être convivial car il permet la récupération automatique de séquences et plusieurs visualisations et liens vers des outils tiers afin d'aider les utilisateurs à trouver les instances les plus susceptibles d'être de véritables sites réglementaires. L'algorithme INSECT 2.0 a déjà été publié et l'algorithme et la théorie qui le sous-tendent expliqués dans

Stubb utilise des modèles de Markov cachés pour identifier des groupes statistiquement significatifs de combinaisons de facteurs de transcription. Il utilise également un deuxième génome connexe pour améliorer la précision de prédiction du modèle.

Les réseaux bayésiens utilisent un algorithme qui combine des prédictions de sites et des données d'expression spécifiques aux tissus pour les facteurs de transcription et les gènes cibles d'intérêt. Ce modèle utilise également des arbres de régression pour décrire la relation entre le module de régulation cis identifié et l'ensemble de liaison possible de facteurs de transcription.

CRÈME examine des groupes de sites cibles pour les facteurs de transcription d'intérêt. Ce programme utilise une base de données de sites de liaison de facteurs de transcription confirmés qui ont été annotés à travers le génome humain . Un algorithme de recherche est appliqué à l'ensemble de données pour identifier les combinaisons possibles de facteurs de transcription, qui ont des sites de liaison proches du promoteur de l'ensemble de gènes d'intérêt. Les modules cis-régulateurs possibles sont ensuite analysés statistiquement et les combinaisons significatives sont représentées graphiquement

Les modules cis- régulateurs actifs dans une séquence génomique ont été difficiles à identifier. Des problèmes d'identification surviennent parce que souvent les scientifiques se retrouvent avec un petit ensemble de facteurs de transcription connus, il est donc plus difficile d'identifier des groupes statistiquement significatifs de sites de liaison de facteurs de transcription. De plus, les coûts élevés limitent l'utilisation de grandes matrices de pavage du génome entier .

Exemples

Un exemple de séquence régulatrice agissant en cis est l'opérateur dans l' opéron lac . Cette séquence d'ADN est liée par le répresseur lac , qui, à son tour, empêche la transcription des gènes adjacents sur la même molécule d'ADN. L'opérateur lac est donc considéré comme « agissant en cis » sur la régulation des gènes voisins. L' opérateur lui-même ne code pour aucune protéine ou ARN .

En revanche, les éléments trans-régulateurs sont des facteurs diffusibles, généralement des protéines, qui peuvent modifier l'expression de gènes éloignés du gène qui a été à l'origine transcrit pour les créer. Par exemple, un facteur de transcription qui régule un gène sur le chromosome 6 pourrait lui-même avoir été transcrit à partir d'un gène sur le chromosome 11 . Le terme trans-regulatory est construit à partir de la racine latine trans , qui signifie « en face de ».

Il existe des éléments cis-régulateurs et trans-régulateurs. Les éléments cis-régulateurs sont souvent des sites de liaison pour un ou plusieurs facteurs agissant en trans .

Pour résumer, les éléments cis-régulateurs sont présents sur la même molécule d'ADN que le gène qu'ils régulent alors que les éléments trans-régulateurs peuvent réguler des gènes éloignés du gène à partir duquel ils ont été transcrits.

Exemples dans l'ARN

Éléments d'ARN
Taper Abr. Fonction Distribution Réf.
Élément de décalage de cadre Régule l'utilisation de cadres alternatifs avec les ARN messagers Archaea , bactéries , eucaryotes , virus à ARN
Site d'entrée interne du ribosome IRES Initie la traduction au milieu d'un ARN messager Virus à ARN , Eucaryote
Élément de réponse en fer COLÈRE Régule l'expression des gènes associés au fer eucaryote
Peptide leader Régule la transcription des gènes et/ou opérons associés Bactéries
Riboswitch Régulation des gènes Bactéries , Eucaryotes
thermomètre à ARN Régulation des gènes Bactéries
Séquence d'insertion de la sélénocystéine SECIS Dirige la cellule à traduire les codons d'arrêt UGA en sélénocystéines Métazoaires

Voir également

Les références

Lectures complémentaires

Liens externes