Cis Module -regulatory - Cis-regulatory module

Le module de régulation Cis ( CRM ) est un segment d' ADN , généralement de 100 à 1 000 paires de bases d'ADN de longueur, où un certain nombre de facteurs de transcription peuvent se lier et réguler l'expression de gènes voisinset réguler leurs taux de transcription. Ils sont marqués comme cis parce qu'ils sont généralement situés sur le même brin d'ADN que les gènes qu'ils contrôlent par opposition à trans , qui se réfère à des effets sur des gènes qui ne sont pas situés sur le même brin ou plus loin, tels que les facteurs de transcription. Unélément de régulation cis peut réguler plusieurs gènes, et inversement, un gène peut avoir plusieursmodules de régulation cis . Les modules de régulation CIS remplissent leur fonction en intégrant les facteurs de transcription actifs et les cofacteurs associés à un moment et à un endroit spécifiques de la cellule où ces informations sont lues et une sortie est donnée.

Fonction de régulation génique

Schéma montrant à quelles étapes de l'expression de la voie ADN-ARNm-protéine peut être contrôlée

Les modules de régulation CIS sont l'un des nombreux types d' éléments de régulation fonctionnels . Les éléments régulateurs sont des sites de liaison pour les facteurs de transcription, qui sont impliqués dans la régulation génique. Les modules de réglementation Cis effectuent une grande quantité de traitement des informations de développement. Les modules de régulation Cis sont des groupes non aléatoires au niveau de leur site cible spécifié qui contiennent des sites de liaison aux facteurs de transcription.

La définition originale présentait des modules de régulation cis comme des amplificateurs de l'ADN agissant en cis, ce qui augmentait le taux de transcription à partir d'un promoteur lié . Cependant, cette définition a changé pour définir les modules de régulation cis comme une séquence d'ADN avec des sites de liaison aux facteurs de transcription qui sont regroupés en structures modulaires, y compris - mais sans s'y limiter - des régions de contrôle de locus, des promoteurs, des amplificateurs, des silencieux, des éléments de contrôle des limites et d'autres modulateurs.

Les modules de réglementation CIS peuvent être divisés en trois classes; des amplificateurs , qui régulent positivement l'expression des gènes; les isolants , qui fonctionnent indirectement en interagissant avec d'autres modules de régulation cis à proximité ; et des silencieux qui désactivent l'expression des gènes.

La conception des modules de régulation cis est telle que les facteurs de transcription et les modifications épigénétiques servent d'entrées, et la sortie du module est la commande donnée à la machinerie de transcription, qui à son tour détermine le taux de transcription du gène ou s'il est activé ou de. Il existe deux types d'entrées de facteurs de transcription: celles qui déterminent le moment où le gène cible doit être exprimé et celles qui servent de moteurs fonctionnels , qui n'entrent en jeu que lors de situations spécifiques au cours du développement. Ces entrées peuvent provenir de différents moments, peuvent représenter différents ligands de signal ou peuvent provenir de différents domaines ou lignées de cellules. Cependant, beaucoup reste encore inconnu.

De plus, la régulation de la structure de la chromatine et l'organisation nucléaire jouent également un rôle dans la détermination et le contrôle de la fonction des modules de régulation cis. Ainsi, les fonctions de régulation génique (GRF) fournissent une caractéristique unique d'un module de régulation cis (CRM), reliant les concentrations de facteurs de transcription (entrée) aux activités du promoteur (sortie). Le défi est de prédire les GRF. Ce défi n'est toujours pas résolu. En général, les fonctions de régulation génique n'utilisent pas la logique booléenne , bien que dans certains cas l'approximation de la logique booléenne soit encore très utile.

L'hypothèse logique booléenne

Dans l'hypothèse de la logique booléenne, les principes guidant le fonctionnement de ces modules incluent la conception du module qui détermine la fonction de régulation. En ce qui concerne le développement, ces modules peuvent générer des sorties à la fois positives et négatives. La sortie de chaque module est le produit des différentes opérations effectuées sur celui-ci. Les opérations courantes incluent la porte logique "OU" - Cette conception indique qu'une sortie sera donnée lorsque l'une ou l'autre des entrées est donnée [3]. Porte logique "ET" - Dans cette conception, deux facteurs de régulation différents sont nécessaires pour garantir une sortie positive. «Interrupteurs à bascule» - Cette conception se produit lorsque le ligand signal est absent alors que le facteur de transcription est présent; ce facteur de transcription finit par agir comme un répresseur dominant. Cependant, une fois que le ligand signal est présent, le rôle du facteur de transcription en tant que répresseur est éliminé et la transcription peut avoir lieu.

D'autres opérations logiques booléennes peuvent également se produire, telles que les répresseurs transcriptionnels spécifiques à une séquence, qui, lorsqu'ils se lient au module de régulation cis, conduisent à une sortie de zéro. De plus, outre l'influence des différentes opérations logiques, la sortie d'un module de régulation "cis" sera également influencée par des événements antérieurs. 4) Les modules de réglementation CIS doivent interagir avec d'autres éléments réglementaires. Pour la plupart, même avec la présence d'un chevauchement fonctionnel entre les modules de régulation cis d'un gène, les entrées et les sorties des modules ont tendance à ne pas être les mêmes.

Alors que l'hypothèse de la logique booléenne est importante pour la biologie des systèmes , des études détaillées montrent qu'en général la logique de la régulation des gènes n'est pas booléenne. Cela signifie par exemple que dans le cas d'un module de régulation cis régulé par deux facteurs de transcription, les fonctions de régulation génique déterminées expérimentalement ne peuvent pas être décrites par les 16 fonctions booléennes possibles de deux variables. Des extensions non booléennes de la logique de régulation génique ont été proposées pour corriger ce problème.

Identification et prédiction informatique

Outre la détermination expérimentale des CRM, il existe divers algorithmes bioinformatiques pour les prédire. La plupart des algorithmes tentent de rechercher des combinaisons significatives de sites de liaison aux facteurs de transcription ( sites de liaison à l'ADN ) dans des séquences promotrices de gènes co-exprimés. Des méthodes plus avancées combinent la recherche de motifs significatifs avec une corrélation dans les ensembles de données d' expression génique entre les facteurs de transcription et les gènes cibles. Les deux méthodes ont été implémentées, par exemple, dans ModuleMaster . D'autres programmes créés pour l'identification et la prédiction des modules de régulation cis comprennent:

INSECT 2.0 est un serveur Web qui permet de rechercher des modules Cis-régulateurs à l'échelle du génome. Le programme s'appuie sur la définition de restrictions strictes parmi les sites de liaison des facteurs de transcription (TFBS) qui composent le module afin de diminuer le taux de faux positifs. INSECT est conçu pour être convivial car il permet la récupération automatique de séquences et de plusieurs visualisations et liens vers des outils tiers afin d'aider les utilisateurs à trouver les instances qui sont plus susceptibles d'être de véritables sites réglementaires. L'algorithme INSECT 2.0 a été publié précédemment et l'algorithme et la théorie sous-jacents expliqués dans

Stubb utilise des modèles de Markov cachés pour identifier des groupes statistiquement significatifs de combinaisons de facteurs de transcription. Il utilise également un deuxième génome associé pour améliorer la précision de prédiction du modèle.

Les réseaux bayésiens utilisent un algorithme qui combine des prédictions de sites et des données d'expression spécifiques aux tissus pour les facteurs de transcription et les gènes cibles d'intérêt. Ce modèle utilise également des arbres de régression pour décrire la relation entre le module de régulation cis identifié et l'ensemble de liaison possible de facteurs de transcription.

CRÈME examine les groupes de sites cibles pour les facteurs de transcription d'intérêt. Ce programme utilise une base de données de sites confirmés de liaison aux facteurs de transcription qui ont été annotés dans le génome humain . Un algorithme de recherche est appliqué à l'ensemble de données pour identifier les combinaisons possibles de facteurs de transcription, qui ont des sites de liaison proches du promoteur de l'ensemble de gènes d'intérêt. Les éventuels modules cis-régulateurs sont ensuite analysés statistiquement et les combinaisons significatives sont représentées graphiquement

Les modules actifs de régulation cis dans une séquence génomique ont été difficiles à identifier. Des problèmes d'identification surviennent parce que souvent les scientifiques se retrouvent avec un petit ensemble de facteurs de transcription connus, il est donc plus difficile d'identifier des groupes statistiquement significatifs de sites de liaison aux facteurs de transcription. De plus, les coûts élevés limitent l'utilisation de grands tableaux de tuiles du génome entier .

Classification

Les modules de régulation CIS peuvent être caractérisés par le traitement de l'information qu'ils codent et l'organisation de leurs sites de liaison aux facteurs de transcription. De plus, les modules de régulation cis sont également caractérisés par la façon dont ils affectent la probabilité, la proportion et le taux de transcription. Les modules de régulation cis hautement coopératifs et coordonnés sont classés comme des enhanosomes . L'architecture et l'agencement des sites de liaison du facteur de transcription sont essentiels car une perturbation de l'agencement pourrait annuler la fonction. Les modules de régulation cis flexibles fonctionnels sont appelés panneaux d'affichage. Leur sortie transcriptionnelle est l'effet de sommation des facteurs de transcription liés. Les amplificateurs affectent la probabilité qu'un gène soit activé, mais ont peu ou pas d'effet sur le taux. Le modèle de réponse binaire agit comme un interrupteur marche / arrêt pour la transcription. Ce modèle augmentera ou diminuera la quantité de cellules qui transcrivent un gène, mais il n'affectera pas le taux de transcription. Le modèle de réponse rhéostatique décrit les modules de régulation cis comme régulateurs du taux d'initiation de la transcription de son gène associé.

Mode d'action

Les modules de régulation CIS peuvent réguler leurs gènes cibles sur de grandes distances. Plusieurs modèles ont été proposés pour décrire la manière dont ces modules peuvent communiquer avec leur promoteur de gène cible. Ceux-ci incluent le modèle de balayage d'ADN, le modèle de boucle de séquence d'ADN et le modèle de suivi facilité. Dans le modèle de balayage d'ADN, le facteur de transcription et le complexe de cofacteur se forment au niveau du module de régulation cis , puis continuent à se déplacer le long de la séquence d'ADN jusqu'à ce qu'il trouve le promoteur du gène cible. Dans le modèle en boucle, le facteur de transcription se lie au module de régulation cis , qui provoque alors le bouclage de la séquence d'ADN et permet l'interaction avec le promoteur du gène cible. Le complexe facteur de transcription- module de régulation cis provoque la boucle de la séquence d'ADN lentement vers le promoteur cible et forme une configuration en boucle stable. Le modèle de suivi facilité combine des parties des deux modèles précédents.

Cis Module -regulatory dans le réseau de régulation des gènes

La fonction d'un réseau de régulation génique dépend de l'architecture des nœuds , dont la fonction dépend des multiples modules de régulation cis . La disposition des modules de régulation cis peut fournir suffisamment d'informations pour générer des modèles spatiaux et temporels d'expression génique. Au cours du développement, chaque domaine, où chaque domaine représente une région spatiale différente de l'embryon, d'expression génique sera sous le contrôle de différents modules de régulation cis . La conception de modules de réglementation aide à produire des retours d'informations , des retours en avant et des boucles de régulation croisée.

Voir également

Références

Liens externes