Trois premières régions non traduites - Three prime untranslated region

Le flux d'informations au sein d'une cellule. L'ADN est d'abord transcrit en ARN, qui est ensuite traduit en protéine. (Voir Dogme central de biologie moléculaire ).
Structure d'ARNm, approximativement à l'échelle d'un ARNm humain, où la longueur médiane de 3'UTR est de 700 nucléotides

En génétique moléculaire , les trois régions non traduites principales ( 3'-UTR ) sont la section d' ARN messager (ARNm) qui suit immédiatement le codon de terminaison de la traduction . La 3'-UTR contient souvent des régions régulatrices qui influencent de manière post-transcriptionnelle l'expression des gènes .

Au cours de l'expression génique , une molécule d'ARNm est transcrite à partir de la séquence d' ADN et est ensuite traduite en une protéine . Plusieurs régions de la molécule d' ARNm ne sont pas traduites en une protéine comprenant la capsule 5' , 5' non traduite , la région non traduite 3 'et la queue poly (A) . Les régions régulatrices dans la région 3'-non traduite peuvent influencer la polyadénylation , l'efficacité de la traduction, la localisation et la stabilité de l'ARNm. Le 3'-UTR contient à la fois des sites de liaison pour les protéines régulatrices ainsi que des microARN (miARN). En se liant à des sites spécifiques au sein de la 3'-UTR, les miARN peuvent diminuer l'expression génique de divers ARNm en inhibant la traduction ou en provoquant directement la dégradation du transcrit. Le 3'-UTR possède également des régions de silence qui se lient aux protéines répresseurs et inhiberont l'expression de l'ARNm.

De nombreux 3′-UTR contiennent également des éléments riches en AU (ARE). Les protéines se lient aux ARE pour affecter la stabilité ou le taux de décroissance des transcrits de manière localisée ou affecter l'initiation de la traduction. De plus, la 3'-UTR contient la séquence AAUAAA qui dirige l'ajout de plusieurs centaines de résidus adénine appelés queue poly(A) à l'extrémité du transcrit d'ARNm. La protéine de liaison poly(A) (PABP) se lie à cette queue, contribuant à la régulation de la traduction, de la stabilité et de l'exportation de l'ARNm. Par exemple, la PABP liée à la queue poly(A) interagit avec les protéines associées à l'extrémité 5' du transcrit, provoquant une circularisation de l'ARNm qui favorise la traduction.

La 3'-UTR peut également contenir des séquences qui attirent des protéines pour associer l'ARNm au cytosquelette , le transporter vers ou depuis le noyau cellulaire , ou effectuer d'autres types de localisation. En plus des séquences au sein de la 3'-UTR, les caractéristiques physiques de la région, y compris sa longueur et sa structure secondaire , contribuent à la régulation de la traduction. Ces divers mécanismes de régulation génique garantissent que les bons gènes sont exprimés dans les bonnes cellules aux moments appropriés.

Caractéristiques physiques

La 3'-UTR de l'ARNm possède une grande variété de fonctions régulatrices qui sont contrôlées par les caractéristiques physiques de la région. L'une de ces caractéristiques est la longueur de la 3'-UTR, qui dans le génome des mammifères présente une variation considérable. Cette région du transcrit d'ARNm peut aller de 60 nucléotides à environ 4000. En moyenne, la longueur du 3'-UTR chez l'homme est d'environ 800 nucléotides, tandis que la longueur moyenne des 5'-UTR n'est que d'environ 200 nucléotides. La longueur de la 3'-UTR est significative car des 3'-UTR plus longues sont associées à des niveaux inférieurs d'expression génique. Une explication possible de ce phénomène est que les régions plus longues ont une probabilité plus élevée de posséder plus de sites de liaison aux miARN qui ont la capacité d'inhiber la traduction. En plus de la longueur, la composition nucléotidique diffère également de manière significative entre la 5' et la 3'-UTR. Le pourcentage moyen de G+C du 5'-UTR chez les vertébrés à sang chaud est d'environ 60 % contre seulement 45 % pour les 3'-UTR. Ceci est important car une corrélation inverse a été observée entre le G+C% des 5' et 3'-UTR et leurs longueurs correspondantes. Les UTR pauvres en GC ont tendance à être plus longs que ceux situés dans les régions génomiques riches en GC.

Les séquences au sein de la 3'-UTR ont également la capacité de dégrader ou de stabiliser le transcrit d'ARNm. Les modifications qui contrôlent la stabilité d'un transcrit permettent de contrôler rapidement l'expression d'un gène sans altérer les taux de traduction. Un groupe d'éléments dans la 3'-UTR qui peut aider à déstabiliser un transcrit d'ARNm sont les éléments riches en AU (ARE). Ces éléments varient en taille de 50 à 150 paires de bases et contiennent généralement de multiples copies du pentanucléotide AUUUA. Les premières études ont indiqué que les ARE peuvent varier dans l'ordre et se répartir en trois classes principales qui diffèrent par le nombre et la disposition des motifs. Un autre ensemble d'éléments présents à la fois dans les 5' et 3'-UTR sont les éléments de réponse au fer (IRE). L'IRE est une structure tige-boucle dans les régions non traduites des ARNm qui codent pour des protéines impliquées dans le métabolisme cellulaire du fer. Le transcrit d'ARNm contenant cet élément est soit dégradé, soit stabilisé en fonction de la liaison de protéines spécifiques et des concentrations de fer intracellulaire.

Structure tige-boucle d'une molécule d'ARN

La 3'-UTR contient également des séquences qui signalent des ajouts à faire, soit au transcrit lui-même, soit au produit de la traduction. Par exemple, il existe deux signaux de polyadénylation différents présents dans le 3'-UTR qui signalent l'ajout de la queue poly(A). Ces signaux initient la synthèse de la queue poly(A) à une longueur définie d'environ 250 paires de bases. Le signal principal utilisé est le signal de polyadénylation nucléaire (PAS) avec la séquence AAUAAA située vers l'extrémité de la 3'-UTR. Cependant, au cours du développement précoce, une polyadénylation cytoplasmique peut se produire à la place et réguler l'activation traductionnelle des ARNm maternels. L'élément qui contrôle ce processus s'appelle le CPE qui est riche en AU et également situé dans le 3'-UTR. Le CPE a généralement la structure UUUUUUAU et se situe généralement à moins de 100 paires de bases du PAS nucléaire. Un autre ajout spécifique signalé par la 3'-UTR est l'incorporation de sélénocystéine au niveau des codons UGA des ARNm codant pour les sélénoprotéines. Normalement, le codon UGA code pour un arrêt de la traduction, mais dans ce cas, une structure tige-boucle conservée appelée séquence d'insertion de la sélénocystéine (SECIS) provoque l'insertion de la sélénocystéine à la place.

Rôle dans l'expression des gènes

La région 3'-non traduite joue un rôle crucial dans l'expression des gènes en influençant la localisation, la stabilité, l'exportation et l'efficacité de la traduction d'un ARNm. Il contient diverses séquences impliquées dans l'expression des gènes, notamment des éléments de réponse microARN (MRE), des éléments riches en AU (ARE) et la queue poly(A). De plus, les caractéristiques structurelles de la 3'-UTR ainsi que son utilisation de polyadénylation alternative jouent un rôle dans l'expression des gènes.

Le rôle des miARN dans la régulation des gènes

Éléments de réponse microARN

Le 3'-UTR contient souvent des éléments de réponse microARN (MRE), qui sont des séquences auxquelles les miARN se lient. Les miARN sont de courtes molécules d'ARN non codantes capables de se lier aux transcrits d'ARNm et de réguler leur expression. Un mécanisme de miARN implique l' appariement partiel de bases de la séquence d'ensemencement 5' d'un miARN à un MRE dans la 3'-UTR d'un ARNm ; cette liaison provoque alors une répression traductionnelle.

Éléments riches en UA

En plus de contenir des MRE, la 3'-UTR contient également souvent des éléments riches en AU (ARE) , qui ont une longueur de 50 à 150 pb et comprennent généralement de nombreuses copies de la séquence AUUUA. Les protéines de liaison ARE (ARE-BP) se lient aux éléments riches en AU d'une manière qui dépend du type de tissu, du type de cellule, du moment, de la localisation cellulaire et de l'environnement. En réponse à différents signaux intracellulaires et extracellulaires, les ARE-BP peuvent favoriser la dégradation de l'ARNm, affecter la stabilité de l'ARNm ou activer la traduction. Ce mécanisme de régulation génique est impliqué dans la croissance cellulaire , la différenciation cellulaire et l'adaptation aux stimuli externes. Il agit donc sur les transcrits codant pour les cytokines , les facteurs de croissance , les suppresseurs de tumeurs , les proto-oncogènes , les cyclines , les enzymes , les facteurs de transcription , les récepteurs et les protéines membranaires .

Queue poly(A)

La circulation du transcrit d'ARNm est médiée par des protéines interagissant avec la coiffe 5' et la queue poly(A).

La queue poly(A) contient des sites de liaison pour les protéines de liaison poly(A) (PABP). Ces protéines coopèrent avec d'autres facteurs pour affecter l'exportation, la stabilité, la dégradation et la traduction d'un ARNm. Les PABP liées à la queue poly(A) peuvent également interagir avec des protéines, telles que des facteurs d'initiation de la traduction, qui sont liées à la coiffe 5' de l'ARNm. Cette interaction provoque la circularisation du transcrit, ce qui favorise par la suite l'initiation de la traduction. De plus, il permet une traduction efficace en provoquant le recyclage des ribosomes . Alors que la présence d'une queue poly(A) aide généralement à déclencher la traduction, l'absence ou l'élimination d'une queue conduit souvent à une dégradation de l'ARNm médiée par l'exonucléase. La polyadénylation elle-même est régulée par des séquences dans la 3'-UTR du transcrit. Ces séquences comprennent des éléments de polyadénylation cytoplasmique (CPE), qui sont des séquences riches en uridine qui contribuent à la fois à l'activation et à la répression de la polyadénylation. La protéine de liaison aux CPE (CPEB) se lie aux CPE en conjonction avec une variété d'autres protéines afin de provoquer différentes réponses.

Caractéristiques structurelles

Alors que la séquence qui constitue la 3'-UTR contribue grandement à l'expression des gènes, les caractéristiques structurelles de la 3'-UTR jouent également un rôle important. En général, des 3'-UTR plus longs correspondent à des taux d'expression plus faibles car ils contiennent souvent plus de sites de liaison de miARN et de protéines qui sont impliqués dans l'inhibition de la traduction. Les transcrits humains possèdent des 3'-UTR qui sont en moyenne deux fois plus longues que les autres 3'-UTR de mammifères. Cette tendance reflète le haut niveau de complexité impliqué dans la régulation des gènes humains. En plus de la longueur, la structure secondaire de la région 3'-non traduite a également des fonctions régulatrices. Les facteurs protéiques peuvent aider ou perturber le repliement de la région en diverses structures secondaires. La structure la plus courante est une tige-boucle, qui fournit un échafaudage pour les protéines de liaison à l'ARN et les ARN non codants qui influencent l'expression du transcrit.

Une polyadénylation alternative donne des transcrits avec différents 3′-UTR

Polyadénylation alternative

Un autre mécanisme impliquant la structure de la 3'-UTR est appelé polyadénylation alternative (APA), qui se traduit par des isoformes d' ARNm qui ne diffèrent que par leurs 3'-UTR. Ce mécanisme est particulièrement utile pour les organismes complexes car il fournit un moyen d'exprimer la même protéine mais dans des quantités et des emplacements variables. Il est utilisé par environ la moitié des gènes humains. L'APA peut résulter de la présence de plusieurs sites de polyadénylation ou d' exons terminaux mutuellement exclusifs . Puisqu'il peut affecter la présence de sites de liaison aux protéines et aux miARN, l'APA peut provoquer une expression différentielle des transcrits d'ARNm en influençant leur stabilité, leur exportation vers le cytoplasme et leur efficacité de traduction.

Méthodes d'étude

Les scientifiques utilisent un certain nombre de méthodes pour étudier les structures et les fonctions complexes de l'UTR 3'. Même si un 3'-UTR donné dans un ARNm est présent dans un tissu, les effets de la localisation, de la demi-vie fonctionnelle, de l'efficacité traductionnelle et des éléments trans-agissant doivent être déterminés pour comprendre la pleine fonctionnalité du 3'-UTR. . Des approches informatiques, principalement par analyse de séquence, ont montré l'existence d'ARE dans environ 5 à 8 % des 3′-UTR humains et la présence d'une ou plusieurs cibles de miARN dans 60 % ou plus des 3′-UTR humains. Le logiciel peut comparer rapidement des millions de séquences à la fois pour trouver des similitudes entre divers UTR 3' au sein du génome. Des approches expérimentales ont été utilisées pour définir des séquences qui s'associent à des protéines spécifiques de liaison à l'ARN ; en particulier, des améliorations récentes dans les techniques de séquençage et de réticulation ont permis une cartographie fine des sites de liaison aux protéines dans le transcrit. Les mutations induites spécifiques au site, par exemple celles qui affectent le codon de terminaison, le signal de polyadénylation ou la structure secondaire de la 3'-UTR, peuvent montrer comment les régions mutées peuvent provoquer une dérégulation de la traduction et une maladie. Ces types de méthodes à l'échelle du transcrit devraient nous aider à comprendre les éléments cis connus et les facteurs trans-régulateurs dans les 3'-UTR.

Maladie

Maladies causées par différentes mutations au sein de la 3′-UTR

Les mutations 3′-UTR peuvent être très importantes car une altération peut être responsable de l'expression altérée de nombreux gènes. Sur le plan de la transcription, une mutation peut affecter uniquement l'allèle et les gènes qui sont physiquement liés. Cependant, étant donné que les protéines de liaison 3'-UTR fonctionnent également dans le traitement et l'exportation nucléaire de l'ARNm, une mutation peut également affecter d'autres gènes non apparentés. La dérégulation des protéines de liaison à l'ARE (AUBP) due à des mutations dans les régions riches en AU peut entraîner des maladies telles que la tumorigenèse (cancer), les malignités hématopoïétiques, la leucémogenèse et les troubles du développement/du spectre autistique. Un nombre accru de répétitions de trinucléotides (CTG) dans la 3'-UTR du gène de la protéine kinase de dystrophie myotonica (DMPK) provoque une dystrophie myotonique . L'insertion par rétro-transposition de 3 kilobases de séquences répétées en tandem dans la 3'-UTR de la protéine fukutine est liée à la dystrophie musculaire congénitale de type Fukuyama. Des éléments de la 3′-UTR ont également été liés à la leucémie myéloïde aiguë humaine , à l' alpha-thalassémie , au neuroblastome , à la kératinopathie , à l' aniridie , au syndrome IPEX et aux malformations cardiaques congénitales . Les quelques maladies à médiation UTR identifiées ne font qu'indiquer les innombrables liens encore à découvrir.

Développement futur

Malgré notre compréhension actuelle des 3′-UTR, ce sont encore des mystères relatifs. Étant donné que les ARNm contiennent généralement plusieurs éléments de contrôle qui se chevauchent, il est souvent difficile de spécifier l'identité et la fonction de chaque élément 3'-UTR, sans parler des facteurs de régulation qui peuvent se lier à ces sites. De plus, chaque 3'-UTR contient de nombreux éléments alternatifs riches en AU et des signaux de polyadénylation. Ces éléments agissant en cis et en trans, ainsi que les miARN, offrent une gamme pratiquement illimitée de possibilités de contrôle au sein d'un seul ARNm. Les recherches futures grâce à l'utilisation accrue du profilage des ribosomes basé sur le séquençage en profondeur révéleront davantage de subtilités réglementaires ainsi que de nouveaux éléments de contrôle et UABP. De plus, le destin ultime d'un transcrit réside dans la voie de transduction du signal dans laquelle il est impliqué, de sorte que les recherches futures dans ce domaine semblent prometteuses.

Voir également

Les références

Lectures complémentaires

Liens externes