E-box - E-box

Une boîte électronique ( boîte d' amélioration) est un élément de réponse à l'ADN trouvé chez certains eucaryotes qui agit comme un site de liaison aux protéines et s'est avéré réguler l'expression des gènes dans les neurones , les muscles et d'autres tissus. Sa séquence d'ADN spécifique, CANNTG (où N peut être n'importe quel nucléotide ), avec une séquence canonique palindromique de CACGTG, est reconnue et liée par des facteurs de transcription pour initier la transcription génique . Une fois que les facteurs de transcription se lient aux promoteurs via la boîte E, d'autres enzymes peuvent se lier au promoteur et faciliter la transcription de l'ADN en ARNm .

Découverte

La boîte électronique a été découverte dans une collaboration entre les laboratoires de Susumu Tonegawa et de Walter Gilbert en 1985 en tant qu'élément de contrôle dans l'amplificateur de chaîne lourde d' immunoglobulines . Ils ont découvert qu'une région de 140 paires de bases dans l'élément amplificateur de transcription spécifique au tissu était suffisante pour différents niveaux d' amélioration de la transcription dans différents tissus et séquences. Ils ont suggéré que les protéines fabriquées par des tissus spécifiques agissaient sur ces activateurs pour activer des ensembles de gènes au cours de la différenciation cellulaire.

En 1989, le laboratoire de David Baltimore a découvert les deux premières protéines de liaison E-box , E12 et E47. Ces activateurs d' immunoglobulines pourraient se lier sous forme d' hétérodimères à des protéines par l'intermédiaire de domaines bHLH . En 1990, une autre protéine E, ITF-2A (plus tard rebaptisée E2-2Alt) a été découverte qui peut se lier aux amplificateurs de chaîne légère d' immunoglobuline . Deux ans plus tard, la troisième protéine de liaison E-box, HEB, a été découverte en criblant une banque d'ADNc de cellules HeLa . Une variante d'épissage de l'E2-2 a été découverte en 1997 et s'est avérée inhiber le promoteur d'un gène spécifique du muscle.

Depuis lors, les chercheurs ont établi que la E-box affecte la transcription des gènes chez plusieurs eucaryotes et ont trouvé des facteurs de liaison de la E-box qui identifient les séquences consensus de la E-box . En particulier, plusieurs expériences ont montré que la E-box fait partie intégrante de la boucle de rétroaction transcription-traduction qui constitue l' horloge circadienne .

Obligatoire

Les protéines de liaison E-box jouent un rôle majeur dans la régulation de l'activité transcriptionnelle. Ces protéines contiennent habituellement l' hélice-boucle-hélice basique protéine motif structural , ce qui leur permet de se lier en tant que dimères . Ce motif est constitué de deux hélices amphipathiques , séparées par une petite séquence d' acides aminés , qui forment une ou plusieurs spires . Les interactions hydrophobes entre ces hélices stabilisent la dimérisation. En outre, chaque monomère bHLH a une région basique, qui aide à médier la reconnaissance entre le monomère bHLH et la boîte E (la région basique interagit avec le sillon principal de l' ADN ). Selon le motif d'ADN ("CAGCTG" versus "CACGTG"), la protéine bHLH a un ensemble différent de résidus basiques.

Position relative du CTRR et de l'E-Box

La liaison E-box est modulée par le Zn 2+ chez la souris. Les régions riches en CT (CTRR) situées à environ 23 nucléotides en amont de la boîte E sont importantes dans la liaison de la boîte E, la transactivation (augmentation du taux d'expression génétique) et la transcription des gènes circadiens BMAL1 / NPAS2 et BMAL1 / CLOCK complexes.

La spécificité de liaison des différentes boîtes électroniques s'avère essentielle dans leur fonction. Les boîtes électroniques avec des fonctions différentes ont un nombre et un type de facteur de liaison différents.

La séquence consensus de la boîte E est généralement CANNTG ; cependant, il existe d'autres boîtes E de séquences similaires appelées boîtes E non canoniques. Ceux-ci incluent, mais ne sont pas limités à :

  • CACGTT séquence 20 pb en amont du gène de la Période2 ( PER2 ) de la souris et régule son expression
  • Séquence CAGCTT trouvée dans l' amplificateur central MyoD
  • CACCTCGTGAC séquence dans la proximal région promotrice de l' homme et de rat APOE , qui est un composant protéique de lipoprotéines .

Rôle dans l'horloge circadienne

Le lien entre les gènes régulés par E-box et l' horloge circadienne a été découvert en 1997, lorsque Hao, Allen et Hardin (Department of Biology at Texas A&M University ) ont analysé la rythmicité du gène de la période ( per ) chez Drosophila melanogaster . Ils ont trouvé un amplificateur de transcription circadien en amont du gène per dans un fragment d'ADN de 69 pb. En fonction des niveaux de protéine PER, l'amplificateur a entraîné des niveaux élevés de transcription d' ARNm dans les conditions LD (clair-obscur) et DD (obscurité constante). L'amplificateur s'est avéré nécessaire pour l'expression génique de haut niveau , mais pas pour la rythmicité circadienne. Il fonctionne également indépendamment en tant que cible du complexe BMAL1/CLOCK.

La boîte électronique joue un rôle important dans les gènes circadiens ; jusqu'à présent, neuf gènes circadiens contrôlés par E/E'BOX ont été identifiés : PER1 , PER2, BHLHB2 , BHLHB3 , CRY1 , DBP , Nr1d1 , Nr1d2 et RORC. Comme la boîte électronique est connectée à plusieurs gènes circadiens, il est possible que les gènes et les protéines qui lui sont associés soient « des points cruciaux et vulnérables du système (circadien) ».

La boîte E est l'une des cinq principales familles de facteurs de transcription associées à la phase circadienne et se trouve dans la plupart des tissus. Un total de 320 gènes contrôlés par la boîte E se trouvent dans le SCN ( noyau suprachiasmatique ), le foie , l' aorte , les surrénales , le WAT ( tissu adipeux blanc ), le cerveau , les oreillettes , le ventricule , le cortex préfrontal , le muscle squelettique , le BAT ( tissu adipeux brun ) ) et l'os calvarial.

Les éléments liés à l'horloge électronique comme l'horloge (boîte EL ; GGCACGAGGC) sont également importants pour maintenir la rythmicité circadienne dans les gènes contrôlés par l'horloge. De la même manière que la E-box, l'élément lié à la E-box comme CLOCK peut également induire la transcription de BMAL1/CLOCK, qui peut ensuite conduire à l'expression dans d'autres gènes contenant la EL-box (Ank, DBP, Nr1d1). Cependant, il existe des différences entre la boîte EL et la boîte électronique ordinaire. La suppression de DEC1 et DEC2 a un effet plus fort sur E-box que sur EL-box. De plus, HES1, qui peut se lier à une séquence consensus différente (CACNAG, connue sous le nom de N-box), montre un effet de suppression dans EL-box, mais pas dans E-box.

Les E-box non canoniques et les séquences de type E-box sont cruciales pour l'oscillation circadienne. Des recherches récentes à ce sujet forment une hypothèse selon laquelle une E-box canonique ou non canonique suivie d'une séquence de type E-box avec un intervalle de 6 paires de bases entre les deux est une combinaison nécessaire pour la transcription circadienne. L'analyse in silico suggère également qu'un tel intervalle existait dans d'autres gènes connus contrôlés par l'horloge.


Rôle des protéines qui se lient aux E-box

Il existe plusieurs protéines qui se lient à la boîte E et affectent la transcription des gènes.

Complexe HORLOGE-ARNTL

Le complexe CLOCK- ARNTL (BMAL1) fait partie intégrante du cycle circadien des mammifères et est essentiel au maintien de la rythmicité circadienne.

Sachant que la liaison active la transcription du gène per dans la région promotrice, les chercheurs ont découvert en 2002 que DEC1 et DEC2 (facteurs de transcription bHLH) réprimaient le complexe CLOCK-BMAL1 par interaction directe avec BMAL1 et/ou compétition pour les éléments E-box. Ils ont conclu que DEC1 et DEC2 étaient des régulateurs de l'horloge moléculaire des mammifères.

En 2006, Ripperger et Schibler ont découvert que la liaison de ce complexe à la boîte E entraînait la transcription circadienne de la DBP et les transitions de la chromatine (un changement de la chromatine à l' hétérochromatine facultative ). Il a été conclu que CLOCK régule l'expression de la DBP en se liant aux motifs E-box dans les régions amplificatrices situées dans les premier et deuxième introns .

MYC (c-Myc, un oncogène )

MYC ( c-Myc ), un gène qui code pour un facteur de transcription Myc , est important dans la régulation de la prolifération et de l' apoptose des cellules des mammifères .

En 1991, des chercheurs ont testé si c-Myc pouvait se lier à l'ADN en le dimérisant en E12. Les dimères de E6, la protéine chimérique , étaient capables de se lier à un élément E-box (GGCCACGTGACC) qui était reconnu par d'autres protéines HLH. L'expression de E6 a supprimé la fonction de c-Myc, qui a montré un lien entre les deux.

En 1996, il a été découvert que Myc s'hétérodimérise avec MAX et que ce complexe hétérodimère pouvait se lier à la séquence E-box CAC(G/A)TG et activer la transcription.

En 1998, il a été conclu que la fonction de c-Myc dépend de l'activation de la transcription de gènes particuliers par le biais d'éléments E-box.

MYOD1 (MyoD)

MyoD vient de la famille Mrf bHLH et son rôle principal est la myogenèse , la formation du tissu musculaire. Les autres membres de cette famille comprennent la myogénine , Myf5 , Myf6 , Mist1 et Nex-1.

Lorsque MyoD se lie au motif E-box CANNTG, la différenciation musculaire et l'expression de protéines spécifiques du muscle sont initiées. Les chercheurs ont procédé à l'ablation de diverses parties de la séquence MyoD recombinante et ont conclu que MyoD utilisait des éléments englobants pour lier la boîte E et la structure tétraplexe de la séquence promotrice de l' intégrine α7 du gène spécifique du muscle et du sarcomérique sMtCK .

MyoD régule le HB-EGF ( Heparin-binding EGF-like growth factor ), un membre de la famille EGF ( Epidermal growth factor ) qui stimule la croissance et la prolifération cellulaires. Elle joue un rôle dans le développement du carcinome hépatocellulaire , le cancer de la prostate , le cancer du sein , cancer de l' œsophage et le cancer gastrique .

MyoD peut également se lier aux boîtes E non canoniques de MyoG et réguler son expression.

MyoG (Myogénine)

MyoG appartient à la famille des facteurs de transcription MyoD. La liaison MyoG-E-Box est nécessaire à la formation des synapses neuromusculaires , car une voie de signalisation HDAC-Dach2- myogénine dans l'expression des gènes du muscle squelettique a été identifiée. Une diminution de l'expression de MyoG a été démontrée chez des patients présentant des symptômes d'atrophie musculaire.

MyoG et MyoD sont également impliqués dans la différenciation des myoblastes . Ils agissent en transactivant l' activité du promoteur de la cathepsine B et en induisant l'expression de son ARNm.

TCF3 (E47)

E47 est produit par E2A épissé alternativement dans des exons spécifiques de E47 codant pour bHLH . Son rôle est de réguler l'expression et la différenciation des gènes spécifiques aux tissus. De nombreuses kinases ont été associées à E47, notamment 3pk et MK2. Ces 2 protéines forment un complexe avec E47 et réduisent son activité de transcription. CKII et PKA sont également montrés pour phosphoryler E47 in vitro.

Semblable à d'autres protéines de liaison E-box, E47 se lie également à la séquence CANNTG dans la E-box. Chez les souris knock-out E2A homozygotes, le développement des cellules B s'arrête avant le stade de l'arrangement DJ et les cellules B ne parviennent pas à maturité. Il a été démontré que E47 se lie soit sous forme d'hétérodimère (avec E12) soit sous forme d'homodimère (mais plus faiblement).

Recherche récente

Bien que la base structurelle de l'interaction de BMAL1/CLOCK avec la boîte électronique soit inconnue, des recherches récentes ont montré que les domaines protéiques bHLH de BMAL1/CLOCK sont très similaires à d'autres protéines contenant bHLH, par exemple Myc/Max, qui ont été cristallisées avec E-boîtes. On suppose que des bases spécifiques sont nécessaires pour supporter cette liaison de haute affinité. De plus, les contraintes de séquence sur la région autour de la boîte E circadienne ne sont pas entièrement comprises : on pense qu'il est nécessaire mais pas suffisant que les boîtes E soient espacées de manière aléatoire les unes des autres dans la séquence génétique pour que la transcription circadienne se produise. . Des recherches récentes impliquant la E-box ont visé à essayer de trouver plus de protéines de liaison ainsi que de découvrir plus de mécanismes pour inhiber la liaison.

Des chercheurs de la faculté de médecine de l' université de Nanjing ont découvert que l'amplitude de FBXL3 (F-box/Leucine rich-repeat protein) est exprimée via une E-box. Ils ont étudié des souris présentant un déficit en FBXL3 et ont découvert qu'il régule les boucles de rétroaction dans les rythmes circadiens en affectant la durée de la période circadienne.

Une étude publiée le 4 avril 2013 par des chercheurs de la Harvard Medical School a révélé que les nucléotides de chaque côté d'une boîte électronique influencent les facteurs de transcription pouvant se lier à la boîte électronique elle-même. Ces nucléotides déterminent l'arrangement spatial 3-D du brin d'ADN et restreignent la taille des facteurs de transcription de liaison . L'étude a également trouvé des différences dans les modèles de liaison entre les brins in vivo et in vitro .

Les références

Liens externes