Protéine -Protein

Une représentation de la structure 3D de la protéine myoglobine montrant des hélices α turquoise . Cette protéine a été la première à voir sa structure résolue par cristallographie aux rayons X. Vers le centre droit parmi les bobines, un groupe prothétique appelé groupe hémique (en gris) avec une molécule d'oxygène liée (en rouge).

Les protéines sont de grosses biomolécules et macromolécules qui comprennent une ou plusieurs longues chaînes de résidus d' acides aminés . Les protéines remplissent un vaste éventail de fonctions au sein des organismes, notamment la catalyse des réactions métaboliques , la réplication de l'ADN , la réponse aux stimuli , la structure des cellules et des organismes et le transport des molécules d'un endroit à un autre. Les protéines diffèrent les unes des autres principalement par leur séquence d'acides aminés, qui est dictée par la séquence nucléotidique de leurs gènes , et qui se traduit généralement parprotéine se repliant dans une structure 3D spécifique qui détermine son activité.

Une chaîne linéaire de résidus d'acides aminés est appelée un polypeptide . Une protéine contient au moins un long polypeptide. Les polypeptides courts, contenant moins de 20 à 30 résidus, sont rarement considérés comme des protéines et sont communément appelés peptides , ou parfois oligopeptides . Les résidus d'acides aminés individuels sont liés ensemble par des liaisons peptidiques et des résidus d'acides aminés adjacents. La séquence de résidus d'acides aminés dans une protéine est définie par la séquence d'un gène, qui est codée dans le code génétique . En général, le code génétique spécifie 20 acides aminés standards ; mais chez certains organismes, le code génétique peut inclure de la sélénocystéine et, chez certaines archées , de la pyrrolysine . Peu de temps après ou même pendant la synthèse, les résidus d'une protéine sont souvent modifiés chimiquement par modification post-traductionnelle , qui altère les propriétés physiques et chimiques, le repliement, la stabilité, l'activité et finalement la fonction des protéines. Certaines protéines ont des groupes non peptidiques attachés, qui peuvent être appelés groupes prosthétiques ou cofacteurs . Les protéines peuvent également travailler ensemble pour remplir une fonction particulière, et elles s'associent souvent pour former des complexes protéiques stables .

Une fois formées, les protéines n'existent que pendant un certain temps et sont ensuite dégradées et recyclées par la machinerie cellulaire via le processus de renouvellement des protéines . La durée de vie d'une protéine est mesurée en fonction de sa demi-vie et couvre une large gamme. Ils peuvent exister pendant des minutes ou des années avec une durée de vie moyenne de 1 à 2 jours dans les cellules de mammifères. Les protéines anormales ou mal repliées sont dégradées plus rapidement, soit parce qu'elles sont ciblées pour la destruction, soit parce qu'elles sont instables.

Comme d'autres macromolécules biologiques telles que les polysaccharides et les acides nucléiques , les protéines sont des parties essentielles des organismes et participent à pratiquement tous les processus au sein des cellules . De nombreuses protéines sont des enzymes qui catalysent les réactions biochimiques et sont vitales pour le métabolisme . Les protéines ont également des fonctions structurelles ou mécaniques, telles que l'actine et la myosine dans le muscle et les protéines du cytosquelette , qui forment un système d' échafaudage qui maintient la forme des cellules. D'autres protéines sont importantes dans la signalisation cellulaire, les réponses immunitaires , l'adhésion cellulaire et le cycle cellulaire . Chez les animaux, les protéines sont nécessaires dans l' alimentation pour fournir les acides aminés essentiels qui ne peuvent pas être synthétisés . La digestion décompose les protéines pour une utilisation métabolique.

Les protéines peuvent être purifiées à partir d'autres composants cellulaires en utilisant diverses techniques telles que l' ultracentrifugation , la précipitation , l'électrophorèse et la chromatographie ; l'avènement du génie génétique a rendu possible un certain nombre de méthodes pour faciliter la purification. Les méthodes couramment utilisées pour étudier la structure et la fonction des protéines comprennent l' immunohistochimie , la mutagenèse dirigée , la cristallographie aux rayons X , la résonance magnétique nucléaire et la spectrométrie de masse .

Histoire et étymologie

Les protéines ont été reconnues comme une classe distincte de molécules biologiques au XVIIIe siècle par Antoine Fourcroy et d'autres, se distinguant par la capacité des molécules à coaguler ou à floculer sous des traitements à la chaleur ou à l'acide. Les exemples notés à l'époque comprenaient l'albumine de blancs d'œufs , l'albumine de sérum sanguin , la fibrine et le gluten de blé .

Les protéines ont été décrites pour la première fois par le chimiste néerlandais Gerardus Johannes Mulder et nommées par le chimiste suédois Jöns Jacob Berzelius en 1838. Mulder a effectué une analyse élémentaire des protéines communes et a découvert que presque toutes les protéines avaient la même formule empirique , C 400 H 620 N 100 O 120 P 1 S 1 . Il est arrivé à la conclusion erronée qu'ils pourraient être composés d'un seul type de (très grande) molécule. Le terme « protéine » pour décrire ces molécules a été proposé par l'associé de Mulder, Berzelius ; protéine est dérivé du mot grec πρώτειος ( proteios ), qui signifie " primaire ", " en tête " ou " debout devant ", + -in . Mulder a ensuite identifié les produits de dégradation des protéines tels que l' acide aminé leucine pour lequel il a trouvé un poids moléculaire (presque correct) de 131 Da . Avant "protéine", d'autres noms étaient utilisés, comme "albumines" ou "matières albumineuses" ( Eiweisskörper , en allemand).

Les premiers scientifiques de la nutrition tels que l'Allemand Carl von Voit croyaient que les protéines étaient le nutriment le plus important pour maintenir la structure du corps, car on croyait généralement que « la chair fait la chair ». Karl Heinrich Ritthausen a étendu les formes de protéines connues avec l'identification de l'acide glutamique . À la station d' expérimentation agricole du Connecticut, une revue détaillée des protéines végétales a été compilée par Thomas Burr Osborne . En travaillant avec Lafayette Mendel et en appliquant la loi du minimum de Liebig à l'alimentation des rats de laboratoire , les acides aminés nutritionnellement essentiels ont été établis. Le travail a été poursuivi et communiqué par William Cumming Rose . La compréhension des protéines en tant que polypeptides est venue des travaux de Franz Hofmeister et Hermann Emil Fischer en 1902. Le rôle central des protéines en tant qu'enzymes dans les organismes vivants n'a été pleinement apprécié qu'en 1926, lorsque James B. Sumner a montré que l'enzyme uréase était en fait une protéine.

La difficulté de purifier les protéines en grandes quantités les rendait très difficiles à étudier pour les premiers biochimistes des protéines. Ainsi, les premières études se sont concentrées sur les protéines qui pouvaient être purifiées en grande quantité, par exemple celles du sang, du blanc d'œuf, de diverses toxines et des enzymes digestives/métaboliques obtenues des abattoirs. Dans les années 1950, l' Armor Hot Dog Co. a purifié 1 kg de ribonucléase A pancréatique bovine pure et l'a mis gratuitement à la disposition des scientifiques ; ce geste a aidé la ribonucléase A à devenir une cible majeure pour l'étude biochimique des décennies suivantes.

Linus Pauling est crédité de la prédiction réussie des structures secondaires régulières des protéines basées sur la liaison hydrogène , une idée proposée pour la première fois par William Astbury en 1933. Les travaux ultérieurs de Walter Kauzmann sur la dénaturation , basés en partie sur des études antérieures de Kaj Linderstrøm-Lang , ont contribué à une compréhension du repliement et de la structure des protéines médiées par les interactions hydrophobes .

La première protéine à être séquencée était l'insuline , par Frederick Sanger , en 1949. Sanger a correctement déterminé la séquence d'acides aminés de l'insuline, démontrant ainsi de manière concluante que les protéines étaient constituées de polymères linéaires d'acides aminés plutôt que de chaînes ramifiées, de colloïdes ou de cycloles . Il a remporté le prix Nobel pour cette réalisation en 1958.

John Kendrew avec un modèle de myoglobine en cours

Avec le développement de la cristallographie aux rayons X , il est devenu possible de séquencer les structures protéiques. Les premières structures protéiques à résoudre étaient l'hémoglobine par Max Perutz et la myoglobine par Sir John Cowdery Kendrew , en 1958. L'utilisation d'ordinateurs et l'augmentation de la puissance de calcul ont également soutenu le séquençage de protéines complexes. En 1999, Roger Kornberg a réussi à séquencer la structure très complexe de l'ARN polymérase en utilisant les rayons X de haute intensité des synchrotrons .

Depuis, la cryo-microscopie électronique de grands assemblages macromoléculaires s'est développée. Cryo-EM utilise des échantillons de protéines congelés plutôt que des cristaux, et des faisceaux d'électrons plutôt que des rayons X. Il cause moins de dommages à l'échantillon, permettant aux scientifiques d'obtenir plus d'informations et d'analyser des structures plus grandes. La prédiction informatique de la structure des protéines de petits domaines protéiques a également aidé les chercheurs à aborder la résolution au niveau atomique des structures protéiques. En 2017, la banque de données sur les protéines comptait plus de 126 060 structures de protéines à résolution atomique.

Nombre de protéines codées dans les génomes

Le nombre de protéines codées dans un génome correspond approximativement au nombre de gènes (bien qu'il puisse y avoir un nombre important de gènes qui codent l'ARN de la protéine, par exemple les ARN ribosomiques ). Les virus codent généralement quelques à quelques centaines de protéines, les archées et les bactéries quelques centaines à quelques milliers, tandis que les eucaryotes codent généralement quelques milliers à des dizaines de milliers de protéines (voir la taille du génome pour une liste d'exemples).

Biochimie

Structure chimique de la liaison peptidique (en bas) et structure tridimensionnelle d'une liaison peptidique entre une alanine et un acide aminé adjacent (en haut/en médaillon). La liaison elle-même est constituée des éléments CHON .
Structures de résonance de la liaison peptidique qui relie les acides aminés individuels pour former un polymère protéique

La plupart des protéines sont constituées de polymères linéaires construits à partir de séries de jusqu'à 20 acides aminés L -α- différents . Tous les acides aminés protéinogènes possèdent des caractéristiques structurelles communes, y compris un carbone α auquel un groupe amino , un groupe carboxyle et une chaîne latérale variable sont liés . Seule la proline diffère de cette structure de base car elle contient un cycle inhabituel au groupe amine N-terminal, qui force le fragment amide CO – NH dans une conformation fixe. Les chaînes latérales des acides aminés standards, détaillées dans la liste des acides aminés standards , ont une grande variété de structures chimiques et de propriétés ; c'est l'effet combiné de toutes les chaînes latérales d'acides aminés d'une protéine qui détermine finalement sa structure tridimensionnelle et sa réactivité chimique. Les acides aminés d'une chaîne polypeptidique sont liés par des liaisons peptidiques . Une fois lié dans la chaîne protéique, un acide aminé individuel est appelé un résidu, et la série liée d'atomes de carbone, d'azote et d'oxygène est connue sous le nom de chaîne principale ou squelette protéique.

La liaison peptidique a deux formes de résonance qui contribuent à un certain caractère de double liaison et inhibent la rotation autour de son axe, de sorte que les carbones alpha sont à peu près coplanaires . Les deux autres angles dièdres dans la liaison peptidique déterminent la forme locale prise par le squelette protéique. L'extrémité avec un groupe amino libre est appelée extrémité N-terminale ou extrémité amino, tandis que l'extrémité de la protéine avec un groupe carboxyle libre est appelée extrémité C-terminale ou extrémité carboxy (la séquence de la protéine est écrite à partir de N- terminus à C-terminus, de gauche à droite).

Les mots protéine , polypeptide et peptide sont un peu ambigus et peuvent se chevaucher. La protéine est généralement utilisée pour désigner la molécule biologique complète dans une conformation stable , tandis que le peptide est généralement réservé aux oligomères d'acides aminés courts dépourvus souvent d'une structure 3D stable. Mais la frontière entre les deux n'est pas bien définie et se situe généralement entre 20 et 30 résidus. Le polypeptide peut désigner n'importe quelle chaîne linéaire unique d'acides aminés, généralement quelle que soit sa longueur, mais implique souvent l'absence d'une conformation définie .

Interactions

Les protéines peuvent interagir avec de nombreux types de molécules, y compris avec d'autres protéines , avec des lipides , avec des glucides et avec de l'ADN .

Abondance dans les cellules

Il a été estimé que les bactéries de taille moyenne contiennent environ 2 millions de protéines par cellule (par exemple E. coli et Staphylococcus aureus ). Les bactéries plus petites, telles que Mycoplasma ou les spirochètes , contiennent moins de molécules, de l'ordre de 50 000 à 1 million. En revanche, les cellules eucaryotes sont plus grandes et contiennent donc beaucoup plus de protéines. Par exemple, on estime que les cellules de levure contiennent environ 50 millions de protéines et les cellules humaines de l'ordre de 1 à 3 milliards. La concentration des copies de protéines individuelles varie de quelques molécules par cellule jusqu'à 20 millions. Tous les gènes codant pour les protéines ne sont pas exprimés dans la plupart des cellules et leur nombre dépend, par exemple, du type de cellule et des stimuli externes. Par exemple, sur les quelque 20 000 protéines codées par le génome humain, seules 6 000 sont détectées dans les cellules lymphoblastoïdes .

La synthèse

Biosynthèse

Un ribosome produit une protéine en utilisant l'ARNm comme matrice
La séquence d' ADN d'un gène code pour la séquence d'acides aminés d'une protéine

Les protéines sont assemblées à partir d'acides aminés à l'aide d'informations codées dans les gènes. Chaque protéine a sa propre séquence d'acides aminés unique qui est spécifiée par la séquence de nucléotides du gène codant pour cette protéine. Le code génétique est un ensemble d'ensembles de trois nucléotides appelés codons et chaque combinaison de trois nucléotides désigne un acide aminé, par exemple AUG ( adénineuracileguanine ) est le code de la méthionine . Comme l'ADN contient quatre nucléotides, le nombre total de codons possibles est de 64 ; par conséquent, il existe une certaine redondance dans le code génétique, certains acides aminés étant spécifiés par plus d'un codon. Les gènes codés dans l'ADN sont d'abord transcrits en ARN pré- messager (ARNm) par des protéines telles que l'ARN polymérase . La plupart des organismes traitent ensuite le pré-ARNm (également connu sous le nom de transcrit primaire ) en utilisant diverses formes de modification post-transcriptionnelle pour former l'ARNm mature, qui est ensuite utilisé comme matrice pour la synthèse des protéines par le ribosome . Chez les procaryotes , l'ARNm peut soit être utilisé dès sa production, soit être lié par un ribosome après s'être éloigné du nucléoïde . En revanche, les eucaryotes fabriquent de l'ARNm dans le noyau cellulaire , puis le transloquent à travers la membrane nucléaire dans le cytoplasme , où la synthèse des protéines a ensuite lieu. Le taux de synthèse des protéines est plus élevé chez les procaryotes que chez les eucaryotes et peut atteindre jusqu'à 20 acides aminés par seconde.

Le processus de synthèse d'une protéine à partir d'un modèle d'ARNm est connu sous le nom de traduction . L'ARNm est chargé sur le ribosome et est lu trois nucléotides à la fois en faisant correspondre chaque codon à son anticodon d' appariement de bases situé sur une molécule d'ARN de transfert , qui porte l'acide aminé correspondant au codon qu'il reconnaît. L'enzyme aminoacyl ARNt synthétase "charge" les molécules d'ARNt avec les acides aminés corrects. Le polypeptide en croissance est souvent appelé la chaîne naissante . Les protéines sont toujours biosynthétisées de l'extrémité N-terminale à l' extrémité C-terminale .

La taille d'une protéine synthétisée peut être mesurée par le nombre d'acides aminés qu'elle contient et par sa masse moléculaire totale , qui est normalement rapportée en unités de daltons (synonyme d' unités de masse atomique ), ou l'unité dérivée kilodalton (kDa). La taille moyenne d'une protéine augmente d'Archaea à Bacteria à Eukaryote (283, 311, 438 résidus et 31, 34, 49 kDa respectivement) en raison d'un plus grand nombre de domaines protéiques constituant des protéines dans des organismes supérieurs. Par exemple, les protéines de levure ont en moyenne 466 acides aminés de long et 53 kDa de masse. Les plus grandes protéines connues sont les titines , un composant du sarcomère musculaire , avec une masse moléculaire de près de 3 000 kDa et une longueur totale de près de 27 000 acides aminés.

Synthèse chimique

Les protéines courtes peuvent également être synthétisées chimiquement par une famille de méthodes connues sous le nom de synthèse peptidique , qui reposent sur des techniques de synthèse organique telles que la ligature chimique pour produire des peptides à haut rendement. La synthèse chimique permet l'introduction d'acides aminés non naturels dans les chaînes polypeptidiques, telles que la fixation de sondes fluorescentes aux chaînes latérales d'acides aminés. Ces méthodes sont utiles en biochimie de laboratoire et en biologie cellulaire , mais généralement pas pour des applications commerciales. La synthèse chimique est inefficace pour les polypeptides de plus de 300 acides aminés environ, et les protéines synthétisées peuvent ne pas assumer facilement leur structure tertiaire native . La plupart des méthodes de synthèse chimique procèdent de l'extrémité C-terminale à l'extrémité N-terminale, à l'opposé de la réaction biologique.

Structure

La structure cristalline de la chaperonine , un énorme complexe protéique. Une seule sous-unité protéique est mise en évidence. Les chaperonines assistent le repliement des protéines.
Trois représentations possibles de la structure tridimensionnelle de la protéine triose phosphate isomérase . Gauche : représentation de tous les atomes colorée par type d'atome. Au milieu : représentation simplifiée illustrant la conformation de la colonne vertébrale, colorée par la structure secondaire. A droite : Représentation de la surface accessible aux solvants colorée par type de résidu (résidus acides en rouge, résidus basiques en bleu, résidus polaires en vert, résidus non polaires en blanc).

La plupart des protéines se replient en structures 3D uniques. La forme dans laquelle une protéine se replie naturellement est connue sous le nom de sa conformation native . Bien que de nombreuses protéines puissent se replier sans aide, simplement grâce aux propriétés chimiques de leurs acides aminés, d'autres nécessitent l'aide de chaperons moléculaires pour se replier dans leur état natif. Les biochimistes se réfèrent souvent à quatre aspects distincts de la structure d'une protéine :

Les protéines ne sont pas des molécules entièrement rigides. En plus de ces niveaux de structure, les protéines peuvent passer d'une structure à l'autre pendant qu'elles remplissent leurs fonctions. Dans le cadre de ces réarrangements fonctionnels, ces structures tertiaires ou quaternaires sont généralement appelées « conformations », et les transitions entre elles sont appelées changements conformationnels. De tels changements sont souvent induits par la liaison d'une molécule de substrat au site actif d'une enzyme ou à la région physique de la protéine qui participe à la catalyse chimique. En solution, les protéines subissent également des variations de structure par vibration thermique et collision avec d'autres molécules.

Surface moléculaire de plusieurs protéines montrant leurs tailles comparatives. De gauche à droite : l'immunoglobuline G (IgG, un anticorps ), l'hémoglobine , l'insuline (une hormone), l'adénylate kinase (une enzyme) et la glutamine synthétase (une enzyme).

Les protéines peuvent être divisées de manière informelle en trois classes principales, qui correspondent aux structures tertiaires typiques : les protéines globulaires , les protéines fibreuses et les protéines membranaires . Presque toutes les protéines globulaires sont solubles et beaucoup sont des enzymes. Les protéines fibreuses sont souvent structurelles, comme le collagène , le composant majeur du tissu conjonctif, ou la kératine , le composant protéique des cheveux et des ongles. Les protéines membranaires servent souvent de récepteurs ou fournissent des canaux permettant aux molécules polaires ou chargées de traverser la membrane cellulaire .

Un cas particulier de liaisons hydrogène intramoléculaires au sein des protéines, mal protégées contre les attaques de l'eau et favorisant ainsi leur propre déshydratation , sont appelées déhydrons .

Domaines protéiques

De nombreuses protéines sont composées de plusieurs domaines protéiques , c'est-à-dire des segments d'une protéine qui se replient en unités structurelles distinctes. Les domaines ont généralement aussi des fonctions spécifiques, telles que des activités enzymatiques (par exemple, kinase ) ou ils servent de modules de liaison (par exemple, le domaine SH3 se lie à des séquences riches en proline dans d'autres protéines).

Motif de séquence

De courtes séquences d'acides aminés dans les protéines agissent souvent comme des sites de reconnaissance pour d'autres protéines. Par exemple, les domaines SH3 se lient généralement à de courts motifs PxxP (c'est-à-dire 2 prolines [P], séparées par deux acides aminés non spécifiés [x], bien que les acides aminés environnants puissent déterminer la spécificité de liaison exacte). De nombreux motifs de ce type ont été collectés dans la base de données des motifs linéaires eucaryotes (ELM).

Fonctions cellulaires

Les protéines sont les principaux acteurs au sein de la cellule, censées remplir les fonctions spécifiées par les informations codées dans les gènes. À l'exception de certains types d' ARN , la plupart des autres molécules biologiques sont des éléments relativement inertes sur lesquels agissent les protéines. Les protéines représentent la moitié du poids sec d'une cellule d' Escherichia coli , alors que d'autres macromolécules telles que l'ADN et l'ARN ne représentent que 3% et 20%, respectivement. L'ensemble des protéines exprimées dans une cellule ou un type de cellule particulier est appelé son protéome .

L'enzyme hexokinase est présentée comme un modèle moléculaire classique en forme de boule et de bâton. À l'échelle dans le coin supérieur droit se trouvent deux de ses substrats, l'ATP et le glucose .

La principale caractéristique des protéines qui permet également leur ensemble diversifié de fonctions est leur capacité à se lier spécifiquement et étroitement à d'autres molécules. La région de la protéine responsable de la liaison d'une autre molécule est connue sous le nom de site de liaison et est souvent une dépression ou une "poche" sur la surface moléculaire. Cette capacité de liaison est médiée par la structure tertiaire de la protéine, qui définit la poche du site de liaison, et par les propriétés chimiques des chaînes latérales des acides aminés environnants. La liaison aux protéines peut être extraordinairement étroite et spécifique ; par exemple, la protéine inhibitrice de la ribonucléase se lie à l' angiogénine humaine avec une constante de dissociation sous-femtomolaire (<10 -15 M) mais ne se lie pas du tout à son homologue d'amphibien l' onconase (>1 M). Des changements chimiques extrêmement mineurs tels que l'ajout d'un seul groupe méthyle à un partenaire de liaison peuvent parfois suffire à éliminer presque la liaison; par exemple, l' aminoacyl ARNt synthétase spécifique de l'acide aminé valine discrimine la chaîne latérale très similaire de l'acide aminé isoleucine .

Les protéines peuvent se lier à d'autres protéines ainsi qu'à des substrats de petites molécules . Lorsque les protéines se lient spécifiquement à d'autres copies de la même molécule, elles peuvent s'oligomériser pour former des fibrilles ; ce processus se produit souvent dans les protéines structurelles constituées de monomères globulaires qui s'auto-associent pour former des fibres rigides. Les interactions protéine-protéine régulent également l'activité enzymatique, contrôlent la progression dans le cycle cellulaire et permettent l'assemblage de grands complexes protéiques qui effectuent de nombreuses réactions étroitement liées avec une fonction biologique commune. Les protéines peuvent également se lier ou même s'intégrer aux membranes cellulaires. La capacité des partenaires de liaison à induire des changements conformationnels dans les protéines permet la construction de réseaux de signalisation extrêmement complexes . Comme les interactions entre les protéines sont réversibles et dépendent fortement de la disponibilité de différents groupes de protéines partenaires pour former des agrégats capables de réaliser des ensembles discrets de fonctions, l'étude des interactions entre des protéines spécifiques est une clé pour comprendre des aspects importants de la fonction cellulaire. , et finalement les propriétés qui distinguent des types de cellules particuliers.

Enzymes

Le rôle le plus connu des protéines dans la cellule est celui d' enzymes , qui catalysent les réactions chimiques. Les enzymes sont généralement très spécifiques et n'accélèrent qu'une ou quelques réactions chimiques. Les enzymes effectuent la plupart des réactions impliquées dans le métabolisme , ainsi que la manipulation de l'ADN dans des processus tels que la réplication de l'ADN , la réparation de l'ADN et la transcription . Certaines enzymes agissent sur d'autres protéines pour ajouter ou supprimer des groupes chimiques dans un processus connu sous le nom de modification post-traductionnelle. Environ 4 000 réactions sont connues pour être catalysées par des enzymes. L'accélération de la vitesse conférée par la catalyse enzymatique est souvent énorme - jusqu'à 10 17 fois plus de vitesse par rapport à la réaction non catalysée dans le cas de l' orotate décarboxylase (78 millions d'années sans l'enzyme, 18 millisecondes avec l'enzyme).

Les molécules liées et sur lesquelles agissent les enzymes sont appelées substrats . Bien que les enzymes puissent être constituées de centaines d'acides aminés, ce n'est généralement qu'une petite fraction des résidus qui entrent en contact avec le substrat, et une fraction encore plus petite - trois à quatre résidus en moyenne - qui sont directement impliquées dans la catalyse. La région de l'enzyme qui lie le substrat et contient les résidus catalytiques est connue sous le nom de site actif .

Les protéines directrices sont des membres d'une classe de protéines qui dictent la stéréochimie d'un composé synthétisé par d'autres enzymes.

Signalisation cellulaire et liaison de ligand

Diagramme en ruban d'un anticorps de souris contre le choléra qui se lie à un antigène glucidique

De nombreuses protéines sont impliquées dans le processus de signalisation cellulaire et de transduction du signal . Certaines protéines, telles que l'insuline , sont des protéines extracellulaires qui transmettent un signal de la cellule dans laquelle elles ont été synthétisées à d'autres cellules dans des tissus distants . D'autres sont des protéines membranaires qui agissent comme des récepteurs dont la fonction principale est de se lier à une molécule de signalisation et d'induire une réponse biochimique dans la cellule. De nombreux récepteurs ont un site de liaison exposé sur la surface cellulaire et un domaine effecteur dans la cellule, qui peut avoir une activité enzymatique ou peut subir un changement de conformation détecté par d'autres protéines dans la cellule.

Les anticorps sont des composants protéiques d'un système immunitaire adaptatif dont la fonction principale est de lier des antigènes ou des substances étrangères dans le corps et de les cibler pour les détruire. Les anticorps peuvent être sécrétés dans l'environnement extracellulaire ou ancrés dans les membranes de cellules B spécialisées appelées plasmocytes . Alors que les enzymes sont limitées dans leur affinité de liaison pour leurs substrats par la nécessité de conduire leur réaction, les anticorps n'ont pas de telles contraintes. L'affinité de liaison d'un anticorps à sa cible est extraordinairement élevée.

De nombreuses protéines de transport de ligands se lient à de petites biomolécules particulières et les transportent vers d'autres emplacements dans le corps d'un organisme multicellulaire. Ces protéines doivent avoir une forte affinité de liaison lorsque leur ligand est présent à fortes concentrations, mais doivent également libérer le ligand lorsqu'il est présent à faibles concentrations dans les tissus cibles. L'exemple canonique d'une protéine de liaison au ligand est l'hémoglobine , qui transporte l'oxygène des poumons vers d'autres organes et tissus chez tous les vertébrés et possède des homologues proches dans chaque règne biologique . Les lectines sont des protéines de liaison au sucre qui sont hautement spécifiques pour leurs fractions de sucre. Les lectines jouent typiquement un rôle dans les phénomènes de reconnaissance biologique impliquant les cellules et les protéines. Les récepteurs et les hormones sont des protéines de liaison hautement spécifiques.

Les protéines transmembranaires peuvent également servir de protéines de transport de ligand qui modifient la perméabilité de la membrane cellulaire aux petites molécules et aux ions. La membrane seule possède un noyau hydrophobe à travers lequel les molécules polaires ou chargées ne peuvent diffuser . Les protéines membranaires contiennent des canaux internes qui permettent à ces molécules d'entrer et de sortir de la cellule. De nombreuses protéines de canal ionique sont spécialisées pour sélectionner uniquement un ion particulier; par exemple, les canaux potassium et sodium discriminent souvent un seul des deux ions.

Protéines structurales

Les protéines structurelles confèrent rigidité et rigidité à des composants biologiques autrement fluides. La plupart des protéines structurales sont des protéines fibreuses ; par exemple, le collagène et l'élastine sont des composants essentiels du tissu conjonctif tel que le cartilage , et la kératine se trouve dans des structures dures ou filamenteuses telles que les cheveux , les ongles , les plumes , les sabots et certaines carapaces animales . Certaines protéines globulaires peuvent également jouer des fonctions structurelles, par exemple, l'actine et la tubuline sont des monomères globulaires et solubles, mais polymérisent pour former de longues fibres rigides qui composent le cytosquelette , ce qui permet à la cellule de conserver sa forme et sa taille.

D'autres protéines qui remplissent des fonctions structurelles sont des protéines motrices telles que la myosine , la kinésine et la dynéine , qui sont capables de générer des forces mécaniques. Ces protéines sont cruciales pour la motilité cellulaire des organismes unicellulaires et le sperme de nombreux organismes multicellulaires qui se reproduisent sexuellement . Ils génèrent également les forces exercées par la contraction des muscles et jouent un rôle essentiel dans le transport intracellulaire.

Évolution des protéines

Une question clé en biologie moléculaire est de savoir comment les protéines évoluent, c'est-à-dire comment des mutations (ou plutôt des changements dans la séquence d'acides aminés ) peuvent-elles conduire à de nouvelles structures et fonctions ? La plupart des acides aminés d'une protéine peuvent être modifiés sans perturber l'activité ou la fonction, comme le montrent de nombreuses protéines homologues d'une espèce à l'autre (telles que collectées dans des bases de données spécialisées pour les familles de protéines , par exemple PFAM ). Afin d'éviter les conséquences dramatiques des mutations, un gène peut être dupliqué avant de pouvoir muter librement. Cependant, cela peut également entraîner une perte complète de la fonction des gènes et donc des pseudo-gènes . Plus communément, les modifications d'un seul acide aminé ont des conséquences limitées, bien que certaines puissent modifier considérablement la fonction des protéines, en particulier dans les enzymes . Par exemple, de nombreuses enzymes peuvent modifier leur spécificité de substrat par une ou quelques mutations. Les modifications de la spécificité des substrats sont facilitées par la promiscuité des substrats , c'est-à-dire la capacité de nombreuses enzymes à se lier et à traiter plusieurs substrats . Lorsque des mutations surviennent, la spécificité d'une enzyme peut augmenter (ou diminuer) et donc son activité enzymatique. Ainsi, les bactéries (ou d'autres organismes) peuvent s'adapter à différentes sources de nourriture, y compris des substrats non naturels tels que le plastique.

Méthodes d'étude

Les activités et les structures des protéines peuvent être examinées in vitro , in vivo et in silico . Les études in vitro de protéines purifiées dans des environnements contrôlés sont utiles pour apprendre comment une protéine remplit sa fonction : par exemple, les études de cinétique enzymatique explorent le mécanisme chimique de l'activité catalytique d'une enzyme et son affinité relative pour diverses molécules de substrat possibles. En revanche, les expériences in vivo peuvent fournir des informations sur le rôle physiologique d'une protéine dans le contexte d'une cellule ou même d'un organisme entier . Les études in silico utilisent des méthodes informatiques pour étudier les protéines.

Purification des protéines

Pour effectuer une analyse in vitro , une protéine doit être purifiée des autres composants cellulaires. Ce processus commence généralement par la lyse cellulaire , dans laquelle la membrane d'une cellule est perturbée et son contenu interne libéré dans une solution connue sous le nom de lysat brut . Le mélange résultant peut être purifié par ultracentrifugation , qui fractionne les différents composants cellulaires en fractions contenant des protéines solubles ; lipides et protéines membranaires ; les organites cellulaires et les acides nucléiques . La précipitation par une méthode connue sous le nom de relargage permet de concentrer les protéines de ce lysat. Différents types de chromatographie sont ensuite utilisés pour isoler la ou les protéines d'intérêt en fonction de propriétés telles que le poids moléculaire, la charge nette et l'affinité de liaison. Le niveau de purification peut être surveillé à l'aide de divers types d' électrophorèse sur gel si le poids moléculaire et le point isoélectrique de la protéine souhaitée sont connus, par spectroscopie si la protéine a des caractéristiques spectroscopiques distinctes, ou par des dosages enzymatiques si la protéine a une activité enzymatique. De plus, les protéines peuvent être isolées en fonction de leur charge en utilisant l' électrofocalisation .

Pour les protéines naturelles, une série d'étapes de purification peut être nécessaire pour obtenir une protéine suffisamment pure pour des applications en laboratoire. Pour simplifier ce processus, le génie génétique est souvent utilisé pour ajouter des caractéristiques chimiques aux protéines qui les rendent plus faciles à purifier sans affecter leur structure ou leur activité. Ici, une "étiquette" constituée d'une séquence d'acides aminés spécifique, souvent une série de résidus d' histidine (une " étiquette His "), est attachée à une extrémité de la protéine. En conséquence, lorsque le lysat est passé sur une colonne de chromatographie contenant du nickel , les résidus d'histidine ligaturent le nickel et se fixent à la colonne tandis que les composants non marqués du lysat passent sans entrave. Un certain nombre de balises différentes ont été développées pour aider les chercheurs à purifier des protéines spécifiques à partir de mélanges complexes.

Localisation cellulaire

Protéines dans différents compartiments cellulaires et structures étiquetées avec une protéine fluorescente verte (ici, blanche)

L'étude des protéines in vivo concerne souvent la synthèse et la localisation de la protéine dans la cellule. Bien que de nombreuses protéines intracellulaires soient synthétisées dans le cytoplasme et des protéines liées à la membrane ou sécrétées dans le réticulum endoplasmique , les spécificités de la façon dont les protéines sont ciblées sur des organites ou des structures cellulaires spécifiques ne sont souvent pas claires. Une technique utile pour évaluer la localisation cellulaire utilise le génie génétique pour exprimer dans une cellule une protéine de fusion ou chimère constituée de la protéine naturelle d'intérêt liée à un « rapporteur » tel que la protéine fluorescente verte (GFP). La position de la protéine fusionnée dans la cellule peut être visualisée proprement et efficacement à l'aide de la microscopie , comme le montre la figure ci-contre.

D'autres méthodes pour élucider la localisation cellulaire des protéines nécessitent l'utilisation de marqueurs compartimentaux connus pour des régions telles que le RE, l'appareil de Golgi, les lysosomes ou les vacuoles, les mitochondries, les chloroplastes, la membrane plasmique, etc. Avec l'utilisation de versions marquées par fluorescence de ces marqueurs ou d'anticorps dirigés contre des marqueurs connus, il devient beaucoup plus simple d'identifier la localisation d'une protéine d'intérêt. Par exemple, l' immunofluorescence indirecte permettra la colocalisation de la fluorescence et la démonstration de l'emplacement. Les colorants fluorescents sont utilisés pour marquer les compartiments cellulaires dans un but similaire.

D'autres possibilités existent également. Par exemple, l' immunohistochimie utilise généralement un anticorps contre une ou plusieurs protéines d'intérêt qui sont conjuguées à des enzymes produisant des signaux luminescents ou chromogéniques qui peuvent être comparés entre les échantillons, permettant des informations de localisation. Une autre technique applicable est la cofractionnement dans des gradients de saccharose (ou d'un autre matériau) en utilisant une centrifugation isopycnique . Bien que cette technique ne prouve pas la colocalisation d'un compartiment de densité connue et de la protéine d'intérêt, elle augmente la probabilité et se prête mieux à des études à grande échelle.

Enfin, la méthode de référence pour la localisation cellulaire est la microscopie immunoélectronique . Cette technique utilise également un anticorps contre la protéine d'intérêt, ainsi que des techniques classiques de microscopie électronique. L'échantillon est préparé pour un examen au microscope électronique normal, puis traité avec un anticorps dirigé contre la protéine d'intérêt qui est conjugué à un matériau extrêmement dense en électricité, généralement de l'or. Cela permet la localisation des détails ultrastructuraux ainsi que de la protéine d'intérêt.

Grâce à une autre application de génie génétique connue sous le nom de mutagenèse dirigée , les chercheurs peuvent modifier la séquence protéique et donc sa structure, sa localisation cellulaire et sa sensibilité à la régulation. Cette technique permet même l'incorporation d'acides aminés non naturels dans des protéines, en utilisant des ARNt modifiés, et peut permettre la conception rationnelle de nouvelles protéines avec de nouvelles propriétés.

Protéomique

Le complément total de protéines présentes à un moment donné dans une cellule ou un type de cellule est appelé son protéome , et l'étude de ces ensembles de données à grande échelle définit le domaine de la protéomique , nommé par analogie avec le domaine connexe de la génomique . Les principales techniques expérimentales en protéomique comprennent l'électrophorèse 2D , qui permet la séparation de nombreuses protéines, la spectrométrie de masse , qui permet l'identification rapide à haut débit des protéines et le séquençage des peptides (le plus souvent après digestion en gel ), les puces à protéines , qui permettent la détection des niveaux relatifs des différentes protéines présentes dans une cellule, et le criblage à deux hybrides , qui permet l'exploration systématique des interactions protéine-protéine . Le complément total de telles interactions biologiquement possibles est connu sous le nom d' interactome . Une tentative systématique de déterminer les structures des protéines représentant chaque pli possible est connue sous le nom de génomique structurale .

Détermination de la structure

Découvrir la structure tertiaire d'une protéine, ou la structure quaternaire de ses complexes, peut fournir des indices importants sur la façon dont la protéine remplit sa fonction et comment elle peut être affectée, c'est-à-dire dans la conception de médicaments . Comme les protéines sont trop petites pour être vues au microscope optique , d'autres méthodes doivent être utilisées pour déterminer leur structure. Les méthodes expérimentales courantes incluent la cristallographie aux rayons X et la spectroscopie RMN , qui peuvent toutes deux produire des informations structurelles à une résolution atomique . Cependant, les expériences de RMN sont capables de fournir des informations à partir desquelles un sous-ensemble de distances entre des paires d'atomes peut être estimé, et les conformations finales possibles pour une protéine sont déterminées en résolvant un problème de géométrie de distance . L'interférométrie à double polarisation est une méthode analytique quantitative pour mesurer la conformation globale des protéines et les changements de conformation dus aux interactions ou à d'autres stimuli. Le dichroïsme circulaire est une autre technique de laboratoire pour déterminer la composition interne feuille β / hélice α des protéines. La microscopie cryoélectronique est utilisée pour produire des informations structurelles à plus faible résolution sur de très grands complexes protéiques, y compris des virus assemblés ; une variante connue sous le nom de cristallographie électronique peut également produire des informations à haute résolution dans certains cas, en particulier pour les cristaux bidimensionnels de protéines membranaires. Les structures résolues sont généralement déposées dans la Protein Data Bank (PDB), une ressource librement disponible à partir de laquelle des données structurelles sur des milliers de protéines peuvent être obtenues sous la forme de coordonnées cartésiennes pour chaque atome de la protéine.

Beaucoup plus de séquences de gènes sont connues que de structures protéiques. De plus, l'ensemble des structures résolues est biaisé vers des protéines qui peuvent être facilement soumises aux conditions requises en cristallographie aux rayons X , l'une des principales méthodes de détermination de la structure. En particulier, les protéines globulaires sont relativement faciles à cristalliser en vue de la cristallographie aux rayons X. Les protéines membranaires et les grands complexes protéiques, en revanche, sont difficiles à cristalliser et sont sous-représentés dans le PDB. Les initiatives de génomique structurale ont tenté de remédier à ces lacunes en résolvant systématiquement les structures représentatives des principales classes de plis. Les méthodes de prédiction de la structure des protéines tentent de fournir un moyen de générer une structure plausible pour les protéines dont les structures n'ont pas été déterminées expérimentalement.

Prédiction de structure

Les acides aminés constitutifs peuvent être analysés pour prédire la structure des protéines secondaires, tertiaires et quaternaires, dans ce cas l'hémoglobine contenant des unités hémiques

Complémentaire au domaine de la génomique structurale, la prédiction de la structure des protéines développe des modèles mathématiques efficaces de protéines pour prédire par ordinateur les formations moléculaires en théorie, au lieu de détecter des structures avec des observations en laboratoire. Le type de prédiction de structure le plus réussi, connu sous le nom de modélisation d'homologie , repose sur l'existence d'une structure "modèle" avec une similarité de séquence avec la protéine modélisée ; L'objectif de la génomique structurale est de fournir une représentation suffisante dans les structures résolues pour modéliser la plupart de celles qui restent. Bien que la production de modèles précis reste un défi lorsque seules des structures de modèles éloignées sont disponibles, il a été suggéré que l'alignement de séquences est le goulot d'étranglement de ce processus, car des modèles assez précis peuvent être produits si un alignement de séquences "parfait" est connu. De nombreuses méthodes de prédiction de structure ont servi à éclairer le domaine émergent de l'ingénierie des protéines , dans lequel de nouveaux replis protéiques ont déjà été conçus. De plus, les protéines (chez les eucaryotes ~ 33%) contiennent de grands segments non structurés mais biologiquement fonctionnels et peuvent être classées comme protéines intrinsèquement désordonnées . La prédiction et l'analyse des troubles protéiques constituent donc une partie importante de la caractérisation de la structure des protéines.

Bioinformatique

Une vaste gamme de méthodes de calcul ont été développées pour analyser la structure, la fonction et l'évolution des protéines. Le développement de tels outils a été motivé par la grande quantité de données génomiques et protéomiques disponibles pour une variété d'organismes, y compris le génome humain . Il est tout simplement impossible d'étudier toutes les protéines expérimentalement, c'est pourquoi seules quelques-unes sont soumises à des expériences en laboratoire tandis que des outils informatiques sont utilisés pour extrapoler à des protéines similaires. De telles protéines homologues peuvent être efficacement identifiées dans des organismes éloignés par alignement de séquences . Les séquences de génomes et de gènes peuvent être recherchées par une variété d'outils pour certaines propriétés. Les outils de profilage de séquences peuvent trouver des sites d' enzymes de restriction , ouvrir des cadres de lecture dans des séquences nucléotidiques et prédire des structures secondaires . Des arbres phylogénétiques peuvent être construits et des hypothèses évolutives développées à l'aide d'un logiciel spécial comme ClustalW concernant l'ascendance des organismes modernes et les gènes qu'ils expriment. Le domaine de la bioinformatique est aujourd'hui incontournable pour l'analyse des gènes et des protéines.

Simulation in silico de processus dynamiques

Un problème de calcul plus complexe est la prédiction des interactions intermoléculaires, telles que l'amarrage moléculaire , le repliement des protéines , l'interaction protéine-protéine et la réactivité chimique. Les modèles mathématiques pour simuler ces processus dynamiques impliquent la mécanique moléculaire , en particulier la dynamique moléculaire . À cet égard, des simulations in silico ont découvert le repliement de petits domaines protéiques α-hélicoïdaux tels que le casque villin , la protéine accessoire du VIH et des méthodes hybrides combinant la dynamique moléculaire standard avec les mathématiques mécaniques quantiques ont exploré les états électroniques des rhodopsines .

Au-delà de la dynamique moléculaire classique, les méthodes de dynamique quantique permettent la simulation de protéines dans le détail atomistique avec une description précise des effets mécaniques quantiques. Les exemples incluent la méthode Hartree multicouche multi-configuration dépendante du temps (MCTDH) et l' approche des équations hiérarchiques du mouvement (HEOM), qui ont été appliquées aux cryptochromes végétaux et aux complexes de collecte de lumière des bactéries, respectivement. Les simulations mécaniques quantiques et classiques de systèmes à l'échelle biologique sont extrêmement exigeantes en termes de calcul, de sorte que les initiatives de calcul distribué (par exemple, le projet Folding@home ) facilitent la modélisation moléculaire en exploitant les avancées du traitement parallèle GPU et des techniques de Monte Carlo .

Analyse chimique

La teneur totale en azote de la matière organique est principalement formée par les groupes amino des protéines. L'azote total Kjeldahl ( NTK ) est une mesure de l'azote largement utilisée dans l'analyse des eaux (usées), des sols, des denrées alimentaires, des aliments pour animaux et de la matière organique en général. Comme son nom l'indique, la méthode Kjeldahl est appliquée. Des méthodes plus sensibles sont disponibles.

La nutrition

La plupart des micro -organismes et des plantes peuvent biosynthétiser les 20 acides aminés standard , tandis que les animaux (y compris les humains) doivent obtenir certains des acides aminés à partir de l' alimentation . Les acides aminés qu'un organisme ne peut pas synthétiser par lui-même sont appelés acides aminés essentiels . Les enzymes clés qui synthétisent certains acides aminés ne sont pas présentes chez les animaux, comme l' aspartokinase , qui catalyse la première étape de la synthèse de la lysine , de la méthionine et de la thréonine à partir de l' aspartate . Si des acides aminés sont présents dans l'environnement, les micro-organismes peuvent conserver l'énergie en absorbant les acides aminés de leur environnement et en régulant à la baisse leurs voies de biosynthèse.

Chez les animaux, les acides aminés sont obtenus par la consommation d'aliments contenant des protéines. Les protéines ingérées sont ensuite décomposées en acides aminés par digestion , ce qui implique généralement une dénaturation de la protéine par exposition à un acide et une hydrolyse par des enzymes appelées protéases . Certains acides aminés ingérés sont utilisés pour la biosynthèse des protéines, tandis que d'autres sont convertis en glucose par gluconéogenèse ou introduits dans le cycle de l'acide citrique . Cette utilisation des protéines comme carburant est particulièrement importante dans des conditions de famine car elle permet d'utiliser les propres protéines du corps pour soutenir la vie, en particulier celles que l'on trouve dans les muscles .

Chez les animaux tels que les chiens et les chats, les protéines maintiennent la santé et la qualité de la peau en favorisant la croissance et la kératinisation des follicules pileux, réduisant ainsi la probabilité de problèmes cutanés produisant des mauvaises odeurs. Les protéines de mauvaise qualité jouent également un rôle dans la santé gastro-intestinale, augmentant le potentiel de flatulences et de composés odorants chez les chiens, car lorsque les protéines atteignent le côlon à l'état non digéré, elles sont fermentées et produisent du sulfure d'hydrogène gazeux, de l'indole et du scatole. Les chiens et les chats digèrent mieux les protéines animales que celles des plantes, mais les produits d'origine animale de mauvaise qualité sont mal digérés, notamment la peau, les plumes et le tissu conjonctif.

Voir également

Références

Lectures complémentaires

Manuels scolaires
  • Branden C, Tooze J (1999). Introduction à la structure des protéines . New York : Guirlande Pub. ISBN 978-0-8153-2305-1.
  • Murray RF, Harper HW, Granner DK, Mayes PA, Rodwell VW (2006). Biochimie illustrée de Harper . New York : Lange Medical Books/McGraw-Hill. ISBN 978-0-07-146197-9.
  • Van Holde KE, Mathews CK (1996). Biochimie . Menlo Park, Californie : Benjamin/Cummings Pub. Co., Inc ISBN 978-0-8053-3931-4.

Liens externes

Bases de données et projets

Tutoriels et sites Web éducatifs