La cellule/Organisation cellulaire/Procaryotes : Synthèse des protéines chez les procaryotes


	La synthèse des protéines chez les procaryotes

La synthèse des protéines chez les procaryotes a été très étudiée, car elle reprend dans les grandes lignes les mécanismes développés chez les eucaryotes et chez l'homme, mais de façon beaucoup plus simple. C'est grace aux bactéries que la biologie moléculaire a pu faire d'aussi grand progrès aujourd'hui.

La strcuture d'une protéine est entièrement determinée par la séquence en acide aminée qui la constitue. Pour synthetiser une protéine, la cellule doit donc assembler les acides aminés dans un ordre exact défini pour chaque protéine. La séquence en acide aminée est codée dans la molécule d'ADN qui constitue la mémoire de la cellule. Il existe dans la nature 20 acides aminés, mais seulement 4 bases nucléiques. Tout le problème consiste donc à transformer un code à quatre éléments en une structure linéaire à 20 éléments. Cette prouesse est réalisée dans toutes les cellules en 2 étapes appelées respectivement transcription et traduction, que nous allons détailler maintenant après avoir défini auparavant ce qu'est un gène.

Avant de continuer, je doit signaler que l'ADN ne synthètise pas les protéines, il ne fait que coder l'information nécessaire. La synthèse est effectuée par tout un mécanisme enzymatique à partir des informations portées par la molécules.

Le gène

L'ADN de la cellule est une molécule linéaire constituée d'un enchainement de bases nucléiques dans un ordre précis. Cette molécule, généralement unique chez les procaryotes, est capable de coder les informations nécessaires pour synthétiser plusieurs milliers de protéines différentes. Le code de ces protéine est donc disposé bout à bout sur la molécule d'ADN. Ce qui implique que l'ADN est divisé en zone, chacune correspondant à une protéine précise. Ces zones sont appelée gène. L'ADN peut ainsi être assimilé à une bande magnétique qui comporte plusieurs fichiers à la suite l'un de l'autre.

Il ne suffit pas pour synthétiser une protéine, d'avoir une molécule d'ADN. Puisque une molécule d'ADN peut coder plusieurs protéines, il faut savoir où chacune commence et où elle finit. Il faut aussi que la protéine soit synthétisée quand il faut mais pas de façon inutile. Toutes ces informations sont codées sous forme de séquence de base à l'intérieur de la molécule d'ADN. Le gène apparait donc comme une véritable fiche technique qui indique non seulement la composition de la protéine, les conditions dans lesquelles elle doit être synthétisée et où elle doit être utilisée. Souvent, ces informations de régulation prennent plus de place dans le gène que la composition de la protéine elle même.

Nous avons vu plus haut que la molécule d'ADN est constituée de deux brins complémentaires. Des expériences ont montrés que le gène est porté par un seul des deux brins. L'autre brins ne comporte aucune information, si ce n'est qu'il permet par complémentarité de resynthétiser le premier brin. Cette règle est respectée par l'ensemble des êtres vivants sauf chez les virus à ADN chez qui le génome extrémement réduit oblige à choisir leur séquence protéique de façon à utiliser les deux brins de la molécule d'ADN. D'autre part, le brin traduit en protéine est lu dans un sens bien précis, dans le sens 5' -> 3'. Ces informations de régulation sont rassemblées dans une zone qui précéde le gène et qui est appelée promoteur. Le promoteur est caractérisé par des séquences consensus, c'est à dire des séquences de nucléotides qui ne sont pas toutes identiques d'un promoteur à un autre mais qui ressemblent, à l'exception d'un ou deux nucléotides, à une séquence moyenne (consensus) appelée boite. Il existe deux boites, la boite CAAT et la boite TATA, ainsi nommées en fonction de la séquence consensus qui les caractérise.

Une particularité dun génome des procaryotes est l'organisation des gènes en opérons. Plusieurs sont disposés à la suite sur le brin d'ADN et tous sont contrôlés par la même zone de régulation. Tous ces gènes seront transcris sur le même ARN message et seront traduit en protéines. Cela est un moyen simple, mis en place par les procaryotes pour assurer la synthèse coordonnées de protéines dépendantes. On trouve ainsi dans un opéron une enzyme et ses facteurs de régulation, les enzymes spécifiques d'une voie métabolique, etc... Les eucaryotes ne possèdent pas d'opérons, ils ont d'autres systèmes plus complexes, mais autrement plus performants.

La transcription

La molécule d'ADN est unique dans l'organisme. Ceci a deux implications : tous mécanisme qui risque d'endommager l'ADN detruirait automatiquemnt le gène en cours de traduction et la quantité de protéines qu'il est possible de synthétiser par unité de temps est réduite. Ces difficultés ont été tournée par les cellules en n'effectuant pas la traduction directement depuis l'ADN mais se servant de celui-ci pour créer plusieurs copies de travail qui elles servivont à synthétiser les protéines.

La première étape de la synthèse protéique est donc la synthèse d'une copie de la partie utile du gène. La molécule synthétisée n'est toutefois pas de l'ADN mais de l'ARN. Elle diffère de l'ADN par trois particularités :/

Le desoxyribose est remplacé par du ribose.
La base azotée thymine est remplacée par de l'uracile.
Enfin, la molécule d'ADN est monocatenaire, c'est à dire, constituée d'un seul brin.

L'ARN qui servira de matrice est appelé ARN messager, car il porte le message sur la structure de la protéine. Il est différent pour chaque protéine synthétisé. On peut noter trois particularités de cet ARN qui différe de celui des eucaryotes, d'une part sur une molécule d'ARN, le gène est en un seul morceau (ce détail sera approndi lors de l'etude des gènes fragmenté des eucoaryotes), d'autre part, un ARN peut porter plusieur gènes; au sein d'un opéron, enfin, un même gène ne peut coder pour qu'une seule protéine, alors que les eucaryotes par le mécanisme de l'épissage peuvent coder plusieurs protéines par un même gène.
L'ARN messager n'est toutefois pas le seul ARN synthétisé par la cellule à partir de l'ADN. On trouve deux autres types qui sont aussi codés par des gènes de l'ADN, mais ne seront pas traduits en protéines : l'ARN ribosomal, qui intervient dans la machinerie de la synthèse protéique et l'ARN de transfert qui participe à la reconnaissance des acides aminés. Ces deux types sont communs à toutes les protéines synthétisées.

La synthèse de l'ARN fait intervenir un ensemble protéique très complexe, la RNA synthétase. La première étape de la transcription est la reconnaissance du gène à transcrire. Cette étape fait intervenir des mécanismes variés qui dépendent de la protéine à transcrire, mais qui tous reposent sur le principe d'une protéine spécifique du ou des gène à transcrire, qui se fixe en un endroit précis de l'ADN, située dans le promoteur. Cette protéine va servir de point d'ancrage au système RNA synthétase, cette phase n'ayant lieu naturellement que si les deux boites CAAT et TATA sont présentes. Ce complexe va parcourir la molcéule d'ADN pour la lire. Elle va tout d'abord dérouler la molécule d'ADN, puis séparer les deux brins, puis assembler les bases azotées en se servant du brin complémentaire comme matrice pour aboutir à la molécule d'ARN. Derrière elle, les deux brins se réassemblent et l'ADN se réenroule. Quand la RNA synthétase rencontre le site de terminaison de gène, elle se sépare de l'ADN est l'ARN est libéré dans le cytoplasme. Souvent, plusieurs RNA synthétase peuvent parcourir le même gène simultanément, ce qui permet à partir d'un seul gène d'obtenir de multiples copies sous forme d'ARN, ce qui permettra ultérieurement de synthétiser la protéine beaucoup plus rapidement que si la traduction avait lieu directement depuis l'exemplaire unique de l'ADN.

Maintenant que l'ARN est prêt, l'étape suivante, sa traduction en protéine va pouvoir débuter.

La traduction

La traduction est la synthèse de protéine à partir du message porté par la molécule d'ARN. Ce terme de traduction se justifie car il faut passer d'une succession de 4 bases azotées à une succession de 20 acides aminés. La méthode la plus simple à imaginer est de faire correspondre à chaque acide aminé une succession de bases azotées, les groupes de base azotés correspondant à chaque acides aminés se succedant sur la molécule d'ARN pour coder la séquence de la protéine. En regroupant les bases par deux, on peut ainsi coder 8 acides aminés, par 3 on dispose de 64 possibilités, ce qui est suffisant pour nos besoins. Comme il y a 20 acides aminés, on pouvait donc supposer que :

le codage des protéines est beaucoup plus complexe, utilisant par exemple un mélange de doublet et de triplet.
plusieurs triplets de bases codent pour le même acide aminés
seuls une partie des triplets codent pour des acides aminés, les autres étant inutilisés.

Des expériences ont montrés que la réalité est un petit peu un mélange des trois.

Les acides aminés sont bien codés par des triplets de bases azotés et plusieurs triplet correspondent au même acide aminés, ce qui correspond à l'hypothèse 2. Mais certains triplets ne code aucun acide aminés (hypothèse 3). Enfin, si plusieurs triplets codent pour plusieurs acides aminés, la correspondance ne s'est pas établie au hasard. Souvent seules les deux premières bases sont spécifiques de l'acide aminés, la troisième étant sans importance ou au mieux seule sa nature chimique (purique ou pyrimidique) compte. Seul pour un petit nombre d'acide aminés, la succession exacte des bases azotés est importante. On retrouve ainsi un code à deux bases noyés dans le code à trois bases (hypothèse 1).
Trois triplets ne codent pour aucun acides aminés. Cela ne signifient pas qu'ils ne servent à rien. En réalité, ils servent de ponctuation, indiquant au mécansime de synthèse que la fin de la protéine est atteinte. Il existe aussi un triplet indiqué ou débute la protéine, mais le cas est beaucoup plus complexe puiqu'il code aussi pour un acide aminé, ce qui lui atttribue donc deux rôles.
Il est a noter que le code de correspondance entre les triplets de bases et les acides aminés est, à de très rares exceptions près et dans une mesure très réduite, universel pour l'ensemble de la planète, des bactéries à l'homme. Ce fait, plus que tous les autres milite en faveur d'une origine commune pour tous les êtres vivants. Ce code a été aujourd'hui élucidé et s'appelle le code génétique. Le triplet de base azoté est le codon.

Le code génétique
	U	C	A	G
U	phe phe leu leu	ser ser ser ser	tyr tyr stop stop	cys cys stop try	U C A G
C	leu leu leu leu	pro pro pro pro	his his gln gln	arg arg arg arg	U C A G
A	ileu ileu ileu met	thr thr thr thr	asn asn lys lys	ser ser arg arg	U C A G
G	val val val val	ala ala ala ala	asp asp glu glu	gly gly gly gly	U C A G

Dans le tableau, l'ordre des bases se lit de gauche à droite. Les codons rouges sont les codons stop qui signifient au mécanisme de synthèse protéique la fin de la chaine. Le codon bleu est le codon d'initiation qui, comme on le voit, code aussi pour la méthionine.

A partir du brin d'ARN et des acides aminés, la synthèse de la protéine va s'executer en plusieurs étapes : la reconnaissance des acides aminés, l'élongation puis la maturation de la chaine protéique. Dans la plupart des ces étapes sont sous le contrôle, le rôle majeur est joué par un ARN.

La reconnaissance des acides aminés.

Schéma d'un ARN de transfert Il n'existe aucune reconnaissance directe entre un codon et un acide aminé. Le système de synthèse des protéines reconnait les acides aminés à ajouter à la chaine protéique parce que ceux ci sont fixés de facon covalente à un ARN d'un type particulier appelé ARN de transfert. Cet ARN est constitué d'une courte chaine de base azotées à la séquence parfaitement determiné. Cette séquence provoque un repliement de la chaine dans l'espace qui forme alors 3 boucle et comporte une longue queue. La seconde boucle porte la séquence complémentaire du codon (l'anticodon) qui sera reconnu par le système de synthèse. L'acide aminé est fixé à l'extrémité de la longue queue au moyen d'une protéine spéciale qui reconnait la structure tridimensionnelle de l'ARN et l'acide aminé. Il existe 20 protéines de liaison (une pour chaque acide aminé) et 61 ARN de transfert (un par codon).

L'élongation de la chaine protéique.

Schéma d'un ARN de transfert La synthèse de la chaine protéique se fait dans le cytoplasme au niveau d'un organite spécialisé, le ribosome. Le ribosome est constitué de deux sous unités nommées 30S et 50S en fonction de leur coefficient de sédimentation, chacune formée de protéines et d'une troisieme sorte d'ARN, l'ARN ribosomique. Dans un premier temps, l'ARN messager se fixe sur la particule 30S du ribosome, au niveau du codon AUG qui indique le début de la traduction. La deuxième sous-unité se fixe alors à la première et reconstitue le ribosome complet et fonctionnel.
Le ribosome comporte un site qui peut recevoir le complexe acide-aminé/ARN de transfert. Si l'anticodon porté par l'ARNt est complémentaire du codon de l'ARNm le complexe prend place dans le site. Le ribosome sépare alors le complexe et soude l'acide aminé à la chaine protéique, l'ARNt quitte le site pour être réutilisé. Le ribosome glisse ensuite d'un codon le long de l'ARNm, pour accueillir l'acide aminé suivant.
Quand un codon stop est rencontré, aucun complexe acide amine/ARNt ne peut prendre place dans le site et la chaine peptidique est libérée.

Quand un ribosome a suffisament avancé le long de l'ARNm, un autre ribosome peut venir se fixer sur le site d'initiatin de la traduction et commencer une nouvelle traduction alors que la première n'est pas encore finie. Une telle structure avec plusieurs ribosomes traduisant simultanement le même ARNm est appelé polysome.

La synthèse protéiques des bactéries présente une particularité absente chez les eucaryotes, le début de la traduction alors que la transcription n'est pas terminée. Chez les eucaryotes, la synthèse d'ARN a lieu dans le noyau et les ribosomes se situant dans le cytoplasme, les deux évènements sont séparés dans l'espace et le temps. Il n'en est pas de même chez les procaryotes où les deux peuvent se prduire simultanément.

La maturation de la chaine protéique.

Après sa synthèse, la chaine protéique est rarement immédiatement utilisable. Elle doit subir une étape de maturation qui doit la rendre apte à exercer sa fonction. Cette étape est très variable d'une protéine à l'autre. Les principales possibilités sont :

La coupure de la chaine protéique en plusieurs morceaux
La fixation de groupement glucidique ou lipidique sur certains acides aminés. C'est en général le cas pour les protéines extracellulaires
L'assemblage de plusieurs chaines pour former une protéine multimérique.
La transformation d'un acide aminé en un autre. C'est la méthode utilisée pour insérer dans une protéine un acide aminé qui ne fait pas partie des 20 figurants dans le code génétique.

Toutes ces étapes sont sous la dépendance de protéines spécialisées.

Tous ces mécanismes permettent la synthèse des protéine à une vitesse élevée et avec un taux d'erreur très faible. Ces mécanismes se retrouvent avec de très légères différences chez les eucaryotes.

Laurent DELEPINE

Mise à jour le 30 dec 2000