Informations

Terminologie des séquences de promoteurs en relation avec des brins d'ADN


J'étudie la biologie moléculaire et j'essaye de comprendre une expérience qui montre l'importance des promoteurs dans le niveau relatif de transcription (RT). L'image ci-dessous provient du livre de Rolf Knippers "Molekulare Genetik" (8e édition).

La légende dit (entre autres) :

Die erste Zeile gibt die normale "Wildtyp"-Sequenz der 5'-flankierenden Region wieder.

Ce qui, en anglais, signifie quelque chose comme :

La première ligne répète la séquence de type sauvage normale de la région flanquante 5'.

La colonne de droite donne le niveau de transcription relatif (RT), 1,0 étant le niveau de transcription le plus élevé possible. Comme on peut le voir, les lignes où certaines parties de la "région 5'" ont été supprimées donnent des niveaux de RT assez faibles, car certaines régions du promoteur sont manquantes.

Mes questions sont les suivantes :

1) D'après ceci et cela, je comprends que l'ARN polymérase lit et utilise à la fois des brins codants et non codants afin de synthétiser de l'ARN. Dès lors, comment ont-ils réussi à utiliser les séquences des régions des brins qui avaient été supprimées pour qu'une polymérase « les lise » et effectue la transcription ?

2) Si la polymérase lit le brin matrice dans le sens 3' -> 5', ne faut-il pas parler de "boîte ATAT" ou "boîte TAAC" au lieu de boîtes "TATA" ou "CAAT" ? Cela signifie-t-il que les régions "promotrices" qu'ils utilisent sur le graphique ci-dessus sont en fait sur le brin de codage ?

Merci beaucoup pour votre aide.


Il semble que cette question soit d'ordre terminologique, alors j'y réponds comme telle.

Convention pour représenter les caractéristiques dans les séquences d'ADN

La convention est qu'en indiquant toute caractéristique de séquence† dans un gène codant pour une protéine sur un ADN double brin, un seul brin‡ est représenté - celui à partir duquel la séquence aminée pourrait être lue en utilisant le code génétique (conceptuellement, avec T substitué à U). Comme toute autre séquence d'acides nucléiques§, elle est toujours écrite dans le sens 5' vers 3' de la même manière que l'ARNm transcrit à partir de celle-ci, sans que cela ne soit explicitement indiqué.

† Une exception pourrait être l'hémi-méthylation, auquel cas les deux brins seraient affichés.

J'appelle ça le sens brin. Je discute la nomenclature plus loin ci-dessous.

§ Une exception est que les anticodons d'ARNt sont parfois écrits dans le sens 3ʹ à 5ʹ pour faciliter la comparaison avec le codon, mais dans ce cas, la directionnalité est indiquée.

Origine et justification de cette convention

  1. Historique. La séquence d'acides aminés de la protéine (le produit du gène) est au cœur de cette convention car la connaissance du code génétique, et donc la représentation de la région de l'ARNm qui code la protéine - et par extension l'ADN - était la première information de séquence être connu.

  2. Cohérence logique. Plus tard, d'autres caractéristiques de séquences ont été identifiées (dont certaines initialement pourraient n'être que des caractéristiques génétiques), par ex. sites de liaison du ribosome, signaux d'addition de polyadénylation, sites de démarrage de la transcription, promoteurs, sites de reconnaissance des facteurs de transcription. Il était logiquement cohérent de les représenter sur le même brin que la séquence codante.

  3. Agnosticisme fonctionnel. Dans de nombreux cas, la fonction d'une séquence suivait sa description, il n'y avait donc aucune raison de la placer initialement sur un brin particulier. Cependant, même si l'on pensait que la fonction d'une séquence devait être reconnue sur le brin opposé (ce que j'appellerais le anti-sens brin), il serait imprudent scientifiquement de changer la représentation pour l'indiquer. La science progresse et l'interprétation change. Mieux vaut séparer les caractéristiques descriptives concrètes des conclusions sur leur fonction.

Cela ne pourrait jamais être une boîte ATAT

Même si vous avez représenté la boîte TATA sur le brin anti-sens, cela ne pourrait jamais être appelé une « boîte ATAT » (comme suggéré par l'affiche) car, selon la convention de base, ATAT est 5ʹ-ATAT-3ʹ, et sur la brin antisens, la séquence est 3'-ATAT-5', c'est-à-dire TATA!

Terminologie pour désigner les deux brins de l'ADNdb

Alors que ce qui précède est la convention universellement suivie, ce qui suit n'est que mon opinion. En science, la terminologie est importante pour communiquer des idées sans ambiguïté, je pense donc qu'il vaut la peine d'expliquer l'ambiguïté de certains termes, dont je déconseille l'utilisation.

Sens et anti-sens C'est mon terme préféré car, même s'il n'est pas parfait, il évite les écueils des autres. L'idée me semble claire que lorsque vous lisez la chaîne de codons qui codent la séquence d'acides aminés de ce brin, ils "ont un sens". (L'anti-sens est utilisé de préférence au non-sens, car « non-sens » était le terme utilisé historiquement pour les mutations qui convertissaient les codons d'acides aminés en codons d'arrêt.) Il peut également être étendu aux gènes non codants pour les protéines (par exemple pour l'ARNt) , où « sens » est en corrélation avec la séquence du produit du gène.

J'utiliserai « sens » et « anti-sens » comme terminologie de référence pour discuter d'autres termes.

Codage et non-codage Ceci présente l'inconvénient de ne pas pouvoir être étendu à des gènes ne codant pas pour des protéines. Cependant, ma principale objection est que cela peut prêter à confusion, car le codage ne fait référence sans ambiguïté qu'à l'ARNm. Comme le brin anti-sens est la matrice de l'ARN polymérase, on pourrait faire l'association mentale entre cela et le « codage », alors que c'est le brin sens qui est visé dans cet usage (certes courant).

Modèle et non modèle La matrice pourrait être un terme plus logique pour le brin anti-sens car il s'agit de la matrice pour la transcription par l'ARN polymérase (bien que l'ARNm soit également une matrice - pour la traduction). Cependant, il n'est utilisé que rarement.

Plus et moins Cette terminologie est utilisée pour les virus simple brin (en particulier à ARN) pour représenter le génome entier, où dans les virus à brin plus, le génome est également l'ARNm, c'est-à-dire le brin sens. Un problème ici est que cela peut être déroutant pour le débutant, qui par extrapolation peut supposer que dans les génomes à ADN double brin, un brin est le brin sens pour tous les gènes. Ce n'est pas. Ce qui m'amène à mon dernier point…

… quelle que soit la terminologie que vous utilisez, il est préférable de s'assurer qu'il est clair que vous faites référence au volet sens ou anti-sens d'un gène, pas du tout génome. Vous devez utiliser une autre terminologie pour faire la distinction entre les deux volets, par ex. ADN bactérien ou plasmidique s'il est nécessaire de les distinguer.


Contribution de la séquence d'ADN du promoteur à la vitesse de formation de l'hétérochromatine et à la mémoire de la répression génique dans les fibroblastes d'embryons de souris

L'inactivation durable des gènes par la formation de domaines d'hétérochromatine compacts joue un rôle essentiel au cours du développement des mammifères dans l'établissement de tissus définis capables de conserver l'identité cellulaire. Les caractéristiques de la répression du gène de l'hétérochromatine sont la liaison de la protéine hétérochromatine 1 (HP1), la triméthylation de la lysine 9 sur l'histone H3 (H3K9me3) et la méthylation des résidus cytosine de l'ADN. HP1 se lie directement à la modification des histones H3K9me3, et bien que des ADN méthyltransférases aient été trouvées en complexe avec des histones méthyltransférases et HP1, il reste beaucoup à savoir sur la relation entre la séquence d'ADN et HP1 dans les cellules de mammifères différenciées. Pour explorer davantage cette interaction dans un système contrôlé, nous avons conçu un système pour tester l'effet de la teneur en CpG du promoteur sur la cinétique de formation et la mémoire d'un domaine d'hétérochromatine médié par HP1 dans les fibroblastes d'embryons de souris (MEF). Pour ce faire, nous avons construit une comparaison côte à côte des constructions de rapporteurs de type sauvage (CpGFull) et appauvries en CpG (CpGDep) dans le contexte du dosage in vivo de la chromatine (CiA), qui utilise chimiquement- proximité induite (CIP) pour attacher le domaine chromoshadow de HP1α (csHP1α) à un gène rapporteur fluorescent d'une manière réversible et chimiquement dépendante. En comparant la réponse des constructions de rapporteurs CpGFull et CpGDep, nous avons découvert que la formation d'hétérochromatine par recrutement de csHP1α n'est pas affectée par la teneur en dinucléotides CpG sous-jacente du promoteur, telle que mesurée par la vitesse de silençage génique ou d'enrichissement de H3K9me3 au niveau du gène silencieux. Cependant, la récupération de l'extinction à long terme est sensiblement plus rapide dans les lignées de rapporteurs appauvries en CpG. Ces données fournissent la preuve que la stabilité du domaine d'hétérochromatine HP1 dépend de la séquence d'ADN sous-jacente. De plus, ces lignées cellulaires représentent un nouveau système modulaire permettant d'étudier l'effet des séquences d'ADN sous-jacentes sur l'efficacité des modificateurs épigénétiques.

Déclaration de conflit d'intérêts

Les auteurs ont déclaré qu'ils n'existaient pas de conflit d'intérêts.

Les figures

Fig 1. Création de CpGDep et CpGFull…

Fig 1. Création de lignées cellulaires rapporteurs CpGDep et CpGFull pour tester les effets de CpG…

Fig 2. Le recrutement de csHP1α induit le silence…

Fig 2. Le recrutement de csHP1α induit l'extinction de l'expression de la GFP.

A) Les histogrammes représentatifs montrent une réduction…

Fig 3. Enrichissement de H3K9me3 en deux…

Fig 3. Enrichissement de H3K9me3 dans deux lignées cellulaires pendant six jours de CIP.

Fig 4. Silençage génique et enrichissement de…

Fig 4. Silençage génique et enrichissement de H3K9me3 dans deux lignées cellulaires pendant 48 heures…

Fig 5. Récupération de l'expression des gènes après…

Fig 5. Récupération de l'expression des gènes après une hétérochromatisation à court terme.


Contenu

Pour que la transcription ait lieu, l'enzyme qui synthétise l'ARN, connue sous le nom d'ARN polymérase, doit se fixer à l'ADN à proximité d'un gène. Les promoteurs contiennent des séquences d'ADN spécifiques telles que des éléments de réponse qui fournissent un site de liaison initial sécurisé pour l'ARN polymérase et pour des protéines appelées facteurs de transcription qui recrutent l'ARN polymérase. Ces facteurs de transcription ont des séquences d'activateurs ou de répresseurs spécifiques de nucléotides correspondants qui se fixent à des promoteurs spécifiques et régulent l'expression des gènes.

Chez les bactéries Le promoteur est reconnu par l'ARN polymérase et un facteur sigma associé, qui à leur tour sont souvent amenés à l'ADN promoteur par la liaison d'une protéine activatrice à son propre site de liaison à l'ADN à proximité. Chez les eucaryotes Le processus est plus compliqué, et au moins sept facteurs différents sont nécessaires pour la liaison d'une ARN polymérase II au promoteur.

Les promoteurs représentent des éléments critiques qui peuvent travailler de concert avec d'autres régions régulatrices (amplificateurs, silencieux, éléments limites/isolants) pour diriger le niveau de transcription d'un gène donné. Un promoteur est induit en réponse à des changements d'abondance ou de conformation de protéines régulatrices dans une cellule, qui permettent à des facteurs de transcription d'activation de recruter l'ARN polymérase. [2] [3]

Comme les promoteurs sont généralement immédiatement adjacents au gène en question, les positions dans le promoteur sont désignées par rapport au site de démarrage de la transcription, où la transcription de l'ADN commence pour un gène particulier (c. -100 est une position 100 paires de bases en amont).

Dans le noyau cellulaire, il semble que les promoteurs soient distribués préférentiellement à la lisière des territoires chromosomiques, vraisemblablement pour la co-expression de gènes sur différents chromosomes. [4] De plus, chez l'homme, les promoteurs présentent certaines caractéristiques structurelles caractéristiques de chaque chromosome. [4]

Eucaryote Modifier

  • Promoteur central - la partie minimale du promoteur nécessaire pour initier correctement la transcription [5]
    • Comprend le site de démarrage de la transcription (TSS) et des éléments directement en amont
    • Un site de liaison pour l'ARN polymérase
        : transcrit les gènes codant les ARN ribosomiques 18S, 5.8S et 28S : transcrit les gènes codant les ARN messagers et certains petits ARN et microARN nucléaires : transcrit les gènes codant les ARN de transfert, les ARN ribosomiques 5s et autres petits ARN
      • Environ 250 paires de bases en amont du site de départ
      • Sites de liaison spécifiques aux facteurs de transcription
      • Tout ce qui est plus en amont (mais pas un activateur ou une autre région de régulation dont l'influence est indépendante de la position/orientation)
      • Sites de liaison spécifiques aux facteurs de transcription

      Bactérien Modifier

      Chez les bactéries, le promoteur contient deux éléments de séquence courte d'environ 10 (Pribnow Box) et 35 nucléotides en amont du site de démarrage de la transcription.

      • La séquence à -10 (l'élément -10) a la séquence consensus TATAAT.
      • La séquence en -35 (l'élément -35) a la séquence consensus TTGACA.
      • Les séquences consensus ci-dessus, bien que conservées en moyenne, ne se trouvent pas intactes dans la plupart des promoteurs. En moyenne, seulement 3 à 4 des 6 paires de bases de chaque séquence consensus se trouvent dans un promoteur donné. Peu de promoteurs naturels ont été identifiés à ce jour qui possèdent des séquences consensus intactes aux deux. consensus.
      • L'espacement optimal entre les séquences -35 et -10 est de 17 pb.
      • Certains promoteurs contiennent un ou plusieurs sous-sites d'élément promoteur en amont (élément UP) [7] (séquence consensus 5'-AAAAAARNR-3' lorsqu'elle est centrée dans la région -42 séquence consensus 5'-AWWWWWTTTTT-3' lorsqu'elle est centrée dans la région -52 W = A ou TR = A ou GN = toute base). [8]

      Les séquences de promoteur ci-dessus ne sont reconnues que par l'holoenzyme ARN polymérase contenant sigma-70. Les holoenzymes d'ARN polymérase contenant d'autres facteurs sigma reconnaissent différentes séquences de promoteur de noyau.

      Probabilité d'occurrence de chaque nucléotide Modifier

      Eucaryote Modifier

      Les promoteurs eucaryotes sont divers et peuvent être difficiles à caractériser, cependant, des études récentes montrent qu'ils sont divisés en plus de 10 classes. [9]

      Les promoteurs de gènes sont généralement situés en amont du gène et peuvent avoir des éléments régulateurs à plusieurs kilobases du site de démarrage de la transcription (amplificateurs). Chez les eucaryotes, le complexe transcriptionnel peut amener l'ADN à se replier sur lui-même, ce qui permet de placer des séquences régulatrices loin du site réel de transcription. Les promoteurs eucaryotes dépendant de l'ARN-polymérase II peuvent contenir un élément TATA (séquence consensus TATAAA), qui est reconnu par le facteur de transcription général TATA-binding protein (TBP) et un élément de reconnaissance B (BRE), qui est reconnu par le général facteur de transcription TFIIB. [5] [10] [11] L'élément TATA et BRE sont généralement situés à proximité du site de démarrage de la transcription (généralement dans les 30 à 40 paires de bases).

      Les séquences régulatrices des promoteurs eucaryotes se lient généralement à des protéines appelées facteurs de transcription qui sont impliquées dans la formation du complexe transcriptionnel. Un exemple est la boîte E (séquence CACGTG), qui se lie aux facteurs de transcription de la famille basique hélice-boucle-hélice (bHLH) (par exemple BMAL1-Clock, cMyc). [12] Certains promoteurs ciblés par plusieurs facteurs de transcription pourraient atteindre un état hyperactif, entraînant une augmentation de l'activité transcriptionnelle. [13]

      Les promoteurs interagissent avec les amplificateurs, les facteurs de transcription, le complexe médiateur et les boucles d'ADN dans la transcription des mammifères

      L'expression régulée à la hausse des gènes chez les mammifères est initiée lorsque des signaux sont transmis aux promoteurs associés aux gènes. Les séquences d'ADN promoteur peuvent inclure différents éléments tels que des îlots CpG (présents dans environ 70 % des promoteurs), une boîte TATA (présente dans environ 24 % des promoteurs), un initiateur (Inr) (présent dans environ 49 % des promoteurs), en amont et les éléments de reconnaissance TFIIB en aval (BREu et BREd) (présents dans environ 22 % des promoteurs) et l'élément promoteur central en aval (DPE) (présent dans environ 12 % des promoteurs). [14] La présence de plusieurs sites CpG méthylés dans les îlots CpG de promoteurs provoque un silence stable des gènes. [15] Cependant, les expériences de Weingarten-Gabbay et al. [16] ont montré que la présence ou l'absence des autres éléments a des effets relativement faibles sur l'expression des gènes. Deux séquences, la boîte TATA et Inr, ont provoqué des augmentations faibles mais significatives de l'expression (45 % et 28 % d'augmentation, respectivement). Les éléments BREu et BREd ont significativement diminué l'expression de 35 % et 20 %, respectivement, et l'élément DPE n'a pas détecté d'effet sur l'expression. [16]

      Les modules de régulation cis qui sont localisés dans des régions d'ADN éloignées des promoteurs des gènes peuvent avoir des effets très importants sur l'expression des gènes, certains gènes subissant une expression jusqu'à 100 fois supérieure en raison d'un tel module de régulation cis. [17] Ces modules de régulation cis comprennent des amplificateurs, des silencieux, des isolants et des éléments d'attache. [18] Parmi cette constellation d'éléments, les activateurs et leurs facteurs de transcription associés ont un rôle de premier plan dans la régulation de l'expression des gènes. [19]

      Les amplificateurs sont des régions du génome qui sont des éléments majeurs de régulation des gènes. Les amplificateurs contrôlent les programmes d'expression génique spécifiques à un type cellulaire, le plus souvent en parcourant de longues distances pour se rapprocher physiquement des promoteurs de leurs gènes cibles. [20] Dans une étude des neurones corticaux du cerveau, 24 937 boucles ont été trouvées, apportant des amplificateurs aux promoteurs. [17] De multiples amplificateurs, chacun souvent à des dizaines ou des centaines de milliers de nucléotides éloignés de leurs gènes cibles, bouclent vers leurs promoteurs de gènes cibles et se coordonnent les uns avec les autres pour contrôler l'expression de leur gène cible commun. [20]

      L'illustration schématique de cette section montre un amplificateur en boucle pour se rapprocher physiquement du promoteur d'un gène cible. La boucle est stabilisée par un dimère d'une protéine connecteur (par exemple un dimère de CTCF ou YY1), avec un membre du dimère ancré à son motif de liaison sur l'amplificateur et l'autre membre ancré à son motif de liaison sur le promoteur (représenté par le zigzags rouges dans l'illustration). [21] Plusieurs facteurs de transcription spécifiques à la fonction cellulaire (il existe environ 1 600 facteurs de transcription dans une cellule humaine [22] ) se lient généralement à des motifs spécifiques sur un amplificateur [23] et une petite combinaison de ces facteurs de transcription liés à l'amplificateur, lorsqu'ils sont rapprochés à un promoteur par une boucle d'ADN, régissent le niveau de transcription du gène cible. Le médiateur (coactivateur) (un complexe généralement constitué d'environ 26 protéines dans une structure en interaction) communique les signaux régulateurs des facteurs de transcription liés à l'ADN amplificateur directement à l'enzyme ARN polymérase II (pol II) liée au promoteur. [24]

      Les activateurs, lorsqu'ils sont actifs, sont généralement transcrits à partir des deux brins d'ADN avec des ARN polymérases agissant dans deux directions différentes, produisant deux ARNe comme illustré sur la figure. [25] Un amplificateur inactif peut être lié par un facteur de transcription inactif. La phosphorylation du facteur de transcription peut l'activer et ce facteur de transcription activé peut alors activer l'amplificateur auquel il est lié (voir la petite étoile rouge représentant la phosphorylation du facteur de transcription lié à l'amplificateur dans l'illustration). [26] Un amplificateur activé commence la transcription de son ARN avant d'activer un promoteur pour initier la transcription de l'ARN messager à partir de son gène cible. [27]

      Bidirectionnel (mammifère) Modifier

      Les promoteurs bidirectionnels sont des régions intergéniques courtes (<1 kpb) d'ADN entre les extrémités 5' des gènes dans une paire de gènes bidirectionnelle. [28] Une « paire de gènes bidirectionnelle » fait référence à deux gènes adjacents codés sur des brins opposés, avec leurs extrémités 5' orientées l'une vers l'autre. [29] Les deux gènes sont souvent fonctionnellement liés, et la modification de leur région promotrice partagée leur permet d'être co-régulés et donc co-exprimés. [30] Les promoteurs bidirectionnels sont une caractéristique commune des génomes mammifères. [31] Environ 11% des gènes humains sont appariés bidirectionnellement. [28]

      Les gènes appariés de manière bidirectionnelle dans la base de données Gene Ontology partageaient au moins une catégorie fonctionnelle attribuée par la base de données avec leurs partenaires 47 % du temps. [32] L'analyse des puces à ADN a montré que les gènes appariés bidirectionnellement sont co-exprimés à un degré plus élevé que les gènes aléatoires ou les gènes unidirectionnels voisins. [28] Bien que la co-expression n'indique pas nécessairement la corégulation, il a été démontré que la méthylation des régions promotrices bidirectionnelles régule à la baisse les deux gènes et la déméthylation pour réguler à la hausse les deux gènes. [33] Il existe cependant des exceptions à cette règle. Dans certains cas (environ 11 %), un seul gène d'une paire bidirectionnelle est exprimé. [28] Dans ces cas, le promoteur est impliqué dans la suppression du gène non exprimé. Le mécanisme derrière cela pourrait être une compétition pour les mêmes polymérases ou une modification de la chromatine. Une transcription divergente pourrait déplacer les nucléosomes pour réguler à la hausse la transcription d'un gène, ou éliminer les facteurs de transcription liés pour réguler à la baisse la transcription d'un gène. [34]

      Certaines classes fonctionnelles de gènes sont plus susceptibles d'être appariées de manière bidirectionnelle que d'autres. Les gènes impliqués dans la réparation de l'ADN sont cinq fois plus susceptibles d'être régulés par des promoteurs bidirectionnels que par des promoteurs unidirectionnels. Les protéines chaperonnes sont trois fois plus probables, et les gènes mitochondriaux sont plus de deux fois plus probables. De nombreux gènes ménagers et métaboliques cellulaires de base sont régulés par des promoteurs bidirectionnels. [28] La surreprésentation des gènes de réparation de l'ADN appariés bidirectionnellement associe ces promoteurs au cancer. Quarante-cinq pour cent des oncogènes somatiques humains semblent être régulés par des promoteurs bidirectionnels – bien plus que les gènes non cancérigènes. L'hyperméthylation des promoteurs entre les paires de gènes WNT9A/CD558500, CTDSPL/BC040563 et KCNK15/BF195580 a été associée aux tumeurs. [33]

      Certaines caractéristiques de séquence ont été observées dans les promoteurs bidirectionnels, notamment un manque de boîtes TATA, une abondance d'îlots CpG et une symétrie autour du point médian des dominants Cs et As d'un côté et Gs et Ts de l'autre. Un motif avec la séquence consensus de TCTCGCGAGA, également appelé élément CGCG, a récemment montré qu'il conduisait la transcription bidirectionnelle pilotée par PolII dans les îlots CpG. [35] Les boîtes CCAAT sont courantes, comme elles le sont dans de nombreux promoteurs qui manquent de boîtes TATA. De plus, les motifs NRF-1, GABPA, YY1 et ACTACAnnTCCC sont représentés dans les promoteurs bidirectionnels à des taux significativement plus élevés que dans les promoteurs unidirectionnels. L'absence de boîtes TATA dans les promoteurs bidirectionnels suggère que les boîtes TATA jouent un rôle dans la détermination de la directionnalité des promoteurs, mais des contre-exemples de promoteurs bidirectionnels possèdent des boîtes TATA et des promoteurs unidirectionnels sans eux indiquent qu'ils ne peuvent pas être le seul facteur. [36]

      Bien que le terme « promoteur bidirectionnel » se réfère spécifiquement aux régions promotrices des gènes codant pour l'ARNm, les dosages de la luciférase ont montré que plus de la moitié des gènes humains n'ont pas de biais directionnel important. La recherche suggère que les ARN non codants sont fréquemment associés aux régions promotrices des gènes codant pour l'ARNm. Il a été émis l'hypothèse que le recrutement et l'initiation de l'ARN polymérase II commencent généralement de manière bidirectionnelle, mais la transcription divergente est arrêtée à un point de contrôle plus tard au cours de l'élongation. Les mécanismes possibles derrière cette régulation incluent des séquences dans la région du promoteur, la modification de la chromatine et l'orientation spatiale de l'ADN. [34]

      Un promoteur subgénomique est un promoteur ajouté à un virus pour un gène hétérologue spécifique, entraînant la formation d'ARNm pour ce gène seul. De nombreux virus à ARN de sens positif produisent ces ARNm subgénomiques (sgRNA) comme l'une des techniques d'infection courantes utilisées par ces virus et transcrivent généralement les gènes viraux tardifs. Les promoteurs subgénomiques vont de 24 nucléotides (virus Sindbis) à plus de 100 nucléotides (virus Beet necrotic yellow vein virus) et se trouvent généralement en amont du début de la transcription. [37]

      Une grande variété d'algorithmes ont été développés pour faciliter la détection de promoteurs dans la séquence génomique, et la prédiction de promoteur est un élément commun de nombreuses méthodes de prédiction de gènes. Une région promotrice est située avant les séquences -35 et -10 Consensus. Plus la région promotrice est proche des séquences consensus, plus la transcription de ce gène aura lieu. Il n'y a pas de modèle défini pour les régions promotrices comme il y en a pour les séquences consensus.

      Les changements dans les séquences de promoteurs sont critiques dans l'évolution, comme l'indique le nombre relativement stable de gènes dans de nombreuses lignées. Par exemple, la plupart des vertébrés ont à peu près le même nombre de gènes codant pour des protéines (environ 20 000) qui sont souvent hautement conservés en séquence, par conséquent, une grande partie des changements évolutifs doivent provenir de changements dans l'expression des gènes. [4] [9]

      Origine de novo des promoteurs Modifier

      Compte tenu des séquences courtes de la plupart des éléments promoteurs, les promoteurs peuvent évoluer rapidement à partir de séquences aléatoires. Par exemple, dans E. coli,

      60% des séquences aléatoires peuvent évoluer à des niveaux d'expression comparables au promoteur lac de type sauvage avec une seule mutation, et que

      10% des séquences aléatoires peuvent servir de promoteurs actifs même sans évolution. [39]

      D'autres études récentes suggèrent que les promoteurs de gènes pourraient être la principale cause du diabète. [40] Les promoteurs de gènes associés au diabète par les études d'association à l'échelle du génome (GWAS) montrent des modèles d'ADN spécifiques pour chaque phénotype. [40] Cette observation indique que les promoteurs de ces gènes utilisent des facteurs de transcription spécifiques pour chaque phénotype du diabète. [40]

      L'initiation de la transcription est un processus séquentiel en plusieurs étapes qui implique plusieurs mécanismes : localisation du promoteur, liaison réversible initiale de l'ARN polymérase, changements de conformation de l'ARN polymérase, changements de conformation de l'ADN, liaison du nucléoside triphosphate (NTP) au promoteur fonctionnel de l'ARN polymérase initiation complexe, non productive et productive de la synthèse d'ARN. [41]

      Le processus de liaison du promoteur est crucial dans la compréhension du processus d'expression des gènes.

      Emplacement Modifier

      Bien que l'holoenzyme ARN polymérase montre une grande affinité pour les sites non spécifiques de l'ADN, cette caractéristique ne nous permet pas de clarifier le processus de localisation du promoteur. [42] Ce processus de localisation du promoteur a été attribué à la structure de l'holoenzyme à l'ADN et du sigma 4 aux complexes d'ADN. [43]

      La plupart des maladies ont des causes hétérogènes, ce qui signifie qu'une « maladie » correspond souvent à de nombreuses maladies différentes au niveau moléculaire, bien que les symptômes présentés et la réponse au traitement puissent être identiques. La façon dont les maladies d'origine moléculaire différente répondent aux traitements est partiellement abordée dans la discipline de la pharmacogénomique.

      Ne sont pas répertoriés ici les nombreux types de cancers impliquant une régulation transcriptionnelle aberrante en raison de la création de gènes chimériques par translocation chromosomique pathologique. Il est important de noter que l'intervention sur le nombre ou la structure des protéines liées au promoteur est une clé pour traiter une maladie sans affecter l'expression de gènes non apparentés partageant des éléments avec le gène cible. [44] Certains gènes dont le changement n'est pas souhaitable sont capables d'influencer le potentiel d'une cellule à devenir cancéreuse. [45]

      Chez l'homme, environ 70 % des promoteurs situés à proximité du site d'initiation de la transcription d'un gène (proximaux promoteurs) contiennent un îlot CpG. [46] [47] Les îlots CpG ont généralement une longueur de 200 à 2000 paires de bases, ont une teneur en paires de bases C:G >50%, et ont des régions d'ADN où un nucléotide cytosine est suivi d'un nucléotide guanine et cela se produit fréquemment dans le linéaire séquence de bases le long de sa direction 5' → 3'.

      Les promoteurs distaux contiennent également fréquemment des îlots CpG, tels que le promoteur du gène de réparation de l'ADN ERCC1, où le promoteur contenant l'îlot CpG est situé à environ 5 400 nucléotides en amont de la région codante du ERCC1 gène. [48] ​​Les îlots CpG se produisent également fréquemment dans les promoteurs d'ARN fonctionnels non codants tels que les microARN.

      Chez l'homme, la méthylation de l'ADN se produit à la position 5' du cycle pyrimidine des résidus cytosine dans les sites CpG pour former des 5-méthylcytosines. La présence de plusieurs sites CpG méthylés dans les îlots CpG de promoteurs provoque un silence stable des gènes. [15] Le silence d'un gène peut être initié par d'autres mécanismes, mais cela est souvent suivi par la méthylation des sites CpG dans l'île promoteur CpG pour provoquer le silence stable du gène. [15]

      Généralement, dans la progression vers le cancer, des centaines de gènes sont réduits au silence ou activés. Bien que l'extinction de certains gènes dans les cancers se produise par mutation, une grande partie de l'extinction de gènes cancérigènes est le résultat d'une méthylation de l'ADN altérée (voir Méthylation de l'ADN dans le cancer). La méthylation de l'ADN provoquant l'extinction dans le cancer se produit généralement au niveau de plusieurs sites CpG dans les îlots CpG qui sont présents dans les promoteurs des gènes codant pour les protéines.

      Les expressions altérées des microARN font également taire ou activent de nombreux gènes en progression vers le cancer (voir microARN dans le cancer). L'expression altérée des microARN se produit par l'hyper/hypométhylation des sites CpG dans les îlots CpG dans les promoteurs contrôlant la transcription des microARN.

      L'extinction des gènes de réparation de l'ADN par méthylation des îlots CpG dans leurs promoteurs semble être particulièrement importante dans la progression vers le cancer (voir méthylation des gènes de réparation de l'ADN dans le cancer).

      L'utilisation du terme séquence canonique pour désigner un promoteur est souvent problématique et peut conduire à des malentendus sur les séquences de promoteur. Canonique implique parfait, dans un certain sens.

      Dans le cas d'un site de liaison à un facteur de transcription, il peut y avoir une seule séquence qui se lie le plus fortement à la protéine dans des conditions cellulaires spécifiées. Cela pourrait être appelé canonique.

      Cependant, la sélection naturelle peut favoriser une liaison moins énergétique comme moyen de réguler la production transcriptionnelle. Dans ce cas, nous pouvons appeler la séquence la plus courante dans une population la séquence de type sauvage. Ce n'est peut-être même pas la séquence la plus avantageuse à avoir dans les conditions existantes.

      Des preuves récentes indiquent également que plusieurs gènes (y compris le proto-oncogène c-myc) ont des motifs G-quadruplex comme signaux régulateurs potentiels.

      Certains cas de nombreuses maladies génétiques sont associés à des variations de promoteurs ou de facteurs de transcription.

      Certains promoteurs sont dits constitutifs car ils sont actifs en toutes circonstances dans la cellule, tandis que d'autres sont régulés, devenant actifs dans la cellule uniquement en réponse à des stimuli spécifiques.


      Promoteurs

      Promoteurs eucaryotes

      En général, les promoteurs eucaryotes sont beaucoup plus compliqués que leurs homologues procaryotes, tout comme la machinerie de transcription eucaryote. Les eucaryotes possèdent trois ARN polymérases nucléaires dépendantes de l'ADN, chacune possédant ses propres éléments promoteurs centraux. Les promoteurs d'ARNm de mammifère, qui sont transcrits par l'ARN polymérase II, se composent d'éléments promoteurs centraux et de sites de liaison aux protéines régulatrices qui s'étendent souvent sur des dizaines de paires de kilobases.

      Les trois éléments principaux identifiés dans les promoteurs de noyau d'ARNm de mammifère sont la boîte TATA, l'initiateur (Inr) et l'élément promoteur en aval (DPE) (figure 1B). Il est important de noter que certains promoteurs de mammifères ne semblent contenir aucun de ces trois éléments de promoteur de base et dans ces cas, il a été difficile de déterminer comment l'initiation de la transcription se produit à partir d'un site de démarrage spécifique. La boîte TATA, qui a été le premier élément promoteur central eucaryote identifié, a la séquence consensus TATATAAG (brin non modèle) et est centrée à environ 29 pb en amont du site de démarrage de la transcription. L'Inr s'étend sur le site de démarrage de la transcription (conservé A) et a une séquence consensus qui contient plusieurs pyrimidines (Y). Le DPE, qui a été découvert pour la première fois en Drosophile promoteurs et plus tard dans les promoteurs de mammifères, est centrée à environ 31 pb en aval du site de démarrage de la transcription. Typically, if promoters contain more than one of these three core elements they contain either: (1) a TATA box and an Inr or (2) an Inr and a DPE.

      Eukaryotic core promoter elements serve to recruit the RNA polymerase II transcription machinery. TFIID, one of the general transcription factors for RNA polymerase II, is a multiprotein complex containing the TATA-binding protein and associated factors that can bind with sequence specificity to all three of the core promoter elements. Other components of the RNA polymerase II general transcription machinery also contact core promoter DNA, and data is emerging that these factors may bind specific DNA sequences other than the TATA box, Inr, and DPE. It is likely that our understanding of RNA polymerase II core promoters will dramatically change as more core promoters are studied in detail.

      The extended sizes of many eukaryotic promoters result from regulatory elements that can be found tens of kilobase pairs away from core promoters. Regulatory elements include proximal elements that are found close to core promoters and typically bind activators, as well as enhancers and silencers that (depending on the promoter) can be found close to or at great distances upstream or downstream of the core promoter. In general, enhancers bind proteins that activate transcription and silencers bind proteins that repress transcription.

      The accessibility of transcription factors to eukaryotic promoters is influenced by nucleosomes and higher order chromatin structure. It is likely that the chromatin structure of a promoter plays an active role in its function. Therefore, it may be more accurate to think of eukaryotic promoters as nucleoprotein chromatin structures, since it is the chromatin and not simply the DNA sequence that will be recognized and accessed by the transcription machinery in eukaryotes.


      18.1 : Transcription — de l'ADN à l'ARN

      Les bactéries, les archées et les eucaryotes doivent tous transcrire les gènes de leur génome. While the cellular location may be different (eukaryotes perform transcription in the nucleus bacteria and archaea perform transcription in the cytoplasm), the mechanisms by which organisms from each of these clades carry out this process are fundamentally the same and can be characterized by three stages: initiation, elongation, and termination.

      Un bref aperçu de la transcription

      La transcription est le processus de création d'une copie d'ARN d'un segment d'ADN. Puisqu'il s'agit d'un traiter, nous voulons appliquer la rubrique Energy Story pour développer une compréhension fonctionnelle de la transcription. A quoi ressemble le système de molécules avant le début de la transcription ? A quoi ça ressemble à la fin ? Quelles transformations de matière et transferts d'énergie se produisent pendant la transcription et qu'est-ce qui, le cas échéant, catalyse le processus ? Nous voulons également réfléchir au processus du point de vue du Design Challenge. Si la tâche biologique consiste à créer une copie de l'ADN dans le langage chimique de l'ARN, quels défis pouvons-nous raisonnablement émettre une hypothèse ou anticiper, compte tenu de nos connaissances sur d'autres processus polymères nucléotidiques, doivent être surmontés ? Existe-t-il des preuves que la nature a résolu ces problèmes de différentes manières ? Quels semblent être les critères de réussite de la transcription ? Vous avez eu l'idée.

      Énumérer certaines des exigences de base pour la transcription

      Examinons d'abord les tâches à accomplir en utilisant certaines de nos connaissances fondamentales et en imaginant ce qui pourrait devoir se produire pendant la transcription si l'objectif est de faire une copie d'ARN d'un morceau d'un brin d'une molécule d'ADN double brin. Nous verrons que l'utilisation d'une logique de base nous permet de déduire bon nombre des questions et des choses importantes que nous devons savoir afin de décrire correctement le processus.

      Imaginons que nous voulions concevoir une nanomachine/nanobot qui effectuerait la transcription. Nous pouvons utiliser une réflexion sur le Design Challenge pour identifier les problèmes et les sous-problèmes qui doivent être résolus par notre petit robot.

      &bull Where should the machine start? Parmi les millions voire les milliards de paires de bases, vers où la machine doit-elle être dirigée ?
      &bull Where should the machine stop?
      &bull If we have start and stop sites, we will need ways of encoding that information so that our machine(s) can read this information&mdashhow will that be accomplished?
      &bull How many RNA copies of the DNA will we need to make?
      &bull How fast do the RNA copies need to be made?
      &bull How accurately do the copies need to be made?
      &bull How much energy will the process take and where is the energy going to come from?

      Ce ne sont bien sûr que quelques-unes des questions fondamentales. On peut creuser plus profondément s'ils le souhaitent. Cependant, ceux-ci sont déjà suffisamment bons pour que nous commencions à avoir une bonne idée de ce processus. Notez également que bon nombre de ces questions sont remarquablement similaires à celles que nous avons déduites pourraient être nécessaires pour comprendre la réplication de l'ADN.

      Les briques de la transcription

      Les éléments constitutifs de l'ARN

      Rappelez-vous de notre discussion sur la structure des nucléotides que les éléments constitutifs de l'ARN sont très similaires à ceux de l'ADN. Dans l'ARN, les éléments constitutifs sont constitués de nucléotides triphosphates composés d'un sucre ribose, d'une base azotée et de trois groupes phosphate. Les principales différences entre les éléments constitutifs de l'ADN et ceux de l'ARN sont que les molécules d'ARN sont composées de nucléotides avec des sucres ribose (par opposition aux sucres désoxyribose) et utilisent l'uridine, un nucléotide contenant de l'uracile (par opposition à la thymidine dans l'ADN). Note below that uracil and thymine are structurally very similar&mdashthe uracil is just lacking a methyl (CH3) par rapport à la thymine.

      Figure 1. Les composants chimiques de base des nucléotides.
      Attribution : Marc T. Facciotti (œuvre originale)

      Initiation à la transcription

      Promoteurs

      Les protéines responsables de la création d'une copie d'ARN d'un morceau spécifique d'ADN (transcription) doivent d'abord être capables de reconnaître le début de l'élément à copier. UNE promoteur est une séquence d'ADN sur laquelle diverses protéines, collectivement connues sous le nom de machinerie de transcription, se lient et initient la transcription. Dans la plupart des cas, les promoteurs existent en amont (5' de la région codante) des gènes qu'ils régulent. La séquence spécifique d'un promoteur est très importante car elle détermine si la partie codante correspondante du gène est transcrite tout le temps, parfois ou rarement. Bien que les promoteurs varient selon les espèces, quelques éléments de séquence similaire sont parfois conservés. Aux régions -10 et -35 en amont du site d'initiation, il y a deux promoteurs consensus des séquences ou des régions qui sont similaires à travers de nombreux promoteurs et à travers diverses espèces. Certains promoteurs auront une séquence très similaire à la séquence consensus (la séquence contenant les éléments de séquence les plus courants), et d'autres auront une apparence très différente. Ces variations de séquence affectent la force à laquelle la machinerie transcriptionnelle peut se lier au promoteur pour initier la transcription. Cela permet de contrôler le nombre de transcriptions qui sont faites et à quelle fréquence elles sont faites.

      Figure 2. (a) Un schéma général d'un gène. Le gène comprend la séquence promotrice, une région non traduite (UTR) et la séquence codante. (b) Une liste de plusieurs séquences promotrices fortes d'E. coli. La boîte -35 et la boîte -10 sont des séquences hautement conservées dans toute la liste des promoteurs forts. Les promoteurs plus faibles auront plus de différences de paires de bases par rapport à ces séquences.
      Source: http://www.discoveryandinnovation.co. lecture12.html

      Quels types d'interactions sont modifiés entre la machinerie de transcription et l'ADN lorsque la séquence nucléotidique du promoteur change ? Why would some sequences create a "strong" promoter and why do others create a "weak" promoter?

      Promoteurs bactériens vs eucaryotes

      Dans les cellules bactériennes, la séquence consensus -10, appelée région -10, est riche en AT, souvent TATAAT. La séquence -35, TTGACA, est reconnue et liée par la protéine &sigma. Une fois cette interaction protéine-ADN réalisée, les sous-unités de l'ARN polymérase centrale se lient au site. En raison de la stabilité relativement plus faible des associations d'AT, la région -10 riche en AT facilite le déroulement de la matrice d'ADN et plusieurs liaisons phosphodiester sont créées.

      Eukaryotic promoters are much larger and more complex than prokaryotic promoters, but both have an AT-rich region&mdashin eukaryotes, it is typically called a TATA box. Par exemple, dans le gène de la thymidine kinase de souris, la boîte TATA est située à environ -30. Pour ce gène, la séquence exacte de la boîte TATA est TATAAAA, telle que lue dans la direction 5' à 3' sur le brin non-matrice. Cette séquence n'est pas identique à la E. coli -10, mais les deux partagent la qualité d'être un élément riche en AT.

      Au lieu d'une seule polymérase bactérienne, les génomes de la plupart des eucaryotes codent pour trois ARN polymérases différentes, chacune composée de dix sous-unités protéiques ou plus. Chaque polymérase eucaryote nécessite également un ensemble distinct de protéines appelées facteurs de transcription de le recruter auprès d'un promoteur. De plus, une armée d'autres facteurs de transcription, des protéines appelées amplificateurs et des silencieux aident à réguler la synthèse d'ARN de chaque promoteur. Les activateurs et les silencieux affectent l'efficacité de la transcription mais ne sont pas nécessaires à l'initiation de la transcription ou à son déroulement. Les facteurs de transcription basaux sont cruciaux dans la formation d'un complexe de pré-initiation sur la matrice d'ADN qui recrute ensuite l'ARN polymérase pour l'initiation de la transcription.

      L'initiation de la transcription commence par la liaison de l'ARN polymérase au promoteur. La transcription nécessite que la double hélice d'ADN se déroule partiellement de telle sorte qu'un brin puisse être utilisé comme matrice pour la synthèse d'ARN. La région de déroulement est appelée bulle de transcription.

      figure 3. Pendant l'élongation, l'ARN polymérase suit la matrice d'ADN, synthétise l'ARNm dans la direction 5' à 3', et se déroule puis rembobine l'ADN au fur et à mesure qu'il est lu.

      Élongation

      La transcription procède toujours de la brin modèle, l'un des deux brins de l'ADN double brin. Le produit d'ARN est complémentaire du brin matrice et est presque identique au brin non-matrice, appelé le brin de codage, à l'exception du fait que l'ARN contient un uracile (U) à la place de la thymine (T) présente dans l'ADN. Pendant l'allongement, une enzyme appelée ARN polymérase procède le long de la matrice d'ADN, en ajoutant des nucléotides par appariement de bases avec la matrice d'ADN d'une manière similaire à la réplication d'ADN, la différence étant qu'un brin d'ARN qui est synthétisé ne reste pas lié à la matrice d'ADN. Au fur et à mesure que l'allongement progresse, l'ADN est continuellement déroulé devant l'enzyme centrale et rembobiné derrière elle. Note that the direction of synthesis is identical to that of synthesis in DNA&mdash5' to 3'.

      Figure 4. Pendant l'élongation, l'ARN polymérase suit la matrice d'ADN, synthétisant l'ARNm dans la direction 5' à 3', déroulant puis rembobinant l'ADN au fur et à mesure de sa lecture.

      Figure 5. L'ajout de nucléotides au cours du processus de transcription est très similaire à l'ajout de nucléotides dans la réplication de l'ADN. L'ARN est polymérisé de 5' à 3', et à chaque ajout d'un nucléotide, une liaison phosphoanhydride est hydrolysée par l'enzyme, ce qui donne un polymère plus long et la libération de deux phosphates inorganiques.
      Source: http://utminers.utep.edu/rwebb/html/. longation.html

      Comparez et contrastez l'histoire de l'énergie pour l'ajout d'un nucléotide dans la réplication de l'ADN à l'ajout d'un nucléotide dans la transcription.

      Allongement bactérien vs eucaryote

      Chez les bactéries, l'allongement commence par la libération du &sigma sous-unité de la polymérase. La dissociation de &sigma permet à l'enzyme centrale de procéder le long de la matrice d'ADN, synthétisant l'ARNm dans la direction 5' à 3' à une vitesse d'environ 40 nucléotides par seconde. Au fur et à mesure que l'allongement progresse, l'ADN est continuellement déroulé devant l'enzyme centrale et rembobiné derrière elle. L'appariement des bases entre l'ADN et l'ARN n'est pas suffisamment stable pour maintenir la stabilité des composants de synthèse de l'ARNm. Au lieu de cela, l'ARN polymérase agit comme un lieur stable entre la matrice d'ADN et les brins d'ARN naissants pour garantir que l'élongation n'est pas interrompue prématurément.

      Chez les eucaryotes, après la formation du complexe de pré-initiation, la polymérase est libérée des autres facteurs de transcription et l'élongation peut se dérouler comme chez les procaryotes, la polymérase synthétisant le pré-ARNm dans la direction 5' à 3'. Comme discuté précédemment, l'ARN polymérase II transcrit la majeure partie des gènes eucaryotes, donc cette section se concentrera sur la façon dont cette polymérase accomplit l'allongement et la terminaison.

      Résiliation

      Dans les bactéries

      Une fois qu'un gène est transcrit, la polymérase bactérienne doit recevoir l'instruction de se dissocier de la matrice d'ADN et de libérer l'ARNm nouvellement créé. Selon le gène à transcrire, il existe deux types de signaux de terminaison. L'un est à base de protéines et l'autre à base d'ARN. Terminaison Rho-dépendante est contrôlé par la protéine rho, qui suit la polymérase sur la chaîne d'ARNm en croissance. Vers la fin du gène, la polymérase rencontre une série de nucléotides G sur la matrice d'ADN et elle cale. En conséquence, la protéine rho entre en collision avec la polymérase. L'interaction avec rho libère l'ARNm de la bulle de transcription.

      Résiliation indépendante de Rho est contrôlé par des séquences spécifiques dans le brin matrice d'ADN. Lorsque la polymérase approche de la fin du gène en cours de transcription, elle rencontre une région riche en nucléotides CG. L'ARNm se replie sur lui-même et les nucléotides complémentaires CG se lient. Le résultat est une stabilité épingle à cheveux qui provoque le blocage de la polymérase dès qu'elle commence à transcrire une région riche en nucléotides AT. La région UA ​​complémentaire du transcrit d'ARNm ne forme qu'une faible interaction avec l'ADN matrice. Ceci, couplé à la polymérase bloquée, induit une instabilité suffisante pour que l'enzyme centrale se détache et libère le nouveau transcrit d'ARNm.

      Chez les eucaryotes

      La terminaison de la transcription est différente pour les différentes polymérases. Unlike in prokaryotes, elongation by RNA polymerase II in eukaryotes takes place 1,000&ndash2,000 nucleotides beyond the end of the gene being transcribed. Cette queue de pré-ARNm est ensuite éliminée par clivage pendant le traitement de l'ARNm. D'autre part, les ARN polymérases I et III nécessitent des signaux de terminaison. Les gènes transcrits par l'ARN polymérase I contiennent une séquence spécifique de 18 nucléotides qui est reconnue par une protéine de terminaison. Le processus de terminaison dans l'ARN polymérase III implique une épingle à cheveux d'ARNm similaire à la terminaison rho-indépendante de la transcription chez les procaryotes.

      Aux archées

      La terminaison de la transcription chez les archées est beaucoup moins étudiée que dans les deux autres domaines de la vie et n'est toujours pas bien comprise. Alors que les détails fonctionnels sont susceptibles de ressembler à des mécanismes qui ont été vus dans d'autres domaines de la vie, les détails dépassent le cadre de ce cours.

      Emplacement cellulaire

      Chez les bactéries et les archées

      Chez les bactéries et les archées, la transcription se produit dans le cytoplasme, où se trouve l'ADN. Étant donné que l'emplacement de l'ADN, et donc le processus de transcription, ne sont pas physiquement séparés du reste de la cellule, la traduction commence souvent avant la fin de la transcription. Cela signifie que l'ARNm des bactéries et des archées est utilisé comme matrice pour une protéine avant que l'ARNm entier ne soit produit. L'absence de ségrégation spatiale signifie également qu'il y a très peu de ségrégation temporelle pour ces processus. La figure 6 montre les processus de transcription et de traduction se produisant simultanément.

      Figure 6. L'ajout de nucléotides au cours du processus de transcription est très similaire à l'ajout de nucléotides dans la réplication de l'ADN.
      Source : Marc T. Facciotti (propre travail)

      In eukaryotes.

      Chez les eucaryotes, le processus de transcription est physiquement séparé du reste de la cellule, séquestré à l'intérieur du noyau. This results in two things: the mRNA is completed before translation can start, and there is time to "adjust" or "edit" the mRNA before translation starts. La séparation physique de ces processus donne aux eucaryotes une chance de modifier l'ARNm de manière à prolonger la durée de vie de l'ARNm ou même de modifier le produit protéique qui sera produit à partir de l'ARNm.

      Traitement de l'ARNm

      Capuchon G 5' et queue poly-A 3'

      Lorsqu'un gène eucaryote est transcrit, le transcrit primaire est traité dans le noyau de plusieurs manières. Les ARNm eucaryotes sont modifiés à l'extrémité 3' par l'ajout d'une queue poly-A. Cette série de résidus A est ajoutée par une enzyme qui n'utilise pas d'ADN génomique comme matrice. De plus, les ARNm ont une modification chimique de l'extrémité 5', appelée 5'-cap. Les données suggèrent que ces modifications contribuent à la fois à augmenter la durée de vie de l'ARNm (empêcher sa dégradation prématurée dans le cytoplasme) ainsi qu'à aider l'ARNm à initier la traduction.

      Figure 7. les pré-ARNm sont traités en une série d'étapes. Les introns sont retirés, un capuchon 5' et une queue poly-A sont ajoutés.
      Source: http://www.discoveryandinnovation.co. lecture12.html

      Épissage alternatif

      L'épissage se produit sur la plupart des ARNm eucaryotes dans lesquels les introns sont retirés de la séquence d'ARNm et les exons sont liés ensemble. Cela peut créer un ARNm beaucoup plus court que celui initialement transcrit. L'épissage permet aux cellules de mélanger et de faire correspondre les exons incorporés dans le produit d'ARNm final. Comme le montre la figure ci-dessous, cela peut conduire à ce que plusieurs protéines soient codées par un seul gène.


      Gènes

      Qu'est-ce qu'un gène ? UNE gène is a segment of DNA in an organism's genome that encodes a functional RNA (such as rRNA or tRNA, etc) or protein product (enzymes, tubulin, etc). A generic gene contains elements encoding regulatory regions (which are often not transcribed) and a region encoding a transcribed unit.

      Les gènes peuvent acquérir mutation - defined as changes in the in the composition and or sequence of the nucleotides - either in the coding or regulatory regions. These mutations can lead to several possible outcomes: (1) nothing measurable happens as a result (2) the gene is no longer expressed or (3) the expression or behavior of the gene product(s) are different. In a population of organisms sharing the same gene, different variants of the gene are known as allèles. Différents allèles peuvent entraîner des différences dans les phénotypes des individus et contribuer à la diversité biologique qui est soumise à une pression sélective.

      Commencez à apprendre ces termes de vocabulaire et les concepts associés. Vous les connaîtrez alors un peu lorsque nous commencerons à les approfondir plus en détail au cours des prochaines conférences.

      Un gène consiste en une région codante pour un ARN ou un produit protéique accompagné de ses régions régulatrices. La région codante est transcrite en ARN qui est ensuite traduit en protéine. Note that most transcripts to not begin with a start codon and end with a stop codon (unlike this example), there are usually upstream and downstream untranslated regions.

      Résumé de la section

      All living things must all transcribe genes from their genomes. While the cellular location may be different (eukaryotes perform transcription in the nucleus bacteria and archaea- lacking a nucleus- perform transcription in the cytoplasm), the mechanisms by which organisms from each of these clades carry out this process are fundamentally the same and can be characterized by three stages: initiation, elongation, and termination.


      Overview of the Stages of Transcription

      The basic steps of transcription are initiation, elongation, and termination. Here we can identify several of the DNA sequences that characterize a gene. The promoter is the binding site for RNA polymerase. It usually lies 5&rsquo to, or upstream of the transcription start site. Binding of the RNA polymerase positions the enzyme to near the transcription start site, where it will start unwinding the double helix and begin synthesizing new RNA. The transcribed grey DNA region in each of the three panels are the transcription unit of the gene. Termination sites are typically 3&rsquo to, or downstream from the transcribed region of the gene. By convention, en amont refers to DNA 5&rsquo to a given reference point on the DNA (e.g., the transcription start-site of a gene). Downstream then, refers to DNA 3&rsquo to a given reference point on the DNA.

      Figure (PageIndex<2>): Three steps of transcription. (Copyright )


      This eliminates base pair mismatches and insertions or deletions of a few nucleotides that are accidentally introduced by DNA polymerase during replication. Mismatch excision repair occurs after DNA replication. Cells defective in MMR genes (Mismatch Excision Repair genes) have a very high mutation rate which can be up to 1000 times the normal. Mutations in at least six MMR genes cause hereditary non polyposis colorectal cancer (HNPCC). In HNPCC there are mutations in the MLH1 or MSH2 genes. Cells with only one copy of these mutated genes show normal mismatch repair, however, if there is a random mutation in the second gene, the mismatch repair system is lost (something like tumour suppressor genes). This predisposes to other mutations and the development of colorectal cancer. Mismatch repair genes correct mismatched bases introduced during DNA replication.

      Nucleotide Excision Repair removes thymine dimers and large chemical adducts. A different set of genes is required to excise single abnormal bases and are called Base Excision Repair genes.

      The nucleotide excision repair fixes DNA regions containing chemically modified adducts that distort the shape of DNA locally. These proteins slide along the DNA molecule and look for irregularities in the shape of the double helix. If there are irregularities present, these proteins repair the defects. About 30 proteins are involved and they remove fragments of approximately 30 nucleotides. Mutations in at least eight of these genes can cause Xeroderma Pigmentosum. The cells of the affected patients lack a functional nucleotide excision repair mechanism. Therefore, there is no repair of damaged genes and thus predisposition to cancer.


      DNA Transcription (Advanced Detail)

      This animation shows how RNA polymerase and other transcription factors interact to transcribe DNA into RNA.

      DNA is copied into RNA in a process called genetic transcription. The process starts with transcription factors assembling on a region of a gene called a promoter. An enzyme called RNA polymerase travels along the DNA, unzipping its two strands. The molecule then copies one of the strands of DNA into a strand of RNA.

      This animation brings the process to life, showing three-dimensional representations of the molecules involved. Depending on students’ backgrounds, it may be helpful to pause the animation at various points to identify the molecules and describe their interactions.

      Des détails

      central dogma, gene expression, initiation, messenger RNA (mRNA), nucleotide, promoter, RNA polymerase, template, transcription factor

      The resource is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International license. No rights are granted to use HHMI’s or BioInteractive’s names or logos independent from this Resource or in any derivative works.