Informations

2D : Pliage des Protéines - in Vivo et in Vitro - Biologie


Objectifs d'apprentissage

  • faire la différence entre les approches thermodynamiques (équilibre) et cinétiques (temporisées) pour l'étude des réactions de repliement des protéines
  • décrire des techniques pour étudier les intermédiaires transitoires (cinétiques) et à longue durée de vie (thermodynamique) dans le repliement des protéines
  • décrivent les intermédiaires suivants dans le repliement des protéines : globule fondu, isomères X-Pro ; Intermédiaires de liaison disulfure
  • interpréter les données spectrales et chromatographiques des études de repliement des protéines et les utiliser pour déterminer ou expliquer un mécanisme de repliement
  • décrire les propriétés des protéines repliées, dépliées, globulaires fondues et intrinsèquement désordonnées
  • expliquer la différence entre les environnements pour le repliement des protéines lorsqu'il est effectué in vitro et in vivo
  • énoncer le rôle des chaperons moléculaires dans le repliement des protéines in vivo
  • décrire les différences dans l'occurrence des liaisons disulfure dans les protéines cytoplasmiques et extracellulaires

Vignette : Structure de l'hémoglobine humaine. Les sous-unités et des protéines sont en rouge et en bleu, et les groupes hème contenant du fer en vert. Depuis PDB : 1GZX​. (GNU; Proteopedia Hémoglobine).


D2. Pliage des protéines in vitro

Les premières études sur le repliement des protéines impliquaient de petites protéines qui pouvaient être dénaturées et repliées de manière réversible. Un modèle à deux états, D <===> N, a été supposé. Les dénaturants étaient la chaleur, l'urée ou la guanidine HCl. Étant donné que les états dénaturés sont moins compacts que l'état natif, la viscosité de la solution peut être utilisée comme mesure de dénaturation/renaturation. De même, les chaînes latérales d'acides aminés dans les différents états seraient dans des environnements différents. Les acides aminés aromatiques Trp, Phe et Tyr absorbent la lumière UV. Après excitation, les électrons se désintègrent jusqu'à l'état fondamental par plusieurs processus. Une certaine relaxation vibrationnelle se produit, amenant les électrons à des niveaux d'énergie vibrationnelle inférieurs. Certains des électrons peuvent alors tomber à divers niveaux vibrationnels à des états d'énergie de principe inférieurs par le biais d'un processus radiatif. Les photons émis sont plus faibles en énergie et donc plus longs en longueur d'onde. La lumière émise est appelée fluorescence. La longueur d'onde d'intensité de fluorescence maximale et la durée de vie de la décroissance de fluorescence sont très sensibles à l'environnement des acides aminés. Par conséquent, la fluorescence peut également être utilisée pour mesurer les changements dans la conformation des protéines. D'autres techniques spectrales comme la spectroscopie CD ainsi que de simples mesures d'absorbance sont utilisées. Pour les petites protéines à domaine unique (telles que la RNase) subissant une dénaturation réversible, les graphiques montrant l'étendue de la dénaturation à l'aide de chaque technique ci-dessus sont superposables, ce qui confère une forte validité au modèle à deux états.

Figure : Dénaturation réversible

Les protéines qui se replient sans intermédiaires de longue durée facilement discernables et suivant un modèle simple à deux états, D <=> N, subissent un repliement coopératif. Ce modèle simple devait être étendu à mesure que davantage de protéines étaient étudiées. Certains intermédiaires dans le processus ont été détectés.

  • Certaines protéines présentent deux étapes, une lente, une rapide, dans les études de repliement, suggérant un intermédiaire. Plus une protéine est conservée longtemps à l'état dénaturé, plus elle est susceptible d'afficher un intermédiaire. Une explication acceptée de ce phénomène est que pendant une période prolongée dans l'état D, certaines liaisons X-Pro pourraient s'isomériser de l'état trans à l'état cis, pour former un intermédiaire. Alternativement, comme dans le cas de la RNase, qui possède une liaison cis X-Pro à l'état natif, la dénaturation provoque une isomérisation à l'état trans. Dans le cas de la RNase, pour se replier, l'intermédiaire d'accumulation I doit se réisomériser lentement jusqu'à l'état cis, suivi d'un retour rapide à l'état N.
  • Certaines protéines qui contiennent plusieurs liaisons disulfure qui doivent se reformer correctement après une dénaturation réductrice peuvent se replier en intermédiaires avec le mauvais partenaire S-S. De tels intermédiaires peuvent être piégés en arrêtant la formation supplémentaire de S-S pendant le repliement avec l'ajout d'iodoacétamide.

Figure : ajout d'iodoacétamide

A titre d'exemple, considérons les données suivantes sur l'inhibiteur de trypsine pancréatique bovine.

Figure : Inhibiteur de trypsine pancréatique bovin (BPTI) : cinétique de repliement - seules des structures disulfure natives semblent se former.

Figure : BPTI Folding Pathway In Vitro - donne un schéma possible des intermédiaires de pliage

  • Certaines protéines forment des intermédiaires partiellement repliés mais stables lorsqu'elles sont repliées dans des conditions partiellement dénaturantes. Un bon exemple est la lactalbumine, qui dans des conditions légèrement acides (pH 4), de faibles niveaux de guanidine HCl ou un pH neutre et une faible force ionique en l'absence de calcium (qui se lie normalement à la protéine), forme un intermédiaire stable et isolable ( I) appelé le globule fondu (MG). L'image ci-dessous montre l'état replié avec deux ions calcium liés.

Figure : lactalbumine (image réalisée avec Pymol)

Les données montrent que la MG est environ 50 % plus volumineuse que l'état N. Cela se compare à l'état dénaturé, qui peut être 300% plus grand que l'état natif. Par conséquent, il ressemble plus à l'état natif tel qu'il est étudié par les techniques hydrodynamiques, mais avec une plus grande accessibilité au solvant des chaînes latérales hydrophobes. La MG a un spectre CD similaire à l'état natif, mais les chaînes latérales aromatiques présentent les mêmes caractéristiques d'absorption UV et de fluorescence que la protéine dans la guanidine HCl 6 M, ce qui suggère que l'état tertiaire final n'est pas encore complètement formé. La structure secondaire dans la MG peut ne pas être la même que dans l'état natif

La RMN peut également être utilisée pour détecter les intermédiaires de repliement. En utilisant cette technique, les protéines sont dépliées dans D2O, ce qui provoquera l'échange de tous les Cs avec des protons ionisables, y compris l'amide Hs. Une amine est une base faible (pKb d'environ 3,5) donc son acide conjugué, l'amine protonée, a un pKa d'environ 9,5. Une liaison amide ou peptide serait une base plus faible qu'une amine car sa paire isolée est moins disponible (en raison de la délocalisation par résonance) pour être partagée avec un proton. Le pKa de l'acide conjugué de l'amide (dans lequel l'amide N est protoné et a une charge positive) est beaucoup plus faible, environ -0,5, que le pKa de l'acide conjugué d'une amine. A 2 unités de pH supérieures à son pKa, l'amide chargé N est proche de 100 % déprotoné. Le pka du groupe protoné est important puisque le taux d'échange de H est lié au pKa, les autres variables étant constantes. Le pka d'une amine non protonée (RNH2 -> RNH- est très élevé (30s) et donc la déprotonation de l'amine RNH2 pour former RNH- n'est pas probable dans des conditions normales.

Figure : Échange de tous les Cs avec des protons ionisables, dont l'amide Hs

Le repliement est initié en diluant la protéine dans une solution sans le dénaturant, mais toujours dans D2O. Au fur et à mesure que la protéine se replie et devient plus compacte, les atomes enfouis sont maintenant séquestrés du solvant et n'échangent plus facilement les Ds. Ensuite, la protéine est placée dans H2O à pH 9,0 pendant 10 ms, après quoi le pH est modifié à pH 4,0. L'échange D --> H est favorisé à pH élevé et désactivé pour les amides Ds et Hs à faible pH. Les amides H qui continuent à s'échanger doivent être accessibles à l'eau. Ceux qui ne le sont pas sont généralement enterrés dans une structure secondaire.

Figure : Données expérimentales sur des protéines modèles. Comment interpréteriez-vous ces graphiques.

Lorsque les mêmes techniques sont appliquées à de grandes protéines multidomaines ou oligomères, seuls quelques pour cent se replient in vitro. Des interactions intermoléculaires incorrectes et une agrégation hétérogène semblent être les principaux problèmes qui empêchent un repliement correct des protéines in vitro.

Jmol : Mise à jour de l'Apolactalbumine (sans Ca2+)/Hololactalbumine Jmol14 (Java) | JSMol (HTML5)

Version archivée du chapitre 2D complet : Pliage et stabilité des protéines

/>
Biochemistry Online par Henry Jakubowski est sous licence Creative Commons Attribution-NonCommercial 4.0 International License.


Possibilités d'accès

Obtenez un accès complet au journal pendant 1 an

Tous les prix sont des prix NET.
La TVA sera ajoutée plus tard dans la caisse.
Le calcul des taxes sera finalisé lors du paiement.

Obtenez un accès limité ou complet aux articles sur ReadCube.

Tous les prix sont des prix NET.


Nous décrivons une approche générale pour concevoir des matrices de protéines bidimensionnelles (2D) médiées par des interfaces protéine-protéine non covalentes. Les homo-oligomères de protéines sont placés dans l'un des dix-sept groupes de couches 2D, les degrés de liberté du réseau sont échantillonnés pour identifier les configurations avec des surfaces d'interaction complémentaires de forme, et l'énergie d'interaction est minimisée à l'aide de calculs de conception de séquence. Nous avons utilisé la méthode pour concevoir des protéines qui s'auto-assemblent en groupes de couches P 3 2 1, P 4 21 2 et P 6. Les cartes de projection de réseaux à l'échelle micrométrique, assemblées à la fois in vitro et in vivo, sont cohérentes avec les modèles de conception et affichent la symétrie du groupe de couches cible. De tels réseaux de protéines 2D programmables devraient permettre de nouvelles approches pour la détermination de la structure, la détection et l'ingénierie des nanomatériaux.

L'auto-assemblage programmé fournit une voie pour modeler la matière à l'échelle atomique. Méthodes d'origami ADN (1, 2) ont été utilisées pour générer une grande variété de structures ordonnées, mais les progrès dans la conception d'assemblages de protéines ont été plus lents en raison de la plus grande complexité des interactions protéine-protéine. La biologie fournit un certain nombre d'exemples de matrices de protéines bidimensionnelles (2D) ordonnées : les protéines bactériennes de la couche S s'assemblent en une symétrie plane oblique, carrée ou3) les plaques de jonction lacunaire, abondantes dans les tissus musculaires et cardiaques, présentent une symétrie planaire hexagonale (4) et les canaux d'eau présentent une symétrie planaire carrée (5). Bien que des protéines qui forment des cristaux 3D ordonnés aient été conçues (6) et des réseaux 2D ont été générés en fusionnant génétiquement ou en réticulant chimiquement des oligomères avec des groupes symétriques ponctuels appropriés (710), il y a eu peu de succès dans la conception de réseaux 2D auto-assemblés avec un ordre suffisant pour diffracter les électrons ou les rayons X en dessous de 15 de résolution (7). Les matrices et assemblages 2D naturels sont stabilisés par des interactions non covalentes étendues entre les sous-unités protéiques (10, 11), et ce principe a été utilisé pour concevoir des cages tétraédriques et octaédriques auto-assemblées (12, 13).

Nous avons cherché à concevoir des réseaux 2D ordonnés médiés par des interfaces protéine-protéine conçues stabilisées par des interactions non covalentes étendues. Nous nous sommes concentrés sur les réseaux symétriques, car la symétrie réduit le nombre d'interfaces protéiques distinctes nécessaires pour stabiliser le réseau (14, 15). Il existe 17 façons distinctes (groupes de calques) par lesquelles des objets 3D peuvent se réunir pour former des calques 2D périodiques (16). Dans certains groupes de couches, il n'y a que deux interfaces uniques entre des sous-unités identiques, dans d'autres, trois ou quatre (17). Pour simplifier le défi de conception, nous nous sommes concentrés sur les groupes de couches qui n'impliquent que deux interfaces uniques et des blocs de construction avec une symétrie de point interne (qui contiennent déjà l'une des deux interfaces requises), ce qui ne laisse qu'une seule interface unique à concevoir pour former la 2D déployer. Sur les 17 groupes de couches, 11 ont deux interfaces uniques sur lesquelles nous nous sommes concentrés ici sur 6 de ces 11 groupes impliquant des groupes ponctuels cycliques plutôt que dièdres, car il y a beaucoup plus d'oligomères cycliques que d'oligomères dièdres dans la Protein Data Bank qui peuvent servir de blocs de construction. Les six groupes de couches avec deux interfaces uniques qui peuvent être construits à partir d'oligomères cycliques sont P 2 21 21 (à partir des blocs de construction C2), P 3 et P 3 2 1 (à partir des blocs de construction C3), P 4 et P 4 21 2 (à partir des blocs de construction C4) et P 6 (à partir des blocs de construction C6). Les différents groupes ont différents nombres de degrés de liberté décrivant le placement d'un objet à symétrie cyclique dans le réseau, par exemple, pour P 3 2 1 (Fig. 1A) et P 4 21 2 (Fig. 1F), il y a trois degrés de liberté, alors que pour P 6 (Fig. 1K) il n'y en a que deux.

(UNE) La maille élémentaire P 3 2 1 à trois axes représentés par des triangles. Les objets C3 jaunes (–) et violets (+) ont des orientations opposées le long de la z axe. (Encart) Les trois degrés de liberté du réseau. (B) p3Z_42 tableau 2D. (C) Interface conçue par p3Z_42 avec un garnissage hydrophobe « de type zippé » et des liaisons hydrogène périphériques. () Grand (>1 μm) E. coli–matrice cultivée (milieu), vue à plus fort grossissement avec espacement de réseau comme dans (B) (à droite) et transformée de Fourier (amplitudes) de la grande matrice (à gauche). (E) (gauche) Carte de projection à 15 Å calculée à partir d'un large réseau. (À droite) superposition du modèle de conception p3Z_42 sur la carte de projection. (F) Le P 4 21 2 treillis. Les ovales représentent des axes doubles et des carrés, des axes quadruples. (g) tableau p4Z_9. (H) interface conçue par p4Z_9. (je) Taché négativement E. coli–matrice cultivée (panneau principal), un réseau replié in vitro à un grossissement plus élevé (en médaillon) et transformée de Fourier du panneau principal (à gauche). (J) Carte de projection à 14 calculée à partir d'un E. coli tableau comme dans (I) sans (gauche) et avec (droite) modèle de conception p4Z_9. (K) Le réseau P 6 a deux degrés de liberté (UNE,θ) (encart) disponible pour l'échantillonnage. Les six volets sont représentés par des hexagones. (L) tableau p6_9H. (M) Interface conçue par p6_9H. (N) p6_9H treillis cultivé in vivo avec transformée de Fourier à gauche et grossissement supérieur à droite. (O) Carte de projection à 14 Å de p6_9H de E. coli–matrices cultivées comme dans (N) et superposition de dessins animés (à droite). Toutes les barres d'échelle : noir, 5 nm blanc, 50 nm.

Nous avons utilisé l'amarrage symétrique dans Rosetta (14, 18, 19) pour rechercher des placements d'oligomères cycliques dans chacun des six groupes de couches avec une forme complémentaire (20) interfaces entre différentes copies d'oligomères. La fonction de notation d'amarrage consistait en un modèle de sphère souple d'interactions stériques et une mesure simple de la zone d'interface pouvant être conçue : le nombre d'interfaces Cβ dans les 7 Å. Pour chaque oligomère cyclique dans chaque groupe de couches,

20 trajectoires d'amarrage Monte Carlo indépendantes ont été réalisées à partir de placements de six à neuf copies de l'oligomère avec son axe de symétrie aligné avec les axes de symétrie correspondants du groupe de couches (par exemple, les trimères ont été placés sur les trois axes de symétrie indiqués par le triangles sur la figure 1A, tétramères sur les axes de symétrie quadruple indiqués par des carrés sur la figure 1F et hexamères sur les axes de symétrie sextuple indiqués par des hexagones sur la figure 1K). Dans les simulations d'amarrage Monte Carlo, les degrés de liberté échantillonnés étaient ceux compatibles avec le groupe de couches [Fig. 1, A, F et K (à droite)], et par conséquent, la symétrie du groupe de couches a été préservée tout au long des calculs.

Nous avons ensuite sélectionné les solutions les plus complémentaires de forme (le plus grand nombre de résidus en contact avec le moins de collisions) des trajectoires et effectué des calculs de conception de séquence de Rosetta pour générer des interfaces de faible énergie bien emballées entre les oligomères. Des recherches Monte Carlo ont été effectuées sur toutes les identités d'acides aminés et les états de rotamères de la chaîne latérale pour les résidus près de l'interface nouvellement formée entre les oligomères, tout en optimisant l'énergie de tous les atomes de Rosetta de l'ensemble du complexe (12, 13, 21). Après cette étape de conception de séquence, l'énergie a été encore minimisée par rapport aux angles de torsion des chaînes latérales des résidus près de l'interface et aux degrés de liberté symétriques du groupe de couches. Enfin, les modèles de réseau résultants ont été filtrés sur la base de la complémentarité de forme de l'interface conçue (>0.5), de la surface de l'interface conçue (>400 Å par monomère), des liaisons hydrogène insatisfaites enfouies introduites à la nouvelle interface (<4 à l'aide d'une sonde d'accessibilité au solvant de 1,4 ) (22) et l'énergie libre relative prévue (23) de formation complexe (≤ 10 unités d'énergie Rosetta par sous-unité) (des exemples de fichiers de script Rosetta accompagnent le matériel supplémentaire). Après une nouvelle optimisation de la séquence (13, 24), les modèles passant les filtres ont été inspectés manuellement et 62 modèles ont été sélectionnés pour la caractérisation expérimentale 16 pour P 2 21 21, 2 pour P 3, 10 pour P 3 2 1, 16 pour P 4, 3 pour P 4 21 2, et 15 pour P 6.

Des gènes synthétiques ont été obtenus pour les 62 conceptions, et les protéines ont été exprimées dans le Escherichia coli cytoplasme en utilisant un vecteur d'expression standard basé sur T7. Sur les 62 modèles, 43 en ont exprimé, 18 avaient des protéines dans le surnageant après avoir nettoyé le lysat à 12 000g pendant 30 min, alors que tous les 43 avaient des protéines dans le culot. Pour étudier le degré d'ordre dans le matériau granulé, nous avons examiné des échantillons colorés négativement par microscopie électronique (EM). Des réseaux réguliers ont été observés pour quatre des conceptions : l'une ne formait que des couches 2D empilées (fig. S1), tandis que trois formaient des réseaux planaires. Ces derniers sont décrits dans les sections suivantes.

Le plan p3Z_42 est dans le groupe de couches P 3 2 1. La disposition des corps rigides des trimères -hélices constituants dans le réseau a été identifiée par recherche Monte Carlo sur les trois degrés de liberté du réseau : la rotation du trimère autour de son axe θ , l'espacement du réseau A et le z décalage du trimère par rapport au plan du réseau (Fig. 1A). Dans le réseau identifié dans les calculs d'amarrage de Monte Carlo, les blocs de construction oligomériques s'entassent dans un réseau dense (Fig. 1B, les copies jaune et violet sont inversées l'une par rapport à l'autre) stabilisée par une grande surface de contact entre les copies adjacentes avec un côté complémentaire proche -l'empilement de chaînes (Fig. 1C) généré dans les calculs de conception de séquence.

p3Z_42 a formé de gros cristaux 2D très bien ordonnés (Fig. 1D). La plupart des protéines exprimées dans E. coli semblaient s'assembler dans ces cristaux 2D, car il y en avait très peu dans la fraction soluble (fig. S3). À des températures d'expression basses (16 °C), des feuilles 2D ont été obtenues (Fig. 1D), tandis qu'à 37 °C, où de plus grandes quantités de protéines sont produites, de grandes feuilles 2D empilées principalement en cristaux 3D épais. Un grossissement plus élevé (Fig. 1D, en médaillon) a montré un réseau trigonal similaire à celui du modèle de conception [comparer la Fig. 1D (à droite) avec la Fig. 1B]. Transformation de Fourier du réseau [Fig. 1D (gauche)] a donné des pics jusqu'à une résolution de 15 Å, l'ordre dans le réseau non coloré est probablement nettement plus élevé, car la coloration négative limite probablement la résolution observée. Une carte de projection de 15 Å (Fig. 1E) recalculée à partir des composantes de Fourier suivait le contour du réseau conçu [Fig. 1E (à droite)] (dimensions de la cellule unitaire une = b = 85 , = 120°). Il est à noter que des cristaux planaires d'une si grande taille peuvent croître sans support dans les limites (et avec les nombreux obstacles cellulaires) d'un E. coli cellule. L'expression sans cellule de cette conception a donné de gros cristaux 2D ordonnés similaires à ceux formés dans E. coli (fig. S4A).

La conception p4Z_9 est dans le groupe de couches P 4 21 2. Recherchez sur les trois degrés de liberté du groupe de calques [la rotation autour de l'axe interne C4, l'espacement du réseau et le z décalage entre les tétramères inversés adjacents (Fig. 1F)] a donné l'arrangement compact illustré sur la Fig. 1G (vue latérale sur la Fig. S2B). L'interface conçue est composée de résidus hydrophobes nichés entre deux hélices entourées de résidus polaires (Fig. 1H).

p4Z_9 a formé des cristaux jusqu'à 1 m de largeur (Fig. 1I) avec peu de protéine présente dans la fraction soluble (Fig. S3). L'incubation du matériau du culot avec de la guanidine 6 M et la purification et le repliement ultérieurs (par dialyse ou dilution rapide) ont donné des matrices cristallines 2D et des fibres avec le même emballage carré (fig. S4, B et C). La transformation de Fourier des grands réseaux 2D colorés négativement générés in vivo a donné des pics jusqu'à une résolution de 14 [Fig. 1I (gauche)]. La carte de projection de 14 produite par rétro-transformation avait des vides rectangulaires distinctifs dans des directions alternées, qui correspondaient étroitement au modèle de conception [Fig. 1J et 1J (à droite)] (dimensions de la cellule unitaire une = b = 56 , = 90°).

La conception p6_9 est construite à partir d'hexamères -hélicoïdaux dans le groupe de couches P 6. Dans ce cas, tous les oligomères sont dans la même orientation le long de la z axe (perpendiculaire au plan de la Fig. 1K), et par conséquent, il n'y a que deux degrés de liberté - la rotation autour de l'axe sextuple et l'espacement du réseau [Fig. 1K (à droite)]. La solution d'amarrage de forme complémentaire (Fig. 1L et vue de côté fig. S2C) est composée de quatre hélices étroitement associées le long du double axe du réseau (Fig. 1M) avec deux phénylalanines en interaction. Nous avons également testé une variante, p6_9H, qui introduit un réseau de liaisons hydrogène à travers l'interface (Fig. 1M).

Conception p6_9 exprimée en E. coli a été trouvé à la fois dans le surnageant et le culot (fig. S3). L'enquête EM a révélé que la pastille contenait des matrices hexagonales 2D monocouche hautement ordonnées, contrairement au surnageant. p6_9H a formé des réseaux encore plus grands (Fig. 1N, Fig. S5 et tableau S1). Les couches 2D de la pastille étaient très ordonnées avec un empilement hexagonal clairement évident [Fig. 1N et 1N (encadré)]. Transformation de Fourier des tableaux colorés négativement [Fig. 1N (gauche)] a donné des pics jusqu'à une résolution de 14 et la carte rétro-calculée de 14 était à nouveau étroitement cohérente avec le modèle de conception de la matrice [Fig. 1O et 1O (à droite)] (dimensions de la cellule unitaire : une = b = 120 , = 120°). De grands réseaux ont également été formés in vitro après concentration de p6_9H soluble purifié à partir du surnageant après lyse de E. coli (fig. S4, D et E).

Pour obtenir une résolution plus élevée que possible avec des échantillons colorés négativement, nous avons analysé les conceptions sans tache par cryomicroscopie électronique (cryo-EM). L'analyse des cristaux p3Z_42 par cryo-EM (Fig. 2, A et B) et la diffraction électronique ont donné des données à une résolution de 3,5 Å (Fig. 2C). La grande majorité des cristaux diffractés à cette résolution dans les préparations cryo, indiquant un ordre élevé à longue distance. Des micrographies filmées des cristaux résultants ont également été collectées, corrigées en mouvement et traitées dans 2dx (25) pour produire une carte de projection à une résolution de 4 Å en accord avec le modèle de conception (Fig. 2, comparer D et E). À notre connaissance, il s'agit de l'ordre le plus élevé observé à ce jour pour un réseau 2D macromoléculaire conçu.

(UNE) Micrographie cryo-EM de E. coli– cultivé p3Z_42 enregistré à partir de matériel insoluble non purifié et remis en suspension. (B) Transformée de Fourier calculée à partir de films corrigés par le mouvement pris à partir d'échantillons comme ceux de (A). (C) Diffraction électronique d'un cristal comme en (A). () Carte de projection à 4 Å calculée à partir de films corrigés par le mouvement à partir de matériel comme dans (A) montrant un arrangement de protéines répétées lié similaire au modèle de conception p3Z_42. La cellule unitaire est représentée en bleu et contient deux unités trimériques alternées. La densité triangulaire aux coins de la cellule unitaire est probablement un artefact de moyenne. (E) modèle de conception p3Z_42 dans une vue similaire à celle de (D). Barre d'échelle, 50 nm.

Nos réseaux de protéines planaires conçus forment de grands cristaux 2D planaires à la fois in vivo et in vitro qui sont étroitement cohérents avec les modèles de conception. Deux des trois succès concernaient des groupes de couches avec des blocs de construction adjacents dans des orientations opposées le long de la z axe ceux-ci ont les avantages que (i) il y a un degré de liberté supplémentaire (le z offset) fournissant plus d'arrangements d'emballage possibles pour un bloc de construction oligomère donné (ii) les interfaces sont antiparallèles plutôt que parallèles de sorte que, dans les calculs de conception, les résidus opposés peuvent avoir des identités différentes et (iii) des inexactitudes dans les calculs de conception qui entraînent une déviation de la planéité s'annulent effectivement. D'un autre côté, les matrices "polaires" conçues avec toutes les sous-unités orientées dans la même direction - comme p6_9 - présentent des avantages pour la fonctionnalisation, car les deux côtés sont distincts et peuvent être adressés séparément.

Il est à noter que, pour les trois conceptions, de vastes réseaux cristallins se forment sans support dans E. coli et à partir de protéines purifiées in vitro. Les réseaux cohérents peuvent s'étendre jusqu'à 1 µm de longueur mais n'ont par conception que 3 à 8 nM d'épaisseur (fig. S2). Nous prévoyons que des cristaux encore plus gros et peut-être plus hautement ordonnés se formeraient sur un support solide, ce qui sera utile pour les futures applications nanotechnologiques. La capacité de concevoir avec précision des réseaux 2D au niveau atomique proche devrait permettre de nouvelles approches en biologie structurelle26) applications], de nouvelles modalités de détection avec le couplage de domaines de liaison d'analyte aux puces, et l'organisation de réseaux d'enzymes et de chromophores de récolte de lumière en deux dimensions.


Matériaux et méthodes

Matériaux.

Des informations détaillées sur les matériaux utilisés dans cette étude, y compris les oligoonucléotides d'ADN, les enzymes de restriction, la ligase, les vecteurs phagemides, les cellules compétentes, les phages auxiliaires et les produits chimiques, peuvent être trouvées dans SI Text.

Réplication in vivo de nanostructures d'ADN.

Les brins de nanostructure sens et antisens équimolaires (J1, J1-O ou PX, voir le texte SI pour les séquences) (90 nM) ont été recuits de 94 ° C à température ambiante pendant 45 min dans 1 × tampon TAE-Mg [à mM Tris -acide acétique (pH 8,0), 12,5 mM d'acétate de magnésium et 1 mM d'EDTA] pour donner un insert DS. Deux microgrammes de Litmus 28i (500 µg/ml) ont été digérés en double restriction par 20 unités de PstI et 15 unités de SacI dans 50 µl de 1× NE Buffer 1 [10 mM Bis-Tris-Propane-HCl, 10 mM MgCl2, DTT 1 mM (pH 7,0)] à 37°C pendant 3 h. La réaction a été arrêtée par l'ajout de tampon dénaturant, et le vecteur digéré a été purifié par électrophorèse sur gel d'agarose. Le vecteur digéré (100 ng) a été ligaturé avec 0,16 pmol d'insert DS préannelé ( excess3 fois en excès) dans 20 l de tampon ligase T4 f1 × [50 mM Tris·HCl, 10 mM MgCl2, 1 mM d'ATP et 10 mM de DTT (pH 7,5)] à 4°C pendant la nuit. Le vecteur ligaturé (50 ng) a été transformé dans des cellules XL1-Blue compétentes, étalé sur des plaques de gélose LB-ampicilline (LB-Amp) et incubé à 37°C pendant une nuit. Le phagemide double brin a été extrait des cellules dans 5 ml de cultures saturées qui ont été amplifiées à partir d'une seule colonie en utilisant le kit miniprep plasmide. L'insertion correcte a été vérifiée par digestion de restriction, suivie d'une PAGE dénaturante. Un millilitre de stock de glycérol de cellules XL1-Blue (OD600 = 0,5) avec le phagemide correctement inséré ont ensuite été infectés par 50 l de 1 × 10 11 phage auxiliaire M13KO7 et incubé pendant une nuit à 37°C dans 250 ml de culture LB-Amp contenant 25 ug/ml de kanamycine A. Les cellules ont été récoltées pour des études de reticulation ultérieures. Les particules de bactériophage qui contiennent le vecteur simple brin ont été précipitées du surnageant par addition de 10 g de PEG et 7,5 g de NaCl, suivi d'une centrifugation à 10 000 × g. Les enveloppes protéiques ont été retirées du vecteur simple brin par extraction au phénol/chloroforme. L'ADN a été récupéré par précipitation à l'éthanol, redissous dans 0,9 ml d'eau et restreint par 500 unités de PstI et 360 unités de SacI en présence de 1 nmol d'auxiliaires de restriction dans 1 ml de 1 × NE Buffer 1. L'ADN simple brin digéré le vecteur a été résolu sur un gel de polyacrylamide dénaturant à 10 %, et l'insert correctement répliqué (J1, J1-O ou PX) a été excisé du gel et élué. En règle générale, 50 à 100 pmol d'ADNsb peuvent être récupérés.

Caractérisation de la nanostructure répliquée.

La PAGE non dénaturante, l'analyse de Ferguson, l'autoempreinte des radicaux hydroxyles et les expériences de clivage de l'endonucléase VII ont été utilisées pour caractériser les nanostructures d'ADN répliquées. Des protocoles détaillés peuvent être trouvés dans SI Text.

Étude de croisement de psoralène.

Des informations détaillées sur les protocoles utilisés dans les expériences de réticulation du psoralène peuvent être trouvées dans SI Text.


Résumé

Sporisorium scitamineum, l'agent pathogène du charbon de la canne à sucre, s'appuie principalement sur son sécrétome pour coloniser avec succès son hôte, conformément à d'autres champignons du charbon apparentés. Compte tenu de l'importance de déchiffrer son sécrétome, nous avons examiné les altérations de la in vitro sécrétome de S. scitamineum en réponse à des milieux de croissance modifiés en tissu de méristème synthétique et de canne à sucre, afin d'identifier les protéines sécrétoires sensibles au signal de l'hôte. Les protéines sécrétoires qui étaient différentiellement abondantes et exclusivement sécrétées en réponse au milieu d'extrait hôte ont été identifiées par électrophorèse sur gel bidimensionnelle couplée avec MALDI-TOF/TOF MS. Sur les 16 protéines différentiellement abondantes et exclusivement sécrétées, neuf protéines ont été identifiées. Parmi lesquels, six étaient liés à la modification de la paroi cellulaire, à la morphogenèse, à la dégradation des polysaccharides et au métabolisme des glucides. In planta le profilage de l'expression génique a indiqué que cinq in vitro les protéines sécrétées ont été exprimées selon des schémas distincts par S. scitamineum au cours des différents stades de l'infection avec une expression relativement plus élevée 1 jour après l'inoculation, ce qui suggère que ces protéines pourraient aider S. scitamineum à des moments précoces de pénétration et de colonisation des cellules de canne à sucre. La présente étude a permis de mieux comprendre les altérations qui se produisent dans le sécrétome de S. scitamineum à in vitro conditions et a abouti à l'identification de protéines sécrétoires qui sont peut-être associées à la pathogénicité du champignon du charbon de la canne à sucre.


Discussion

Malgré la grande diversité des SLP (5, 23), les interactions moléculaires responsables du maintien d'un réseau physiologique de couche S ont été élucidées par cristallographie et confirmées par EM pour seulement RsaA bien qu'un modèle quasi atomique ait été proposé pour SbsB, le SLP de la bactérie Gram-positive Géobacillus stearothermophilus, qui est basé sur la cristallisation 3D assistée par nanocorps (6, 10). Il a été démontré que la liaison du calcium dans SbsB médie directement les interactions entre les domaines, compactant ainsi la structure dans la conformation appropriée pour la cristallisation (6). Dans le cas de RsaA, bien que les sites de liaison au calcium soient évidents dans tout le domaine de cristallisation, tous les contacts cristallins entre les monomères se produisent par le biais d'interactions d'acides aminés, et non par la coordination d'ions calcium divalents (Fig. 1B et Annexe SI, fig. S1) (10). Cette observation a été corroborée par nos analyses SAXS et CD de RsaA223–1026 indiquant que la liaison du calcium ne modifie pas significativement la structure du domaine de cristallisation (Fig. 1 et Annexe SI, fig. S4). Cependant, le calcium stabilise la structure secondaire de RsaA et se lie à proximité des résidus directement impliqués dans les contacts cristallins tels que P693 et ​​T758 à l'interface dimère et T256 à l'interface hexamère (Annexe SI, Figues. S1 et S5) (7, 10).

La structure cristalline de résolution 2.1-Å de RsaA223–1026 a révélé que bien que la liaison du calcium le long du domaine de cristallisation n'induise pas de changement de conformation observable, ce comportement de liaison est suffisant pour assembler des feuilles empilées du réseau physiologique de la couche S (Fig. 1B). Cependant, cet assemblage macroscopique de RsaA223–1026 s'est produite sur plusieurs jours en présence de précipitants et a été facilitée par un processus de concentration lent dû à l'équilibrage de la vapeur (22). À l'opposé, lors de l'ajout de 10 mM de CaCl2 au RsaA purifiéToute la longueur, l'auto-assemblage se produit facilement comme observé avec la diffraction des rayons X aux petits angles dans les 2 min à 20 M (Fig. 1C). A titre de comparaison directe, RsaA223–1026 n'a pas réussi à s'auto-assembler en 5 h dans les mêmes conditions de tampon et une concentration en protéines plus élevée (Fig. 1). Par conséquent, le domaine N-terminal de RsaA améliore la cinétique d'auto-assemblage et agit comme un domaine de nucléation.

La surveillance de la nucléation des cristaux de protéines à l'échelle nanométrique par une évolution temporelle des images Cryo-EM (Fig. 3) a révélé qu'après la liaison du calcium, RsaA cristallise en feuilles via une voie en plusieurs étapes. A 20 M, RsaAToute la longueur s'auto-assemble en cristaux matures en 120 s (Figs. 1C et 3B) en formant d'abord un intermédiaire cristallin à courte durée de vie structurellement distinct à des moments antérieurs (Figs. 3 et 4). A l'intérieur de cet état intermédiaire, le domaine de nucléation apparaît flexible par rapport au réseau rigide formé concurremment par le domaine de cristallisation (Figs. 4 et 5). Le domaine de nucléation semble atteindre sa conformation mature en formant plus tard un anneau à symétrie hexagonale autour du centre de chaque répétition hexamérique faite par le domaine de cristallisation (Figs. 4C et 5). Cette conformation mature est en accord avec la structure physiologique de la couche S, dans laquelle le domaine de nucléation réside sous le domaine de cristallisation (Figs. 1UNE, 4, et 5). Crystallization of SbpA, the calcium-triggered SLP from Lysinibacillus sphaericus, was recently observed by time-resolved AFM and exhibited a structural intermediate evidenced by discrete changes in crystal height (21, 24). Delayed assembly of specific domains, such as the N-terminal domain of RsaA (Fig. 5), could be responsible for intermediate conformations observed for other SLPs like SbpA.

Rapid in vitro RsaA crystallization involves a multistep pathway. Without calcium, the crystallization domain of RsaA (red surface, white crystal structure) is folded, but the N terminus (orange surface) exists in a partially unfolded state. Upon calcium introduction, the N terminus folds and compacts (Rg decreases by 7.4 Å). Then, monomers begin to assemble into a lattice using the crystallization domain. However, the N terminus retains motion and therefore does not appear in the 2D average of the intermediate state as observed by Cryo-TEM. Later, the N terminus locks into place as confirmed by another 2D average, forming a state resembling the physiological crystal lattice. Thus, a multistep pathway enables rapid protein crystallization for this bacterial SLP.

The crystallization domain possesses all of the residues necessary to form the long-range S-layer lattice, yet we observe a nucleation domain-dependent multistep assembly pathway of RsaAFull-Length. How does the nucleation domain mediate assembly kinetics? The precise mechanism by which this nucleation domain enhances the rate of self-assembly without directly participating in most intermolecular contacts remains unclear. By isolating and examining RsaA truncations, we determined that the nucleation domain undergoes a calcium-specific conformational change before crystallization, likely mediated by specific structural changes including increasing helical content of the domain upon binding calcium (Fig. 2). This observed calcium-induced conformational change might affect the formation of the hexameric interface of the crystallization domain, which is just downstream in the RsaA sequence. This change may also expose additional intermolecular interfaces to be utilized during delayed maturation of the nucleation domain. Segregating the biochemical steps in this assembly pathway would likely require high-resolution structural knowledge of the nucleation domain to guide rational mutagenesis. Alternatively, in the context of a short-lived crystalline intermediate, flexibility between domains may provide access to a larger landscape of conformational microstates, which could act as an additional entropic driving force for successful crystal nucleation. A careful study of the energetics of RsaA self-assembly may be required to fully elucidate the mechanism of nucleation rate enhancement observed herein.

S-layer assembly in vivo occurs through continuous protein crystallization as individual secreted RsaA monomers diffuse on the LPS outer membrane until reaching the edge of a growing S-layer crystal (9). Copious environmental calcium ensures that RsaA assumes its crystallizable conformation upon secretion (7). Whether this conformation is required for S-layer anchoring is unknown however, calcium depletion causes S-layer shedding, which could also be explained by partial unfolding and aggregation of the protein (7, 9). Upon reintroducing calcium to a liquid culture of Caulobacter cells that have shed their S-layer, RsaA nucleates quickly and efficiently at concentrations as low as 1–10 nM (9), suggesting an evolutionary basis for noncanonical crystallization kinetics if the proposed assembly pathway occurs on the cellular surface. High-resolution imaging of the Caulobacter S-layer in situ either by Cryo-EM or by superresolution fluorescence imaging has only observed S-layer assembly postnucleation, thereby precluding direct visual evidence of this multistep assembly mechanism in vivo (9, 10). However, the topology of the bacterial surface has been shown to affect S-layer crystal growth in vivo (9). Flexibility between domains might allow the crystallization domain to position itself for lattice formation while relieving torque originating from anchoring a 2D lattice on a variably curved surface. Our results further indicate that SLPs may segregate kinetic regulation of assembly using a structurally remote nucleation domain that enables fast and robust crystallization through an intermediate. This modularity raises the possibility of designing biologically inspired, self-assembling macromolecular nanomaterials with controllable nucleation kinetics.


A Bacterial Surface Layer Protein Exploits Multi-step Crystallization for Rapid Self-assembly

Surface layers (S-layers) are crystalline protein coats surrounding microbial cells. S-layer proteins (SLPs) regulate their extracellular self-assembly by crystallizing when exposed to an environmental trigger. However, molecular mechanisms governing rapid protein crystallization in vivo ou in vitro are largely unknown. Here, we demonstrate that the C. croissant SLP readily crystallizes into sheets in vitro via a calcium-triggered multi-step assembly pathway. This pathway involves two domains serving distinct functions in assembly. The C-terminal crystallization domain forms the physiological 2D crystal lattice, but full-length protein crystallizes multiple orders of magnitude faster due to the N-terminal nucleation domain. Observing crystallization using time-resolved electron cryo-microscopy (Cryo-EM) reveals a crystalline intermediate wherein N-terminal nucleation domains exhibit motional dynamics with respect to rigid lattice-forming crystallization domains. Dynamic flexibility between the two domains rationalizes efficient S-layer crystal nucleation on the curved cellular surface. Rate enhancement of protein crystallization by a discrete nucleation domain may enable engineering of kinetically controllable self-assembling 2D macromolecular nanomaterials.

Déclaration d'importance Many microbes assemble a crystalline protein layer on their outer surface as an additional barrier and communication platform between the cell and its environment. Surface layer proteins efficiently crystallize to continuously coat the cell and this trait has been utilized to design functional macromolecular nanomaterials. Here, we report that rapid crystallization of a bacterial surface layer protein occurs through a multi-step pathway involving a crystalline intermediate. Upon calcium-binding, sequential changes occur in the structure and arrangement of the protein, which are captured by time-resolved small angle x-ray scattering and transmission electron cryo-microscopy. We demonstrate that a specific domain is responsible for enhancing the rate of self-assembly, unveiling possible evolutionary mechanisms to enhance the kinetics of 2D protein crystallization in vivo.


Fond

Systems biology seeks to understand genomic and proteomic changes between species or between individual cells to link compositional changes in the genome (or proteome) to the observed phenotype. However, many organisms still have an array of genes and proteins of unknown structure and function while other annotated proteins may have limited homology to proteins in the same class. For example, more than 2000 of the 8000 genes identified in the smallest eukaryote Ostreococcus tauri are designated as proteins of unknown function [1, 2]. Understanding the structure, mechanism and function of these unknown proteins is the key to connecting information across scales from the individual protein to whole cell/organism. Thus, a better link is needed to connect proteomic output with structural biology pipelines.

Today, a variety of cell-free expression options have emerged as powerful alternatives to laborious in vivo methods of protein synthesis to support the growing demand for easy and cost-effective ways for protein production. Depending on the biochemical properties, the origin and the potential use of the proteins to be expressed, several cell-free protein expression systems can be explored and are commercially available today. These are based on E. coli, wheat germ, rabbit reticulocyte, L. tarentolae, insect and human cell extracts [3,4,5,6,7,8,9]. Although not currently commercially available, efficient cell-free lysates can also be prepared from tobacco BY-2 cells, Chinese hamster ovary (CHO) and yeast [10,11,12,13]. All cell-free translation systems rely on two major components: (1) a specifically designed vector or a PCR template with your gene of interest, and (2) a cell extract of choice that matches the experimental needs for yield or post-translational modifications. The reagents are supplemented with additional energy sources, amino acids and various cofactor molecules to aid continuous protein synthesis and folding. Key advantages of these systems are the ease of the setup, fast turnaround times, linear scalability for the reaction volumes and amenability to high-throughput screening. Additionally, these platforms allow significant customization as one can directly provide additives to aid solubilization and folding of difficult targets [14,15,16]. One can also include unnatural amino acids to facilitate labeling and characterization or introduce additional DNA/RNA templates to generate diverse protein hetero-assemblies by co-expression [17,18,19,20,21,22]. Since there is no need to sustain a living organism, toxic proteins that failed to be produced by cell-based methods can be readily expressed [23]. These numerous benefits are being widely exploited in applications of NMR and X-ray structure determination, functional genomics and proteome research, protein chip construction, therapeutics and vaccine development [17, 23,24,25,26].

While thousands of proteins can be manufactured in a high-throughput fashion using the cell-free translation format [26, 27], structural biology primarily requires a supply of specific protein components. Thus, the most critical parameters are high yield and high purity of the protein sample. High-resolution structural studies require at least 50 μg of highly purified protein for cryo-EM whereas, X-ray crystallography can require 1 mg or more. As of today, in comparison with other cell-free systems, E. coli cell-free protein production is the most frequently used for the needs of structural biology in X-ray and NMR due to its cost and availability [24]. However, a wheat germ lysate has the highest solubility and the highest translation yields for eukaryotic proteins. For instance, in the high-throughput proteome study, 12,996 human clones (out of 13,364 tested) gave rise to proteins whereas, 97.6% of those were detectable in a soluble fraction [26]. In addition, codon optimization is not required for wheat germ, which makes it compatible with various DNA templates from different organisms of both prokaryotic and eukaryotic origins [28]. Despite these benefits, the use of wheat germ cell-free system for structural biology has been primarily limited to NMR studies [17]. There is only one report on the use of this system for X-ray structure determination [29], yet that study utilized methods for the purification of PabI protein based on its heat-resistance properties, which are not broadly applicable for other protein targets.

The Environmental Molecular Sciences Laboratory is a United States Department of Energy user facility that is primarily focused on organisms relevant to bioenergy and the environment such as bacteria, algae, fungi and plants. Using a wheat germ cell-free expression system from CellFree Sciences, invented by the Endo group from Japan [4, 5], we sought to build a cell-free expression pipeline to link the systems biology and structural biology capabilities at this user facility, while maintaining applicability to a wide range of organisms and being compatible with all sample geometries used for high-resolution electron microscopy and X-ray structural analysis. Here, we describe a multiscale pipeline that allows quick screening for protein solubility, quick optimization of expression yield along with purification strategies suitable for high-resolution structural investigations using several target genes from various diverse organisms.


Hierarchical design of artificial proteins and complexes toward synthetic structural biology

In multiscale structural biology, synthetic approaches are important to demonstrate biophysical principles and mechanisms underlying the structure, function, and action of bio-nanomachines. A central goal of “synthetic structural biology” is the design and construction of artificial proteins and protein complexes as desired. In this paper, I review recent remarkable progress of an array of approaches for hierarchical design of artificial proteins and complexes that signpost the path forward toward synthetic structural biology as an emerging interdisciplinary field. Topics covered include combinatorial and protein-engineering approaches for directed evolution of artificial binding proteins and membrane proteins, binary code strategy for structural and functional de novo proteins, protein nanobuilding block strategy for constructing nano-architectures, protein–metal–organic frameworks for 3D protein complex crystals, and rational and computational approaches for design/creation of artificial proteins and complexes, novel protein folds, ideal/optimized protein structures, novel binding proteins for targeted therapeutics, and self-assembling nanomaterials. Protein designers and engineers look toward a bright future in synthetic structural biology for the next generation of biophysics and biotechnology.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Voir la vidéo: From DNA to protein - 3D (Décembre 2021).