Informations

6.S : Base génétique de la complexité (Références) - Biologie


6.S : Base génétique de la complexité (Références)

Complexité génétique du dysfonctionnement du nœud sino-auriculaire

Les cellules du stimulateur cardiaque du nœud sino-auriculaire cardiaque (SAN) sont essentielles à l'automaticité cardiaque normale. Un dysfonctionnement de la stimulation cardiaque entraîne un dysfonctionnement du nœud sino-auriculaire (SND) humain. La SND survient plus généralement dans la population âgée et est associée à une altération de la fonction du stimulateur cardiaque provoquant un rythme cardiaque anormal. Les personnes atteintes de SND présentent divers symptômes, notamment une bradycardie sinusale, un arrêt sinusal, un bloc SAN, un syndrome de bradycardie/tachycardie et une syncope. Il est important de noter que les personnes atteintes de SND signalent une incompétence chronotrope en réponse au stress et/ou à l'exercice. Le SND peut être génétique ou secondaire à des affections systémiques ou cardiovasculaires. La prise en charge actuelle des patients atteints de SND se limite au soulagement des symptômes d'arythmie et à l'implantation d'un stimulateur cardiaque si cela est indiqué. Le manque de mesures thérapeutiques efficaces ciblant les causes sous-jacentes de la SND rend la gestion de ces patients difficile en raison de sa nature progressive et a mis en évidence un besoin critique d'améliorer notre compréhension de sa base mécanique sous-jacente de la SND. Cette revue se concentre sur les informations actuelles sur la génétique sous-jacente aux SND, suivies des implications futures de ces connaissances dans la gestion des personnes atteintes de SND.

Mots clés: GIRK4 HCN4 Nav1.5 fibrillation auriculaire calséquestrine-2 génétique syndrome du sinus malade dysfonctionnement du nœud sino-auriculaire.

Copyright © 2021 Wallace, El Refaey, Mesirca, Hund, Mangoni et Mohler.

Déclaration de conflit d'intérêts

Le relecteur HZ a déclaré une co-paternité passée avec les auteurs PM et MM au rédacteur en chef. Les autres auteurs déclarent que la recherche a été menée en l'absence de toute relation commerciale ou financière pouvant être interprétée comme un conflit d'intérêt potentiel.


Quelles sont les causes de la distribution continue des phénotypes pour les caractères quantitatifs ?

La variation continue des caractères complexes est due à la complexité génétique et à la sensibilité environnementale. La complexité génétique résulte de la ségrégation des allèles à plusieurs loci. L'effet de chacun de ces allèles sur le phénotype du trait est souvent relativement faible et leur expression est sensible à l'environnement. Les effets alléliques peuvent également dépendre du patrimoine génétique et du sexe. En raison de cette complexité, de nombreux génotypes peuvent donner naissance au même phénotype, et le même génotype peut avoir des effets phénotypiques différents dans différents environnements. Ainsi, il n'y a pas de relation claire entre le génotype et le phénotype.


La base génétique de l'évolution du soma : preuves mécanistiques de la cooptation d'un gène induit par le stress en un maître régulateur du développement

Dans les organismes multicellulaires avec des cellules spécialisées, la distinction la plus significative entre les types de cellules est entre les cellules reproductrices (germinales) et les cellules non reproductrices/somatiques (soma). Bien que le soma ait contribué à l'augmentation marquée de la complexité de nombreuses lignées multicellulaires, on sait peu de choses sur ses origines évolutives. Nous avons précédemment suggéré que l'évolution des gènes responsables de la différenciation des cellules somatiques impliquait la cooptation de gènes de compromis du cycle de vie qui, dans les organismes unicellulaires, augmentaient la survie au détriment de la reproduction immédiate. Dans l'algue verte multicellulaire, Volvox carteri, le destin cellulaire est établi tôt dans le développement par l'expression différentielle d'un gène régulateur principal connu sous le nom regA. Un étroitement lié RegA-Comme la séquence (RLS1) est présent dans son parent unicellulaire, Chlamydomonas reinhardtii. RLS1 s'exprime en réponse au stress, et nous avons proposé qu'une RLS1-like gène a été coopté dans une voie de développement dans la lignée menant à V. carteri. Cependant, le scénario évolutif exact responsable de l'événement de cooptation postulé reste à déterminer. Ici, nous montrons qu'en plus d'être régulé par le développement, regA peut également être induite par des signaux environnementaux, indiquant que regA a maintenu sa régulation ancestrale. Nous avons également constaté que l'absence d'une protéine RegA fonctionnelle confère une sensibilité accrue au stress, compatible avec RegA ayant un rôle direct ou indirect dans les réponses au stress. Dans l'ensemble, cette étude (i) fournit des preuves mécanistiques de la cooptation d'un gène induit par l'environnement en un régulateur majeur du développement, (ii) soutient l'idée que les innovations morphologiques majeures peuvent évoluer via des changements réglementaires et (iii) plaide en faveur du rôle de stress dans l'évolution de la complexité multicellulaire.

Mots clés: Evolution du développement de la cooptation Volvox carteri du stress soma regA.


Discussion

Un nouvel environnement thermique induit un recâblage de la régulation métabolique

La température est un facteur majeur modulant l'expression de nombreux gènes chez les ectothermes et est particulièrement bien étudiée dans Drosophile [19, 20, 39]. Nos populations expérimentales qui ont évolué dans un nouvel environnement thermique chaud présentaient des différences très significatives dans l'expression des gènes impliquant de nombreux gènes de voies bien définies. Les gènes qui étaient régulés à la baisse dans les populations à évolution chaude étaient particulièrement intéressants, car ils suggèrent une régulation à la baisse globale de la production d'énergie chez les mouches à évolution chaude, affectant la glycolyse, le cycle du TCA et les voies de phosphorylation oxydative. Il est intéressant de noter qu'une étude largement répliquée dans Escherichia coli ont découvert que l'ARN polymérase était le gène le plus fréquemment ciblé dans les réplicats, entraînant un taux de synthèse protéique plus faible [40], fournissant une preuve supplémentaire qu'une réponse évolutive importante aux environnements chauds consiste à réduire l'augmentation de la production d'énergie et de la synthèse protéique, ce qui est augmenté dans les environnements chauds et impose probablement un coût important.

Conformément au recâblage métabolique modifié des populations évoluées à chaud, nous avons trouvé des différences significatives dans le CO2 production par rapport aux populations témoins ancestrales et évoluées à froid (voir Fig. 2e Fichier supplémentaire 1 : Figure S3 et Méthodes et résultats supplémentaires). Contrairement aux attentes naïves, le CO2 la production était plus élevée chez les mouches évoluées à chaud. Néanmoins, le métabolisme au repos et l'expression des gènes sont mesurés à deux moments différents du cycle quotidien des populations en évolution, ce qui suggère que le lien entre l'expression des gènes et la production d'énergie pourrait ne pas être simple. De plus, un CO plus élevé2 la production chez les mouches évoluées à chaud est cohérente avec l'augmentation de l'O2 consommation associée à une diminution de l'activité de l'AMPK [41]. Plus d'informations sur ce modèle contre-intuitif de CO2 consommation proviennent d'une analyse métabolomique de D. melanogaster dans une large gamme de températures de développement [42]. À des températures extrêmes, les mouches étaient appauvries en sucres et en métabolites énergétiques (NAD+, NADP+ et AMP), ce qui est attribué à leur incapacité à maintenir l'homéostasie cellulaire. Si les conditions chaudes de notre expérience ont le même effet, les mouches non évoluées dans cet environnement peuvent également être appauvries en sucres et en métabolites énergétiques. En réponse, les enzymes de la glycolyse, du cycle du TCA et des voies de phosphorylation oxydative pourraient être régulées à la hausse. Les mouches évoluées à chaud peuvent avoir acquis la capacité de maintenir l'homéostasie cellulaire à des températures élevées, permettant un métabolisme de repos plus élevé sans régulation à la hausse des gènes de la voie métabolique.

Nos résultats contrastent avec une étude récente où le CO2 la production a été conservée entre D. melanogaster populations qui ont évolué dans des environnements thermiques différents [43]. Avec plusieurs détails expérimentaux différant entre les études (lignées d'isofemelles vs pools d'individus non consanguins, mesures de 20 min pendant la journée vs métabolisme au repos pendant la nuit), l'interprétation de cet écart apparent est difficile. Néanmoins, il s'aligne bien avec la controverse générale sur l'effet de la température sur l'évolution du métabolisme [44]. Nous concluons que les différences constantes de CO2 La production entre les populations ancestrales et évoluées fournit des preuves solides de l'évolution de la régulation du métabolisme en fonction de la température, mais indique également que les changements physiologiques sous-jacents sont plus complexes.

L'AMPK explique les changements phénotypiques observés dans les populations à évolution chaude

Sur la base des seules analyses génomiques, il n'est pas possible d'exclure d'autres gènes dans le Sestrine pic comme cibles de sélection, ou trois autres petits gènes qui chevauchent la signature de sélection de SNF4Aγ (Fichier supplémentaire 2 : Tableau S3). En combinaison avec les données d'expression, cependant, le rôle de SNF4Aγ et Sestrine à mesure que les principaux moteurs du recâblage métabolique deviennent évidents. Sestrine module le taux de phosphorylation de la protéine kinase activée par l'AMP (AMPK) [45], qui est composée de SNF4Aγ et deux autres sous-unités. L'AMPK est un acteur clé de l'homéostasie énergétique aux niveaux cellulaire et organisme, et les deux SNF4Aγ et Sestrine sont directement liés à l'activité de l'AMPK [45,46,47]. De faibles niveaux d'ATP entraînent l'activation de l'AMPK, ce qui provoque une régulation à la hausse de la glycolyse et de la biogenèse des mitochondries [48]. De plus, des voies énergétiquement coûteuses, telles que la production d'acides gras et la néoglucogenèse, sont régulées à la baisse par l'AMPK [49]. L'inactivation de l'AMPK provoque une régulation négative de la glycolyse et une régulation positive des voies anaboliques telles que la production d'acides gras, qui ont toutes deux été observées dans nos données. Fait intéressant, Pfk, l'enzyme cible de l'AMPK dans la glycolyse, est la première enzyme régulée à la baisse de la voie de la glycolyse dans notre ensemble de données (Fig. 2a, flèche bleue). Dans D. melanogaster, la régulation négative médiée par l'interférence ARN de SNF4Aγ augmente la teneur en glucose des muscles et du corps gras [50] et induit un comportement de famine [41]. Certains des gènes de la voie de signalisation des récepteurs de l'insuline étaient également exprimés de manière différentielle dans les populations à évolution chaude (Ilp6, InR, voir Fichier supplémentaire 1 : Figure S1). De plus, certaines enzymes clés impliquées dans la production d'acides gras (ACCoAs, ACC et FASN2, Desat1, CG30008, CG33110, CG18609 voir fichier supplémentaire 1 : Figure S1) montrent également un signal de régulation à la hausse, compatible avec l'inhibition directe de l'ACC par l'AMPK [51]. L'augmentation des températures et le stress thermique épuisent le stockage des graisses dans D. melanogaster [52] en invoquant l'apoptose dans le corps gras - un processus dépendant de SNF4Aγ [53] qui relie le modèle d'expression de type famine observé ici à l'adaptation à la température. Sestrine est également liée à la régulation de l'autophagie dans Drosophile, par son rôle dans l'activation de l'AMPK [54, 55].

Ainsi, nos résultats indiquent que l'activité du régulateur métabolique clé AMPK est modulée par la régulation différentielle de la sous-unité SNF4Aγ et gène d'interaction Sestrine dans les populations à évolution chaude. Étant donné le rôle central de SNF4Aγ et Sestrine pour le recâblage métabolique dépendant de la température, nous avons estimé que les deux gènes devraient varier le long des courbes de température dans les populations naturelles. Bien que nous n'ayons trouvé aucune preuve de la clinalité de Sestrine, les modèles de SNF4Aγ correspondait à nos attentes. Une analyse du polymorphisme du génome entier identifié SNF4Aγ comme l'un des meilleurs candidats en clinique nord-américaine D. melanogaster population [22]. Variation clinique et saisonnière de SNF4Aγ dans D. melanogaster et D. simulans impliquent davantage la température en tant que moteur adaptatif [21, 24]. Réanalyser les données génétiques des populations cliniques [23], SNF4Aγ fait partie des 603 gènes les plus différenciés partagés par l'Amérique du Nord et l'Australie D. simulans populations. Expression génique de SNF4Aγ est clinal en Europe D. subobscura populations, avec des populations du sud ayant des niveaux d'expression plus faibles [19], ce qui correspond à la réponse observée dans nos populations d'évolution expérimentales. Parce que le bloc d'haplotype sélectionné peut être partiellement maintenu dans d'autres populations, nous avons testé les SNP diagnostiques pour la variation clinique. Remarquablement, les populations des extrémités du cline nord-américain présentent un signal clinique pour les SNP diagnostiques. Néanmoins, le signal était mitigé pour les populations moins extrêmes.

Des loci à effet large ségrégeant à des fréquences alléliques intermédiaires entraînent une évolution rapide

L'analyse combinée des données transcriptomiques et de reséquençage du génome entier d'un D. simulans population évoluant dans un nouvel environnement thermique a identifié deux gènes, tous deux connectés à l'AMPK, un interrupteur métabolique central. Bien qu'il existe de nombreuses possibilités quant à la façon dont le métabolisme pourrait être régulé, la forte réponse de sélection dans toutes les répliques suggère que deux loci à effet majeur sont à l'origine de la réponse métabolique adaptative dans nos populations. La signature de sélection observée indique clairement que l'adaptation dans notre étude E&R [27] est dominée par un petit nombre de loci à fort effet, fournissant un autre exemple d'adaptation rapide entraînée par quelques loci à effet majeur [12,13,14,15, 16].

Les deux haplotypes à l'origine du changement métabolique dans nos populations expérimentales se séparent à des fréquences intermédiaires dans la population fondatrice et présentent une variation clinale. Ainsi, il est hautement plausible que ces gènes contribuent à des processus adaptatifs similaires dans les populations naturelles, qui se produisent probablement sur des échelles de temps très courtes. Étant donné que la température varie selon les saisons, il est possible que l'hétérogénéité spatiale et temporelle maintienne les allèles sélectionnés à une fréquence intermédiaire dans D. simulans [10, 24].

Le fait que peu de loci à effet important aient abouti à une signature de sélection claire dans notre expérience n'exclut cependant pas que plusieurs loci à effet mineur influencent également le recâblage métabolique dans les environnements chauds. Pourtant, nos simulations informatiques suggèrent que ces deux loci expliquent probablement plus de 50 % du changement phénotypique, même lorsque des loci à effet mineur contribuent également (Fig. 4). Auparavant, il avait été montré que les allèles à effet majeur contribuant aux caractères quantitatifs présentaient la réponse de sélection la plus rapide, mais avec un nombre croissant de générations, ces loci sont surpassés car les allèles à petit effet augmentent progressivement en fréquence [56]. La raison de la perte des allèles à grand effet est qu'il est plus facile d'obtenir des génotypes proches de l'optimum de fitness avec des allèles à petit effet, tandis que les allèles à grand effet pourraient provoquer un dépassement, résultant en des phénotypes plus extrêmes que favorisés par la sélection. Par conséquent, l'analyse de ces populations expérimentales après un intervalle de temps plus long pourrait être très informative pour comprendre la dynamique des allèles adaptatifs dans les populations naturelles.

L'allèle privilégié étant fixé ou proche de la fixation dans les populations du sud des USA, il serait intéressant d'étudier la réponse adaptative dans ces populations. Parce que l'AMPK ne contribuera probablement pas davantage à l'adaptation, une telle expérience pourrait révéler d'autres signaux adaptatifs qui n'ont pas été détectés dans cette étude. De telles populations seraient-elles en ségrégation pour d'autres allèles majeurs ou une réponse polygénique serait-elle détectée ?

Prochaines étapes

L'évolution expérimentale fournit un excellent cadre pour les tests expérimentaux d'allèles sélectionnés. Les remplacements alléliques avec la technologie CRISPR/Cas9 permettent la comparaison directe d'allèles sélectionnés et non sélectionnés dans un fond génétique par ailleurs homogène. Néanmoins, la résolution cartographique dans notre étude est encore assez faible. Remplacement d'une région génomique de > 10 kb dans D. simulans, une espèce avec une efficacité de transformation inférieure à D. melanogaster, est extrêmement difficile. Ainsi, les prochaines étapes nécessiteraient une cartographie plus fine de la cible de sélection. Nous prévoyons que l'ajout de chromosomes sans les allèles sélectionnés au cours d'une évolution expérimentale prolongée offrira plus d'opportunités de recombinaison pour obtenir une région candidate plus petite. Une fois que des régions candidates suffisamment petites sont clonées, de nombreuses expériences de suivi sont envisageables, allant des expériences de compétition d'allèles sélectionnés et non sélectionnés dans un cadre d'évolution expérimentale à des comparaisons biochimiques détaillées utilisant la métabolomique, la transcriptomique et la protéomique.


Fond

Pour identifier les variantes génétiques qui affectent la susceptibilité à une variété de maladies, des études d'association pangénomique (GWAS) génotypent un ensemble dense de SNP (polymorphisme nucléotidique unique) communs et testent les fréquences alléliques parmi une cohorte de personnes affectées et de personnes non affectées [1 ]. Les méthodes d'analyse traditionnelles des données GWAS ne prennent en compte qu'un seul SNP à la fois et testent son association avec la maladie. Ce type de stratégie d'analyse ne convient que pour les troubles mendéliens simples. Certaines maladies complexes courantes telles que divers types de cancers, les maladies cardiovasculaires et le diabète sont influencées par de multiples variantes génétiques. Par conséquent, la détection d'épistasie d'ordre élevé, qui fait référence à l'effet interactif de deux ou plusieurs variantes génétiques sur des maladies humaines complexes, peut aider à comprendre comment les facteurs de risque génétiques confèrent une sensibilité aux maladies complexes [2]. Cependant, le très grand nombre de SNP vérifiés dans un GWAS typique et le nombre énorme de combinaisons de SNP possibles rendent difficile la détection d'interactions épistatiques d'ordre élevé à partir des données GWAS [3]. De plus, comment mesurer l'association entre un ensemble de SNP et le phénotype présente un autre grand défi statistique.

Au cours de la dernière décennie, deux types de méthodes de calcul heuristiques ont été proposées pour détecter les interactions épistatiques : les méthodes basées sur la prédiction/classification et les méthodes basées sur les associations. Les méthodes basées sur la prédiction/classification tentent de trouver le meilleur ensemble de SNP, qui peut générer la plus grande précision de prédiction/classification, y compris, par exemple, la réduction de dimensionnalité multifactorielle (MDR) [4], la régression logistique pénalisée (par exemple, stepPLR [5], et lassoPLR [6]), machine à vecteurs de support (SVM) [7] et forêt aléatoire [8]. Le MDR est une méthode non paramétrique et sans modèle basée sur la construction d'un tableau de risque pour chaque combinaison de SNP [4]. Si le rapport cas/contrôle dans une cellule de ce tableau des risques est supérieur à 1, le MDR l'étiquetera comme « risque élevé », sinon, « à faible risque ». Par le tableau des risques, MDR peut prédire le risque de maladie et sélectionnera la combinaison SNP avec la précision de prédiction la plus élevée. StepPLR et lassoPLR apportent quelques modifications pour éviter les problèmes de surajustement dont souffrent les méthodes de régression logistique standard [9] lors de la détection des interactions épistatiques. Par exemple, stepPLR combine le critère de régression logistique avec une pénalisation de la norme L2 des coefficients. Cette modification rend le stepPLR plus robuste aux interactions épistatiques d'ordre élevé [5]. Deux méthodes d'apprentissage automatique : SVM [7] et forêt aléatoire [8] ont également été appliquées à la détection d'interactions épistatiques. Les méthodes d'apprentissage automatique sont basées sur une classification binaire (prédiction) et traitent les cas comme des positifs et les contrôles comme des négatifs dans les données SNP. Ils utilisent SVM ou forêt aléatoire comme prédicteur et sélectionnent un ensemble de SNP avec la précision de prédiction/classification la plus élevée par sélection de caractéristiques. Certaines méthodes basées sur la prédiction/la classification ne peuvent être appliquées qu'à une analyse à petite échelle (c'est-à-dire un petit ensemble de SNP) en raison de leur complexité de calcul. De plus, presque toutes les méthodes basées sur la prédiction/la classification ont tendance à introduire un grand nombre de faux positifs, ce qui peut entraîner un coût énorme pour d'autres expériences de validation biologique [10].

La cartographie d'association épistasis bayésienne (BEAM) est une méthode évolutive et basée sur l'association [11]. Il divise les SNP en trois groupes : le groupe 0 est pour les SNP normaux, le groupe 1 contient les SNP de la maladie affectant le risque de maladie indépendamment et le groupe 2 contient les SNP de la maladie qui contribuent conjointement au risque de maladie (interactions). Étant donné une partition fixe, BEAM peut obtenir la probabilité postérieure de cette partition à partir des données SNP basées sur la théorie bayésienne. Une méthode de Markov Chain Monte Carlo est utilisée pour atteindre la partition SNP optimale avec une probabilité postérieure maximale dans BEAM. Un inconvénient de BEAM est que l'identification simultanée de combinaisons SNP et SNP pour une seule maladie rend BEAM trop complexe et affaiblit sa puissance.

Récemment, nous proposons une nouvelle méthode basée sur la couverture de Markov, DASSO-MB, pour détecter les interactions épistatiques dans les études cas-témoins [10]. La couverture de Markov est un ensemble minimal de variables, qui peut complètement protéger la variable cible de toutes les autres variables basées sur la propriété de condition de Markov [12]. Ainsi, les méthodes de couverture de Markov peuvent détecter les SNP de la maladie causale avec le moins de faux positifs. De plus, la stratégie de recherche heuristique dans les méthodes de couverture de Markov peut éviter le processus de formation fastidieux comme dans SVM et les forêts aléatoires. Cependant, l'hypothèse de fidélité dans les méthodes de couverture de Markov, qui ne peut pas toujours être assurée, peut entraver leurs applications dans la détection des interactions épistatiques [13].

Dans cet article, nous abordons les deux défis critiques (petites tailles d'échantillons et haute dimensionnalité) dans la détection d'interaction épistatique en introduisant une méthode d'apprentissage de structure de réseau bayésien basée sur le score, EpiBN (détection d'interaction épistatique à l'aide d'un modèle de réseau bayésien), qui utilise un et-Bound technique et une nouvelle fonction de notation. Les réseaux bayésiens fournissent une représentation succincte de la distribution de probabilité conjointe et de l'indépendance conditionnelle parmi un ensemble de variables. En général, une méthode d'apprentissage de structure basée sur le score pour les réseaux bayésiens définit d'abord une fonction de notation reflétant l'adéquation entre chaque structure possible et les données observées, puis recherche une structure avec le score maximum. Par rapport aux méthodes de couverture de Markov, les avantages de l'application de la méthode d'apprentissage de la structure du réseau bayésien basée sur les scores à la détection d'interaction épistatique incluent : (1) l'hypothèse de fidélité peut être assouplie et (2) la méthode de recherche heuristique peut résoudre le problème classique XOR (exclusif ou) [14]. Nous appliquons la méthode EpiBN à des ensembles de données simulés basés sur quatre modèles de maladie et trois ensembles de données réels : ensemble de données sur la dégénérescence maculaire liée à l'âge (DMLA), ensemble de données sur la maladie d'Alzheimer à début tardif (LOAD) et ensemble de données sur l'autisme. Nous démontrons que la méthode proposée surpasse certaines méthodes couramment utilisées telles que SVM, MDR et BEAM, en particulier lorsque le nombre d'échantillons est petit.


Discussion

Nos résultats épigénétiques de population, obtenus dans le cadre d'une population de cellules d'immunité innée, démontrent des différences importantes dans les profils de méthylation de l'ADN entre deux populations qui diffèrent par leur ascendance génétique mais partagent le même environnement actuel. De telles différences de population ont été observées à l'échelle de l'épigénome (expliquant

12 % de la variance totale de la méthylation de l'ADN) et impliquait 12 050 sites qui étaient principalement situés dans des gènes ayant des fonctions liées à la périphérie cellulaire ou à la régulation de la réponse immunitaire. Des études antérieures ont recherché des différences liées à l'ascendance dans la méthylation de l'ADN dans diverses populations humaines et types de cellules [16, 38, 39, 40, 41, 43, 95]. Bien que les comparaisons entre les études soient compliquées par les différences dans les paramètres expérimentaux et les seuils statistiques utilisés pour détecter les sites CpG associés à l'ascendance, ceux-ci vont de 299 entre les individus caucasiens et asiatiques/d'ascendance mixte vivant au Canada [16] à 36 897 entre les CEU européens et africains YRI [39]. Une idée intéressante qui peut être tirée de nos analyses est que les gènes impliqués dans l'activation et la régulation des réponses immunitaires ont tendance à présenter des niveaux plus élevés de méthylation de l'ADN chez les individus d'ascendance européenne, par rapport à ceux d'ascendance africaine, principalement en raison du contrôle génétique. Le fait que jusqu'à 16% des gènes liés au système immunitaire qui sont hyperméthylés chez les Européens soient également exprimés de manière différentielle entre les populations [48] pourrait fournir une explication mécaniste des différences liées à l'ascendance dans les réponses transcriptionnelles aux bactéries signalées dans les macrophages, où l'ascendance européenne est associée à des réponses inflammatoires plus faibles [49].

Bien que la variation des expositions environnementales passées et des facteurs socioéconomiques puissent contribuer aux différences de population dans la méthylation de l'ADN, nous avons constaté que 70 % des sites méthylés différemment entre les groupes d'ascendance africaine et européenne étaient associés à au moins un meQTL. Cela indique que les différences de population dans la méthylation de l'ADN sont principalement dues à des variantes de séquence d'ADN [38, 40, 41, 42]. Dans certains cas, une seule variante génétique peut expliquer des différences de population importantes sur plusieurs sites CpG, comme l'atteste le trans-meQTL que nous avons détecté à CTCF, dont il a été démontré que la variation génétique locale modifie les schémas de méthylation de l'ADN à distance dans le sang total [65]. Nous montrons qu'un CTCF Le variant (rs7203742) régule la méthylation de l'ADN de 30 CpG distants, dont 40 % sont méthylés de manière différentielle entre les populations. Nous avons également constaté que tous CTCF transLes CpG régulés relèvent d'un TFBS, confirmant notre hypothèse initiale sur le mécanisme par lequel une variante génétique pourrait altérer la méthylation de l'ADN sur un site CpG distant. Fait intéressant, 9 sur 30 CTCF trans-les CpG réglementés relèvent d'un TFBS de CTCF, tandis que les 21 autres relèvent d'un TFBS spécifique à d'autres TF tels que AA1, ESR1, ou ZNF143. Cette observation est cohérente avec un modèle d'activité du facteur de transcription pionnier [96] et suggère que CTCF agit comme un facteur pionnier qui générera des changements dans l'état de la chromatine qui, à leur tour, deviendront accessibles pour la liaison de facteurs secondaires.

Au niveau du génome, nous constatons que l'impact quantitatif de la méthylation de l'ADN sur la variation de l'expression génique est inférieur à celui rapporté par certaines études précédentes, reflétant peut-être des différences dans les paramètres expérimentaux et la puissance statistique (par exemple, les types de cellules et la taille des échantillons) [23 , 65, 84, 89]. Par exemple, une étude portant sur 204 nouveau-nés en bonne santé a détecté une variation substantielle à travers les tissus du nombre de gènes dont les niveaux d'expression étaient associés à la méthylation de l'ADN, allant de 596 dans les fibroblastes à 3838 dans les cellules T [23]. Nous avons détecté, à l'état non stimulé, 811 gènes eQTM (6% du nombre total de gènes exprimés), un chiffre qui tombe à 230 pour les gènes reQTM dans toutes les conditions de stimulation. Cependant, une limitation de notre étude est que nous avons mesuré la méthylation de l'ADN à l'état basal, alors que l'expression des gènes a été obtenue après 6 h. Des études comprenant une gamme plus complète de marques épigénétiques obtenues à différents moments - dans différents types de cellules et tissus provenant d'individus d'ascendances diverses - sont nécessaires pour comprendre plus précisément l'interaction entre ces éléments régulateurs et quantifier leurs rôles respectifs dans la régulation de la transcription. activité.

Les eQTM détectés se sont avérés considérablement enrichis en contrôle génétique (OU

33.2, P < 1 × 10 −326 , Fig. 3c), qui met en évidence l'action coordonnée des facteurs génétiques et épigénétiques dans la variation de l'expression des gènes mais soulève des questions sur le rôle causal de la méthylation de l'ADN [56]. Bien qu'une interprétation prudente de la causalité dans les analyses de médiation soit nécessaire [97], notre analyse fournit une première estimation du rôle direct potentiel de la méthylation de l'ADN dans la régulation de l'activité transcriptionnelle, à la fois dans les monocytes au repos et stimulés. A l'état non stimulé, on trouve que

20% des gènes eQTM montrent des preuves d'un effet de médiation causale de la méthylation de l'ADN. Bien qu'une mesure similaire de médiation ait été trouvée lors de la stimulation immunitaire (

17%), nous avons détecté des schémas spécifiques lors du traitement avec des provocations virales, où une occurrence plus élevée d'associations positives a été observée parmi les cas médiés. Ces résultats reflétaient principalement des cas où des niveaux élevés de méthylation de l'ADN étaient associés à une faible expression génique dans la condition non stimulée, nécessitant ainsi des réponses plus fortes pour atteindre des niveaux élevés d'expression génique lors d'une perturbation cellulaire. Ces tendances suggèrent un rôle majeur, direct et spécifique au contexte de la méthylation de l'ADN dans la régulation des réponses immunitaires, dont la complexité nécessite une étude plus approfondie.

Enfin, nous avons constaté que les meQTL, en particulier ceux associés aux différences liées à l'ascendance, sont enrichis en hits GWAS liés aux troubles immunitaires. Cela suggère que la méthylation de l'ADN a un impact important sur l'activité cellulaire des monocytes et affecte finalement les résultats phénotypiques. Néanmoins, une grande partie de la variance de la méthylation de l'ADN et de l'expression des gènes reste inexpliquée. Des travaux supplémentaires sont nécessaires pour quantifier l'impact relatif des facteurs génétiques, épigénétiques, environnementaux et liés au mode de vie dans la variation de la méthylation de l'ADN et de l'expression des gènes, à la fois dans les cellules au repos et stimulées. De plus, bien que les analyses de médiation causale présentées dans cette étude renforcent l'idée que la méthylation de l'ADN peut jouer un rôle direct dans la régulation de l'expression des gènes chez l'homme [23, 98], le suivi de la cinétique de variation de la méthylation de l'ADN et de l'expression des gènes après exposition à différents agents élargiront notre compréhension de l'interaction entre ces phénotypes moléculaires et leur impact sur les phénotypes de point final.


Conclusion

Avec la combinaison de la biochimie, de la biologie des cellules musculaires et de l'utilisation d'animaux modèles, les informations génétiques moléculaires ont permis de mieux comprendre le mécanisme pathologique des dystrophies musculaires. Comme nous l'avons vu, la perturbation génétique primaire ou secondaire fonctionnelle de la liaison matrice-membrane plasmique semble être la cause de plusieurs formes de dystrophies musculaires. La propriété mécanique du muscle squelettique est maintenue par des éléments contractiles et des éléments élastiques, qui sont fournis par le sarcomère et la matrice extracellulaire, respectivement. De plus, la transmission latérale de la force contractile est médiée par l'interaction matrice-récepteur. Ainsi, sur la base du fait que la liaison matrice-cytosquelette est une clé pour le maintien de la fonction musculaire squelettique, plusieurs stratégies thérapeutiques ont été proposées telles qu'elles ont été introduites dans cette revue et par d'autres. Espérons que de telles approches contribueront à une meilleure compréhension de l'étiologie de la maladie et conduiront à des stratégies thérapeutiques appropriées pour traiter les dystrophies musculaires.


Conclusion

Les PCWDE obtenus à l'origine par les coléoptères à partir de bactéries et de champignons via HGT ont permis une digestion efficace et indépendante des symbiotes de la biomasse végétale, la source de glucides la plus abondante sur Terre. Nous proposons que cette innovation clé a facilité l'évolution d'habitudes d'alimentation des plantes particulièrement spécialisées, telles que l'extraction de feuilles et de graines et le forage de tiges et de bois, et probablement aussi certaines formes d'alimentation spécialisée en champignons, par exemple la culture de champignons à Platypodinae et Scolytinae (67) . Bien que cela reste incertain, l'apparition et l'expansion de PCWDE et d'invertases putatifs dans les génomes des coléoptères sont corrélées à des augmentations significatives du taux de diversification parmi les coléoptères herbivores spécialisés (Buprestoidea et Phytophaga). Nos résultats peuvent aider à expliquer la disparité dans le degré de spécialisation alimentaire et de richesse spécifique observée parmi les groupes de coléoptères herbivores possédant ou n'ayant pas un répertoire diversifié de PCWDE, ainsi que l'existence de groupes de coléoptères qui se nourrissent de plantes (notamment les angiospermes) mais ne sont pas exceptionnellement riches en espèces. Les PCWDE obtenus à l'origine via HGT ont probablement joué un rôle important dans le rayonnement adaptatif d'autres groupes d'insectes herbivores, par exemple certains lépidoptères et hémiptères, qui possèdent au moins certaines de ces familles de gènes (8, 14, 68).

L'extraordinaire diversité des coléoptères semble donc avoir résulté de plusieurs facteurs, notamment un faible taux d'extinction de la lignée au cours d'une longue histoire évolutive (2, 5), la codiversification avec des angiospermes (2) et le rayonnement adaptatif de coléoptères herbivores spécialisés suivant une convergence horizontale. transfers (and “domestication”) of microbial genes encoding PCWDEs. More broadly, our findings show how large-scale genomic data can reveal new insights into the evolution and genomic basis of insect biodiversity and underscore the intimacy and complexity of the relationships between insects, plants, and microorganisms, as well as their concerted roles in the “origins of terrestrial organic diversity” (60).


Remerciements

We thank Dr. Karsten Zengler and Marc Abrams for reviewing the manuscript and providing constructive suggestions. This work was supported by NIH Grants AI124316 and GM057089, and Novo Nordisk Foundation Grant NNF10CC1016517. We are grateful to Drs. Rebecca Lindsey, Nancy Strockbine, Shi Chen, Sang Jun Lee, Dana Boyd, Mehmet Berkmen, Henning Sørum, David Rozak, Shannon Lyn Johnson, Craig Winstanely, Roger Johnson, and Weihua Huang for generously providing bacterial strains for this study.


Voir la vidéo: Maladies génétiques 2 partie page 5 (Décembre 2021).