Informations

9.4 : Microévolution - Biologie


Jours d'école

À l'exception de leurs glacières en plastique, vous pourriez penser que cette photo d'enfants sur le chemin de l'école date des années 1800. En fait, la photo est une photographie qui a été prise en 2006. Les enfants font partie d'une communauté religieuse appelée les Amish, dont les fondateurs sont arrivés aux États-Unis dans les années 1700. Les Amish évitent les commodités modernes telles que l'électricité et les automobiles. Leurs vies sont plus similaires à celles de leurs fondateurs qu'à celles de la plupart des autres personnes aux États-Unis aujourd'hui. Comme vous l'apprendrez en lisant ce concept, les Amish sont un exemple d'une manière dont les populations peuvent évoluer.

Gènes dans les populations

Les individus n'évoluent pas parce que leurs gènes ne changent pas avec le temps. UNE population se compose d'organismes de la même espèce qui vivent dans la même région. En termes d'évolution, la population est supposée être un groupe relativement fermé. Cela signifie que la plupart des accouplements ont lieu au sein de la population. Le changement évolutif qui se produit sur des périodes de temps relativement courtes au sein des populations est appelé microévolution. La science qui se concentre sur l'évolution au sein des populations est génétique des populations. C'est une combinaison de la théorie de l'évolution et de la génétique mendélienne.

Le pool de gènes

La constitution génétique d'un individu est le génotype de l'individu. Une population est constituée de plusieurs individus et donc de plusieurs génotypes. Tous les génotypes constituent le pool génétique de la population. Les pool génétique se compose de tous les gènes de tous les membres de la population. Pour chaque gène, le pool génétique comprend tous les différents allèles du gène existant dans la population. Un allèle est appelé une version d'un gène. Pour un gène donné, la population est caractérisée par la fréquence des différents allèles du pool génétique. Fréquence allélique est la fréquence à laquelle un allèle apparaît dans un pool génétique par rapport aux autres allèles pour le même gène.

Forces d'évolution

Les facteurs qui provoquent le changement des fréquences alléliques sont appelés les forces d'évolution. Ces forces sont au nombre de quatre : la mutation, le flux génétique, la dérive génétique et la sélection naturelle.

Dérive génétique

La dérive génétique est un changement aléatoire des fréquences alléliques qui se produit dans une petite population. Lorsqu'un petit nombre de parents ne produisent que quelques descendants, les fréquences alléliques chez les descendants peuvent différer, par hasard, des fréquences alléliques chez les parents. C'est comme lancer une pièce. Si vous lancez une pièce seulement quelques fois, vous pouvez, par hasard, obtenir plus ou moins que les 50 pour cent de face et 50 pour cent de face attendus. En raison de ces variations aléatoires dans les petites populations, les fréquences alléliques dérivent avec le temps.

Il existe deux conditions particulières dans lesquelles la dérive génétique se produit. On les appelle l'effet de goulot d'étranglement et l'effet fondateur.

  1. L'effet de goulot d'étranglement se produit lorsqu'une population devient soudainement beaucoup plus petite. Cela peut se produire en raison d'une catastrophe naturelle telle qu'un incendie de forêt ou une épidémie de maladie. Par chance, les fréquences alléliques des survivants peuvent être différentes de celles de la population d'origine.
  2. L'effet fondateur se produit lorsque quelques individus commencent ou fondent une nouvelle population. Par chance, les fréquences alléliques des fondateurs peuvent être différentes des fréquences alléliques de la population qu'ils ont quittée. Un exemple de l'effet fondateur s'est produit dans les Amish, comme décrit dans la figure (PageIndex{2}).

Mutation

La mutation crée une nouvelle variation génétique dans un pool génétique. C'est ainsi que tous les nouveaux allèles apparaissent pour la première fois. Chez les espèces à reproduction sexuée, les mutations importantes pour l'évolution sont celles qui se produisent dans les gamètes. Seules ces mutations peuvent être transmises à la descendance. Pour un gène donné, le risque qu'une mutation se produise dans un gamète donné est très faible. Ainsi, les mutations seules n'ont pas beaucoup d'effet sur les fréquences alléliques. Cependant, les mutations fournissent la variation génétique nécessaire pour que d'autres forces de l'évolution agissent.

Flux de gènes

Le flux de gènes se produit lorsque des individus entrent ou sortent d'une population. Si le taux de migration est élevé, cela peut avoir un effet significatif sur les fréquences alléliques. Les fréquences alléliques peuvent changer dans la population que les migrants quittent ainsi que dans la population dans laquelle les migrants entrent. Un exemple de flux de gènes s'est produit pendant la guerre du Vietnam dans les années 1960 et 1970. De nombreux jeunes militaires américains ont eu des enfants avec des femmes vietnamiennes. La plupart des militaires sont retournés aux États-Unis après la guerre. Cependant, ils ont laissé des copies de leurs gènes dans leur progéniture. De cette façon, ils ont modifié les fréquences alléliques dans le pool génétique vietnamien. Pensez-vous que le pool génétique des États-Unis a également été affecté? Pourquoi ou pourquoi pas?

Sélection naturelle

La sélection naturelle se produit lorsqu'il existe des différences de fitness entre les membres d'une population. En conséquence, certains individus transmettent plus de gènes à la génération suivante que d'autres membres de la population. Cela fait changer les fréquences alléliques au fil du temps. L'exemple de l'anémie falciforme, qui est montré dans le tableau suivant et décrit ci-dessous, montre comment la sélection naturelle peut conserver même un allèle nocif dans un pool génétique.

Tableau (PageIndex{1}) : Anémie falciforme et sélection naturelle
GénotypePhénotypeAptitude
AA100% d'hémoglobine normaleForme physique légèrement réduite en raison de l'absence de résistance au paludisme
COMMEAssez d'hémoglobine normale pour prévenir l'anémie falciformeMeilleure forme physique en raison de la résistance au paludisme
SS100% d'hémoglobine anormale, provoquant une anémie falciformeRemise en forme considérablement réduite en raison de l'anémie falciforme

L'allèle (S) pour la drépanocytose est un allèle autosomique récessif nocif. Elle est causée par une mutation de l'allèle normal (UNE) pour l'hémoglobine (la protéine transportant l'oxygène sur les globules rouges). Le paludisme est une maladie tropicale mortelle qui est courante dans de nombreuses populations africaines. Hétérozygotes (COMME) avec l'allèle drépanocytaire sont résistants au paludisme. Par conséquent, ils sont plus susceptibles de survivre et de se reproduire. Cela garde le S allèle dans le pool génétique.

L'exemple de la drépanocytose montre que la fitness dépend des phénotypes et aussi de l'environnement. Que pensez-vous qui pourrait arriver si le paludisme était éliminé dans une population africaine avec une fréquence relativement élevée de la S allèle ? Comment la fitness des différents génotypes pourrait-elle changer ? Comment cela peut-il affecter la fréquence des S allèle ?

Le trait drépanocytaire est contrôlé par un seul gène. La sélection naturelle pour les traits polygéniques, qui sont contrôlés par plusieurs gènes, est plus complexe, bien qu'elle soit moins compliquée si l'on considère uniquement les phénotypes pour les traits polygéniques plutôt que les génotypes. La sélection naturelle peut affecter la distribution des phénotypes d'un trait polygénique de trois manières principales. Les trois manières sont illustrées dans les graphiques de la figure (PageIndex{3}).

  1. Sélection perturbatrice se produit lorsque les phénotypes du milieu de la fourchette sont sélectionnés. Il en résulte deux phénotypes qui se chevauchent, un à chaque extrémité de la distribution. Un exemple est un dimorphisme sexuel. Cela fait référence aux différences entre les phénotypes des mâles et des femelles de la même espèce. Chez l'homme, par exemple, les hommes et les femmes ont des tailles moyennes et des formes corporelles différentes.
  2. Sélection stabilisatrice se produit lorsque les phénotypes aux deux extrémités de la distribution phénotypique sont sélectionnés. Cela réduit la plage de variation. Un exemple est le poids humain à la naissance. Les bébés qui sont très gros ou très petits à la naissance ont moins de chances de survivre, ce qui maintient le poids à la naissance dans une fourchette relativement étroite.
  3. Sélection directionnelle se produit lorsque l'un des deux phénotypes extrêmes est sélectionné. Cela déplace la distribution vers cet extrême. C'est le type de sélection naturelle que les Grant ont observé dans la taille du bec des pinsons des Galápagos. Des becs plus gros ont été sélectionnés pour les périodes de sécheresse, de sorte que la taille du bec a augmenté avec le temps.

Dossier : La biologie humaine dans l'actualité

Des recherches récemment rapportées pourraient aider à résoudre l'un des mystères les plus importants et les plus durables de la biologie humaine. Le mystère est pourquoi les gens avec le COMME génotype de l'hémoglobine drépanocytaire sont protégés contre le paludisme. Comme vous l'avez lu ci-dessus, leur hémoglobine drépanocytaire leur confère une meilleure condition physique dans les zones impaludées que les homozygotes normaux (AA) qui n'ont que de l'hémoglobine normale.

Le parasite du paludisme et son vecteur moustique ont été découverts à la fin des années 1800. La base génétique de la drépanocytose et de la résistance au paludisme qu'elle confère ont été découvertes vers 1950. Depuis lors, les scientifiques ont supposé, et certaines preuves ont suggéré, que les quelques globules rouges en forme de faucille des hétérozygotes en font des hôtes moins hospitaliers pour le parasite du paludisme que les globules rouges tout à fait normaux de AA homozygotes. Cela semble être une hypothèse raisonnable, mais est-ce la bonne ? La nouvelle recherche suggère une hypothèse différente.

En travaillant avec des souris génétiquement modifiées comme organismes modèles, des chercheurs portugais ont découvert qu'une enzyme qui produit le monoxyde de carbone gazeux est exprimée à des niveaux beaucoup plus élevés en présence d'hémoglobine drépanocytaire que l'hémoglobine normale. De plus, le gaz semble protéger l'hôte infecté du développement des lésions et des symptômes du paludisme, même s'il ne semble pas interférer avec le cycle de vie du parasite du paludisme dans les globules rouges. Ces découvertes pourraient conduire à de nouvelles thérapies pour le traitement du paludisme, qui reste l'un des problèmes de santé publique les plus graves au monde. Les résultats peuvent également faire la lumière sur d'autres variantes anormales de l'hémoglobine qui sont connues pour protéger contre le paludisme.

Revoir

  1. Pourquoi les populations, plutôt que les individus, sont-elles les unités d'évolution ?
  2. Qu'est-ce qu'un pool génétique ?
  3. Énumérez et définissez les quatre forces de l'évolution.
  4. Pourquoi une mutation est-elle nécessaire pour que l'évolution se produise, même si elle a généralement peu d'effet sur les fréquences alléliques ?
  5. Quel est l'effet fondateur ? Donne un exemple.
  6. Identifier trois types de sélection naturelle pour les caractères polygéniques.
  7. Expliquez pourquoi la dérive génétique est plus susceptible de se produire dans une très petite population.
  8. Chez certaines espèces, les femelles préfèrent s'accoupler avec des mâles qui ont certaines caractéristiques génétiquement déterminées, telles qu'une coloration vive ou une grande queue voyante. Comment cela va-t-il modifier la fréquence des allèles dans une population ?
  9. Lequel des éléments suivants peut provoquer une dérive génétique ?
    1. Une catastrophe naturelle
    2. Une grande population où les membres s'accouplent les uns avec les autres et aussi avec les nouveaux migrants qui entrent dans la population.
    3. Une île sans oiseaux qui devient peuplée par un petit nombre d'espèces d'oiseaux.
    4. A et C
  10. Vrai ou faux. Les fréquences alléliques peuvent changer au sein d'un organisme.
  11. Vrai ou faux. La plupart des populations sur Terre sont en équilibre Hardy-Weinberg.
  12. Vrai ou faux. La fréquence des génotypes peut changer s'il y a une migration vers ou hors de la population.

Microévolution

Microévolution est le changement dans les fréquences alléliques qui se produisent au fil du temps au sein d'une population. [1] Ce changement est dû à quatre processus différents : la mutation, la sélection (naturelle et artificielle), le flux de gènes et la dérive génétique.

La génétique des populations est la branche de la biologie qui fournit la structure mathématique pour l'étude du processus de microévolution. La génétique écologique s'occupe d'observer la microévolution dans la nature. En règle générale, les instances d'évolution observables sont des exemples de microévolution, par exemple des souches bactériennes résistantes aux antibiotiques.

La microévolution au fil du temps peut conduire à la spéciation ou à l'apparition d'une nouvelle structure, parfois classée comme macroévolution. [2] Macro et microévolution décrivent des processus fondamentalement identiques à des échelles différentes [2] [3] mais ils ne sont pas exactement la même chose. [4] [5]


Mémoires de recherche présentés au CNB-MAC 2019

Après l'atelier, dix articles de recherche originaux [1,2,3,4,5,6,7,8,9,10] ont été acceptés pour publication dans les revues partenaires du CNB-MAC 2019 : BMC Bioinformatique et BMC Génomique. Dans ce qui suit, nous fournissons un bref résumé de ces articles sélectionnés.

Les haplotypes, les listes ordonnées de variations de nucléotides uniques qui distinguent les séquences chromosomiques de leurs paires homologues, peuvent révéler la susceptibilité d'un individu aux maladies héréditaires et complexes et affecter la façon dont notre corps répond aux médicaments thérapeutiques. La reconstruction des haplotypes d'un individu à partir de courtes lectures de séquençage est un problème NP-difficile qui devient encore plus difficile dans le cas des polyploïdes. Bien que l'augmentation des longueurs de lectures de séquençage et des tailles d'insertion contribue à améliorer la précision de la reconstruction, elle exacerbe également la complexité de calcul de la tâche d'assemblage d'haplotypes. Cela a motivé la recherche de cadres algorithmiques capables d'un assemblage précis mais efficace d'haplotypes à partir de données de séquençage à haut débit. Sankararaman, Vikalo et Baccelli [1] proposent une nouvelle représentation graphique des lectures de séquençage et posent le problème d'assemblage d'haplotypes comme une instance de détection de communauté sur un graphe aléatoire spatial. À cette fin, un graphe spatial où chaque lecture est un nœud avec une étiquette de communauté inconnue associant la lecture à l'haplotype à partir duquel il échantillonne est construit. La reconstruction de l'haplotype est ensuite réalisée par une procédure en deux étapes : d'abord, les étiquettes de communauté sur les nœuds (c'est-à-dire les lectures) sont récupérées, puis ces étiquettes estimées sont utilisées pour assembler les haplotypes. Sur la base de cette observation, ComHapDet a développé un nouvel algorithme d'assemblage pour les haplotypes diploïdes et ployploïdes, qui permet à la fois des variantes biallèles et multi-alléliques.

La maturation d'affinité des lymphocytes B est un processus de microévolution qui permet au système immunitaire de générer des anticorps de haute affinité et de développer une grande diversité des répertoires d'immunoglobulines. Ce processus de microévolution peut être décrit par des arbres de lignée construits à partir de données de séquençage BCR (récepteur d'immunoglobuline des cellules B). Yang et al. [2] présentent un nouvel algorithme nommé GLaMST (Grow Lineages Along Minimum Spanning Tree) pour construire de tels arbres de lignage. Grâce à des données simulées et réelles, GLaMST surpasse les algorithmes existants en termes d'efficacité et de précision. L'intégration de GLaMST dans les cadres d'analyse de séquençage BCR existants peut considérablement améliorer l'analyse de séquençage BCR de l'aspect de reconstruction de l'arbre de lignage.

Lee et Kimmel [3] proposent que les réseaux G et les réseaux d'automates stochastiques (SAN) sont utiles pour identifier un ensemble de gènes qui jouent un rôle important dans un système d'intérêt et pour estimer leur corrélation. Leur étude utilise les distributions stationnaires et transitoires de G-Networks pour détecter des gènes statistiquement significatifs associés aux mécanismes de maintenance des télomères (TMM), essentiels à l'immortalisation des populations cellulaires. Un nouvel algorithme basé sur les SAN est introduit pour montrer comment la corrélation entre deux gènes d'intérêt varie dans l'état transitoire avec différentes TMM et différentes conditions cellulaires. Cette analyse élargit la connaissance des détails du contrôle génétique des MMT.

Dans [4], Dadaneh et al. proposent un modèle binomial gamma-négatif entièrement génératif (hGNB) pour extraire des représentations en basse dimension des données de séquençage d'ARN unicellulaire (scRNA-seq). Le modèle hGNB proposé peut naturellement tenir compte des effets des covariables au niveau des gènes et des cellules pour identifier les représentations latentes complexes des données scRNA-seq, sans qu'il soit nécessaire de modéliser explicitement l'inflation zéro dans les données scRNA-seq ou les étapes de pré-traitement couramment adoptées, y compris la normalisation dans nombreuses méthodes existantes. En exploitant la conjugaison conditionnelle via de nouvelles techniques d'augmentation des données, hGNB possède une inférence de modèle bayésienne efficace avec des équations de mise à jour d'échantillonnage de Gibbs sous forme fermée. Les résultats expérimentaux sur les données simulées et sur plusieurs ensembles de données scRNA-seq du monde réel montrent que le hGNB est un outil puissant pour la découverte d'amas cellulaires ainsi que pour l'inférence de lignée cellulaire.

Progression du cycle cellulaire dans C. croissant nécessite une coordination précise des activités cellulaires métaboliques et morphologiques. Le réseau de messagers à base de nucléotides de guanine, y compris c-di-GMP et (p) ppGpp, joue un rôle important dans le contrôle des métabolismes et de la morphologie, tels que la régulation de l'activité de CtrA, la décision de transition entre les cellules mobiles et non mobiles et l'adaptation des cellules aux changements environnementaux. Xu et al. [5] proposent un modèle mathématique pour C. croissant capturer la dynamique du c-di-GMP et (p) ppGpp et relier le deuxième réseau de messagers à la réponse environnementale via un système PTS à l'azote. Leurs simulations sont cohérentes avec les observations expérimentales et suggèrent des voies potentielles sur la disponibilité des nutriments influençant le cycle cellulaire de C. croissant.

L'identification de gènes essentiels dans les bactéries permet non seulement aux scientifiques de la vie de déterminer l'ensemble de gènes essentiels à la survie d'un organisme, mais peut également fournir des cibles pour les médicaments antimicrobiens/antibiotiques et la création de génomes artificiels autonomes. DeeplyEssential [6] s'appuie sur une architecture de réseau de neurones profonds pour l'identification des gènes essentiels bactériens exclusivement à partir de la séquence d'ADN primaire, maximisant ainsi la praticité de l'outil.

L'avènement du Hi-C unicellulaire apporte un nouveau type d'information fréquentielle, le nombre de cellules individuelles avec des interactions de chromatine entre deux régions chromosomiques disjointes, qui est ignoré dans la recherche sur les interactions interchromosomiques. Bulathsinghalage et Liu [7] proposent un outil informatique pour identifier les régions présentant des interactions interchromosomiques statistiquement fréquentes à une résolution unicellulaire. Ils démontrent que l'outil utilisant des réseaux et des tests statistiques binomiaux peut identifier des régions structurelles intéressantes grâce à la visualisation, la comparaison et l'analyse d'enrichissement et il prend également en charge différentes configurations pour offrir aux utilisateurs une flexibilité.

TCGA (The Cancer Genome Atlas) est une merveilleuse ressource de données pour développer des algorithmes et des modèles pour une meilleure compréhension des cancers. Clayton et al. [8] intègrent les données d'expression génique, les données de traitement médicamenteux et les données de survie des patients dans la TCGA, et développent des modèles d'apprentissage automatique pour prédire si un patient répondra positivement ou négativement à deux chimiothérapies : le 5-Fluorouracile et la Gemcitabine. Les résultats montrent des précisions de prédiction allant jusqu'à 86 %, et les gènes les plus informatifs pour les modèles sont enrichis en voies de signalisation du cancer bien connues. Dans l'ensemble, cette analyse intégrative démontre l'utilité des données de traitement médicamenteux, qui est un aspect sous-exploré par rapport aux autres aspects génomiques disponibles via TCGA.

Zengin et Önal-Süzek [9] proposent un pipeline R réutilisable et open-source pour la découverte de signatures pronostiques par l'intégration de plusieurs dimensions de l'ensemble de données TCGA Lung cancer (LUAD). Les auteurs génèrent 4 catégories de gènes différentes en utilisant les SNV, CNV, DEG et DEG de sous-réseau actifs significatifs. Le modèle multivarié de risques proportionnels de Cox avec la pénalité de Lasso et LOOCV est utilisé pour identifier la meilleure signature génétique parmi les catégories de gènes. Les auteurs élucident une signature de 12 gènes (BCHE, CCNA1, CYP24A1, DEPTOR, MASP2, MGLL, MYO1A, PODXL2, RAPGEF3, SGK2, TNNI2, ZBTB16) pour la prédiction du risque pronostique basée sur le temps de survie global des patients atteints d'adénocarcinome pulmonaire. Lorsque les patients sont regroupés dans des groupes à haut et à faible risque avec le cadre proposé, l'analyse de survie montre des résultats hautement significatifs pour les ensembles de données d'entraînement (55 patients TCGA LUAD) et de test (442 patients TCGA LUAD).

Alors que de nombreuses études ont tenté de combiner les informations du réseau de gènes avec l'expression des gènes pour prédire les résultats du cancer, la question de savoir si une telle combinaison fournit réellement une prédiction plus précise et identifie des biomarqueurs plus robustes est complexe en raison de la configuration expérimentale sophistiquée de différentes études. Adnan et al. [10] proposent un modèle simple basé sur les bords pour prédire les métastases du cancer du sein en utilisant l'interaction protéine-protéine et les réseaux de co-expression génique. À l'aide de plusieurs mesures d'évaluation sur 12 cohortes de patientes atteintes d'un cancer du sein, leur évaluation rigoureuse montre que la prédiction basée sur les bords est systématiquement plus performante que l'expression génique seule dans les classificateurs de forêt aléatoire et de régression logistique, et que la méthode simple surpasse plusieurs méthodes existantes basées sur le réseau avec une signification statistique. . De plus, avec une nouvelle procédure pour obtenir des caractéristiques importantes à partir de modèles de forêts aléatoires, ils montrent que les caractéristiques de lisière sont beaucoup plus robustes que les caractéristiques génétiques et que les principaux biomarqueurs des caractéristiques de lisière sont statistiquement plus significativement enrichis dans les processus biologiques qui sont bien connus pour être liés aux métastases du cancer du sein.


Les quatre processus

Mutation

Les mutations sont des changements dans la séquence d'ADN du génome d'une cellule et sont causées par des radiations, des virus, des transposons et des produits chimiques mutagènes, ainsi que des erreurs qui se produisent pendant la méiose ou la réplication de l'ADN. [ 2 ] [ 3 ] [ 4 ] Des erreurs s'introduisent particulièrement souvent dans le processus de réplication de l'ADN, dans la polymérisation du deuxième brin. Ces erreurs peuvent également être induites par l'organisme lui-même, par des processus cellulaires tels que l'hypermutation.

Au cours du processus de réplication de l'ADN, des erreurs se produisent parfois dans la polymérisation du deuxième brin. Ces erreurs, appelées mutations, peuvent avoir un impact sur le phénotype d'un organisme, surtout si elles se produisent dans la séquence codant pour la protéine d'un gène. Les taux d'erreur sont généralement très faibles – 1 erreur sur 10 à 100 millions de bases – en raison de la capacité de « relecture » ​​des ADN polymérases. [ 5 ] [ 6 ] (Sans les taux d'erreur de relecture sont mille fois plus élevés, car de nombreux virus reposent sur des polymérases d'ADN et d'ARN qui manquent de capacité de relecture, ils connaissent des taux de mutation plus élevés.) Les processus qui augmentent le taux de changements dans l'ADN sont appelés mutagènes : mutagènes les produits chimiques favorisent des erreurs dans la réplication de l'ADN, souvent en interférant avec la structure de l'appariement des bases, tandis que le rayonnement UV induit des mutations en endommageant la structure de l'ADN. [ 7 ] Les dommages chimiques à l'ADN se produisent également naturellement, et les cellules utilisent des mécanismes de réparation de l'ADN pour réparer les mésappariements et les ruptures de l'ADN. Néanmoins, la réparation échoue parfois à ramener l'ADN à sa séquence d'origine.

Dans les organismes qui utilisent le croisement chromosomique pour échanger de l'ADN et recombiner des gènes, des erreurs d'alignement pendant la méiose peuvent également provoquer des mutations. [ 8 ] Les erreurs de croisement sont particulièrement probables lorsque des séquences similaires amènent les chromosomes partenaires à adopter un alignement erroné, ce qui rend certaines régions des génomes plus susceptibles de muter de cette manière. Ces erreurs créent d'importants changements structurels dans la séquence d'ADN—duplications, inversions ou suppressions de régions entières, ou échange accidentel de parties entières entre différents chromosomes (appelé translocation).

Les mutations peuvent avoir un impact sur le phénotype d'un organisme, surtout si elles se produisent dans la séquence codant pour la protéine d'un gène. Les taux d'erreur sont généralement très faibles - 1 erreur sur 10 160 millions à 100 millions de bases - en raison de la capacité de « relecture » ​​des ADN polymérases. [ 5 ] [ 6 ] Sans relecture, les taux d'erreur sont mille fois plus élevés. Les dommages chimiques à l'ADN se produisent également naturellement, et les cellules utilisent des mécanismes de réparation de l'ADN pour réparer les mésappariements et les ruptures de l'ADN. Néanmoins, la réparation échoue parfois à ramener l'ADN à sa séquence d'origine.

La mutation peut entraîner plusieurs types de changements dans les séquences d'ADN, qui peuvent soit n'avoir aucun effet, soit altérer le produit d'un gène, soit empêcher le gène de fonctionner. Études à la mouche Drosophila melanogaster suggèrent que si une mutation modifie une protéine produite par un gène, cela sera probablement nocif, avec environ 70 pour cent de ces mutations ayant des effets néfastes, et le reste étant neutre ou faiblement bénéfique. [ 9 ] En raison des effets dommageables que les mutations peuvent avoir sur les cellules, les organismes ont développé des mécanismes tels que la réparation de l'ADN pour éliminer les mutations. [ 2 ] Par conséquent, le taux de mutation optimal pour une espèce est un compromis entre les coûts d'un taux de mutation élevé, tels que les mutations délétères, et les coûts métaboliques du maintien de systèmes pour réduire le taux de mutation, tels que les enzymes de réparation de l'ADN. [ 10 ] Les virus qui utilisent l'ARN comme matériel génétique ont des taux de mutation rapides, [ 11 ] ce qui peut être un avantage car ces virus évolueront constamment et rapidement, et échapperont ainsi aux réponses défensives de, par ex. le système immunitaire humain. [ 12 ]

Les mutations peuvent impliquer la duplication de grandes sections d'ADN, généralement par recombinaison génétique. [ 13 ] Ces duplications sont une source majeure de matière première pour l'évolution de nouveaux gènes, avec des dizaines à des centaines de gènes dupliqués dans les génomes animaux tous les millions d'années. [ 14 ] La plupart des gènes appartiennent à de plus grandes familles de gènes d'ascendance partagée. [ 15 ] Les nouveaux gènes sont produits par plusieurs méthodes, généralement par duplication et mutation d'un gène ancestral, ou par recombinaison de parties de différents gènes pour former de nouvelles combinaisons avec de nouvelles fonctions. [ 16 ] [ 17 ]

Ici, les domaines agissent comme des modules, chacun avec une fonction particulière et indépendante, qui peuvent être mélangés pour produire des gènes codant pour de nouvelles protéines aux propriétés inédites. [ 18 ] Par exemple, l'œil humain utilise quatre gènes pour créer des structures qui détectent la lumière : trois pour la vision des couleurs et un pour la vision nocturne, tous les quatre sont issus d'un seul gène ancestral. [ 19 ] Un autre avantage de la duplication d'un gène (ou même d'un génome entier) est que cela augmente la redondance, ce qui permet à un gène de la paire d'acquérir une nouvelle fonction tandis que l'autre copie remplit la fonction d'origine. [ 20 ] [ 21 ] D'autres types de mutation créent occasionnellement de nouveaux gènes à partir d'ADN auparavant non codant. [ 22 ] [ 23 ]

Sélection

Sélection est le processus par lequel les traits héréditaires qui augmentent les chances de survie et de reproduction d'un organisme deviennent plus courants dans une population au cours des générations successives.

Il est parfois utile de faire la distinction entre la sélection naturelle, la sélection naturelle et la sélection qui est une manifestation des choix faits par les humains, la sélection artificielle. Cette distinction est assez diffuse. La sélection naturelle est néanmoins la partie dominante de la sélection.

La variation génétique naturelle au sein d'une population d'organismes signifie que certains individus survivront mieux que d'autres dans leur environnement actuel. Les facteurs qui affectent le succès de reproduction sont également importants, une question que Charles Darwin a développée dans ses idées sur la sélection sexuelle.

La sélection naturelle agit sur le phénotype, ou les caractéristiques observables d'un organisme, mais la base génétique (héritable) de tout phénotype qui donne un avantage reproductif deviendra plus courante dans une population (voir fréquence allélique). Au fil du temps, ce processus peut entraîner des adaptations qui spécialisent les organismes pour des niches écologiques particulières et peuvent éventuellement entraîner l'émergence de nouvelles espèces.

La sélection naturelle est l'une des pierres angulaires de la biologie moderne. Le terme a été introduit par Darwin dans son livre révolutionnaire de 1859 À propos de l'origine des espèces, [ 24 ] dans laquelle la sélection naturelle a été décrite par analogie à la sélection artificielle, un processus par lequel les animaux et les plantes avec des traits considérés comme souhaitables par les éleveurs humains sont systématiquement favorisés pour la reproduction. Le concept de sélection naturelle a été développé à l'origine en l'absence d'une théorie valide de l'hérédité au moment de l'écriture de Darwin, rien n'était connu de la génétique moderne. L'union de l'évolution darwinienne traditionnelle avec les découvertes ultérieures en génétique classique et moléculaire est appelée la synthèse évolutive moderne. La sélection naturelle reste la principale explication de l'évolution adaptative.

Dérive génétique

Dérive génétique est le changement dans la fréquence relative à laquelle une variante de gène (allèle) se produit dans une population en raison d'un échantillonnage aléatoire. C'est-à-dire que les allèles de la progéniture de la population sont un échantillon aléatoire de ceux des parents. Et le hasard a un rôle à jouer pour déterminer si un individu donné survit et se reproduit. La fréquence des allèles d'une population est la fraction ou le pourcentage de ses copies de gènes par rapport au nombre total d'allèles de gènes qui partagent une forme particulière. [ 25 ]

La dérive génétique est un processus évolutif qui entraîne des changements dans les fréquences alléliques au fil du temps. Cela peut entraîner la disparition complète des variantes génétiques et ainsi réduire la variabilité génétique. Contrairement à la sélection naturelle, qui rend les variantes génétiques plus ou moins courantes en fonction de leur succès de reproduction, [ 26 ] les changements dus à la dérive génétique ne sont pas dus à des pressions environnementales ou adaptatives, et peuvent être bénéfiques, neutres ou préjudiciables à la reproduction. Succès.

L'effet de la dérive génétique est plus important dans les petites populations et plus faible dans les grandes populations. De vifs débats font rage parmi les scientifiques sur l'importance relative de la dérive génétique par rapport à la sélection naturelle. Ronald Fisher a estimé que la dérive génétique joue tout au plus un rôle mineur dans l'évolution, et cela est resté le point de vue dominant pendant plusieurs décennies. En 1968, Motoo Kimura a ravivé le débat avec sa théorie neutre de l'évolution moléculaire qui prétend que la plupart des changements dans le matériel génétique sont causés par la dérive génétique. [ 27 ] Les prédictions de la théorie neutre, basées sur la dérive génétique, ne correspondent pas bien aux données récentes sur les génomes entiers : ces données suggèrent que les fréquences des allèles neutres changent principalement en raison de la sélection sur des sites liés, plutôt que du fait de la dérive génétique par des moyens d'erreur d'échantillonnage. [ 28 ]

Flux de gènes

Le flux de gènes est l'échange de gènes entre des populations, qui appartiennent généralement à la même espèce. [ 29 ] Des exemples de flux de gènes au sein d'une espèce incluent la migration puis la reproduction d'organismes, ou l'échange de pollen. Le transfert de gènes entre espèces comprend la formation d'organismes hybrides et le transfert horizontal de gènes.

La migration vers ou hors d'une population peut modifier les fréquences alléliques, ainsi qu'introduire une variation génétique dans une population. L'immigration peut ajouter du nouveau matériel génétique au pool génétique établi d'une population. Inversement, l'émigration peut éliminer du matériel génétique. Comme des barrières à la reproduction entre deux populations divergentes sont nécessaires pour que les populations deviennent de nouvelles espèces, le flux de gènes peut ralentir ce processus en propageant les différences génétiques entre les populations. Le flux de gènes est entravé par des chaînes de montagnes, des océans et des déserts ou même des structures artificielles telles que la Grande Muraille de Chine, qui a entravé le flux de gènes végétaux. [ 30 ]

Selon à quel point deux espèces ont divergé depuis leur ancêtre commun le plus récent, il peut encore leur être possible de produire une progéniture, comme avec les chevaux et les ânes qui s'accouplent pour produire des mules. [ 31 ] De tels hybrides sont généralement infertiles, car les deux ensembles différents de chromosomes sont incapables de s'apparier pendant la méiose. Dans ce cas, des espèces étroitement apparentées peuvent se croiser régulièrement, mais les hybrides seront sélectionnés contre et l'espèce restera distincte. Cependant, des hybrides viables se forment occasionnellement et ces nouvelles espèces peuvent soit avoir des propriétés intermédiaires entre leurs espèces parentes, soit posséder un phénotype totalement nouveau. [ 32 ] L'importance de l'hybridation dans la création de nouvelles espèces d'animaux n'est pas claire, bien que des cas aient été observés chez de nombreux types d'animaux, [ 33 ] la rainette grise étant un exemple particulièrement bien étudié. [ 34 ]

L'hybridation est cependant un moyen important de spéciation chez les plantes, car la polyploïdie (ayant plus de deux copies de chaque chromosome) est plus facilement tolérée chez les plantes que chez les animaux. [ 35 ] [ 36 ] La polyploïdie est importante chez les hybrides car elle permet la reproduction, les deux ensembles différents de chromosomes pouvant chacun s'apparier avec un partenaire identique pendant la méiose. [ 37 ] Les polyploïdes ont également plus de diversité génétique, ce qui leur permet d'éviter la dépression de consanguinité dans les petites populations. [ 38 ]

Le transfert horizontal de gènes est le transfert de matériel génétique d'un organisme à un autre organisme qui n'est pas sa progéniture, ce qui est le plus courant chez les bactéries. [ 39 ] En médecine, cela contribue à la propagation de la résistance aux antibiotiques, car lorsqu'une bactérie acquiert des gènes de résistance, elle peut rapidement les transférer à d'autres espèces. [ 40 ] Transfert horizontal de gènes des bactéries aux eucaryotes comme la levure Saccharomyces cerevisiae and the adzuki bean beetle Callosobruchus chinensis may also have occurred. [ 41 ] [ 42 ] An example of larger-scale transfers are the eukaryotic bdelloid rotifers, which appear to have received a range of genes from bacteria, fungi, and plants. [ 43 ] Viruses can also carry DNA between organisms, allowing transfer of genes even across biological domains. [ 44 ] Large-scale gene transfer has also occurred between the ancestors of eukaryotic cells and prokaryotes, during the acquisition of chloroplasts and mitochondria. [ 45 ]

Gene flow is the transfer of alleles from one population to another.

Migration into or out of a population may be responsible for a marked change in allele frequencies. Immigration may also result in the addition of new genetic variants to the established gene pool of a particular species or population.

There are a number of factors that affect the rate of gene flow between different populations. One of the most significant factors is mobility, as greater mobility of an individual tends to give it greater migratory potential. Animals tend to be more mobile than plants, although pollen and seeds may be carried great distances by animals or wind.

Maintained gene flow between two populations can also lead to a combination of the two gene pools, reducing the genetic variation between the two groups. It is for this reason that gene flow strongly acts against speciation, by recombining the gene pools of the groups, and thus, repairing the developing differences in genetic variation that would have led to full speciation and creation of daughter species.

For example, if a species of grass grows on both sides of a highway, pollen is likely to be transported from one side to the other and vice versa. If this pollen is able to fertilise the plant where it ends up and produce viable offspring, then the alleles in the pollen have effectively been able to move from the population on one side of the highway to the other.


2.10 Mechanisms of Evolution: Genetic Drift

Genetic drift occurs when a population experiences random fluctuations in frequencies of genetic traits. The term “random” is key to an understanding of drift. If any heritable variation leads to genetic changes in a population, natural selection has occurred. Drift has occurred if these changes are unrelated to any heritable feature possessed by individuals in the population. Sometimes, as a result of chance events, certain individuals do not reproduce, and the population evolves as a result of drift. While natural selection results from aspects of an organism’s environment exerting “selective pressure” on the individual (e.g., the desert environment favors the spines of the cactus and the long ears of the fox), drift, by definition, is not a result of environmental pressures. Drift is common to small populations, such as those that colonize islands or other isolated habitats, or those that remain after large-scale disruptions (e.g. earthquakes, fire). Think about it: the random loss of 20 iguanas from a large population of 1 million iguanas is bound to result in fewer overall genetic changes than is the random loss of 20 iguanas from an island population of 100 iguanas.

One form of drift is the founder effect, which results when a small part of a population (the “founders”) moves to a new location, and the small variety of genes of the founders mean that the new population is different from the original population. Ellis-van Creveld Syndrome (a form of dwarfism that involves short stature, extra fingers or toes, and possible heart defects) and several other genetic conditions that are typically rare in large populations, are common in the Pennsylvania Amish population in the United States because of drift—specifically, because of the founder effect. This group was founded relatively recently by a few individuals who presumably had genes for these conditions. The population has grown, but has not been subject to the diversifying effects of gene flow (that is, individuals rarely enter the population from another population). Therefore the current population has these conditions in much higher frequency than the population from which they migrated.


9.4: Microevolution - Biology

DNA: History & Structure, continued What s a Gene?

Genes at Work: Transcription & Translation

Making Proteins: Transcription & Translation, continued

Mutations: Causes and Effects

Cell Division: DNA Replication, Chromosomes & Mitosis

8.8-8.10 11.16-11.20 (skim 11.17) Sci Am. pp. 12-21: Tumor-Busting Viruses,

Genetics & Chromosomes Karyotypes Gender

Introduction to Mendelian Genetics

Mendelian Genetics: Human Genetics (continued) & Di-Hybrid Crosses

Mendelian Genetics, continued

Non-Mendelian Genetics: Incomplete Dominance & Co-Dominance

HW #7 Due
HW #8 (Chap. 9 Quiz B)

Non-Mendelian Genetics, continued: Linked Genes & Pleiotropic Genes

Genetics of Race Polygenic Traits

Sci . Un m. pp. 22-31: Does Race Exist?

Non-Mendelian Genetics: X-Linked Traits

Begin Gene Regulation: X-inactivation

Gene Regulation: Stem Cells, Cloning, Differentiation & Development

11.0, 11.2-11.311.10-11.13 11.15 skim 27.15 eCampus reading: Stem Cell Basics (all 7 parts)

Gene Regulation, continued

Introduction to Evolution

Evolution: Definitions & Overview of the Data

Review 1.6-1.8 13.2 13.5-13.6 13.11-13.15 13.18

WVU Holiday (Good Friday)

Microevolution: Darwin , Genetic Variation, & Adaptations

Finish Microevolution Geological History & Hypotheses of Origins

15.0-15.5 16.0-16.3 16.17 Review 16.7-16.8

Bio in the News #5 Due HW #9 Due 4/15

Finish Geol History/Origins
Macroevolution: Speciation & Species Definitions

Sci . Un m. pp. 32-43: Mammals that Conquered the Seas 14.0-14.13 15.6-15.7 15.10 18.22 17.11, 17.13


Fingerprint

  • APA
  • Auteur
  • BIBTEX
  • Harvard
  • Standard
  • SIF
  • Vancouver

Looking for local adaptation : Convergent microevolution in aleppo pine (pinus halepensis). / Daniels, Rose Ruiz Taylor, Richard S. Martínez, Santiago C.González Vendramin, Giovanni G. Fady, Bruno Muratorio, Sylvie Oddou Piotti, Andrea Simioni, Guillaume Grivet, Delphine Beaumont, Mark A.

In: Genes , Vol. 10, No. 9, 673, 04.09.2019.

Research output : Contribution to journal › Article (Academic Journal) › peer-review

T1 - Looking for local adaptation

T2 - Convergent microevolution in aleppo pine (pinus halepensis)

AU - Martínez, Santiago C.González

AU - Muratorio, Sylvie Oddou

N2 - Finding outlier loci underlying local adaptation is challenging and is best approached by suitable sampling design and rigorous method selection. In this study, we aimed to detect outlier loci (single nucleotide polymorphisms, SNPs) at the local scale by using Aleppo pine (Pinus halepensis), a drought resistant conifer that has colonized many habitats in the Mediterranean Basin, as the model species. We used a nested sampling approach that considered replicated altitudinal gradients for three contrasting sites. We genotyped samples at 294 SNPs located in genomic regions selected to maximize outlier detection. We then applied three di_erent statistical methodologies—Two Bayesian outlier methods and one latent factor principal component method—To identify outlier loci. No SNP was an outlier for all three methods, while eight SNPs were detected by at least two methods and 17 were detected only by one method. From the intersection of outlier SNPs, only one presented an allelic frequency pattern associated with the elevational gradient across the three sites. In a context of multiple populations under similar selective pressures, our results underline the need for careful examination of outliers detected in genomic scans before considering them as candidates for convergent adaptation.

AB - Finding outlier loci underlying local adaptation is challenging and is best approached by suitable sampling design and rigorous method selection. In this study, we aimed to detect outlier loci (single nucleotide polymorphisms, SNPs) at the local scale by using Aleppo pine (Pinus halepensis), a drought resistant conifer that has colonized many habitats in the Mediterranean Basin, as the model species. We used a nested sampling approach that considered replicated altitudinal gradients for three contrasting sites. We genotyped samples at 294 SNPs located in genomic regions selected to maximize outlier detection. We then applied three di_erent statistical methodologies—Two Bayesian outlier methods and one latent factor principal component method—To identify outlier loci. No SNP was an outlier for all three methods, while eight SNPs were detected by at least two methods and 17 were detected only by one method. From the intersection of outlier SNPs, only one presented an allelic frequency pattern associated with the elevational gradient across the three sites. In a context of multiple populations under similar selective pressures, our results underline the need for careful examination of outliers detected in genomic scans before considering them as candidates for convergent adaptation.


Mutation

Mutations are changes in the DNA sequence of a cell's genome and are caused by radiation, viruses, transposons and mutagenic chemicals, as well as errors that occur during meiosis or DNA replication. [8] [9] [10] Errors are introduced particularly often in the process of DNA replication, in the polymerization of the second strand. These errors can also be induced by the organism itself, by cellular processes such as hypermutation.

During the process of DNA replication, errors occasionally occur in the polymerization of the second strand. These errors, called mutations, can affect the phenotype of an organism, especially if they occur within the protein coding sequence of a gene. Error rates are usually very low—1 error in every 10–100 million bases—due to the "proofreading" ability of DNA polymerases. [11] [12] (Without proofreading error rates are a thousandfold higher because many viruses rely on DNA and RNA polymerases that lack proofreading ability, they experience higher mutation rates.) Processes that increase the rate of changes in DNA are called mutagenic: mutagenic chemicals promote errors in DNA replication, often by interfering with the structure of base-pairing, while UV radiation induces mutations by causing damage to the DNA structure. [13] Chemical damage to DNA occurs naturally as well, and cells use DNA repair mechanisms to repair mismatches and breaks in DNA—nevertheless, the repair sometimes fails to return the DNA to its original sequence.

In organisms that use chromosomal crossover to exchange DNA and recombine genes, errors in alignment during meiosis can also cause mutations. [14] Errors in crossover are especially likely when similar sequences cause partner chromosomes to adopt a mistaken alignment making some regions in genomes more prone to mutating in this way. These errors create large structural changes in DNA sequence—duplications, inversions or deletions of entire regions, or the accidental exchanging of whole parts between different chromosomes (called translocation).

Mutation can result in several different types of change in DNA sequences these can either have no effect, alter the product of a gene, or prevent the gene from functioning. Studies in the fly Drosophila melanogaster suggest that if a mutation changes a protein produced by a gene, this will probably be harmful, with about 70 percent of these mutations having damaging effects, and the remainder being either neutral or weakly beneficial. [15] Due to the damaging effects that mutations can have on cells, organisms have evolved mechanisms such as DNA repair to remove mutations. [8] Therefore, the optimal mutation rate for a species is a trade-off between costs of a high mutation rate, such as deleterious mutations, and the metabolic costs of maintaining systems to reduce the mutation rate, such as DNA repair enzymes. [16] Viruses that use RNA as their genetic material have rapid mutation rates, [17] which can be an advantage since these viruses will evolve constantly and rapidly, and thus evade the defensive responses of e.g. the human immune system. [18]

Mutations can involve large sections of DNA becoming duplicated, usually through genetic recombination. [19] These duplications are a major source of raw material for evolving new genes, with tens to hundreds of genes duplicated in animal genomes every million years. [20] Most genes belong to larger families of genes of shared ancestry. [21] Novel genes are produced by several methods, commonly through the duplication and mutation of an ancestral gene, or by recombining parts of different genes to form new combinations with new functions. [22] [23]

Here, domains act as modules, each with a particular and independent function, that can be mixed together to produce genes encoding new proteins with novel properties. [24] For example, the human eye uses four genes to make structures that sense light: three for color vision and one for night vision all four arose from a single ancestral gene. [25] Another advantage of duplicating a gene (or even an entire genome) is that this increases redundancy this allows one gene in the pair to acquire a new function while the other copy performs the original function. [26] [27] Other types of mutation occasionally create new genes from previously noncoding DNA. [28] [29]

Sélection

Sélection is the process by which heritable traits that make it more likely for an organism to survive and successfully reproduce become more common in a population over successive generations.

It is sometimes valuable to distinguish between naturally occurring selection, natural selection, and selection that is a manifestation of choices made by humans, artificial selection. This distinction is rather diffuse. Natural selection is nevertheless the dominant part of selection.

The natural genetic variation within a population of organisms means that some individuals will survive more successfully than others in their current environment. Factors which affect reproductive success are also important, an issue which Charles Darwin developed in his ideas on sexual selection.

Natural selection acts on the phenotype, or the observable characteristics of an organism, but the genetic (heritable) basis of any phenotype which gives a reproductive advantage will become more common in a population (see allele frequency). Over time, this process can result in adaptations that specialize organisms for particular ecological niches and may eventually result in the speciation (the emergence of new species).

Natural selection is one of the cornerstones of modern biology. The term was introduced by Darwin in his groundbreaking 1859 book À propos de l'origine des espèces, [30] in which natural selection was described by analogy to artificial selection, a process by which animals and plants with traits considered desirable by human breeders are systematically favored for reproduction. The concept of natural selection was originally developed in the absence of a valid theory of heredity at the time of Darwin's writing, nothing was known of modern genetics. The union of traditional Darwinian evolution with subsequent discoveries in classical and molecular genetics is termed the modern evolutionary synthesis. Natural selection remains the primary explanation for adaptive evolution.

Genetic drift

Genetic drift is the change in the relative frequency in which a gene variant (allele) occurs in a population due to random sampling. That is, the alleles in the offspring in the population are a random sample of those in the parents. And chance has a role in determining whether a given individual survives and reproduces. A population's allele frequency is the fraction or percentage of its gene copies compared to the total number of gene alleles that share a particular form. [31]

Genetic drift is an evolutionary process which leads to changes in allele frequencies over time. It may cause gene variants to disappear completely, and thereby reduce genetic variability. In contrast to natural selection, which makes gene variants more common or less common depending on their reproductive success, [32] the changes due to genetic drift are not driven by environmental or adaptive pressures, and may be beneficial, neutral, or detrimental to reproductive success.

The effect of genetic drift is larger in small populations, and smaller in large populations. Vigorous debates wage among scientists over the relative importance of genetic drift compared with natural selection. Ronald Fisher held the view that genetic drift plays at the most a minor role in evolution, and this remained the dominant view for several decades. In 1968 Motoo Kimura rekindled the debate with his neutral theory of molecular evolution which claims that most of the changes in the genetic material are caused by genetic drift. [33] The predictions of neutral theory, based on genetic drift, do not fit recent data on whole genomes well: these data suggest that the frequencies of neutral alleles change primarily due to selection at linked sites, rather than due to genetic drift by means of sampling error. [34]

Gene flow

Gene flow is the exchange of genes between populations, which are usually of the same species. [35] Examples of gene flow within a species include the migration and then breeding of organisms, or the exchange of pollen. Gene transfer between species includes the formation of hybrid organisms and horizontal gene transfer.

Migration into or out of a population can change allele frequencies, as well as introducing genetic variation into a population. Immigration may add new genetic material to the established gene pool of a population. Conversely, emigration may remove genetic material. As barriers to reproduction between two diverging populations are required for the populations to become new species, gene flow may slow this process by spreading genetic differences between the populations. Gene flow is hindered by mountain ranges, oceans and deserts or even man-made structures such as the Great Wall of China, which has hindered the flow of plant genes. [36]

Depending on how far two species have diverged since their most recent common ancestor, it may still be possible for them to produce offspring, as with horses and donkeys mating to produce mules. [37] Such hybrids are generally infertile, due to the two different sets of chromosomes being unable to pair up during meiosis. In this case, closely related species may regularly interbreed, but hybrids will be selected against and the species will remain distinct. However, viable hybrids are occasionally formed and these new species can either have properties intermediate between their parent species, or possess a totally new phenotype. [38] The importance of hybridization in creating new species of animals is unclear, although cases have been seen in many types of animals, [39] with the gray tree frog being a particularly well-studied example. [40]

Hybridization is, however, an important means of speciation in plants, since polyploidy (having more than two copies of each chromosome) is tolerated in plants more readily than in animals. [41] [42] Polyploidy is important in hybrids as it allows reproduction, with the two different sets of chromosomes each being able to pair with an identical partner during meiosis. [43] Polyploid hybrids also have more genetic diversity, which allows them to avoid inbreeding depression in small populations. [44]

Horizontal gene transfer is the transfer of genetic material from one organism to another organism that is not its offspring this is most common among bacteria. [45] In medicine, this contributes to the spread of antibiotic resistance, as when one bacteria acquires resistance genes it can rapidly transfer them to other species. [46] Horizontal transfer of genes from bacteria to eukaryotes such as the yeast Saccharomyces cerevisiae and the adzuki bean beetle Callosobruchus chinensis may also have occurred. [47] [48] An example of larger-scale transfers are the eukaryotic bdelloid rotifers, which appear to have received a range of genes from bacteria, fungi, and plants. [49] Viruses can also carry DNA between organisms, allowing transfer of genes even across biological domains. [50] Large-scale gene transfer has also occurred between the ancestors of eukaryotic cells and prokaryotes, during the acquisition of chloroplasts and mitochondria. [51]

Gene flow is the transfer of alleles from one population to another.

Migration into or out of a population may be responsible for a marked change in allele frequencies. Immigration may also result in the addition of new genetic variants to the established gene pool of a particular species or population.

There are a number of factors that affect the rate of gene flow between different populations. One of the most significant factors is mobility, as greater mobility of an individual tends to give it greater migratory potential. Animals tend to be more mobile than plants, although pollen and seeds may be carried great distances by animals or wind.

Maintained gene flow between two populations can also lead to a combination of the two gene pools, reducing the genetic variation between the two groups. It is for this reason that gene flow strongly acts against speciation, by recombining the gene pools of the groups, and thus, repairing the developing differences in genetic variation that would have led to full speciation and creation of daughter species.

For example, if a species of grass grows on both sides of a highway, pollen is likely to be transported from one side to the other and vice versa. If this pollen is able to fertilise the plant where it ends up and produce viable offspring, then the alleles in the pollen have effectively been able to move from the population on one side of the highway to the other.


Galleria mellonelle infection model

The virulence of target strains was determined using the wax moth (G. mellonella) larvae model [12,15]. Three doses of 1휐⁴, 1휐 5 , 1휐 6 CFU each with ten worms per group were tested. 1휐⁴ CFU was used for the injection. Controls included a PBS injection group, one group receiving no dose, a non-virulent control using E. coli MG1655, and a highly-virulent control using HvKP4 as previously reported [12]. The larvae were incubated at 37ଌ in a darkroom and the survival rate was recorded every 12 h for seven days. The experiments were conducted in duplicate.

Quantitative real-time PCR (qPCR)

The experimental procedures for qPCR were modified from a previous report [16]. The total RNA of Kp strains was extracted using the bacteria RNA Extraction Kit (Vazyme Biotech, China). Reverse transcription was performed using Goldenstar TM RT6 cDNA Synthesis Kit Ver.2 (Beijing TsingKe Biotech, China). The qPCR assay was conducted using the Bio-Rad IQ thermocycler and Master qPCR Mix-SYBR (Beijing TsingKe Biotech, China) for three biological replicates and three technical replicates. Calculation of 2 -ΔΔ CT using 16S rRNA as the reference was used to determine the relative transcript levels for each target gene of acrA, acrB, et acrR. The primers used to amplify each gene are listed in Table S2.

Whole-genome sequencing and genotyping

All the 72 CRKP isolates and 82 randomly selected carbapenem-susceptible Kp (CSKP) isolates from the contributing hospitals were selected for whole-genome sequencing (WGS). DNA libraries were constructed with 350-bp paired-end fragments and sequenced using an Illumina HiSeq 2000 platform. Short-read sequence data were de novo assembled using SPAdes v3.10 [17]. For the reference strains (Table S3), eight ST11 strains and one ST23 strain from China [12], 140 ST11 strains from Europe [18], six ST11 strains from other countries in Asia [19], and six outbreak-associated ST258 strains from the USA were enrolled [20]. Furthermore, to detect the ISKpn26 insertion into acrR across public strains, all fully assembled Kp genomes were downloaded from GenBank as of 1/1/2021. The long-read MinION sequencing (Oxford Nanopore Technologies, Oxford, UK) was used to sequence 40 Kp strains out of the 154 newly sequenced strains with a mean read length of 24 kbp. These isolates included all the 34 ST11 strains, two KPC-2-producing non-ST11 strains, and four virulence plasmid-carrying strains. De novo hybrid assembly both of short Illumina reads and long MinION reads was performed using Unicycler v0.4.3 [21], and corrected using Pilon v1.22. Plasmid sequences were confirmed by manually extracting the sequences from the assemblies to conduct a BLASTn search. The MLST and cgMLST were identified using the BIGSdb (//bigsdb.web.pasteur.fr/klebsiella/). The minimum spanning tree (MST) was constructed by GrapeTree [22]. Acquired antibiotic resistance genes (ARGs) and virulence genes were identified using ABRicate version 0.5 (https://github.com/tseemann/abricate) by aligning genome sequences to the ResFinder database [23] and VFDB database [24]. IS elements (https://www-isfinder.biotoul.fr), CRISPRs (https://crisprcas.i2bc.paris-saclay.fr/CrisprCasFinder/Index), PAIs (http://www.paidb.re.kr) [25], and prophages (https://phaster.ca/) [26] were identified using web-based searches. Kaptive was used to identify the whole capsule synthesis locus (K-locus) based on assembly scaffolds [27].

Phylogenetic analysis

For each de novo assembly, coding sequences were predicted using Prodigal v2.6 [28] and annotated using Prokka v1.13.3 [29]. Core genes were identified and used to build the core genome using Roary v3.12 [30] with the 𠄾 –mafft setting to create a concatenated alignment of core genomic CDS. SNP-sites (https://github.com/sanger-pathogens/snp-sites) was used to extract the core-genome SNPs (cgSNPs) [31]. The clonal strains differed by fewer than four cgSNPs [12]. Recombinogenic regions were removed with Gubbins v2.3.4 [32]. To construct a maximum likelihood phylogeny of the sequenced isolates, RAxML v8.2.10 was used with the generalized time-reversible model and a GTRGAMMA distribution to model site-specific rate variation [33]. We used iTOL [34] to visualize and edit the phylogenetic tree.

Disponibilité des données

All the 154 whole-genome sequenced data have been deposited in the NCBI database BioProject: PRJNA550041. A total of 34 blaKPC-2-carrying or virulence plasmid sequences were deposited in the GenBank database and assigned the accession numbers MT269819-MT269852.


The origin and evolution of seahorses (genus Hippocampe): a phylogenetic study using the cytochrome b gene of mitochondrial DNA

Phylogenetic relationships among 93 specimens of 22 species of seahorses (genus Hippocampe) from the Atlantic and Indo-Pacific Oceans were analysed using cytochrome b gene sequence data. A maximum sequence divergence of 23.2% (Kimura 2-parameter model) suggests a pre-Tethyan origin for the genus. Despite a greater number of seahorse species in the Indo-Pacific than in the Atlantic Ocean, there was no compelling genetic evidence to support an Indo-Pacific origin for the genus Hippocampe. The phylogenetic data suggest that high diversity in the Indo-Pacific results from speciation events dating from the Pleistocene to the Miocene, or earlier. Both vicariance and dispersal events in structuring the current global distribution of seahorses. The results suggested that several species designations need re-evaluating, and further phylogeographic studies are required to determine patterns and processes of seahorse dispersal.

Present address: Fisheries Centre, The University of British Columbia, 2204 Main Mall, Vancouver, BC, Canada V6T 1Z4.