Informations

Exemples d'analyses de grands ensembles de données frappantes/pédagogiques en biologie


Cette question appartient à « Cross-Validated » ainsi qu'à « Biologie »

Je recherche des exemples d'ensembles de données que je pourrais utiliser à la fois pour l'enseignement et pour ma formation personnelle, qui seraient de bons exemples d'applications très réussies de in silico outils d'analyse de données.

Je suis intéressé par des outils tels que : k-means ou clustering hiérarchique, analyse en composantes principales, modèles linéaires généralisés ou apprentissage automatique de base comme la découverte et la prédiction de classes.

Bien sûr, si les données sont disponibles, ce serait encore mieux, mais un simple chiffre dans un document fonctionnerait également.

Ce que j'entends par bien est "assez clair et démonstratif", c'est-à-dire. les résultats pourraient être, par exemple, une dichotomie de l'ensemble de données en deux ou trois groupes qui ont du sens d'un point de vue biologique (par exemple, différents tissus du même organe, différents moments du développement cellulaire…).

Un bon exemple serait, par exemple, ce chiffre :

(De Handschuh et al, Int J Oncol (2017) Copyright Spandidos Publications)

Les lignes sont des gènes (analyse d'expression de puces à ADN) et les colonnes sont des patients sains (HV) ou cancéreux (AML) ; le clustering fait apparaître deux gros clusters.

C'est un très bon exemple car nous pouvons facilement vérifier que les deux clusters correspondent aux deux types d'échantillons de patients, ce qui fait de ce cluster une bonne étude de cas pédagogique.

En d'autres termes, je recherche des exemples frappants de la façon dont les données visualisées sont parfaitement logiques, si elles sont correctement analysées.


Méthodes mathématiques et informatiques en biologie

Les méthodes mathématiques et informatiques sont essentielles pour mener des recherches dans de nombreux domaines de la biologie, tels que la génomique, la biologie moléculaire, la biologie cellulaire, la biologie du développement, les neurosciences, l'écologie et l'évolution. Inversement, la biologie offre de nouveaux défis qui conduisent au développement de nouvelles méthodes mathématiques et informatiques. Cet atelier rassemble des experts mondiaux pour présenter et discuter du développement récent des méthodes mathématiques qui surviennent dans les sciences biologiques. Les sujets comprennent des méthodes de modélisation déterministes, stochastiques, hybrides et multi-échelles, ainsi que des méthodes analytiques et informatiques.

Cet événement se déroulera virtuellement grâce à Zoom. Veuillez vous inscrire ci-dessous.

Quelques tutoriels utiles pour l'utilisation de Zoom :

Prise en main sous Windows ou Mac - https://go.osu.edu/BrDy
Tutoriels vidéo Zoom - https://go.osu.edu/BrEE
Partage de votre écran (pour les présentateurs) - https://go.osu.edu/BrEC
Options de mise en page vidéo (pour les présentateurs) - https://go.osu.edu/BrED

Directives de participation à l'atelier virtuel MBI Zoom :

Comment poser des questions pendant les discussions et les sessions de discussion - https://go.osu.edu/BrWN

Sessions de conversation en parallèle :

Groupe 1 aura lieu lors de la réunion Zoom principale. Groupe 2 aura lieu dans un Zoom séparé
Rencontre.


Fond

Les ARN messagers peuvent transporter une grande quantité d'informations en plus de la séquence de la protéine qu'ils codent. Les régions non traduites (UTR) des ARNm codent pour des signaux de régulation pour la traduction, la stabilité et la localisation subcellulaire [1]. Les études génomiques précédentes des transcrits d'ARN ont été limitées au séquençage d'ADNc à grande échelle [2–4] et à la modélisation informatique [5, 6]. Bien que les méthodes de calcul pour prédire les séquences codantes à partir de séquences génomiques fonctionnent généralement bien, notre capacité à reconnaître et à prédire les limites des transcrits à partir de séquences génomiques est encore relativement peu fiable. La mesure à l'échelle du génome des longueurs des transcrits correspondant à chaque gène pourrait fournir des contraintes importantes pour la modélisation des limites et des modèles d'épissage à partir de la séquence du génome, et nous donner un aperçu des caractéristiques des séquences non traduites des ARNm.

Nous avons développé une méthode basée sur des puces à ADN pour mesurer la longueur des transcrits à l'échelle génomique. Cette méthode, appelée Virtual Northern, est une approche complémentaire au séquençage d'ADNc. Il est de résolution inférieure, mais relativement rapide et bon marché, et moins sensible à l'abondance de messages rares ou aux difficultés d'obtention et de clonage d'ADNc complets [7].

Le schéma Virtual Northern est résumé sur la figure 1. L'ARN poly(A) est séparé par longueur sur un gel d'agarose. Le gel est découpé en un grand nombre de tranches minces, dont chacune contient des ARN d'une gamme étroite de longueurs [8]. L'ARN de chaque tranche est ensuite récupéré, marqué par fluorescence et hybride à une puce à ADN séparée. L'analyse systématique de la variation du signal d'hybridation - à travers la série de tranches de gel pour chaque séquence d'ADN représentée sur les puces à ADN - donne le profil de longueur de tous les transcrits qui contiennent cette séquence (Figure 2). Les longueurs de transcription peuvent ensuite être déterminées à partir des pics de ces profils. La méthode est essentiellement un Northern blot à l'envers : au lieu d'une sonde génétique marquée et hybridée à un ARN séparé par taille immobilisé sur une membrane, l'ARN séparé par taille est marqué et hybridé à des sondes génétiques immobilisées sur une lame de verre.

Exemples de profils de longueur. Chaque profil de longueur est un tracé du rapport normalisé des 30 puces à ADN. L'axe des x est la distance entre le point médian de chaque tranche de gel et l'origine. La ligne noire indique le rapport de fluorescence seuil pour la reconnaissance des pics de 2,0, et les cercles pleins représentent les trois points utilisés pour calculer le point médian de chaque pic.

Nous avons choisi de tester la méthode Virtual Northern sur le génome de la levure bourgeonnante Saccharomyces cerevisiae pour plusieurs raisons. En tant que premier génome eucaryote entièrement séquencé, le S. cerevisiae le génome est complet, bien étudié et bien annoté [9]. De plus, le génome est suffisamment petit et compact pour permettre l'impression de l'ensemble du génome sur un seul microarray [10]. Enfin, on en savait très peu sur les longueurs ou la diversité des longueurs de S. cerevisiae transcriptions.


Tailles des échantillons, associations trouvées, maladies étudiées et diversité des revues

La figure 1 montre l'explosion de la recherche GWAS depuis 2007. Bien que la première entrée dans le catalogue GWAS date du 10 mars 2005, seules 10 entrées ont été faites en 2005 et 2006. Une percée majeure s'est produite en 2007, avec un article largement annoncé publié par le Wellcome Trust Case Control Consortium 12 , plus tard qualifié de chef d'œuvre de la diplomatie en raison de l'agrégation des données concernées 6 . Au 29 octobre 2018, le catalogue enregistre 3639 articles de recherche individuels, qui couvrent 5849 adhésions d'étude uniques (identifiants uniques attribués aux études de traits spécifiques dans un article) à travers 3508 maladies/traits uniques, qui correspondent à 2532 traits uniques d'ontologie de facteurs expérimentaux cartographiés. . Le nombre moyen d'associations ou d'appels par étude est de 15,3, avec une moyenne p valeur de 1,3729 × 10 –6 . Seulement 49 451 des 89 588 (55,20 %) associations signalées répondent aux p ≤ Seuil 5×10 –8, la plupart restant à l'intérieur ou en dessous du niveau limite, des travaux récents suggérant un possible relâchement du seuil actuel 13 . Génétique de la nature a été l'éditeur le plus fréquent au fil du temps, bien qu'en 2017, GWAS ait été le plus souvent publié par Communication Nature. Au moment de la rédaction, la plus grande étude du catalogue contient actuellement 1 030 836 sujets.

La croissance de GWAS, 2007-2017. Le panneau supérieur montre le nombre d'entrées d'études publiées par trimestre au fil du temps, coloré en fonction de la taille de l'échantillon pour montrer la croissance des plus grandes (100 001 N) GWAS. Le panneau inférieur gauche montre la forte corrélation positive entre le nombre d'associations trouvées et le nombre de participants utilisés dans GWAS au fil du temps. Le panneau inférieur droit montre la croissance du nombre de traits uniques examinés ainsi que le nombre de revues uniques publiant GWAS au fil du temps. 2007-2017 est sélectionné car seulement 10 entrées ont eu lieu avant 2007. Chaque panel contient uniquement des années civiles complètes. Source : Catalogue NHGRI-EBI GWAS


Remerciements

Tara Océans (qui comprend le Tara Océans et Tara Les expéditions Oceans Polar Circle) n'existeraient pas sans le leadership de la Fondation Tara Ocean et le soutien continu de 23 instituts (https://oceans.taraexpeditions.org/). Les auteurs remercient en outre l'engagement des sponsors suivants : le CNRS français (en particulier le Groupement de Recherche GDR3280 et la Research Federation for the Study of Global Ocean Systems Ecology and Evolution FR2022/Tara GOSEE), le Fonds Français pour l'Environnement Mondial (FFEM), le Laboratoire Européen de Biologie Moléculaire, Genoscope/CEA, le Ministère de la Recherche et les programmes d'Investissements d'Avenir du Gouvernement français OCEANOMICS (ANR-11-BTBR-0008), FRANCE GENOMIQUE (ANR-10-INBS-09-08) et MEMO LIFE (ANR-10-LABX-54), l'université de recherche PSL (ANR-11-IDEX-0001-02) et EMBRC-France (ANR-10-INBS- 02). Le financement de la collecte et du traitement des Tara L'ensemble de données sur les océans a été fourni par le programme de biologie océanique et de biogéochimie de la NASA dans le cadre des subventions NNX11AQ14G, NNX09AU43G, NNX13AE58G et NNX15AC08G (à l'Université du Maine), la Chaire d'excellence en recherche du Canada en télédétection de la nouvelle frontière arctique du Canada et la Fondation canadienne pour l'innovation. Les auteurs remercient également agnès b. et E. Bourgois, la Fondation Prince Albert II de Monaco, la Fondation Veolia, la Région Bretagne, Lorient Agglomération, Serge Ferrari, Worldcourier et KAUST pour leur soutien et leur engagement. L'effort d'échantillonnage mondial a été rendu possible par d'innombrables scientifiques et membres d'équipage qui ont effectué l'échantillonnage à bord du Tara de 2009 à 2013, et les auteurs remercient MERCATOR-CORIOLIS et ACRI-ST pour avoir fourni des données satellitaires quotidiennes lors des expéditions. Les auteurs sont également reconnaissants aux pays qui ont gracieusement accordé l'autorisation d'échantillonnage. Les auteurs remercient N. Le Bescot et N. Henry pour leur aide dans la conception des figures de cet article. C.d.V. grâce à la plateforme Roscoff Bioinformatique ABiMS (http://abims.sb-roscoff.fr). S. Sunagawa remercie le Laboratoire européen de biologie moléculaire et les installations de calcul haute performance de l'ETH Zürich pour le soutien informatique. C.B. reconnaît le financement du Conseil européen de la recherche dans le cadre du programme de recherche et d'innovation Horizon 2020 de l'Union européenne (accord de subvention 835067) ainsi que du Radcliffe Institute of Advanced Study de l'Université Harvard pour une bourse universitaire au cours de l'année universitaire 2016-2017. M.B.S. remercie la Gordon and Betty Moore Foundation (prix 3790) et la US National Science Foundation (prix OCE#1536989 et OCE#1829831) ainsi que l'Ohio Supercomputer pour leur soutien informatique. S.G.A. remercie le ministère espagnol de l'Économie et de la Compétitivité (CTM2017-87736-R). F.L. remercie l'Institut Universitaire de France ainsi que la plateforme EMBRC PIQv pour l'analyse d'images. S. Sunagawa est soutenu par l'ETH Zürich et la Fondation Helmut Horten et par le financement de la Fondation nationale suisse (205321_184955). Les auteurs déclarent que toutes les données rapportées dans le présent document sont entièrement et librement disponibles à partir de la date de publication, sans aucune restriction, et que toutes les analyses, publications et propriété des données sont libres de tout enchevêtrement juridique ou restriction par les différentes nations dans les eaux desquelles le Tara Des expéditions océaniques ont effectué des échantillonnages. Cet article est la contribution numéro 100 de Tara Océans.


Pour les derniers événements, consultez notre fil Twitter ci-dessous.

Nous recherchons toujours de nouveaux étudiants qui peuvent apporter de la diversité, de l'enthousiasme et du dévouement dans le laboratoire.

Nous croyons fermement à l'importance de créer un environnement de soutien inclusif pour tous les membres du laboratoire. Pour y parvenir, nous demandons à tous les membres du laboratoire de signer un document qui explicite nos attentes pour tous les membres du laboratoire. Ce document comprend les déclarations suivantes :

  • Je participerai à des réunions de laboratoire hebdomadaires et à des clubs de lecture.
  • J'assisterai aux séminaires départementaux et IDP.
  • Je préparerai nos réunions régulières progrès/pièges
  • Je vais relire les manuscrits des autres membres du laboratoire.
  • Je maintiendrai un ensemble de notes de laboratoire, y compris des répertoires de données, des codes et versions annotés, des méthodes détaillées. Les notes de laboratoire seront suffisantes pour reproduire les résultats sans instructions supplémentaires.
  • Je participerai aux responsabilités générales du laboratoire (entretien des coléoptères, entretien des aires communes, événements de sensibilisation communautaire).
  • En tant qu'étudiant diplômé, je serai disponible au laboratoire/bureau presque tous les jours de 9h00 à 17h00.
  • En tant que chercheur de premier cycle, je consacre au moins 10 heures par semaine à la recherche et je m'engage à travailler en laboratoire pendant deux semestres.
  • J'apprécie la diversité des origines intellectuelles, de la race, du sexe et de l'identité.
  • Je traiterai tous les autres avec respect et dignité.

Les compétences avancées en mathématiques prédisent-elles le succès dans les diplômes de biologie et de chimie ?

La préparation mathématique des étudiants de premier cycle en sciences est un sujet de débat depuis un certain temps. Cet article examine la relation entre les résultats scolaires en mathématiques et les résultats des diplômes en biologie et en chimie à travers l'Angleterre, une échelle d'analyse beaucoup plus large que celle qui a été rapportée jusqu'à présent dans la littérature. Un ensemble de données unique qui relie la base de données nationale des élèves pour l'Angleterre (NPD) et les données de la Higher Education Statistics Agency (HESA) est utilisé pour suivre les trajectoires éducatives d'une cohorte nationale de jeunes de 16 ans à travers leurs programmes scolaires et diplômants. Les modèles de régression à plusieurs niveaux indiquent que les étudiants qui ont obtenu des qualifications avancées en mathématiques avant leurs études universitaires en biologie et en chimie n'étaient pas plus susceptibles d'obtenir les meilleurs résultats que ceux sans mathématiques avancées. Les modèles suggèrent cependant que le succès en chimie avancée à l'école prédit les résultats en biologie de premier cycle et vice versa. Il existe d'importantes différences d'origine sociale et l'impact de l'université fréquentée est considérable. Nous discutons d'un éventail d'explications possibles de ces résultats.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Les chevaux de course sont de plus en plus rapides

Des études antérieures ont conclu que la vitesse des chevaux de course pur-sang s'améliore très lentement, voire pas du tout, malgré une variation héréditaire de la performance et un élevage sélectif prétendument intensif. Cela a conduit à la suggestion que les chevaux de course ont atteint une limite de sélection. Cependant, les études précédentes ont été limitées, se concentrant uniquement sur les temps de victoire de quelques courses d'élite courues sur des distances moyennes et longues, et omettant de prendre en compte les facteurs potentiellement confusionnels. En utilisant un ensemble de données beaucoup plus vaste couvrant toute la gamme des distances de course et tenant compte de la variation de facteurs tels que la douceur du sol, nous montrons que l'amélioration est, en fait, en cours pour la population dans son ensemble, mais largement due à l'augmentation de la vitesse dans les courses de sprint. En revanche, la vitesse sur les moyennes et longues distances, du moins au niveau élite, semble atteindre une asymptote. Il reste à déterminer si cela reflète une limite de sélection à la vitesse sur les moyennes et longues distances ou un changement dans les pratiques d'élevage pour cibler les performances de sprint.

1. Introduction

Les temps de victoire de certaines courses de chevaux pur-sang en Grande-Bretagne (GB) sont enregistrés depuis le milieu des années 1800. De nos jours, les temps gagnants sont enregistrés pour toutes les courses courues, et les temps des chevaux battus peuvent être déduits. Notamment, les quelques études pour analyser les changements temporels de la performance ont rapporté peu d'amélioration récente des temps de victoire des courses d'élite en GB [1,2]. De même, une étude des trois courses les plus prestigieuses d'Amérique n'a signalé aucune augmentation de la vitesse de victoire depuis le début des années 1970 [3], et a conclu que les chevaux de course atteindront leur vitesse maximale de manière imminente. Cette conclusion a également été tirée d'une étude des meilleures performances mondiales [4]. L'absence d'amélioration est frappante compte tenu de l'élevage sélectif prétendument intensif [5] et des estimations d'héritabilité élevées pour les caractères de performance [4-6], ce qui suggère que les pur-sang ont atteint une limite de sélection [3,4,7-9]. Cependant, les études antérieures ont été limitées. Tout d'abord, ils n'ont analysé que le temps (ou la vitesse) gagnant d'un petit nombre de courses d'élite de moyenne et longue distance. Deuxièmement, aucun compte n'a été pris pour la variation temporelle des facteurs potentiellement confusionnels tels que la douceur du sol [1–4]. Ici, nous abordons ces limites pour tester et caractériser l'amélioration, à la fois au niveau de l'élite et dans la population de chevaux de course dans son ensemble.

2. Méthodes

Les données proviennent de Guide de Ruff sur le gazon (éditions annuelles 1850-1951), le Raceform Plat Annuel (1949-1994) et Raceform Interactive (1996-2012 www.raceform.co.uk). Nous n'avons inclus que les courses de plat GB courues sur le gazon. Pour une moyenne de 48 (plage de 11 à 106) courses élites (appelées « courses de groupe » depuis 1971) par an en 47 ans entre 1850 et 1996 (2243 courses au total), nous avons enregistré : le temps gagnant, la méthode de chronométrage (chronométre manuel ou automatique), distance de course, hippodrome, parcours officiel (sol mou), nombre de coureurs (nb de coureurs) et nom, âge et sexe du vainqueur. « Going » a été converti de sa description officielle (catégorique) en une échelle numérique à l'aide des tableaux de conversion fournis sur www.britishhorseracing.com/wp-content/uploads/2014/03/Going-Stick-Average-Readings.pdf. Nous avons collecté des données similaires pour un plus grand nombre de courses (>50 000 élite et autres) organisées chaque année entre 1997 et 2012. Pour ces courses, les temps des chevaux battus ont été estimés sur la base des distances battues et des échelles de conversion publiées sur www.britishhorseracing.com/ wp-content/uploads/2014/04/Lengths-Per-Second-Scale-Tables.pdf. L'ensemble de données complet comprend 616 084 temps de course courus par 70 388 chevaux.

Nous avons modélisé la vitesse à l'aide de modèles à effets linéaires mixtes adaptés à des ensembles de données différents en ce qui concerne : 12 stades) et les courses de longue distance (14-20 stades) (tableau 1). Pour chaque ensemble de données, nous avons d'abord ajusté le modèle 1 comme

Tableau 1. Taux linéaires d'amélioration de la vitesse estimés à partir des ensembles de données du modèle 1. Les estimations des paramètres proviennent des modèles REML avec l'année ajustée comme covariable continue. L'inférence est une comparaison de vraisemblance des modèles complets et réduits ajustés par ML (voir le texte pour plus de détails).

Le modèle 1 teste une amélioration simple (linéaire) de la vitesse moyenne sur la variation de distance au sein de chaque ensemble de données. Pour déterminer les modèles de changement temporel sans supposer une relation linéaire (ou autre paramétrique), et pour caractériser explicitement les taux d'amélioration en fonction de la distance de course, nous avons adapté un modèle modifié (modèle 2) avec effet de l'année en tant que facteur à plusieurs niveaux et inclusion de l'année (continue) par distance et année par distance 2 interactions. Une amélioration non linéaire a déjà été signalée (2,3,4) et cohérente avec cela, le réaménagement du modèle 1 traitant l'année comme un facteur d'ajustement du modèle amélioré (par exemple, ΔAIC = 132,9 analysant les résultats complets des gagnants d'élite de 1850 à 2012 non présentés). Le modèle 2 a été ajusté à des ensembles de données différant en ce qui concerne : représentant le sprint, les moyennes et longues distances). L'importance de l'effet cheval a été évaluée par un test de rapport de vraisemblance et la variance entre chevaux a été divisée par la variance phénotypique (conditionnelle aux effets fixes) pour estimer la répétabilité (entre chevaux) de la vitesse.

Tableau 2. Taux d'amélioration de la vitesse prévus à 6, 10 et 17 stades déterminés à partir du modèle 2 ajusté aux ensembles de données. L'amélioration annuelle moyenne est exprimée en unités absolues (yards s −1 an −1 ) et en pourcentage de la vitesse au cours de la première année d'analyse (1850 ou 1997).

3. Résultats

La vitesse moyenne des chevaux de course s'est améliorée historiquement (depuis 1850) et continue d'augmenter (depuis 1997, tableau 1). Dans le modèle 1, les effets de l'année étaient positifs dans les 15 ensembles de données examinés et significatifs dans tous sauf un (gagnants de courses élites de longue distance, 1997-2012). Cependant, une image plus nuancée est révélée par le modèle 2. Premièrement, l'amélioration historique n'a pas été linéaire (figure 1). Une amélioration rapide s'est produite de la fin des années 1800 à 1910, suivie d'une stase comparative jusqu'en 1975, puis des taux relativement plus élevés depuis. Deuxièmement, des interactions significatives entre l'année (continue) et la distance/distance 2 (|Z| > 1,96, p < 0,05 matériel électronique supplémentaire, tableau S1) signifie qu'entre 1850 et 2012, les vainqueurs des courses d'élite se sont améliorés plus rapidement sur des distances plus courtes (figure 1) à la fois en termes absolus et en pourcentage. Par exemple, les augmentations de vitesse prévues à 6, 10 et 17 stades, respectivement, étaient de 2,11, 1,69 et 1,49 yards s −1 , ce qui représente des augmentations de 12,9%, 10,6% et 9,7% par rapport à la vitesse en 1850 (ou des gains annuels moyens de environ 0,080%, 0,065% et 0,060% tableau 2).

Figure 1. Modèles de changement temporel des vitesses des vainqueurs de courses d'élite depuis 1850. Les cercles, les carrés et les triangles représentent la vitesse moyenne prédite à partir du modèle 2 à 6, 10 et 17 stades, respectivement (les barres indiquent ±1 s.e.).

Un examen plus détaillé des prévisions du modèle pour les données 1997-2012 montre que si les vainqueurs des courses d'élite continuent de s'améliorer, cela est presque entièrement dû aux courses de sprint, la vitesse de victoire augmentant en moyenne de 0,110 % par an depuis 1997 (tableau 2). Les changements moyens correspondants de la vitesse de victoire des élites sur les moyennes et longues distances ont été estimés à 0,020 % et -0,009 % par an, respectivement (tableau 2 et figure 2une). Les modèles qualitatifs sont largement similaires en utilisant les données de tous les finisseurs dans les courses d'élite (figure 2b), vainqueurs de toutes les courses (figure 2c) et tous les finishers de toutes les courses (figure 2). Dans tous les cas, l'amélioration est la plus rapide pour les sprints. Par exemple, la vitesse de victoire de toutes les courses a augmenté d'une moyenne estimée de 0,062%, 0,037% et 0,022% par an (des valeurs de 1997) à 6, 10 et 17 stades, respectivement (tableau 2). Les taux estimés sont légèrement plus élevés à 0,090%, 0,065% et 0,034% par an si l'on considère tous les finissants dans toutes les courses de 1997 à 2012 (tableau 2). Voir le matériel électronique supplémentaire, le tableau S1 pour les estimations complètes (fixes) des paramètres sous le modèle 2 et le matériel électronique supplémentaire, le tableau S2 pour la vitesse prévue par année à 6, 10 et 17 stades. Les estimations de la répétabilité entre les chevaux sont fournies dans le matériel électronique supplémentaire, tableau S3.

Figure 2. Modèles de changement temporel des vitesses pour (une) vainqueurs de courses élites depuis 1997, (b) finisseurs de course élite depuis 1997, (c) tous les vainqueurs de course depuis 1997, () tous les finisseurs de course depuis 1997. Les cercles, les carrés et les triangles représentent la vitesse moyenne (par rapport à la moyenne de 1997) prédite à partir du modèle 2 à 6, 10 et 17 stades, respectivement (les barres indiquent ±1 s.e.).

4. Discussion

Nos analyses montrent que les vitesses de victoire dans les courses d'élite se sont considérablement améliorées depuis 1850. De plus, les données de 1997 à 2012 révèlent que cette amélioration est continue mais, surtout, les taux varient selon les distances. L'amélioration contemporaine est faible pour les moyennes et longues distances, mais la vitesse de victoire pour les courses de sprint d'élite dépasse en fait les taux historiques estimés. Un schéma similaire apparaît lorsque tous les finisseurs d'élite sont inclus et si la population plus large d'artistes non élites est prise en compte.

Trois études récentes ont conclu que les chevaux de course sont à (ou très proche de) la vitesse maximale [2–4], avec un quatrième rapportant une amélioration continue modeste (bien que le changement significatif ait été limité à 4 des 11 courses analysées [1]). Étant donné que ces études étaient limitées aux courses d'élite courues sur des distances moyennes et longues, nos résultats sont globalement cohérents (en termes de taux d'amélioration) même si notre conclusion qualitative, à savoir que les chevaux sommes toujours plus rapide—c'est différent. L'écart qualitatif reflète probablement notre plus grande puissance statistique combinée à une modélisation explicite des facteurs environnementaux connus [10] ou supposés influencer la vitesse. L'amélioration continue des performances de sprint, non analysée auparavant, est beaucoup plus rapide. Entre 1997 et 2012, la vitesse de victoire pour les courses élites de 1 200 mètres a augmenté d'environ 0,110 % par an, ce qui correspond à une amélioration du temps de victoire prévu de 72,92 à 71,74 s. En bon terrain, une différence de 1,18 s correspond à plus de sept longueurs de chevaux (www.britishhorseracing.com/wp-content/uploads/2014/04/Lengths-Per-Second-Scale-tables.pdf), une marge nette étant donné que nous avons calculé que la distance moyenne gagnante des courses d'élite de 6 stades entre 1997 et 2012 n'était que de 1,28 longueur.

Il y a plusieurs explications possibles pour que les vitesses des courses de sprint continuent de s'améliorer rapidement par rapport aux courses de moyenne et longue distance. Les performances des chevaux de course sur de plus longues distances pourraient atteindre une limite de sélection comme cela a été suggéré précédemment [3,4,7-9], mais nous notons également que l'accent de l'élevage en GB peut également s'être déplacé vers la production de chevaux de sprint. Plus généralement, il faut veiller à ne pas attribuer les changements de vitesse à la seule reproduction. Par exemple, une amélioration très rapide au début des années 1900 (figure 1) a été attribuée par Pfau et al. [11] à l'introduction (en 1897) et à l'adoption universelle (en 1910) d'un style de conduite modifié. D'autres changements dans le style de conduite pourraient bien avoir facilité une amélioration relativement rapide entre le milieu des années 1970 et le milieu des années 1990, lorsqu'une posture inventée par le jockey Lester Piggott a été adoptée [12]. Cependant, la commercialisation de l'élevage de chevaux de course a également eu lieu au cours de cette période, avec une augmentation de l'importation de chevaux américains bien élevés [13]. Nous notons également que les tactiques des jockeys influencent sans aucun doute la vitesse de course et reconnaissons que nous ne pouvions pas contrôler toutes les variables potentiellement confusionnelles. Par exemple, nous avons choisi de ne pas inclure les poids de handicap dans notre modèle car il était confondu avec l'identité du cheval, les meilleurs coureurs ayant tendance à porter plus de poids. Néanmoins, le poids moyen transporté a en fait augmenté entre 1997 et 2012 dans les deux courses d'élite (estimé à 0,194 ± 0,006 lb an −1 , F1,19193 = 1183, p < 0,001) et dans toutes les races (à 0,255 ± 0,002 lb an −1 , F1,613839 = 14956, p < 0,001 matériel électronique supplémentaire, figure S1). Parce que plus de poids devrait réduire la vitesse, cela pourrait potentiellement masquer une amélioration génétique sous-jacente.


Discussion

Nous avons développé du matériel et des logiciels associés qui permettent une collecte et une segmentation rapides d'une quantité sans précédent de chants de parade à partir de D. melanogaster. Nous avons illustré la puissance de ce système en analysant un large échantillon de chant de cinq souches de type sauvage. Tous les paramètres de chanson que nous avons examinés affichent des variations intra-individuelles, inter-individuelles et inter-souches. Presque tous les aspects du chant présentent une hétérogénéité entre les variétés. Parce que ces cinq souches représentent des isolats indépendants de la nature, et parce que toutes les souches ont été traitées de manière identique en laboratoire, la variation entre les souches résulte très probablement de différences génétiques entre les souches [30]. De plus, des caractéristiques de chanson distinctes étaient soit faiblement corrélées, soit non corrélées (tableau S1 dans le fichier supplémentaire 3), ce qui suggère que ces souches se séparent pour plusieurs variantes génétiques qui peuvent influencer chaque caractéristique de chanson indépendamment. Cette observation est cohérente avec d'autres études qui ont révélé que de nombreux loci contribuent à la variation du chant [13, 31, 32]. Ces observations sont également cohérentes avec l'extrême diversité des chants de parade nuptiale trouvés parmi les espèces du genre Drosophile [3, 4, 10].

Des études antérieures sur le chant nuptial ont rapporté un cycle périodique de l'intervalle entre les impulsions et que la fréquence de ce cycle est influencée par des mutations au niveau de la période lieu [9, 23]. De plus, il a été signalé que ce rythme différait entre les espèces étroitement apparentées, au moins en partie en raison de la variation naturelle au niveau de la période lieu [21, 22]. L'existence de ces rythmes s'est avérée controversée et plusieurs groupes ont rapporté qu'ils étaient incapables de détecter le rythme [33, 34]. Une caractéristique de ces études précédentes est qu'elles impliquaient toutes des ensembles de données de taille modeste, aucun ne convenant à l'estimation de rythmes avec des périodes de l'ordre de quelques dizaines de secondes [24]. De plus, la plupart des études ont utilisé des techniques d'analyse spectrale qui ne sont pas appropriées pour les données de séries chronologiques échantillonnées à intervalles irréguliers. Cette limitation de l'analyse spectrale classique a été surmontée par le développement de nouvelles approches par Lomb et Scargle qui permettent une détection efficace des rythmes dans des données de séries chronologiques échantillonnées de manière irrégulière. De plus, nous avons généré des ensembles de données où la plupart des individus ont produit bien plus de 300 points d'échantillonnage, ce qui, a-t-il été suggéré, est la taille d'échantillon minimale absolue requise pour estimer une puissance significative dans une plage spectrale particulière [35]. Nous n'avons détecté aucune preuve de l'existence de cycles périodiques de l'intervalle entre les impulsions à quelque fréquence que ce soit (Figure 5). Nos simulations ont confirmé que notre ensemble de données était d'une taille suffisante pour trouver ces rythmes s'ils existaient. Nous devons donc conclure que les mouches qui chantent dans notre appareil ne produisent pas de cyclage périodique de l'intervalle entre les impulsions et que ce phénomène ne nous est pas disponible pour une étude plus approfondie.

Compte tenu de notre difficulté à détecter des tendances à long terme dans l'intervalle inter-impulsions, nous avons été surpris de trouver plusieurs modulations temporelles dans la fréquence porteuse du train sinusoïdal. Premièrement, les mouches mâles ont tendance à augmenter la fréquence de la porteuse sinusoïdale au cours des premiers trains d'un épisode de chant, et cet effet est spécifique aux trains sinusoïdaux. Comme nous n'avons trouvé aucune tendance comparable pour les changements de fréquence des impulsions, il semble que les mouches mâles modulent la fréquence de la porteuse sinus indépendamment des contraintes physiques sur la vibration des ailes. De plus, la modulation indépendante de la fréquence du train sinusoïdal et de la fréquence d'impulsion suggère que ces deux modes de chant sont produits par des mécanismes différents. Ces résultats contrastent avec la proposition d'Ewing, qui a suggéré que les impulsions sont générées par un amortissement du chant sinusoïdal [36, 37].

Nous avons également découvert que les mouches mâles modulent la fréquence des porteurs sinusoïdaux sur des échelles de temps encore plus longues. Au cours de toute la session d'enregistrement de 14 minutes, la fréquence fondamentale sinusoïdale moyenne avait tendance à augmenter dans la plupart des enregistrements (Figure 6d, e). De plus, la durée des épisodes de chant et la durée du train sinusoïdal affichaient également des tendances linéaires sur cette échelle de temps (figure 6e). Nos résultats indiquent que le chant des mouches, et le chant des sinus en particulier, contient des motifs sur plusieurs échelles de temps. Il reste à voir dans quelle mesure cette variabilité est détectée et utilisée par les femelles pour la discrimination des partenaires.

Nous avons observé une variation importante dans de nombreuses dynamiques temporelles du chant, telles que les pauses entre les combats et la durée des combats et des trains. Cette variabilité temporelle dans la structure du chant nuptial contraste fortement avec les chants d'appel très stéréotypés d'autres insectes, tels que les grillons et les sauterelles [38]. À l'heure actuelle, il n'est pas clair comment la variabilité de Drosophile Le chant de parade nuptiale est généré au niveau neuronal. Les mouches mâles peuvent basculer entre deux générateurs de motifs centraux pour produire des trains de sinus et d'impulsions, un mécanisme suggéré par la variation génétique apparemment indépendante des paramètres de sinus et d'impulsion, mais nous ne savons pas ce qui détermine la durée du temps passé dans chaque mode. Nous soupçonnons que les schémas des trains de sinus et d'impulsions peuvent être liés à la dynamique du comportement de parade nuptiale, et en particulier à l'interaction du mâle et de la femelle, comme cela a été suggéré récemment [39].

De nouveaux outils transgéniques disponibles dans D. melanogaster provide the opportunity to manipulate sparse subsets of neurons to interrogate neural networks [40]. Our platform provides the opportunity to perform a systematic analysis of the neural basis for courtship song, even for neurons that contribute only subtle, quantitative aspects to song. In preliminary studies, we have found that our hardware and software can be employed, with minor modifications, to record and analyze song from several other species of Drosophile. We expect, therefore, that our platform will accelerate research on the genetic and neural basis for song within D. melanogaster and also will aid studies on song evolution.


Developing Pedagogical Content Knowledge: Lessons Learned from Intervention Studies

Pedagogical content knowledge (PCK) is generally accepted as positively impacting teaching quality and student learning. Therefore, research on PCK development in (prospective) teachers is highly relevant. Based on a search in three databases (ERIC, PsycInfo, and Web of Science), a systematic review is conducted on intervention studies aiming at PCK development. The research questions are threefold: (1) How are the studies designed? (2) How are the interventions designed? and (3) What elements of interventions contribute to PCK development? The results show that most intervention studies are conducted in math and science education and use a qualitative methodology. Reflection, PCK courses, contact with other teachers, and experiences in educational practice are typically part of effective interventions. The review enables the identification of clear guidelines that may strengthen future research on stimulating PCK.

1. Introduction

Shulman [1] introduced the concept “pedagogical content knowledge” (PCK) as a possible answer to the so-called “missing paradigm” in research and practice on teaching. Teaching was either approached by only focusing on content or by exclusively focusing on pedagogy. Shulman believed that neither approach grasped every aspect of teachers’ knowledge base. Hence, he defined PCK as “that special amalgam of content and pedagogy that is uniquely the province of teachers, their own special form of professional understanding”, p. 8 [2]. The two main components that Shulman [1] distinguished in PCK were, on the one hand, the most useful forms of representing the topics in one’s subject area and, on the other hand, an understanding of what makes the learning of these topics easy or difficult for students. Besides PCK, he considered other categories in teachers’ knowledge base, that is, content knowledge (CK), general pedagogical knowledge (PK), curriculum knowledge, knowledge of learners and their characteristics, knowledge of educational contexts, and knowledge of educational ends, purposes, and values [2].

Since Shulman’s introduction of PCK, the concept has been adopted by various researchers, resulting in both theoretical developments and empirical research. Several authors elaborated Shulman’s initial framework of PCK. Grossman [3], who studied PCK in the context of language, added two other components to Shulman’s original PCK components, that is, knowledge of curriculum and knowledge of purposes for teaching. Another elaboration that has been very influential in the context of science education is the model of Magnusson et al. [4]. This model added three components to the original ones of Shulman, that is, orientation to teaching science (i.e., knowledge and beliefs about purposes and goals for teaching), knowledge of science curricula, and knowledge of assessment of scientific literacy. Within the context of mathematics, the model of Ball et al. [5], focusing on the concept “content knowledge for teaching mathematics” (CKTM), has been very influential. This model includes both PCK and CK, with each of these two parts being divided into three components. Concerning PCK, the model includes (1) knowledge of content and students, which is similar to Shulman’s knowledge of students’ (mis)conceptions, (2) knowledge of content and teaching, which is similar to Shulman’s knowledge of educational representations, and (3) knowledge of curriculum. Regarding CK, the CKTM model includes (1) common content knowledge, which is mathematical knowledge that is used in other than educational contexts, (2) specialized content knowledge, which is mathematical knowledge that is unique to teaching contexts, and (3) knowledge at the mathematical horizon, meaning being aware of how separate mathematical topics relate to each other.

Recently, test instruments to measure teacher cognition have been developed and used in several studies, leading to empirical confirmation of Shulman’s claim that PCK makes a difference for instructional quality and student learning. For instance, Baumert et al. [6] found a significant positive effect of teachers’ CK and PCK on instructional quality (assessed by means of student ratings, teacher self-reports, and analyses of tasks) and on student progress in mathematics education (measured through an achievement test). Results even showed that PCK had greater predictive power for student progress and instructional quality than CK. In another study, Kunter et al. [7] confirmed these results. Moreover, they showed that teachers’ PCK had a positive effect on student motivation (measured through an enjoyment questionnaire). Hence, to improve the quality of education, investing in (prospective) teachers’ PCK seems to be a good strategy.

In an attempt to describe how PCK develops, several scholars have distinguished sources that contribute to PCK development [3, 8–10]. The first source is teaching experience [3, 9, 10]. Empirical studies have shown that significant improvements in PCK are made in the early months of one’s teaching career [11]. PCK courses, which aim at improving teachers’ knowledge on how to teach a subject, are the second source for PCK development [3, 8]. The third PCK source is disciplinary knowledge, that is, CK [3, 9]. Possession of CK is necessary for the presence of PCK [9, 12]. CK positively influences teachers’ decisions about the relative importance of particular subject matter and their selection and use of curriculum materials, that is, their PCK [3]. Brownlee et al. [13] showed that a course on CK had a positive influence on teachers’ content knowledge for teaching mathematics, which is related to PCK. Fourthly, “apprenticeship of observation” [14] has been distinguished as another source for PCK development [3, 8]. Apprenticeship of observation refers to the influence of teachers’ past experiences as a student on their current teaching models [3]. Unfortunately, these memories may also limit teachers to rely only on familiar curricular materials and approaches [3]. Haston and Leon-Guerrero [8] empirically showed that teachers consider their memories of past education as an important PCK source. Fifthly, teachers’ cooperation with colleagues has been described as a possible source for PCK development [8, 9]. According to Kind [9], provision of a supportive working environment that encourages collaboration may benefit teachers’ PCK development. Haston and Leon-Guerrero [8] empirically showed the importance of cooperation with colleagues for PCK development. Finally, the sixth possible source for PCK development is the importance of reflection on educational practice [10]. Kenney et al. [15] showed that reflection on writing assignments improved teachers’ PCK.

Although several scholars have mentioned PCK sources, there is still little empirical evidence on how education can contribute to PCK development. Until now, it is unclear whether the PCK sources described above have been considered in intervention research. Furthermore, it is unclear how intervention research on PCK is mainly conducted. The significance of the present study is twofold. First, it provides an overview of intervention research on PCK without being restricted to a particular disciplinary domain. Second, as it is not very clear what elements should be incorporated in interventions in order to make them effective for PCK development, the study seeks to find out these effective elements by comparing several intervention studies. In contrast to earlier studies on PCK sources, the present study makes a systematic analysis of studies that aim to develop PCK through educational interventions. Three research questions (RQs) are addressed: (RQ 1) How are intervention studies on PCK development designed? (the disciplinary context, the participants, and the research methods). (RQ 2) How are interventions that aim at PCK development designed? (the PCK sources that are addressed, the location, the main actors, and whether background characteristics are taken into account). (RQ 3) What elements of interventions that aim at PCK development are effective?

2. Méthodes

A systematic review was conducted [16] using three databases (ERIC, Web of Science, and PsycInfo) because these databases include the most high-quality and relevant educational research. The databases were browsed, based on five combinations of search terms, namely, “pedagogical content knowledge AND experiment” (

), “pedagogical content knowledge AND experimental” (

), “pedagogical content knowledge AND intervention” (

), “pedagogical content knowledge AND development” (

), and “pedagogical content knowledge AND course” ( ), leading to a total of 2358 search hits. These search terms were chosen because we noticed that many different synonyms of the word “intervention” are used in educational research. Therefore, we included search terms that are often used when interventions are described. The dataset was reduced based on three criteria that are implied by the RQs. Firstly, all selected articles had to be peer-reviewed and written in English and report at least one empirical study, resulting in an exclusion of, for example, purely conceptual manuscripts. Secondly, the articles had to study the effects of an educational intervention. To define an intervention, we build on the framework of Hattie, Biggs, and Purdie [17]. We claim that interventions are educational interference that (a) differ from the educational activities that the instructor(s) involved in the study would normally organize, (b) require an outsider (e.g., the researcher) to design the intervention and study its effects, and (c) focus on the increase of a certain variable. Hattie et al. [17] included the use of an experimental design as the fourth prerequisite. This prerequisite is not included because it would limit the search results too strongly as there were only three experimental studies in the dataset. Thirdly, all selected articles had to focus on PCK. For all abstracts (and if necessary the full texts), one rater checked whether they met the criteria. In case of doubt, the papers in question were discussed with two other raters until consensus was reached. After application of the three criteria, 85 articles remained in the comprehensive dataset. Articles from this dataset are marked with one asterisk in the reference list.

The comprehensive dataset was used to answer RQ 1 (the design of the intervention studies). RQs 2 and 3 were based on a limited dataset of studies containing both pre- and posttests. This choice is made because studies of this kind allow for studying the effect of an intervention on PCK development instead of PCK at one particular moment. Therefore, the chances are higher that the effects that are found can be attributed to the intervention instead of extraneous factors. Since the aim of RQs 2 and 3 is to specifically focus on the effects of interventions, we decided to limit the dataset for these research questions to studies using both pre- and posttests. The 37 articles that are part of the limited dataset are marked with two asterisks in the reference list.

The analyses were similar for the three RQs. Firstly, in a within-case analysis, each article was analyzed separately [18]. The articles were summarized in a table, relating to (1) disciplinary domain, (2) participants (educational level, teaching experience, and number of participants), (3) research methods, (4) intervention (including PCK sources, location, and main actors), (5) background characteristics, and (6) main results. The first three categories pertain to RQ 1. The last three categories cover RQs 2 and 3. A table summarizing the articles in the limited dataset can be found in Appendix. Secondly, the within-case analyses were compared with each other in a cross-case analysis [18].

When describing PCK sources addressed in the studies, we build on the literature on sources for PCK development. When designing interventions for PCK development, it is however impossible to address PCK sources in their original meaning because interventions usually cover a shorter, delineated period of time. Therefore, in the analyses of the present study, a translation of the sources is made. “Disciplinary knowledge” is understood as all activities and courses that focus on CK. The term “PCK courses” is used to describe activities and courses focusing on PCK. Interventions addressing teaching experience include teaching and trying out new insights in a real classroom. “Contact with cooperating teachers” is understood as any contact with other people, for instance, other participants and colleagues. Interventions including reflection ask participants to systematically question past events. “Observation,” finally, is used to describe interventions in which attention is given to participants’ prior experiences as students.

3. Résultats

3.1. Design of the Studies

In Table 1, an overview is provided of the contexts of the intervention studies (the educational levels and the disciplinary domains) of the comprehensive dataset. Most studies pertained to primary or secondary education. Almost three-fourths of the studies focused on natural sciences, one-fourth on mathematics, and a few on other domains.

Table 2 describes the participants and whether quantitative, qualitative, or mixed methods were used. The studies in the dataset used both preservice (

) and in-service ( ) teachers. Within the latter group, most studies used teachers with more than five years of experience or a combination of experienced and novice teachers. A distinction is made between studies using quantitative (test or survey instruments), qualitative (interviews, document review, and observations), or mixed methodology (combining quantitative and qualitative methods). The majority used qualitative research methods, mostly combining several instruments. Particularly, interviews were often used. Qualitative methods were mostly used on smaller datasets, while quantitative methods were applied to larger datasets. All studies measured the effects of the intervention immediately after the intervention none of the studies used retention tests to measure the effects of the intervention in the long run.

3.2. Design of the Interventions

The following paragraphs focus on the limited dataset, including only studies using both pre- and posttests, because these designs allow for grasping the effects caused by the interventions instead of extraneous factors. Three aspects are described, that is, the PCK sources that are addressed, the location of the interventions, and the main actors in the interventions.

3.2.1. Sources

The classification of PCK sources described above is used (teaching experience, PCK courses, disciplinary knowledge, observation, cooperation with colleagues, and reflection). An overview of the PCK sources in the interventions is provided in Table 3. Observation, despite being described as a PCK source by Grossman [3] and Haston and Leon-Guerrero [8], is not included in the table as no study addressed this source. Most studies covered a variety of PCK sources. PCK courses are the most common PCK source among the different interventions ( ). The contents of these courses vary across the studies, for instance, sorting tasks according to difficulty [19], an online professional development program including PCK exercises [20], or designing of a lesson plan [21]. Most interventions addressing PCK courses focused on Shulman’s [1] two components: knowledge of students’ (mis)conceptions and knowledge of educational representations. Particularly, teachers’ knowledge of student understanding was very often addressed in interventions (e.g., [22, 23]), for instance, in tasks in which student work had to be analyzed (e.g., [20, 24]). The second most used PCK source across the dataset is contact with cooperating teachers ( ). Activities addressing this source vary from online interaction with other participants [25], getting feedback from an experienced teacher [19], to group discussions [26–29]. Examples of the third most used source, teaching experience ( ), are a research project that teachers tried out in their classroom [30] or a video-based task in which lesson that was taught by the participant had to be analyzed [27]. Reflection is addressed in 17 studies. Participants reflected on learning activities (e.g., [21, 31–33]) or on feedback from peers [24]. Reflection was mostly organized through written reports (e.g., [24, 31]). Reflective group discussions [34] were part of a few interventions. The least addressed source is disciplinary knowledge (CK) ( ). An example can be found in Buchholtz and Kaiser [35], who included a phase of content exploration in their professional development program.

3.2.2. Emplacement

Table 4 contains the locations of the interventions and the main actors in the interventions. Concerning the locations, a distinction is made between on-site (inside a school), off-site (e.g., in a public meeting room, or at home behind a computer), or combined interventions. Most interventions were off-site (

) or combined interventions ( ).

3.2.3. Main Actors

Only the person(s) that played the most important role (the persons from whom the participant mainly learned) in the intervention is/are mentioned in Table 4. We made a distinction between experts, more experienced teachers, less experienced teachers, or the participants themselves. A person is classified as an expert when he/she has broad knowledge about the contents of the intervention due to experience in research. More and equally experienced teachers can be colleagues of the participant or teachers from other schools. When only the participants played a role in the intervention, the study was classified in “participants themselves.” Firstly, in most studies, participants mainly learned from an expert ( ). The experts were mostly authors of the study (e.g., [19, 29, 36]). In a smaller amount of interventions, the experts were other individuals, who were trained in advance for course facilitation [20, 37, 38]. In Harr et al. [39], a computer-based learning environment was used in which the computer was the expert. Secondly, six studies included learning from equally experienced teachers. In most of these studies, participants learned from whole- or small-group discussions with other (equally experienced) teachers [19, 25, 40]. Furthermore, this category includes studies consisting of a course with peer review [24], a community of practice providing constant feedback and support [38], and collaborative inquiry, in which the participants answered a question through reflection and action [33]. Thirdly, in four studies, a more experienced teacher played the main role: mentors gave feedback on participants’ educational practice [41, 42], tutors acted as professional coaches during group activities [29], and participants met with experienced teachers to share teaching and evaluation strategies [43]. Finally, in two studies, the participants themselves played the main role, by completing a portfolio assignment on their own [44] and by using different textbooks [45].

When looking simultaneously at the main actors and the locations of the interventions, the most frequent combinations are those with an expert facilitator and an off-site location, and those with an expert facilitator and both an on-site and an off-site location.

3.2.4. Background Characteristics

Only three studies in the dataset took participants’ background characteristics into account when analyzing the effects of the intervention on PCK. Davis [45] studied the impact of using two different textbooks on teachers’ PCK. He concluded that teachers’ beliefs about mathematics and their perceptions about textbooks (based on previous work with textbooks) had an influence on how teachers understood the lessons in the textbooks and what they learned from reading and planning from the textbooks. Harr et al. [39] expected a positive effect of participants’ prior knowledge on PCK and PK and their working memory on the PCK growth caused by the intervention. However, they did not find an influence of these background characteristics on PCK development. Wahbeh and Abd-El-Khalick [23] found a mediating effect of several background variables on PCK (i.e., CK, PK, attention to students’ prior knowledge, abilities to locate, adapt, and design content-related instructional resources, and nature and attributes of science understanding).

3.3. Effective Elements in the Interventions

Comparing the results of the studies in the limited dataset, it can be concluded that the majority of the studies reported a positive effect on PCK development of the intervention. 13 out of 16 quantitative studies found a significant positive effect of their intervention on PCK development [20, 25, 27, 34, 36, 37, 39–42, 46–48]. Tirosh [49] found an improvement in PCK but did not report the significance of the effect. Two quantitative studies were noneffective their intervention did not lead to a significant effect on PCK [35, 50]. All qualitative studies in the dataset reported a growth in PCK at the end of the intervention. For instance, Arbaugh and Brown [19] reported better performances of their participants on a PCK-related task that was executed during a postinterview in comparison with a preinterview. De Jong and van Driel [21] found that their participants mentioned more student difficulties in the postinterviews than in the preinterviews. McNeill and Knight [51] only found a growth on one particular aspect of PCK, measured by means of a test on teachers’ knowledge of students’ conceptions that was analyzed qualitatively using a coding scheme (i.e., on student writing, whereas no effect was found on classroom discussion), while all other qualitative studies found an improvement of PCK in general. 11 out of 13 studies spoke in terms of an increase in PCK [19, 21, 23, 26, 29, 30, 33, 44, 45, 51–53] while three studies found a change in the nature of their participants’ PCK [31, 32, 54]. Aydin et al. [31, 32] concluded that their participants moved from fragmented PCK to more integrated PCK, measured through content representations (CoRes) prepared by the participants, interviews, and reflection papers. The participants in Kinach’s study [54] shifted their rather instrumental PCK into more relational PCK, which was measured by means of several documents (i.e., written journals, written homework assignments, and transcribed video-recordings of classroom discussions). All seven studies using mixed methods found an increase in PCK on their qualitative instruments. The results based on the quantitative methods differed. Two studies reported significant PCK improvement after the intervention [28, 46]. Three studies found an increase in PCK but did not report the significance of their results [22, 38, 55]. Two studies only found a significant increase on certain subscales [24, 43]. Burton [24] found a growth in four out of five subscales, of which one was significant. Jang [43] found an increase in PCK on all four subscales, of which two were significant. These differences on the quantitative instruments show that using mixed methods leads to richer results than just focusing on one kind of methodology. The results on the qualitative measurements of these studies are nuanced by the quantitative results.

Because most studies found a positive effect of their intervention on participants’ PCK and only a small contrast in research designs between effective and noneffective studies exists, identifying effective characteristics of interventions is difficult. Nevertheless, we will summarize the results for the PCK sources, the locations, and the main actors of the interventions.

3.3.1. Sources

The PCK sources mainly addressed in effective studies are reflection, PCK courses, teaching experience, and contact with cooperating teachers. Firstly, particularly reflection stands out as an effective PCK source. In Michalsky’s [37] intervention, the best performing condition was the one that most strongly induced reflection. Similarly, reflection was part of 16 other effective interventions. It did not play a role in the noneffective interventions. Secondly, PCK courses were part of most effective interventions and of the noneffective interventions [35, 50]. Several studies concluded that including PCK courses in interventions and explicitly introducing the concept PCK to the participants were beneficial for PCK development [31–33, 43, 53]. Thirdly, contact with cooperating teachers was included in 22 effective studies. Aydin et al. [31, 32] included several aspects in their intervention (such as design of content representations, microteaching, and educative mentoring) but concluded that the mentoring part was the most effective way to promote PCK. Fourthly, teaching experience was part of 20 effective studies and of the noneffective study of Santagata et al. [50]. In Strawhecker [48], the most effective conditions where those including a field experience. Similarly, De Jong and van Driel [21] and De Jong et al. [52] used an intervention that focused on “learning from teaching” instead of “learning of teaching,” meaning that participants learned in a way that involved real situations from practice that made learning more meaningful. Teaching practice seems to play an important role in the development of prospective teachers’ practical knowledge base. These authors argued that preservice teachers get the opportunity in teacher education to link authentic teaching experiences to educational literature on student conceptions. Finally, disciplinary knowledge was not very often addressed in effective studies ( ) and it was part of the two noneffective studies [35, 50]. Studies that did address disciplinary knowledge, or CK, mostly combined it with courses or assignments on PCK (i.e., both effective and noneffective studies). For instance, the interventions of Dash et al. [20] included information related to CK and exercises related to student understanding. In Roth et al. [40], the experimental group that followed a course on CK and a program on learning to analyze educational practice through a PCK framework outperformed the control group that only took part in the content-related course.

3.3.2. Emplacement

Almost all effective interventions took place off-site or combined off-site with on-site parts. However, noneffective interventions also mostly took place off-site or both off- and on-site.

3.3.3. Main Actors

Most effective interventions as well as most noneffective interventions were facilitated by an expert. In six effective studies, equally experienced teachers played a role. More experienced teachers were less prominent in effective interventions.

4. Discussion and Conclusions

This study reviewed intervention studies aiming to promote PCK development. Searching three databases (ERIC, Web of Science, and PsycInfo), a comprehensive dataset of 85 articles was used to address RQ 1: How are intervention studies on PCK development designed? A limited dataset (37 articles) was used to answer RQs 2 and 3: How are interventions that aim at PCK development designed? What elements of interventions that aim at PCK development are effective? The limited dataset only included studies with a pretest-posttest design, given the aim to examine effects of interventions.

RQ 1 aimed at giving a general overview of research on PCK interventions. Most intervention studies took place in primary and secondary natural sciences or math education, focusing on pre- and in-service teachers. The research methodology is diverse, as are sample sizes. Systematic design principles are hardly applied in designing interventions. The predominant emphasis on natural sciences and math in intervention research on PCK could be caused by the high status that society awards to these domains in comparison with other scientific domains, such as social sciences, as illustrated by the inclusion of natural sciences and math in national assessments [56]. Furthermore, there is a larger amount of general educational research on exact sciences [10]. A possible cause for this phenomenon might be that these domains follow a strong linear sequentiality, which makes them more delineated and thus easier to measure and to study [56].

RQ 2 compared the designs of the interventions. The most addressed PCK sources are PCK courses, contact with cooperating teachers, teaching experience, and reflection. The least addressed sources are disciplinary knowledge and observation. Most interventions took place off-site or combined off-site with on-site parts and were facilitated by an expert. Only three studies considered participants’ background characteristics.

Regarding RQ 3, it was difficult to isolate effective characteristics of interventions because the dataset only included two studies that did not find a positive development. Furthermore, reported designs of effective and noneffective interventions were very similar. Nevertheless, a number of general tendencies stand out. Firstly, several PCK sources were part of effective interventions. A large number of studies showed the effectiveness of reflection for PCK development. This is interesting as in the literature on PCK sources, only van Driel and Verloop [10] identified reflection as a possible source for PCK. As Monet and Etkina [46] indicated, not all kinds of reflection are beneficial for knowledge development. Writing a lot not necessarily mirrors ample learning. Only reflection that induces higher order thinking seems beneficial. This makes teachers understand their own learning process, allowing them to apply adequate techniques in their teaching practices [46]. The importance of reflection for PCK development is also mentioned by van Driel and Berry [57]. These authors claim that, in order to promote PCK development, teacher education should be closely aligned to teaching practice and hence should include the possibility for preservice teachers to try out what they have learned and to reflect on their experiences both individually and collectively. Reflection is also considered important for teacher education in general by many scholars. For instance, McIntyre [58] claimed that reflection is important in teacher education for two main reasons: (1) it promotes preservice teachers’ understanding of their own problems and needs and guides their search for solutions for these problems, and (2) it helps to develop reflection skills and habits that will be extremely useful once preservice teachers become more experienced in teaching. Furthermore, the importance of reflection has been shown empirically (e.g., [13, 59]). Brownlee et al. [13], for instance, found that students taking part in a teacher education program focusing on reflection showed more growth in sophisticated epistemological beliefs than a control group taking part in a more traditional, subject-oriented program.

PCK courses were also part of several effective interventions. Most of these interventions included courses or assignments on both student understanding and representations of subject matter. Roth et al. [40] stressed the importance of these two aspects of PCK, thereby avoiding to superficially address everything a teacher should know. Not only have PCK courses been shown to be effective in interventions but also explicitly introduced the concept PCK to the participants. This illustrates that the possibility to understand PCK as knowledge to be learned makes preservice teachers more aware of the learning process they are going through, which helps them in developing as teachers [9]. Teaching experience was part of several effective interventions. Experiences in teaching practice and contact with cooperating teachers also seem to be beneficial for PCK development.

By contrast, disciplinary knowledge was addressed less frequently in effective interventions, while it was part of both noneffective interventions. In effective interventions, it was mostly combined with PCK courses, exercises, or assignments. Hence, CK seems necessary, despite being not sufficient for PCK [12]. This does not necessarily mean that disciplinary knowledge cannot be considered as an effective PCK source. The same applies for the source “observation.” Even though none of the interventions in the dataset addressed this source, observation cannot be concluded to be an ineffective PCK source.

Secondly, most effective studies took place off-site or combined off-site with on-site parts, all guided by an expert. The importance of course facilitation by experts has been shown in several studies. Chae et al. [60] found that expert tutors elicited higher learning gains on algebra problems from students than novice tutors. In Couto et al. [61], medical students considered expert course facilitators as more effective than nonexpert facilitators regarding building knowledge, guiding the learning process, achieving cognitive learning, generating learning goals, and motivating self-study. Furthermore, Hattie et al. [17] and Dignath et al. [62] drew similar conclusions in their meta-analyses of intervention studies on general learning skills and self-regulation. Effect sizes of intervention studies were significantly higher if the intervention was organized by researchers than if it was organized by regular teachers [62]. They claimed that researchers are more concerned with the importance of self-regulated learning. For the present study, this would mean that researchers are more aware than (either more or equally experienced) teachers about the importance of PCK and therefore better succeed in promoting it. However, not all studies in the dataset allowed for drawing this conclusion.

Thirdly, two quantitative studies in the dataset did not find positive results of their intervention, which provides a warning for future intervention research [35, 50]. Particularly, problems in the design of the studies are pushed forward by the authors. Buchholtz and Kaiser [35] gave two possible explanations for the lack of differences in PCK between their intervention conditions and their control conditions (one consisting of preservice teachers not taking part in an intervention and one consisting of students in a nonteaching higher education program). First, the authors indicated some problems with their PCK instrument. It correlated highly with their CK test and the sample of nonteaching students (who also studied mathematics and hence had high CK scores) reached the highest results on the PCK pretest, which is problematic since PCK is considered as a kind of knowledge that is specific to the teaching profession [1, 2]. This illustrates the need for conceptual clarity and valid operationalization of concepts. Second, the groups that were compared were not randomly selected. Each condition represented one higher education institution. The entry requirements of the students differed, in disadvantage of the students taking part in the interventions. This problem did not occur in the experimental studies [20, 39, 50]. However, the experimental study of Santagata et al. [50] also did not find positive effects of the intervention on PCK. These authors described several possible reasons. They drew attention to their sample population, which came from a minority environment and had considerably less knowledge than the national average. As there was a lack of support from the school administrators, the participating teachers might not have tried their best when completing the measurement, which may have rendered doubtful results. It seems indicated to be careful in sampling and to look for a representative if one wants to draw conclusions that are generalizable to a large population. As a solution, the authors suggested to assess teachers’ knowledge before finalizing the design of the intervention and adapt the intervention to the participants’ knowledge level. Furthermore, the authors stressed the importance of sharing the professional development goals with the participants prior to the intervention. This conclusion corresponds to the finding in several effective studies that making the concept PCK explicit to the participants in the beginning of the intervention is beneficial for the effectivity of the intervention.

However, these conclusions should be interpreted cautiously because of several reasons. Firstly, the original meanings of the PCK sources were adapted to the context of the present study. Therefore, the conclusions that are drawn are only related to the adapted meanings of the sources. The authors of the intervention studies did not mention the sources themselves. Secondly, of the 37 studies in the dataset, 35 showed a (partially) positive development in PCK after the intervention. This might mean that most authors who designed interventions did this in a very effective way. However, this result might also be caused by publication bias. “A publication bias exists if the probability that a study reaches the literature and is thus available for combined analysis depends on the results of the study”, p. 6 [63]. Studies that did not find a positive effect of an intervention might not have been published. Thirdly, the conclusions of the present study are based on a small dataset. Furthermore, of the 37 articles that are included in the dataset, only three followed an experimental design [20, 39, 50], and four followed a quasiexperimental design [35, 37, 40, 48]. (Quasi)experimental designs limit the chance of effects to be attributed to extraneous factors. As the majority of the studies in the dataset do not meet the conditions of (quasi)experimental design, it is not sure whether the results that are found in these studies are caused by the interventions or by other variables. Fourthly, researchers mostly stayed rather implicit about their interventions. In most cases, it is not very clear what the interventions exactly comprised. It may be possible that certain sources are addressed in the interventions without being reported. For instance, Monet and Etkina [46] explained that their intervention included teacher-centered and student-centered activities, but they did not further elaborate on these activities.

It would be interesting for further intervention research on PCK to incorporate the following guidelines. Firstly, this review has particularly shown the importance of reflection for PCK development. Further intervention studies are encouraged to include reflection in their interventions. Furthermore, the present study has shown that interventions including courses or exercises on student understanding and educational representations, contact with other teachers, and experiences in educational practice are effective PCK sources. Further interventions could incorporate these elements. Secondly, making PCK explicit to participants in interventions might help them in developing as teachers. Thirdly, course facilitation by experts in the field has been shown to be effective for PCK development. Fourthly, interventions would benefit from a clear conceptualization of PCK. The way in which PCK is operationalized by the different research instruments in the dataset reveals that PCK is understood in different ways. A clear conceptualization, on which PCK instruments are based, might be a sound basis for the systematic design of an intervention. Fifthly, the use of intervention studies that apply experimental designs, compare at least two groups, and use pre- and posttesting [17] to increase the chance that effects are caused by the intervention is advocated. Sixthly, systematic instructional design principles might guide the design of the intervention to be able to exactly find out what parts of the interventions are effective. In any case, additional information is needed on how interventions are designed and what parts they comprise. Seventhly, systematically studying the impact of the different PCK sources would be interesting. Eighthly, since the majority of intervention research on PCK is conducted within the context of the exact sciences, we think it would be interesting for further research to broaden its scope to other disciplinary domains, such as languages or social sciences. Ninthly, we recommend using mixed methodology while studying the effects of educational interventions as this methodology leads to richer, more nuanced results than the use of only quantitative or qualitative methods. Finally, the studies in the dataset did not study the effects of their interventions in the long run. Therefore, it is not sure whether the effects that were found are permanent. Further research is recommended to include retention tests.


Voir la vidéo: Analyse des données: Partie-1 (Décembre 2021).