Bandeau

Évaluation : état des lieux et pistes pour mieux faire

La pratique de l’évaluation interroge plus que jamais : la circulaire de rentrée 2014 réaffirme la nécessité de modifier les pratiques d’évaluation pour qu’elles soient au service des apprentissages et non plus de simples évaluations des apprentissages, l’évaluation bienveillante est médiatisée et, en la rentrée 2014, y a été consacrée un dossier de l’IFÉ « L’évaluation pour (mieux) faire apprendre » d’Olivier Rey et Annie Feyfant ainsi qu'un ouvrage de la collection Repères pour agir « L’évaluation plus juste et efficace : comment faire ? » de Florence Castincaud et Jean-Michel Zakhartchouk.

Sommaire

État des lieux

Pistes pour mieux faire apprendre

Bibliographie-Sitographie

Version téléchargeable

État des lieux

Modalités des évaluations

En SVT, deux types d'évaluations sont principalement mises en oeuvre  :

  • des évaluations formatives. Le plus souvent il s’agit d’évaluer des capacités, expérimentales ou non (les tâches, souvent cadrées même si ce n’est que dans un second temps par un guidage collectif trop fermé, ne permettent pas d’évaluer véritablement des compétences) ;
  • des évaluations sommatives à des étapes clés de l’apprentissage.
    Les évaluations des capacités  expérimentales, et le cas échéant d’attitudes, se font le plus souvent en situation d’apprentissage, la mémorisation des connaissances n’est alors pas évaluée mais leur mobilisation peut éventuellement l’être à partir de diverses ressources dont les traces écrites des élèves.
    Les connaissances et la plupart des autres capacités sont évaluées, le plus souvent, en fin d’apprentissage (en réalité les connaissances d’un champ notionnel ont bien été construites mais le développement des capacités reste en cours d’apprentissage).

Avec le socle commun et le LPC, d’une part, et l’évaluation par curseur introduite dans les barèmes du baccalauréat en 2012, d’autre part, l’évaluation par compétence s’installe progressivement. Les devoirs communs proposés à l’échelle de l’académie pour les niveaux 3e et 2nde, basés sur des barèmes par curseur, s’inscrivent dans cette dynamique. Ils permettent aussi de vérifier la solidité des acquis des élèves sur un temps plus long.
Les évaluations diagnostiques restent rares ; dans la plupart des cas ces prises d’informations ne donnent lieu ni à un ajustement de la progression prévue par l’enseignant, ni à une différenciation pédagogique.

▲ Retour au sommaire

Objets évalués

Les productions écrites des élèves, qui sont quasi exclusivement les seules évaluées, sont très diverses (textes, tableaux, graphes, dessins d’observation, croquis, schémas fonctionnels ou non). S’y ajoutent quelques gestes techniques en vue de la préparation des élèves aux ECE. Les attitudes sont très rarement évaluées, en SVT comme dans la plupart des disciplines hormis l’EPS et…. D’une façon générale, les objets évalués sont ceux qui le sont lors des évaluations certificatives (baccalauréat, ECE). L’oral est peu pris en compte, hormis en classe de 3e où la démarche de projet donne lieu à une présentation à la classe.
Résultats de l'enquête de la DEPP (toutes disciplines)
Avec l’histoire géographie, les sciences de la vie et de la Terre sollicitent beaucoup les connaissances selon deux modalités : la restitution et le transfert dans une nouvelle situation.
Résultats de l'enquête de la DEPP (toutes disciplines). Remarque : le terme "compétence" recouvre ici en réalité aussi (voire plutôt) des capacités.

▲ Retour au sommaire

Transparence/clarté des évaluations

Les évaluations sommatives s’appuient sur un champ de connaissances clair, dans la quasi-totalité des cas. Les capacités qui sont souvent précisées dans les supports d’évaluation, sont, elles, moins fréquemment annoncées en amont de ces évaluations. Quand elles le sont, essentiellement au collège, c’est sous la forme d’un référentiel des notions et de capacités/compétences à maîtriser. Cette information permet aux élèves et à leurs parents de cibler leurs efforts et d’éviter un surcroît de travail inutile pour ceux qui seraient inquiets. Par exemple, en 5e, des parents pourraient faire travailler leur enfant sur la réalisation d’un graphique dès le début de cet apprentissage alors que l’enseignant a évidemment prévu une progression pour développer et consolider cette capacité avant de l’évaluer de façon sommative.

D’une façon générale, une attention est portée à la clarté des consignes. Les capacités ou compétences visées sont précisées, y compris les compétences transversales de maîtrise de la langue par exemple.
Formatives ou sommatives, les évaluations sont souvent précédées par une explicitation des critères de réalisation et/ou d’évaluation.
Limitée aux productions non textuelles il y a encore peu, la pratique de l’auto-évaluation s’étend progressivement. Elle aide les élèves à s’approprier les attendus (sinon implicites et inaccessibles aux élèves les plus en difficulté), identifier leurs erreurs ou insuffisances et cibler ainsi leurs efforts. Elle s’appuie parfois sur des critères et est alors insuffisamment précise pour permettre aux élèves d’atteindre cet objectif et de progresser alors que la déclinaison de quelques critères, choisis, en indicateurs plus explicites, rend possible cet objectif.

▲ Retour au sommaire

Communication sur les résultats et suite à donner (feed-back)

En 2004, l’enquête de la DEPP montrait que les professeurs de SVT enseignant au collège considéraient que ce qui exprimait le mieux le niveau d’acquisition des élèves était, dans l’ordre décroissant :

  • une appréciation écrite (80,5 % - 75,8 % toutes disciplines confondues) ;
  • une note chiffrée (75,4 % - 74,6 % toutes disciplines confondues) ;
  • une grille de compétences – ou capacités (68,2 % - 54,3 % toutes disciplines confondues) ;
  • des niveaux - acquis / non acquis… (36,0 % - 43,5 % toutes disciplines confondues) ;
  • des commentaires oraux (31,8 % - 38,0 % toutes disciplines confondues) ;
  • des symboles (5,9 % - 8,9 % toutes disciplines confondues).

Au collège, les pratiques ont quelque peu évolué. Presque tous les professeurs font état, lors des évaluations, formatives et sommatives, d’un bilan (en termes de niveau de maîtrise) pour quelques items de la compétence 3 du socle commun et, parfois, quelques autres plus transversaux.
Au lycée, le bilan distingue très fréquemment les connaissances des capacités (ou des compétences) et/ou les différents exercices du baccalauréat de la série considérée.
Ces informations étant indiquées sur le support d’évaluation ou sur un document d’application du barème, les élèves disposent ainsi régulièrement d’un bilan par capacités ou compétences (mais qu’ils continuent fréquemment à prendre pour une évaluation de leur propre valeur, en particulier s’il est adossée à une notation).

La notation reste pour beaucoup d’enseignants une référence forte surtout lorsqu’elle est établie à partir d’un barème. Le barème de notation est en effet considéré comme garant de la « justesse » et de la « justice »,  parfois davantage lorsqu’il s’agit d’un barème par accumulation de points plutôt qu’un barème par curseur. En 2004, la même enquête de la DEPP montrait que 90,7 % des enseignants de SVT de collège considéraient le barème – par accumulation de points à l’époque – comme garant d’une notation juste. Il s’agissait de la discipline la plus confiante en son barème (même si la confiance était élevée pour toutes les disciplines – minima de 72 et 73 % respectivement en EPS et arts plastiques).
Pourtant, la docimologie, c’est-à-dire l’étude de la façon dont sont attribuée les notes, a montré l’influence :

  • du contexte (établissement, classe, ordre des copies) ;
  • de l’élève (origine sociale, genre masculin/féminin, apparence physique, notes précédentes dans la disciplines, niveau scolaire dans les autres disciplines) ;
  • de l’évaluateur, qu’il s’agisse d’une variation interpersonnelle (niveau d’exigence quant à l’expression écrite…) ou intra personnelle (fatigue, distraction momentanée, moment de la journée, …). Pour approfondir

Cette confiance est probablement à l’origine du fait que les professeurs ne modifient que rarement leur barème après quelques copies et transforment encore plus rarement une évaluation sommative en évaluation formative (ce dernier point trouvant aussi peut-être sa source dans le besoin d’un nombre suffisant de notes pour calculer une moyenne trimestrielle).

Expérience EncouragementLes appréciations, orales ou écrites, mentionnées sur une évaluation ponctuelle ou un bulletin trimestriel, n’apportent aucune information voire sont contre-productives quand elles se limitent à un jugement général tel « Insuffisant » ou « Peut mieux faire » ou caractérisent les insuffisances de façon trop vague par des mentions comme « Manque de rigueur » ou « Incomplet ». Elles sont, en revanche, très utiles pour encourager, signifier des progrès et/ou fournir des pistes concrètes pour mieux faire : par exemple, à l’appréciation « Les documents sont bien exploités mais l’apport de connaissances est insuffisant » peut s’accompagner, selon le cas, de la piste « Prenez le temps, au brouillon, de lister les connaissances susceptibles d’être mobilisées » ou « Venez me voir pour que nous trouvions comment ajuster /améliorer votre méthode de mémorisation ».

▲ Retour au sommaire

Suivi des acquis par les élèves

Au collège, il peut correspondre :

  • à des items de la compétence 3 du socle commun et quelques autres plus transversaux des compétences 1, 6 et 7. Un tel suivi permet de mettre en évidence des progrès mais la précision est insuffisante pour permettre à un élève de cibler ses efforts. En 5e, présenter ses observations sous la forme d’un dessin d’observation ou un croquis et réaliser un schéma fonctionnel doivent évidemment être distincts !
  • à des items beaucoup plus précis, c’est-à-dire à l’échelle de la micro-capacité ou micro-compétence. Cette échelle est opérationnelle pour un élève qui s’initie à des techniques et méthodes, mais n’est efficace que si l’élève peut se concentrer sur un nombre réduit de micro-capacités ou micro-compétences.

Au lycée, le suivi n’est organisé qu’en seconde, les professeurs proposent alors, en général, des grilles construites dans le prolongement de celles utilisées au collège. Ce suivi est plus fréquemment organisé par les professeurs qui ont enseigné en collège ou enseignent en cité scolaire. 

▲ Retour au sommaire

Suivi des acquis par les professeurs

Au collège, il s’effectue au moyen d’un relevé précis dans un « relevé de notes » détourné, une grille, un tableur ou toute autre application numérique. Il peut correspondre à des items de la compétence 3 du socle commun et quelques autres plus transversaux des compétences 1, 6 et 7. Parfois le suivi est beaucoup plus fin, à l’échelle de la micro-capacité ou micro-compétence, ce qui peut engendrer des usines à gaz !

Au lycée, le relevé est moins fin. Il distingue néanmoins très fréquemment les connaissances des capacités (ou des compétences selon le niveau de précision) et prend en compte les différents exercices de l’épreuve écrite du baccalauréat de la série considérée et, parfois, les étapes de l’ECE en filière S.

▲ Retour au sommaire

Utilisation des résultats des évaluations pour réguler les apprentissages

Les résultats obtenus en 2004 (DEPP – Q37) semblent encore représentatifs des pratiques actuelles et pouvoir s’étendre au lycée. Les enseignants de SVT de collège déclaraient alors utiliser les résultats des évaluations pour :

  • revenir sur des points du programme pour 49,2 % d’entre eux (64,1 % toutes disciplines confondues) ;
  • repenser leur façon d’évaluer pour 44,1 % d’entre eux (39,9 % toutes disciplines confondues) ;
  • réorganiser les contenus d’enseignement pour 43,6 % d’entre eux (47,5 % toutes disciplines confondues) ;
  • proposer des actions de remédiation pour 31,8 % d’entre eux (47,3 % toutes disciplines confondues) ;
  • faire le lien avec les autres disciplines pour 28,0 % d’entre eux (24,5 % toutes disciplines confondues) ;
  • individualiser les apprentissages pour 26,3 % d’entre eux (36,3 % toutes disciplines confondues) ;
  • regrouper les élèves par type de besoins pour 7,6 % d’entre eux (19,4 % toutes disciplines confondues).

Bien que « revenir sur des points particuliers du programme » et « réorganiser les contenus d’enseignement » aient été les plus souvent cités, ces pratiques étaient moins fréquentes en SVT que dans les autres disciplines. Les pratiques de personnalisation, quelles qu’elles soient, étaient également plus rares. En revanche, ils s’interrogeaient davantage que leur pratique de l’évaluation que les enseignants des autres disciplines. Peut-être aussi parce que ces pratiques étaient parmi les plus individuelles (peu de travail transdisciplinaire ou d’équipe disciplinaire, au-delà de la mutualisation des énoncés).

Les devoirs communs sont plus fréquents. En lycée, aux épreuves blanches proposées en 1ère L/ES et terminale S, s’ajoutent fréquemment des devoirs communs en première S et parfois en seconde. En 3e et 2nde les professeurs peuvent désormais faire participer leurs élèves à un devoir commun académique. Pour chacun de ces niveaux ils proposent des modèles d’énoncé et d'évaluation qui permettent aux professeurs de davantage viser des objectifs communs et de moins évaluer par la comparaison des élèves d’une classe ou d’un établissement (ce qui se traduit le plus souvent par une distribution des notes selon une courbe de Gauss plus ou moins centrée sur la moyenne d’où la notion d’évaluation normative).

Remarque
Situer un élève par rapport à un groupe de référence peut néanmoins avoir son intérêt si ce diagnostic ne se reproduit pas trop souvent et si le groupe de référence n’est pas trop étroit*, en particulier pour alimenter les choix d’orientation. C’est à cette fin que ces devoirs communs sont organisés pour les niveaux 3e et 2nde qui sont des paliers d’orientation. S’il n'est pas souhaitable d’appuyer son avis sur cette seule évaluation, elle peut cependant constituer un élément de réflexion à mettre en regard des pratiques mises en place par le professeur pour adapter son enseignement à la diversité de ses élèves. Adapter son enseignement à la diversité des élèves suppose d’adapter les situations d’apprentissage mais aussi les situations d’évaluation, or en 3e et 2nde beaucoup d’enseignants hésitent à proposer des situations d’évaluation adaptées, et plus encore des évaluations différenciées - hormis pour les élèves néo-francophones et autres élèves à besoins spécifiques – du fait qu’il s’agit de paliers d’orientation).

*L’ensemble des élèves ayant participé constituant un échantillon suffisamment représentatif, l’observation des résultats obtenus à l’échelle académique atteste (ou pas) que les exercices proposés satisfont les objectifs communs visés. 

Les pratiques d’évaluation des enseignants de SVT ont évolué mais, comme celles des autres disciplines, elle est encore trop souvent chiffrée et normative et, si elle reste un levier pour faire progresser les meilleurs, elle peut aussi décourager les plus fragiles dont l’estime de soi ne cesse de diminuer et le sentiment d’impuissance d’augmenter (et cela d’autant plus qu’ils ont fourni des efforts). Comment mieux faire ?

▲ Retour au sommaire

Pistes pour mieux faire apprendre

Adapter l’évaluation à la progressivité des apprentissages

Les différents types d’évaluation se succèdent théoriquement selon la temporalité suivante :

 Temporalité des évaluations

Cette temporalité ne peut s’appliquer, du moins en SVT, à toutes les connaissances, capacités ou attitudes travaillées. Elle peut néanmoins s’appliquer pour quelques éléments clés en fonction du niveau de classe et du public considéré.

Une bonne connaissance de ses élèves peut suppléer à quelques évaluations diagnostiques (à bien distinguer de la mobilisation des représentations initiales qui ne vise pas seulement à donner de l’information aux professeurs mais aussi à faire prendre conscience aux élèves de l’état de leurs savoirs).

Le temps long de certains apprentissages est difficilement compatible avec l’élaboration de bilans trimestriels, pour l’heure chiffrés dans la plupart des cas (les expériences de classes sans notes se multiplient. Voir en lien l’article de l’IGEN). Que les évaluations sommatives soient chiffrées ou non, il convient de s’attacher à :

drapeau blanc-fond bleu n’évaluer ainsi que les apprentissages déjà quelque peu consolidés (la solidité ayant été vérifiée par une (des) évaluation(s) formative(s), formelle(s) ou informelle(s) en circulant dans la classe).

Comme les évaluations formatives, les évaluations sommatives peuvent distinguer différents degrés de maîtrise correspondant respectivement à des tâches simples (restitutions de connaissances, reproduction de gestes techniques ou de raisonnement à l’identique), des tâches cadrées (qui nécessitent une transposition) et des tâches complexes (qui nécessitent à la fois une transposition et la coordination de connaissances, capacités et attitudes). Aussi :

drapeau blanc-fond bleu choisir le(s) type(s) de tâche(s) proposé(s) en fonction de l’état des apprentissages ;
drapeau blanc-fond bleu varier le niveau de difficulté des tâches proposées pour que chacun puisse réussir.

▲ Retour au sommaire

Diversifier l’évaluation pour mieux s’appuyer sur les points forts

Compte tenu de la quasi exclusivité accordée aux écrits individuels ou élaborés en binôme, par ailleurs souvent diversifiés, on peut dégager les pistes suivantes (à ne pas mener de front !) :

drapeau blanc-fond bleu évaluer les gestes techniques, comme ils le sont durant l’épreuve pratique d’évaluation des compétences expérimentales (ECE) ;

drapeau blanc-fond bleu évaluer à l’oral (introduit en 2013 dans l’épreuve pratique d’ECE sous la forme d’une présentation brève aidée par le questionnement de l’évaluateur), ce qui implique de développer la pratique de l’oral.  Ex : présentation de résultats de recherche.

Pour suivre cette piste : http://www.christiandumais.info/
Voir en particulier le diaporama synthétique : L’évaluation de l’oral au primaire (14 novembre 2008) ,

drapeau blanc-fond bleu évaluer le travail de groupe

Pour suivre cette piste :
http://www.ac-nice.fr/pacte/Filieres/Dijon/Travailler%20en%20groupes.htm

http://www.cdc.qc.ca/ped_coll/pdf/aylwin_ulric_07_3.pdf

▲ Retour au sommaire

Aider les élèves à s’approprier les attendus et à prendre conscience de leurs raisonnements

Ce sont là des objectifs essentiels des auto-évaluations, qui peuvent alterner avec des évaluations par des pairs pour travailler sur les mêmes objets en faisant prendre conscience à l’élève des non-dits/non écrits, des approximations… tout en mettant une certaine distance. Dans les deux cas il s’agit de :

drapeau blanc-fond bleu fournir aux élèves des indicateurs suffisamment précis.
En effet, « J’ai fourni les informations nécessaires à la résolution du problème » peut aider les élèves à résoudre le problème en rappelant que plusieurs informations sont nécessaires (critère d’intégralité) et que la réponse doit être construite en fonction de la situation (critère de pertinence), mais son caractère général rend impossible pour un élève tout acte d’évaluation au sens utilisé traditionnellement (exactitude de la réponse). Pour cela il lui faut au moins savoir quelles sont lesdites informations !
A l’exception des indicateurs caractérisant les gestes techniques et les méthodes, ces indicateurs ne peuvent être fournis, ou mieux dégagés d’une mutualisation, qu’après le travail.

Un des meilleurs indices laissant espérer la réussite scolaire est la capacité qu’a l’élève de réfléchir sur ses connaissances, à comprendre ses raisonnements et ses stratégies d’apprentissages (métacognition), d’où, en particulier pour les plus en difficulté :

drapeau blanc-fond bleu proposer des situations permettant de développer les compétences métacognitives des élèves, parmi lesquelles l’explicitation orale au professeur ou à un pair. L’accompagnement éducatif ou personnalisé peut être un moment privilégié pour travailler ces compétences au moyen de jeux sérieux. Voir d’autre exemple dans « En savoir plus, les cahiers Pédagogiques ».

Parmi les autres pistes se dégageant de l'état des lieux :

drapeau blanc-fond bleu fournir des appréciations suffisamment précises pour être constructives.

▲ Retour au sommaire

Cibler quelques objectifs… pour se donner une chance de les atteindre !

La volonté de bien connaître le profil des élèves conduit parfois à une frénésie de l’évaluation. Les élèves sont sans cesse évalués et sur tout ! Si cela peut désacraliser le processus d’évaluation, cela engendre bien sûr un certain stress pour les élèves qui, de surcroît, ne sont pas évalués qu’en SVT ! La connaissance des objectifs de chaque niveau (programme, référentiel de compétences indiqué dans le vade-mecum, que l’on peut croiser pour plus de clarté), d’une part, et quelques évaluations diagnostiques faites en situation d’apprentissage, d’autre part, doivent permettre de choisir quelques compétences sur lesquelles davantage cibler le travail et le suivi. Leur niveau de précision dépendra du niveau de classe considéré pour éviter leur découpage systématique en micro-capacités ou micro-compétences, qui ne peut avoir d’intérêt qu’au tout début du processus d’apprentissage. Quelques pistes :

drapeau blanc-fond bleu cibler l’attention des élèves sur quelques capacités, attitudes ou compétences clés choisies en fonction

du niveau de classe - ex : réalisation d’un schéma fonctionnel en 5e, élaborer un paragraphe argumenté en 2nde,  distinguer une simulation ou une modélisation de la réalité en 4e,
des besoins des élèves
- ex : réalisation d’un graphe, à consolider ou non en classe de 2nde ;

drapeau blanc-fond bleu évaluer à un degré de maîtrise adapté à la progression des élèves (tâche simple, cadrée et complexe autant que possible) ;

drapeau blanc-fond bleu organiser le recueil des données de façon à montrer les progrès
Exemple en 2nde : l’objectif est de consolider la réalisation d’un graphe dans une situation de tâche cadrée puis de l’introduire dans la résolution d’une tâche complexe donc de difficulté plus élevée. Si cette capacité est évaluée sur 5 points dans deux évaluations sommatives successives, alors l’élève qui obtiendrait 4,5/5 puis 2/5 aura l’impression d’avoir régressé (éventuellement malgré des efforts) alors que ce ne sera pas le cas. De nombreux exemples de relevés non chiffrés ont été expérimentés au collège (indication des degrés de maîtrise par des ceintures semblables à celles des judokas par exemple)

drapeau blanc-fond bleu proposer des activités pour consolider la maîtrise de compétences déjà acquises et/ou pour le plaisir (!), et non seulement dans le but d’une future évaluation.

▲ Retour au sommaire

Utiliser les résultats des évaluations pour réguler les apprentissages

En SVT, les programmations construites par les enseignants sont souvent denses, ce qui se traduit par un faible retour sur les erreurs observées lors des évaluations sommatives. Il est pourtant nécessaire de :

drapeau blanc-fond bleu réviser sa progression et sa programmation de façon à revenir sur ces points particuliers du programme (connaissances, capacités ou attitudes).
Par exemple, en 4e si les élèves n’ont pas assimilé la notion d’aléas introduite à partir des risques sismiques, il est possible d’y revenir dans le domaine de la santé. De même, si, à propos de la durée moyenne des règles et de la période moyenne de l’ovulation, la notion de dispersion statistique n’est pas comprise, il est possible d’y revenir à propos de la taille d’un nourrisson à sa naissance.

L’objectif n’est pas d’individualiser dans leur totalité les apprentissages, ce qui relèverait davantage du préceptorat que du professorat ! Mais il s’agit de proposer à chacun des situations de travail qui permettent effectivement des apprentissages.

Pour personnaliser les apprentissages dans la classe :

drapeau blanc-fond bleu organiser des groupes de besoin et/ou d’élèves aux compétences complémentaires ;
drapeau blanc-fond bleu proposer des activités différenciées (ateliers mosaïques menés en parallèle par exemple).
Outre les aides orales et les coups de pouces formels fréquemment proposés, la conception d’une séance différenciée par trimestre et par niveau de classe conduirait à proposer, en trois ans, 1  séance différenciée sur 4.

Pour personnaliser les apprentissages hors la classe :

drapeau blanc-fond bleu proposer aux élèves des travaux adaptés à leurs besoins (les manuels précisant désormais tous les capacités ou attitudes ciblées, ce travail peut être fait au CDI)
drapeau blanc-fond bleu utiliser les dispositifs prévus (accompagnement personnalisé en 6e et au lycée, accompagnement éducatif en 5e, 4e et 3e).

 

Apprendre à l’élève à mesurer ses propres progrès en comparant ses résultats avec des résultats antérieurs et non en les comparant avec ceux des autres, adopter une approche positive de l'erreur et donner le droit de se reprendre, encourager l'engagement, le dépassement de soi, le recours au savoir stratégique et la persévérance devant la difficulté, telles sont les bases d'une « évaluation bienveillante », au service des apprentissages.

▲ Retour au sommaire

Bibliographie / sitographie 

Pour en savoir (encore) plus :

▲ Retour au sommaire