onsdag 22. januar 2014

Lærerhverdag #38: Karakterer

Mandag 20. januar publiserte den konservative tenketanken Civita et notat om karakterer i barneskolen på sine nettsider. "Debatten om karakterer på barneskolen trenger mer kunnskap," sier de, men har ikke tatt seg bryet med å lese stort av den forskningen som faktisk finnes. Det hindrer dem heller ikke i å konkludere med at "Både hensynet til lærernes vurderingskompetanse, foreldres kunnskap om barnets utvikling og elevens evne til å vurdere seg selv kan tale for en ordning med karakterer." Mon det.

Jeg har lest en del forskning om karakterer, inkludert den ene rapporten de valgte å ta med, så jeg tenkte det kunne være verdt å gå notatet litt nøyere etter i sømmene.

I hoveddelen starter forfatteren med å hevde at hovedargumentet mot karakterer i barneskolen er at det virker demotiverende på faglig svake elever. Det er i beste fall upresist. Jeg kan ikke tale for alle motstandere av karakterer, men jeg er bekymret for de fleste elevene, ikke bare eller nødvendigvis dem som har lav faglig kompetanse. Det er vist at kun de sterkeste elevene tjener på karakterer – og da bidrar det primært til at de liker faget bedre, ikke at de lærer mer (Butler 1988). 


Hovedargumentet for karakterer er delvis basert på OECD-rapporten Reviews of Evaluation and Assessment in Education, som enkelte partier tolket som en anbefaling om karakterer i barneskolen. Kirsti Klette, professor ved institutt for lærerutdanning og skoleforskning ved Universitetet i Oslo, og en av de norske forskerne bak rapporten, avkreftet påstanden i Bergens Tidenes Faktasjekk-spalte:

«Vi (OECD) anbefaler ikke å innføre karakterer på barnetrinnet i denne rapporten - tvert imot. Men vi anbefaler en bedre introduksjon til karakterer i overgangen barnetrinnet/ ungdomstrinnet - især viktige for svake elever som er uforberedt på denne type vurdering og som lett blir demotivert av å stadig få en 2'er uansett egeninnsats. Det er argumentet bak bedre 'assessment practices' i overgangen barnetrinn / ungdomstrinn.»
Kanskje vi heller kan påstå at hvis problemet er at overgangen blir for stor, kan vi like gjerne myke opp bruken av karakterer i 8. klasse? Det vil vel lette overgangen like mye? Så jeg foreslår at vi glemmer OECD i denne sammenhengen. 

De fleste av de øvrige sitatene og referansene Civita stiller med, sier ingenting om karakterer. John Hattie viser ganske riktig at elevenes evne til å vurdere seg selv (såkalt "self-reported grades") er viktig (sammen med, for øvrig, hyppige tilbakemeldinger fra læreren), men karakterer trenger ikke være del av den tilbakemeldingen.

Ellers er det en del rasling med rapporter om at vurderingskulturen kan bli bedre, og det er det jo ikke umulig å være enig i. Flere undersøkelser viser at lærere underkommuniserer med elever som viser lavere faglig kompetanse. Men hvordan og hvorfor karakterer skal gjøre den bedre, er det vanskelig å få øye på. Hvis problemet er at lærere ikke ønsker/tør å "si det som det er" og heller er "snille" i ordvalg og tilbakemeldinger – hvorfor skulle det bli annerledes med karakterer? Vi må vel anta at det ikke er fordi lærere ikke vet at eleven har lav faglig kompetanse at tilbakemeldingene blir ulne? Er ikke sjansen like stor for at en 2-er da blir til en 3-er eller "snill" 4-er?


La oss heller se på forskningen som faktisk er gjort om karakterer. Som all annen forskning i skolen på effektstørrelser, altså "hva som virker", er det svært krevende å isolere effekten av ulike tiltak. Som Hattie påpeker, virker (nesten) "alt". Nesten uansett hva vi gjør, presterer gjennomsnittseleven bedre ett år etter - de lærer litt mer "av seg selv". Som ellers er det derfor god grunn til å se på resultater fra enkeltstående undersøkelser med en sunn porsjon skepsis – det er også derfor store metaundersøkelser, som Hatties, er såpass interessante.

Den politiske høyresiden og her også Cevita trekker gjerne fram økonomen Anna Sjøgrens studie fra 2010, "Betygsatta barn - spelar det någon roll i längden?" som bevis på enten at karakterer er bra eller i det minste viser at forskningen er uklar nok til at man bør gjennomføre forsøk. 


Hvis vi ser litt nærmere på denne studien, så det en kvantitativ, longitudinell studie som undersøker sammenhengen mellom at karakterer ble fjernet i barneskolen tidlig på 70-tallet (og erstattet med annen vurdering) effektene på elevenes senere utdanningslengde og inntekt.

Studien viser at jenter fra hjem med liten akademisk bakgrunn endte med å utdanne seg kortere (tilsvarende ca 3 uker i snitt). Blant annet var det færre som klarte seg gjennom videregående etter at karakterene forsvant. I motsatt ende finner vi at gutter fra hjem med høyt utdannede foreldre tjente på karakterfriheten. Funnene er jo interessante og kan se ut til å støtte en innføring av karakterer - de utjevner forskjeller ved at de som har lavest kompetanse, blir styrket.

Det er likevel verdt å merke seg flere ting. For det første, vet vi lite om hva som kom istedenfor karakterer. Og vi vet alle hva som kan skje når en ytre motivsjon blir tatt bort uten å erstattes av en tilsvarende sterk motivasjon. Dette henger sammen med kvaliteten på læreres tilbakemeldingspraksis, som vi allerede er enige om at kan forbedres. Etter noen år med satsingen Vurdering for læring, ser vi at vi er på rett vei (selv om det fortsatt er noen avsporinger).

For det andre har rapporten blitt kritisert for sin bruk av statistisk metode. Lenken foran er en grundig gjennomgang av det som skal være mangler, mens Sjøgren har svart på kritikken punkt for punkt her. Jeg kan ikke nok om statistikk til å vurdere hvem som har (mest) rett i diskusjonen, men merker meg at den i det minste avdekker at denne typen forskning er krevende og at resultater i enkeltundersøkelser bør veies mot andre funn. Dette er en undersøkelse av svært langsiktige konsekvenser av en 40 år gammel reform, og som Sjøgren sier selv: "i och med att re­sul­tat­en är så att det finns nå­gon liten grupp som gyn­nas och nå­gon liten grupp som miss­gyn­nas så kan man ju väl­ja att ploc­ka de russin som stäm­mer med den eg­na kakan."


Den øvrige forskningen peker på andre effekter av vurdering med karakterer (deler av det følgende er basert på  http://www.alfiekohn.org/teaching/fdtd-g.htm)

1. Karakterer påvirker indre motivasjon for læring
Den psykologiske forskningen på sammenhengen mellom belønning og indre motivasjon er kompleks. Sammenhengen er ikke ensidig negativ, men en lang rekke skolespesifikke studier viser at karakterer trekker elever bort fra en interesse for læring (Benware and Deci, 1984; Butler, 1987; Butler and Nisan, 1986; Grolnick and Ryan, 1987; Harter and Guzman, 1986; Hughes et al., 1985; Kage, 1991; Salili et al., 1976)

Hvis vi tar for oss to av disse, kan vi jo starte med Ruth Butlers fra 1988 (ikke-betal her). Den viste at elever uavhengig av faglig nivå lærte mindre og ble mindre interessert ("an  ego-involving orientation" p 13.) av å få karakterer istedenfor beskrivende tilbakemelding. Men mest interessant er det at en tredje gruppe som fikk både karakter og beskrivende tilbakemelding viste samme utvikling som dem som bare fikk karakter. Man skulle kanskje tro at begge deler var det beste fra to verdener, men det ser altså ut til at den negative effeten av karakteren "slår ut" det positive ved den beskrivende tilbakemeldingen.

Blant dem som lar seg overbevise av denne og annen forskning på området, er de kjente vurderingsforskerne Paul Black og Dylan Wiliam. I "Working inside the Black Box" sier de

Research experiments have established that, while student learning can be advanced by feedback through comments, the giving of numerical scores or grades has a negative effect, in that students ignore comments when marks are also given. (s. 13)
Et lignende forsøk ble gjennomført i 2008 av Lipnevich og Smith, i rapporten "Response to Assessment Feedback: The Effects of Grades, Praise, and Source of Information":

Detailed feedback specific to individual work was found to be strongly related to student improvement in essay scores, with the influence of grades and praise more complex. Overall, detailed, descriptive feedback was found to be most effective when given alone, unaccompanied by grades or praise. (s. i)
Karakterene stjeler fokus fra tilbake- og framovermeldingen læreren gjerne har brukt mye tid på å formulere. Vi ser det ofte i klasserommet - eleven får tilbake arbeidet sitt, blar for å se karakteren og fordyper seg deretter i kommentarene prøver å finne ut hvordan de har gjort det i forhold til de andre. Her finnes det selvsagt strategier for å unngå dette, men for mange er karaktereren "dommen" som gjør all annen tilbakemelding uvesentlig.

2. Karakterer får elever til å velge bort utfordringer.
Karakterer er en utvetydig markør for suksess eller fiasko. Hvis målet er en god karakter, er det naturlig å velge oppgaver og utfordringer som gir størst mulighet for det på kort sikt (Harter, 1978; Harter og Guzman, 1986; Kage, 1991; Milton . fl., 1986). Å prøve en ny sjanger, et nytt ord eller en regneoperasjon men ikke er helt sikker på er derfor et risikoprosjekt - det kan ødelegge for den gode karakteren. Dermed skapes det et press mot å "safe", ikke søke intellektuelle utfordringer. Seier smaker godt, tap gjør vondt.

3. Karakterer svekker kvaliteten på læringen
I et eksperiment utført av Grolnick og Ryan i 1987 viste studenter som fikk beskjed om at de ville få karakter på sin forståelse av en tekst, dårliger forståelse enn studenter som fikk beskjed om at de ikke skulle få karakter. Forsøket til Butler over viser samme tendens. For egen del, hvis jeg kan tillate meg en anekdote, opplever jeg at samtalene med elever om tilbakemeldinger er langt mer verdifulle når de ikke har fått en karakter.

4. Karakterer motiverer for juks
Elever som fokuserer på å få gode karakterer er mer tilbøyelige til å jukse. Årsaken til et slikt fokus kan ligge mange steder, men nettopp fordi karakterer er så (tilsynelatende) utvetydig, blir effekten sterk. Foreldre som betaler for gode karakterer hjelper heller ikke. Mange elever opplever presset for å få gode karakterer gjennom skoleåret som ganske nådeløst. Igjen finner vi forskning som underbygger dette. Anderman m.fl. (1998) og Milton m.fl. (1986) viser at det er større sjans for at studenter jukser hvis de fokuserer på karakterer.

5.  Karakterer gjør eksternalisering enklere
For mange elever er karakteren en definerende faktor i mange fag. "Jeg er en 3-er" og "jeg får aldri annet enn 2 av denne læreren" er ytringer som signaliserer at noe har gått galt. Karakteren oppleves ofte som en merkelapp, en straff, ikke som informasjon.

Carol Dweck bygger på psykologisk forskning når hun viser hvordan tankesettet vårt påvirker evnen vår til å lære og utvikle oss. Med et låst tankesett tror vi at de grunnleggende kvalitetene våre, som intelligens og talent) er låst. Vi bruker tiden vår på å dokumentere disse kvalitetene istendenfor å utvikle dem. Det er også lett å tro at medfødt talent er veien til suksess, ikke innsats.

Med et vekstorientert tankesett tror vi at våre grunnleggende kvaliteter kan utvikles gjennom innsats og dedikasjon - intelligens og talent er bare grunnlaget vi bygger videre på. Dermed utvikler vi en kjærlighet til å lære og en stå-på-vilje som er avgjørende for utvikling og store prestasjoner.
Karakterer er merkelapper som kan bidra til et låst tankesett. Elever som definerer seg selv som "dårlige" eller "2-ere" har mistet troen på at de kan utvikle seg - de har "tapt" skolen.

Så jo, Civita, vi vet litt om karakterer.


(Jeg blir glad for kommentarer om unøyaktigheter, feil etc, for dette er gjort på begrenset tid :-))


Referanser:
Anderman, E. M., T. Griesinger, and G. Westerfield. “Motivation and Cheating During Early Adolescence.” Journal of Educational Psychology 90 (1998): 8493.

Benware, C. A., and E. L. Deci. “Quality of Learning With an Active Versus Passive Motivational Set.” American Educational Research Journal 21 (1984): 75565.

Butler, R. “TaskInvolving and EgoInvolving Properties of Evaluation: Effects of Different Feedback
Conditions on Motivational Perceptions, Interest, and Performance.” Journal of Educational Psychology 79 (1987): 47482.

Butler, R. “Enhancing and Undermining Intrinsic Motivation: The Effects of TaskInvolving and EgoInvolving
Evaluation on Interest and Performance.” British Journal of Educational Psychology 58 (1988): 114.

Butler, R., and M. Nisan. “Effects of No Feedback, TaskRelated Comments, and Grades on Intrinsic Motivation and Performance.” Journal of Educational Psychology 78 (1986): 21016.

Grolnick, W. S., and R. M. Ryan. “Autonomy in Children's Learning: An Experimental and Individual Difference Investigation.” Journal of Personality and Social Psychology 52 (1987): 89098.

Harter, S. “Pleasure Derived from Challenge and the Effects of Receiving Grades on Children's Difficulty Level Choices.” Child Development 49 (1978): 78899.

Harter, S. and Guzman, M. E. "The Effect of Perceived Cognitive Competence and Anxiety on Children’s Problemsolving Performance, Difficulty Level Choices, and Preference for Challenge." Unpublished manuscript, University of Denver. 1986.

Hughes, B., H. J. Sullivan, and M. L. Mosley. “External Evaluation, Task Difficulty, and Continuing Motivation.” Journal of Educational Research 78 (1985): 21015.

Johnson, D. W., and R. T. Johnson. Cooperation and Competition: Theory and Research. Edina, Minn.:Interaction Book Co., 1989.

Kage, M. “The Effects of Evaluation on Intrinsic Motivation.” Paper presented at the meeting of the Japan Association of Educational Psychology, Joetsu, Japan, 1991.

Kohn, A. No Contest: The Case Against Competition. Rev. ed. Boston: Houghton Mifflin, 1992.

Kohn, A. Punished by Rewards: The Trouble with Gold Stars, Incentive Plans, A’s, Praise, and Other Bribes. Boston: Houghton Mifflin, 1993

Kohn, A. “Only for My Kid: How Privileged Parents Undermine School Reform.” Phi Delta Kappan, April 1998: 56977.

Krumboltz, J. D., and C. J. Yeh. “Competitive Grading Sabotages Good Teaching.” Phi Delta Kappan, December 1996: 32426.

Lipnevich, A. A. og J. K. Smith. Response to Assessment Feedback: The Effects of Grades, Praise, and Source of Information.  ETS (2008) (http://www.ets.org/Media/Research/pdf/RR-08-30.pdf)

Milton, O., H. R. Pollio, and J. A. Eison. Making Sense of College Grades. San Francisco: JosseyBass, 1986.

Salili, F., M. L. Maehr, R. L. Sorensen, and L. J. Fyans, Jr. “A Further Consideration of the Effects of Evaluation on Motivation.” American Educational Research Journal 13 (1976): 85102.



5 kommentarer:

  1. Veldig grundig og bra. Jeg kan lite om temaet (underviser i UH-sektoren og der brukes karakterer summativt), men dette var interessant å lese og gav ny innsikt. Lagret i Evernote (med gul understreking her og der).

    SvarSlett
  2. Takk for opplysende lesning, Bjørn Helge!

    SvarSlett
  3. Takk for grundig innlegg som gir et forskningsmessig lys på mye av det lærere erfarer i hverdagen!

    SvarSlett
  4. Takk for hyggelige tilbakemeldinger, alle tre! Glad for at det var nyttig!

    SvarSlett
  5. Leonhard Vårdal5. august 2015 kl. 01:02

    Spennande og interessant lesing. Stadfestar erfaringar med eigne elever.

    SvarSlett