I år hadde jeg ingen avgangselever og føler derfor at jeg har et relativt avslappet forhold til resultater. Dermed vil følgende observasjoner i minimal grad handle om sårhet eller stolthet på vegne av meg selv eller elevene mine. De er også basert på at min vurdering er "bedre" enn sensuren. Men når flere lærere uavhengig av hvarandre kommer til samme konklusjoner, og spriket mellom sensur og standpunkt (viser det seg) er betydelig, tror jeg at det er grunnlag for noen påstander.
Skriftlig eksamen i hovedmål er noe alle skal gjennom, det er en slags "fasit" på 12 års morsmålsopplæring og svært styrende for undervisning og vurdering gjennom videregående skole. Jeg har sett på resultatene på skolen generelt og konkrete besvarelser spesielt og er faktisk sjokkert over hvor liten sammenheng det er mellom prestasjoner og karakterer i em del tilfeller. Meget gode tekster får lave karakterer, mens dårlige tekster gjør det bedre. I konkrete tilfeller kan tekster som etter min mening burde fått mellom 5 og 6 havner på 3, mens tekster som kanskje kvalifiserer til 2 gis 4. Det virker som sensorer har veldig ulike utgangspunkt for vurdering - for noen er språkføring veldig viktig, for andre nesten uvesentlig. For noen er sjanger avgjørende, mens andre slipper gjennom tekster som knapt kan plasseres i noen sjanger. Kildebruk fortsetter å være bortimot fraværende i de aller fleste tekster, uten at det ser ut til å bety all verdens. Når en åpner for bruk av alle kilder, bør vel krav om god og etterrettelig kildebruk være en naturlig konsekvens?
Sensorveiledningen, vurderingsveiledningen og veiledningsteksten elevene får til hver oppgave burde vel bidra til både bedre resultater og jevnere bedømming? La oss for eksempel se på veiledningsteksten elevene og sensorene fikk til oppgave 1 våren 2012 (min utheving):
Du skal skrive om både form og innhold i de to vedleggene, men du kan velge
hvordan du vil strukturere svaret ditt. For å vise god kompetanse bør du
sammenlikne teksten og maleriet på en presis og oversiktlig måte og bruke
eventuelle kilder relevant og selvstendig.
Veiledningen er altså:
Skriv om både for og innhold (avgjørende - men for hva? Å stå? God måloppnåelse?).
Presist og oversiktlig sammenligning er lurt, men ikke avgjørende for en god tekst (hva er alternativet?)
Kilder er ikke nødvendig. Og bruker du det, er "relevant og selvstendig" (hva nå enn det er) et "bør"-krav.
Er dette egentlig til hjelp for eleven? Eller sensor?
Her er et klipp fra vurderingsskjemaet sensorene brukte:
Hva er forskjellen på "tematisk sammenheng" og "klar tematisk sammenheng"? Hva er forskjellen på "bruke bredt register av språklige virkemidler", "bruke språklige virkemidler" og "bruke noen enkle språklige virkemidler"?
Jevnt over er karakterene lave. Kanskje er det fordi elevene kan velge oppgaver som:
Bruk to eller flere av vedleggene, og skriv et essay der du reflekterer over de tankene om
kjærlighet som kommer til uttrykk i tekstene. Lag overskrift selv.
Skal dette vise noe som ligner elevens samlede kompetanse etter 12 år? Og hjelpen elevene får, er:
Det skal komme tydelig fram at de vedleggene du velger, er grunnlaget forDet er lite motiverende å holde på med norskfaget når eksamen er så tilfeldig som den er. Oppgaver og veiledning er sikkert laget i beste mening og sensorene gjør sikkert sitt beste for å gi en rettferdig vurdering av elevenes besvarelser, men resultatet er ikke presist nok. Slik sett er det pussig at motviljen er så stor til å endre vurderingsformen.
refleksjonene dine. For å vise god kompetanse bør du gi essayet klare
sjangertrekk.
Kan 200 besvarelser på tre uker (på toppen av ordinært arbeid) med middels god betaling, bidra til at lesningen ikke alltid er god nok? Hva skjer hvis en sensor har 3 og en 5? Lett å møtes på midten? Eller diskuteres besvarelsen grundig? Sensorkurset er frivillig. Det er mange faktorer her som ikke er vanskelige å forstå eller til og med begrunne, men summen blir en sensur som for ofte slår feil ut.
Jeg vil for øvrig også gjenta ønsket fra 2010:
Besvarelsene som sensorene får, er merket med skolens navn. Jeg forstår ikke hvorfor det er nødvendig, og det skaper uheldige muligheter:
Case 1: En av mine slektninger går på en skole som jeg har fått i oppgave å sensurere. Case 2: En lokal konkurrerende skole ligger i bunken min.Case 3: En skole der faglæreren er en god venn av meg, ligger i bunken min.
Her finnes det flere muligheter, og samtlige ville vært unngått hvis skolene ble anonymisert vha et nummer. Ettersom en funksjonene til sentralt gitt skriftlig eksamen er å være en nøytral vurdering av sluttkompetanse, burde en gjøre så mye som mulig for å unngå faktorer som truer det. Selvfølgelig kan en si at vi må stole på at sensorene forholder seg profesjonelt til dette, men det virker unødvendig at de skal trenge å gjøre det.
Et lite spørsmål til slutt:
Er det virkelig slik at norske ungdommer har høyere kompetanse i engelsk enn i norsk (tatt i betraktning, selvsagt, at målene er ulike)? Men likevel?
Skoleporten |
Oh yes. Kan bekrefte dette fra et (tidligere) elev-ståsted. Jeg fikk en 3'er på norskeksamen. Det er den eneste 3'eren på hele mitt vitnemål. Den sier absolutt ingenting om min norskkompetanse - jeg hadde 6 i standpunkt både skriftlig og muntlig, det på en karakterstreng skole. Det var visstnok mange lave karakterer det året, pga en populær, men uklart skrevet oppgavetekst som svært mange misforsto. De gode tekstene fikk 3 "selv om de skrev oppgaven galt" fikk vi forklart. Nå hadde ikke dette noen konsekvenser for meg personlig, men hadde jeg søkt meg inn på et kompetitivt studie, er det utrolig at noe så tilfeldig skal kunne avgjøre fremtiden din..
SvarSlettJeg er også veldig enig. Spesielt har jeg mange som har gjort det dårlig på essayoppgaven over, og på språkoppgaven hvor man skulle ta utgangspunkt i sitt eget talemål. Begge disse åpner i veldig stor grad for at eleven skal gå i feil retning, og dette burde man tenke på når man lager oppgavene. Jeg har også, som Beate over skriver om, elever som gikk fra 4 og 5 i standpunkt til 2 på eksamen. Eksamenskarakteren er overhodet ikke representabel for nivået disse elevene er på. Jeg har også fått gjengitt fra kolleger som har vurdert eksamen hvor få 5-ere som faktisk gis, og der er det noe feil, enten er undervisningen for dårlig slik at elevene ikke kan det de skal, ellers er det noe feil med karaktersettingen, rett og slett.
SvarSlettLurer på om Udir har gått inn og sett på karaktersettinga i norsk, og jeg tenker da på grad av samsvar eller manglende samsvar mellom sensorer når det gjelder karaktersetting.
SvarSlettDu foreslår å anonymisere skolene, jeg tror vel det er mer grunnleggende svakheter ved denne type eksamen som på sett og vis vel skal være et slags korrektiv for faglærerne. Det må vel også også oppfattes som en mistillit til faglæreren som har fulgt eleven i og vurdert eleven underveis og i form av årsprøver osv. Betalingen for denne type overtidsarbeid i vakre juni måned er jo forholdsvis sparsommelig. Det gjør at en må ha et visst tempo for bli ferdig i tide, og for at betalingen skal stå i forhold til timene som legges ned.
Det viktigste er likevel om eksamen måler det den skal måle, om målingen er valid. Jeg tror nok sensorene kjenner på en viss grad av kynisme. De vet at det er tilfeldig hvilken type medsensor (streng, snill, vanskelig, opptatt av kommefeil??)en skal forholde seg til, de vet at sensormøtet ikke gir rom for grunnleggende faglige diskusjoner, relesning av mange tekster osv.
I år opplevde jeg som sensor at jeg ved en glipp hos fylkesmannen fikk tilgang på karakterene til medsensor én dag før sensormøte. Dessverre ble "glippen" oppdaget, men jeg rakk å lese på nytt noen av tekstene der vi hadde sprik. Jeg synes det kanskje var en god måte å forberede seg på sensormøtet (som mange sensorer gruer seg til). Man kan da bruke noe tid på å se litt systematisk på om det er spesielle oppgavetyper en vurderer forskjellig, om en kanskje har vært noe for streng eller snill osv. Slike diskusjoner er vanskelig å ta på et sensormøte der det er et sterkt ønske om å bli ferdig.
@Leif: Forlaget om anonymisering var mer et apropos enn et forslag til løsning. Å få opplyst hvilken skole det er snakk om er bare en ekstra, nå helt unødvendig, tilleggsfaktor som kan bidra til lavere tillit til vurderingen.
SvarSlettJeg er helt enig i at svakhetene med eksamen handler vel så mye om andre ting - oppgaver, veiledningstekst, sensorveiledning og -skolering og andre ting. Jeg lurer også på hvordan Udir sjekker opp resultater. Det kunne også vært interessant om man prøvde ut at 10-20 tekster (gjerne fiktive besvarelser) havnet hos mange sensorer for å få et innblikk i hvor likt eller ulikt de vurderes.
Kanskje mappevurdering hadde vore ei meir representativ vurderingsform av skrivekunne?
SvarSlettHer peker du på noe som er interessant og viktig - som hårsår faglærer for avgangselever OG sensor over syv år kan jeg ikke være uenig. Et eksempel: en av mine "sterke", skrivekyndige elever fikk 3 på en glimrende besvarelse av oppgave 1, om det norske. Hun gjør som instruksen sier, språk, struktur, form og innhold er godt, hun bruker eksempler osv. Jeg kan ikke se hva sensorene har trukket henne for, annet enn at hun kaller den ene teksten en novelle (den er vanskelig å sjangerbestemme). Jeg har anbefalt henne å klage - klagesensuren har bedre tid. Og får bedre betalt?
SvarSlettHadde jeg fått denne oppgaven i en bunke hadde jeg jublet! Jeg har tre elever til som har fått mye svakere enn tekstene tilsier og enn standpunktkarakteren tilsier. Jeg tror klagesensuren blir travel i år. Dette er jo rett og slett litt flaut - men kanskje er deler av problemet at sensorene har så dårlig tid at de ikke rekker å sette seg inn i oppgavene og vurderingsveiledningen? Og når veiledningen i tillegg spriker slik som den gjør i eksempelet ovenfor er farsen komplett.
Jaja, Bjørn Helge - fortsett å være systemkritiker! Kanskje vi kan få endra noe.
Dette er en viktig debatt. Spesielt det som handler om vurderingsform og vurderingskriterier. I min lærerkarriere (20 år i grunnskolen) var eksamen blant annet et vanskelig punkt å forberede elevene på.
SvarSlettVi hadde jobbet med mapper gjennom 3 år og elevene fikk vist sin breddekompetanse ved at de selv valgte ut et representativt utvalg tekster i ulike sjangre. De holdt selv kontroll over hva de ønsket å levere og var selv egenvurderere av egne tekster helt fram til innlevering til siste bedømming. Likevel måtte vi forberede oss på en "vanlig eksamen/avgangsprøve". Denne heldagsprøven kunne treffe noen elever og de kunne kanskje gjøre det godt, avhengig av hva sensor likte eller ikke likte. Dette var bekymringsfullt!
Jeg gjennomførte en stor gransking av samtlige avgangsprøver i grunnskolen høsten 1998 og kom i grove trekk fram til at de elevene som behersket både form og innhold fikk de beste karakterene. Mest fokus fikk faktisk formen på teksten og oppbygging av teksten med for eksempel parallellfortellinger ble belønnet med god karakter. Jeg sjekket kun nest høyeste karakter (den gang M, nå 5) og nest laveste karakter (den gang Ng, nå 2). Undersøkelsen avslørte mange bekymringer, blant annet at elever som hadde dårlig håndskrift fikk dårligere karakter enn det de innholdsmessige og formmessige kriteriene skulle tilsi.
Jeg stilte en del spørsmål til sensor: "Spissformulert er det grunn til å stille følgende spørsmål: Ønsker sensor å se hva eleven har prøvd å få til, eller har han eller hun sin egen tolking som fasitsvar og vurderer sensor dermed elevens tekst ut fra dette fasitsvaret?".
Det er så mange problemer i forhold til sensur og menneskelige (les: sensorenes) preferanser at dette kunne vært tema på en hel konferanse. Det kunne jeg godt delta med flere spørsmålsstillinger, spesielt når det gjelder de fortellende tekstene til elever. Disse tekstene er oftest de som sensorene synes er vanskeligst å bedømme på alle nivåer i skoleverket. Jeg husker at vi en gang på 1980-tallet sendte en fortellende tekst fra eksamen i vgs til ulike sensorer i vgs og denne ene og samme teksten havnet på samtlige karakterer fra 1-6! Nå har vi fått kriterier, men jeg er usikker på om det er blitt noe bedre?
Her trengs flere forsøk på ulike eksamensformer og mer arbeid med kriterier. Jeg ville helst velge meg mappevurdering som vurderingsmetode gjennom hele skoleverket og til og med i høyskole og på universitetene. Se Delogbruk: Mappevurdering.
Hei, Bjørn Helge.
SvarSlettJeg kan godt gi elendigheten et ansikt ved å innrømme å ha sensurert 204 av årets hovedmålsbesvarelser. Jeg liker jo å tenke på meg selv som en hederlig og kompetent sensor med konsekvent og rimelig bruk av de tildelte retningslinjer for sensur og vurdering, men jeg er sannelig ikke sikker lenger. I alle fall er det flere av dine gode venner her som peker på urovekkende sider ved sensuren, og som er de samme som det jeg selv har erfart.
I årets haug med hovedmålsbesvarelser var det stort sett oppgave 2, 4 og 5 som var forsøkt besvart av ungdommen. Jeg vil rolig tippe at ca 90% av de besvarelsene jeg sensurerte, fordelte seg på disse tre. De som hadde valgt oppgave 4, tolking av en novelle, kom stort sett hederlig fra det. En kan sikkert si mye om novelleanalyse som oppgavetype, men det ser her ut som om elevene i all hovedsak skjønner hva som blir forventet av dem både når det gjelder innhold, metode og sjanger, og det er jo i seg selv en god ting.
Verre er det med oppgave 2 og 5, oppgaver som ærlig talt er to feller for elevene. Oppgave 2 ber dem som kjent om å skrive en artikkel om sin egen muntlige og skriftlige bruk av språket, og her går de aller fleste forståelig nok i baret både når det gjelder sjangervalg og innhold.
Det samme gjelder til dels oppgave 5. Her er det ulikt i hvor stor grad elevene skriver med utgangspunkt i tekstvedleggene, noe oppgavene eksplisitt ber dem om, men et dominerende fellestrekk er at de ganske raskt går over til å skrive generelt og bejublende om hvor flott og berusende det er å være forelsket. (En av kandidatene ga til og med uttrykk for at han ble så oppstemt at han ikke kunne komme seg raskt nok ut av eksamenslokalet.) Akkurat det er det jo lett å være enig i, men det kan diskuteres om det faller innenfor rammene for relevante svar på oppgaven.
Men: Hva annet kan vi vente? Når vi gir ungdommen oppgaver som 2 og 5 i årets oppgavesett, får vi akkurat det vi ber om, og dermed blir sensors stabilitet også svekket. Det blir for mange besvarelser som blir diskutable når det gjelder innhold, valg av sjanger, relevans i forhold til oppgaven osv, og da ser jeg for meg at faren for ulik vurderingspraksis også øker. Dessverre.