Hvordan kan vi som leder skoler bruke resultatene fra eksamen? Kan disse resultatene gjøre oss kloke og mer styringsdyktige?
Neste uke skal jeg ha en av de tre årlige oppfølgingssamtalene med min sjef. I vår kommune kalles dette dialogsamtaler og skolesjefen signaliserer at i disse samtalene skal vi få frem «fortellingen bak tellingen«. Vi har tall for alle skoler i kommunen, både om elevers trivsel og prestasjoner, men vi må bruke disse tallene på en fornuftig måte. Dialogsamtalene jeg har med min sjef skal gjøre både meg (og mine medarbeidere) og min sjef klokere. Og de skal forhåpentligvis føre til at vi foretar gode valg for den enkelte skole og for hele kommunen. Jeg opplever dette som en meningsfull og god tilnærming til å skoleledelse. (Du kan evnt. lese mer av det jeg har skrevet om profesjonelle dialoger her).
Som en forberedelse til denne dialogsamtalen har sjefen min sendt ut en agenda for møtet der hun utfordrer oss på skolen til å tenke igjennom noen forhold ved skolen. (Hun er er en skikkelig dame, vet du, og gjør en ordentlig jobb). Et av spørsmålene vi fikk var: Karakterer for årets avgangskull – hva forteller disse?
Så på et av ledermøtene våre tok vi igjen tak i disse karakterene. Vi har «kvernet» på disse tallene tidligere også, men det var fint å gjøre en oppsummering sammen. Vi var enige om at våre eksamensresultater er stabile over tid, men at de varierer fra år til år. En av mine avdelingsledere har vært engelsklærer på denne skolen i mange år. Da vi så på statistikken over våre eksamenskarakterer som er presentert i skoleporten.no, så han at han hadde hatt både svært gode eksamensresultater og noe svakere resultater. Forteller eksamensresultatene for hans elever noe om hvorvidt han er en god lærer? Kan skoleledere bedømme lærere på grunnlag av de eksamensresultatene de «oppnår»? Vi var ikke helt sikre på det.
Men vi la merke til noe annet ved årets skriftlige eksamen i matematikk, og det var ikke at vi hadde de dårligste resultatene vi noen gang har hatt, for det hadde vi ikke. Nei, det vi la merke til var at det så ut til at ulike sensorer bedømmer skriftlig eksamen ulikt.
Stopp en hal: Er ikke skriftlig eksamen nettopp den mest nøytrale og «rettferdige» vurderingen i norsk skole? Jo, mange hevder det, og det er meget mulig de har rett. Men hos oss var situasjonen denne:
Våren 2015 var det 3 partier (15-grupper) ved vår skole som ble trukket ut til skriftlig eksamen i matematikk. Siden vi har 2 storklasser på hvert trinn og de tre 15-gruppene var trukket ut fra begge klassene, hadde to av partiene hatt samme lærer i matematikk. Noe av det vi bruker skriftlig eksamen til er å se om det er stort avvik mellom standpunktkarakterene og eksamenskarakterene. Og vi la merke til at i de to partiene som hadde samme lærer, var det stor forskjell i dette avviket. I den ene gruppa var det ikke avvik mellom gjennomsnittlige standpunktkarakterer og eksamenskarakterer, men hva med den andre gruppa? 7 av elevene i den andre gruppa fikk svakere karakter til skriftlig eksamen enn de fikk i standpunkt mens ingen av elevene i gruppa fikk bedre karakter på eksamen enn i standpunkt. Det var altså et stort avvik mellom standpunktkarakterer og eksamenskarakterer i denne gruppa. To av elevene i denne gruppa klaget på karakteren til eksamen og begge fikk medhold slik at karakteren deres ble hevet.
Vi drøftet selvsagt dette med den aktuelle matematikklæreren. Hadde han vært for snill med standpunktkarakteren i den ene gruppa? Var det svært mange tvilstilfeller i den andre gruppa og hadde han vært for «snill» med karakterene til noen elever? Dette er en erfaren lærer som har ført elever gjennom 10. klasse tidligere, og han mente at det ikke var noe i elevgruppene som skulle tilsi at avviket mellom standpunkt- og eksamenskarakteren var større i den ene enn den andre gruppa. Den eneste faktoren som var ulik mellom de to gruppene var hvem de hadde hatt som sensorer ved skriftlig eksamen. Var det slik at ulik sensor ved eksamen ga elever ulik karakter for tilnærmet lik prestasjon? Og var det tilfeldig at de to elevene som klaget på karakteren begge fikk medhold og hevet karakter? Du vil selvsagt innvende at dette er et ekstremt lite utvalg, og det har du rett i. Men for oss var denne forskjellen påfallende.
Vi opplevde noe lignende for mange år siden. Den gangen var det for få sensorer i norsk sidemål (altså nynorsk i vårt tilfelle) på østlandet og eksamensbesvarelsene til våre elever ble sendt til sensorer på vestlandet. Hva tror du skjedde med karakterene i sidemål? Riktig, vi fikk de svakeste eksamensresultatene vi noen gang har hatt i norsk sidemål. Selvsagt kan det skyldes at elevene våre ikke var særlig flinke i sidemål det året, men de hadde hatt en av skolen flinkeste og mest «ihuga» sidemålslærere. Kanskje var årsaken at sensorer på vestlandet er vant til bedre sidemålstekster og at de, kanskje ubevisst, stiller større krav til sidemålseksamen enn sensorer på østlandet. Hvis dette er tilfelle: hvilke andre ubevisste forskjeller i kvalitetskrav finnes mellom sensorer og lærere på ulike skoler eller i ulike landsdeler?
Så det spørs om ikke ethvert system er usikkert og avhengig av menneskelige faktorer. Kanskje er ikke eksamen særlig rettferdig heller – det er ikke så mye i denne verden som er det.
God helg!
P.S: Vi lærer selvsagt mer av eksamensresultatene. Bl.a. at jentene fortsatt presterer langt bedre enn guttene i alle fag, men det er ikke spesielt for vår skole – dessverre.