Du använder en utdaterad webbläsare som inte längre stöds. Vänligen uppgradera din webbläsare för en bättre upplevelse av timbro.se

Samhälle Essä

Betygsinflationen är inte som du tror

I skoldebatten påstås ofta att friskolor sätter glädjebetyg för att locka elever. I verkligheten är det dock svårt att hitta stöd för att så är fallet – de studier som sägs indikera detta tillåter sällan att man drar några säkra slutsatser om skillnader mellan olika huvudmän. Däremot finns det goda skäl att se över betygsättningen och hur betyg används vid exempelvis högskoleantagning, skriver Erik Lakomaa.

Ett fall av glädjebetyg? Foto: Jessica Gow /TT

Enligt en rad studier ger konkurrens från friskolor bättre studieresultat – detta både genom att resultaten för de elever som går i friskolorna förbättras, men också genom att konkurrensen tvingar fram förbättringar i de kommunala. De funna effekterna är emellertid inte jättestora och varierar mellan olika studier. 

Friskolekritiker menar emellertid att de resultatförbättringar som skett inte nödvändigtvis beror på ökade kunskaper utan på att friskolorna för att locka elever helt enkelt fuskar och sätter glädjebetyg. Det finns också en mer allmän kritik mot betygsättningen, att betygen generellt ökar över tid men utan att det motsvaras av ökade kunskaper, något som ofta kallas betygsinflation. 

Forskningen är långtifrån så entydig som ofta görs gällande i debatten. 

Ser man till forskningen är resultaten dock långtifrån så entydiga som ofta görs gällande i debatten. Anders Böhlmark och Mikael Lindahl konstaterade exempelvis i en studie av grundskolan att observerade resultatförbättringar inte berodde på betygsinflation. Björn Tyrefors Hinnerich och Jonas Vlachos fann i en studie för gymnasieskolan närmast det motsatta. Christina och Magnus Wikström har i en äldre men ofta citerad studie funnit att friskolor under systemets första år var ordentligt frikostiga vid betygssättningen. Frågan är med andra ord långt ifrån okomplicerad och det går att ifrågasätta metodvalen och slutsatserna i flera av studierna. Att som exempelvis SVT:s Vetenskapens värld häromåret luta sig mot en enda studie (Hinnerich och Vlachos ovan) och dra långtgående slutsatser av denna ger således en skev bild av läget. 

Egentligen är det ofta mer relevant att tala om felaktig betygssättning än om inflation, för det är även ett problem om elever får ett lägre betyg än vad de är värda. Ett felaktigt betyg kan bero på två faktorer: dels det som brukar kallas betygsinflation – det vill säga att samma bedömda kunskaper ger högre betyg över tid, eller att olika grupper får olika betyg för samma prestation, exempelvis elever på fristående skolor och kommunala – och dels att betyg sätts utifrån felaktiga kriterier. Man måste också skilja på felaktig betygssättning på lärar- och på skolnivå. 

Betyg kan också vara felaktiga genom att de kriterier som eleven bedömts mot varit felaktiga. Anledningar till detta kan vara att skolorna har lokala betygskriterier som inte överensstämmer med de nationella eller att enskilda lärare bortser från dessa. 

Tillsammans med Gustaf Lundgren har jag själv undersökt saken för grundskolan. Vi kunde inte utesluta förekomst av betygsinflation som sådan, men däremot att den drevs av konkurrens. Skolor som var utsatta för konkurrens hade inte större betygsavvikelser än de som saknade sådan. Vi fann också att skolkoncerner satte betyg som var mer rättvisande än skolor som inte drevs i koncernform (kommunala eller fristående). Den metod vi använde –  att använda de skillnader som finns mellan flickor och pojkar som referenspunkt – har fördelen att den möjliggör att man skiljer mellan systematiska glädjebetyg, vad som skulle kunna kalla fusk, och fel som exempelvis beror på felakiga betygskrtiterier. En skola som systematiskt fuskade med betygen, exempelvis för att locka elever,  skulle knappast avstå från att göra det för det ena könet. Däremot skulle felaktiga betygskriterier – som att väga in ordning och uppförande, flit eller hur snyggt och prydligt inlämningsuppgifter var skrivna – kunna slå olika mellan flickor och pojkar.

Denna typ av mönster fann jag även i den studie jag 2010 var med och gjorde för Skolinspektionen om betygssättningen i gymnasieskolan. Att skolor hade egna betygskriterier som avvek från de nationella var vanligt, men mindre vanligt hos skolor som drevs i koncernform. Vi fann också där storlekseffekter: större skolor hade färre problem med betygssättningen. Detta kan tolkas som att det finns en medvetenhet om problemet inom skolväsendet och att man försöker göra något åt det – exempelvis genom att ta fram bedömningsunderlag, konkretiseringar av betygskriterier och prov som är anpassade för att mäta de kunskaper som ingår i kursmålen.

Eftersom det inte finns någon objektiv referenspunkt som omfattar alla elever är frågan om betygsinflation komplex, och de jämförelsepunkter som används har alla mer eller mindre stora problem. Är man intresserad av att använda betygsfrågan som ett slagträ i den politiska debatten om huvudmannaskapet för skolor måste man också notera att metoderna som används inte alltid kan användas för att dra några slutsatser på den nivån. 

Ett exempel är den mycket uppmärksammade rapport som Skolverket släppte 2018, och som enligt verket visade att elever med friskolebakgrund klarade sig sämre på högskolan.

Läser man rapporten finner man emellertid att det överhuvudtaget inte går att säga något om detta utifrån den metod som användes. Skolverkets antagande är nämligen att alla högskoleutbildningar och kurser har samma svårighetsgrad. Det innebär att Skolverket kommer att finna betygsinflation där sådan inte finns. Antag att vi har två gymnasieelever, Alice och Bob, som har exakt samma faktiska kunskaper och exakt samma samma betyg i alla ämnen. Här saknas i objektiv mening betygsinflation eller felaktig betygsättning. Alice väljer att läsa på KTH men klarar inte tentorna i linjär algebra och envariabelanalys första terminen, Bob läser istället grundkursen i praktisk filosofi på Stockholms universitet, vilket han klarar utan vidare ansträngning trots ett omfattande deltagande i kårens festverksamhet. Enligt Skolverket indikerar detta att Alice fått ett glädjebetyg. Hade hon gått på en friskola hade det dessutom tagits som intäkt för att friskolor som sådana satte glädjebetyg. 

Skolverket tar inte heller hänsyn till att förutsättningarna för att klara olika högskoleutbildningar kan hänga samman med i vilka ämnen som eleven har bra och dåliga betyg. Man kan exempelvis förvänta sig att en elev som har 17,5 i genomsnittligt meritvärde men A i matematik och E i bild kommer att klara kursen i linjär algebra på högskolan bättre än en annan elev med samma meritvärde men med E i matematik och A i bild. Detta medges av Skolverket i rapporten (s 34) men man tar ingen hänsyn till detta i tolkningen. Förklaringen blir i stället “betygsinflation” (hos friskolor).  

Även om studieresultat på högskolan är relevanta att studera och ett rimligt mått på skoleffekter innebär det utmaningar för den som vill använda dem för att studera korrektheten i betygssättningen. Detta av flera skäl. Det är för det första endast en mindre andel av gymnasieeleverna som läser vidare, och andelen varierar påtagligt mellan olika skolor – detta även om man kontrollerar för vilket gymnasieprogram som eleven läser. Vidare kan en ökning av andelen elever, från exempelvis en skola eller ett gymnasieprogram, som läser vidare medföra att de genomsnittliga prestationerna hos de elever som läser vidare sjunker. Detta skulle med Skolverkets metod signalera betygsinflation på gymnasiet snarare än att eleverna blivit mer motiverade att läsa vidare eller läser mer avancerade kurser på högskolan.

Studier som använder tagna högskolepoäng, men som inte kontrollerar för vad studenten studerat, riskerar således att ge helt missvisande resultat beträffande gymnasieskolans kvalitet. Detsamma gäller om man inte tar hänsyn till andelen på respektive gymnasieskola som läser vidare.

Avvikelse mellan betyg och nationella prov kan inte utan vidare användas som bevis för betygsinflation. 

Inte heller avvikelse mellan betyg och nationella prov, vilket används av bland annat Tyrefors Hinnerich och Vlachos, kan utan vidare användas som bevis för betygsinflation. Proven är inte tänkta att vara rena examensprov utan har även funktionen att hjälpa lärarna att hitta kunskapsluckor hos eleverna i syfte att ge möjlighet att korrigera dessa. Om en elev får alla rätt på det nationella provet i matematik, förutom att denne helt missar en uppgiftstyp, säg trigonometri eller andragradsekvationer, kommer eleven inte att få högsta betyg på provet. Om det är en skola som fungerar väl kommer då läraren att säga till eleven: ”Jag ser att du är jättebra på matte, se nu till att lära dig andragradsekvationer innan terminen är slut.” För en sådan elev kommer det sannolikt inte vara särskilt svårt att under den tid som återstår av terminen lära sig att lösa andragradsekvationer. Därmed kommer eleven också kunna få högsta betyg när kursen är avslutad.  

På en skola som fungerar mindre väl kanske inte detta fångas upp, eller så används de nationella proven som examensprov, vilket de inte är avsedda för.

De förväntade avvikelserna kommer här att vara olika stora i olika ämnen, man kan exempelvis inte förvänta sig att en elev på samma sätt som i matematik i slutet av terminen kan förbättra sig avsevärt i svenska genom att lära sig uppgiftstyper eleven inte tidigare kunde.

Eftersom de nationella proven inte ges efter att alla kurser är avslutade kommer dessutom något moment att behöva läsas efter att provet hållits. Om alla skolor hade organiserat sin undervisning exakt lika hade detta inte utgjort något problem. Men så ser det inte ut, skolorna har stor frihet att välja hur de ska organisera undervisningen. Om det nationella provet i fysik innehåller frågor om optik och eleverna på en skola ännu inte läst optik kommer de att prestera sämre på det nationella provet. Men när betygen sedan sätts vid terminens slut, efter att eleverna läst optik, kommer de få högre betyg än provresultaten – vilket för vissa skulle utgöra ”bevis” för betygsinflation. Man skulle tvärtom kunna säga att om de nationella proven används rätt och skolan fungerar väl kommer de flesta elever att ha högre betyg än provresultat.

Finns det friskoleeffekter?

Det är också viktigt att veta vad som är friskoleeffekter och vad som beror på andra faktorer, men som kan vara korrelerade med friskolor. Det tydligaste exemplet är skolstorlek. Små skolor har allt annat lika svårare att hålla en hög kvalitet. Även om friskolorna nu 30 år efter friskolereformen har närmat sig de kommunala i storlek var detta definitiv inte fallet tidigare. Det är även i dag ovanligt med stora friskolor: Grundskolor med fler än 700 elever, vilket inte är särskilt stort i en internationell jämförelse, drivs i Sverige med några få undantag av kommuner eller av koncernen Internationella Engelska Skolan. 

En förklaring till varför vi inte sett större konkurrenseffekter på utbildningsresultat kan vara att skolmarknaden fortfarande är relativt omogen, många kommuner saknar fortfarande helt friskolor. En annan är att utbildningsresultat – och betyg – för många familjer och elever inte är en avgörande faktor när man väljer grundskola. Det har ibland lyfts fram som bevis på problemen med valfrihet:  Att inte alla väljer den skola som maximerar de förväntade utbildningsresultaten har tolkats som att valfriheten inte fungerar. Så är det inte. 

Studieresultat inte har den stora betydelse för att locka elever som ibland påstås.

En undersökning  gjord bland föräldrar som valt grundskola i någon av de kommuner som då hade obligatoriskt skolval fann 2017 att de faktorer som prioriterades vid skolvalen främst var arbetsmiljöfaktorer som frånvaro av våld och mobbning samt ordning och reda i klassrummet. Nittio procent svarade att det var viktigt eller mycket viktigt och över 70 procent att det var mycket viktigt eller helt avgörande. Detta är också överensstämmande med resultat från tidigare svensk forskning om arbetsmiljöfaktorer i skolan och med internationella studier. Mindre än hälften svarade däremot att utbildningsresultaten var mycket viktiga eller helt avgörande för skolvalet. De flesta familjer valde också, oavsett vad de svarat att de ansåg var viktigt, den skola som låg närmast hemmet. Detta indikerar att betyg inte har den stora betydelse för att locka elever som ibland påstås. 

En förklaring till detta är att det ofta saknas lättillgänglig och tolkningsbar information om resultat. Även om exempelvis Skolverket redovisar statistik är det för den sökande svårt att veta om resultaten beror på vilka elever som går på skolan eller på undervisningen. Trots att en rad internationella studier visar på påtagliga lärareffekter kan det faktum att en skola presterar bra bero på att eleverna där är duktiga; inte på att undervisningen är bättre. 

Elever som går på fristående grundskolor har det gemensamt att de alla gjort ett aktivt val, det har inte nödvändigtvis de som går på kommunala. Det betyder också att föräldrarna till elever på friskolor kan förväntas vara mer engagerade i sina barns skolgång, kanske hjälper dem mer med läxorna eller har en mer utbildningspositiv världsåskådning. Detta kommer sannolikt också att påverka även om det är svårt att skatta effektens storlek. Detta kan också påverka betygen – om dessa engagerade elever och föräldrar klagar och tjatar mer på lärarna kommer det leda till att elever på friskolor får ”glädjebetyg” utan att det beror på friskolan.  Denna effekt skulle då bestå även utan friskolor. Incitamenten att tjata sig till ett högre betyg (men knappast ett lägre) försvinner inte med friskolor, inte heller incitamenten för lärare att falla till föga för en påstridig elev, eller en som har påstridiga föräldrar, och ge ett högre betyg än vad som egentligen förtjänats. Detta skulle även kunna förklara varför man exempelvis uppmätt större skillnader mellan provresultat och betyg hos stiftelsedrivna friskolor än hos sådana som drivs i aktiebolagsform. De stiftelsedrivna är i högre utsträckning sådana som vänder sig till mycket utbildningspositiva familjer. 

Finns incitament att sätta glädjebetyg?

De empiriska undersökningar som gjorts pekar som nämnts ovan i olika riktning. Hur ser det då ut teoretiskt? Vilka incitament finns det för att sätta högre betyg än eleven är värd? Allt annat lika vill nog nästan alla ha så höga betyg som möjligt. Dock ska man beakta att betygen i Sverige för en stor grupp elever har mycket liten betydelse för möjligheten till vidare studier. Där skiljer sig Sverige från många andra länder. Enligt OECD är Sverige det OECD-land där betygen har minst betydelse: I Sverige används inte betyg alls för antagning före gymnasienivå. Till många gymnasieprogram och skolor kommer dessutom också alla som söker in, och för de eleverna spelar grundskolebetygen i praktiken ingen roll. Detsamma gäller många högskoleutbildningar. För de elever som går yrkesförberedande program och inte avser att läsa vidare på högskolan är också betygen mindre avgörande. 

Ersättningen till skolorna påverkas inte heller av vilka betyg, eller provresultat, eleverna får. Det har kommit förslag om att basera en del av skolpengen på skolans resultat och även om att hindra friskolor som presterar dåligt att dela ut vinstmedel. Om detta skedde skulle incitamenten att sätta glädjebetyg öka. 

För enskilda lärare finns däremot ofta incitament att ge elever högre betyg än vad elevens kunskaper kanske motiverar, om så bara av skälet att en elev, eller dess föräldrar aldrig kommer att klaga på ett för högt betyg. 

Skolkoncerner, som drivs i vinstsyfte, har incitament att inte fuska då detta skulle kunna äventyra tillståndet.

Det finns samtidigt, som en följd av skolsystemets organisation, påtagliga incitament att inte fuska med betygen. Just skolkoncerner, i synnerhet sådana som drivs i vinstsyfte, har incitament att inte fuska då detta skulle kunna äventyra tillståndet, och därmed de pengar som investerats i företaget. Man kan utgå ifrån att om det gått ut direktiv till lärarna som arbetar inom en skolkoncern att de i syfte att locka elever skulle ge högre betyg än motiverat hade det läckt ut. Att några sådana dokument under de 30 år det funnits friskolor inte gjort det är en tydlig indikation på att några sådana direktiv sannolikt inte existerar. 

En kommunal skola har inte alls dessa incitament att avstå från fusk. Det kan jämföras med hur det fungerade inom bilprovningen under monopoltiden. Alla som är gamla nog att ha varit med på den tiden och var något så när bilintresserade visste då vilka stationer där det gick att lägga en halvflaska Explorer på passagerarsätet och få igenom bilar som annars skulle fått körförbud. Det är svårt idag. Även om det såklart finns incitament för den enskilda besiktningsmannen att låta sig mutas – exempel på att det skett finns också – finns inget intresse för de kedjor som utför besiktning i dag att göra det. Skulle det uppdagas att de inte ingripit mot sådant skulle de riskera tillståndet. Svensk Bilprovning löpte på monopoltiden däremot aldrig någon risk att bli av med tillståndet. 

Vad kan man göra åt saken

Även om det inte på något övertygande sätt går att visa att betygsinflation är ett stort problem finns goda skäl att ändå säkerställa att betygsättningen är korrekt och ta fram skoloberoende bedömningar av elevernas kunskaper. Detta både för den enskilde elevens rättssäkerhet och för förtroendet för skolväsendet. Det går inte att komma ifrån att det trots allt finns incitament till att sätta glädjebetyg, både på lärar- och skolnivå, och både på fristående skolor och kommunala. 

En del av problemen med felaktig betygsättning skulle sannolikt gå att undvika genom att ha större skolor. Skolor där det finns flera undervisande lärare i varje ämne innebär större möjligheter till exempelvis medbedömning. Stora skolor har också oftare kvalitetssäkrade bedömningsmallar och lokala prov, vilket gör att den enskilde lärarens möjlighet att göra fel minskar. 

Ett annat förslag som diskuterats länge men som inte genomförts är central rättning av de nationella proven. Det är en god idé. Även om rättningen som görs av lärarna inte skulle vara felaktig skulle detta avlasta lärarna och stärka förtroendet för skolväsendet. Det finns samtidigt goda skäl att fortsätta använda de nationella proven som de används i dag, och inte göra dem till examensprov. 

Ett sätt att minska risken för att betygsinflation, oavsett i vilken omfattning det förekommer, vore också att införa ett allmänt högskoleprov motsvarande det amerikanska SAT/GMAT. Detta skulle dels leda till att man fick ett oberoende mått på skolornas resultat, i alla fall för de elever som hade för avsikt att läsa vidare, dels skulle det kunna användas vid intagning till högskolorna. Ett sådant prov bör organiseras oberoende av skolhuvudmännen. Det bör också övervägas att låta högskolorna själva avgöra antagningskriterier och behörighetskrav. Högskolor bör exempelvis få ställa krav på att studenter för att antas både ska ha visst betyg och visst resultat på ett högskoleprov eller på ett eget antagningsprov.

Sammanfattningsvis är betygsinflation ett problem som bör tas på allvar. Det går emellertid inte att utifrån den forskning som finns tillgänglig att påstå att det handlar om ett friskoleproblem. Detta utgör dock inte skäl att avstå från att göra något åt problemet.