'Eindtoets heeft te veel functies'
De eindtoets in het basisonderwijs selecteert leerlingen, meet de kwaliteit van de school en moet docenten van feedback voorzien. Klinkt handig, maar de vraag is: voor wie precies?
Achter een stuwdam van eindtoetsresultaten klappen drie sluisjes ritmisch open en dicht. Als bingoballetjes rollen de scores richting de sorteerbakjes: 50 procent vmbo, 30 procent havo, 20 procent vwo. Wanneer het ene bakje te snel vol dreigt te lopen, wordt er driftig een schroefje bijgedraaid zodat het bijbehorende sluisje wat langer dicht blijft. “We hebben in het Nederlandse onderwijs helemaal geen talentmodel”, constateert toetsexpert Karen Heij, die de gang van zaken beeldend verwoordt. “Alle leerlingen worden op een hoop gegooid en geselecteerd op zo’n manier dat de verdeling over de schoolsoorten al sinds jaar en dag vrijwel stabiel is.”
Onderzoekscollectief Spit probeerde onder andere voor het Onderwijsblad in samenwerking met regionale media zoals de Stadsbron en Vers Beton in kaart te brengen welke volgsystemen en eindtoetsen er worden gebruikt. Al snel kwamen de samenwerkende journalisten tot de conclusie dat er vooral meer van hetzelfde op de markt is en eindigde hun inventarisatie tegen een dikke muur van systeemkritiek. Niemand is tegen het volgen van de ontwikkeling van kinderen, toch zijn er maar weinig fervente voorstanders te vinden voor de manier waarop dit momenteel gebeurt. Of beter gezegd: manieren.
De eindtoets legt te veel druk op kinderen
De politieke intentie achter het sinds 2015 verplichte leerlingvolgsysteem klinkt sympathiek: de eindtoets legt te veel druk op kinderen, maar ook op scholen die vervolgens te maken krijgen met ambitieuze ouders. Door het volgen van leerlingen verplicht te stellen, zouden scholen, naast de reeds verplichte eindtoets (sinds 2013), een beter beeld krijgen van de ontwikkeling. “Acht jaar op de basisschool is een film, en de eindtoets is een foto”, zo verwoordde SP-Kamerlid Tjitske Siderius begin 2016 deze heersende gedachte in de Tweede Kamer.
In de praktijk blijkt het leerlingvolgsysteem meer van hetzelfde, alleen vroeger in de schoolloopbaan. Dit komt met name door het gebruik van zogeheten ‘plaatsingswijzers’ en afspraken tussen voortgezet en basisonderwijs. Om er zeker van te zijn dat kinderen een betrouwbaar advies meekrijgen, wordt niet alleen gekeken naar die ene eindtoets, maar ook naar de eerdere schoolprestaties. De stress van de eindtoets wordt hierdoor verlegd naar een eerder moment - als kinderen jonger zijn. Basisschooldocent Jeroen Goes sprak profetische woorden in een gastcolumn in het tijdschrift Didactief vlak voor de invoering in 2015: ‘Er zal geen rector eerlijk voor uitkomen, maar categoriale gymnasia zullen toch echt naar de resultaten kijken vanaf groep 5 van de basisschool.’
Ontwikkelingspsycholoog en orthopedagoog Anke Klein, verbonden aan de Universiteit Leiden als hoofddocent en medeoprichter van het Kenniscentrum Angst en Stress bij jeugd, herkent dit uit eigen ervaring: “We horen toch wel vaak dat leerkrachten tegen leerlingen zeggen dat Cito-toetsen vanaf groep 5 meetellen op het eindadvies, dat is nogal wat druk wat je op een kind legt.” Vanuit ontwikkelingsperspectief vraagt ze zich af of deze druk op jonge kinderen wel ‘verstandig en wenselijk’ is.
Kinderen zijn afhankelijk van de prestaties van ándere kinderen voor hun positie
Officieel worden kinderen op 11/12-jarige leeftijd geselecteerd, maar door onderlinge afspraken door scholen voelen zij deze druk al veel eerder. “De toetsen worden afgenomen vanaf groep 3, dan begint het vergelijken met elkaar al”, vertelt Heij. Het vergelijken van kinderen met elkaar als selectiemiddel heeft bijwerkingen. “Kinderen worden geordend ten opzichte van elkaar. Om op te klimmen naar een hoger niveau, moet er dus een ander kind uit het sorteerbakje boven jou naar beneden.” Oftewel: kinderen zijn afhankelijk van de prestaties van ándere kinderen voor hun positie.
Onder de motorkap kijken
Niet alleen is er kritiek op het gebruik van de eindtoets als selectiemiddel, ook de manier waarop de selectie gebeurt, wekt vragen op. Het is lastig onder de motorkap kijken - en waarschijnlijk een goed bewaard bedrijfsgeheim - maar dankzij de vrolijk gekleurde grafieken en gemaakte claims in de glossy reclamefilmpjes kunnen we wel iets zeggen over wat er gemeten wordt en welke verwachtingen worden gewekt. Neem bijvoorbeeld het leerlingvolgsysteem Leerling in beeld van Cito. In een demonstratiefilmpje is te zien hoe leerkrachten en ouders in één oogopslag kunnen zien of kinderen onder, boven of op de ‘gemiddelde groei’ zitten voor bijvoorbeeld rekenen, begrijpend lezen en woordenschat. ‘Niet alleen de leerkracht, maar ook de leerling zelf krijgt met Leerling in beeld een compleet beeld van waar hij staat’, zo omschrijft basisschooldirecteur en mede-ontwikkelaar van Cito-producten Willem van Till het product in Trots, het vakblad voor primair en speciaal onderwijs.
Nederland lijdt aan een collectieve meetobsessie
“Zo’n mooi dashboard, met strakke grafieken en cijfers, daar zijn mensen snel van onder de indruk en het wordt verkocht als een compleet beeld. Dat is precies het probleem”, stelt Berend van der Kolk, onderzoeker van meetsystemen aan de Vrije Universiteit. In zijn boek Meetmaatschappij nam hij de ‘collectieve meetobsessie’ van Nederland onder de loep. Een obsessie die hij ook terugziet in de leerlingvolgsystemen. Hoewel het meten van prestaties - zoals de woordenschat - een handig hulpmiddel kan zijn, vreest hij dat de beperkingen van zo’n grafiek vaak over het hoofd worden gezien.
Woordgrappen
De woordenschat is namelijk een van de vele onderdelen waarop je taalvaardigheid kunt meten. In leerlingvolgsystemen en eindtoetsen wordt er vooral gekeken naar woordenschat en begrijpend lezen. Dat is een vrij beperkte samenvatting van het begrip ‘taal’. Het kunnen maken van woordgrappen, creatief kunnen schrijven of het bespreken van zojuist gelezen verhalen: horen die ook niet bij taal? “Er is gekozen om vaardigheden te toetsen die met multiple choice af te nemen zijn en dus makkelijk te vergelijken”, legt Heij uit.
De toetsbare zakelijke kant van het taalonderwijs heeft de overhand gekregen
De manier waarop vaardigheden worden gemeten, heeft onbedoelde bij-effecten. Kinderen die bijvoorbeeld tweetalig worden opgevoed weten misschien 75 woorden in het Nederlands en 75 woorden in een andere taal. Als je dan alleen naar de Nederlandse woordenschat kijkt om te bepalen hoe goed een kind in taal is, loopt het tweetalige kind onterecht achter bij een eentalige kind met een woordenschat van bijvoorbeeld 120 Nederlandse woorden. “Terwijl het tweetalige kind eigenlijk voor loopt, komt het toch op een achterstand te staan”, aldus organisatiewetenschapper Van der Kolk.
De experts Van der Kolk en Heij staan zeker niet alleen in hun kritiek. De Onderwijsraad constateerde in 2022 al droogjes dat ‘de toetsbare zakelijke kant van het taalonderwijs de overhand heeft gekregen’. Het werpt direct vragen op over de tweede sympathieke belofte van de invoering van het leerlingvolgsysteem: het zou namelijk ook de leerkracht helpen om tijdig achterstanden te signaleren. Maar een achterstand op wat? Taalvaardigheid of toetsbare elementen van taalvaardigheid? “Je legt als leerkracht de resultaten natuurlijk naast je eigen observaties. Zo hebben sommige toetsen talige rekensommen en het kan zijn dat het kind door het begrijpend lezen deels de context niet snapt, maar de som wel degelijk kan maken”, vertelt leerkracht Masja Straetemans. Volgens haar is het vooral ook verwachtingsmanagement: niet alleen naar de kinderen, maar ook naar de ouders.
Kinderen aan de kalmeringsmiddelen
Mediaberichten over de toetsen helpen dan niet altijd mee. Straetemans: “Dan probeer je als leerkracht de stress eraf te halen en komen in het Jeugdjournaal berichten voorbij over kinderen aan de kalmeringsmiddelen die relaxplekjes nodig hebben.” Of wat te denken van RTL Nieuws, dat op basis van Cito-scores jarenlang ‘rapportcijfers’ gaf aan scholen. “In de media worden toetsuitslagen vaak gekoppeld aan kwaliteit”, stelt bestuurder Remco Prast. “Het beeld dat toetsen een absoluut gegeven zijn van hoe het onderwijs en de kinderen ervoor staan, leeft in de hele maatschappij.”
De Onderwijsinspectie is geen voorstander van intensief oefenen met toetsen
Op de vraag of zoveel rollen voor eenzelfde eindtoets wel mogelijk zijn, laat de Onderwijsinspectie weten dat ze voor elk ander doel andere data gebruiken. De kwaliteitsmeting bestaat immers uit meer dan eindtoetsresultaten alleen. Ondanks de prachtig geformuleerde processen, constateerde het Centraal Planbureau in 2019 dat de dubbelfunctie zorgt voor perverse prikkels: zo zijn er scholen die leerlingen de eindtoets laten oefenen, zodat ze een goede beoordeling krijgen. Leerlingen zijn dan goede toetsmakers, maar de eindscore zegt dan (nog) minder over hun vaardigheden. Vaardigheden zoals schrijven en redeneren met getallen worden hierdoor naar de achtergrond gedrukt: er valt letterlijk niet mee te scoren. Ook zijn niet alle eindtoetsen volledig vergelijkbaar, waardoor scholen kunnen kiezen voor de eindtoets die de hoogste schooladviezen geeft. De Onderwijsinspectie zegt geen voorstander te zijn van intensief oefenen met toetsen, maar controleert scholen er niet op. Het kiezen voor de toets waar een hoger eindadvies van wordt verwacht, is herkenbaar voor de inspectie, maar volgens hen heeft de invoering van een standaardnormering in 2023 hier een einde aan gemaakt.
Kinderen worden uitgesloten
“Bepaalde kinderen kunnen vrijgesteld worden van deelname aan de toets, omdat zij de gemiddelde score omlaag halen”, vertelt bestuurder Marten Elkerbout van Openbaar Onderwijs Spaarnesant. Een score waar de scholen deels op worden beoordeeld door de Onderwijsinspectie. “Dat is zo tegenstrijdig. Enerzijds wordt ons verteld dat we inclusief onderwijs moeten bieden, maar anderzijds worden kinderen uitgesloten als het even niet zo uitkomt.” De Onderwijsinspectie laat desgevraagd weten de resultaten van ‘alle leerlingen’ mee te nemen in de beoordeling, behalve ‘de toetsresultaten van leerlingen die voldoen aan de ontheffingsgronden’.
Normeren, selecteren, kwalificeren. Het zijn wel heel veel functies die aan die ene toetsmethode worden gehangen. “We zijn indicatoren gaan verwarren met doelen. Er wordt niet meer nagedacht over waartoe het onderwijs op aard is, maar toegerekend naar hoe we scoren”, constateert Elkerbout.