De Nieuwe Stem. Jaargang 22
(1967)– [tijdschrift] Nieuwe Stem, De– Auteursrechtelijk beschermd
[pagina 619]
| |
W.J. Jong
| |
[pagina 620]
| |
opleveren: (0,75)5 of ook weer iets onder de 25%, maar het klopt dan toch niet, dat het zesjarige gymnasium in dit opzicht gunstiger voor de dag komtGa naar eind2. Een tweede grondslag voor het betoog is de zogeheten ‘wet van Posthumus’, door de tegenwoordige hoogleraar in de scheikunde te Eindhoven in 1940 in De Gids geformuleerd, in de laatste jaren bij herhaling van de Eindhovense katheder verkondigd. Zij houdt in dat bij iedere beoordeling in ons onderwijssysteem gemiddeld een kwart onvoldoenden wordt uitgedeeld. Combineert men deze stelling met empirisch vastgestelde correlaties tussen de resultaten voor verschillende schoolvakken - en houdt men rekening met het verschil tussen ‘moeilijke’ en ‘makkelijke’ vakken - dan is het doubleerpercentage hieruit af te leiden. Dat wil zeggen: als men, met de Groot, een ‘tweede wet van Posthumus’ introduceert, die ditmaal op het doubleerpercentage slaat. We raken hier een van de fundamentele punten uit het betoog: de beoordeling van een gegeven werkstuk, de ‘succes-score’, houdt géén beslissing in over de grens ‘voldoende-onvoldoende’. De samenhang tussen de ‘wet van Posthumus’ en het doubleerpercentage is alleen duidelijk als men er van uitgaat dat twee à vier onvoldoenden tot afwijzen moet leiden! Men kan het model van Posthumus aanduiden als het model van de ‘schiftende school’, met de Groot nog iets nader te omschrijven als: gebaseerd op een systeem van ‘permanente selectie met wisselende maatstaven’. De remedie ligt dan voor de hand: éénmalige selectie en constante, reproduceerbare, maatstaven. De vraag is alleen of dit te verwezenlijken is.
In onderwijskringen zijn beide vaststellingen: constant doubleerpercentage en constant percentage onvoldoenden, met veel kritiek ontvangen. Oud-minister Bolkestein heeft dit voldoende ervaren, toen hij na 1945 de Amerikaanse opvatting overbracht, die ons doubleersysteem als ‘criminal’ brandmerkte. Men zag en ziet deze en soortgelijke kritiek, ook de ‘wet van Posthumus’, als een beschuldiging van ‘knoeien’ met de cijfers en de bevorderingen. Nu valt niet te ontkennen dat er zich gevallen voordoen, waarbij het ‘cijfer’ voortkomt uit een min of meer toevallige ‘caesuur’ in een rangorde van prestaties, een caesuur die zich door gedachten | |
[pagina 621]
| |
van het type ‘meer dan een kwart onvoldoenden is toch te gek’ laat leiden. Maar juist bij werk, waar objectieve vergelijking moeilijk is, opstellen bijvoorbeeld, komt de ‘wet van Posthumus’ slecht tot uiting en in de meeste gevallen gaat men uit van een min of meer traditionele verwachting (tenminste de helft moet goed zijn, twee fouten een punt is redelijk en dergelijke) en constateert dan een percentage onvoldoenden. Hooguit wordt achteraf de schaal gecorrigeerd, als het aantal onvoldoenden te hoog oploopt of onvoldoenden geheel ontbreken.
Posthumus, de Groot cum suis zien over het hoofd dat zij een landelijk gemiddelde hanteren, zonder zich bewust te zijn uit hoeveel ‘effectief onafhankelijke gegevens’Ga naar eind3 het resulteert en dus zonder enig inzicht in de spreiding. Vandaar ook de talloze protesten, met cijfers gestaafd, dat aan deze school, bij deze leraar, er niets van uitkomt. Met andere woorden deze percentages missen iedere predictieve waarde niet alleen voor individuen, maar voor hele groepen. Het is typerend dat waar een nader onderzoek is ingesteld, zoals bijvoorbeeld door de Groot's leerling Groen aan het Spinoza Lyceum, maar ook elders (Haags Dalton Lyceum, Montessori lycea, vooroorlogs Kennemer Lyceum) de resultaten heel anders plegen uit te vallen en met name veel betere rendementen te voorschijn komen. En het zou wel interessant zijn te beschikken over gegevens van kleinere provinciale gymnasia, internaten, kortom van scholen waar wellicht meer neiging tot ‘slepen’ bestaat dan op de grotestadsscholen, waar, ook voor de leerlingen, de strijd om het bestaan feller is en vroeger zijn intrede doet. Maar hier hebben we met maatschappelijke, niet met onderwijskundige invloeden te maken. In ieder geval zijn Brouwer's cijfers uit het verleden overwegend afkomstig van grotestads-HBS-en en ging Posthumus uit van gegevens uit het koloniale Indië.
Ik meen dat de Groot de homogeniteit van ons voortgezet onderwijs schromelijk overschat, al is er natuurlijk een uniformerende tendens van bevoegdheidsregelingen, eindexamennormen en niet te vergeten: lerarenopleiding. Omdat hij het onderwijs ziet als een ‘Systeem’ (hoofdletter van de Groot) hecht hij weinig waarde aan incidentele hervormingen, hetzij van | |
[pagina 622]
| |
individuele leraren, hetzij van afzonderlijke scholen. Maar voorzover hij hierin enigszins gelijk heeft ziet hij over het hoofd dat zijn ‘Systeem’ slechts een ‘subsysteem’ is in het grotere geheel van de hedendaagse industriële maatschappij. Hij beredeneert (pag. 175) waarom een incidentele verandering uiteindelijk verzandt, hij ziet de betekenis van ‘status’. Maar de plaats van de school in een op mededinging gegrondvest maatschappelijk bestel laat hij terzijde. BrouwerGa naar eind4 heeft ons onderwijsstelsel gekarakteriseerd als een ‘afvalrace’, waarin ieder jaar weer een kwart afvalt. Maar noch hij, noch de Groot geeft aan hoe de school zich anders dan door ‘flexible response’, door geven-en-nemen, aan dit stelsel kan onttrekken. En juist dit geven-en-nemen, dit rekening houden met allerlei factoren bij de beoordeling van een leerling, deze ‘medische aanpak’Ga naar eind5 veroordeelt hij als ‘paternalistische’ inmenging van de aangevochten ‘souvereine’ leraarsvergadering.
De Groot wil de permanente selectie op twee wijzen uitschakelen. Enerzijds wil hij een beoordeling van ‘minimum’-eisen op objectieve, van te voren vaststaande normen, reproduceerbaar: zowel voor dezelfde beoordelaar als tussen verschillende beoordelaars, ook in die zin, dat de verschillende prestaties van dezelfde leerling overeenkomstige resultaten leveren. Hij meent dat zogeheten studietoetsen, met name van het ‘meer-keuzen-type’Ga naar eind6 hiertoe een mogelijkheid bieden en wenst, evenals in Amerika, een speciaal instituut om dergelijke objectieve toetsen voor te bereiden en te ijken. Ik zal op de techniek hiervan niet ingaan, men zie de discussie in Pedagogische Studiën, 1964 en 1965 (de Groot-Steller) en pag. 196 en volgende van het onderhavige boek. Maar afgezien van deze techniek blijft het probleem van de minimumeis bestaan. De Groot blijkt op pag. 204, mèt van den Ende, het vreemd te vinden dat van de minimum-eisen voor scheikunde HBS-B op het examen nog heel wat gemist kan worden: met 51% heeft men nog een zes. Hij verwart hier kennelijk het minimum van de te behandelen stof en het minimum aan vereiste kennis. Maar op pag. 206 blijkt hij te erkennen, dat ook van zijn ‘kernitems’ (essentie-vragen over de minimumstof) wel wat gemist mag worden, al ware het slechts ten gevolge van aandachtsschommelingen bij de kandidaat. In feite vergelijken we twee steekproeven: de toets is, idealiter, een | |
[pagina 623]
| |
steekproef uit de mogelijke, binnen het kader van de eisen aanvaardbare, vragen; het resultaat toont ons een steekproef uit de kennis van de kandidaat, één van de door allerlei factoren (vermoeidheid, aandacht, emotie) beïnvloede mogelijkheden. De normen voor de caesuur voldoende-onvoldoende kan men toepassen op dit resultaat. Maar omdat het om steekproeven gaat, is de aldus bepaalde uitslag niet volledig reproduceerbaar, betrouwbaar in experimentele zin. Het is geenszins uitgesloten dat met een andere steekproef een enigszins afwijkend resultaat wordt verkregen of dat op een ander moment dezelfde steekproef een andere uitslag zou opleveren. ‘Zekerheid’ zou men alleen kunnen krijgen door àlles te vragen op verschillende tijdstippen. Als ik zeker wil zijn, dat iemand alle Griekse stamtijden of alle tafels van vermenigvuldiging paraat heeft moet ik hem alles vragen en navragen wat hij mist. Is dit niet mogelijk, dan moet ik genoegen nemen met een zekere waarschijnlijkheid. Dat erkent ook de Groot (pag. 207). Dat brengt mee dat ik fouten maak, fouten van tweeërlei aard. Of ik laat ten onrechte toe (eerste soort) òf ik wijs ten onrechte af (tweede soort). KohnstammGa naar eind7 heeft er reeds op gewezen dat bij het onderwijs het probleem anders ligt dan bijvoorbeeld bij een sollicitatie. Het gaat er bij het onderwijs om fouten van de tweede soort te vermijden: indien men tenminste ernst wil maken met de gedachte van ‘gelijke kansen’. Maar hoe minder fouten van de tweede soort ik wìl maken, hoe meer fouten van de eerste soort ik moèt maken. Hoe minder ik ten onrechte afwijs, hoe vaker ik ten onrechte zal toelaten. Groen (t.a.p.) heeft dit heel uitvoerig nagegaan. Nadat hij een zo bruikbaar mogelijke ‘voorspeller’Ga naar eind8 heeft afgeleid uit test- en schoolresultaten is hij aan de hand van de schoolloopbanen van ruim vijfhonderd voor toelating tot het Spinoza Lyceum aangemelde kandidaten nagegaan, welke betrouwbaarheid hij met deze voorspeller had kunnen bereiken. Indien hij 84% van de ongeschikt gebleken kandidaten zou afwijzen, betekent dat tevens dat hij de helft van de geschikten ten onrechte zou hebben afgewezen (‘geschikt’ betekent hier: leerlingen die in een eindexamenklas terecht zijn gekomen, op het Spinoza Lyceum of elders). Bij een ruimere definitie van ‘geschikt’ (niveau driejarige HBS) zou vrijwel niemand zijn afgewezen, en zelfs van de veertien wie dit lot te beurt viel, waren er nog vijf die achteraf onjuist beoordeeld bleken te zijn. Maar drieënzeventig leerlingen zouden, achteraf, nog niet eens dit lagere niveau hebben | |
[pagina 624]
| |
bereikt. Echter: ‘Dit betekent dat er op een gegeven moment een punt bereikt wordt waar de onderwijsinstellingen de gemeenschap meer geld kosten dan verantwoord is’. Men bedenke: kosten door ongeschikt gebleken leerlingen èn kosten tengevolge van onaangewende mogelijkheden van afgewezenen.
Groen is niet optimistisch over de mogelijkheid de voorspelbaarheid van schoolsucces te vergroten: voor de lagere-schoolleerlingen die hij in Utrecht in zijn onderzoek betrok bleek ook het beroep van de vader een bijdrage tot die voorspelbaarheid te leveren, die in Amsterdam, binnen de groep van Spinoza-kandidaten, ontbrak. In feite is zijn conclusie die van Brouwer: We kunnen vrij duidelijk een groep van beslist geschikten en een van beslist ongeschikten aanwijzen. En daar tussenin weten we het niet... Daarom adviseert hij (pag. 154) herhaalde adviezen, getrapte selectie. Inderdaad, dit is de methode van ‘sequential sampling’ die echter heel dicht komt bij wat de Groot als ‘permanente selectie’ brandmerkt. De Groot's voornaamste bezwaar is echter dat men ‘nooit zeker is geaccepteerd te zijn’, al geeft hij allerlei voorbeelden van het tegendeel: veel eindexamenklassen, de doctoraal-studie in vele gevallen.
Er is echter nog een andere kant aan deze kwestie, die aan de orde wordt gesteld in een brief in New Scientist van 5 oktober 1967. Het komt hierop neer: waar heb je meer kans, in de ‘A-stream’ van een secondary modern of in de ‘D-stream’ van een Grammar school, vrij vertaald: als beste leerling op een ULO of als brekebeen op een HBS? Dat is de vraag waarop we zo vaak eenvoudig moeten antwoorden: we weten het niet. Het is een van de voordelen van de mammoetwet dat er straks meer herkansingsmogelijkheden zullen zijn. Nu reeds is Delft bereikbaar via LTS-UTS-HTS. De Groot voert een sympathiek pleidooi voor het overlaten van de beslissing aan de leerling, maar ik heb te veel ervaring met slechte resultaten dan dat ik me zou kunnen troosten met een ‘ze hebben het toch zelf gewild’. Iets dergelijks geldt voor zijn pleidooi voor bevordering per vak. Prachtig: maar niet met een eindexamen met zeven à acht verplichte vakken. Als iemand zes jaar nodig heeft om de stof van vijf jaar wiskunde te leren beheersen, dan hangt het van allerlei praktische en | |
[pagina 625]
| |
persoonlijke omstandigheden af of het zin heeft, dat hij een jaar te voren al klaar is met zijn moderne talen. Het is natuurlijk wat anders of men de betrokkene verplichten wil zich een jaar lang bij Frans te vervelen, dan wel hem zinrijker bezigheid verschaft. Met het systeem heeft het weinig te maken. En een analoge redenering geldt voor de door de Groot zo bepleite herkansingen in de vorm van taken en herexamens (pag. 50). Men kan zich hier niet aan de indruk onttrekken dat hij nogal generaliseert, ondanks vele behartenswaardige opmerkingen.
De Groot wil dus objectieve toetsen, helaas ook niet geheel zuiver en dus behept met onzekerheid, met een foutenmarge. En hij wil eenmalige selectie, behoudens ‘voldoende ijver’ èn behoudens ‘pathologische ontwikkelingen’Ga naar eind9. Hij gaat uitvoerig in op het aan de Haagse Thorbecke HBS ondernomen experiment (1953-1960) de bevordering automatisch te maken, behalve die van de derde naar de vierde klas. Een analoog experiment is trouwens op het Overveense Montessori Lyceum genomen. In beide gevallen kon worden aangetoond dat het rendement niet verminderd was, maar in beide gevallen lieten - door vergelijkbare oorzaken - de eindexamenresultaten te wensen over en kwam aan het experiment een einde. Ik meen dat de Groot onvoldoende oog heeft voor de mogelijkheden die in dit opzicht in de mammoetwet liggen: het geringere aantal vakken op de MMS-afdeling leidde in Overveen bij het zelfde bevorderingssysteem tot duidelijk gunstige resultaten, óók bij het eindexamen. Het Thorbecke-experiment voldeed dus aan de tweede wens van de Groot: na een selectiedrempel een garantie voor een bepaald resultaat. In een propedeutisch-nieuwe-stijl wordt dat bij de Amsterdamse psychologiestudie geprobeerd. Maar men realisere zich dat deze selectiedrempel evenmin foutenvrij is als welk toelatingsonderzoek ook, dat hetzelfde mechanisme dus werkt: òf men laat te veel ongeschikten toe en kan zijn garantie niet waar maken òf men wijst te veel geschikten af. De mededeling dat bij het propedeutisch psychologie strengere maatstaven aangelegd zullen worden en het Eindhovense resultaat, zo juist bekend geworden, dat het propedeutisch als voorspeller voor de studiegang niet bijzonder voldeed, wijzen beide op de realiteit van dit gevaar. De Groot's pretentie van ‘selectievrij’ onderwijs, ná een selectiedrempel | |
[pagina 626]
| |
is irreëel. Er volgen nieuwe selectiedrempels. Minder hopelijk dan in het huidige systeem, maar toch drempels. Het Britse ‘streaming’-systeem is óók selectie, want al haalt men een diploma zonder doubleren, het is de vraag wat men met dat diploma bereiken kan. Voor een Oxford-Cambridge A-level doubleert men ook in Engeland (drie jaar over de twee jaren van de Sixth Form). En toch klaagt SnowGa naar eind10 dat er een te veel aan aanbod is van de ‘gemakkelijke’ diploma's, met als resultaat sterke selectie voor de universiteit en een tekort voor de zwaardere diploma's waarvoor de universiteiten dan ook te weinig aanmeldingen krijgen.
De Groot levert een goed pleidooi voor meer objectieve normen, al schijnt hij te onderschatten wat er op dat gebied al gebeurt; en wat er voor gevaren schuilen: er klinken reeds roepen om een staatsdidactiek. Objectieve normen maken een discussie over de relevantie van de toetsvragen nodig, maar in de discussie over de vakstof speelt dit element toch ook al mee. Als er tenminste overleg is over de leerstof, zoals bij ULO en VHMO, in tegenstelling tot sommige vormen van Hoger Beroepsen Wetenschappelijk Onderwijs. Menige examencommissie kan een voorbeeld nemen aan de verslagen van de staatsexamencommissies HBS en Gymnasium. En er wordt meer gediscussiëerd over eindexamenopgaven dan ooit over bijvoorbeeld de opgaven van de verschillende eerstejaars-toetsen! Objectieve normen vereisen in de meeste gevallen schriftelijke opgaven. Voor bepaalde vaardigheden wil de Groot eventueel beoordeling door deskundige - een belangrijk punt! - juries. Maar sommige doelstellingen van het onderwijs, creativiteit, inventiviteit, acht hij in beginsel ontoetsbaar en wil hij derhalve van de toetsing uitsluiten... bij het slot van de opleiding. Voor de aanvangsselectie kunnen ze, meent hij, niet gemist worden; een duidelijk geval waar objectieve normen dus niet verwezenlijkbaar zijn! Het is niet anders dan het interview van de Engelse Civil Service: een sollicitatiegesprek, geen objectieve toets. Bij een garantie van slagen na toelating kan dit niet anders betekenen dan een hoog percentage ten onrechte afgewezenen. Laat men deze drempel vallen, dan belandt men automatisch bij het andere uiterste: selectie tijdens de opleiding, met andere woorden getrapte selectie. Een diploma is in onze maatschappij een economisch goed. Bij een consequente vrije mededinging betekent dat strenge spelregels om de | |
[pagina 627]
| |
mededinging ‘eerlijk’ te houden: anti-trustwetten, ‘doping’-verbod en... verbod van bijlessen en hulp thuis, zoals men zich dacht voor de nationaal-socialistische school in Valkenburg! ‘May the best man win’, in een intellectuele ‘rat race’ die een weerspiegeling is van de maatschappij. Maar in een samenleving waarin ‘vrije mededinging’ niet als hoogste waarde wordt beschouwd, is plaats voor de ‘medische’ aanpak: help zoveel mogelijk de leerling zijn eigen niveau te vinden, confronteer hem met zijn eigen grenzen, maar geef zo veel mogelijk kansen. Paternalistisch noemt de Groot dat, ik noem het menselijk. Menselijk ook vanwege onze eigen feilbaarheid, die ik niet zou willen verbergen onder een mantel van pretentie van grotere nauwkeurigheid dan ik kan waarmaken. In een selecterende maatschappij is een niet-selecterende school niet mogelijk, wel een humane en openhartige school, die niet meer belooft dan zij vervult.Ga naar eind11 |
|