Colloquium Neerlandicum 16 (2006)
(2007)– [tijdschrift] Handelingen Colloquium Neerlandicum– Auteursrechtelijk beschermdNeerlandistiek in contrast. Handelingen Zestiende Colloquium Neerlandicum
[pagina 411]
| |||||||||||||||||||||||||||
De dubbele pregnante contexttoets als productieve woordenschattoets voor Nederlands als vreemde taal
| |||||||||||||||||||||||||||
[pagina 412]
| |||||||||||||||||||||||||||
gaat, gaat het bij dieptekennis om hoe goed men de woorden kent (zie ook Neven 2002: 78). In het begrip dieptekennis kan men taalkundig verschillende dimensies onderscheiden. Een van de bekendste kwalitatieve karakteriseringen van woordkennis is wellicht die van Paul Nation (1990) die de volgende dimensies onderscheidde:
Een voorbeeld ter illustratie. Wie het woord ‘kat’ alleen kent in zijn gesproken of geschreven vorm en er een betekenis aan kan toekennen, heeft nog geen diepe kennis van dit woord. Hij/zij moet ook nog weten dat het een de-woord is, dat het meervoud ‘katten’ is en bijvoorbeeld niet ‘katen’ (vgl. gat/gaten), dat het diminutief ‘katje’ is, dat je het collocationeel kan verbinden in ‘zijn kat sturen’ (niet komen opdagen), ‘de kat de bel aanbinden’ (een zaak aanhangig maken), ‘dat is geen katje om zonder handschoenen aan te pakken’, ‘een kat een kat noemen’, ‘de kat in het donker knijpen’, etc. Je moet ook weten dat het een frequent voorkomend woord is, maar dat het andere registerbeperkingen heeft dan zijn synoniem ‘poes’: ‘Ze is een echte kat!’. Uiteraard moet je ook de conceptuele betekenis van het woord kennen (klein harig huisdier) en moet je weten dat het woord geassocieerd wordt met typisch gedrag zoals spinnen, miauwen en kopjes geven. In onze mentale encyclopedie weten we overigens nog heel wat meer over de ‘kat’:
Bij die encyclopedische kennis zit ook cultuurspecifieke kennis: kattenvlees kan je wel of niet eten, katten zijn wel of geen huisdieren,... | |||||||||||||||||||||||||||
[pagina 413]
| |||||||||||||||||||||||||||
Het zal in elk geval duidelijk zijn dat de ‘dieptekennis’ van een woord veel meer omvat dan de kennis van de frequentste betekenis en dat de grens tussen grammatica en betekenis hierbij opgeheven wordt. Het lijkt voor de hand te liggen om deze nieuwe kijk op woordenschatkennis ook toe te passen bij woordenschattoetsing, aangezien goede toetsing altijd een afspiegeling moet zijn van omschrijving van de bedoelde vaardigheid. Maar de operationalisering is niet onproblematisch want:
| |||||||||||||||||||||||||||
Receptieve en productieve woordenschattoetsenVoor de receptieve woordenschatkennis wordt Paul Nations Vocabulary Levels Test (1990) beschouwd als ‘the nearest thing we have to a standard test in vocabulary’ en volgens Cobb is Paul Meara's Yes/No Vocabulary Checklist ‘another candidate’ (2000: 296). En dat is het zowat. ♦ De toetsitems van Nations Vocabulary Levels Test zijn - in Nederlandse versie - van de volgende vorm:
Dit is dus in feite een matching test waarbij de getoetsten de betekenis van drie woorden uit een rijtje van zes moeten identificeren door de letter bij die woorden naast de juiste betekenis te schrijven. ♦ Van Paul Meara's Yes/No Vocabulary Checklist heeft June Eyckmans voor haar proefschrift (2004) een Nederlandstalige versie gemaakt, waarvan de toetsitems er als volgt uitzien: | |||||||||||||||||||||||||||
[pagina 414]
| |||||||||||||||||||||||||||
Beide toetsvormen hebben het nadeel dat ze uitsluitend receptieve breedtekennis meten.
Is het meten van receptieve kennis al erg moeilijk, het meten van productieve woordenschatkennis blijkt nog problematischer, zodanig zelfs dat Meara en Fitzpatrick nog in 2000 vaststelden: ‘There are no well-established and easy-to-use tests of productive lexical skills’ (2000: 19). Wat is er dan wel?
♦ synoniemtoetsen Dat zijn toetsen waarbij de kandidaten een synoniem moeten geven voor een schuin gedrukt woord (bijvoorbeeld: Hij komt heel dikwijls (...) met ons mee.). Het probleem met dit soort toetsen is dat het aantal synoniemen beperkt is en dat dus slechts een heel beperkt deel van de woordenschat kan worden getoetst.
♦ C-test Een C-test is een toets die bestaat uit een korte tekst waarvan, na de eerste zin, de tweede helft van elk tweede woord is weggelaten. Weliswaar zijn C-tests vrij eenvoudig te construeren en tasten ze ook gedeeltelijk dieptekennis af, maar ze zijn eigenlijk niet betrouwbaar en valide (Chapelle 1994) en ze toetsen voor een groot stuk raadvaardigheid eerder dan woordenschatkennis. Bovendien is het moeilijk om een specifiek segment van de woordenschat voor toetsing te selecteren.
♦ Cloze De Cloze is een toets bestaande uit een tekst waarvan vanaf de tweede zin, met mathematische regelmaat elk vijfde, zesde of zevende woord is weggelaten. Elk weggelaten woord wordt vervangen door een streepje van standaardlengte. De Cloze wordt wel eens gebruikt als productieve woordenschattoets, maar in feite is het geen zuivere woordenschattoets, veeleer een globale taalvaardigheidstoets en bovendien is hij als woordenschattoets noch betrouwbaar noch valide. | |||||||||||||||||||||||||||
[pagina 415]
| |||||||||||||||||||||||||||
♦ Lex30 (Meara en Fitzpatrick 2000) Deze experimentele toets is gebaseerd op het woordassociatie-principe: hoe dichter het netwerk rond een woord, hoe beter de kennis van dat woord (Nagy en Herman 1987). Een leerder die veel woorden kan associëren met een bepaald stimuluswoord is lexicaal competenter dan een leerder die dat niet kan. De toets bestaat uit dertig items en verloopt als volgt: Geef een reeks woorden (minstens drie) waar u aan denkt als u het volgende stimuluswoord ziet (om de vijftien seconden wordt een nieuw woord gepresenteerd): Het probleem met deze toets is dat hij geen betrouwbare meting oplevert omdat er geen vaste meetstandaard voor is.
♦ Laufer en Nation's ‘Levels Test of Productive Vocabulary’ (1999) Dit is de meeste gebruikelijke test voor productieve woordenschatkennis. De items bestaan uit betekenisvolle contexten, waarin de eerste letters van het doelwoord gegeven zijn (‘Het boek beslaat een reeks geïsoleerde epis___ uit de geschiedenis’). Het is duidelijk dat de gegeven eerste letters moeten beletten dat andere eveneens geschikte woorden gekozen worden (bijvoorbeeld in plaats van ‘episodes’, woorden als ‘gebeurtenissen’ ‘hoofdstukken’, ‘periodes’...). Aan deze toets zitten enkele interessante aspecten. Het is namelijk mogelijk via selectie van de doelwoordenschat uit een bepaalde frequentieband een niveautest te maken en de betekenisvolle context doet een beroep op verschillende aspecten van de dieptekennis: gevoeligheid voor semantische relaties, gevoeligheid voor grammaticale valentie en gevoeligheid voor idiomatische verbindingen. | |||||||||||||||||||||||||||
De dubbele pregnante context niveautestAansluitend bij Laufer en Nation's Levels Test wilde ik de voordelen van een contexttoets combineren met een volledig gecontroleerde toetsvorm die de dieptekennis van productieve woordenschat op verschillende niveaus kon aangeven. Het testformaat dat ik daartoe gekozen heb is de dubbele pregnante context niveautest. Een typisch item bestaat uit twee pregnante contexten die samen ondubbelzinnig dezelfde woordvorm oproepen. Bijvoorbeeld: | |||||||||||||||||||||||||||
[pagina 416]
| |||||||||||||||||||||||||||
Een pregnante context is een context die zowel grammaticaal als semantisch voldoende aanwijzingen bevat om een specifiek doelwoord op te roepen. Nu zijn absoluut pregnante contexten vrij zeldzaam, daarom wordt in het item een tweede pregnante context geïntroduceerd die de unieke juiste keuze moet garanderen. Die tweede context roept dezelfde woordvorm op, maar niet noodzakelijk hetzelfde woord. Het vereiste woord hoop1 (substantief) is hier bijvoorbeeld niet hetzelfde als het vereiste woord hoop2 (1e persoon v.h. ww.). Deze itemvorm is niet nieuw, ik heb hem al als woordoefenvorm gebruikt in Een zinnig woord (Beheydt 1987) maar als toetsvorm is dit itemtype nog niet uitgetest, terwijl het mijns inziens een uitstekende test van de dieptekennis van de woordenschat is. Om dit soort toetsen goed te kunnen maken moet de leerder immers verschillende aspecten van de woordenschat beheersen. ♦ De kandidaat moet het semantisch profiel van de doelwoorden kennen: | |||||||||||||||||||||||||||
[pagina 417]
| |||||||||||||||||||||||||||
♦ De kandidaat moet het associatieve verband kennen waarin de woorden functioneren. De contexten roepen immers zo ondubbelzinnig mogelijk de typische associatieve netwerken op die moedertaalsprekers verbinden met de doelwoorden. Zo zal het woord ‘bril’ bij de moedertaalspreker het makkelijkst de woorden ‘glas’, ‘oog’, ‘lezen’, ‘lenzen’, ‘opzetten’, ... (Van Loon-Vervoorn en Van Bekkum 1991: 53) oproepen en dus zullen zinnetjes die deze woorden bevatten in een zinnige context het woord gemakkelijk uitlokken:
| |||||||||||||||||||||||||||
Een niveautestMet dit type toetsitems is het mogelijk om een niveautest te ontwerpen. Het is namelijk mogelijk om de kennis van de woordenschat op verschillende niveaus te meten door een selectie van de woordenschat uit verschillende frequentiebanden. Hier is gekozen voor een selectie uit drie frequentiebanden. Een eerste selectie betreft woorden uit de duizend nuttigste woorden, zoals die zijn vastgelegd in het Elementair woordenboek van Beheydt en Wieers (1991). Hiermee mikken we op het A2-niveau van het C.E.F.R want dat stelt: ‘Ik kan [...] de meest frequente woorden begrijpen die betrekking hebben op gebieden die van direct persoonlijk belang zijn’ (De Jong 2002: 39). Voor een tweede selectie richten we ons op de ruim 2000 | |||||||||||||||||||||||||||
[pagina 418]
| |||||||||||||||||||||||||||
woorden van het Basiswoordenboek (1987) van De Kleijn en Nieuwborg. Hiermee viseren we het B1-niveau van het C.E.F.R (‘heeft voldoende vocabularium om zich met enige omschrijving uit te drukken over de meeste onderwerpen die van belang zijn in het dagelijkse leven, zoals familie, hobby's, interesses, werk, reizen en actuele gebeurtenissen’ (Janssen-van Dieten 2000: 64)). Voor de derde selectie richten we ons op de woordenbestand van Alexander (De Kleijn, 2005), waarmee we het B2-niveau van her C.E.F.R op het oog hebben (‘Heeft een brede vocabulariumrange voor zaken uit zijn/haar domein en voor de meeste algemene onderwerpen. Kan de formulering variëren om frequente herhaling te vermijden, maar lexicale tekorten kunnen aarzeling en omschrijving veroorzaken’ (Janssenvan Dieten 2000: 64)).Ga naar eind1 Voor elk van deze frequentiebanden worden twintig woorden geselecteerd, zodat de totale toets uit zestig items zal bestaan (zie appendix, voor voorbeelden uit elke frequentieband).Ga naar eind2 Bij de keuze van de woorden wordt erop gelet dat alle woordklassen vertegenwoordigd zijn, zodat niet alleen inhoudswoorden worden getoetst. Voor die zestig woorden worden dan onder meer op basis van in corpora gevonden voorbeeldzinnen en op basis van de bekende woordassociaties van moedertaalsprekers pregnante itemzinnetjes gecreëerd, zoals hierna is uitgelegd (cf. ‘itemconstructie’). De woordenschat van die contextzinnen is bewust eenvoudig gehouden, zodat de woorden van de contextzinnen geen hindernis vormen voor het maken van de toetsitems. Zo krijgt u op het duizend-woordenniveau geen zinnetjes van het type:
‘Kopjes geven’ en ‘spinnen’ zijn te specifieke woorden om op elementair niveau in itemzinnen te fungeren. Lexicaal worden de itemzinnen bewust eenvoudig gehouden. Er is gekozen voor zestig items omdat we op die manier hopen de spanning tussen betrouwbaarheid en uitvoerbaarheid van de toets in evenwicht te houden. Voor de drie frequentiebanden is ook een verschil in dieptekennis vereist. We gaan er namelijk vanuit dat woordkennis een incrementeel proces is en dat de dieptekennis van de afzonderlijke woorden toeneemt, naarmate de leerder vordert (Schmitt 1998). We gaan er immers van uit dat leerders op een hoger niveau meer gevoel hebben gekregen voor de semantische en grammaticale subtiliteiten in het gebruik van de woordvormen, dat ze een toegenomen kennis van de polysemie hebben verworven, maar ook dat ze een ruimere contextuele kennis hebben van | |||||||||||||||||||||||||||
[pagina 419]
| |||||||||||||||||||||||||||
de woorden. De itemzinnen doen dan ook wat meer een beroep op een lexicaal en grammaticaal complexere kennis, ook wat het morfologisch, het syntactisch en het idiomatisch profiel betreft van de doelwoorden. Een item als het hiernavolgende is al vrij complex:
We hebben in de ... weken heel wat ellende gezien op de televisie. Toen de wedstrijd was ... renden de supporters het veld op.
Lexicaal is hier het woord ‘ellende’ gebruikt dat niet in de eerste duizend woorden van het Nederlands thuishoort. In de eerste zin zouden ‘voorbije’ en ‘afgelopen’ even goed kunnen. Maar de tweede zin geeft aan dat het adjectief ‘voorbij’ geen optie meer is. Hier kan alleen nog een voltooid deelwoord komen. ‘Afgelopen’ is een voltooid deelwoord dat als adjectief kan worden gebruikt en dat niet verbogen wordt, ook niet voor een meervoud en dus is het de enige optie hier. | |||||||||||||||||||||||||||
ItemconstructieHet construeren van toetsitems is een nauwgezet en veeleisend karwei en het is een illusie te geloven dat bruikbare pregnante zinnen gemakkelijk te vinden zijn. Bij de constructie van de testitems zijn een aantal regels gevolgd. | |||||||||||||||||||||||||||
1. Het uitgangspunt is de ‘mentale encyclopedie’.Voor het construeren van een goede pregnante context gaan we in de eerste plaats uit van de gemeenschappelijke kennis van de wereld. Mensen weten dat een bril glazen heeft, dat katten muizen vangen, dat een fietsband lucht bevat, dat haar geknipt moet worden etc. Daarbij moet men echter wel bedenken dat heel wat van die gedeelde kennis cultureel bepaald is. Niet in alle culturen beschouwt men honden als huisdieren of wandelen als een vrijetijdsbesteding. Maar gemiddeld genomen is een item als:
niet te cultuurspecifiek. | |||||||||||||||||||||||||||
2. Een tweede uitgangspunt is het ‘mentale lexicon’ van de moedertaalspreker.Dat mentale lexicon is het lexicale netwerksysteem waarin de woorden zijn opgeslagen. Woorden zijn in het mentale lexicon in verschillende graad van sterkte met elkaar verbonden en roepen elkaar meer of minder gemakkelijk op. Via woordassociatietests kunnen we weten welke woorden in de collectieve | |||||||||||||||||||||||||||
[pagina 420]
| |||||||||||||||||||||||||||
ervaring van de moedertaalsprekers nauw met een bepaald stimuluswoord verbonden zijn. Zoals Read heeft opgemerkt is één van de basisbevindingen uit het woordassociatieonderzoek dat ‘native speakers have remarkably stable patterns of word association, which can be taken to reflect the sophisticated lexical and semantic networks that they have developed through their acquisition of the language’ (Read 1993: 358). In die zin zijn Woordassociatielexica zoals dat van W.A. van Loon-Vervoorn en I.J. van Bekkum bijzonder nuttige instrumenten voor het construeren van contexten die het doelwoord moeten oproepen. Bovendien heeft woordassociatieonderzoek in de loop der jaren aangetoond dat woorden neigen te clusteren in specifieke betekenisverbanden (Schreuder en Levelt 1978: 44, Verhallen 1991, Clark 1970, Ramsey 1981):
Deze fundamentele relaties in het mentale lexicon van de moedertaalsprekers vormen een bruikbaar uitgangspunt voor de constructie van de items. | |||||||||||||||||||||||||||
3. Een derde uitgangspunt is het ‘taalkundig profiel’ van het woord:
| |||||||||||||||||||||||||||
4. Een vierde uitgangspunt betreft de moeilijkheidsgraad van de zinnen.Voor de eerste twintig items mag de lexicale moeilijkheidsgraad niet boven het duizend-woordenniveau van het elementair woordenboek uitstijgen en ook de | |||||||||||||||||||||||||||
[pagina 421]
| |||||||||||||||||||||||||||
syntactische complexiteit moet zo laag mogelijk gehouden worden. Bij voorkeur dus enkelvoudige zinnen bestaande uit louter elementaire woordenschat. | |||||||||||||||||||||||||||
5. Een vijfde uitgangspunt is het reëel voorgekomen taalgebruik.Het ligt voor de hand om zich voor de pregnante zinnen te baseren op het normale taalgebruik en dat kunnen we uiteraard vinden door te gaan grasduinen in allerlei bestanden die op het internet beschikbaar zijn. De simpelste manier is via een google-zoekoperatie met het doelwoord en een paar ermee verbonden woordassociaties voorbeeldzinnen op te zoeken. Deze voorbeeldzinnen kunnen dan vervolgens worden opgeschoond volgens de uitgangspunten die hiervoor geformuleerd zijn.
Een toepassing van deze uitgangsprincipes heeft uiteindelijk geleid tot de constructie van twee parallelversies van de ‘dubbele pregnante context niveautest’ waarvan in bijlage uit elke frequentieband enkele voorbeelden zijn opgenomen. De parallele toetsen kunnen als basis dienen voor het vaststellen van woordenschatniveaus, maar ook voor verder valideringsonderzoek van deze nieuwe productieve woordenschattoets. | |||||||||||||||||||||||||||
Bibliografie
| |||||||||||||||||||||||||||
[pagina 422]
| |||||||||||||||||||||||||||
| |||||||||||||||||||||||||||
[pagina 423]
| |||||||||||||||||||||||||||
Appendix
| |||||||||||||||||||||||||||
Voorbeelden uit frequentieband 1
| |||||||||||||||||||||||||||
Voorbeelden uit frequentieband 2
| |||||||||||||||||||||||||||
[pagina 424]
| |||||||||||||||||||||||||||
Voorbeelden uit frequentieband 3
|
|