| |
| |
| |
De zoekmachine Google en de zelfstandige naamwoorden met een dubbel de-/het-genus
Siegfried Theissen, lid van de Academie
Het is algemeen bekend dat het Nederlands een erg instabiele/onstabiele taal is met een groot aantal dubbele of zelfs driedubbele meervouden, dubbele genera (en daarmee bedoel ik niet masculinum en femininum - want dan spreek je al vlug over ongeveer 20% van de zelfstandige naamwoorden - maar de circa 500 het-/de-woorden zonder betekenisverschil), dubbele suffigeringsmogelijkheid, b.v. -ering/-atie enz., enz.
Als anderstalige en als docent Nederlands aan anderstaligen ben ik altijd gefascineerd geweest door al deze dubbele mogelijkheden van de meervoudsvorming, de genustoekenning of de suffigering - en dan laat ik de zinsbouw, b.v. de volgorde in de werkwoordelijke eindgroep nog buiten beschouwing - die ik in het Duits, het Frans of het Engels niet ken.
Nu heb ik enkele van deze doubletten al eens onderzocht a.h.v. omvangrijke krantencorpora, voor het Zuiden meer dan 10 jaargangen van het weekblad Knack (1991-2003) en voor het Noorden 2 jaargangen van NRC-Handelsblad (1993-1994): samen ging het hier om een 80-miljoen woorden corpus.
Deze onderzoeken hebben heel wat interessante gegevens opgeleverd met betrekking tot de statistische verhouding tussen de twee vormen van een doublet (b.v. het/de schilderij) of een eventueel verschil tussen het Noorden en het Zuiden (b.v. het/de affiche), maar er waren wel een aantal beperkingen in de interpretatie van het materiaal (en ik heb daar ook telkens op gewezen): ten eerste bestond het corpus slechts uit één Vlaams weekblad en uit één Nederlandse krant, die ik dan maar noodgedwongen representatief achtte voor het Noorden en het Zuiden; ten tweede was het corpus, hoewel het, zoals gezegd, circa 80 miljoen woorden omvatte, voor een aantal niet zo vaak voorkomende doubletten niet omvangrijk genoeg, en ten derde, en dat was het voornaamste bezwaar, ging het hier om verzorgde krantentaal. Je kon er dus geen conclusies aan verbinden over het gebruik van deze doubletten in informele taal of in spreektaal.
| |
| |
En toen kwam Google. De zoekmachine Google stelt je in staat een miljardencorpus te doorploegen. Niet voor niets vertegenwoordigt Google een getal van 1 gevolgd door 100 nullen. Om een idee te geven van de elke dag groeiende omvang van het Google-corpus: voor het dubbele meervoud artikels/artikelen heb ik in het NRC-corpus (dat omvangrijker is dan het Knackcorpus) circa 1.500 voorbeelden gevonden en op Google 1.550.000. Maar er is nog een ander voordeel: Google bevat niet alleen krantentaal, maar alle soorten taal, van zeer informele taal en spreektaal tot zeer plechtige bijbelse taal. Dit lijkt me dus het ideale corpus om aan statistisch taalonderzoek te doen.
Helaas zijn er een paar beperkingen en tekortkomingen:
1) | Je kan wel afzonderlijk het Noorden en het Zuiden van het Nederlandse taalgebied onderzoeken door in het domeinvenster.nl of.be in te tikken, maar al vlug constateer je dat er overlappingen zijn, omdat Belgische commerciële sites ook in Nederland adverteren en vice-versa. Dit heeft als gevolg dat de percentages voor het Noorden en het Zuiden niet absoluut betrouwbaar zijn. |
2) | Ook al heb je slechts voor sites in het Nederlands gekozen, je vindt ook voorbeelden in het Engels, het Frans of het Duits, ofwel omdat het citaten zijn, ofwel omdat een buitenlands bedrijf ook op Nederlandse sites in een van die talen adverteert: als je wil weten of je op Google meer het concours of de concours tegenkomt, vind je tientallen voorbeelden in het Frans, natuurlijk niet van het concours maar b.v. van ‘une bête de concours’. Ook van de manoeuvre tref je honderden Franse voorbeelden aan. |
3) | Onderzoek je de frequentie van illustrators en illustratoren, dan vind je opeens heel wat voorbeelden van de Engelse vorm illustrators. |
4) | Google maakt geen onderscheid tussen grote en kleine beginletters, zodat naast de gezochte soortnaam ook eigennamen (familienamen en namen van firma's) verschijnen, denk b.v. aan Colbert. Van het meervoud lectors had ik niet veel vindplaatsen verwacht; er waren er echter toch enkele, maar toen ik de voorbeelden las, zag ik dat er sprake was van de ‘Hannibal Lectors van onze tijd’. Soms kun je b.v. bij het onderzoek naar het de-/het-genus de soortnaam van de eigennaam scheiden door het zelfstandig naamwoord niet door het lidwoord vooraf te laten gaan, maar door de aanwijzende voornaamwoorden deze/die, dit/dat: daarmee schakel je b.v. alle voorbeelden met de gamma als eigennaam uit. Bij transfer, dat in heel wat eigennamen (b.v. de Transfer en Liaison groep) voorkwam, kun je niet de 21.000 voorbeelden lezen, maar je kunt de niet
|
| |
| |
| gewenste voorbeelden uitschakelen door de/het transfer van en naar te onderzoeken en dan hou je in totaal nog meer dan 10.000 voorbeelden over, wat meer dan voldoende is om iets relevants te kunnen zeggen over de verhouding tussen het transfer en de transfer. |
5) | Google houdt geen rekening met leestekens of diacritische tekens, ook niet met de apostrof, zodat bij het opzoeken van het of de memo, het of de menu ook de meervoudsvormen de memo's en de menu's verschijnen. Die moet je er dan maar handmatig uitsorteren. Er zit dus soms niets anders op dan honderden voorbeelden te lezen. Als het er tienduizenden zijn, is dit natuurlijk niet meer te doen: dan moet je steekproeven nemen. |
6) | Het voornaamste bezwaar is echter van een heel andere orde: bij elke onderzoeksopdracht vermeldt Google het totale aantal gevonden vindplaatsen en het aantal originele vindplaatsen, b.v. NL 25.500 aardappels naast 55.300 aardappelen, maar na de eerste 755 meervouden op -s en de eerste 816 op -en vermeldt Google dat de andere voorbeelden niet gegeven worden omdat ze sterk lijken op de al vermelde gevallen, m.a.w. alle andere voorbeelden zouden citaten of herhalingen zijn van de originele voorbeelden. Het lag dus voor de hand alleen rekening te houden met de oorspronkelijke vindplaatsen, want dat had ik ook in de krantencorpora gedaan: als er in een artikel voor het meervoud leraars gekozen wordt en er zijn tien voorbeelden van, dan tel je dit normaliter maar één keer, tenzij een journalist, wat ook al eens gebeurt, de beide vormen van een doublet in hetzelfde artikel door elkaar gebruikt. |
Maar dan heb ik iets eigenaardigs ontdekt: de verhouding van de originele vindplaatsen tot het totale aantal vindplaatsen is relevant, als er minder dan duizend originele vindplaatsen zijn, maar daarna niet meer, m.a.w. als Google.nl vermeldt dat er in totaal - ik noem dit het bruto aantal - 157 vindplaatsen van administrateurs en 5 van administrateuren zijn en dat het netto aantal resp. 112 en 5 is, dan kun je daarop vertrouwen. Maar - om nog eens het voorbeeld van die aardappels/aardappelen te nemen - als Google beweert dat er van de 25.500 aardappels slechts 755 oorspronkelijke voorbeelden zijn en van de 55.300 aardappelen slechts 816, dan klopt er iets niet. De bruto-verhouding is 2/3 tegen 1/3 en de netto-verhouding is ongeveer fifty-fifty. Het is dus zo dat Google nooit meer dan acht- à negenhonderd netto vindplaatsen vermeldt, m.a.w. als de bruto-getallen in de duizenden gaan, kun je op de verhouding van de netto-getallen niet meer vertrouwen.
Je moet dus noodgedwongen rekening houden met de bruto-aantallen, wat voor de meeste doubletten geen probleem is, maar voor enkele gevallen wel. De
| |
| |
voornaamste reden dat je niet alle doubletten met Google kunt onderzoeken, is dat er soms teveel ruis is: gelijkluidende woorden uit andere talen, vooral Engels en Frans (voor het/de parfum b.v. eau de parfum), of eigennamen die je er niet altijd uit kunt filteren, zelfstandige naamwoorden die ook als adjectief voorkomen (als je de vereiste naast het vereiste opzoekt, vind je duizenden voorbeelden van de vereiste (als adj.) + substantief). Je zoekt naar het meervoud bons naast bonnen en je wordt getrakteerd op honderden voorbeelden van de bons krijgen. Ook samenstellingen met als eerste deel het gezochte substantief kunnen voor problemen zorgen: b.v. in de risico-inventarisatie, waar Google de risico vet drukt, slaat het lidwoord uiteraard niet op risico maar op inventarisatie. Soms is er (vooral op Nederlandse sites) foute spelling in het spel, doordat b.v. het streepje verkeerd gebruikt wordt: zo vind je de ozon-laag i.p.v. ozonlaag en wordt dit voorbeeld, als je niet oppast, meegeteld in het aantal de-gevallen.
Maar ondanks als deze beperkingen is Google een fantastisch instrument voor taalonderzoek waar volgens mij de woordenboekmakers in de toekomst niet meer naast zullen kunnen kijken.
Nu heb ik a.h.v. het Google-corpus de dubbele meervouden, de dubbele suffigering -ering/-atie en het dubbel de-/het-genus onderzocht. In het bestek van deze lezing moet ik me beperken tot de genusproblematiek.
Het is bekend dat er naast de 75% de-substantieven en de circa 25% het-substantieven, ongeveer 500 zelfstandige naamwoorden zijn die volgens de woordenboeken, zonder betekenisverschil, met het of met de gebruikt kunnen worden. Dit betekent natuurlijk niet dat de het- en de-vormen altijd even vaak voorkomen of dat ze in Nederland en België op dezelfde manier gebruikt worden. Over het genus van heel wat van die 500 gevallen zijn de woordenboeken het niet eens, wat trouwens niet verwonderlijk is, want wie doublet zegt, zegt instabiliteit, zegt evolutie en dat houdt dus ook een verschillende appreciatie van die evolutie in. Voor een historische benadering van dit al oude verschijnsel verwijs ik naar ‘Genus en geslacht in de Gouden Eeuw’ van collega G. Geerts.
Enkele voorbeelden van de huidige toestand in de voornaamste standaardwerken:
| |
| |
|
GVD |
HVD |
KRA |
WDL |
ANS |
Google.nl |
de/het aperitief |
het |
beide |
beide |
beide |
beide (voorkeur het) |
duidelijke voorkeur het |
de/het automatiek |
beide |
beide |
de |
de |
beide (voorkeur de) |
de |
de/het creatuur |
beide |
beide |
het |
het |
beide (voorkeur het) |
voorkeur het |
de/het deksel |
het, ook wel de |
beide |
beide |
beide |
beide (voorkeur het) |
voorkeur het |
de/het gordijn |
beide |
het |
beide |
het |
beide (voorkeur het) |
duidelijke voorkeur het |
de/het heethoofd |
de |
de |
de |
de |
beide (voorkeur de) |
voorkeur het |
de/het kilo |
het, soms de |
beide |
het |
beide |
beide (voorkeur de) |
de |
de/het kraam |
de, gew. het |
beide |
beide |
beide |
beide (voorkeur de) |
de |
de/het leeghoofd |
het |
beide |
beide |
beide |
beide (voorkeur het) |
de = het |
de/het libido |
de, soms ook het |
de |
de |
het |
/ |
de = het |
de/het menu |
het, gew. de |
beide |
beide |
beide |
beide (voorkeur het) |
het |
de/het oriënt |
de |
beide |
de |
beide |
beide (voorkeur de) |
? |
de/het roodvonk |
de, gew. het |
de |
beide |
beide |
beide (voorkeur de) |
? |
de/het status |
de |
de |
de |
de |
beide (voorkeur de) |
? |
de/het tabernakel |
het |
beide |
beide |
beide |
beide (voorkeur het) |
voorkeur de |
de/het warhoofd |
de |
beide |
beide |
beide |
beide (voorkeur het) |
het |
de/het zadel |
het, niet alg. de |
het |
beide |
beide |
beide (voorkeur het) |
het |
de/het zeggenschap |
de |
beide |
beide |
beide |
beide (voorkeur de) |
de |
| |
| |
Van de bovenvermelde circa 500 de-/het-substantieven staan er ongeveer een derde in de ANS: op blz. 159 vermeldt de ANS voor 75 ervan een voorkeur voor de, voor 90 andere een voorkeur voor het en van 11 zelfstandige naamwoorden is het genus onduidelijk
Nu heb ik er al eens eerder op gewezen (zie de bibliografie) dat de voorkeur van de ANS in een aantal gevallen niet overeenstemt met de voorkeur die het onderzoek van verschillende krantencorpora had opgeleverd. Bovendien rept de ANS niet over belangrijke verschillen tussen Noord en Zuid.
Dankzij Google heb ik de resultaten van de twee vorige onderzoeken (in 1997 werden er 63 gevallen onderzocht en in 2004 87) kunnen aanvullen en verfijnen.
Van de 176 die in de ANS staan heb ik a.h.v. Google (onderzoeksperiode september-november 2004) voor 139 een voorkeur kunnen bepalen. Voor de 37 andere was dit onmogelijk, ofwel om technische redenen (bij uniform b.v. stoorde de adjectivische vorm), of omdat er zelfs in dit miljardencorpus te weinig voorbeelden waren (b.v. van circumflex of struma waarvan je wel een aantal voorbeelden vindt, maar dan zonder bepaald lidwoord). Daarnaast heb ik nog eens een twintigtal de-/het-substantieven onderzocht die niet in de ANS staan, maar die men wel in de meeste woordenboeken aantreft, en waarvan je dus kunt aannemen dat ze gebruikelijk zijn. Je kan je trouwens afvragen waarop de selectie van de ANS gebaseerd is: als je slechts een derde van alle mogelijke gevallen vermeldt - en niemand verwacht dat je als grammatica álle 500 substantieven opneemt, want er zijn erg veel heel ongebruikelijke woorden bij - dan zou je toch denken dat dan de meest gangbare woorden gehonoreerd worden. Maar dan constateer je, dat, om slechts enkele voorbeelden te noemen, festoen, lorgnet, plastron, schepel, waarvan ik zo weinig voorbeelden heb gevonden dat ik geen voorkeur heb kunnen bepalen, er wel in staan en afval (25.000 vb.), parfum (5.000 vb.), personage (19.000 vb.) en status-quo (9.000 vb.) niet.
Van de 139 substantieven die in de ANS staan en waarvan ik wel een voorkeur voor het of voor de heb gevonden, wijken er circa 25% (gedeeltelijk) af van wat de ANS vermeldt (tussen haakjes het deel van het taalgebied, als de voorkeur slechts voor Nederland of voor België geldt).
A) | ANS: voorkeur de, Google: voorkeur het: filter (NL), heethoofd, hippodroom (NL), karwei, katern (NL), manoeuvre (BE), mechaniek (NL), orgelpunt, ratjetoe, retabel, soort (alg. bet.), voorschoot (NL) |
| |
| |
B) | ANS: voorkeur het, Google: de: bruikleen, colofon (NL), imperiaal (NL), impromptu (NL), jacquet, mengelmoes, micron (NL), pincet (NL), pendant, periodiek, schrijn (NL), stort (NL), tabernakel (NL) |
C) | ANS: voorkeur het, Google: de = het: gobelin (NL), leeghoofd (NL), vuilnis (NL) |
D) | ANS: voorkeur de, Google: de = het: matras (NL) |
E) | ANS: genus onduidelijk, Google: de: appendix, brok, kameleon, kruim, poeha, tablet; Google: het: prospectus |
In ongeveer de helft van de gevallen komt de voorkeur van de ANS dus wel overeen met die van het Zuiden, maar niet met die van het Noorden.
Precies aan deze tegenstelling tussen Noord en Zuid besteedt de ANS helemaal geen aandacht en de woordenboeken trouwens ook niet. Nochtans zijn die verschillen heel duidelijk in circa een kwart van de door de ANS vermelde gevallen:
A) | NL: voorkeur het, BE: voorkeur de: affiche, bidet, carillon, chalet, commentaar (alg. bet.), fiche, filter, gamma, getuigenis, gilde, hippodroom, katern, mechaniek, overtrek, riool, stencil, tenue, vod |
B) | NL: voorkeur de, BE: voorkeur het: jolijt, manoeuvre, pincet, salon, schrijn, stort, tabernakel |
C) | NL: voorkeur het, BE: de = het: rooster |
D) | NL: voorkeur de, BE: de = het: proviand |
E) | NL: de = het, BE: voorkeur de: vernis |
F) | NL: de = het, BE: voorkeur het: katoen, libido, vuilnis |
Als men ook nog rekening houdt met de graduele verschillen (b.v. in NL 90% voorkeur het en in BE 60% voorkeur het), dan blijkt dat het de-genus, waarschijnlijk door Franse invloed,Ga naar voetnoot1 in België sterker staat dan in Nederland.
Ter illustratie van de cijfermatige verschillen met de ANS en de verschillen tussen Noord en Zuid, geef ik hier slechts enkele voorbeelden (voor de volledige lijst van de 194 onderzochte het-/de-substantieven verwijs ik naar de bijlage).
| |
| |
A) Verschil in voorkeur (de percentages zijn afgerond)
|
NL |
BE |
|
het filter |
14.300 vb. (81%) |
2.230 vb. (77%) |
ANS: voorkeur de |
de filter |
3.300 vb. (19%) |
656 vb. (23%) |
|
het karwei |
4.850 vb. (89%) |
191 vb. (69%) |
ANS: voorkeur de |
de karwei |
569 vb. (11%) |
85 vb. (31%) |
|
het mengelmoes |
9 vb. (4%) |
6 vb. (6%) |
ANS: voorkeur het |
de mengelmoes |
199 vb. (96%) |
99 vb. (94%) |
|
het pendant |
71 vb. (19%) |
22 vb. (14%) |
ANS: voorkeur het |
de pendant |
303 vb. (81%) |
138 vb. (86%) |
|
B) Verschil tussen Noord en Zuid
|
NL |
BE |
|
het affiche |
2.970 vb. (86%) |
87 vb. (1%) |
ANS: voorkeur het |
de affiche |
812 vb. (14%) |
7.050 vb. (99%) |
|
het commentaar |
31.400 vb. (91%) |
3.750 vb. (24%) |
ANS: niet vermeld |
de commentaar |
2.950 vb. (9%) |
11.600 vb. (76%) |
|
het salon |
1.200 vb. (7%) |
6.100 vb. (63%) |
ANS: voorkeur de |
de salon |
15.500 vb. (93%) |
3.560 vb. (37%) |
|
het tabernakel |
630 vb. (17%) |
205 vb. (85%) |
ANS: voorkeur het |
de tabernakel |
3.060 vb. (83%) |
35 vb. (15%) |
|
In sommige gevallen nadert de voorkeur de 100%, zodat je eigenlijk niet meer van twee genera kunt spreken, ten minste in een van de twee delen van het taalgebied. In de overzichtstabel (zie bijlage) heb ik in deze gevallen nog slechts één genus vermeld. Enkele voorbeelden ter illustratie:
| |
| |
|
NL |
BE |
|
de carrousel |
5.070 vb. (95%) |
617 vb. (97%) |
ANS: voorkeur de |
het carrousel |
260 vb. (5%) |
21 vb. (3%) |
|
het circus |
43.100 vb. (99%) |
2.910 vb. (95%) |
ANS: voorkeur het |
de circus |
579 vb. (1%) |
145 vb. (5%) |
|
het risico |
180.000 vb. (100%) |
60.900 vb. (100%) |
ANS: voorkeur het |
de risico |
0 vb. (0%) |
0 vb. (0%) |
|
het schilderij |
30.700 vb. (97%) |
4.950 vb. (97%) |
ANS: voorkeur het |
de schilderij |
994 vb. (3%) |
154 vb. (3%) |
|
het zadel |
33.300 vb. (99%) |
7.170 vb. (99%) |
ANS: voorkeur het |
de zadel |
418 vb. (1%) |
46 vb. (1%) |
|
Men kan zich dan ook afvragen waarom de woordenboeken nog de twee genera vermelden. Op z'n minst zouden ze kunnen wijzen op een duidelijke voorkeur voor een van de twee genera en op duidelijke verschillen tussen Noord en Zuid.
Als we de 18 bovenvermelde gevallen waarover de woordenboeken, de Woordenlijst en de ANS het niet eens waren, met de resultaten van het Google-onderzoek vergelijken, constateren we dat de genustoekenning van de GVD vaker overeenstemt met de gevonden resultaten dan die van de andere naslagwerken. Zo geeft de GVD de voorkeur aan of vermeldt nog uitsluitend het aperitief, het deksel, de kraam, het menu, het zadel en de zeggenschap. In enkele andere gevallen zijn er verschillen: terwijl de GVD (samen met de HVD, KRA en de WDL) nog slechts de heethoofd honoreren, heb ik een duidelijke voorkeur voor het heethoofd gevonden; terwijl de GVD uitsluitend de warhoofd zegt, heeft Google een uitgesproken voorkeur voor het warhoofd.
De HVD vermeldt terecht nog maar het gordijn en KRA heeft het bij het goede eind door nog slechts de automatiek te honoreren, maar globaal gezien nemen de vier woordenboeken nog te vaak zonder voorkeur de twee genera op, waar er in de praktijk nog maar een van de twee lijkt voor te komen of er tenminste een duidelijke voorkeur voor een van de twee is.
Als we voor alle onderzochte gevallen naar de algemene voorkeur voor het of de kijken, dan constateren we voor het hele taalgebied in 54 gevallen een (duidelijke) voorkeur voor het en in 55 gevallen voor de. Voor het Noorden alleen is dit in 22 gevallen een (duidelijke) voorkeur voor het en in 12 gevallen voor
| |
| |
de. Voor het Zuiden, een voorkeur voor het in 8 gevallen en een voorkeur voor de in 20 gevallen. Globaal gezien is er dus in het Noorden een iets sterkere tendens naar het en in het Zuiden een iets sterkere voorkeur voor de. In respectievelijk 6 en 5 gevallen was er in Noord en Zuid geen duidelijke voorkeur te bespeuren voor een van de twee genera.
Men heeft zich al eens afgevraagd of er niet een deneutralisering aan de gang is. Een vergelijking van mijn resultaten met het genus of de genera die het WNT vermeldt, geeft hier misschien een antwoord op deze vraag. Natuurlijk vind je niet al de onderzochte substantieven in het WNT, omnium en voltage b.v. zoek je er vergeefs in, maar in totaal zijn er toch 143 gevallen waarvan het WNT het of de of het/de opgeeft, soms met een voorkeur. Voor de helft ervan (71) vermeldt het WNT het en de. Voor 35 ervan is er in mijn materiaal, tenminste in NL, een (duidelijke) voorkeur voor het.Ga naar voetnoot2 De gevallen waar het WNT zelf al de voorkeur geeft aan het zijn hier niet meegeteld en staan in de voetnoot tussen [ ]. Er zijn echter evenveel gevallen, nl. 34, waar er nu een voorkeur voor de lijkt te zijnGa naar voetnoot3 en slechts twee waar het ene genus even gebruikelijk lijkt te zijn als het andere.Ga naar voetnoot4 Van de 48 gevallen (= 34%) die in het WNT slechts onzijdig zijn, zijn er 24 waarvoor nu nog steeds een voorkeur voor het bestaat,Ga naar voetnoot5 maar ook 20 die nu bij voorkeur de-woorden zijnGa naar voetnoot6 en 2 woorden waarvoor het genus nu, volgens de ANS, onduidelijk is.Ga naar voetnoot7
| |
| |
Van de 23 substantieven (= 16%) die volgens het WNT uitsluitend de-woorden waren, bestaat er bij 11 ervanGa naar voetnoot8 nog steeds een voorkeur voor de; bij 9 andere is er nu een voorkeur voor het;Ga naar voetnoot9 in één gevalGa naar voetnoot10 zijn het en de even gebruikelijk en voor 2 substantieven is het genus, volgens de ANS, onduidelijk.Ga naar voetnoot11 Voor pr(a)e zegt het WNT zelf dat het genus onduidelijk is.
Wat betekent dit nu allemaal voor een eventuele deneutralisering? Het is moeilijk om uit het feit dat het WNT zowel het als de vermeldt te concluderen dat ze allebei even gebruikelijk waren en dus dat er, als er nu een voorkeur voor het of voor de is, een evolutie naar het andere genus heeft plaatsgevonden, want misschien was die voorkeur er vroeger ook al. Wat wel duidelijk is, is in 9 gevallen (zie voetnoot 9) een evolutie van uitsluitend de naar een (duidelijke) voorkeur voor het en in 20 gevallen een evolutie van uitsluitend het naar een (duidelijke) voorkeur voor de (zie voetnoot 6). Voor de deneutraliseringstendens vind je in het WNT zelf slechts één voorbeeld,Ga naar voetnoot12 maar 10 tegenvoorbeelden.Ga naar voetnoot13 Wat wél opvalt, is dat bagatel, kameleon, kraam, poeha, proviand en stort, waarvan het WNT een evolutie van de naar het vermeldt, nu weer bij voorkeur de-woorden zijn. In deze gevallen is er dus echt sprake van een deneutralisering.
Om echter zeker te zijn dat er een algemene deneutralisering aan de gang is, zou men de overige circa 300 (minder gebruikelijke) de-/het-substantieven die ik niet onderzocht heb, onder de loep moeten nemen.
Samenvattend kunnen we zeggen:
1) | De voorkeur die de ANS vermeldt voor het of de stemt in ongeveer een kwart van de gevallen niet overeen met de resultaten van mijn statistisch onderzoek. Dit is gewoon een feit en geen kritiek op de ANS die met de riemen heeft moeten roeien die ze had. Er waren trouwens ook enkele verschillen met mijn twee vorige onderzoekenGa naar voetnoot14 die misschien
|
| |
| |
| te verklaren zijn door de te beperkte taalsoort van krantencorpora. Overigens werden de resultaten voor 95% bevestigd en konden heel wat gegevens nauwkeuriger worden omschreven. |
2) | De genustoekenning in onze gezaghebbende woordenboeken zou verfijnd kunnen worden door b.v. bij substantieven die voor (meer dan) 95% het of de zijn, nog maar dit genus te vermelden, b.v. schilderij: het, door bij andere, waar er een duidelijke voorkeur is voor een van beide genera, het minder gebruikelijke genus tussen haakjes te zetten, b.v.: filter: het (de) en ook door aandacht te besteden aan de verschillen tussen Noord en Zuid, b.v.: affiche: het (in B. de). |
3) | Er lijkt, meer in het Zuiden dan in het Noorden, een deneutralisering aan de gang te zijn, maar zekerheid daarover krijgen we pas als alle de-/het-woorden onderzocht en (voor zover mogelijk) met de genustoekenning van het WNT vergeleken zijn. |
4) | In ieder geval is Google, ondanks alle moeilijkheden en tekortkomingen, een onmisbaar instrument voor taalkundig onderzoek en dan denk ik vooral aan de morfologie. |
| |
Overzichtstabel
Er wordt slechts één genus vermeld: het percentage is gelijk aan of hoger dan 95%
Duidelijke voorkeur: 75-94%
Voorkeur: 55-74%
De = het: beide tussen 45 en 54%
W. vb.: te weinig voorbeelden gevonden
Techn.?: technisch onmogelijk
NL: Google Nederlands
BE: Google België
aanrecht: |
NL: duidelijke voorkeur het |
|
BE: het |
accordeon: |
NL: duidelijke voorkeur de |
|
BE: voorkeur de |
affiche: |
NL: duidelijke voorkeur het |
|
BE: de (niet in de ANS) |
afval (vuilnis): |
duidelijke voorkeur het (niet in de ANS) |
animo: |
duidelijke voorkeur de |
aperitief: |
duidelijke voorkeur het |
| |
| |
appendix (aanhangsel): |
duidelijke voorkeur de (ANS: genus onduidelijk) |
appendix (blindedarm): |
de |
automatiek: |
de |
[bagatel]: |
? (w. vb.) (ANS: voorkeur de) |
baldakijn: |
voorkeur het |
bidet: |
NL: duidelijke voorkeur het |
|
BE: voorkeur de (niet in de ANS) |
boezeroen: |
duidelijke voorkeur de |
[brio]: |
? (w. vb.) (ANS: voorkeur de) |
brok: |
NL: voorkeur de (ANS: genus onduidelijk) |
|
BE: duidelijke voorkeur de |
bruikleen: |
NL: voorkeur de (≠ ANS: voorkeur het) |
|
BE: duidelijke voorkeur de |
carillon: |
NL: het |
|
BE: duidelijke voorkeur de (niet in de ANS) |
[carré]: |
? (techn.?) (ANS: voorkeur het) |
carrousel: |
de |
cement: |
duidelijke voorkeur het (niet in de ANS) |
chalet: |
NL: duidelijke voorkeur het |
|
BE: duidelijke voorkeur de (niet in de ANS) |
[circumflex]: |
? (w. vb.) (ANS: voorkeur de) |
circus: |
het |
colbert: |
het |
colofon: |
NL: voorkeur de (≠ ANS: voorkeur het) |
|
BE: de = het |
commentaar (alg. bet.): |
NL: het |
|
BE: duidelijke voorkeur de (niet in de ANS) |
commentaar (bij een uitgave): |
de (niet in de ANS) |
[complet]: |
? (w. vb.) (ANS: genus onduidelijk) |
concours: |
het |
corsage: |
de |
creatuur: |
NL: voorkeur het |
|
BE: duidelijke voorkeur het |
debacle: |
het |
deksel: |
NL: voorkeur het |
|
BE: duidelijke voorkeur het |
depot: |
NL: het |
|
BE: voorkeur het |
| |
| |
diadeem: |
duidelijke voorkeur de |
dressoir: |
NL: het |
|
BE: voorkeur het |
[embonpoint]: |
? (w. vb.) (ANS: voorkeur het) |
[ex-voto]: |
? (w. vb.) (ANS: voorkeur het) |
[facie]: |
? (w. vb.) (ANS: genus onduidelijk) |
[factotum]: |
? (w. vb.) (ANS: voorkeur het) |
[festoen]: |
? (w. vb.) (ANS: voorkeur het) |
feuilleton: |
duidelijke voorkeur het |
fiche: |
NL: voorkeur het |
|
BE: de |
[figuur]:Ga naar voetnoot15 |
? (techn.?) (ANS: voorkeur de) |
filet: |
de |
filter: |
NL: duidelijke voorkeur het (≠ ANS: voorkeur de) |
|
BE: duidelijke voorkeur de |
floret: |
voorkeur de |
foetus: |
de |
[fond]: |
? (techn.?) (ANS: voorkeur het) |
[fries]: |
? (techn.?) (ANS: genus onduidelijk) |
galon: |
NL: het |
|
BE: ? (w. vb.) |
gamma (reeks): |
NL: voorkeur het |
|
BE: voorkeur de (niet in de ANS) |
getuigenis: |
NL: voorkeur het |
|
BE: voorkeur de (niet in de ANS) |
gilde: |
NL: duidelijke voorkeur het |
|
BE: duidelijke voorkeur de (niet in de ANS) |
gobelin: |
NL: de = het (≠ ANS: voorkeur het) |
| |
| |
|
BE: ? (w. vb.) |
gordijn: |
duidelijke voorkeur het |
hars: |
NL: duidelijke voorkeur de (niet in de ANS) |
|
BE: de = het |
heethoofd: |
NL: voorkeur het |
|
BE: het |
hendel: |
de |
hiaat (≠ taalkunde): |
het |
hippodroom: |
NL: duidelijke voorkeur het (≠ ANS: voorkeur de) |
|
BE: duidelijke voorkeur de |
hocus-pocus: |
de |
[hondsvot]: |
? (w. vb.) (ANS: voorkeur de) |
idee-fixe: |
voorkeur het |
imperiaal: |
NL: duidelijke voorkeur de (≠ ANS: voorkeur het) |
|
BE: ? (w. vb.) |
impromptu: |
NL: duidelijke voorkeur de (≠ ANS: voorkeur het) |
|
BE: ? (w. vb.) |
introïtus: |
NL: duidelijke voorkeur de |
|
BE: ? (w. vb.) |
jacquet: |
NL: voorkeur de (≠ ANS: voorkeur het) |
|
BE: duidelijke voorkeur de |
jolijt: |
NL: voorkeur de |
|
BE: duidelijke voorkeur het (niet in de ANS) |
kaft: |
duidelijke voorkeur de |
kameleon: |
de (ANS: genus onduidelijk) |
karkas: |
duidelijke voorkeur het |
karwei: |
NL: duidelijke voorkeur het (≠ ANS: voorkeur de) |
|
BE: voorkeur het |
katern: |
NL: duidelijke voorkeur het (≠ ANS: voorkeur de) |
|
BE: voorkeur de |
katoen: |
NL: de = het |
|
BE: voorkeur het |
kilo: |
de (bij prijsopgave soms het) |
klavecimbel: |
voorkeur het |
| |
| |
klimop: |
de |
knoflook: |
NL: de (niet in de ANS) |
|
BE: duidelijke voorkeur de |
koliek: |
de |
koord: |
NL: het |
|
BE: voorkeur het |
kraam: |
NL: de (maar: in het kraam passen) |
|
BE: voorkeur de (idem) |
kruim: |
duidelijke voorkeur de (ANS: genus onduidelijk) |
leeghoofd: |
NL: de = het (≠ ANS: voorkeur het) |
|
BE: het |
lef: |
het |
libido: |
NL: de = het (niet in de ANS) |
|
BE: voorkeur het |
[lidmaat (medelid)]: |
? (techn.?) (ANS: voorkeur de) |
liniaal: |
NL: de |
|
BE: duidelijke voorkeur de |
[lis (plant)]: |
? (w. vb.) (ANS: voorkeur de) |
loeder: |
NL: duidelijke voorkeur het |
|
BE: voorkeur het |
[lor]: |
? (techn.?) (ANS: voorkeur het) |
[lorgnet]: |
? (w. vb.) (ANS: voorkeur de) |
manoeuvre: |
NL: de |
|
BE: het |
matras: |
NL: de = het (≠ ANS: voorkeur de) |
|
BE: duidelijke voorkeur de |
mechaniek: |
NL: duidelijke voorkeur het (≠ ANS: voorkeur de) |
|
BE: voorkeur de |
melange: |
de (niet in de ANS) |
membraan: |
duidelijke voorkeur het |
memo: |
duidelijke voorkeur de (niet in de ANS) |
mengelmoes: |
de (≠ ANS: voorkeur het) |
menu: |
het |
menuet: |
NL: voorkeur het |
|
BE: duidelijke voorkeur het |
micron: |
NL: de (≠ ANS: voorkeur het) |
|
BE:? (w. vb.) |
| |
| |
molecule: |
voorkeur de |
mom (onder de/het - van): |
het |
montuur: |
NL: het |
|
BE: duidelijke voorkeur het |
mortier: |
NL: duidelijke voorkeur de |
|
BE: ? (w. vb.) |
[mud]: |
? (w. vb.) (ANS: voorkeur het) |
octaaf: |
duidelijke voorkeur het |
omnium: |
NL (sport): duidelijke voorkeur het |
|
BE (sport): het |
|
BE (verzekering): de |
opium: |
duidelijke voorkeur de (niet in de ANS) |
order (‘bevel’ en beursterm): |
NL: de |
|
BE: voorkeur de |
[oriënt]: |
? (techn.?) (ANS: voorkeur de)Ga naar voetnoot16 |
orgelpunt: |
het (≠ ANS: voorkeur de) |
overtrek: |
NL: duidelijke voorkeur het |
|
BE: de (niet in de ANS) |
ozon: |
duidelijke voorkeur de (niet in de ANS) |
pancreas: |
duidelijke voorkeur de |
[pandoer]: |
? (techn.?) (ANS: voorkeur het) |
parfum: |
NL: voorkeur het (niet in de ANS) |
|
BE: de = het |
parterre: |
NL: de |
|
BE: duidelijke voorkeur de |
pasta: |
de (niet in de ANS) |
pedaal: |
NL: het |
|
BE: voorkeur het |
pendant: |
duidelijke voorkeur de (≠ ANS: voorkeur het) |
periodiek: |
NL (blad en salarisverhoging): duidelijke voorkeur de (≠ ANS: voorkeur het) |
|
BE (blad): duidelijke voorkeur de |
personage: |
duidelijke voorkeur het (niet in de ANS) |
[piëdestal]: |
? (w. vb.) (ANS: genus onduidelijk) |
pincet: |
NL: voorkeur de (≠ ANS: voorkeur het) |
|
BE: voorkeur het |
pipet: |
duidelijke voorkeur de |
| |
| |
[plastron]: |
? (w. vb.) (ANS: voorkeur het) |
pleuris: |
NL: de |
|
BE: duidelijke voorkeur de |
pluche: |
het (niet in de ANS) |
[plus]: |
? (techn.?) (ANS: voorkeur het) |
poeder: |
duidelijke voorkeur het (niet in de ANS) |
poeha: |
de (ANS: genus onduidelijk) |
potpourri: |
de |
[pr(a)e]: |
? (w. vb.) (ANS: voorkeur de) |
prospectus: |
NL: duidelijke voorkeur het (ANS: genus onduidelijk) |
|
BE: voorkeur het |
proviand: |
NL: voorkeur de |
|
BE: de = het |
[raster]: |
? (techn.?) (ANS: voorkeur het) |
ratjetoe: |
duidelijke voorkeur het (≠ ANS: voorkeur de) |
reliek: |
voorkeur de |
remedie: |
de |
retabel: |
NL: duidelijke voorkeur het (≠ ANS: voorkeur de) |
|
BE: het |
riool: |
NL: het |
|
BE: voorkeur de (niet in de ANS) |
risico: |
het |
roest: |
duidelijke voorkeur de (niet in de ANS) |
[roodvonk]: |
? (w. vb.) (ANS: voorkeur de) |
rooster: |
NL: het |
|
BE: de = het (niet in de ANS) |
salon: |
NL: de |
|
BE: voorkeur het (niet in de ANS) |
scapulier: |
duidelijke voorkeur het |
scharminkel: |
het |
[schepel]: |
? (w. vb.) (ANS: voorkeur het) |
scheurbuik: |
de |
schilderij: |
het |
[schort]: |
? (techn.?) (ANS: voorkeur de)Ga naar voetnoot17 |
| |
| |
schrijn: |
NL: voorkeur de (≠ ANS: voorkeur het) |
|
BE: duidelijke voorkeur: het |
schurft: |
NL: de (maar meestal: het schurft hebben aan...) |
|
BE: voorkeur de |
sex-appeal: |
NL: voorkeur het (≠ ANS: voorkeur de) |
|
BE: duidelijke voorkeur het |
silhouet: |
het |
slem: |
NL: het |
|
BE: ? (w. vb.) |
slijm: |
het (niet in de ANS) |
[solo]: |
? (techn.?) (ANS: voorkeur de)Ga naar voetnoot18 |
soort (het/de - mensen, wegens de soort [biol. bet.]): |
|
duidelijke voorkeur het (≠ ANS: voorkeur de) |
[status]: |
? (techn.?) (ANS: voorkeur de)Ga naar voetnoot19 |
status-quo: |
NL: de (niet in de ANS) |
|
BE: voorkeur de |
stencil: |
NL: het |
|
BE: duidelijke voorkeur de (niet in de ANS) |
stort (naar de/het -): |
NL: duidelijke voorkeur de (≠ ANS: voorkeur het) |
|
BE: duidelijke voorkeur het |
[struma]: |
? (w. vb.) (ANS: voorkeur het) |
subsidie: |
de |
tabernakel: |
NL: voorkeur de (≠ ANS: voorkeur het) |
|
BE: duidelijke voorkeur het |
tablet: |
NL: duidelijke voorkeur de (≠ ANS: genus onduidelijk) |
|
BE: de |
taboe: |
het |
takel: |
duidelijke voorkeur de |
teint: |
de |
tenue: |
NL: het |
|
BE: voorkeur de (niet in de ANS) |
transfer: |
de |
| |
| |
[tribuut]: |
? (w. vb.) (ANS: voorkeur het) |
uitwas: |
de |
uitzet: |
de |
[uniform]: |
? (techn.?) (ANS: voorkeur het) |
[vereiste]: |
? (techn.?) (ANS: voorkeur het)Ga naar voetnoot20 |
vergiet: |
voorkeur het |
vernis: |
NL: de = het (niet in de ANS) |
|
BE: voorkeur de |
viaduct: |
NL: het |
|
BE: voorkeur het |
vod: |
NL: voorkeur het |
|
BE: voorkeur de (niet in de ANS) |
[voldoende]: |
? (techn.?) (ANS: voorkeur de) |
voltage: |
NL: duidelijke voorkeur het |
|
BE: voorkeur het |
voorschot: |
NL: voorkeur het (≠ ANS: voorkeur de) |
|
BE: ? (w. vb.) |
vuilnis: |
NL: de = het (≠ ANS: voorkeur het) |
|
BE: voorkeur het |
warhoofd: |
het |
welp (jong dier): |
de |
zadel: |
het |
zeggenschap: |
de |
zijspan: |
voorkeur het |
[zuivel]: |
? (techn.?) (ANS: voorkeur de)Ga naar voetnoot21 |
| |
| |
| |
Bibliografie
Coenders, H. Kramers, Woordenboek Nederlands. Amsterdam: Elsevier, 1996. |
Geerts, G. Genus en geslacht in de Gouden Eeuw. B.I.C.N., 1966. |
Geerts, G. ‘De nominale klassificatie van ontleningen’, in: De Nieuwe Taalgids 63, 1970, p. 64-53. |
Geerts, G. ‘Genusfouten: hollanditis in Vlaanderen?’, in: Verslagen en Mededelingen van de Koninklijke Academie voor Taal- en Letterkunde, 1988, p. 68-78. |
Geerts, G. et al. Van Dale, Groot Woordenboek der Nederlandse Taal. Utrecht/Antwerpen: Van Dale Lexicografie, 1999. |
Haeseryn, W. et al. Algemene Nederlandse Spraakkunst. Groningen/Deurne: Nijhoff/Wolters Plantyn, 1997. |
Renkema, J. Woordenlijst Nederlandse Taal. Den Haag/Antwerpen: Sdu Uitgevers/Standaard Uitgeverij, 1995. |
Theissen, S., Hiligsmann, Ph. ‘Met de natte vinger, met de pet of... met de muis? Een onderzoek naar enkele het-/de-substantieven’, in: Morfologiedagen 1997. Handelingen van het colloquium aan de Université de Liège op 23 en 24 september 1997. Liège: Vakgroep Nederlands, Université de Liège, 1999, p. 51-69. |
Theissen, S. ‘Nog een Noord-Zuid verschil? Een vergelijkend corpusonderzoek van een tachtigtal het-/de-substantieven in Van Dale, de ANS en de Woordenlijst’, in: Thesaurus polyglottus et flores quadrilingues. Festschrift für Stanislaw Predota zum 60. Geburtstag. Wroclaw: Ofycina Wydawnicza ATUT - Wroclawskie Wydawnictwo Oswiatowe, 2004, p. 439-446. |
Van Marle, J. ‘Nogmaals het genus van Franse leenwoorden in het Nederlands’, in: Schatbewaarder van de taal. Liber amicorum Johan Taeldeman. Gent: Academia Press, 2004, p. 917-925. |
Van Sterkenburg, P.G.J. Van Dale, Groot woordenboek hedendaags Nederlands. Utrecht-Antwerpen: Van Dale Lexicografie, 2002. |
Woordenboek der Nederlandse Taal op CD-ROM, AND, 2000. |
|
-
voetnoot1
- In Nederland zijn substantieven van Franse oorsprong eerder onzijdig (zie Van Marle, 2004).
-
voetnoot2
- WNT beide, nu voorkeur het (N): affiche, afval, baldakijn (WNT, voorkeur de), colbert, filter (WNT, voorkeur de), [getuigenis (WNT, voorkeur het)], hiaat, karkas, karwei, katern, klavecimbel, [koord (WNT, voorkeur het)], mechaniek, menuet, mom, montuur (WNT, voorkeur de), parfum, pedaal, personage, pluche, poeder, [prospectus (WNT, voorkeur het)], rooster (WNT, voorkeur de), ratjetoe, retabel, risico, rooster (WNT, voorkeur de), scapulier, scharminkel, schepel, schilderij, [silhouet (WNT, voorkeur
het)], [slem (WNT, voorkeur het)], slijm, soort, tenue, tribuut, vergiet, [viaduct (WNT, voorkeur het)], vod, voorschot, [zadel (WNT, voorkeur het)]
-
voetnoot3
- WNT beide, nu voorkeur de (N): animo, appendix, brok, carrousel, diadeem, figuur, filet, floret, hars, kaft, koliek (WNT, voorkeur het), kruim, liniaal, lorgnet, opium, pasta, pendant, pleuris, potpourri, [reliek (WNT, voorkeur de)], remedie, roest, roodvonk, salon, (WNT, voorkeur het), scheurbuik, schort, schrijn, schurft, subsidie, tabernakel, takel, [transfer (WNT, voorkeur de)], uitwas, uitzet, welp, zuivel
-
voetnoot4
- WNT beide, nu het = de (N): katoen,
vuilnis
-
voetnoot5
- WNT het, nu het (N): aanrecht, aperitief, carillon, carré, cement, concours, creatuur, deksel, depot, dressoir, factotum, festoen, feuilleton, fiche, fond, galon, gordijn, lef, loeder, menu, mud, overtrek, plastron, plus, riool, uniform (ANS)
-
voetnoot6
- WNT het, nu de (N): bagatel, boezeroen, bruikleen, corsage, hocus-pocus, jacquet, jolijt, kameleon, kilo, knoflook, kraam, mengelmoes, oriënt, ozon, parterre, pincet, poeha, proviand, stort, teint
-
voetnoot7
- WNT het, nu genus onduidelijk (ANS): piëdestal, vernis
-
voetnoot8
- WNT de, nu de (N): automatiek, imperiaal, lidmaat, manoeuvre, mortier, order, periodiek, pipet, solo, tablet, zeggenschap
-
voetnoot9
- WNT de, nu het (N): bidet, circus, commentaar, gilde, heethoofd, lor, octaaf, pandoer, warhoofd
-
voetnoot11
- WNT de, nu genus onduidelijk (ANS): facie, fries
-
voetnoot13
- evolutie in WNT: de → het: bagatel (ANS: de), festoen, kameleon, kraam, mud, poeha, proviand, stort, uniform, vernis
-
voetnoot14
- B.v. 2004, krantenonderzoek Knack 1992-2002, NRC 1993-1994: voorkeur het memo, Google: voorkeur de memo; het molecule, Google: voorkeur de molecule; het colofon, Google: voorkeur de colofon; het roest, Google: voorkeur de roest; de getuigenis, Google: voorkeur: het getuigenis
-
voetnoot15
- Om de verschillende betekenissen van figuur te onderscheiden had ik de duizenden voorbeelden van Google allemaal moeten lezen, wat niet te doen is. Alleen al voor Google.nl waren er 42.000 vb. van de figuur en 7.000 van het figuur. Wel wil ik hier de resultaten van het corpusonderzoek (Knack/NRC) vermelden, zoals het in het Album Predota verschenen is:
Er moeten ten minste vier betekenissen uit elkaar worden gehouden, wat de GVD ook doet, maar waar hij (evenmin als de ANS en de WDL) geen consequenties aan verbindt voor het genus, dat je evenwel kan opmaken uit de voorbeelden!
a) geometrische figuur: in N en Z: de
b) het menselijk lichaam (een slank figuur hebben): in N en Z: 95% het
c) een personage (een kleurrijke figuur): in N en Z: 90% de
d) in de uitdrukking: een mal, slecht... figuur slaan: in N en Z altijd het
-
voetnoot17
- Krantencorpora (NRC-Knack): NL: voorkeur het; BE: voorkeur de
-
voetnoot20
- Krantencorpora (NRC-Knack): NL: voorkeur het, BE: voorkeur de
|