● Niet representatief
In haar boek wijdt Van der Sijs een intrigerend paragraafje aan het percentage leenwoorden in het Nederlands (bladzijde 64-67). Zij bestrijdt daarin mijn fifty-fifty-opvatting. In NRC Handelsblad van 7 april 1994 heeft zij geteld. Zij geeft toe dat je op verschillende manieren kunt tellen, maar in ieder geval telt zij appels en peren bij elkaar op. Hoewel ze onderkent dat er met de zelfstandige naamwoorden iets bijzonders aan de hand is - 60% leen - verbindt zij daar weinig consequenties aan. Zij komt voor NRC Handelsblad uit op een percentage leenwoorden van 16,2 (als we álle woorden tellen) tot 30,7 (als we alle verschillende woorden maar één keer tellen). Als ze een kinderboek had genomen, waren de percentages lager geweest, bij een gedicht nog lager en bij een kookboek aanmerkelijk hoger, vanwege de ingrediënten.
Bekend is - en daar maakt Van der Sijs ook melding van - dat functiewoorden (en telwoorden) in principe niet ontleend worden. Het merendeel van de leenwoorden bestaat uit zelfstandige naamwoorden. Functiewoorden zijn in een tekst per definitie veel ruimer vertegenwoordigd. Het heeft dus geen zin alle woorden van een tekst bij elkaar op te tellen en daar een conclusie aan te verbinden. Eigenlijk wordt hier dezelfde fout gemaakt als die ik in de eerste alinea's heb gesignaleerd: een tekst is taal, en woordenschat is niet identiek aan taal. Dat neemt niet weg dat je best leenwoorden - inclusief deelleenwoorden en leenaffixen (vooren achtervoegsels) - in een tekst kunt gaan tellen. Maar dan moet je alle woordsoorten die niet voor ontlening in aanmerking komen, buiten beschouwing laten. Vervolgens kun je per tekstsoort percentages gaan vergelijken.
De vraag ‘Hoeveel leenwoorden heeft het Nederlands?’ is dus niet juist. Die moet luiden: ‘Hoeveel leenwoorden bevat de Nederlandse woordenschat?’ Om daarachter te komen moet je een representatief woordenboek bekijken en dan van iedere letter één bladzijde nemen. Het heeft geen zin uitsluitend naar één letter te kijken, want het percentage leenwoorden verschilt per letter. Zo bevat de a 71% leenwoorden (telling van professor Beekes in het binnenkort te verschijnen Etymologisch Woordenboek van het Nederlands), de b ongeveer 30% en de c 100%. Over het hele alfabet genomen, komt het gemiddelde uit op zo'n 50%.
Gewone ‘bouwstenen’ worden gemakkelijk van een andere taal overgenomen, ‘sierstenen’ wat moeilijker. Echte taalbeïnvloeding, die plaatsvindt op het niveau van de structuur en de functiewoorden, komt aanmerkelijk minder voor. Dat is nagenoeg alleen het geval als er in een bepaald gebied van twee- of drietaligheid sprake is. En wat de ornamenten betreft: telwoorden horen tot de basiswoordenschat, maar tussenwerpsels en uitroepen niet. Shit!