● Zoekplan bijstellen
Een vraag die we met behulp van het WNT op cd-rom willen beantwoorden, luidt: welke ingangen van het WNT zijn klanknabootsende woorden, ofwel onomatopeeën? Het ligt voor de hand om de computer te vragen ‘Geef me alle onomatopeeën’, maar zo simpel is het niet. In het WNT staan de woordkenmerken (zoals woordsoort, etymologie, stijllabels, vormvarianten, samenstellingen en afleidingen) niet altijd op dezelfde plaats, en bovendien hebben ze niet altijd dezelfde benaming.
Maar de computer zou de computer niet zijn als die het niet mogelijk zou maken om de onomatopeeën er toch uit te krijgen. We maken gebruik van de mogelijkheid om van voor naar achter door het WNT te zoeken naar het woord onomatopee. We gaan er bij deze ‘full-text zoekactie’ dus van uit dat de redacties bij de beschrijvingen van klanknabootsende woorden in ieder geval één keer het woord onomatopee laten vallen.
Die zoekactie levert twintig resultaten op, twintig artikelen waarin het woord onomatopee voorkomt. Dat is op ruim 90.000 artikelen natuurlijk veel te weinig. De aanname dat in ieder geval het woord onomatopee in de beschrijving voorkomt, is kennelijk nogal naïef. Het kan natuurlijk zijn dat de redacties van het woordenboek ook het woord klanknabootsing hebben gebruikt om een onomatopee aan te duiden.
De vraag ‘Geef me alle artikelen waarin het woord onomatopee of klanknabootsing voorkomt’ levert 238 artikelen op. Dat is al een stuk beter. We zijn nu echter gewaarschuwd dat woordkenmerken op meer dan één manier aangeduid kunnen worden. Een redacteur kan net zo goed de omschrijving klanknabootsend woord gebruikt hebben, of een afkorting. Om dit vermoeden te controleren doorlopen we de lijst van alle 1,4 miljoen verschillende woorden in het WNT. Zo'n lijst is op de cd-rom aanwezig om de gebruiker te helpen bij het correct formuleren van zoekopdrachten. Ons vermoeden wordt bevestigd: naast klanknabootsing komen nog voor: klanknabootsingen, klanknabootsend, klanknabootsende, klanknabootsenden en de kennelijke afkortingen klanknaboots. en klanknab. Bij onomatopee is het nog veel erger: onomatopeeën komt voor en onomat., maar ook onomatopeïsch, onomatopoeïsch, onomatopoeïsch; zelfs onomatopoëtisch komt voor, en van al deze woorden natuurlijk ook alle afleidingen.
Nu is het mogelijk om de zoekopdracht uit te breiden met al deze woorden, telkens verbonden door het woordje of. Maar zelfs met de computer is dat vrij omslachtig. We maken daarom gebruik van de mogelijkheid om een ‘joker’ of ‘wild-card’ te gebruiken. In plaats van een compleet woord, kunnen we een ook gedeelte van een woord opgeven, waarbij de weggelaten letters door een ? (voor precies één letter) of een* (nul of meer letters) worden weergegeven. Letterlijk vragen we nu: geef me alle artikelen waarin woorden voorkomen die of met onomat, of met klanknab beginnen. We zijn nu waar we wezen willen: de computer laat een lijst zien van 880 artikelen, van aansarren tot wouwou. (Compleet is die verzameling overigens niet; omdat het WNT nog niet voltooid is, ontbreekt bijvoorbeeld zoeven nog.) Een gedeelte van de lijst van resultaten ziet u in de afbeelding.
De meeste onomatopeeën blijken te beginnen met een p (225 stuks), een k (178) of een t (114); te zamen leveren deze drie letters 60% van de klanknabootsers, wat niet verwonderlijk is, daar het de drie plofklanken van het alfabet zijn. Tussen de resultaten vinden we te verwachten woorden als klateren, koekoek, kloppen, knetteren, pats, piep, plons, tamtam, tinkelen en tjilpen. Verrassend zijn woorden als blaten, boer, botsen, kotsen, kokhalzen, pauk, pissen en poep. Deze woorden zijn zo alledaags geworden dat de klankassociatie verloren is gegaan.