Het netwerk van Nederlandse bigrammen
W. Dierick - Nijmegen
Deze eerste zin bevat geen enkel bigram. Deze tweede trouwens evenmin. ‘Bigram’ is Opperlands voor een twee-letter-woord. Zo bestaan er ook ‘monogrammen’ (‘U’), ‘trigrammen’ enzovoort. Een echte, vrije tekst schrijven in woorden van één bepaalde lengte gaat nauwelijks. Het is nog moeilijker dan het bouwen van een huis met òf alleen bouwstenen òf alleen cement. Een tekst in bigrammen als voorbeeld:
- | Is de os al in de ar, pa? |
- | Ja ma; hij at je ei op. |
- | Zo! En de ui? (Ik ga de rij af!) |
- | De ui is op of om de po, ma. |
Zoiets.
Volgens Battus' Opperlandse Taal- en Letterkunde is de gemiddelde lengte van de woorden in een Nederlands woordenboek 10 letters. In een Nederlandse tekst is die lengte gemiddeld 5 letters. Van een dergelijke tekst maken de bigrammen de, en, in, je, te, is, hij, ik, op, ze, om, al, zij, er, bij twintig procent uit.
Van de 676 (26 × 26) mogelijke twee-lettercombinaties zijn er 61 die, naar mijn mening, ‘Nederlandse woorden’ mogen heten. Dat is nog geen 9%. Daarbij vallen uitroepen en klanknabootsingen (ha, he, ho, hu, hi en ah, eh, oh, ju, bè enzovoort) af. Afkortingen zijn per definitie geen woorden. En verder moeten we ook hard zijn ten opzichte van internationale, wetenschappelijke termen, dus weg met ‘pi’. Notennamen daarentegen behoren tot de normale woordenschat van Neerlands jong en oud. Ik hoop verder dat niemand mij het weglaten van de woorden am, et, ijp, ijm en ijf zal euvel duiden. Zij komen absoluut niet voor in de actieve of passieve woordenschat van de algemeen ontwikkelde Nederlander. Ze zijn hoogstens curiositeiten. In Word Recreations - Games and Diversions from Word Ways (Dover Publications, New York 1972) presenteert A. Ross Eckler een rangschikking van woorden van gelijke lengte in de vorm van een ‘netwerk’. Hij komt tot 38 Engelse twee-letterwoorden; ook hij wijst afkortingen af, maar laat, vreemd genoeg, ‘tv’ en ‘tb’ wel toe.
In navolging van Ross Ecklers Engelse versie bied ik hieronder een netwerk aan van die 61 gangbare Nederlandse twee-letter-woorden.
Woorden met dezelfde beginletter staan in horizontale rijen; woorden met dezelfde eindletter zijn gerangschikt in verticale kolommen. Een rij of kolom van slechts twee woorden wordt verbonden door een stippellijn; bij meer dan twee woorden zijn deze verbonden door een streep.
Ik verwacht wel dat ik met deze 61 woorden - mijn restricties in aanmerking genomen - volledig ben geweest (maar bijna tot het laatst bleek ik ‘hij’ over het hoofd te hebben gezien!)
Wanneer we het netwerk nu eens gaan bekijken dan kunnen we, na even van de aantrekkelijke vorm genoten te hebben, enige wellicht nutteloze conclusies trekken.
Beschouwen we de ‘ij’ als één letter en wel als een ‘klinker’, dan zijn er van deze 61 bigrammen 35 die bestaan uit een medeklinker gevolgd door een klinker, 24 uit een klinker gevolgd door een medeklinker en 2 uit een klinker gevolgd door een klinker.
Kijken we naar de verschillende woordsoorten dan zien we dat die 61 bigrammen eigenlijk 68 verschillende woorden vertegenwoordigen:
bij is een zelfstandig naamwoord en een voorzetsel;
zij is een zelfstandig naamwoord en een persoonlijk voornaamwoord;
rij
een zelfstandig naamwoord en een werkwoord;
es twee zelfstandige naamwoorden;
la twee zelfstandige naamwoorden en
as drie zelfstandige naamwoorden.
Van alle bezittelijke voornaamwoorden blijkt ruim 22% een bigram te zijn; van alle lidwoorden 33% en van alle persoonlijke voornaamwoorden ruim 68%.
We kunnen verder zien welk woord het vaakst tot een ander woord omgevormd kan worden door slechts één letter te veranderen. Welk woord, anders gezegd, heeft de grootste ‘veranderbaarheid’? Dat blijkt, met 14 mogelijkheden, mij te zijn. Nu heeft er slechts één.
Dan zijn er nog zogenaamde ‘blokken’ te onderscheiden, waarvan het blok ‘wij-we-gij-ge’ met 16 woorden het grootste is. (Een blok is symmetrisch: ‘pij’ telt in dit blok dan ook niet mee). De blokken ‘pa-pij-la-lij’ en ‘ja-je-ga-ge’ bestaan allebei uit 12 woorden, maar hun vorm is verschillend. Volgens een code van Ross Eckler kunnen deze blokken wat hun vorm betreft achtereenvolgens weergegeven worden als (62) en (43). De vorm van het ‘wij-we-gij-ge’-blok is dus (82).
Ten slotte is het mogelijk na te gaan tussen welke twee woorden de grootste afstand ligt; dat wil zeggen de grootste afstand zonder omweg. Voor zover ik het heb kunnen bekijken liggen er tussen ‘nu’ en ‘op’, tussen ‘zo’ en ‘op’ en tussen ‘po’ en ‘op’ telkens 7 stappen. Een stap is een rechte, horizontale of verticale weg. Misschien is er een langere weg? Ze wordt aangegeven door het BEGINWOORD, de hoekwoorden en het EINDWOORD. Dus bijvoorbeeld NU-na-ma-mi-ei-es-os-OP.