X-rijke woorden
H. Brandt Corstius - Amsterdam
Toen ik nog niet lezen kon, keek ik 's ochtends vaak of er bij de post weer een brief voor mijn vader was met zo'n lange rij van dezelfde krabbeltjes. Dat waren de e's in de voor de oorlog gebruikelijke adressering Den Weledelzeergeleerden Heer. In de Opperlandse folklore kennen we ook een t-rijk woord als hottentottententententoonstelling en een u-rijk woord als Luculluscultus.
Vorig jaar verscheen het Elektronisch Groene Boekje. Ik heb voor de 26 letters plus de ij de ‘rijkste woorden’ er in een kwartiertje uit gehaald. In de lijst ziet u achter elke letter het maximale aantal keren dat die letter in één woord voorkomt, en daarachter het kortste woord (of een paar kortste) met dat maximale aantal.
a |
7 |
propaganda-apparaat |
b |
4 |
babbelbox, bubbelbad |
c |
5 |
catch-as-catch-can |
d |
5 |
donderdagmiddag |
e |
9 |
weledelzeergeleerde |
f |
5 |
afvalstoffenheffing |
g |
4 |
gegaggeld |
h |
4 |
huichelachtigheid |
i |
6 |
liquiditeitscrisis |
j |
3 |
jojootje |
k |
5 |
klikklakken |
l |
5 |
lellebellen |
m |
5 |
mammogrammen |
n |
7 |
ontspanningsoefeningen |
o |
6 |
oostnoordoost |
p |
5 |
lappenpoppen |
q |
2 |
Quinquagesima |
r |
6 |
herstructureringsreserve |
s |
7 |
stofwisselingsstoornissen |
t |
6 |
tentoonstellingsinstituut, straatvechtersmentaliteit |
u |
5 |
bestuurscultuur |
v |
3 |
visvijver |
w |
3 |
weduwvrouw |
x |
2 |
xerox |
y |
2 |
playboy, royalty |
ij |
3 |
begrijpelijkerwijs |
z |
3 |
jazzmuziek |
Als u het woord bij de c te Engels of te veel gestreept vindt, moet u het doen met conceptcontract of conjunctuurcycli, die maar 4 c's bevatten. Bij de j heb ik wijntje en trijntje niet goedgekeurd. Als de hoofdletter van het q-rijke woord u mishaagt, moet u het langere woord liquiditeitsquote nemen. Bij de r kunnen we het betreuren dat het kortere restructureringsreserve niet in het Groene Boekje staat. Ook de Hottentotten zijn verdwenen.
Als we de lengte van het kortste x-rijke woord delen door het aantal x-letters daarin, dan krijgen we een getal dat aangeeft hoe efficiënt het x-rijke woord is. Het e-rijke woord uit mijn jeugd scoort niet alleen de meeste identieke letters, maar is ook het efficiëntst met een waarde 2,1. Na de e zijn de k (klikklakken) en de 1 (lellebellen) met ieder 2,2 het efficiëntst. De gemiddelde efficiëntie is 3,0: voor elk van de x-letters moeten gemiddeld dus twee andere letters opdraven (de c, d, i, u en v hebben deze waarde).
Als we kijken hoeveel van de circa 300.000 woorden in het Elektronisch Groene Boekje minstens 1, 2, 3, 4... x keer dezelfde letter bevatten, dan duikt een wetmatigheid op, die we bij de letter e het best kunnen vertonen. In de onderstaande lijst is aangegeven hoeveel woorden er zijn met minstens 1, 2, 3, 4, 5, 6, 7 en 8 e's. Deelt men elk aantal door het aantal eronder, dan ontstaat een reeks die afgerond 1, 2, 3, 4, 5, 6, 7 is. Het aantal woorden dat minstens n keer een bepaalde letter bevat, is dus steeds ongeveer n maal zo klein als het aantal woorden dat minstens n+1 maal diezelfde letter bevat.
e-tal |
aantal |
quotiënt met volgend aantal |
1 e |
232498 |
1,5 |
2 e |
154391 |
2,1 |
3 e |
72045 |
3,0 |
4 e |
23636 |
4,2 |
5 e |
5657 |
5,2 |
6 e |
1087 |
5,7 |
7 e |
192 |
7,1 |
8 e |
27 |
|