Boekbespreking
G. Aucamp. Woordeskat en woordherhaling. (Duisend afrikaanse staatmakers wetenskaplik vasgestel). Kaapstad. Die Mercantile-Pers. 1932 (- 7/6).
Welke woorden worden het meest gebruikt in de taal? En zijn dit voor de verschillende taal- en stijlsoorten steeds dezelfde woorden? - Op deze interessante vragen heeft de Z. Afrikaansche journalist G. Aucamp een antwoord beproefd, en wel langs zuiver statistische weg. Daartoe heeft hij 16 stukken proza onderzocht, die loopen van lectuur voor kinderen via hoofdartikels uit de nieuwsbladen naar algemeen letterkundig werk, stof uit de bijbel en brieven van een verzekeringskantoor, en in totaal 269.009 woorden omvatten. Dat is dus ongeveer het veertigste deel van het materiaal dat aan Raeding's ‘Häufigkeitswörterbuch’ ten grondslag werd gelegd (11 millioen woorden). Het eerste resultaat is een ‘Lijs van die 1.000 meesgebruikte woorde’. Voorop komen vormen als die, en, nie, het, 'n, van, is, in, ek, dit; te, hij, sy, wat, ons, vir enz.; daarop volgen vooral pronomina, adverbia, enkele verba als sê, kom, gaan en meerdere hulpverba; en tenslotte langzaam aan ook de substantiva. De minder frequente woorden staan in een aparte lijst, telkens onder opgave van de stijlsoort waarin ze gevonden zijn.
Verwonderlijk is het hoe vaak sommige woorden in de taal gerepeteerd worden; het meest gebruikte element ‘die’ haalt b.v. direct al een frequentie van 18.851, ‘en’ van 7.894, d.i. resp. van 7% en 2.9%. Het eerste tiental hierboven geciteerde woorden vormt 25.4% van het totaal; met 25 woorden komt men aan 39.9%, en met 50 is men reeds over de helft (51.6%). De heele lijst van de 1000 ‘staatmakers’ omvat 82.7% van de totale onderzochte woordenschat! Zulke hooge getallen had men zeker niet verwacht.
Toch heeft G. Aucamp uit zijn mooie opgave niet gehaald wat erin zit; het overvloedige materiaal is niet voldoende uitgebuit. De voornaamste oorzaak daarvan is, dat weinig of geen gewicht gehecht is aan semantische factoren; alleen de woordvorm beslist hier. Bij no. 22 uit de Lys, ‘my’ met een frequentie van 2.230, zijn b.v. de beteekenissen my, me, mine en to avoid, shun niet gescheiden gehouden; bij no. 55 ‘weer’ vallen 3 beteekenissen samen, nl. weather; again, second time