Voorwoord
De Nederlandse woordenschat heeft zich in de loop van de tijd gestaag uitgebreid. Er werden nieuwe samenstellingen en afleidingen gemaakt van inheemse woorden, en er werden woorden geleend uit andere talen. De ouderdom van de woorden die we momenteel gebruiken, verschilt: sommige worden al sinds de dertiende eeuw of eerder in het Nederlands gebruikt, andere zijn pas in de twintigste eeuw in onze taal gekomen.
In verschillende talen (Engels, Frans, Duits, Zweeds) besteden etymologen al langere tijd aandacht aan het zoeken naar de oudste vindplaats van een woord. In de Nederlandse etymologische woordenboeken bestaat die aandacht pas sinds enkele decennia. Het inzicht is algemeen geworden dat voor ieder woord het eerste geschreven voorkomen het beginpunt dient te zijn van de geschiedenis van dat woord.
Momenteel wordt echter nog geen aandacht besteed aan het inzicht dat dateringen kunnen bieden in de opbouw, groei, herkomst en verandering van de gehele woordenschat van een taal van de oudste overlevering tot op heden. Dateringen worden traditioneel slechts op woordniveau bekeken, en er worden geen onderlinge verbanden gelegd. De digitalisering van bestanden en de nieuwe computertechnieken maken het echter mogelijk andere onderzoeksvragen te stellen en dwarsverbanden te tonen die voorheen niet of nauwelijks onderzocht konden worden.
Het doel van dit boek is met behulp van recente computertechnieken tot nieuwe inzichten te komen over de ontwikkeling van de woordenschat als geheel. De tijd dat etymologie inhield dat in alfabetische volgorde telkens de herkomst van één woord beschreven werd, is definitief voorbij. De alfabetische volgorde is handig voor wie een woord wil opzoeken, maar verschaft weinig inhoudelijk inzicht. Een andere manier om woorden te groeperen is naar hun betekenis (zoals gebeurt in zogenaamde thesauri als Het juiste woord van Brouwers), naar hun herkomst (zoals ik in het Leenwoordenboek heb gedaan) of naar hun ouderdom. In dit boek worden al deze elementen met elkaar verbonden.
Daarvoor is een representatief bestand van ruim achttienduizend merendeels ongelede trefwoorden in een database gezet. Van ieder trefwoord is de huidige betekenis opgenomen met de oudste datering hiervan (zoals momenteel bekend). Voorts is van ieder trefwoord in het kort de herkomst opgenomen.
Alle trefwoorden zijn thematisch ingedeeld, en wel in tweeëntwintig hoofdthema's (aardrijk, plantenrijk, dierenrijk, mensenwereld, kunst, wetenschap, etc.), die weer nader zijn onderverdeeld in subthema's en naar woordsoort.
In de database zijn dus de volgende gegevens opgenomen: trefwoord, datering, betekenis, thema, woordsoort en herkomst. Deze gegevens kunnen op iedere gewenste manier met elkaar gecombineerd worden. Op basis hiervan zijn de volgende hoofdstukken en woordenlijsten samengesteld: