● Vrijwilligers
Hoe verzamelt een onderzoeker tien miljoen gesproken woorden? Waarschijnlijk worden vrijwilligers uit het hele taalgebied geselecteerd, die opnamen van hun alledaagse taalgebruik maken. ‘Het is niet de bedoeling dat die vrijwilligers dialect spreken,’ zegt Baayen, ‘al mag er best een Groningse of Vlaamse tongval doorheen klinken.’ Die vrijwilligers worden uitgerust met opnameapparatuur. ‘Ze zetten die apparatuur 's ochtends vroeg bij de eerste gaap aan, en 's avonds na het laatste gesprek in bed zetten ze hem weer uit.’ Geven ze zo niet erg veel van hun privacy weg? ‘Nou, onder bepaalde voorwaarden mogen ze af en toe wel de knop omdraaien.’
Bovendien krijgen de vrijwilligers een stapel formulieren mee. Alles wat hun gesprekspartners zeggen, wordt ook opgenomen en komt dus ook in de gegevensbank terecht. Op de formulieren moeten al die mensen - de jongen achter de kassa, de receptioniste, de beste vriend - hun toestemming geven, en bovendien wordt hun gevraagd ook wat informatie te verstrekken over hun eigen achtergrond.
De opnamen worden ingeleverd, door de onderzoekers uitgeschreven, ontleed en van extra informatie voorzien. Zo moet binnen vijf jaar de gegevensbank gestaag groeien tot de geplande tien miljoen woorden bereikt zijn.
Ondanks het enthousiasme van de onderzoekers zal de elektronische gegevensbank niet op een grote publieke belangstelling hoeven te rekenen. Toch is het denkbaar dat ook niet-taalkundigen erin geïnteresseerd zullen zijn. ‘We zullen ook voor het nageslacht op een vrij systematische manier hebben vastgelegd hoe mensen rond de wisseling van het millennium spraken’, zegt Baayen. ‘We zullen een klein monumentje voor het Nederlands hebben opgericht.’ Een monumentje dat past in de palm van je hand.