| |
| |
| |
De wording van het Algemeen Nederlands Woordenboek Fons Moerdijk
Het Algemeen Nederlands Woordenboek (ANW) is een project van het Instituut
voor Nederlandse Lexicologie (INL). Het officiële beginjaar ervan is 1999, maar we konden er
feitelijk pas volop aan beginnen, nadat we in 2001 drie delen Aanvullingen op
het Woordenboek der Nederlandsche Taal (WNT) hadden voltooid. Met die ‘we’
bedoel ik de elf oud-medewerkers van het WNT die nu het redactieteam van het ANW vormen: vijf
redacteuren, vijf bureauredacteuren en een hoofdredacteur. Het project moet afgerond zijn op 31
december 2018.
Bij het maken van een woordenboek kunnen we grofweg drie fasen onderscheiden: de
voorbereiding, het schrijven en het publiceren. Het ANW bevindt zich in de eerste fase, die van
de voorbereiding. Het is de fase waarin de vorming van het concept en de materiaalverzameling
centraal staan. Ik moet u dus iets gaan vertellen over een woordenboek dat er nog niet is en
voel me dan ook als een architect die aan zijn gehoor de pracht van zijn gebouw duidelijk moet
maken aan de hand van een maquette van alleen de fundamenten. Toch hoop ik u aan de hand van de
belangrijkste kenmerken een voldoende duidelijk beeld te kunnen geven van wat er komen gaat.
| |
Algemeen en eigentijds Nederlands
In de titel is als eerste belangrijk kenmerk het object van het woordenboek aangegeven:
Algemeen Nederlands. Met ‘algemeen’ willen we uitdrukken dat we ons richten op het
Standaardnederlands. We zullen specifieke vaktermen, specifieke woorden uit groepstalen en
dialectwoorden buiten beschouwing laten. Uitsluiting van dialectwoorden betekent overigens
niet, dat we ons in het geheel niet om regionale variatie bekommeren. We zullen namelijk wel
volop aandacht besteden aan het gebruik van het bovengewestelijke Nederlands in België. Het
hoofdaccent ligt op het geschreven Nederlands.
| |
| |
Het ‘Nederlands’ uit de titel laat zich in tijd nader specificeren tot ‘eigentijds
Nederlands’. De taalperiode die het ANW bestrijkt loopt van 1970 tot 2019. Het eindjaartal
2019 is vanzelfsprekend bepaald door het afsluitingsjaar van het project. Het beginjaartal
1970 hangt samen met de terminus post quem non van het WNT. Met de drie
delen Aanvullingen kwam de eindgrens daarvan te liggen op 1976. Door de
keuze van 1970 ontstaat er tussen WNT en ANW een overlapping, die het voor het ANW mogelijk
maakt ook nog van recent WNT-materiaal gebruik te maken.
| |
Omvang
Een vraag waarop menigeen altijd graag een antwoord wil, is: hoeveel trefwoorden staan er in
het woordenboek? Die interesse is begrijpelijk. Bij het grote publiek leeft de gedachte ‘hoe
meer hoe beter’. Uitgevers spelen daar gretig op in door bij herdrukken van hun woordenboek
nadrukkelijk te pronken met hun alsmaar fors toegenomen aantallen trefwoorden. Nu hangt het er
maar vanaf hóé je telt en wát je telt. Ik kan daar in dit verband niet verder op ingaan, maar
moet volstaan met de opmerking dat we er verstandig aan doen mededelingen over aantallen
trefwoorden niet al te absoluut op te vatten en zeker niet als graadmeter voor kwaliteit te
nemen. Bovendien lijkt die getalsfixatie me meer een relict uit het tijdperk dat het papieren
woordenboek nog alleenzaligmakend was. In het elektronische tijdperk vervalt het probleem van
het ruimtegebrek. Dat biedt de mogelijkheid om woorden die vroeger buiten de boot moesten
vallen, nu op zijn minst te vermelden. Getalsmatige vergelijkingen tussen beide
woordenboekvormen gaan daardoor mank. Maar ik kan me voorstellen dat men toch enig idee wil
hebben van wat op dit gebied van het ANW, dat een elektronisch woordenboek wordt, te
verwachten valt. Op grond van de lijst van woordvormen uit het proefcorpus houd ik het op de
volgende raming: ongeveer 80.000 hoofdwoorden die een volle bewerking zullen ondergaan en
ongeveer 250.000 kleinere woorden waarvoor slechts enkele gegevens worden geboden of die
uitsluitend worden genoemd, voomamelijk als lid van de woordfamilie van een trefwoord.
| |
| |
| |
Bestemming
Een volgende voor de hand liggende vraag is: voor wie is het ANW bestemd? Van het doel van
een woordenboek hangt immers zijn inhoud af, die op zijn beurt bepalend is voor het concept en
de bouwstoffen ervan. Voor het ANW denken we aan de volgende gebruikersgroepen:
niet-professionele, volwassen taalgebruikers en taalliefhebbers enerzijds, professionele
taalonderzoekers, taalbeschouwers en natuurlijke-taalverwerkers anderzijds. Natuurlijk hebben
die verschillende gebruikersgroepen uiteenlopende interesses en verschillende redenen om een
woordenboek te raadplegen. Een papieren woordenboek kan ze onmogelijk allemaal bedienen. Voor
een elektronisch woordenboek ligt dat anders. Dat kan zo worden ingericht dat ieder naar zijn
gading de informatie kan krijgen die hij wenst. Het ANW zal als elektronisch woordenboek
daarom zulke verschillende gebruikersgroepen van dienst kunnen zijn. Onder hen vormen de
taalkundigen en lexicografen wel de belangrijkste doelgroep. Zoals het WNT als
wetenschappelijk woordenboek een moederwoordenboek voor de handwoordenboeken uit het verleden
was en leidde tot verbetering daarvan, zouden we daarnaast graag zien dat het ANW als een
product van de moderne wetenschappelijke lexicografie die rol vervult voor de toekomstige
handwoordenboeken van het eigentijdse Nederlands.
| |
Corpusgebaseerd
Het ANW wordt een corpusgebaseerd woordenboek. ‘Corpus’ moet hier in de moderne zin verstaan
worden als een verzameling elektronische teksten die zó zijn geselecteerd dat ze een zekere
weerspiegeling vormen van de taalwerkelijkheid die men wil vastleggen. Het uiteindelijke
ANW-corpus zal samengesteld worden uit diverse corpora. Voor de periode tot ongeveer 2000
kunnen we een beroep doen op al bestaande en gedeeltelijk ook voor een breed publiek op
internet beschikbare, taalkundig verrijkte INL-corpora. Dat zijn (‘miljoen’ staat verkort voor
‘miljoen afzonderlijke woordvormen/tokens’):
• | 5 miljoen corpus |
• | 27 miljoen corpus |
• | 38 miljoen corpus |
| |
| |
• | 50 miljoen corpus |
• | Parole corpus (20 miljoen). |
Naast deze corpora beschikt het INL nog over ander materiaal van voor 2000, waar het ANW
gebruik van kan maken: ‘losse’ digitale bestanden, teksten in papieren vorm, en het al eerder
genoemde WNT-Aanvullingen-materiaal voor de periode 1970-1976.
Voor de periode vanaf 2000 onderscheiden we als eigen ANW-corpora:
• | Domeinencorpus Nederland (2000-2005) |
• | Domeinencorpus België (2000-2005) |
• | Corpus van Literaire Teksten (2000-2005) |
• | Neologismencorpus (2000-2019). |
Uit de toegevoegde dateringen (2000-2005) kan men opmaken dat de domeinencorpora en het
literaire corpus eind 2004 afgesloten worden en dat alleen het neologismencorpus (met
2000-2019) doorloopt tot het einde van het project.
Het domeinencorpus Nederland en het domeinencorpus België ontlenen hun naam aan de
bijzondere methode waarmee ze worden opgebouwd. Uitgangspunt vormen de domeinen van de
webindex NL-menu. Met behulp daarvan zoeken de bureauredacteuren binnen die domeinen (1817!)
naar teksten die voor het woordenboek geschikt zijn. Ook Google wordt voor
de constructie van deze corpora benut. Deze methode garandeert ons in ieder geval een zeer
grote inhoudelijke diversiteit. Veel onderwerpen uit de samenleving die in de traditionele
materiaalverzamelingen buiten beeld gebleven zouden zijn, worden ermee bereikt en dus ook de
woorden die daar kenmerkend mee verbonden zijn. De totale omvang van het domeinencorpus
Nederland zal eind 2004 ongeveer dertig miljoen tokens bedragen, die van het domeinencorpus
België is geraamd op tien miljoen tokens.
Het Corpus van Literaire Teksten zal essays, romans, verhalen en toneel bevatten, onder te
verdelen in oorspronkelijk en vertaald werk en in Noord en Zuid. De teksten worden door de
eigen medewerkers gedownload of gescand. Dit corpus zal uitkomen op ongeveer vijftien miljoen
tokens.
Het Neologismencorpus wordt als volgt gerealiseerd. We hebben een selectie gemaakt van een
twintigtal dag- en weekbladen op internet. Deze | |
| |
worden dagelijks door
ANW-medewerkers op neologismen (in ruimste zin: ook nieuwe betekenissen, verbindingen e.d.)
doorgekeken. Aangetroffen neologismen worden met zeer ruime contexten gekopieerd en in eigen
bestanden opgeslagen. Daarnaast blijft de oude verzamelmogelijkheid bestaan: papieren notities
of krantenknipsels. Op die manier aangeleverd materiaal (ook van buiten het INL) wordt
eveneens gedigitaliseerd. Bij afsluiting van de andere corpora, eind 2004, zal het een omvang
hebben van zes miljoen tokens. De uiteindelijke omvang is begroot op circa vijftien miljoen
tokens.
Als we de periode 2000 t/m 2002 als maat nemen, dan verzamelen we gemiddeld ongeveer 5.000
neologismen per jaar. Het zou zeer veel tijd kosten die allemaal te bewerken. Bovendien zijn
het voor het merendeel eendagsvliegen. Veel van die tijd zou dus ook nog eens verloren tijd
zijn. We hebben daarom besloten alleen de als ‘duurzaam’ ingeschatte neologismen te bewerken.
Wel houden we van alle verzamelde neologismen lijsten bij, met vermelding van het jaar of de
jaren waarin ze door ons zijn opgetekend. Het is onze bedoeling die lijsten op internet voor
iedereen toegankelijk te maken nog voor de start van de publicatie van het feitelijke
woordenboek zelf.
Onze eigen corpora staan bij de bewerking centraal. De INL-corpora en de losse digitale
INL-bestanden zullen voornamelijk aanvullende diensten bewijzen. Die eigen corpora hebben
samen een omvang van zeventig miljoen tokens. Met dat aanvullende, andere INL-materiaal zal de
eindomvang van het ANW-corpus naar onze inschatting uitkomen op ongeveer honderd miljoen
tokens.
We leggen niet zelf een subcorpus voor de gesproken taal aan. Wel zullen we gebruikmaken van
het Corpus Gesproken Nederlands om woorden op het spoor te komen die uitsluitend of op
bepaalde specifieke wijze in het gesproken taalgebruik voorkomen.
Momenteel is de afdeling automatisering van het INL bezig een proefcorpus van zeventien
miljoen tokens voor ons gereed te maken. De verwachting is dat we dit op korte termijn
taalkundig verrijkt en voorzien van tal van functionaliteiten die voor de redactionele
bewerking van belang zijn, tot onze beschikking krijgen. Dan zal het de grondslag vormen voor
onze eerste proefartikelen, waarmee we nog voor het einde van dit jaar willen beginnen.
| |
| |
| |
Elektronisch woordenboek
Met mijn eerdere vermelding van het ANW als een elektronisch woordenboek heb ik al een ander
wezenlijk kenmerk genoemd, maar een verdere specificatie is gewenst. Elektronische
woordenboeken kun je naar hun bestemming verdelen in elektronische woordenboeken voor mensen
en elektronische woordenboeken voor computers. Uit mijn bespreking van de bestemming bleek al:
het ANW zal er zijn voor de mensen. Gebruikelijk is verder een hoofdonderscheiding in off line en on line woordenboeken. Off line
woordenboeken zijn woordenboeken op lokale opslagmiddelen als een diskette of cd-rom. On line woordenboeken zijn woordenboeken die zijn opgeslagen op servers die via
internet toegankelijk zijn (cf. Petelenz 2001, 43; De Schryver 2003, 146-151). Het ANW valt
onder die laatste categorie. Het ANW wordt dus een on line woordenboek voor
menselijk gebruik.
Bijna alle elektronische woordenboeken zijn gedigitaliseerde versies van eerdere papieren
woordenboeken. Inhoudelijk is daarbij doorgaans niets of nauwelijks iets veranderd. Wat deze
producten een bijzonder aantrekkelijke meerwaarde geeft, is de software waarmee op
verschillende manieren en vanuit verschillende invalshoeken allerlei soorten gegevens kunnen
worden opgevraagd (Petelenz 2001, 62). Het alfabet is niet langer de enige toegangsweg tot de
informatie die in een woordenboek besloten ligt.
Die nieuwe fonctionaliteiten die we danken aan de ontwikkeling van de woordenboeksoftware,
brachten echter meer en scherper dan ooit tevoren ook de lacunes, inconsistenties,
tegenstrijdigheden en vergissingen uit de oorspronkelijke gedrukte versies aan het licht. Ook
inlioudelijk vraagt het elektronische tijdperk om verbetering en vernieuwing.
Aan het ANW ligt geen papieren versie ten grondslag. We beginnen met een schone lei. Onze
opzet is ook niet om artikelen te schrijven zoals we dat voor een papieren woordenboek gewend
zijn, maar om ons al bij de conceptvorming van meet af aan rekenschap te geven van de
mogelijkheden, eisen en problemen die aan het maken van een nieuw elektronisch woordenboek
verbonden zijn.
| |
| |
| |
Inhoud
In vergelijking met andere woordenboeken kenmerkt het ANW zich inhoudelijk, doordat het tal
van nieuwe informatiecategorieën zal bevatten. Voorts zullen we de al bestaande
informatiecategorieën met meer diepgang en systematischer behandelen. Een grotere interne
consistentie bereiken we door voor de inhoud van de artikelen een vaste datastructuur te
ontwerpen. Om duidelijk te maken dat het hier niet om een paar loze reclamekreten gaat, wil ik
bij deze punten wat uitvoeriger stilstaan. Voor mijn toelichting neem ik een voorbeeld als
uitgangspunt dat ons wellicht naar de late middag doet verlangen: het woord bier. In de jongste druk van het handwoordenboek van Koenen staat het volgende artikel:
bier (o) (soorten) -en
alcoholische drank, uit hop en gerst gebrouwen: een ~tje drinken.
Naar de verschillen in de aard van de gegevens die hier worden aangeboden, valt het artikel
in vijf segmenten, of ‘velden’, te verdelen. Als we die segmenten voorzien van een beginlabel
<> en een eindlabel </> en met die labeling hun aard markeren, dan
krijgen we het volgende beeld:
<trefwoord>bier</trefwoord><geslacht>
(o)</geslacht><meervoud<-en</meervoud<<definitie> alcoholische drank, uit hop en
gerst gebrouwen </definitie>:<voorbeeld> een ~tje
drinken</voorbeeld>.
Buiten het trefwoord zelf, waarover immers de informatie gegeven wordt, zijn die
afzonderlijke velden te beschouwen en te benoemen als ‘informatiecategorieën’. Deze staan op
één lijn, er zijn geen verschillende niveaus van overkoepeling en onderverdeling. Het artikel
heeft een ‘platte’ structuur.
Er zijn echter ook enige ‘verborgen categorieën’. Met het trefwoord is namelijk impliciet
ook de juiste spelling aangegeven. De ‘o’ achter het trefwoord staat voor ‘onzijdig’ en maakt
kenbaar wat het woordgeslacht is (het is een ‘het-woord’). Dit is echter alleen van toepassing
bij substantieven, zodat impliciet via ‘substantief’ ook de categorie ‘woordsoort’ aanwezig
is. Op vergelijkbare wijze is ‘substantief’ ook overkoepelend besloten in de categorie
‘meervoud’. We krijgen nu een structuur met zes informatiecategorieën en bovendien een
structuur die niet meer plat, maar | |
| |
hïerarchisch is (drie niveaus bij
‘woordsoort’; substantief is gecursiveerd omdat het geen informatiecategorie maar een waarde
bij ‘woordsoort’ is):
trefwoord |
spelling (impliciet in trefwoord) |
woordsoort (impliciet via substantief) |
substantief (impliciet in geslacht en meervoud)
geslacht |
meervoud |
definitie |
voorbeeld. |
|
In deze eenvoudige structuur kan men gemakkelijk het informatieaanbod van het gemiddelde
handwoordenboek herkennen.
Het aantal informatiecategorieën in het ANW ligt ruim boven de honderd. In een eerste
ontwerp komen we uit op honderdveertig. Ze zijn ondergebracht in een hiërarchische structuur.
Die kent zoveel verschillende niveaus, dat ik u hier slechts fragmentarisch een idee ervan kan
geven aan de hand van de twee hoogste niveaus. Op het hoogste niveau wordt die structuur
gevormd door de rubrieken a) trefwoord, b) spelling en uitspraak, c) grammatica, d) betekenis
en gebruik, e) etymologie. Ieder van die topelementen is verder onderverdeeld:
trefwoord
[homoniemennummer] |
trefwoordtype
|
|
spelling en uitspraak
spellingsvariant |
afbreking |
schrijfwijze
|
aantal lettergrepen
|
afkorting
|
grafisch symbool
|
beklemtoning |
uitspraakwijze |
fonetisch |
IPA-notatie |
|
grammatica |
| |
| |
woordsoort |
woordvormingstype
|
|
betekenis en gebruik
betekenisnummer |
definitie |
semagram
|
voorbeelden |
verbindingen |
spreekwoorden en zegswijzen |
contextanten
|
woordfamilie
|
betekenisrelaties
|
|
etymologie
datering |
aard van de herkomst |
etymologisch commentaar. |
|
Ik heb in dit schema niet de rubrieken verwerkt die geen vaste stractuurplaats hebben, zoals
bijvoorbeeld ‘pragmatiek’ (met categorieën als taalgebied, stijl, vakgebied, sociale groep,
houding en frequentie), ‘multimedia’ (afbeelding, geluid, video) en ‘commentaar’.
In de gedeeltelijke structuurweergave zijn de vetgedrukte categorieën nieuw. Veel van deze
categorieën hebben op hun beurt verscheidene onderverdelingen. Exemplarisch wil ik er twee
behandelen: woordvormingstype en semagram. Het element woordvormingstype heeft in ons ontwerp
de volgende opzet:
ongeleed
|
afleiding
|
samenstelling
linkerlid |
rechterlid |
type |
tussenklank |
betekenisbetrekking tussen linkerlid en rechterlid |
|
| |
| |
samenstellende afleiding, |
samenkoppeling
|
blend/samensmelting/reductiesamenstelling
|
verkorting
|
keervorming (back formation)
|
eponiem
|
letterwoord
|
lettergreepwoord
|
overige. |
Woordvormingstype is een categorie waarvoor direct een waarde wordt opgegeven. In dit geval
is er sprake van een eindige set van vaste waarden (aangegeven met cursief): ongeleed woord,
afleiding, samenstelling, samenstellende afleiding, samenkoppeling, blend, verkorting,
keervorming, eponiem, letterwoord, lettergreepwoord, overige. Een aantal van hen wordt weer
verder onderverdeeld. In het schema geven we daar voorbeelden van bij afleiding en bij
samenstelling.
Bij afleiding zijn velden ingeruimd waar het karakter van het grond- woord en het affix
wordt gepresenteerd. Voor ‘grondwoord’ is er opnieuw een gesloten verzameling waarden (12):
substantief, adjectief, werkwoord, werkwoordsstam, werkwoordsstam + substantief, samengesteld
substantief, samengesteld substantief + ig, onovergankelijk werkwoord,
overgankelijk werkwoord, bijwoord, eigennaam, wortel. Onder ‘affix’ komt te staan met welk
voorvoegsel, achtervoegsel, gecombineerd voor- en achtervoegsel, of infix een woord is
afgeleid, of er wordt vermeld dat het gaat om een afleiding zonder affix (nul-afleiding,
conversie).
Bij ‘samenstelling’ worden gesloten sets van waarden aangehouden voor type, tussenklank en
betekenisbetrekking tussen linker- en rechterlid. Dat zijn er voor ‘type’ liefst veertig. Voor
de betekenisbetrekkingen zijn we bezig met een inventarisatie die naar verwachting ook tot
enige tientallen waarden zal leiden.
Met deze nieuwe categorieën op het gebied van de woordvorming spelen we voornamelijk in op
mogelijke vragen en behoeften van taalkundigen.
Nieuwkomer bij ‘betekenis en gebruik’ is het semagram. Een semagram is een frame, een
structuur met slots en fillers waarin kennis van een
bepaald concept wordt gepresenteerd. Het semagram voor bier zou er als volgt
uit kunnen zien:
| |
| |
<categorie>drank</categorie> |
<kenmerk_samenstelling>alcoholhoudend,
alcoholisch</kenmerk_samenstelling> |
<kenmerk_bereiding>in een brouwerij; brouwen; koken,
gisten</kenmerk_bereiding> |
<kenmerk_grondstof>gerst, mout, wort, hop,
water</kenmerk_grondstof> |
<kenmerk_kleur>goudkleurig, geel, blond, amberkleurig, bruin, wit, licht,
donker; schuimkraag wit</kenmerk_kleur> |
<kenmerk_smaak>bitter, bitterzoet, zoetzuur, zoet, verfrissend,
fris</kenmerk_smaak> |
<kenmerk_gebruik> verpakt en vervoerd in flesjes, blikjes, kratten, vaten;
getapt uit vaten, fusten; gedronken uit glazen, pullen, flesjes,
potten</kenmerk_gebruik> |
<bovencategorie>vloeistof, product,
consumptieartikel</bovencategorie> |
<oppercategorie>stof</oppercategorie>. |
De slots (de labels tussen de punthaken) zijn de abstracte elementen die
de eigenschappen en relaties aangeven die relevant zijn voor woorden uit de semantische klasse
waartoe het trefwoord behoort. De fillers zijn de bij die labels ingevulde
concrete gegevens die voor het trefwoord in kwestie gelden. Die structuren zijn niet uit de
lucht komen vallen. Op basis van analyses van definities voor een selectie van ongelede
substantieven, werkwoorden en adjectieven onderscheiden we semantische klassen. Daar ontwerpen
we ‘typesjablonen’ voor, die vervolgens bij de bewerking worden ingevuld. In die technische
zin kan men het semagram ook beschouwen als een ‘ingevuld typesjabloon’ Het structuurmodel bij
bier is dus een structuurmodel dat bij alle drankbenamingen terugkeert.
Voor nadere details moet ik verwijzen naar mijn oratie (Moerdijk 2002). Het semagram zal in
het ANW naast de definitie deel uitmaken van de betekenisbeschrijving (vanzelf-sprekend met
aangepaste lay-out).
Om een aantal redenen kan het semagram een rol van betekenis (in dubbele zin dus) gaan
spelen:
| |
| |
• | het expliciteert kennisgegevens die in de definitie alleen impliciet besloten liggen; |
• | het kan op een coherente, gestructureerde wijze veel meer gegevens bevatten dan de
definitie; |
• | het zorgt voor veel meer en genuanceerdere zoek- en opvraagmogelijkheden van inhoud naar
vorm; |
• | het vormt met andere semagrammen een grote verscheidenheid aan lexicale en conceptuele
relaties; |
• | elementen ervan spelen onder meer ook een rol bij collocaties, polysemie, betrekkingen
tussen de leden van samenstellingen van het trefwoord. |
Het semagram is een vernieuwing die niet alleen voor professionele, maar ook voor ‘gewone’
taalgebruikers interessant is. De laatste kunnen er bijvoorbeeld baat bij hebben als ze niet
meer op een woord kunnen komen, waarvan ze nog wel bepaalde betekeniselementen in hun hoofd
hebben.
Op basis van ons concept van de microstructuur zal in overleg en samenwerking met onze
automatiseringsdeskundigen een XML-structuur ontworpen worden. Ten slotte merk ik op, nu
mogelijk ten overvloede, dat je in het geval van het ANW bij ‘woordenboek’ moet denken aan een
lexicografische database, niet aan een gedrukt boek of een cd-rom daarvan. Eventueel kunnen
van die database allerlei andere lexicografische producten worden afgeleid, zowel in papieren
als in elektronische vorm, maar dat is op dit moment niet aan de orde.
| |
Publicatie
In 2005 moeten we volgens de planning met de echte bewerking beginnen. We willen dan zo
spoedig mogelijk het ANW op internet gaan zetten. Een van de voordelen van het on
line woordenboek is immers dat je niet met publiceren hoeft te wachten tot je je van A
tot en met Z door de woordenschat heen hebt geworsteld. Die publicatie van volledig bewerkte
artikelen zal overigens niet alfabetisch plaatsvinden, maar in klassen van woorden die naar
hun betekenis bijeenhoren. Zo zullen ze ook bewerkt worden, onder meer om een zo groot
mogelijke uniformiteit in behandeling en redactioneel taalgebruik te bereiken. Andere
voordelen van het on line
| |
| |
publiceren zijn de mogelijkheid tot directe interactie met gebruikers en tot
directe aanvulling en verbetering.
| |
Besluit
Nogal wat mensen hebben mij de afgelopen paar jaren gevraagd: Gaan jullie een eigentijds
woordenboek maken? Waar is dat nou voor nodig? We hebben toch Van Dale al? Zelfs in eigen
kring heerste aanvankelijk enige bezorgdheid over de zinvolheid van ons bestaan. Amper tot
hoofdredacteur benoemd, kreeg ik van het bestuur van het INL het verzoek om nu eens in een
nota duidelijk uit te leggen, waarin het ANW zou gaan verschillen van de Grote Van Dale. Als
het goed is, heb ik in ieder geval van u zo'n vraag naar de verschillen met Van Dale niet meer
te duchten.
Ik heb u iets van de fundamenten kunnen laten zien van een bouwwerk dat nog geheel moet
worden opgetrokken. Ik hoop dat ik uw interesse voor dat gebouw heb gewekt. Dat de vlag op het
dak gaat, zal ik niet meer meemakeu, zeker niet beroepsmatig. Mijn leven is dan al yeranderd
van ANW in AOW.
| |
Bibliografie
Moerdijk, Fons: Het woord als doelwit. Amsterdam, 2002. |
Petelenz, Krysztof: Standardisierung der Lexikoneintäge für ein neues
großes Deutsch-Polnisches und Polnisch-Deutsches Wörterbuch. Hildesheim, Georg Olms
Verlag, Germanistische Linguistik, 2001. |
Scharyver, Gilles-Maurice De: ‘Lexicographer's dreams in the electronic dictionary age’.
International Journal of Lexicography 16, 143-199 (2003). |
|
|