Onze Taal. Jaargang 69
(2000)– [tijdschrift] Onze Taal– Auteursrechtelijk beschermd
[pagina 274]
| |
Marc van OostendorpBegin dit jaar verscheen er een nieuwe spellingcorrector voor het Nederlands, die gemaakt is door de woordenboekenuitgever Van Dale en de onderzoeksinstelling TNO. De makers zelf noemen het een ‘professionele spellingcorrector’ en wijzen op de ‘intelligente’ zoektechniek. Maar hoe intelligent is die techniek echt? Voor journalisten, secretaresses en tekstschrijvers, voor wie spellen een deel van hun broodwinning is, was een exemplaar van het Groene Boekje ooit even onmisbaar als de duimstok voor de ambachtelijke timmerman. Maar sinds de komst van de moderne tekstverwerker is dat ingenaaide drukwerk niet meer nodig. Een moeilijk woord zoek je niet zelf op, dat laat je je computer doen. Wel maken de meeste tekstverwerkers daarbij nog steeds gebruik van de woorden uit de woordenlijst van het Groene Boekje. Wie een tijdje met zo'n automatische spellingcorrector heeft gewerkt, merkt dat een dergelijk programma niet ideaal is. Dat komt vooral doordat de computer een suf apparaat is dat niets kan, behalve woorden opzoeken in een lijst. Het vindt dan in sommige opzichten te veel en in andere juist weer te weinig woorden, het weet niets van werkwoordsvervoeging en het begrijpt ook niet wat de gebruiker daadwerkelijk wil. Aan die sufheid hebben onderzoeksinstelling TNO en woordenboekenuitgeverij Van Dale de afgelopen jaren gewerkt. Ze hebben een geheel nieuw soort programma gemaakt, waarin enkele nieuwe technieken zijn verwerkt die het systeem ‘slimmer’ moeten maken. Volgens de makers is het systeem de ‘meest geavanceerde’ spellingcorrector van het Nederlandse taalgebied. Maar hoe goed en slim is die intelligente nieuwe spellingcorrector nu eigenlijk? | |
AllochtoontjeDe meeste spellingcontroleurs werken zoals gezegd nu nog met een woordenlijst. Ze doen eigenlijk weinig meer dan een door de gebruiker ingetikt woord vergelijken met een lijst met woorden die ze kennen. Alle woorden die niet op die lijst staan, zijn ‘fout’, alle andere woorden zijn ‘goed’. In de praktijk betekent dit dat heel veel woorden aangemerkt worden als ‘fout’. Dat komt doordat in de gemiddelde woordenlijst meer woorden níét dan wél staan. Ook als het woord allochtoon wél is opgenomen, kunnen allochtonen, allochtoons en allochtonendebat nog niet zonder meer herkend worden. Het Nederlands is rijk aan manieren om nieuwe woorden te maken op basis van oude. Zo rijk dat het onmogelijk is om alle woorden in een lijst op te nemen. Natuurlijk kun je van alle zelfstandige naamwoorden het meervoud en de verkleinvorm (allochtoontje) in een lijst zetten, maar alle mogelijke samenstellingen opnemen, dat lukt niet. De spellingcorrector van TNO en Van Dale beschikt daarom over de mogelijkheid woorden in stukjes op te breken. Vooruitgang kan bijvoorbeeld worden opgedeeld in voor en uitgang, of in vooruit en gang. Nu zijn met het opbreken van woorden nog steeds niet alle problemen opgelost. Moet er nu wel of niet een tussen-n in blinde(n)darmoperatie? Nee, zegt een mens, die weet dat dit woord waarschijnlijk de operatie van een blindedarm beschrijft. Maar een computerprogramma dat bedenkt dat het hier misschien een darmoperatie betreft die is voorbehouden aan blinden, rekent die tussen-n wél goed. In zo'n geval kun je maar beter niet al te veel ontleden, en TNO en Van Dale hebben blindedarm dan ook in zijn geheel in de woordenlijst opgenomen. Het programma geeft daarom een waarschuwing als de gebruiker een tussen-n schrijft. | |
‘Koerzjet’Behalve te streng is een spellingcontroleur dus soms ook juist te toegeeflijk, en niet alleen bij ingewikkelde samenstellingen. Ook korte ongelede woorden kunnen problemen opleveren. Strikt genomen is wort een goed gespeld Nederlands woord, al zal het niet vaak gebruikt worden (behalve in brouwerskringen; wort is de moutpap waarvan bier gemaakt wordt). Dit soort woorden zijn in deze spellingcorrector in een aparte lijst opgenomen, zodat het programma een waarschuwing geeft als de gebruiker ze opschrijft: ik ken dit woord wel, maar weet u zeker dat u het bedoelt? Als u veel over wort schrijft, kunt u deze waarschuwing gelukkig wel uitzetten. Er zijn nog meer van zulke lijsten. Op basis van een grote databank met teksten van Nederlandse kranten en tijdschriften hebben de makers van de spellingcorrector een lijst gemaakt met de meest gemaakte tikfouten, die automatisch gecorrigeerd kunnen worden. Ook versteende uitdrukkingen - te allen tijde, te juister be- | |
[pagina 275]
| |
stemming - zijn in een lijst opgenomen. Verder beschikt Van Dale over uitspraakinformatie over alle Nederlandse woorden. Wie ‘koerzjet’ intikt, krijgt daarom automatisch de suggestie om ‘courgette’ te spellen. Bovendien zijn er lijsten met vaak voorkomende eigennamen en met afkortingen. | |
FoefjesAl met al is de nieuwe spellingcorrector dus nog steeds een groot deel van de tijd bezig met zoeken in lijsten, maar hij zoekt op een intelligente manier, en in een indrukwekkend aantal lijsten. Hij hakt daarvoor lange woorden in stukjes, zoals we hierboven hebben gezien. Met behulp van allerlei foefjes uit de informatica vergelijkt hij bovendien het te vinden woord met de woorden uit de woordenlijst. Om dat snelle en slimme zoeken mogelijk te maken, hebt u een heel moderne computer nodig en moet u wel heel veel belang hechten aan een juiste spelling. Bijvoorbeeld omdat u journalist, secretaresse of tekstschrijver bent: de makers zelf noemen hun programma een ‘professionele spellingcorrector’. Echt slim is het programma ondanks alles nog steeds niet. Dat komt doordat het misschien wel heel efficiënt kan zoeken in alle tot zijn beschikking staande lijsten, maar nog steeds geen zinnen kan ontleden en geen teksten kan begrijpen. En dat komt weer doordat, ondanks alle vooruitgang in de computerhardware, niemand er nog een idee van heeft hoe je een computer moet uitleggen hoe hij met net zo veel vernuft en inzicht met een tekst moet omgaan als een menselijke eindredacteur. Die laatste hoeft dus nog niet voor zijn baantje te vrezen. Nog steeds kan geen enkele automatische spellingcorrector bepalen of de zin ‘Word je moeder niet boos?’ wel goed gespeld is, omdat hij niet weet wat nu eigenlijk het onderwerp van die zin is. Zelfs of ‘wort nu eens slimmer’ nu wel of niet door de beugel kan, weet het programma niet te zeggen zolang het niet werkelijk begrijpt of je nu wel of niet over bier aan het schrijven bent. Van Dale spellingcorrector voor MS-Word. Prijs: f 119,- /Bfr. 2245 incl. BTW (stand-aloneversie). ISBN 90 6648 902 2. Meer informatie is te vinden op de weblocatie van Van Dale, http://www.vandale.nl/ Voorbeelden en technische informatie in dit artikel zijn gebaseerd op ‘Beter verbeteren. Slimme spellingchecker’ van Janneke Froon, Jurgen den Hartog en Johan Zuidema in Natuur & Techniek, december 1999. |
|