| |
| |
| |
De spelling onder controle?
Waarom de spellingcorrector niet altijd doet wat we willen
Theo van den Heuvel - Polderland Language & Speech Technology
Tekstverwerkers als Microsoft Word bieden de mogelijkheid tot spellingcontrole en automatische correctie. Maar dat gaat niet altijd goed. In 2001 nodigden we de lezers van Onze Taal uit om hun hart te luchten. Wat vindt het bedrijf Polderland, de maker van de Nederlandse spellingmodule van Word, van uw klachten?
Niet iedereen is altijd even blij met de spellingchecker van tekstverwerkingsprogramma's. Dat bleek wel uit de reacties die binnenkwamen op de oproep die Onze Taal twee jaar terug deed om ‘Word-leed’, oftewel talige uitglijders van Word, te melden. Al die inzenders denken waarschijnlijk dat de tekstverwerker Word in Amerika wordt ontwikkeld, bij het bedrijf Microsoft. Dat is gedeeltelijk waar, maar voor de onderdelen waarbij er een andere taal dan het Engels gebruikt wordt, heeft Microsoft aparte bedrijven ingeschakeld. Die bedrijven krijgen de opdracht onder strikte beperkingen een deel van het programma te schrijven, dat als het ware ingeplugd kan worden in het grote programma. Voor Nederland worden de spellingcontrole en de grammaticacontrole gemaakt door Polderland Language & Speech Technology. Deze ‘proofing tools’, zoals ze officieel heten, worden dan meteen toegepast in alle producten van Microsoft Office: de spellingcontrole in Word is precies dezelfde als die in bijvoorbeeld PowerPoint of Access.
| |
Kringeltjes
Waaraan ergerden de inzenders zich zoal? De kringetjes die Word onder de niet door hem herkende woorden zet, blijken soms tot irritatie te leiden. Allereerst vanwege de kleur. Zo zien de meeste kleurenblinden geen verschil tussen de groene golfjes van de grammaticacontrole en de rode van de spellingcontrole. En veel mensen associëren rood met fout, en groen met goed. Dat is inderdaad allebei niet de bedoeling: het kringeltje moet alleen aangeven dat Word iets bijzonders signaleert. De kleuren zijn helaas niet te veranderen, niet door u en niet door ons - het is iets wat in Amerika wordt geprogrammeerd.
Maar het zijn vooral de ten onrechte geplaatste kringeltjes die veel reacties teweegbrengen. Het irriteert veel gebruikers dat ze door de spellingcontrole op de vingers getikt worden, terwijl het juist de computer is die er een potje van maakt door naast de goede oplossing te grijpen. Anderen beklagen zich juist weer over onzinwoorden en spelfouten die goedgekeurd worden. Kan dat nou echt niet beter? Om die vraag te beantwoorden, moeten we iets dieper ingaan op de werkwijze van de programmatuur.
De spellingcontrole kijkt alleen maar naar de individuele woorden en legt geen verbanden tussen de woorden in de zin. Dat maakt het voor het programma veel gemakkelijker, maar het is tegelijkertijd een wezenlijke beperking. Een voorbeeld: u tikt ‘Dat gebeurd maar al te vaak.’ De spellingcorrector zal de fout niet opmerken, omdat gebeurd weliswaar in deze zin gebeurt moet zijn, maar wel een bestaand woord is. Of u verwisselt per ongeluk de s en de t in kisten, en de corrector keurt kitsen goed als meervoud van kits (‘klokhuis’). Niets aan te doen. Omdat de spelingcorrector de woorden een voor een afwerkt, is er geen enkele manier waarop deze fouten gesignaleerd kunnen worden.
| |
Woordenschat
De belangrijkste basis voor de spellingcorrector is de officiële woordenlijst in het Groene Boekje. Daar staan echter alleen basiswoorden in (dus wel werken maar niet werkt of werkten). Bovendien bevat de lijst | |
| |
maar zo'n 125.000 ingangen. Dat is bij lange na niet genoeg voor een tekst met een normale moeilijkheidsgraad.
Dat probleem is groter dan het lijkt. Het is niet eens zo moeilijk om al die woordvormen zoals werkt af te leiden uit de woordenlijst (al krijg je dan ook gekke vormen zoals veelt van het werkwoord velen, dat alleen in de uitdrukking iets niet kunnen velen voorkomt), maar daarmee zijn we er niet.
De gemiddelde schrijver gebruikt heel wat woorden die niet in het Groene Boekje voorkomen, bijvoorbeeld buitenlandcorrespondent of dropliefhebber. Dat komt doordat het Nederlands veel vrijheid biedt om nieuwe woorden samen te stellen uit oude. Dit mechanisme is typisch voor het Nederlands en andere Germaanse talen, zoals Duits en Zweeds. Als u vanavond in een dappere bui een maaltijd van drop probeert te bereiden, dan is het resultaat, op zijn best, een ‘dropschotel’. Vindt u dat een mogelijk woord? Wilt u dat uw spellingcorrector u voor dit woord waarschuwt? Het zou toch heel irritant zijn als die dergelijke samenstellingen steeds zou aanstrepen. Teksten zouden vol komen te staan met rode kringeltjes. Daarom bekijkt de spellingcorrector bij ieder onbekend woord of het niet ook een combinatie van bestaande woorden kan zijn. En dat heeft helaas zo z'n nadelen. Wilt u kameel schrijven en tikt u per ongeluk kamedel, dan zal de spellingcorrector dat niet signaleren, omdat het resultaat een weliswaar onwaarschijnlijke maar geldige combinatie is van het zelfstandig naamwoord kam en het bijvoeglijk naamwoord edel (vergelijk vuurrood). Er is tot nu toe geen enkele methode bekend om de waarschijnlijkheid van zo'n combinatie te bepalen.
| |
Remedies tegen Word-leed
1. Nummer één in de ergernissen-top-tien is de ‘autocorrectie’, die tijdens het typen al uit zichzelf veranderingen aanbrengt. Erg handig voor slordige typers, maar soms hinderlijk. De standaardinstelling is namelijk maar een compromis; u zult die insteling vrijwel zeker moeten aanpassen. Hoe doet u dat?
- | In de ‘Word-leed’-oproep van Onze Taal kwam de letter ij aan het begin van de zin ter sprake. Autocorrectie maakt daar Ij van (Ijsselmeer). Om dit te voorkomen, kunt u het beste via ‘Extra’ > ‘AutoCorrectie’ de optie ‘TWee beginhoofdletters corrigeren’ uitschakelen. |
- | Maakt u vaak dezelfde typefout? Tikt u steeds toesten in plaats van toetsen? Kies dan ‘Extra’ > ‘AutoCorrectie’ en neem de correctie op in de lijst ‘Vervangen door’. Gaat voortaan altijd goed. |
- | Hoewel de spellingcorrector voor Word dezelfde is als die voor PowerPoint, zult u voor de twee pakketten vaak verschillende autocorrectie-voorkeuren hebben. Zo is de optie ‘Zinnen met hoofdletter beginnen’ in PowerPoint meestal hinderlijk. Zet die optie dan gewoon tijdelijk uit. |
2. Ook al doet de spellingcorrector soms rare suggesties, het kan een heel handig hulpmiddel zijn bij spellingonzekerheid. Weet u niet meer hoe het nu ook alweer zat met de accenten en trema's in crème, après-ski of aperçu? Tik dan gewoon creme, apresski en apercu in, klik de kringeltjes met de rechtermuisknop aan en volg de eerste suggestie.
3. Behandel uw spellingcorrector als een werknemer met beperkte capaciteiten. U kunt hem ontslaan als u niet tevreden bent, maar u kunt ook, rekening houdend met zijn beperkingen, zo goed mogelijk gebruikmaken van zijn diensten. Híj zal nooit geïrriteerd raken.
| |
Denkwerk
Door de vele mogelijke combinaties van woorden gebeurt het dus relatief vaak dat de spellingcorrector een fout niet opmerkt. Maar ergerlijker blijken de gevallen waarin het programma een woord onderstreept dat helemaal niet fout is. Dat is meestal het geval bij eigennamen als IJsselmeer of Erasmus. De spellingcorrector heeft geen ingebouwd ‘Groen Boekje’ voor eigennamen. Dat zou trouwens nog niet eens zo eenvoudig zijn, want de lijst met alle mogelijke eigennamen is nog groter dan de lijst met mogelijke woorden; denk alleen maar eens aan teksten met buitenlands nieuws. Maar buiten die eigennamen zijn er ook veel gevallen waarin het resulterende woord niet te herleiden is tot een combinatie van bekende woorden (allesdoeners, vierogig). Dan pas begint het echte denkwerk: de spellingcorrector zal de onbekende woorden proberen te ‘corrigeren’. Dat wil zeggen: hij probeert er met zo min mogelijk veranderingen een bestaand woord van te maken. Zo kan van hebbben gemakkelijk hebben gemaakt worden door een b weg te laten. Op diezelfde manier zou Word onder meer het voor hem onbekende IJsselmeer veranderd willen zien in IJskelder, Erasmus in Grasmus, allesdoeners in flesopeners en vierogig in verhoging.
Illustratie: Jean-Marc van Tol
Bij die veranderingen probeert het programma overigens wel rekening te houden met de klanken van het Nederlands. Zo is de vervanging van ei door ij (of andersom) logisch, omdat beide lettercombinaties dezelfde klank kunnen weergeven. Hetzelfde geldt in het algemeen voor c en k, en voor g en ch. Daarom | |
| |
wordt een fout als reimen door de spellingcontrole goed gecorrigeerd in rijmen, terwijl er voor de correctiesuggestie remmen strikt genomen minder veranderingen nodig zouden zijn.
| |
Het leukste uit ‘loos alarm’
In de rubriek ‘Loos alarm’ uit de jaargangen 2001-2002 van Onze Taal signaleerden de lezers van Onze Taal grappige suggesties die de spellingcorrector verzon bij namen. Een greep uit de aardigste inzendingen:
Bill Gates |
Bil Gajes |
Erasmus |
Grasmus |
Johan Cruijff |
Ohaën Druif |
Willem Alexander |
Wielklem Oleander |
Ronald Koeman |
Tonale Boeman |
Jeroen van Inkel |
Beroven van Winkel |
Blair |
Flair |
George Bush |
Geoorde Push |
Joling |
Jolig |
Guus Hiddink |
Geus Uitdrink |
Hoe komt het programma bij al die gekke suggesties? Zoals u zelf kunt nagaan, verschillen de meeste alternatieven maar in één of twee letters van de originelen. Bijvoorbeeld, om Oleander te maken van Alexander hoef je alleen de eerste letter in een O te veranderen, en de x weg te laten.
Maar hoe zit het dan met Koeman? Dat is toch een mogelijke samenstelling van koe en man, en samenstellingen van twee bestaande woorden keurt de spellingcontrole toch altijd goed? Jawel, maar een samenstelling met koe en man zou eigenlijk koeienman moeten luiden (die wordt dan ook niet gecorrigeerd).
| |
Grammaticacontrole
In dit artikel gaat het alleen over de rode kringeltjes van de spellingcontrole en niet over de groene van de grammaticacontrole. Dat is omdat grammaticacontrole veel ingewikkelder in elkaar zit, en dus ook veel lastiger is om uitte leggen. Een klein voorbeeld kan dat duidelijk maken. Neem de eenvoudige zin ‘Die blokken brandden slecht.’ Om deze zin op grammatica te controleren moetje om te beginnen al weten wat het werkwoord is. Is dat blokken, brandden of slecht? Dat is makkelijk, zult u zeggen, want brandden is duidelijk een werkwoordsvorm. Maar pas op: misschien is brandden wel een spelfout (per ongeluk twee d's). Vervolgens moetje het onderwerp bepalen. Is dat die, die blokken of branden (als brandden toch een spelfout is)? En als het die is, is dat dan enkelvoud of meervoud? Geen wonder dat de grammaticacontrole zijn suggesties vaak heel voorzichtig formuleert (‘Als dit het onderwerp is van dat, komen onderwerp en persoonsvorm niet overeen in persoon/getal’).
| |
Officieel of persoonlijk
De Nederlandse spellingcorrector is gebaseerd op de officiële norm. Dat kan in Nederland en Vlaanderen, omdat de spelling gereguleerd is. Dat is niet in alle landen zo. In die gevallen zal de spellingcorrector een statistische benadering kiezen, waarbij de meest voorkomende spellingvariant de norm wordt. Het is op het eerste gezicht misschien geen slecht idee om zo'n statistische benadering ook voor de Nederlandse corrector in te schakelen. Onder het motto ‘de meeste stemmen gelden’ zou het programma altijd de meest gebruikte variant aanbevelen. Dat heeft echter als nadeel dat hardnekkige spelfouten als geüpdate in plaats van geüpdatet, en pannekoek zonder tussen-n onmiddellijk gelegitimeerd zouden worden. Daarom kiest het Nederlandstalige Word alleen voor het motto ‘volg de leider’: in alle gevallen geldt een officiële norm.
Voor wie er behoefte aan heeft, zijn er wel mogelijkheden om de spellingcorrector te voorzien van persoonlijke instellingen. Zo kunt u als gebruiker indien gewenst spellingvarianten als produkt, bizonder en text aan uw persoonlijke woordenlijst toevoegen, en tevens een aantal opties in- of uitschakelen (zie kader ‘Remedies tegen Word-leed’). Die mogelijkheid is er met alleen voor de eigenwijze speller, maar vooral ook voor mensen met een specifiek jargon. Voor een aantal groepen van dergelijke gebruikers zijn er zelfs aparte varianten van de spellingcontrole verkrijgbaar. Zo kunt u een versie kopen die vol zit met medische terminologie. Daarmee kunt u tenminste zonder hinderlijke rode kringeltjes op het scherm een brief aan uw huisarts opstellen waarin u de gevolgen beschrijft van het eten van te veel dropschotel.
|
|