Woor-daf-bre-kin-gen
In het novembernummer van Onze Taal vraagt C.D. Goudappel zich af waarom er zoveel bizarre afbrekingen aan het eind van kranteregels staan. Hij zoekt het bij de zetters, maar uit de aard van de fouten maak ik op dat ze zijn veroorzaakt door een computerprogramma, dat de woorden aan het einde van een regel moet afbreken. Een aantal Nederlandse kranten gebruikt daarvoor mijn programma (gepubliceerd in ‘Exercises in Computational Linguistics’, Amsterdam 1970), of een verwaterde versie daarvan. De 26 verkeerde afbrekingen zijn in drie groepen te verdelen:
1) Twaalf woorden vertonen afbrekingen die zelfs het domste programma niet zou mogen maken. In negen daarvan bevat een der delen zelfs geen klinker meer; de andere drie zijn: bo-ycott, met-hode en Ob-rechtstraat.
2) Negen woorden vertonen afbrekingen waar zelfs het slimste programma moeite mee zou hebben. Mijn programma maakt dezelfde fouten. Vier woorden zijn samenstellingen waarvan het tweede lid met een klinker begint: alle-reerst, lan-darbeiders, ui-teindelijk, verkeers-lichte-ninstallatie; in de andere vijf woorden vormt de laatste letter van het eerste lid met de eerste letter (of in één geval: de eerste twee letters) van het tweede lid een uitspreekbare combinatie van twee (of drie) medeklinkers: die-plader, gas-theer, va-klieden, voorrang-spositie, en basi-sprogram. Aan dit soort fouten is weinig te doen zonder elders nieuwe fouten te veroorzaken (denk bij gas-theer bijvoorbeeld aan gas-thermometer).
3) Vijf woorden, tenslotte, zijn interessant. Uit drie ervan (bedrijf-sleven, raad-slid, verkeer-slichten) blijkt dat men de combinatie sl altijd als begin van een lettergreep neemt. Ons programma doet dat niet, maar splitst dan ook: arres-lee. De woorden omget-overd en West-endorp vertonen pogingen om samenstellingen met tweede lid -over of eerste lid West- goed te splitsen. Daar wij zulke problemen anders oplosten gaan deze vijf woorden in ons programma goed, maar er zullen ongetwijfeld andere fouten door ontstaan (zoals Wes-teuropees).
Samenvattend: twaalf van de 26 fouten zijn zeker vermijdbaar, vijf zijn met enige moeite te vermijden, maar negen blijven zich hardnekkig verzetten tegen automatische lettergreepscheiding.
Een verbeterde versie van het gepubliceerde programma maakt één fout op de 200 afgebroken regels; minder dan een zetter. Maar het zijn wel onmenselijke fouten!
H. Brandt Corstius