| |
| |
| |
[Nummer 6]
| |
| |
| |
Het boek der boeken nu ook digitaal
Oude bijbelvertalingen sinds kort op internet doorzoekbaar
Nicoline van der Sijs
Op 22 mei heeft Frits van Oostrom, voorzitter van de commissie Ontwikkeling Nederlandse Canon, tijdens een feestelijke bijeenkomst de digitale versie van de Statenvertaling uit-1637 geopend. Hoe is deze digitale teksteditie tot stand gekomen? Wat kunnen we ermee? En vooral: wat hebben in taal geïnteresseerden er preciesaan?
De Statenvertaling van 1637.
Archiefdienst Nederlandse Hervormde Kerk
De Gedenkschriften van Pieter Jelles Troelstra, De Ajacieden van Maarten de Vos, het Militair woordenboek van H.M.E Landolt, alle jaargangen van de Soester Courant - je kunt het zo gek niet bedenken of het staat integraal op internet, doorzoekbaar en wel. Des te vreemder is het daarom dat tot vorig jaar de Statenvertaling van de Bijbel uit 1637 niet digitaal beschikbaar was. Behalve dat die Statenbijbel een mijlpaal is in de geschiedenis van de Nederlandse bijbelvertalingen, heeft hij ongetwijfeld ook een rol gespeeld in de ontwikkeling van het Nederlands. In 2004 kozen de lezers van Onze Taal de Statenvertalers nog tot ‘invloedrijkste taalgebruikers van het Nederlands’.
Dat de oorspronkelijke Statenvertaling niet digitaal beschikbaar was, is trouwens niet helemaal waar; er was op internet wel een fotografische weergave van te vinden, maar die is niet doorzoekbaar, dus taalkundigen en andere onderzoekers hebben daar niet zo veel aan. Vorig jaar juni vond ik dat het zo niet langer kon. In de media riep ik vrijwilligers op om mee te helpen met het overtikken en verder digitaliseren van de Statenvertaling uit 1637. Dat omvangrijke handwerk was nodig omdat tekstherkenningssoftware niet uit de voeten kan met het moeilijk leesbare zeventiende-eeuwse drukwerk.
| |
■Uniek editieproject
De respons op de oproep was overweldigend. Er moest een wachtlijst worden ingesteld: meer dan 300 vrijwilligers meldden zich aan, van wie er uiteindelijk 135 aan de slag konden. De meer dan 1400 dichtbedrukte bladzijden werden in porties verdeeld. Nu, iets minder dan een jaar later, is de complete eerste editie van de Statenvertaling overgetikt, en dat is vervolgens grondig gecorrigeerd en van digitale codes voorzien.
Niet alleen de bijbeltekst is vanaf nu op internet beschikbaar (zie het kader op blz. 158 voor de adressen), maar ook alle inleidingen op de hoofdstukken en bijbelboeken, de kanttekeningen (met toelichtingen van de vertalers) en de omvangrijke registers. Bovendien kon wat inmiddels het ‘Bijbeldigitaliseringsproject’ heet, worden uitgebreid met andere laatmiddeleeuwse en vroegmoderne bijbelvertalingen, zoals de Delftse
| |
| |
bijbel uit 1477 - het oudste gedrukte Nederlandstalige boek -, de Leuvense bijbel uit 1548 en de Lutherse bijbel uit 1648. Andere bijbels zoals de Deux-Aesbijbel uit 1562 en de Liesveltbijbel uit 1526 zullen nog volgen. Tevens wordt er gewerkt aan een digitale versie van de tweede druk van de Statenvertaling uit 1657. Al met al een editieproject dat wat omvang en opzet betreft uniek is.
| |
■Profiteren
Voor wetenschappelijk onderzoek biedt deze digitale verzameling bijbels tal van nieuwe mogelijkheden. Met name het taalkundig onderzoek naar de geschiedenis van het Nederlands kan er enorm van profiteren. De bijbelvertalingen dateren uit de tweede helft van de vijftiende eeuw tot halverwege de zeventiende eeuw, een periode waaruit maar weinig tekstbestanden (oftewel ‘corpora’) beschikbaar zijn. Wat er wél is, zijn voornamelijk literaire teksten uit de eerste helft van de zeventiende eeuw. De verzameling bijbelteksten, het ‘bijbelcorpus’, vormt hier een welkome aanvulling op, en kan onze kennis van de ontwikkeling van de Nederlandse standaardtaal danig uitbreiden.
Wat kunnen we nu allemaal doen met zo'n corpus? Om te beginnen kunnen we gaan tellen. Hoeveel woorden staan er in de Statenvertaling? (Bijna 2,6 miljoen.) Hoeveel kanttekeningen? (Bijna 70.000.) Wat is de verhouding tussen de bijbeltekst en de kanttekeningen? (De kanttekeningen bevatten gemiddeld 2,5 keer méér woorden dan de bijbeltekst.) Welke woorden komen het meest voor? (Ende, de, van, het en in; zie voor de top-50 van meestgebruikte woorden www.onzetaal.nl/2008/06/bijbel.php.)
| |
■Hoofdtrefwoorden
Een volgende stap is om de verschillende woordvormen uit de bijbels te ‘lemmatiseren’; dat houdt in dat de woordvormen met behulp van een computerprogramma ondergebracht worden bij een hoofdtrefwoord, een lemma, precies zoals in woordenboeken gebeurt. Verbogen of vervoegde vormen (grijze; liep) worden geplaatst bij de onverbogen of onvervoegde vorm (grijs; lopen). Woordvormen uit oudere perioden worden meestal ondergebracht bij trefwoorden in moderne of gemoderniseerde spelling, zodat ze gemakkelijk aan bestaande woordenboeken kunnen worden gelinkt. Dus het oudere jeucht en jeugt worden ondergebracht bij het overkoepelende woord jeugd, en danckt, dancket en gedanckt komen onder danken.
Voor het automatisch lemmatiseren is het belangrijk om te weten hoe woorden in het bijbelcorpus in elkaar zitten, bijvoorbeeld hoe samenstellingen (vijgeboom, elpenbeen) of afleidingen (schaduwachtig, rechtveerdig) zijn gevormd. Als dit bekend is, kunnen deze namelijk automatisch herkend en ontleed worden. Een handig hulpje hierbij blijkt het koppelstreepje. Een voorbeeld: in de Statenvertaling komen veelvuldig samenstellingen voor met als tweede deel werck:
backers-werck; beddewerck; berchwerck; bolle-werck; bol-werck; cederwerck; dienst-werck; hantwerck; reuck-werck; roock-werck; wonderwerck; zijde-werck
Taalkundige Nicoline van der Sijs nam vorig jaar het initiatief tot digitalisering van de Statenvertaling (1637).
Foto: Fotostudio Maarten Koch
Veel van die woorden bevatten dus zo'n koppelstreepje. Als we kijken naar enkele van de langste woorden, zien we dat die ook allemaal gespeld worden met een of meer koppeltekens.
- | gevanckelick-wech-gevoerde |
- | honderdt-ende-sestighsten |
- | wilde-vijge-boomen-hout |
- | eewich-genaden-verbont |
- | krijchs-gereetschappen |
- | houwelicksch-geselchap |
- | over-al-tegenwoordige |
- | elpenbeenen-palleysen |
- | reysige-geselschappen |
- | schaduwachtige-boomen |
(zie voor de volledige top-25 van langste woorden www.onzetaal.nl/2008/06/bijbel.php)?
| |
| |
| |
De bijbels online
De gedigitaliseerde bijbels worden in verschillende vormen gepubliceerd op de websites van de Digitale Bibliotheek voor de Nederlandse Letteren (www.dbnl.org), het Instituut voor Nederlandse Lexicologie (www.inl.nl) en het Nederlands Bijbelgenootschap (www.bijbelsdigitaal.nl). De facsimile-afbeeldingen van de oorspronkelijke tekst, die gebruikt zijn voor het maken van de transcriptie, zijn te vinden op de website van het Nederlands Bijbelgenootschap.
Na het lemmatiseren weten we niet alleen hoeveel en welke woordvormen er in het bijbelcorpus zitten, maar ook hoeveel en welke verschillende woordvormen, en - bij samenstellingen en afleidingen - hoe die woordvormen zijn opgebouwd. En die kennis kan gebruikt worden voor verschillende toepassingen.
| |
■Spellingchecker
Op basis van de frequentie van woordvormen en lemma's in het bijbelcorpus kan er een spellingchecker of een spellinglijst worden samengesteld ter controle van weer andere teksten uit de vijftiende, zestiende en zeventiende eeuw, en als hulpmiddel bij het scannen van teksten uit die periode.
Scanprogramma's zoals het veelgebruikte Abby Finereader ‘lezen’ namelijk gescande tekst letter voor letter en interpreteren deze naar bestaande woorden. Dat gebeurt door het instellen van een ‘herkenningstaal’. Zo kan men momenteel kiezen voor de herkenningstaal Nederlands, maar nog niet voor de herkenningstaal Nederlands van de vijftiende en zestiende eeuw. Dankzij het bijbelcorpus zal dit op termijn mogelijk worden. Het instellen van de juiste herkenningstaal is belangrijk, want in combinatie met de frequentie van lettercombinaties en woordvormen wordt het mogelijk om leesfouten te voorkomen of te corrigeren: arcke (‘ark’) is in tegenstelling tot bijvoorbeeld amke een bestaand woord. Als de computer arcke bij het letter-voor-letter-lezen per ongeluk toch denkt te herkennen als amke, kan dat gecorrigeerd worden doordat dat laatste woord niet in het corpus voorkomt, en arcke wel.
Nadat de woorden uit het bijbelcorpus gelemmatiseerd zijn, kan verder ook bekeken worden of ze voorkomen in de bestaande woordenboeken, zoals het Woordenboek der Nederlandsche Taal (WNT). Ik durf zonder nader onderzoek al te stellen dat zal blijken dat diverse woorden in het WNT ontbreken. De beschrijving van de Nederlandse woordenschat uit de vijftiende en zestiende eeuw vertoont namelijk forse lacunes: het Middelnederlandsch Woordenboek eindigt in de vijftiende eeuw en het WNT begint zo rond 1550: deze woordenboeken sluiten niet netjes op elkaar aan, en er bestaan geen goede periodewoordenboeken van de vijftiende en zestiende eeuw. Hier is dringend behoefte aan, zeker nu er steeds meer teksten op internet beschikbaar komen die gelezen worden door mensen zonder specifieke historisch-taalkundige kennis.
Dankzij de digitale Statenvertaling kan worden onderzocht welke woorden in de woordenboeken ontbreken.
| |
■Afwijkend?
Illustratie: Matthias Giesen
Het archaïsche taalgebruik van de Statenvertaling, de zogenoemde tale Kanaans, is beroemd en berucht tegelijk. In de lezing die Joop van der Horst hield bij de presentatie van de digitale Statenvertaling, stelde hij de prikkelende vraag in hoeverre de Statenvertaling eigenlijk wel representatief is voor het Nederlands van de zeventiende eeuw. Die vraag was tot nu toe niet te beantwoorden, maar dankzij de digitalisering wordt dat anders. Om te beginnen kan men via de website van het Instituut voor Nederlandse Lexicologie (www.inl.nl) de concordantie van woorden opvragen, dat wil zeggen een lijst van alle bijbelplaatsen, met context, waarin het bewuste woord voorkomt.
En dankzij de literaire teksten die op de website van de Digitale Bibliotheek voor de Nederlandse Letteren (www.dbnl.org) te vinden zijn, kunnen we van opvallende uitdrukkingen in de Bijbel gaan bekijken of zij óók voorkomen in
| |
| |
de literaire werken uit die tijd. Is dat niet het geval, dan kunnen we voorzichtig stellen dat het bijbelse taalgebruik in dit opzicht afwijkt van het toenmalige literaire taalgebruik.
Zo staat in de Statenvertaling de uitdrukking tot bela(c)ching(e) worden voor ‘belachelijk worden’. Enkele voorbeelden:
- | So sal Moab [met de handen] klappen in sijn uytspousel, ende hy selfs sal oock ter belacchinge zijn. |
- | Want en is u niet Israël [ter] belacchinge geweest? |
- | Ick ben allen mijnen volcke tot belacchinge geworden, haer snarenspel den gantschen dach. |
- | Een materie van belacchinge ende bespottinge. |
- | Ghy sult den beker uwer suster drincken, die diep ende wijt is: ghy sult tot belacchinge, ende spot worden; [de beker] houdt veel in. |
- | Ende de Princen sullen hem een belacchinge zijn: hy sal alle vestinge belacchen, want hy sal stof vergaderen, ende hy salse innemen. |
- | Alsoo sal Moab allen, die rontom hem zijn, tot belachinge ende tot eene ontsettinge worden. |
In literaire teksten uit die periode is deze uitdrukking niet te vinden. In latere tijden wordt ze wél in literaire werken gebruikt, maar dat zal dan onder invloed van de Statenvertaling zijn gebeurd. Inmiddels is de uitdrukking in de vergetelheid geraakt. Als we op deze manier systematisch gaan onderzoeken of uitdrukkingen, woorden en zinsconstructies in het bijbelcorpus ook voorkomen in literaire teksten uit dezelfde of latere tijd, dan kunnen we op termijn de vraag van Van der Horst nauwkeuriger beantwoorden, en tegelijk genuanceerde uitspraken doen over de invloed van de taal van de Statenbijbel op het Nederlands.
Een belangrijke bron van taalhistorische informatie vormen ook de kanttekeningen, waarin de Statenvertalers vaak uitvoerig toelichten waarom zij voor bepaalde woorden hebben gekozen.
| |
■Vergelijkingsmateriaal
Uiterst interessant voor zowel taalkundig als theologisch onderzoek is de mogelijkheid die de website van het Nederlands Bijbelgenootschap (www.bijbelsdigitaal.nl) biedt om de verschillende bijbelvertalingen naast elkaar te zetten en met elkaar te vergelijken. Oordeelt u zelf maar: in het kader hiernaast staan de eerste verzen uit Genesis 1 in een aantal oude bijbelvertalingen.
Nu de verschillende bijbelvertalingen met elkaar kunnen worden vergeleken, kan er een beter antwoord worden gegeven op de vraag in hoeverre de vertalingen schatplichtig zijn aan elkaar. Kijk bijvoorbeeld eens naar Genesis 42:21, waarin de broeders van Jozef naar Egypte komen. In de Delftse bijbel, die relatief weinig leenwoorden gebruikt, staat hier het opvallende woord tribulacie (‘ellende’): ‘hier om is dese tribulacie op ons ghecomen’. In de Leuvense bijbel uit 1548 staat dat woord er ook: ‘daerom es dese tribulatie op ons comen’. De Leuvense bijbel volgt hier dus de Delftse bijbel. Dat geldt niet voor de Statenvertaling uit 1637, want deze heeft het leenwoord vervangen door een Nederlands woord: ‘daerom komt dese benautheyt over ons’.
De eerste resultaten van speurwerk in het bijbelcorpus bewijzen al dat onderzoekers er nog veel plezier aan kunnen beleven, en dat het materiaal ook praktische toepassingen in woordenboeken en woordenlijsten kan krijgen. Het bijbeldigitaliseringsproject zal waarschijnlijk in de loop van volgend jaar voltooid zijn. En dat alles is - het kan niet genoeg benadrukt worden - te danken aan de onbetaalde inspanningen van een grote groep vrijwilligers.
| |
In den beginne
Genesis 1:1-5 in een aantal oude bijbelvertalingen:
| |
Delftse bijbel uit 1477:
1 | Inden beghin sciep god hemel ende aerde. |
2 | Mer die aerde was onnut ende ydel: ende donckerheden waren op die aensichten des afgronts. Ende goods gheest was ghedraghen bouen den wateren. |
3 | Ende god seide dat licht moet werden: ende dat licht wort ghemaect. |
4 | Ende god sach dat licht dattet goet wesen zoude: ende hi sceide dat licht van die donckerheden. |
5 | Ende hi noemde tlicht den dach. ende die donckerheden die nacht Ende het wort ghemaect tsauonts ende tsmoghens enen dach. |
| |
Leuvense bijbel uit 1548:
1 | Inden beginne heeft Godt geschapen hemel ende aerde, |
2 | maer die aerde was ydel ende ledich, ende die duysternissen waren op dat aenschijn des afgronts, ende den gheest Godts dreef op die wateren. |
3 | Ende Godt heeft geseyt, Laet gemaect worden het licht. Ende het licht worde gemaect, |
4 | ende Godt heeft dat licht ghesien dat goet was, ende hy heeft dat licht van die duysternisse gescheyden, |
5 | ende hy heeft dat licht genoemt dach, ende die duysternissen nacht, ende es gheworden auont ende morgen eenen dach. |
| |
Statenvertaling uit 1637:
1 | Inden beginne schiep Godt den Hemel, ende de Aerde. |
2 | De Aerde nu was woest ende ledich, ende duysternisse was op den afgront: ende de Geest Godts sweefde op de Wateren. |
3 | Ende Godt seyde: Daer zy Licht: ende daer wert Licht. |
4 | Ende Godt sach het Licht, dat het goetwas: ende Godt maeckte scheydinge tusschen het Licht, ende tusschen de duysternisse. |
5 | Ende Godt noemde het Licht Dach, ende de Duysternisse noemde hy Nacht: Doe was 't avont geweest, ende 't was morgen geweest, de eerste Dach. |
| |
Lutherbijbel uit 1648:
1 | In 't begin schiep Godt Hemel ende Aerde. |
2 | Ende de aerde was woest ende ledigh, ende het was duyster op de diepte, ende de Geest Godts sweefde op 't water. |
3 | Ende Godt sprack: Het worde licht. Ende het wiert licht. |
4 | Ende Godt sach, dat het licht goetwas: doe scheyde Godt het licht van de duysternisse. |
5 | Ende noemde het licht dagh, endede duysternisse nacht. Doe wiert uyt avont ende morgen de eerste dagh. |
|
|