Verslagen en mededelingen van de Koninklijke Academie voor Nederlandse taal- en letterkunde. Jaargang 2001
(2001)– [tijdschrift] Verslagen en mededelingen van de Koninklijke Academie voor Nederlandse taal- en letterkunde– Auteursrechtelijk beschermd
[pagina 393]
| ||||
Drie segmenteringsaspecten met betrekking tot de opbouw van een corpus van oude teksten (in casu 14de-eeuwse oorkonden).
| ||||
1. De ruimtelijke dimensieHet spreekt vanzelf dat naar een zo evenwichtig mogelijke ruimtelijke spreiding van 14de-eeuws oorkondenmateriaal gestreefd moet worden. M.b.t. de ruimtelijke distributie wil ik allereerst het volgende nogal principiële punt aansnijden: moeten we uitgaan van een punctualistisch (1 plaats = 1 meetpunt) of een vlakkenmatig kaartbeeld? In dit verband is het interessant erop te wijzen dat in de twee atlasachtige publicaties over het 13de-eeuwse Nederlands elk van beide concepten al gebruikt is: het punctualisti- | ||||
[pagina 394]
| ||||
sche door Berteloot (1984)Ga naar voetnoot2 en het vlakkenmatige door Mooijaart (1992).Ga naar voetnoot3 Op de tweede is er meer kritiek geuit dan op de eerste.Ga naar voetnoot4 Welke overwegingen brachten Mooijaart ertoe het vlakkenconcept toe te passen? In eerste instantie deed zij dat omdat sommige documenten niet met zekerheid lokaliseerbaar waren (althans niet in één bepaalde plaats, wel in een regio). Verder was er ook een statistisch motief: door de zeer ongelijke ruimtelijke verdeling van de beschikbare teksten zouden er op de kaart(en) grote witte vlekken ontstaan zijn, vandaar haar toevlucht tot ruime gebieden met liefst een behoorlijke stad erbij met een (vrij) grote tekstproductie. Ten slotte argumenteerde ze dat je door van grote(re) ruimtelijke entiteiten te vertrekken, de relatieve inbreng van de individuele schrijvershand (en de daarmee soms samenhangende vertekeningen) kon verminderen. Puur linguïstisch/dialectologisch is die werkwijze echter niet wenselijk. Ik bespreek hier slechts kort mijn twee belangrijkste bezwaren.
| ||||
[pagina 395]
| ||||
De vlakkenindeling bij Mooijaart is ongetwijfeld in eerste instantie ingegeven door de erg ongelijkmatige, lacuneuze ruimtelijke spreiding van de 13de-eeuwse teksten. Voor de 14de eeuw zijn er echter veel meer teksten en ze zijn ook al veel beter gespreid in de ruimte. Op grond van deze overwegingen lijkt het ons voor het 14de-eeuwse oorkondencorpus wenselijk dat van het werken met grote vlakken als geografische cellen afgezien wordt. Ons staan veeleer eenplaatsige meetpunten (doorgaans steden) of steden met hun onmiddellijk ommeland of uitzonderlijk ook wel eens een concentratie van steden (b.v. de Denderstreek met Dendermonde, Aalst, Ninove en Geraardsbergen) voor de geest. Wij verwerpen dus niet helemaal het vlakkenconcept maar wensen er enkel kleinschalig gebruik van te maken. | ||||
[pagina 396]
| ||||
We streven dus best naar een zo gelijkmatig mogelijke spreiding van onze geografische cellen. Daarbij dient zeker op een evenwichtige west/oost-spreiding gelet te worden, omdat de oudste en diepste tegenstellingen een west/oost-karakter hebben (en dus zeker ook al in het 14de-eeuwse taallandschap heel nadrukkelijk aanwezig waren). Terwille van de haalbaarheid denken wij concreet aan een 25 à 30 ruimtelijke cellen. Die worden echter best niet a priori afgebakend. Het lijkt ons verkieslijker inductief te werk te gaan: in een eerste verkenningsronde worden van alle plaatsen de oorkonden geïnventariseerd en vervolgens worden maximum 25 à 30 cellen of meetpunten in de bovengenoemde zin aangeduid. In een volgende fase moet dat ruimtelijke net geconfronteerd worden met de ‘Belgische’ oorkonden in het Amsterdamse corpus van 14de-eeuwse oorkonden van Van Reenen. Volgens de laatste stand van zakenGa naar voetnoot8 is dat corpus precies voor de zuidelijke gebieden nog erg lacuneus. Prioritair zullen dus de heel opvallende ruimtelijke lacunes in dat corpus opgevuld moeten worden. Zonder erg in detail te treden geef ik hieronder een bondig overzicht van het Amsterdamse materiaal:
| ||||
[pagina 397]
| ||||
Wij vatten nog even ons voorstel samen: na een eerste ronde van zo grondig mogelijke inventarisering van 14de-eeuwse oorkonden bakenen we ongeveer 25 ruimtelijke cellen (meetpunten in de ruime zin) af die zo gelijkmatig mogelijk gespreid zijn over het hele gebied. Daarna wordt nagegaan in hoeverre die cellen al gevuld zijn via het Amsterdamse corpus. De overblijvende lacunes dienen dan zo goed mogelijk opgevuld te worden. | ||||
2. De temporele gelaagdheidEen eeuw is lang. Als we uitzicht willen krijgen op bepaalde evoluties/verschuivingen, dan moeten we de 14de eeuw gaan segmenteren. Hierbij dienen zich twee mogelijkheden aan: ofwel laten we die segmentering afhangen van taalextrinsieke feiten en gebeurtenissen die echter ook een invloed gehad kunnen hebben op de schrijfcultuur en op schrijftradities (b.v. de grote pestepidemieën omstreeks 1350 of de machtsovername door de Bourgondische hertogen in het laatste kwart van de 14de eeuw), ofwel delen we de 14de eeuw op in vier kwartieren (wat ongeveer overeenkomt met een generatie). Die tweede werkwijze is bij nader inzien behoorlijk verzoenbaar met de eerste invalshoek, want de periode van de Zwarte Dood valt ongeveer samen met de overgang van het tweede naar het derde kwartier en het aantreden van de Bourgondische hertogen valt in het vierde kwartier. Misschien zullen in het eerste en mogelijk ook het tweede kwartier nog een aantal geografische cellen ondervertegenwoordigd zijn, maar naar het einde van de 14de eeuw wordt die kans vrij klein. In dat geval dient het motto te luiden: ‘roeien met de riemen die je hebt’. Het hoeft geen ramp te zijn als een paar geografische cellen voor een bepaald kwartier onvoldoende opgevuld kunnen worden. In geografische cellen met een grote oorkondenproductie | ||||
[pagina 398]
| ||||
verdient het m.i. ook aanbeveling de teksten vooral te kiezen uit het centralere deel van elke kwarteeuw (b.v. 1305-1315, 1330-1340, 1355-1365 en 1385-1395). | ||||
3. Het individuele aspectTe overwegen valt ook een diversifiëring van het corpus volgens schrijvende individuen, de zogenaamde handen. Op dat vlak stellen we het volgende voor: als je voor een bepaalde geografische cel en in een bepaalde kwarteeuw een ruime keuze aan teksten hebt, moet je je subcorpus ook qua handen proberen te diversifiëren. Concreet lijken vier verschillende scribenten ons een behoorlijk compromis tussen het ideale (nl. alle handen) en het haalbare. | ||||
4. Ter afrondingAl wat hierboven voorgesteld werd, komt neer op een scenario met 100 cellen: 25 meetpunten maal 4 kwarteeuwen. Als we per cel een maximaal tekstvolume van acht bladzijden (liefst van vier verschillende handen) nastreven, zou het hele corpus 800 bladzijden tekst opleveren. Het lijkt me geen sinecure om in een tijdspanne van twee jaar zo ver te geraken maar gelukkig is er al het vele voorwerk van onze Amsterdamse collega's. |
|