Forum der Letteren. Jaargang 1963
(1963)– [tijdschrift] Forum der Letteren– Auteursrechtelijk beschermd
[pagina 94]
| |||||||||
Glottochronologie en lexicostatistiekDaar de termen glottochronologie en lexicostatistiek beide gebruikt worden voor een wijze van taalkundig onderzoek, die eerst na de Tweede Wereldoorlog is opgekomen, zodat ze in hun huidige betekenis zeer recent mogen worden genoemd, kan het zijn nut hebben, alvorens de problemen, die met de genoemde wijze van onderzoek verband houden, te bespreken, na te gaan wat met deze twee woorden wordt bedoeld. Glottochronologie wil eigenlijk niets anders zeggen dan: studie van de taalgeschiedenis als een opeenvolging van gebeurtenissen. Zulk een studie wordt reeds lang bedreven, eigenlijk al sedert de opkomst der historisch-comparatieve methode in de vorige eeuw. De term is echter nieuw: hij is pas een tiental jaren oud. Nu kan chronologie topologisch zijn, nl. wanneer de gebeurtenissen ten opzichte van elkaar in chronologische volgorde worden geplaatst, maar ook chronometrisch. In het laatste geval worden ook de tijdsafstanden bepaald, die de gebeurtenissen onderling en van het heden scheiden. Van oudsher is de taalchronologie in hoge mate topologisch geweest; chronometrie was alleen daar mogelijk, waar historische gegevens van buiten de linguïstiek een datering van gebeurtenissen mogelijk maakten. Pas in de laatste tijd is men gaan zoeken naar een chronometrische methode, die zonder van niet-linguïstische gegevens gebruik te maken en dus alleen van de taalfeiten uitgaande het vaststellen van jaartallen mogelijk maakte, waarmede de taalkundige op zijn beurt de vondsten van historie, prehistorie en archeologie zou kunnen aanvullen. Het ging dus om ‘a technique which attempts to provide dates for the earlier stages of languages much as carbon-14 dating provides dates for archaeological finds’, zoals de Amerikaanse linguiste Sarah Gudschinsky het uitdrukteGa naar eind1.. Om dit doel te bereiken maakte men gebruik van de lexicostatistiek. Onder deze term verstaat men het statistisch vergelijken van het woordbezit van talen of dialekten, waarbij men nagaat het percentage der gemeenschappelijke woorden, d.w.z. men legt de woordenschat van telkens twee talen naast elkaar en telt het aantal gevallen, waarin de twee talen hetzelfde woord (in historische zin, dus een verwant woord) hebben, waarna men ziet, hoeveel procent der vergeleken woordparen gevallen van verwantschap hebben opgeleverd. Nu kan men, zoals duidelijk is, zeer wel lexicostatistiek bedrijven zonder chronologische oogmerken, zoals men natuurlijk ook taalchronologie kan beoefenen zonder van lexicostatistiek gebruik te maken. Maar zodra men chronometrische resultaten tracht te bereiken met behulp van | |||||||||
[pagina 95]
| |||||||||
statistische studie van het vocabulaire, zijn beide woorden - glottochronologie en lexicostatistiek - van toepassing en worden ze doorelkaar gebruikt. In de praktijk wordt hun betekenis zelfs tot dit nauw afgegrensde gebied beperkt, dat tevens het onderwerp van dit artikel is. De stoot tot de glottochronologische theorie werd gegeven door de Amerikaanse linguïst Morris Swadesh. Deze stelde zich op een gegeven ogenblik de vraag, of het niet mogelijk zou zijn een objectief criterium te vinden voor taalverwantschap. Iedereen was het er toch allang over eens, dat men talen verwant mocht noemen, d.w.z. als afkomstig van één gemeenschappelijke moedertaal beschouwen, als ze een bepaalde mate van overeenkomst vertoonden, maar nooit was er een concreet antwoord gegeven op de vraag, hoe groot die overeenkomst dan wel zou moeten zijn of waaraan men de grootte van de overeenkomst zou kunnen meten. Een van de allereerste faktoren, die daarbij zouden moeten worden uitgeschakeld, is die van het toeval. Hierbij kan de hulp van de waarschijnlijkheidsrekening worden ingeroepen, waarmede men de meestal gevolgde impressionistische benadering omzeilt. Een belangwekkende studie in deze richting werd gedaan door de Zweed Collinder, die de Ural-Altaische hypothese testte op een aantal pronomina en suffixen en tot de conclusie kwam, dat de gevonden overeenkomsten zeer veel talrijker waren dan uit het toeval verklaard kon wordenGa naar eind2.. Maar al is het toeval uitgesloten, dan nog is verwantschap niet de enig mogelijke conclusie, daar de overeenkomsten ook het gevolg zouden kunnen zijn van ontlening en van ‘Elementarverwandtschaft’. Deze faktoren nu trachtte Swadesh uit te sluiten door het onderzoek te beperken tot dat deel van de woordenschat, dat betrekking heeft op de meest elementaire begrippen, zoals lichaamsdelen, eenvoudige levensverrichtingen als eten, drinken, slapen, begrippen uit de natuur als zon, maan, regen, wind, water, enkele telwoorden, persoonlijke voornaamwoorden enz. De ervaring had immers geleerd, dat in dit deel van de woordenschat ontlening het minst pleegt voor te komen, terwijl het ook niet moeilijk was al die begrippen, waarvan men - alweer op grond van ervaring - wist dat ze gevallen van ‘Elementarverwandtschaft’ konden opleveren, uit te sluiten. Toen Swadesh zover gekomen was met zijn onderzoek naar het kwantitatief bewijs voor genetische verwantschap, maakte hij de sprong naar de chronometrie. Hij ging daarbij uit van een vroeger door Edward Sapir gedane uitspraak, luidende: Hoe groter de mate van differentiatie is binnen een taalfamilie, des te groter is de tijdsperiode die men moet aannemen voor de ontwikkeling van zulk een differentiatie.Ga naar eind3. Deze gedachte, die impliciet ook aanwezig is in de oude stamboomtheorie, werkte Swadesh verder uit. Hij nam nl. de mogelijkheid aan, dat taaldifferentiatie, mits over grote tijdseenheden gemeten, een constant verloop heeft. En het middel om dit verloop te meten vond hij in zijn bovengeschetste | |||||||||
[pagina 96]
| |||||||||
‘basic vocabulary’. Het enige wat men nog te doen had was enkele controleerbare gevallen, d.w.z. gevallen van onderling verwante talen, waarvan men weet hoeveel eeuwen er verlopen zijn, sedert ze uit een gemeenschappelijke moedertaal zijn afgesplitst, na te gaan en te zien of de uitkomsten voldoende met elkaar overeenkwamen om een formule op te stellen, die de verhouding weergeeft tussen de drie gecorreleerde grootheden: percentage der overeenkomende woorden in de basic vocabulary, periode der differentiatie en vervangingscoëfficient in de basic vocabulary. De laatstgenoemde zou een constante grootheid moeten zijn, wilde men met de formule kunnen werken in al die gevallen, waarin de tijdsperiode onbekend is. De prompt aan de hand van enkele controleerbare gevallen uitgevoerde berekeningen leverden inderdaad een hanteerbare formule op en daarmede was de lexicostatistische glottochronologie geboren. Deze maakte uiteraard een beginperiode door van verdere uitbouw, zowel van de theoretische principes als van de praktische uitwerking daarvan. Daaraan werkten, behalve Swadesh zelf, anderen mede, van wie vooral Robert Lees moet worden genoemd. Omstreeks het midden der vijftiger jaren treedt dan een consolidatie op en dan is het ook, dat Sarah Gudschinsky een helder overzicht kan geven van de principes en werkwijzen der glottochronologie.Ga naar eind4. Het uitgangspunt vat zij samen in een viertal axioma's:
Voor de praktische toepassing geeft zij de formule t = log C/2log r, waarin t = tijdsdiepte in millennia, C = het percentage verwanten in de basic vocabulary en r = de ‘behoudsconstante’, terwijl met log bedoeld wordt natuurlijke logaritme. Voor de behoudsconstante wordt het getal 0,805 aangenomen, zulks op grond van de bij de controle-gevallen, gevonden waarden. Een andere formule, die we hier onvermeld laten stelt, de onderzoeker in staat de gemaakte fout te berekenen: uitgaande van het totaal aantal vergeleken woordparen kan men een marge uitzetten, waarbinnen de splitsing der betrokken talen moet hebben plaatsgehad. Deze marge | |||||||||
[pagina 97]
| |||||||||
wordt ruimer naarmate de tijdsdiepte groter of het aantal vergeleken woordparen kleiner is. Een voorbeeld: 80% overeenkomst in een lijst van 200 woorden geeft een splitsingstijd gelegen tussen 1366 en 1524 A.D., terwijl 80% overeenkomst bij een totaal van 20 vergelijkbare woorden een bredere marge geeft, nl. tussen 1207 en 1695 A.D. Het is niet verwonderlijk, dat deze nieuwigheden vele taalkundigen de schrik om het hart deden slaan: de gedachte dat men taalvergelijking zou moeten gaan bedrijven met de logaritmentafel in de hand kon men niet zo maar verwerken. Anderen echter begroetten de glottochronologie met veel gejuich. Men zag daarin een middel om de taalvergelijking, die in de huidige fase der ontwikkeling van de linguïstiek minder belangstelling kreeg dan vroeger en vooral op het gebied der ‘historieloze’ talen met allerlei problemen worstelde, nieuw leven in te blazen en in een geheel nieuwe richting te stuwen. Nu, zo zei men, had men een methode gevonden, waardoor men chronometrische resultaten kon boeken, waarmede men antropologen en archaeologen belanrijke gegevens kon verstrekken, ook daar, waar tot nog toe jaartallen een onmogelijkheid waren gebleken. Een aantrekkelijk punt leek velen, dat men glottochronologie zou kunnen bedrijven zonder een grote taalkundige kennis: tenslotte behoeft men geen linguïst te zijn om een woordenlijstje in te vullen, te zien welke woorden op elkaar lijken en dan enkele berekeningen te maken. Men zou de fraaiste resultaten kunnen bereiken en dat nog wel in een handomdraai! Begrijpelijk is, dat deze geestdriftige gevoelens vooral bij niet-linguïsten leefden, die geen begrip hadden voor alle moeilijkheden, waarop men bij toepassing en vooral ook bij nader door-denken der theorie zou stuiten. Een belangrijk element bij dit alles was ongetwijfeld ook het exakte karakter der glottochronologie, waardoor de taalwetenschap veel meer het aanzien van een echte ‘science’ zou kunnen verkrijgen. Welke waren nu de moeilijkheden, waarop we zoëven doelden? Daar was allereerst de samenstelling van de basic woordenlijst. Swadesh zelf zag zich gedwongen op dit punt correcties aan te brengen. Zo werkte hij eerst met een lijst van 200 nummers, maar verving die later door een lijst van 100 nummers, met daarbij een aanvullingslijst voor gevallen van onbruikbaarheid van delen uit de eerste. Ook zijn navolgers werkten met lijsten, die niet alle dezelfde omvang of samenstelling hadden. Achter deze onzekerheid zat de moeilijkheid precies uit te maken, wat nu tot de basis-woordenschat behoorde en wat niet. Want grote persistentie tegen ontlening was niet de enige mogelijke norm. De begrippen moesten ook universeel zijn, d.w.z. niet alleen niet sterk aan een bepaalde cultuur gebonden, maar ook niet beperkt tot een natuurlijk milieu. Zo kwamen op Swadesh' eerste lijst ‘ijs’ en ‘sneeuw’ voor, die hij later naar zijn aanvullende lijst verbande. Over het verschijnsel van het veel minder voorkomen van ontleningen bij gewone begrippen, | |||||||||
[pagina 98]
| |||||||||
pronomina, telwoorden enz. waren reeds vaak opmerkingen gemaakt, maar het was bij zulke opmerkingen gebleven: een systematisch onderzoek hiernaar was nog nimmer op grote schaal verricht. Wel heeft men gebruiksfrekwentie van woorden in sommige talen bepaald, omdat men een minimum-woordenschat voor praktisch gebruik zocht (Basic English!) en ook is er wel studie gemaakt van de beperkte woordenschat van kinderen, maar geen van beide richtingen voerden de lexicostatisticus nader tot zijn doel. Vooral de eis van universaliteit bleek zwaarder dan aanvankelijk was vermoed. Telkens weer moest degene, die de lijst voor een nieuwe taal wilde invullen, sommige nummers ervan schrappen of door andere vervangen. De moeilijkheden kwamen vaak voort uit het feit, dat de taaltekens met hun betekenissen de wereld op een van taal tot taal verschillende wijze indelen. Het gevolg is, dat soms twee woorden in de ene taal staan tegenover één in de andere, een bekend feit maar tevens een moeilijkheid voor wie aan het tellen slaat. Moet men als een taal twee synoniemen geeft voor een nummer van de standaardlijst er één uitkiezen en welk dan? De glottochronologen dachten allerlei, vaak zeer ingenieuze oplossingen uit, maar steeds nieuwe problemen deden zich voor. Het einde was, dat tenslotte telkens andere lijsten werden gebruikt en de daarmee bereikte resultaten op zijn minst onvergelijkbaar waren. Een groot bezwaar tegen het gebruik van onderling in samenstelling verschillende lijsten is gelegen in het feit, dat de controle-gevallen alleen globale gegevens konden leveren over een gemiddelde persistentie van de woorden voor de in een lijst voorkomende begrippen. Of er misschien verschil is in het gedrag van een woord of een groep van woorden t.a.v. vervangbaarheid in de loop der eeuwen vergeleken bij een ander woord of een andere groep, is nimmer grondig onderzocht. In die gevallen, waarin persistentie van woorden in bepaalde betekenisgroepen werd getoetst en vergeleken, kwam men soms tot merkwaardige resultaten, die intussen niet altijd hoop konden geven aan de glottochronologen. Zo bleken woorden voor kleuren in het Chinees een grote persistentie gehad te hebben, terwijl in die taal oudere woorden voor ‘hier’ en ‘daar’ verdwenen en door andere vervangen waren. In moderne dialekten van het Grieks vond men bij vergelijking met Oud-Grieks precies het tegenovergestelde. Die onderlinge ongelijkheid van delen van de lijst ten aanzien van de persistentie heeft ook in wiskundig opzicht zijn bezwaren, daar het werken met een gemiddelde een bedriegelijk beeld kan geven en een ‘eerlijke’ verwerking van de - bij de huidige stand van onze kennis alleen bij ruwe schatting te geven - variaties in de persistentie zulke brede marges in de eindcijfers geeft, dat van een werkelijke berekening met konkreet resultaat allang geen sprake meer is. De toepassing van de glottochronologie behoeft natuurlijk niet beperkt te blijven tot het berekenen van de splitsingstijd van verwante talen, | |||||||||
[pagina 99]
| |||||||||
men kan natuurlijk ook dialekten van eenzelfde taal op deze wijze onderzoeken. Zelfs kan men nog verder gaan en het taalgebruik van individuen (idiolekten) zo vergelijken. Vooral in het laatste geval kwam men tot zeer moeilijk aanvaardbare resultaten. Zo vond Gudschinsky tussen taalgebruik van leden van een vrij homogene taalgemeenschap verschillen, die correspondeerden met een tijdsdiepte van 600 jaar! Anderen pasten de methode op haar gegevens wat anders toe, maar de gevonden tijdsdiepte was dan toch nog drie eeuwen. Maar ook bij de cijfers, die vergelijking van de woordenschat van allerlei dialekten opleverde, waren er vele, die slecht te rijmen bleken met historische gegevens. Als verklaring voerde men aan, dat juist in de eerste periode, waarin lokale idiomen bezig zijn te differentiëren de onderlinge beïnvloeding nog zo sterk is, dat de differentiatie langzamer moet verlopen dan later het geval is, zodat de gewone formule dan niet van toepassing is, hetgeen neerkomt op een beperking van het axioma van het constante getal in de woordvervanging. In het algemeen achtte men alle waarden voor tijdsdiepten kleiner dan vijf eeuwen onbetrouwbaar. Voor diegenen, die de glottochronologie met veel reserve aanzagen, geleek deze restrictie veel op een poging om de slecht kloppende resultaten in die gevallen, waarop veel controle mogelijk is, onder de tafel te werken. Het was te verwachten, dat de discussie over de juistheid der glottochronologische methode in belangrijke mate zich zou concentreren op de controle-gevallen. Immers, zouden de resultaten, behaald bij het onderzoek van die talen waarvan men weet hoelang het geleden is, dat ze zich uit een gemeenschappelijke moedertaal afsplitsten, duidelijk in één richting wijzen, dan zou dit sterk pleiten voor de betrouwbaarheid van de glottochronologische methode. Men zou zelfs mogen eisen, dat alle controleerbare gevallen uitvoerig zo zouden worden onderzocht om daarmede de methode geheel uit te testen, voordat men deze ging toepassen op die talen, welker voorgeschiedenis ons onbekend is. Dit is echter niet gebeurd. Swadesh was zelfs op een gegeven ogenblik gedwongen toe te geven, dat ‘lexicostatistics has thus far operated, as it were, on a shoe-string of basic research’. Swadesh en Lees onderzochten wel een aantal gevallen, maar daarbij waren de Indogermaanse talen in de meerderheid en werd vooral aan de Romaanse groep verhoudingsgewijs veel aandacht besteed. Anderen voerden berekeningen uit met enkele niet-Indogermaanse talen, zoals Japans, Kannada en Arabisch, maar juist bij de laatstgenoemde taal waren de resultaten van verschillende onderzoekers niet gelijkluidend. Men zou tevreden kunnen zijn met enkele steekproeven - ook in de statistiek werkt men daarmede -, maar dan zou men toch enige zekerheid willen hebben, dat die steekproeven representatief zijn voor het totale materiaal. Daartoe zijn de gedane onderzoekingen beslist onvoldoende en zo blijft dus | |||||||||
[pagina 100]
| |||||||||
het axioma van de voor alle talen geldige behoudsconstante een onbewezen stelling. Ook de critiek op de glottochronologie liet niet na steekproeven te nemen. De meest opvallende resultaten hierbij waren die, welke de Zweedse geleerden Vogt en Bergsland verkregen bij het lexicostatistisch onderzoek van Oud-Noors, Riksmål, moderne Noorse dialekten en modern IJslands, Oud- en modern Georgisch en Mingrelisch, en modern en Oud-Armeens.Ga naar eind5. De uitkomsten weken zo af van de historische feiten - het IJslands bijv. is veel minder veranderd dan men op grond van de formule zou verwachten -, dat zij het raadzaam achtten eerst alle vroegere steekproeven nog eens nauwkeurig na te gaan, voordat men verdergaat met het verfijnen der glottochronologische theorie. Anderen betoogden, dat hier bijzondere omstandigheden in het spel waren. Een dergelijke redenering vindt men ook bij de Japanse onderzoeker Shirô Hattori, die in het feit, dat Nederlands en Duits in het basis-vocabulaire zoveel overeenkomen, dat hun splitsing minder dan vijf eeuwen geleden plaats moet hebben gehad, terwijl veel langer geleden er al zeer karakteristieke verschillen tussen beide talen bestonden, een aanwijzing zag van onderlinge beïnvloeding. Terecht kan men hierbij opmerken, dat mensen als Swadesh van meet af aan rekening wilden houden met de mogelijkheid van verschil in tempo van verandering onder de invloed van speciale culturele omstandigheden, vandaar de restrictie aan het eind van het vierde axioma. Deze beperking is maar al te vaak door volijverige glottochronologen over het hoofd gezien. Belangrijk is in dit verband de opmerking van de Leidse hoogleraar KuiperGa naar eind6., dat een trager tempo van vervanging in de basic vocabulary niet wil zeggen, dat er geen verband zou bestaan tussen dit tempo en dat van veranderingen in de rest van de woordenschat. Het is, zo betoogde hij, veel meer voor de hand liggend, dat, wanneer er grote veranderingen optreden in de woordenschat, deze veranderingen de elementaire woordenschat ook zullen aantasten, zij het in mindere mate. Maar dan is er dus een correlatie tussen de veranderingstempi in beide delen van het vocabulaire en deze correlatie laat zich niet rijmen met een voor alle talen en in alle omstandigheden geldende behoudsconstante, die, zoals we boven zagen, de spil is, waar de glottochronologie om draait. Voordat men glottologische berekeningen zou kunnen maken, zou men de geschiedenis van de betrokken talen moeten kennen en kennis van de geschiedenis maakt doorgaans glottochronologische berekeningen overbodig. De boven gesignaleerde verwachting, dat deze methode ook toegepast zou kunnen worden zonder veel taalkundige kennis, ging ook niet in vervulling. Want niet alleen het invullen der woordenlijsten bleek een zekere vertrouwdheid met de betrokken talen te vergen, maar vooral het vaststellen van verwantschap tussen woorden bleek inzicht te eisen zowel in de morfologische structuur als in de ontwikkeling der klank- | |||||||||
[pagina 101]
| |||||||||
stelsels. De glottochronologie bleek het niet te kunnen stellen zonder descriptieve en vergelijkende taalstudie. Hiermede komen we dan terug bij de bestaande beproefde methoden der taalwetenschap. Men ontkomt niet aan de indruk, dat velen, die eerst geestdriftige aanhangers der glottochronologie waren, thans meer geneigd zijn het bij die beproefde methoden te houden. Opvallend is het, dat men in een recente studie van taalvergelijkende aard van SwadeshGa naar eind7. geen glottochronologie vindt, maar een ‘gewone’ comparatieve benadering. Intussen zoeken anderen, onder wie Isidore Dyen genoemd moet worden, naar vervolmaking der glottochronologische formules, die volgens hen alleen faalden, omdat ze veel te eenvoudig waren opgesteld. Het is nog te vroeg om de uiteindelijke balans over dit alles op te maken. Maar nu reeds is het mogelijk vast te stellen, dat het zoeken naar een chronometrische duimstok voor de taalgeschiedenis de aandacht heeft gevestigd op enkele zeer belangwekkende problemen. Het belangrijkste hiervan is wellicht het vraagstuk van de samenhang tussen persistentie van de woordvorm en de betekenis. Hier ligt een heel veld voor onderzoek braak, een onderzoek, dat zowel semantische als antropologisch-linguïstische kanten zal hebben. Daarbij zal dan tevens aandacht moeten geschonken worden aan de mogelijkheid van verband tussen persistentie en morfonologische situatie, m.a.w. de vraag of een bepaalde klanksamenstelling een woord kan voorbestemmen tot spoedig verdwijnen of lang leven. In elk geval kan nadere bestudering van het verschil tussen elementair en niet-elementair in de woordenschat van veel nut zijn voor historisch-comparatief onderzoek. Ook in een andere richting dan de chronometrische biedt de lexicostatistiek mogelijkheden en hierin is het weer Swadesh, die een weg heeft gewezen. Door middel van lexicostatistisch verkregen getallen is het nl. mogelijk de mate van overeenkomst tussen verwante talen of dialekten exakt weer te geven. Natuurlijk ontheft dit de vergelijker niet van zijn taak na te gaan in hoeverre overeenkomsten en verschillen in andere delen van het taalgeheel de lexicale verhoudingen dekken. Men behoeft dan misschien niet zover te gaan als Swadesh, die verwantschapsverhoudingen in fraaie meer-dimensionale modellen weergeeft. Vooral daar, waar men vergelijkend onderzoek wil verrichten naar de historische samenhang van grotere taalgroepen waarvan men de geschiedenis niet kent, kan een lexicostatistische indeling, die in zulke gevallen niet noodzakelijk op gegevens uit het basisvocabulaire alleen behoeft gebaseerd te zijn, een zeer bruikbaar uitgangspunt vormen. Hoe het ook zij, wij moeten afwachten, wat er na de ‘Sturm und Drang’-periode, waarvan we getuige mochten zijn, nog zal groeien uit de lexicostatistiek en de glottochronologie.Ga naar eind8. J.C. Anceaux |
|