Taal en Tongval. Jaargang 27
(1975)– [tijdschrift] Taal en Tongval– Auteursrechtelijk beschermd
[pagina 35]
| ||||||||||||||||||||||||
Variatie in taal en algemene taalwetenschapIn haar bijdrage ‘Taalsociologie’ acht J. Daan het denkbaar dat taalsociologie op den duur een verklarende waarde heeft voor de algemene taaltheorie (Daan 1972, 27). Ik denk dat dit een te bescheiden uitspraak is, en dat hoop ik in het vervolg duidelijk te maken. Zijdelings roert ze ook het afgrenzingsprobleem aan (23, 27). De linguist moet zich ook bezig houden met andere systemen of met varianten van die systemenGa naar voetnoot1. Het is een controverse die steeds weer in een nieuw kleed optreedt: systeem-vrije varianten, langue-parole, competence-performance, ideale spreker-luisteraar-taalgemeenschap, aangeboren taalvermogen-leerproces, en is een voortdurend pogen om vast te stellen wat het object van de taalkunde als theorie is, en wat de data zijn. De meest rigoreuze afperking is tot nu toe gegeven door degenen die binnen het kader van de transformationeel-generatieve grammatica werken. De algemene taaltheorie is een verzameling uitspraken over het aangeboren taalvermogen; is in overeenstemming met de deeltheorieën (= afzonderlijke grammatica's) die weer uitspraken zijn over competences; de deeltheorieën moeten in overeenstemming zijn met de feiten, die bestaan uit de oordelen van native speakersGa naar voetnoot2. De systematische oordelen worden verklaard uit de competence en deze weer uit het aangeboren taalvermogen (ik volg hierbij het schema van de Haan e.a. 1974, 7-8). Wat binnen deze taaltheorie als observeerbaar wordt gezien zijn in feite metalinguistische uitspraken (Al, 1972), en ze betreffen | ||||||||||||||||||||||||
[pagina 36]
| ||||||||||||||||||||||||
welgevormdheid-grammaticaliteit, parafraserelaties, cohesie-oordelen over constituenten en ambiguiteit. Binnen dit paradigma kan variatie alleen verantwoord worden door aan te nemen dat native speakers kunnen verschillen in hun oordelen en dat er dan sprake is van verschillende competences en dus verschillende grammatica's of als er variatie is in de oordelen van een en dezelfde native speaker dat die ook verantwoord moeten worden door verschillende grammatica's. Het laatste geval zal zich waarschijnlijk minder voordoen bij de syntaxis als bij fonologie, morfologie en lexicale varianten (Daan 1972, 27; de Haan e.a. 1974, 19-20).
I. Er zijn echter grote nadelen verbonden aan het werken met linguistische intuitieve oordelen. Levelt (1973) noemt:
Algemeen aanvaard is de eis dat slechts die intuitieve oordelen gebruikt worden die duidelijke gevallen zijn, de geconstrueerde grammatica zou dan later zelf beslissen over de status van problematisch-grammaticale zinnen. Echter juist in gevallen waar regels getoetst moeten worden doen zich vaak ‘onduidelijke’ gevallen voor van voorbeeld- en tegenvoorbeeldzinnen. Zodoende zijn beslissingen over zeer belangrijke | ||||||||||||||||||||||||
[pagina 37]
| ||||||||||||||||||||||||
stukken theorie afhankelijk van zeer onbetrouwbare observaties (Levelt 1973, dl. II). Dit is een voorbeeld van het probleem van de geïntendeerde interpretatie van een theorie, namelijk hoe de theorie te interpreteren in termen van observabelen. Dit probleem speelt behalve op het terrein van observationele, descriptieve en verklarende adekwaatheid ook een rol in de analyse van een corpus: hoe worden gegevens tot data. Wat beantwoordt in een corpus aan de theoretische notie zin (Levelt 1973, II, 10). Wat beantwoordt aan woord, morfeem, woordgroep? Hoe wordt, waar spraak continu is, dit discreet waargenomen? Ieder die voor de opdracht geplaatst wordt een transcriptie te leveren van lopende spraak wordt met dit interpretatie-probleem geconfronteerd. Wel beweert Labov (1970) dat ongeveer 75% van de uitingen welgevormde zinnen zijn en dat men met behulp van ellipsenregels en wat normaliseringen voor stamelen en ‘false starts’ niet-welgevormde zinnen tot op minder dan 2% kan reduceren; bij niet-academici in hun gewone doen zou het percentage zinnen dat genormaliseerd zou moeten worden slechts op 10% liggen, maar dan is er op een ad hoc manier al behoorlijk wat geïnterpreteerd. Lijnrecht hiertegenover staan de bevindingen van recent taalverwervingsonderzoek dat taal van kinderen (ook onderling), taal van volwassenen tot kinderen en taal van volwassenen onderling betrof (Vorster 1974). Taal van volwassenen tot kinderen kan gemakkelijk in discrete uitingen verdeeld worden, taal van volwassenen onderling zeer moeilijk, juist ten gevolge van ‘false starts’, ellipsen, onderbrekingen en aarzelingen. Uit de hiervoor weergegeven mening van Labov, uit de transcripties in Shuy e.a. (1968, 65) blijkt dat er met een zinscriterium gewerkt wordt; Labov werkt blijkbaar met het criterium: wat maximaal als zin beschouwd kan worden. Shuy laat de interpretatie afhangen van de in het interview gestelde vraag. De door Vorster gerefereerde Drach laat fragmentarische zinnen buiten beschouwing en betrekt alleen volledige zinnen in zijn onderzoek. Een Nijmeegs proefonderzoek naar taal van achtjarigen (Verslag 1969, 7) gaat uit van het criterium syntactisch verband: de deelnemers aan de werkgroep deelden met behulp van dit criterium ieder afzonderlijk de zinnen in door ze te nummerenGa naar voetnoot1. Er bleek grote overeenkomst tussen de indelingen te bestaan. In twijfelgevallen besliste de intonatie. Wackernagel-Jolles (1971, 149-50) | ||||||||||||||||||||||||
[pagina 38]
| ||||||||||||||||||||||||
liet dertig tot vijftig ppn. zinseenheden afgrenzen met behulp van intonatie naar bandopnamen. De sprekers hadden zelf ook hun uitingen in zinnen verdeeld; 131 zinnen van de 424 werden buiten beschouwing gelaten omdat ze een wisseling van sprekers bevatten. Van de 293 overgebleven zinnen werden er 135 eenstemmig (d.w.z. bij gelijke afgrenzing door minstens 90% van de ppn.) vastgesteld. Dat is dan ongeveer de helft van de gevallen. Opgemerkt moet nog worden dat dit resultaat gunstig beïnvloed wordt door het feit dat door de verwijdering van de onderbrekingen de monologen de overhand hebben en vertekend wordt doordat de lengte van de 424 zinnen varieert van 1 tot 145 woorden! (Wackernagel-Jolles, 151.) Beter lijkt het dan ook om zoals Snow te werken met een notie minimale uiting (1972). Heeft het dan misschien de voorkeur om af te zien van het zoeken naar iets dat in verband gebracht kan worden met de theoretische notie zin en te zoeken naar iets wat interpreteerbaar is als zinsdeel of woordgroep? Yngve (1973) vermeldt een experiment naar wat er gebeurt als sprekers onderbroken worden doordat ze moeten zeggen of er een geel of wit lichtje is gaan branden. Het blijkt dat hun afbreken in de experimentele situatie niet verschilt van zelfonderbrekingen in gewone spraak. Onderbrekingen komen voor zowel op woordgrenzen als midden in woorden, zelfs midden in fonemen, en niet op lettergreepgrenzen (p. 693). Belangrijk hierbij is dat ppn. altijd teruggaan naar het begin van een phrase of clause als de onderbreking heeft plaatsgevonden in het midden van een woord, soms gaan ze terug naar het begin als de afbreking op een woordgrens valt. Er is dus een criterium om in lopende spraak althans het begin van een woordgroep vast te stellen in moeilijke gevallenGa naar voetnoot1. Verder onderzoek als dat van Yngve is noodzakelijk om regelmatigheden aan het licht te brengen bij de andere genoemde punten: ‘false starts’, ellipsen en aarzelingen, al dan niet in verband met pauzesGa naar voetnoot2. De verhouding competence-performance is dus zeer complex: enerzijds zijn metalinguistische uitingen zelf taalgedrag - en als gedrag behoren ze ook tot de studie-objecten van de psychologische functie- | ||||||||||||||||||||||||
[pagina 39]
| ||||||||||||||||||||||||
leer - anderzijds moeten er nogal wat beslissingen genomen worden voordat taaluitingen de status van data kunnen krijgen die in relatie gebracht kunnen worden met een taaltheorie of model.
II. Niet alleen in de verhouding tussen taalkunde en psycholinguistiek, ook in de verhouding tussen taalkunde en sociolinguistiek speelt de discussie over het competence-performance onderscheid en de positie op de adekwaatheidsschaal van sociolinguistische theorieën een grote rol. Er is echter een groot verschil: is de liefde of de verkoeling bij taalkunde en psychologie steeds van twee kanten gekomen - zeker al sinds de dagen van Wundt - wat heel verhelderend heeft gewerkt op de standpunten van beiden, de liefde van de taalkunde voor de sociologie schijnt niet beantwoord te worden; volgens Bickerton, geciteerd in Shuy ed. (1972, 89): ‘there has been no stampede of sociologists into the linguistic corral’. Taalsociologen zijn voornamelijk taalkundigen. En ook hier is er al een traditie. Door taalkundigen die taalvariatie onderzocht hebben zijn altijd al impliciet (Schuchardt en het merendeel der dialectologen) of expliciet (de dialectologen Kloeke, Kurath, Raven Mc David bijv.)Ga naar voetnoot1 taalverschijnselen met sociologische variabelen gecorreleerd om regelmatige patronen te ontdekken of te verklaren in wat aanvankelijk vrije variatie leek te zijn. Bij de huidige taalsociologenGa naar voetnoot2, die de geidealiseerde spreker-luisteraar | ||||||||||||||||||||||||
[pagina 40]
| ||||||||||||||||||||||||
van Chomsky als een te homogeen artefact zien, vallen met betrekking tot het competence-performance onderscheid twee extreme posities te onderscheiden, beide met de aanspraak dat ze een bijdrage kunnen leveren voor de beslissingsprocedure die uit een aantal mogelijke grammatica's die kiest die de meest verklarende waarde hebben. Aan de ene kant bevinden zich bijvoorbeeld Bickerton (1973) en Bailey (1973), aan de andere kant Labov (1972) en Cedergren and Sankoff (1974). Het gaat erom of bij optionele regels de toepasbaarheid, uitgedrukt in frequenties, tot de regels zelf behoren en dus tot de competence of niet; in dat geval zouden de frequenties tot de performance behorenGa naar voetnoot1. Bickerton en Bailey ontkennen dat performance-onderzoek kan leiden tot verklarende adekwaatheid, Cedergren en Sankoff zien de frequenties in de primaire taaldata als performance, en de daaruit geschatte waarschijnlijkheden als een benadering van de competence. Bickerton en Bailey gebruiken het scalogram, een model dat leidt tot een gewoonlijk strikte rangorde van - in dit geval linguistische - kenmerken en een zwakke rangorde van individuen (Swanborn 1973, 133). De zo verkregen equivalentieklassen van individuen kunnen dialecten zijn. Bij deze analysevorm gaat veel informatie verloren: de scores, reële getallen) worden getransformeerd tot de gehele getallen 1 en 0 (het al dan niet hebben van een kenmerk) met hooguit nog een derde waarde. De verkregen empirische relaties zijn zodoende armer dan de oorspronkelijke. De verkregen rangorde over individuen wordt achteraf gecorreleerd met sociale variabelen. Voor Bickerton en Bailey dient het scalogram verder uitsluitend om uit de mate van schending van het ‘ideaal mogelijke’ scalogram conclusies te trekken over verschuivingen in de rangorde van kenmerken, zodat op die manier herformuleringen van taalregels gevonden kunnen worden. Zodoende is het mogelijk om rekenschap te geven van taalverandering. Het door hen gehanteerde model leidt dus tot een interpretatietheorie, tot voorspellingen die naderhand getoetst kunnen worden en heeft heuristische waarde. Cedergren en Sankoff's multiplicatief model (een wat elegantere ver- | ||||||||||||||||||||||||
[pagina 41]
| ||||||||||||||||||||||||
sie van het oorspronkelijke model van Labov dat additief was) leidt tot een ordening van kenmerken op een aantal factoren die van taakundige, sociale, psychologische of vooralsnog onbekende aard kunnen zijn (de laatste twee zitten in de zgn. aanvangswaarschijnlijkheid Po en werden met uitzondering van attitude tot nu toe niet expliciet gemaakt). Men probeert tot een maximale benadering van de waarschijnlijkheidsverdelingen in de data te komen door de methode van parameterschatting die uitgaat van een principe van maximum likelihood (bij één parameter kan dit bijv. het gemiddelde zijn, bij meerdere parameters is de schatting een ingewikkelder aangelegenheidGa naar voetnoot1. De discussie tussen de twee extremen roert wel principiële zaken met betrekking tot de competence performance verhouding aan, ook met betrekking tot de waarde van het bestuderen van taalvariaties (zoals die aangetroffen worden o.a. in dialecten en sociolecten) voor de algemene taaltheorie voorzover die verklarende adekwaatheid nastreeft. Toch wordt de discussie niet geheel zuiver gevoerd omdat men geen oog heeft voor het feit dat de gebruikte statistische en sociometrische procedures als interpretatietheorie gebruikt worden, ze dienen om zo zuinig mogelijk, dus met zo zwak mogelijke assumpties betreffende de relaties tussen theoretische en geobserveerde variabelen te werken. Als inferentheorie gebruikt vervullen ze een grote heurische rol, als meettheorie vervullen ze een rol bij het toetsen (Greeno 1972, 95-99). Als Anshen (1973, 62) in het voetspoor van Bickerton ((1973) over Cedergren en Sankoff (1974)) Labov's model als een beschrijvend model zonder verklarende waarde ziet, waar geen voorspellingen uit af te leiden zouden zijn en dus niet de moeite van het toetsen waard, ‘mere data displaying devices’ (Bickerton 1972, 26), dan brengt hij dit soort probabilistische grammatica's te vroeg in relatie met de competenceproblematiek. Suppes (1974, 288 e.v.), die overigens zijn probabilistische kindertaalgrammatica's als performancetheorieën ziet (Suppes 1973, 387 e.v.), merkt ten aanzien van taalkundigen die waarschijnlijkheden in een grammatica maar suspect vinden op: ‘Certainly, if the number of parameters equals the number of predictions the results are not very interesting. On the other hand, the more the number of predictions exceeds the number of parameters the greater the interest in the predictions of the theory’. Ieder meetinstrument, dus ook iedere inferentietheorie zal verschillende resultaten geven; belangrijk is of er een redelijke mate van overeenstemming is. Is die er niet, of slaagt men er niet in observabelen | ||||||||||||||||||||||||
[pagina 42]
| ||||||||||||||||||||||||
met zijn theorie in overeenstemming te brengen dan deugt het meetinstrument/de interpretatietheorie niet, of je theorie is verkeerd, een van beide moet dan verworpen worden. De discussie tussen Bickerton en Cedergren-Sankoff voorzover die op dezelfde primaire taaldata betrekking had (deletie van Que in enkele sociolecten in Montreal) laat zien hoe funest het is als men dit soort zaken niet in het oog houdt: ze komen tot verschillende regels, zien hun data anders en hebben een verschillend meetinstrument. De conclusies waartoe je dan komt in zo'n situatie lijken me tamelijk zwevend. Overigens zouden ‘mere data displaying devices’, gezien de hiervoor onder I. vermelde moeilijkheden met betrekking tot wat nu de gegevens zijn voor de taaltheorie en het problematische van het onderscheid competence-performance, al een flinke stap vooruit zijn. Performance en taalvariatie hebben de laatste jaren gefungeerd als het kwade geweten van de linguistiek. Het is een goed gevormd kwaad geweten; de dialectgeografie is dat al jaren voor de historische taalkunde geweest, dialectologie, sociolinguistiek en historische taalkunde zijn het nu voor de linguistiek in zijn geheel (zie Anderson and Jones 1974).
Amsterdam, 1 februari 1975 Ton Goeman. | ||||||||||||||||||||||||
Bibliografie
| ||||||||||||||||||||||||
[pagina 43]
| ||||||||||||||||||||||||
| ||||||||||||||||||||||||
[pagina 44]
| ||||||||||||||||||||||||
|
|