De Nieuwe Taalgids. Jaargang 62
(1969)– [tijdschrift] Nieuwe Taalgids, De– Auteursrechtelijk beschermd
[pagina 168]
| ||||||||||||||||
Fonetische SteunpuntenIn zijn recent artikel ‘Fonologische twijfelpunten’Ga naar voetnoot1 brengt Damsteegt voor mij wel degelijk iets nieuws. Zijn poging om tot een bevredigende fonologische beschrijving van de Nederlandse klinkers te komen, geeft namelijk een prachtig overzicht van een aantal gedachten en argumentaties over dit onderwerp. Maar zijn verzuchting: ‘Konkluderende moet ik zeggen, dat de fonische aspekten nog steeds niet duidelijk zijn...’ (p. 28), en zijn verklaring: ‘Mij dunkt, dat een adekwate, althans zo goed mogelijke, auditorische beschrijving moet prevaleren boven de eenvoud of de symmetrie van het stelsel, dat in de grond van de zaak niet meer is dan de uitkomst van een redenering’. (p. 33) vormen voor mij een dwingende aanleiding om te melden dat de fonische aspekten nu juist wèl duidelijk zijn en dat, als men de auditorische beschrijving laat prevaleren, men een stelsel kan verkrijgen dat zeker even eenvoudig en symmetrisch is als een op louter redenering gebaseerd stelsel. Ik hoop dit in het onderstaande duidelijk te maken. Maar eerst wil ik laten zien, waarom Damsteegt gelijk heeft als hij een lans breekt voor een auditorische beschrijving. Een centraal probleem van de fonologie, dat duidelijk naar voren komt in de wijze waarop Damsteegt de vele argumenten tegen elkaar afweegt, die tot een oplossing van zijn vraag zouden moeten leiden, is het volgende: hoe kunnen wij een ‘signalement’ van de fonemen geven, dat hun identiteit bepaalt? Immers, zolang men, op het zuiver linguïstisch vlak van distinctiviteit of distributieve eigenschappen opererende, geen andere uitslag van de foneemanalyse kan verantwoorden dan een rij fonemen: f1, f2, f3,..................., fn, netjes van elkaar onderscheiden - door distinctieve functie of door distributie - maar niet geïdentificeerd, zo lang is het voor menig toeschouwer alsof hij zich bevond voor een fraai gebouw, echter zonder ingangen. Voor een echt signalement van de fonemen is nodig dat men denkt aan tenminste één akoestische realisatie per foneem. En nu beginnen de problemen. Stel namelijk, dat de uitvinder van het Nederlandse foneemsysteem, gelovend dat ieder foneem, of althans ieder klinkerfoneem, uitspreekbaar is, zijn vondst mondeling openbaar had willen maken. Wij weten nu, dat een publiek, bestaande uit mensen, die een niet te veel van het Algemeen Beschaafd afwijkend Nederlands spreken, de onderscheiden klanken met een kans op succes van 80 à 90% herkend zou hebbenGa naar voetnoot2. Een uit buitenlanders bestaand publiek zou na afloop verbaasd gestaan hebben, wanneer het vernam dat er gedurende de séance twaalf verschillende klinkers geproduceerd waren. Slechter nog waren we er aan toe met een uitvinder, die niet zou geloven in de uitspreekbaarheid van fonemen (‘Hoe moet ik nu een bundel distinctieve eigenschap- | ||||||||||||||||
[pagina 169]
| ||||||||||||||||
pen uitspreken?’). Ook hij zou het wat mager gevonden hebben, als resultaat van zijn arbeid slechts te kunnen melden: ‘Er zijn in het Nederlands twaalf klinkerfonemen, te weten V1, V2, ......, V12’; hij zou daarom nog juist bereid gevonden zijn, enige articulatorische boter bij de vis te geven, maar dan alleen waar het om distinctieve kenmerken ging. Hij zou ons gezegd hebben dat V1 opener is dan V2, V3 gespreider dan V4, V5 vóór tegen V6 achter, enz. Hij had ons daarmede niet alleen in de kou laten staan, maar hij zou er tevens niet voor zijn teruggedeinsd, eenieder terecht te wijzen, die het waagde met een uit zijn gegevens gedestilleerd lijstje te komen, waarin bijvoorbeeld zou staan:
Want zó was het nooit bedoeld: de gegeven termen beschreven alleen opposities. De terechtwijzingen in de wind slaande, hebben we tóch zo'n lijstje gemaakt, louter uit behoefte aan een signalement. Dit betekent echter dat we tegenover onze uitvinder wel met een zeer goede verantwoording zullen moeten komen. Zulk een verantwoording mag men alleen verwachten te kunnen geven via een auditorische beschrijving.
Als het gaat om een auditorische beschrijving, is het in de eerste plaats nodig te luisteren. Als dit iets oplevert dat in strijd is met articulatorische en/of akoestische gegevens, kan men deze gegevens in twijfel trekken, maar ook, en wellicht beter, het gehoor niet vertrouwen. Dat het - ongewapende - oor ons inderdaad af en toe bedriegt, zal hieronder blijken. Voor analytisch luisteren is het dus nodig het oor te helpen. In dit kader passen dan ook niet alleen de training van het gehoor van een logopedist, of van een dialektkundige, maar ook de omkeerproeven die Damsteegt beschrijft; elk middel is welkom, mits het kritisch wordt gehanteerd. En het blijkt dan, dat onder de bovengenoemde condities het oor nog onvoldoende gewapend is. Immers steeds zal de gehoorsindruk van een enkele spraakklank mede bepaald worden door een maskerende werking van de naburige spraakklanken. Als men deze werking wil verminderen door het te onderzoeken materiaal zeer langzaam uit te spreken, kan men de daaruit getrokken konklusies alleen via ontoelaatbare extrapolatie toepasselijk verklaren op normale spraak. Het is daarom, dat op het Instituut voor Perceptie Onderzoek de segmentator is ontwikkeld als een apparaat, dat een demaskerende werking heeft, ook op normale spraak. Nu kan men zich pas goed op de details van de auditorische aspekten concentreren.Ga naar voetnoot1
Natuurlijk is ook dit apparaat met alle wantrouwen bekeken:
Terecht is erop gewezen, dat het plotseling aan- en uitschakelen van het geluid fysische veranderingen teweeg brengt, die aan het oorspronkelijke geluid een ongewen- | ||||||||||||||||
[pagina 170]
| ||||||||||||||||
ste uitbreiding kunnen geven. Daarom zijn er maatregelen getroffen om dit zoveel mogelijk te beperken.Ga naar voetnoot1 Voorts kan men zich afvragen, of de proefpersonen wel onderling redelijk overeenkomende reacties geven, als hun gevraagd wordt de door de segmentator aangeboden spraakfragmenten te identificeren. Ook dit is onderzocht.Ga naar voetnoot2 Waar het gaat om het beoordelen van stukjes klinker, is het de vraag hoe kort de fragmenten minimaal moeten zijn om nog een goede identificatie mogelijk te maken. Dit blijktGa naar voetnoot3, behalve voor de schwa, nog goed te gaan bij een duur van 20 milliseconden (ms), en recente onderzoekingen hebben een nog lagere waarde opgeleverdGa naar voetnoot4. Een belangrijk punt is ook de herhaalbaarheid van een experiment: als Stutterheim aan het begin van een [εi] een [i] hoort, zal ons dat pas bevreemden als blijkt dat na x verschillende beginconsonanten voor [εi], van y verschillende sprekers, steeds een [i] optreedt. Ik heb wel eens [ji] gehoord uit het begin van een woordje ‘leen’; indien men van fricatieven alleen de laatste 10 ms voor het begin van de volgklinker laat horen, klinkt dit als een plofklank, meestal homorgaan met de betreffende fricatief, maar ook hoort men wel eens een [p] na inkorten van de [χ]Ga naar voetnoot5. Toch zal op grond hiervan niemand aannemen, dat de spreker ergens aan het einde van de [χ] stiekum een /p/ gezegd heeft. Tenslotte kan men zich nog afvragen of ook het aldus gewapende oor zich niet laat beetnemen. Daarop hebben wij gemeend antwoord te moeten geven met de techniek van de kunstmatig gegenereerde spraak. Als men langs synthetische weg de verschillende klankelementen die men analytisch luisterende meent gevonden te hebben, simuleert, en weer aaneenrijgt, en als men dan een bevredigende imitatie van het oorspronkelijke geheel verkrijgt, dan vomt dit een sterke aanwijzing dat de analyse juist is geweest. Een voorbeeld van de voordelen van zo'n aanpak van verschillende kanten tegelijk vindt men in het onderzoek aan de klinkerdriehoek. Dit oorspronkelijk articulatorisch gedachte model kon, ondanks de mogelijkheid tot afwijkende realisaties (bijvoorbeeld met een pijp tussen de tanden geklemd, waardoor het correlaat met de kaakafstanden verloren is) stand houden door de ondersteuning die het kreeg uit de akoestische fonetiek. Weliswaar spraken de röntgen-opnamen niet steeds een al te duidelijke taal, en terecht was er wantrouwen tegen de zgn. spectraalanalyses, omdat dit slechts filter-analyses waren, behept met alle beperkende eigenschappen van de filters; maar weer kwam er steun, doordat men langs fysisch - mathematische wegen de correlatie tussen de articulatorische en de akoestische klinkerdriehoek kon aantonenGa naar voetnoot6. Tenslotte gaven | ||||||||||||||||
[pagina 171]
| ||||||||||||||||
de experimenten met kunstmatige spraak aanleiding tot het opstellen van een perceptieve klinkerdriehoek, die opnieuw het oorspronkelijke model ondersteundeGa naar voetnoot1.
Laten we nu eens zien wat het onderzoek aan zwakgesneden klinkers en tweeklanken heeft opgeleverd. De segmentator had geleerd, dat [εi], [Λy] en [αu], maar ook [e], [ø] en [o] geen homogene klanken waren. In sommige gevallen verkleurden ook [i], [y] en [u], en zeker ook [a]. Allereerst nemen we de [εi], [Λy] en [αu] onder de loep. Reeds Menzerath had tot zijn verbazing gekonstateerd dat de - Duitse - tweeklanken bestonden uit een afzonderlijk herkenbaar begin- en einddeelGa naar voetnoot2. Als middendeel, verkregen door zowel aan het begin als aan het eind een stuk onhoorbaar te maken, hoorde hij steeds de oorspronkelijke tweeklank, en niet een klinkerkwaliteit, die het midden hield tussen die van het begin- en einddeel. Bij verder inkorten van dit middendeel bleef hij het overgebleven stuk steeds als de gehele tweeklank horen, totdat het zo kort werd, dat hij er geen kwaliteit meer aan kon toekennen. Nog onbekend met Menzeraths uitkomsten voerden wij onze eerste tweeklankanalyses als volgt uit: met behulp van een segmentator werd van een woordje (met een tweeklank, bijv. [εi] het allereerste fragment hoorbaar gemaakt. Bij een volgende aanbieding kon men een 10 ms langer stuk horen; bij iedere volgende aanbieding werd zo 10 ms meer van het woord aangeboden, totdat tenslotte het volledige woord doorgelaten werd. Nu werd van het begin een klein stukje, en bij iedere volgende aanbieding 10 ms meer afgekapt, totdat uiteindelijk alleen het allerlaatste fragment van het woord hoorbaar was. De proefpersoon kreeg de opdracht, bij elke aanbieding zo goed mogelijk aan te geven wat hij hoorde. Van de tweeklank [εi] bleek dan de eerste echte klinkergewaarwording die van een [ε] te zijn; gedurende de volgende aanbiedingen werd alleen maar een steeds langer wordende [ε] gehoord, totdat men plotseling ‘verkleuring’ waarnam; dit gaf meestal reeds dan aanleiding tot gewaarwording van een [εi]. Vervolgens bleef men uiteraard [εi] horen, alleen steeds langer. Als dan het afkappen van het begin een aanvang nam, bleef aanvankelijk nog steeds een [εi.] hoorbaar, steeds korter bij iedere volgende aanbieding, totdat plotseling een verder homogeen blijvende tweede component [I] of [i] overbleef. Voor het oor leek het dus, alsof er slechts sprake was van een begin- en een eindcomponent, terwijl combinatie van een van beide componenten met 10 of 20 ms van de andere de gehele, oorspronkelijke tweeklank opleverdeGa naar voetnoot3. Dit is natuurlijk niet in overeenstemming met het spectraal meetbare feit van de formantverglijding. Maar wie zal het ons gehoor (en wat daar achter zit) kwalijk nemen, dat het een beetje anders werkt dan een filter? Toch behoeft men dit niet zo maar te geloven, en dus trachtten wij langs kunstmatige weg een signaal te maken, dat overeenkwam met wat wij gehoord hadden: bij- | ||||||||||||||||
[pagina 172]
| ||||||||||||||||
voorbeeld een homogeen stukje met de formanten van een [ε], gevolgd door een homogeen stukje met de formanten van een ‘niet al te overdreven gearticuleerde’ [i]; en zie, het oor liet zich bedotten; wanneer de elementen goed in de tijd worden gedimensioneerd, en indien aan de grondtoon een passende zwaai wordt gegeven, neemt men een alleszins acceptabele [εi] waar.Ga naar voetnoot1 En ook al kan men, op grond van spectraalmetingen van het aldus gegenereerde signaal, zoals dat in een licht galmende ruimte weerklinkt, begrijpen hoe het komt dat het oor zich laat beetnemen, feit blijft, dat er geen moment aanwijsbaar is, waarop de formanten van het signaal een positie innemen, die tussen die van de [ε] en die van de [i] inliggen. Bij andere proeven met de segmentator, waarbij niet steeds een langer stuk van de tweeklank ten gehore werd gebracht totdat men ‘een verkleuring waarnam’, maar opeenvolgende, korte stukjes (van bijvoorbeeld 60 ms) kon wel degelijk een voortdurende, geleidelijke verkleuring worden waargenomen, dus geheel in overeenstemming met wat we van de articulatie weten. Maar dit doet nauwelijks iets af aan het bovenstaande. Aan het analytisch luisteren naar de tweeklanken is een fraai sluitstuk gegeven in een uitgebreid onderzoek met kunstmatige spraak, nu niet alleen om te zien of tweeklanken te simuleren waren met twee successieve, homogene klinkersegmentjes, maar vooral met de vraag, welke formantcombinaties de beste resultaten gavenGa naar voetnoot2. Konklusie daarvan is, dat de [εi] is: de Nederlandse klinker [ε], en daarna beweging in de richting van [i]: [Λy] is de Engelse klinker [Λ] (van ‘cup’) - en niet de Nederlandse [oe] - gevolgd door beweging naar [y]; [αu] is de Nederlandse klinker [α] - en niet [Ɔ] - gevolgd door beweging naar [u]. De eindpunten worden alleen bij overcorrect, geïsoleerd uitspreken, zonder eindconsonant, gevormd door [i], [y] en [u]. Normaal vindt men als eindpunten [ɪ], [ø] en [o]. Nu de zwakgesneden klinkers [e], [ø] en [o]. Zoals reeds gezegd, bleven ook deze bij het segmenteren niet homogeen. Bij de [e] was steeds het eerste, 80 à 100 ms lange stuk te identificeren als een [ɪ], daarna volgde verkleuring naar de [i]. De [ø] begint met [oe], verkleurend naar [y], de [o] met [Ɔ], verkleurend naar [u]. Wat was hiervan de oorzaak? Zijn [e], [ø] en [o] misschien ook tweeklanken, d.w.z. bestaan ze ook uit verschillende begin- en eindklanken? Of is het misschien zo, dat door de merkwaardige ingreep van de poort (het belangrijkste element van de segmentator) een overigens zeer zuivere [e] nu eens als [ɪ], dan weer als [i] klinkt? Hiervoor was weer een onafhankelijke proef nodig. De kunstmatige-spraakproeven wezen uit dat voor de beoordeling van de kwaliteit van [ɪ] tegen [e] (resp. [oe] tegen [ø] en [Ɔ] tegen [o]) niet de spectrale kwaliteit alleen bepalend is, maar concurrerend in belangrijkheid daarmee de tijdstructuur van het signaal. Een scherp afgesneden, kort durende klank moet al heel erg [e]-ig ([ø]-ig of [o]-ig) zijn, wil een proefpersoon er niet [ɪ] (oe] of [Ɔ]) tegen zeggen. Dit betekende dat het horen van een [ɪ] in het begin van een [e] geheel op rekening van dit verschijnsel zou kunnen worden geschoven, ware het niet dat kunstmatige [e]'s acceptabeler bleken indien ze als tweeklanken werden gesynthetiseerd dan wanneer ze homogeen bleven! | ||||||||||||||||
[pagina 173]
| ||||||||||||||||
Zijn dus [e], [ø] en [o] net zo goed tweeklanken als [εi], [Λy] en [αu]? Het antwoord moet luiden: ‘Nee, niet net zo goed, maar wel bijna’. Hiervoor kunnen een drietal argumenten naar voren gebracht worden: 1. [e], [ø] en [o] kunnen wel, [εi], [Λy] en [αu] niet bevredigend worden gesynthetiseerd met één homogene spectrale compositie. 2. [e], [ø] en [o] gedragen zich wat betreft de toleranties in het beginsegment en in de richting van de verkleuring principieel anders dan [εi], [Λy] en [αu]. (Onder tolerantie verstaan wij de afwijking van een norm of een gemiddelde, die blijkens de uitspraken van proefpersonen in een perceptieve proef, waarin de acceptabiliteit van een of meer aspekten in een (kunstmatig) spraaksignaal wordt gemeten, nog toelaatbaar geacht wordt.) Met name geldt voor [e], [ø] en [o], dat hun beginpunten binnen vrij nauwe grenzen moeten liggen en de richting waarin zij verkleuren niet zo belangrijk is, terwijl voor de tweeklanken het beginpunt er niet zo op aan komt, maar juist de richting van de verkleuring tamelijk nauw begrensd is. Voor het derde argument moeten wij een omweg maken, om tenslotte op een punt uit te komen, waar een allermerkwaardigste discrepantie met de meldingen van Damsteegt uit de bus komt. Zoals reeds gezegd, kunnen ook [a], [i], [y] en [u] verkleuring ondergaan. Dit geschiedt echter alleen onder invloed van zekere volgconsonanten. De sterkste invloed gaat uit van de [r], echter ook [l] doet wel iets. Voor een [r] gaat de [a] over naar een zeer duidelijke [ε], de [i], [y] en [u] worden niet, zoals wel gezegd wordt, homogeen gerekt, maar verkleuren naar een schwa. Het doet er hier niet toe of men te maken heeft met een rol- of met een brouw-r. Dit op zich merkwaardige verschijnsel zou nog vreemder zijn als het zich alleen voordeed na deze klinkers en niet na andere, minstens even zwak gesneden klinkers. En inderdaad gebeurt er met [e], [ø] en [o] ook iets merkwaardigs. Hoewel Donders reeds een eeuw geleden beweerde, dat, wil men een zuivere [e], [ø] en [o] horen, men deze voor de [r] moet beluisterenGa naar voetnoot1, wil daar niemand aan, want we horen duidelijk [ɪ:r], [oe:r] en [ɔ:r], dus inderdaad, zoals Van den Berg net iets te haastig rechtzet (Damsteegt p. 31, noot 2), opener dan de [e], [ø] en [o]. Voorts merken we op, dat schoolkinderen ‘menir’ schrijven voor ‘meneer’. Wat laat de segmentator ons echter horen? Het begin van ‘eer’, ‘eur’ en ‘oor’ klinkt juist niet als [ɪ], [oe] en [ɔ], zoals indien niet gevolgd door een [r], maar in overeenstemming met Donders' observatie, als [e], [ø] en [o], dus wel geslotener. Dit effect is in 1961 door Cohen gedemonstreerd op het Filologencongres in Leuven door middel van een bandopname, waarin naast elkaar de analyseresultaten te horen zijn van de woorden ‘been’ en ‘beer’, ‘deun’ en deur, ‘boot’ en ‘boor’. Telkens verwacht men, dat de eerste aanbieding van zo'n paar gesneden is uit het woord, eindigende op [r], telkens komt men bedrogen uit. Deze proef, die niet naliet bij ieder die ermee geconfronteerd werd, grote verbazing te wekken, liet niet alleen zien, hoe verraderlijk het oor oordeelt indien het op | ||||||||||||||||
[pagina 174]
| ||||||||||||||||
globale indrukken moet afgaan, zij leidt tot een onontkoombare konklusie: Vóór [r] beginnen [e], [ø] en [o] geslotener dan voor alle andere consonanten. Ter verduidelijking zouden wij voortaan moeten schrijven: [ɪi], [oey] en [ɔu], maar vóór [r]: [eə], [øə] en [oə]. Interessant is nog op te merken, dat [e], [ø] en [o] zich voor [r] dus net zo gedragen als [i], [y] en [u] dat doen.Ga naar voetnoot1
Hoewel het mij niet vrijstaat, fonologische konklusies te trekken uit het bovenstaande, wil ik wel een aantal suggesties doen. Ik zou mij bij de fonologische indeling van de zwakgesneden klinkers voor /r/ niets aantrekken van het globaal luisterende oor van het schoolkind, dat ‘menir’ schrijft. Het lijkt mij beter, de uitkomst van het analytisch luisteren te laten prevaleren. Fonologisch, en met name distributioneel, hoeft er geen bezwaar tegen te bestaan, de /e/, /ø/ en /o/ voor de /r/ dezelfde foneemwaarde toe te kennen als voor de andere consonanten, precies zoals men de eerste en de laatste consonant van het woord ‘lepel’ manifestaties van het foneem /l/ noemt. Dit brengt ons automatisch op het punt van de gelijksoortigheid van zwakgesneden klinkers en tweeklanken, want uit het voorgaande blijkt, dat ik pleit voor een verschillende distributie voor de /r/. In zulke vraagstukken lijkt het verstandig, dankbaar alle gegevens in ontvangst te nemen, die de fonetici aandragen, maar deze te interpreteren op een wijze die de constructie van een foneemsysteem zou vergemakkelijken, zonder die resultaten geweld aan te doen: zo lijkt het mogelijk, het feit dat de tweeklanken niet bevredigend kunnen worden gesynthetiseerd met één homogene spectrale compositie, zwaarder te laten wegen dan de grotere natuurlijkheid van verkleurend gesynthetiseerde zwakgesneden klinkers, omdat dit, gecombineerd met de overige meetresultaten, de beste kansen biedt om een eenvoudig klinkerfoneemsysteem op te bouwen. Zo kan wat wij met de huidige stand van onze kennis als het (auditorisch) ware kunnen beschouwen, toch nog leiden tot de eenvoud, die op zichzelf geen aanspraak kan maken, er het kenmerk van te zijn. Instituut voor Perceptie Onderzoek, Eindhoven j. 't hart |
|