Studia Neerlandica. Jaargang 1971
(1971)– [tijdschrift] Studia Neerlandica– Auteursrechtelijk beschermd
[pagina 169]
| |
S.G. Nooteboom
| |
[pagina 170]
| |
zeggen over de relatie tussen generatieve fonologie en experimentele fonetiek met de vooropgezette bedoeling om ter discussie te stellen of de generatieve fonologie er voordeel bij zou hebben wanneer zij zich meer dan tot nog toe wat zou aantrekken van de resultaten van de experimentele fonetiek. Dit lijkt misschien een boude veronderstelling. De taalkundige immers die het zevende en negende hoofdstuk van The Sound Pattern heeft gelezen, zal het opgevallen zijn dat daar op een groot aantal plaatsen evidentie wordt aangevoerd ontleend aan de experimentele fonetiek. Dit in tegenstelling tot vele decennia van fonologie, waarin de fonologen zich hadden afgekeerd van de experimentele fonetiek en de experimentele fonetiek zelf, voornamelijk bedreven door niet-linguïsten, zich tevreden stelde met een minimum aan fonologische aannames.
2. Het lijkt er dus op dat de modernere generatieve fonologie weer meer belangstelling krijgt voor experimenteel-fonetische gegevens. Aan de andere kant wordt op het ogenblik door een aantal experimentele fonetici een generatieve fonologie voorondersteld bij hun theorievorming, zodat er ook van die kant toenadering lijkt te zijn. Het naar elkaar toegroeien van generatieve fonologie en experimentele fonetiek gaat echter langzaam en heeft z'n weg, meen ik, nog lang niet voltooid. Dat is niet verwonderlijk. Hoewel fonoloog en foneticus beide geïnteresseerd zijn in de structuren die ten grondslag liggen aan de spraak, zijn wijze van denken en methodes van onderzoek sterk verschillend, evenals de problemen die gesteld worden en de verificatieprocedures.
Het grensvlak tussen fonologie en experimentele fonetiek heeft te maken met de verschillende houding die beide innemen ten aanzien van het aloude probleem van de segmentatie. De generatieve fonologie beperkt zich tot op dit moment expliciet tot verschijnselen die tot uitdrukking gebracht kunnen worden in een segmentele representatie. Ik mag u misschien de structuur van de uitgang van de fonologische component van een generatieve grammatica in herinnering roepen. Deze bestaat uit een matrix waarin kolommen staan voor opeenvolgende segmenten en rijen voor de universele fonetische kenmerken. Ieder fonetisch kenmerk is een één-dimensionele schaal, die een onafhankelijk controleerbaar aspect van de spraakvorming beschrijft, zoals vocaliteit, nasaliteit, ronding. De waarde op de schaal, zoals ingevuld in de matrix, geeft aan in welke mate het betreffende kenmerk aanwezig is in het betref- | |
[pagina 171]
| |
fende segment. De totale lijst van fonetische kenmerken vertegenwoordigt de spraakproducerende vermogens van het menselijk spraakapparaat.
Deze matrix die aan de uitgang van een generatieve grammatica staat, is de fonetische representatie, dat is een ideale fonetische vorm. Het probleem voor de fonoloog is nu o.a. zijn regels zo te kiezen dat aan iedere uiting een fonetische representatie wordt toegekend.
Op deze wijze sluit de fonoloog zich bewust af van al die verschijnselen die niet tot uitdrukking gebracht kunnen worden in een segmentele representatie. Men zou kunnen zeggen dat waar het probleem voor de fonoloog ophoudt, het probleem voor de foneticus pas begint. Van oudsher is het centrale probleem van de experimentele fonetiek geweest hoe men de fonemen of spraakklanken moest terugvinden in de stroom van articulatorische gebeurtenissen of in het akoestische continuum. Dit probleem wordt in de moderne experimentele fonetiek wat anders gesteld, t.w. op welke wijze speelt het zenuwstelsel van een mens het klaar om aan de ene kant een segmentele representatie te vertalen in een semicontinue stroom van articulatorische gebeurtenissen en, één stap verder, van akoustische gebeurtenissen, en aan de andere kant om middels een perceptief mechanisme uit een continu variërend akoetisch signaal weer een segmentele representatie af te leiden.
De experimentele fonetiek zoekt naar modellen die dit kunststukje klaarspelen, er daarbij van uitgaande dat op een of ander niveau in het produceren en het percipiëren van spraak een segmentele representatie, zoals beschreven door een linguïst, een rol speelt. Onderzoek aan de waarneming van spraak heeft het steeds waarschijnlijker gemaakt dat bij het waarnemen van spraak de relatie tussen linguïstische vorm en akoestisch signaal, zoals gespecificeerd door de produktie, een grote rol speelt, en vandaar dat op het ogenblik het onderzoek van veel fonetici op de produktie van spraak gericht is. De laatste jaren zijn nu herhaaldelijk pogingen gedaan om de produktie-modellen van de fonetiek binnen één theoretisch kader te plaatsen met de generatieve grammatica. Ladefoged schreef in 1967 dat een fonetische theorie uit 3 fasen dient te bestaan, waarvan de eerste twee overeenkomen met wat Chomsky noemt de fonologische en de fonetische representatie. De derde fase zou een niveau zijn, dat hij fysische fonetiek noemt, en dat moet | |
[pagina 172]
| |
leiden tot een specificatie van werkelijke uitingen door een spreker. Hij voegt er aan toe dat linguïstische beschrijvingen die niet aan alle drie de eisen tegemoet komen gemakkelijk triviaal worden. Uiteindelijk, zegt Ladefoged, zou het handig zijn als de regels van de fonetische beschrijving een verzameling signalen zouden genereren die een spraaksyn thetisator zouden besturen. Pas dan zouden we de zekerheid hebben dat de regels en de theorie volledig rekenschap aflegden van de taal onder beschrijving. De theorie zou een specificatie van een spraaksyn thetisator dienen te bevatten. Deze beschrijving zou daadwerkelijk deel uitmaken van een generatieve grammatica.Ga naar eind2
Een soortgelijke suggestie is gedaan door Öhman, Person en Leanderson op het Congres van Fonetische Wetenschappen in Praag, 1967, waar zij hun bijdrage begonnen met de volgende uitspraak: ‘De fonologische uitgang van een generatieve grammatica zou men kunnen beschouwen als een abstracte beschrijving van een verzameling ingangcommando's voor een spraaksynthetisator. Deze synthetisator zou een waar model van de menselijke spraakproduktie moeten zijn. De vraag wat voor vorm de uitgang van de fonologische component zou moeten aannemen, is afhankelijk van de aard van de parameters die de synthetisator besturen.Ga naar eind3
Wat er dus gebeurt is het volgende: Experimentele fonetici formuleren hun problemen in termen van een model dat aan zijn ingang de uitgangssignalen van een generatieve grammatica krijgt en aan zijn uitgang een akoestische golfvorm produceert. Zij proberen nu op deze wijze meer inzicht te krijgen in de complexe relatie tussen de linguïstische segmenten en het akoestische signaal. Met name proberen zij de variabiliteit van het akoestisch signaal voor identieke fonemen te verklaren. Ik wil daarvan twee voorbeelden geven. De ligging van de formanten van een bepaald klinkerfoneem in het frequentiespectrum blijkt niet bij iedere realisatie van die klinker dezelfde te zijn. Deze blijkt o.a. afhankelijk te zijn van de medeklinkeromgeving en van de duur van de klinker. Lindblom heeft nu laten zien dat voor een bekende medeklinkeromgeving de afwijking die de formanten t.o.v. hun doelposities vertonen op een eenvoudige wijze m.b.v. een exponentiële funktie uit de duur is te berekenen. Zo heeft hij althans een deel van de variabiliteit van het akoestisch signaal verklaard.Ga naar eind4 | |
[pagina 173]
| |
Als ander voorbeeld wil ik noemen het coarticulatiemodel van Öhman. Bij het realiseren van intervocalische consonanten blijken de formant-buigingen van de eerste klinker naar de consonant niet alleen afhankelijk te zijn van de consonant maar ook van de daaropvolgende klinker. In articulatorische termen betekent dit dat de articulatoren al voor de intervocalische consonant gerealiseerd wordt op weg zijn naar de positie voor de tweede vocaal. Öhman is nu in staat gebleken de hierdoor ontstane variabiliteit te verklaren uit een coarticulatiemodel, waarin hij aanneemt dat de basisbewegingen voor spraak gevormd worden door een opeenvolging van vocaal bewegingen, waarbij steeds de consonantbewegingen gesuperponeerd worden op de diftong-achtige verglijdingen van de ene voaal naar de andere.Ga naar eind5 Het model van Öhman accepteert twee vormen van ingangssignalen, ten eerste een specificatie van de doelposities van de te realiseren fonemen en ten tweede een specificatie van het verloop in de tijd van zowel consonant als vocaalbeweging.
De modellen van Öhman en Lindblom zijn beschrijvend voor bepaalde mechanische eigenschappen van de articulatoren. Maar niet alle variabiliteit van het akoestisch signaal kan verklaard worden uit de mechanische eigenschappen van het spraakapparaat. Er blijkt al een aanzienlijke mate van variabiliteit te bestaan op het niveau van de neurale commando's en op het ogenblik is dan ook een belangrijk deel van de fonetische aandacht gericht op dat deel van de fysiologie van de spraakproduktie, waar de segmentele linguïstische representatie, laten we maar zeggen de foneemopeenvolging, geherstructureerd wordt tot een opeenvolging langs de tijdas van neurale commando's. We zouden hier kunnen spreken over de implementatie van de fonetische kenmerken bij het articuleren. Deze beschouwingswijze impliceert dat het uiteindelijk articulatorisch effect niet alleen afhankelijk is van het fonetische kenmerk dat gerealiseerd wordt, maar ook van de implementatieregels. Dit leidt tot een verandering van de status van de fonetische kenmerken. Lieberman heeft gesuggereerd dat de kenmerken een universele verzameling van signaaleenheden representeren die de reflexie zijn van een ‘match’ tussen spraakproduktie en spraakperceptie. Hij laat deze kenmerken de input zijn voor de neutrale toestand van het spraakkanaal, terwijl een verzameling implementatieregels in de fonetische component bepaalt wat voor articulatorisch gebaar zal volgen uit een fonetisch kenmerk in een | |
[pagina 174]
| |
bepaalde context. Lieberman onderscheidt daarbij tussen universele, taalspecifieke en individuele implementatieregels.Ga naar eind6
3. Wat ik nu in de eerste plaats ter discussie zou willen stellen is of het niet van belang zou zijn voor de generatieve fonologie, wanneer de universele eigenschappen van de menselijke spraakvorming geformuleerd zouden worden in termen van een produktiemodel van spraak dat aan de generatieve theorie zou worden toegevoegd, in plaats van, zoals tot nog toe, te worden geformuleerd in een geklassificeerde lijst van observaties. Ik hoop dit aan een paar voorbeelden te kunnen adstrueren. Een tweede punt wat ik wil aanstippen is de vraag of de fonologie er niet goed aan zou doen de verzameling fonetische kenmerken zodanig te kiezen dat deze optimaal zijn als ingangssignalen voor het genoemde produktiemodel, ook als hierdoor de economie van de fonologische component op zichzelf beschouwd geschaad zou worden. Een derde punt tenslotte wat ik op wil brengen is de verschillende houding van fonoloog en foneticus ten aanzien van al die taalgebonden verschijnselen die geen plaats kunnen krijgen in de fonetische representatie, met name de prosodische eigenschappen van spraak en de taalspecifieke coarticulatie-effecten.
Mijn eerste punt, de vraag of een produktiemodel van spraak opgenomen zou moeten worden in een generatieve grammatica, heeft er mee te maken dat wat wel en wat niet beregeld kan en moet worden in de fonologische component van een grammatica in hoge mate afhankelijk is van de universele eigenschappen van de menselijke spraakvorming. Ten eerste zijn er de absolute mechanische beperkingen van de spraakorganen. Een consonant, gevormd door contact tussen de punt van de tong en de achterwand van de keelholte mag wel als een mechanische onmogelijkheid beschouwd worden. Dergelijke absolute mechanische beperkingen moeten op een of andere wijze in de fonologische theorie tot uitdrukking worden gebracht. Zou men dit willen doen in een lijst van geklassificeerde observaties m.b.t. de spraakvorming dan zou deze lijst wel eens heel lang kunnen worden, en bovendien lastig verifieerbaar. Een aantrekkelijker gedachte lijkt het om, zoals voorgesteld door Ladefoged, in de theorie een beschrijving van een spraaksynthetisator op te nemen, waarbij deze spraaksynthetisator een model dient te zijn van de mechanische eigenschappen van de spraakorganen. | |
[pagina 175]
| |
Een ander voorbeeld, dat met het vorige te maken heeft, is het volgende: Wanneer wij een [k] voor [i] uitspreken is deze meer palataal dan wanneer wij een [k] voor een [at uitspreken. Dit is al een heel oud en veel aangehaald voorbeeld van positionele variantie. Het is echter geen absolute mechanische beperking. Marcel Tatham heeft er onlangs op gewezen dat de palatalisering van [k] voor [i] tegengewerkt kan worden door een andere besturing van de spraakorganen. Dit gebeurt met name in talen waar er een onderscheid bestaat tussen een palatale en een velaire [kt. Tatham pleit er voor om de universele tendens tot palatalisering van [k] voor [i] in de grammatica op te nemen als een universele regel in een ‘phonetic competence’ model. Deze regel zou de vorm hebben van een fonetische syllabestructuurconditie, die er als volgt kan uitzien: In gevallen waarin een velaire [k] voor [i] voorkomt zou Tatham in de beschrijving deze universele regel willen voorzien van een min-teken.Ga naar eind7 Deze beschrijving van de universele tendens tot palatalisering van [k] voor [i] is volgens mij weinig bevredigend. Een dergelijke palataliseringstendens is het gevolg van het feit dat wij niet in brokjes spraak spreken, maar in een continue articulatiestroom. De neurale commando's naar de spieren voor de vorming van [k] en de vorming van [i] worden tegelijk gegeven. De [k] en de [i] worden gecoarticuleerd, en de daaruit resulterende articulatorische verschuiving van de k is berekenbaar op de wijze zoals door Öhman aangegeven. Het onbevredigende van Tatham's beschrijving zit 'm nu naar mijn gevoel daarin, dat hij een verschijnsel dat typisch het gevolg is van het niet-segmentele karakter van onze spraakvorming, beschrijft met behulp van een regel die een segmentele vorm heeft.
De palatalisering van [k] voor [i] vindt plaats op een zodanig laag niveau in de produktie van spraak dat er van een segmentele representatie geen sprake meer kan zijn. Een dergelijk verschijnsel kan, meen ik, het best geformuleerd worden in termen van een model van de spraakvorming zelf. Van dat model zou dan Öhman's coarticulatie model deel moeten uitmaken. | |
[pagina 176]
| |
Dan kom ik nu op mijn tweede punt, dat is de bruikbaarheid van de verzameling fonetische kenmerken als ingangssignalen voor een produktiemodel van spraak. Ook zonder dat een dergelijk produktiemodel al in uitgewerkte vorm bestaat, lijkt het verstandig om bij het denken over fonetische kenmerken met zo'n produktiemodel rekening te houden, omdat men anders gevaar loopt op een al te vrijblijvende wijze te werk te gaan bij het voorstellen van nieuwe fonetische kenmerken.
Ik wil proberen een paar voorbeelden te geven van gevallen waar Chomsky en Halle te weinig met de fonetische werkelijkheid rekening gehouden lijken te hebben. Het eerste voorbeeld is heel onlangs besproken door Fant. In de Sound Pattern worden labiale consonanten beschreven als [+anterior] en [-coronal]. De kenmerken anterior en coronal hebben betrekking op de stand van de tong, en, zoals Fant opmerkt, het lijkt wat vergezocht om aan te nemen dat de werkelijke neurale codering van labiale consonanten op een of ander niveau een selectie zou inhouden van een maximaal naar voren gelegen punt van articulatie in het spraakkanaal en een gebrek aan tongpuntspecificatie om op een lager niveau er zorg voor te moeten dragen dat dit commando wordt uitgevoerd door de lippen en niet door de tong. Fant stelt m.i. terecht voor om labiale consonanten labiaal te noemen.Ga naar eind8
Een volgend voorbeeld heeft te maken met de beregeling van samenvoegingsregels, d.i. de produktie van opeenvolgingen van segmenten. Een produktiemodel van spraak zou men zich op simplistische wijze als volgt kunnen voorstellen. Aan de ingang zijn met behulp van de linguïstische segmenten een aantal doelposities gespecificeerd. Dus iedere kolom uit de fonetische representatie zou een stand van de spraakorganen specificeren. Het produktiemodel zou dan beregelen wat er gebeurt als al deze articulatiestanden gerealiseerd worden. Dus aan de ingang een opeenvolging van gespecificeerde articulatiestanden en aan de uitgang een articulatorisch bewegingspatroon waarbij dikwijls de gespecificeerde doelposities niet gehaald worden als gevolg van coarticulatie en traagheid van de articulatoren. Voor een dergelijk produktiemodel zou het de voorkeur verdienen om affricaten te beschrijven als twee segmenten, t.w. een plofklank gevolgd door een fricatief, omdat een affricaat beschreven als één segment niet als een articulatiestand beschreven kan worden. Chomsky en Halle beschrijven echter op fonetisch niveau affricaten als één segment waarbij een affricaat | |
[pagina 177]
| |
zich onderscheidt van een plofklank door het kenmerk ‘delayed release’. Dit maakt het produktiemodel ingewikkelder. Vermoedelijk is het hierom dat zowel Ladefoged als Fant de voorkeur geven aan een behandeling van affricaten als twee segmenten. Overigens zijn er wel argumenten aan te voeren dat een produktiemodel in termen van articulatiestanden en samenvoegingsregels te simplistisch is. Met name lijken er moeilijkheden op te duiken voor de beregeling van diftongering. Voor het beschrijven van tweeklanken lijken er op het eerste gezicht weinig moeilijkheden te bestaan. Deze zou men kunnen beschrijven in de fonetische representatie als bestaande uit twee segmenten die ieder een verschillende mondstand specificeren, terwijl de verglijding direkt zou volgen uit de produktieregels. Deze beschrijving druist misschien wel erg in tegen de intuïtie van bv. Nederlandse taalgebruikers, maar er is niets op tegen om tweeklanken in de fonologische representatie als één segment te beschrijven om onze intuïtie te bevredigen. De moeilijkheid doet zich pas voor, meen ik, wanneer we diftongering van zulke vocalen als de /o/ en de /e/ in het Nederlands in onze beschrijving tot uitdrukking willen laten komen. Hoewel het ook hier mogelijk is om op fonetisch niveau 2 segmenten aan te nemen, doet dat erg onbevredigend aan. Terwijl ik net bij de affricaten gepleit heb tegen kenmerken die een verandering specificeren, krijg ik nu de neiging om te pleiten voor een kenmerk dat een verandering met name een diftongering specificeert. Dit zou echter leiden tot een ingewikkelder produktiemodel. Een oplossing zie ik niet.
Het derde punt waar ik de aandacht op wilde richten was de verschillende houding die fonoloog en foneticus aannemen m.b.t. aspecten van de spraak die niet beschreven kunnen worden in de segmentele fonetische representie. Dit heeft betrekking op een heel gamma van factoren deels linguïstisch en deels extra-linguïstisch, zoals intonatiecontouren, duuropbouw, taalspecifieke coarticulatieverschijnselen, sex, leeftijd, humeur, gezondheid etc. Voor een fonoloog is het gemakkelijker van al dit soort verschijnselen te abstraheren dan voor een experimenteel foneticus. De laatste vindt immers de invloed van dit soort factoren dagelijks in zijn metingen en moet er daarom in zijn verificatieprocedures mee rekening houden. Voorzover het nu de niet-linguïstische factoren betreft probeert hij deze in laboratoiumcondities constant te houden, of er over te middelen. Voorzover het linguïstisch relevante factoren betreft, zoals bijvoorbeeld de invloed van taalspecifieke coarticulatieregels op de uitgang van het spraakproducerend | |
[pagina 178]
| |
systeem, probeert hij deze onder de knie te krijgen, en is op dat moment bezig een stuk competence van de taalgebruiker te beschrijven, een stuk competence dat hij nodig heeft om zijn produktiemodel uiteindelijk op zijn waarde te kunnen toetsen. Een belangrijke vraag die zich bijvoorbeeld voordoet is of de implementatie-regels, en met name de coarticulatieregels, universeel zijn of dat deze ook taalgebonden aspecten bevatten. Lieberman heeft gesuggereerd dat er ook taalgebonden implementatieregels zijn en Fant heeft met name gesteld dat er taalgebonden coarticulatieregels zijn. Zelf heb ik kort geleden in een voorlopige spectrografische studie van verschillen tussen het Duits en het Nederlands aanwijzingen gevonden dat er coarticulatieverschillen bestaan tussen het Duits en het Nederlands. Al deze verschijnselen zouden tenslotte een plaats moeten krijgen in een ‘phonetic competence model’.
Het zou wenselijk zijn dat de generatieve fonologie zich meer zou aantrekken van dit soort overwegingen, omdat ook de verificatie van het generatief-fonologisch model tenslotte pas aan de uitgang van een produktiemodel van spraak kan geschieden. Om met Gunnar Fant te spreken: Zonder dat we toegang hebben tot de regels van de fonetische component wordt het fonetisch aspect van de kenmerken zo imaginair en leeg als de nieuwe kleren van de keizer in het sprookje van Andersen. |
|