| |
| |
| |
De waarneming van klemtoonpatronen in samenstellingen
A.C.M. Rietveld
L.M.G. Cremers
Inleiding
Sinds het verschijnen van de ‘Sound Pattern of English’ (Chomsky & Halle, 1968) zijn steeds verder uitgewerkte voorstellen gedaan om op grond van fonologische/morfologische/syntactische informatie de verhoudingen van klemtoonsterkten in uitingen te voorspellen. Er zijn regels ontwikkeld voor uiteenlopende linguïstische eenheden, variërend van monomorfematische woorden tot woordgroepen en zinnen.
De meest courante regels zijn uit twee ‘scholen’ afkomstig, t.w. de traditionele generatieve fonologie en de metrische fonologie. De metrische fonologie heeft zich in eerste instantie bij monde van Liberman & Prince (1977) afgezet tegen de door de SPE geïnspireerde regels. Een discussiepunt is onder meer dat de SPE een onwaarschijnlijk groot aantal klemtoonniveaus onderscheidt en op vrij arbitraire wijze d.m.v. ‘readjustment rules’ aan dat aantal een bovengrens moet stellen. In de metrische fonologie is dat aantal klemtoonniveaus slechts een bijprodukt van de afleiding: de klemtoonniveaus in woorden of woordgroepen kunnen met behulp van een rekenschema uit de s- en w-knopen van de metrische boom worden afgeleid. Ook daar echter spelen impliciet de klemtoonniveaus een rol, nl. bij de evaluatie van de metrische bomen.
Er is een constante in de fonologische literatuur over klemtoonniveaus: men laat in het midden hoeveel klemtoonniveaus perceptief relevant zijn. Chomsky & Halle (1968:26) nemen aan dat het vermogen van luisteraars om klemtoonniveaus te onderscheiden vooral steunt op de kennis die de luisteraar heeft van de syntactische structuur van een uiting. Zij achten de kans groot dat luisteraars erg weinig doen met de fysische eigenschappen van het spraaksignaal maar vinden overigens wel dat deze veronderstelling nog experimenteel zou moeten worden onderzocht.
Aan het probleem van het aantal verschillende klemtoonniveaus dat een luisteraar kan onderscheiden heeft de fonetiek relatief weinig aandacht besteed, zeker voor het Nederlands. Een klassiek en nog steeds geciteerd experiment is dat van Lieberman (1965). Deze liet twee getrainde linguïsten m.b.v. het ‘Trager & Smith’-systeem in hele uitingen ‘pitch-’ en ‘stress-’ niveaus onderscheiden. Dit gebeurde niet alleen met normale spraak, maar ook met identieke klinkergeluiden die temporeel overeenkwamen met de stemhebbende delen van het oorspronkelijke spraaksignaal; in een deel van dit laatste spraakmateriaal was het amplitude- en/of grondfrequentieverloop gelijk aan het origineel, in een ander deel hadden deze een constante waarde gekregen. Op deze wijze kon het relatieve effect van de amplitude en de grondfrequentie op de transcriptie van ‘pitch-’ (toonhoogte) en ‘stress-’ niveaus worden onderzocht. Resultaat van dit experiment was dat vooral de secundaire en tertiaire klemtonen bij de transcriptie van de synthetische klinkers niet of nauwelijks overeenkwamen met de klemtonen die met de oorspronkelijke text getranscribeerd waren. De conclusie ligt voor de hand: afgezien van
| |
| |
de primaire klemtoon, zijn klemtoonniveaus slechts waarneembaar via de syntactische structuur. Naar ons idee is deze conclusie niet dwingend. Allereerst liet de door Lieberman gebruikte techniek weinig van het oorspronkelijke signaal over: formantstructuur, consonanten e.d. verdwenen geheel. Bovendien is het goed denkbaar dat de door de linguïsten gebruikte schaal met vier stress-niveaus inderdaad niet goed te hanteren is bij de transcriptie van gemanipuleerde spraak en dat een andere scoringsmethode wel consistente beoordelingen oplevert. Voorts heeft het experiment van Lieberman niet duidelijk gemaakt welke rol de lengte van de linguïstische eenheden heeft op de beoordeling; het is met andere woorden niet duidelijk in hoeverre klemtoonpatronen in geïsoleerde woorden of woordgroepen beter waarneembaar blijven dan in grotere gehelen (cf. Nakatani & Aston, 1978). Wat het aantal klemtoonniveaus betreft dat kan worden onderscheiden en de bijdrage van de linguïstische informatie moet dus nog onderzoek worden gedaan.
In de experimenten waarover wij nu verslag uitbrengen hebben wij getracht op de volgende vragen een antwoord te geven:
a) | In hoeverre kunnen sprekers van het Nederlands in schriftelijk en auditief aangeboden samenstellingen van drie woorden het volgens de fonologie (Booij, 1977) juiste klemtoonpatroon aangeven? |
b) | Wat is de relatieve bijdrage van de betekenisstructuur en het akoestisch signaal aan de waarneming van klemtoonniveaus in deze samenstellingen? |
Om bovenstaande vragen te beantwoorden hebben wij twee experimenten uitgevoerd:
1. | Een experiment waarin een groot aantal samenstellingen met de drie in het Nederlands mogelijke klemtoonpatronen schriftelijk aan proefpersonen wordt aangeboden; de luisteraars kregen de opdracht het klemtoonpatroon van elke samenstelling te transcriberen. |
2. | Een experiment waarin 18 samenstellingen (van elke categorie zes) auditief werden aangeboden. In dit experiment zijn twee versies van het spraakmateriaal aan de luisteraars gepresenteerd, t.w. een ongemanipuleerde versie en een waarin de woorden gedelexicaliseerd waren (onverstaanbaar gemaakt). |
| |
EXPERIMENT 1 Schriftelijke presentatie
Opzet
In het schriftelijke experiment werden 86 woorden aan de proefpersonen aangeboden. Achtenveertig van deze woorden waren samenstellingen, de andere woorden waren ter afleiding opgenomen (fillers, bestaande uit drie beklemtoonde lettergrepen). In Nederlandse samenstellingen van drie woorden zijn drie klemtoonpatronen mogelijk: 123, 132 en 213. De meeste samenstellingen hebben de hoofdklemtoon op de eerste lettergreep, waarbij het klemtoonpatroon 132 het meest frequent voorkomt. Deze frequentie van voorkomen weerspiegelde zich ook in de relatieve frequenties waarmee de verschillende patronen in ons testmateriaal voorkwamen: 132: 29, 123: 10, 213: 9.
Het woordmateriaal was in een willekeurige volgorde op een scoreformulier afgedrukt. De 20 proefpersonen (allen studenten in de letteren) kregen de opdracht met een
| |
| |
cijfer onder elke beklemtoonbare lettergreep de mate van beklemtoning aan te geven; identieke cijfers binnen een patroon waren niet toegestaan. De beklemtoonbare lettergrepen (d.i. de lettergrepen zonder schwa) waren met hoofdletters afgedrukt. In de instructie werden de proefpersonen erop gewezen dat niet elk klemtoonpatroon even vaak voor hoefde te komen.
| |
Resultaten
In Tabel I hebben wij de responsies van de 20 proefpersonen op de 48 samenstellingen ondergebracht.
te beoordelen categorie |
|
|
beoordeling |
|
|
|
|
123 |
213 |
132 |
312 |
231 |
321 |
123(n = 10) |
93 (47) |
8 (4) |
85 (43) |
12 (6) |
1 (1) |
1 (1) |
213 (n = 9) |
12 (7) |
95(53) |
10 (6) |
61(34) |
2(1) |
0(0) |
132 (n = 29) |
185 (32) |
11 (2) |
361 (62) |
10 (2) |
10 (2) |
3 (1) |
Tabel I Frequenties van klemtoonoordelen op samenstellingen met drie typen klemtoonpatroon; tussen haakjes zijn de relatieve frequenties in afgeronde procenten aangegeven.
De data in Tabel I maken duidelijk dat de problemen bij de keuze van het klemtoonpatroon liggen in het onderscheid tussen secundaire en tertiaire klemtoon. De plaats van de hoofdklemtoon werd bijna altijd goed gekozen: in 89%, 87% en 94% van de gevallen voor de patronen 123, 213 en 132 resp. Alleen in samenstellingen met patroon 132 is het correcte patroon beduidend vaker gekozen dan het patroon met de hoofdklemtoon op dezelfde plaats, doch met het secundaire en tertiaire accent omgewisseld: 62% versus 32%. Hoewel ook voor patroon 213 het correcte patroon vaker gekozen wordt, is hier de verhouding met het ‘concurrerende’ patroon minder gunstig: 53% versus 34%. Bij patroon 123 lopen deze percentages nog minder uiteen: 46% versus 42%.
De betrouwbaarheid van de oordelen van de proefpersonen was voor alle patronen redelijk: de coëfficiënten Alpha bedroegen voor de patronen 123:. 73, 213:. 81 en 132:. 72. Deze waarden geven aan dat de proefpersonen het redelijk met elkaar eens waren.
Zoals bekend wordt de vorm van met de SPE regels af te leiden klemtoonpatronen op samenstellingen o.m. bepaald door de structuur van de samenstelling. Te verwachten is derhalve dat bij samenstellingen die op meerdere wijzen te splitsen zijn zoals bv. luchtafweergeschut: luchtafweer en afweergeschut, meer fouten gemaakt zullen worden dan bij andere samenstellingen. Deze verwachting is door de data niet bevestigd.
| |
| |
| |
EXPERIMENT 2 Auditieve Presentatie
Spraakmateriaal
In dit experiment werden de stimuli niet schriftelijk maar auditief aangeboden. Uit elk van de drie klemtooncategorieën zijn zes samenstellingen gekozen die ook in experiment 1 voorkwamen. Het totale spraakmateriaal bestond zo uit 18 samenstellingen die door een man waren uitgesproken.
123 |
213 |
132 |
marktkoopman |
kortegolfzender |
kostwinnersvergoeding |
kleuterkweekschool |
kleinverlofganger |
postzegelverzamelaar |
rivierstoomboot |
boerenleenbank |
landschapsschoon |
tafelasbak |
rijkswaterstaat |
gemeenteraadsverkiezing |
kinderbedtijd |
rijkspolitieauto |
moesappeloogst |
kernstrijdmacht |
staatsbosbeheer |
boekbinderslijm |
De spreker, een foneticus, heeft de woorden redelijk vlot, zonder al te grote nadruk, gerealiseerd. Bij het inspreken werd elk rijtje woorden, bestaande uit zes samenstellingen met hetzelfde klemtoonpatroon, voorafgegaan en gevolgd door een aantal woorden die niet aan de luisteraars zouden worden aangeboden, dit om ‘zinsintonatie-effecten’ te vermijden.
Het aldus verkregen materiaal is vervolgens op de computer geresynthetiseerd met behulp van een LPC-vocoder. Met een LPC-vocoder is het mogelijk spraaksignalen te analyseren, de analyse-parameters vervolgens naar believen te veranderen en daarna het spraaksignaal te resynthetiseren. Bij de resynthese worden alleen die eigenschappen van het spraaksignaal veranderd die verband houden met veranderde analyse-parameters. Twee versies zijn gemaakt: een geresynthetiseerde versie zonder parametermanipulatie en een versie waarin de samenstellingen onverstaanbaar werden gemaakt door de bandbreedte van alle formanten (= resonantiefrequenties van de mond/keelholte) op 1 kHz te stellen. Op deze wijze bleven de amplitude, grondfrequentie en duurverhoudingen, alsmede de formantfrequenties onaangetast. Aangezien het temporele verloop van de consonanten, evenals het stemhebbend/stemloos-onderscheid niet werd gewijzigd, bleef het spraak-karakter van elke samenstelling op deze wijze behouden. Hierna zijn twee stimulusbandjes gemaakt; een met de onverstaanbare en een met de verstaanbare stimuli. De stimuli waren in randomvolgorde gebracht; elke stimulus werd twee keer na elkaar aangeboden, gescheiden door een pauze van 15 seconden. Een zekere vorm van counterbalancing is verkregen door van elke band twee versies te maken, met tegengestelde volgorden.
| |
Procedure
Aan de proefpersonen werden beide versies van de stimuli aangeboden: eerst alle onverstaanbare stimuli en vervolgens alle verstaanbare. In totaal moesten zij zo 36 stimuli beoordelen die via een luidspreker ten gehore werden gebracht.
De taak die de luisteraars moesten uitvoeren betrof, in tegenstelling tot die in het eerste experiment, een ‘gedwongen keuze’. Dat houdt in dat de luisteraars alleen uit de drie voor de aangeboden stimuli relevante klemtoonpatronen mochten kiezen; deze
| |
| |
waren op het scoreformulier afgedrukt, waarbij de onbeklemtoonbare syllaben door een streepje waren voorgesteld. Bijv: 12-3, 21-3, 13-2 (moesappeloogst). We kozen voor deze vorm om de taak van de luisteraar en de interpretatie van de data te vergemakkelijken.
De proefpersoon werd gevraagd voor elke stimulus het juiste patroon te omcirkelen. In de meeste gevallen is geen enkel woord van de gedelexicaliseerde versie verstaan. Het aantal proefpersonen bedroeg 15 (evenals in experiment 1 allen studenten).
| |
Resultaten en discussie
In Tabel II geven wij de responsiematrices voor beide versies van de stimuli
verstaanbaar aangeboden stimuli |
|
|
|
|
|
beoordeling |
|
|
123 |
213 |
132 |
123 |
55 (61) |
6 (7) |
28 (32) |
213 |
2 (2) |
85 (94) |
3 (3) |
132 |
30 (33) |
7 (8) |
53 (59) |
onverstaanbaar aangeboden stimuli |
|
|
|
|
|
beoordeling |
|
|
123 |
213 |
132 |
123 |
32 (36) |
19 (21) |
39 (43) |
213 |
9 (10) |
74 (82) |
7 (8) |
132 |
32 (36) |
23 (26) |
35 (39) |
Tabel II Frequenties van responsies bij klemtoonbeoordeling van samenstellingen; tussen haakjes de relatieve frequenties in afgeronde procenten.
De herkenningspercentages waren groter dan op grond van kans te verwachten was: voor de verstaanbare stimuli was Cohen's Kappa:. 572, p<0.001 en voor de onverstaanbare stimuli. 283, p<0.001. De mate van correcte herkenning was in beide condities echter niet gelijk; de twee waarden van Kappa verschilden significant: z = 4.70, p<0.001. Dit betekent dat de klemtoonpatronen van de verstaanbare stimuli vaker correct zijn waargenomen dan de onverstaanbare. In beide gevallen werd patroon 213 verreweg het vaakst correct waargenomen. Dit resultaat is ook heel begrijpelijk aangezien geen andere responsiecategorie voorkwam met de hoofdklemtoon in het midden; de correcte scores voor dit klemtoonpatroon kwamen dus tot stand door een correcte waarneming van de hoofdklemtoon. De omstandigheid dat patroon 213 zeer vaak correct gekozen werd, is als positieve aanwijzing op te vatten voor de uitvoerbaarheid van de taak: althans één klemtoon bleef goed waarneembaar en werd dan ook goed gelocaliseerd.
De belangrijkste conclusie die we kunnen trekken op grond van Tabel II is dat de perceptieve categorisatie van secundaire en tertiaire klemtoon in de taak van het hier
| |
| |
besproken experiment niet mogelijk is zonder kennis van de betekenis van het woord. In de verstaanbare versie worden in de meerderheid van de gevallen de secundaire en tertiaire klemtoon correct gelokaliseerd, terwijl in de onverstaanbare versie de correcte en niet correcte lokalisaties bijna even vaak voorkomen.
Ons experiment lijkt zo een bevestiging te geven van de in de inleiding geciteerde veronderstelling van Chomsky & Halle (1968) dat het vermogen van de luisteraars om klemtoonniveaus te onderscheiden vooral steunt op kennis van de structuur van uitingen.
Hierbij moet er wel op gewezen worden dat ons experiment alleen uitwijst dat secundaire en tertiaire klemtoon op grond van signaaleigenschappen alleen (m.n. duur, intensiteit, grondfrequentie en formantpositie) niet aangewezen kunnen worden. Wij weten niet hoe het gedrag van luisteraars zal zijn wanneer zij een andere taak moeten uitvoeren. In ons experiment hadden de gedelexicaliseerde uitingen een vrij ongewoon karakter; het is denkbaar dat luisteraars met imitaties in de vorm van herhaalde syllaben (b.v. ‘sasasa’) minder moeite hebben. Evenzeer is denkbaar dat het aantal te onderscheiden klemtoonniveaus invloed heeft op de lokalisatieprestaties. In het hier besproken experiment moesten drie niveaus worden onderscheiden; een beperking tot twee (overeenkomstig de praktijk van vele fonologische beschrijvingen) kan een verbetering van de prestaties opleveren.
Een andere, mogelijk bepalende, factor in dit type experimenten is het soort oordelen dat gevraagd wordt; in ons geval betrof het een combinatie van identificatie- en discriminatieoordelen. De luisteraars werden niet, zoals in een zuivere discriminatietaak, paarsgewijs syllaben aangeboden met de vraag aan te geven welke van beide het ‘meest beklemtoond’ was. Bij ons moest de luisteraar drie klemtoonniveaus benoemen. Toch berustte deze procedure impliciet op een vergelijking van niveaus. Immers, we mogen aannemen dat de luisteraar, zeker wat de lokalisatie van secundaire en tertiaire klemtoon betreft, de twee in aanmerking komende syllaben intern met elkaar vergelijkt en vervolgens de benoeming uitvoert. Het blijft echter mogelijk dat in een werkelijk paarsgewijze aanbieding de klemtoonniveaus beter discrimineerbaar blijken dan onze resultaten doen vermoeden. Verdere experimentatie is dan ook gepland; de conclusies die aan het nu besproken experiment zijn verbonden moeten dus als voorlopig worden beschouwd.
| |
Bibliografie
Booij, G.E. (1977) Dutch morphology. A study of word formation in generative grammar, Lisse: The Peter de Ridder press. |
Chomsky, N. & Hall, M. (1968) The Sound Pattern of English, New York: Harper and Row. |
Liberman, M. & Prince A. (1977) On stress and linguistic rhythm, Linguistic Inquiry, 8, 249-336. |
Lieberman, P. (1965) On the acoustic basis of the perception of intonation by linguists, Word, 21, 40-54. |
Nakatani, L.H. & Aston, C.H. (1978) Perceiving stress patterns of words in sentences, Journal of the Acoustical Society of America, 63: S55(A). |
Wiedeman, C.F. & Fenster C.A. (1978) The use of chance corrected percentages of agreement to interpret the result of a discriminant analysis. Educational and Psychological Measurement, 38, 29-35. |
|
|