Voortgang. Jaargang 28
(2010)– [tijdschrift] Voortgang– Auteursrechtelijk beschermd
[pagina 51]
| ||||||||||||||||||
Productiviteit in taal en taalgebruik
| ||||||||||||||||||
1. InleidingIn deze bijdrage wil ik enkele overwegingen presenteren met betrekking tot de notie productiviteit in de morfologie.Ga naar voetnoot1 Dit begrip heeft zich in de afgelopen decennia ontwikkeld tot een van de centrale noties in het morfologisch onderzoek, maar voor veel studies waarin dit begrip gebruikt wordt, geldt nog steeds wat Aronoff al meer dan dertig jaar geleden schreef: The term productivity is widely used in studies of derivational morphology, and there is obviously some intuition behind the usage, but most of the discussion of it is rather vague. (Aronoff 1976: 35) Aronoff was niet de enige die de discussie over productiviteit vaag vond. Vergelijkbare opmerkingen vindt men wel vaker, zo bijvoorbeeld bij Mayerthaler (1981), die productiviteit een van de meest onduidelijke begrippen van de taalkunde noemt.Ga naar voetnoot2 De afgelopen twintig jaar kon er weliswaar veel vooruitgang worden geboekt in het onderzoek naar morfologische productiviteit, maar tot een algemeen aanvaarde definitie heeft dat niet geleid. Rainer (1987) geeft een mooi overzicht van productiviteitsbegrippen waarin hij constateert dat er minimaal zes verschillende definities in gebruik zijn voor dit verschijnsel. In de tussenliggende tijd is | ||||||||||||||||||
[pagina 52]
| ||||||||||||||||||
dat zeker niet beter geworden, integendeel - ik heb het idee dat het begrip door recente inzichten vanuit de hoek van de zogenaamde ‘usage-based approaches’ binnen de taalkunde juist weer vager en onduidelijker geworden is. Het afscheid van Ariane van Santen van de universiteit leek me een goede gelegenheid om nog eens een paar aspecten van de discussie over productiviteit op een rijtje te zetten. Van Santen heeft immers een heel proefschrift gewijd aan dit verschijnsel en de titel van haar dissertatie heb ik daarom ook gekozen als titel voor deze bijdrage. Het gaat om morfologische productiviteit in taal en taalgebruik en ik zal proberen een aantal problemen omtrent het gebruik van de notie productiviteit te verduidelijken door een gecombineerd synchroon-diachrone benadering. | ||||||||||||||||||
2. ProductiviteitsopvattingenIemand die intensief nagedacht heeft over de theoretische inbedding van het verschijnsel en het begrip productiviteit is Mark Aronoff. Hij suggereert dat productiviteit per definitie een diachrone notie is (om vervolgens een ander standpunt te kiezen). Men zou kunnen zeggen, schrijft hij, dat een regel A productiever is dan een regel B, wanneer er meer woorden worden gevormd volgens regel A in een bepaalde periode. We vergelijken bepaalde momenten in de geschiedenis van een taal en daarom is productiviteit een diachrone aangelegenheid (Aronoff 1980: 71-72). Dit komt er dus op neer dat we de productiviteit van een morfologisch procedé meten door woorden te tellen. Vergelijkbaar formuleert Bauer: A morphological process can be said to be more or less productive according to the number of new words which it is used to form. (Bauer 1983: 100) Nu lijkt het common sense in de morfologie dat dit geen goede definitie is van productiviteit. Dit heeft vooral te maken met het feit dat productiviteit wordt opgevat als een synchrone en generatieve notie, een notie die te maken heeft met regels en mogelijkheden. In de morfologie wordt vaak de definitie van Henk Schultink als uitgangspunt genomen: Onder produktiviteit als morfologisch fenomeen verstaan we [...] de voor de taalgebruikers bestaande mogelijkheid door middel van het morfologisch procédé dat aan de vorm-betekeniscorrespondentie van sommige hun bekende woorden ten grondslag ligt, onopzettelijk een in principe niet telbaar aantal nieuwe formaties te vormen. (Schultink 1961: 113) | ||||||||||||||||||
[pagina 53]
| ||||||||||||||||||
Het gaat dus om de mogelijkheid om nieuwe woorden te vormen. Dit correspondeert mooi met de taakomschrijving die Aronoff gegeven heeft voor de morfologie. Volgens hem is het de taak van de morfologie (‘the least we demand of it’) dat we bepalen wat de mogelijke woorden van een taal zijn. Just as the simplest goal of a syntax is the enumeration of the class of possible sentences of a language, so the simplest task of a morphology, the least we demand of it, is the enumeration of the class of possible words of a language. (Aronoff 1976: 17-18) Productiviteit is dus in wezen een generatieve notie en de taak van de morfoloog is het de klasse van mogelijke woorden te bepalen. Dit gebeurt in de literatuur over het algemeen met behulp van woordvormingsregels. Productieve woordvormingsregels hebben dan ook twee functies: ze verantwoorden de vorm-betekenissystematiek van bestaande woorden en ze definiëren de mogelijke gelede woorden van een taal (vgl. Booij & Van Santen 1998: 52). Taalgebruikers hebben, aldus Booij & Van Santen, zich een regel eigen gemaakt waarmee ze nieuwe woorden kunnen vormen. Hun kennis van paradigmatische correspondenties hebben ze omgezet in syntagmatische regels waarmee ze (nieuwe) woorden vormen (Booij & Van Santen 1998: 49). De notie productiviteit is daardoor direct gekoppeld aan dit concept van een morfologische regel. Ter illustratie geef ik een voorbeeld van een dergelijke regel. (1) In tegenstelling tot syntactische regels of regels in de flexie zijn woordvormingsregels echter vaak niet absoluut productief; ze kunnen niet altijd worden toegepast. Productiviteit is in de morfologie geen kwestie van alles of niets, maar het is een kwestie van meer of minder, een kwestie van graad. There are two important things to notice about productivity. The first is that productivity is not all or nothing, but a matter of more or less, and the second is that it is a synchronic notion. (Bauer 2003: 70) Er zijn allerlei beperkingen en belemmeringen op de toepassing van synchrone woordvormingsregels. Zo kan de zojuist geformuleerde regel voor afleidingen met het prefix ge- niet worden toegepast op reeds geprefigeerde woorden: *geverander of *geomkoop lijken geen mogelijke woorden in het Nederlands. Volgens Taeldeman, die zich intensief met deze ge-afleidingen heeft bezig gehouden, heeft dat te maken met ‘de algemene restriktie dat het basiswerkwoord ongeleed moet zijn’ (Taeldeman 1985: 35). De productiviteit van het procedé wordt door deze beperking belemmerd. Dergelijke beperkingen zijn | ||||||||||||||||||
[pagina 54]
| ||||||||||||||||||
belangrijk: ze dienen om de productiviteit van een regel te definiëren. De productiviteit van een woordvormingsregel wordt dus bepaald door het aantal en de zwaarte van de beperkingen op de mogelijke input, de mogelijke basiswoorden. Dit inzicht heeft geleid tot een opvatting van productiviteit als omgekeerd evenredig aan het aantal restricties waaraan een procedé onderworpen is. Deze opvatting vinden we in deze of vergelijkbare vorm niet alleen bij Taeldeman, maar ook al bij Booij (1977: 120) of bij Van Marle (1985). Taeldeman heeft ervoor gepleit om dergelijke restricties te beschouwen als deel van de woordvormingsregel en dit aspect wordt vervolgens door Van Santen verder uitgewerkt. In haar proefschrift beweert ze dat er absolute beperkingen zijn die het domein van de woordvormingsregel beperken. De genoemde beperking dat de basiswoorden voor ge-afleidingen ongeleed moeten zijn, zou zo'n absolute beperking kunnen zijn (maar zie de tegenvoorbeelden hieronder). De regel zou in dat geval moeten worden aangepast: niet alle werkwoorden kunnen dienen als input, maar alleen de ongelede werkwoorden. Met deze aanpassing is de regel weer productief in de absolute zin: ze definieert de mogelijke woorden, ze definieert die woorden die ‘grammaticaal’ zijn. Van Santen schrijft over dergelijke absolute restricties: De absolute beperkingen waaraan de basis van produktieve procédés onderworpen is, moeten niet gerelateerd worden aan de graad van produktiviteit van deze procédés. Dergelijke beperkingen vormen geen belemmeringen voor de uitbreiding van een procédé; zij hinderen het procédé in kwestie niet, maar verhinderen dat het procédé wordt geprojecteerd op nieuwe basiswoorden die niet tot het oorspronkelijke domein behoren. (Van Santen 1992: 59) Als men een woordvormingsregel maar nauwkeurig genoeg formuleert, als men de mogelijke basiswoorden maar nauwkeurig genoeg definieert, dan is productiviteit dus toch een absolute notie: een woordvormingsregel is productief of niet. Naast de absolute beperkingen - die deel uitmaken van het taalsysteem - zijn er volgens Van Santen ook relatieve restricties, of misschien beter relatieve voorkeuren: In mijn opvatting definiëren de absolute beperkingen op de basis van een procédé de mogelijke woorden, terwijl de realisering daarvan - en daarmee de graduele produktiviteit - niet alleen afhankelijk is van een ‘niet-inherente restrictie’ als blokkering, maar ook van relatieve voorkeuren voor een bepaald type basiswoorden. (Van Santen 1992: 126) En om haar opvatting van graden van productiviteit te preciseren introduceert ze het onderscheid tussen ‘mogelijke’ en ‘waarschijnlijke’ woorden: Waarschijnlijke woorden zijn die mogelijke woorden die, gegeven de veelheid aan factoren die de bruikbaarheid van een geleed woord bepalen, meer in aanmerking | ||||||||||||||||||
[pagina 55]
| ||||||||||||||||||
komen voor realisering dan andere. Waarschijnlijkheid is een gradueel begrip. (Van Santen 1992: 87) Hier gaat het dus bijv. om semantische of pragmatische factoren die ervoor kunnen zorgen dat een bepaald woord - hoewel mogelijk - toch niet wordt gevormd. Niet alle mogelijke woorden zijn ook waarschijnlijke woorden (Booij & Van Santen 1998: 64). De relatieve restricties/voorkeuren bepalen de graad van productiviteit van een woordvormingsregel; de productiviteitsgraad is ‘de mate waarin van een bepaald procédé gebruik gemaakt wordt’ (Van Santen 1992: 91). Deze opvatting van productiviteit is sindsdien geworden tot een gangbare opvatting die we in vergelijkbare vorm vaak terugvinden in veel literatuur over morfologische productiviteit. Zo maakt bijv. Laurie Bauer in zijn boek over Morphological Productivity een verschil tussen ‘availability and profitability’ (Bauer 2001: 205 e.v.), dat direct correspondeert met Van Santens onderscheid tussen mogelijke en waarschijnlijke woorden. Voor hem zijn woordvormingsregels beschikbaar voor nieuwvormingen of niet. In die zin is productiviteit een absolute notie en ‘availability’ is een eigenschap van het taalsysteem. Daarnaast zijn er echter allerlei relatieve beperkingen (‘constraints’) en voorkeuren die bepalen hoe ‘profitable’ een regel is. Niet alle mogelijke woorden zijn even waarschijnlijk. In die zin is productiviteit een graduele notie. ‘Profitability’ is een eigenschap van het taalgebruik en wordt bepaald door taalnormen. Availability and profitability both have the same apparent effect on the number of coinages, but the causes of these apparently similar effects are distinct: availability is a matter of what the language system determines; profitability is a matter which is determined by language norms. (Bauer 2001: 209-210) Van Santens onderscheid tussen mogelijke en waarschijnlijke woorden is een theoretisch goed doordachte onderscheiding die goed past bij het concept van woordvormingsregels zoals dat in het laatste kwart van de afgelopen eeuw is ontwikkeld. Problematisch is echter dat dit verschil in de realiteit vaak moeilijk te maken is (waar trouwens zowel Van Santen als ook Bauer ook zelf op wijzen). En we zien dan ook dat de effecten van beide soorten van productiviteit in concreet onderzoek vaak samen worden genomen, waardoor de onderscheiding dan toch weer erg vaag wordt (vgl. bijv. Bauer 2001: 210). Bovendien blijkt dat ook beperkingen die op het eerste gezicht absoluut lijken, dat bij nadere inspectie vaak toch niet zijn. Neem nog een keer het geval van de ge-afleidingen, waarvoor we hadden gezegd dat die alleen mogelijk zijn op basis van ongelede werkwoorden. Zoals Mackenzie (1985) al heeft laten zien zijn er wel degelijk ook afleidingen op basis van gelede werkwoorden, die misschien minder waarschijnlijk zijn, maar toch niet onmogelijk. Als men even zoekt op Google, dan komt men bijvoorbeeld tal van woorden tegen op basis van werkwoorden met het prefix her- (zoals dat | ||||||||||||||||||
[pagina 56]
| ||||||||||||||||||
geherkauw, al dat geherdenk), op basis van scheidbaar samengestelde werkwoorden (dat geuitstel/uitgestel, genapraat/nagepraat) of ook op basis van werkwoorden met het prefix ver- (dat geverkoop, dat geverkleed). Dergelijke afleidingen worden ook besproken door Van Santen (1992: 84). Zij wijst erop dat het procedé ‘stroef’ werkt op basis van werkwoorden met een onscheidbaar prefix als be- of ver-, terwijl het bijvoorbeeld weer wat makkelijker gaat met werkwoorden met een beklemtoond prefix als her-. We hebben kennelijk te maken met een fonologische factor: de directe opeenvolging van twee onbeklemtoonde prefixen lijkt problematisch (vgl. ook Booij & Van Santen 1998: 65). Een mogelijke manier om dergelijke gevallen te verantwoorden zou zijn de regel nog een keer aan te passen en de restricties beter te definiëren. Of, alternatief, we zien de ongeleedheidsbeperking toch niet als absolute maar als een relatieve restrictie op prefigering met ge-. We zouden dan kunnen proberen om relatieve voorkeuren voor bepaalde types basiswoorden te definiëren. Een derde mogelijkheid is de introductie van het concept ‘morfologische creativiteit’: terwijl productiviteit een absolute notie blijft, gekoppeld aan een regel, zijn taalgebruikers ook in staat om creatief af te wijken van deze regel. Daarvoor wordt dan vaak een beroep gedaan op analogie. Deze opvatting is bijvoorbeeld verdedigd door Van Marle (1985), maar volgens mij verschuiven we het probleem daarmee alleen maar. De vraag is dan waar de grens ligt tussen productiviteit en creativiteit. Uiteindelijk zijn dit echter reparatiepogingen voor een benadering die in mijn ogen niet te repareren valt, maar principieel onjuist is. De regel-aanpak met zijn verschil tussen absolute restricties en relatieve restricties (of relatieve voorkeuren) doet geen recht aan de talige realiteit en leidt niet tot een goed begrip van productiviteit en talige dynamiek. Met deze inschatting bevind ik me in goed gezelschap: in haar recente publicaties neemt ook Ariane van Santen een zeer vergelijkbaar standpunt in; illustratief is in dit opzicht haar bijdrage voor dit nummer van Voortgang. In wat volgt zal ik de aangesneden kwesties bespreken vanuit een diachroon perspectief. Daarbij zal blijken dat de problemen niet kleiner maar groter worden wanneer we proberen een historische dimensie te integreren in onze productiviteitsopvattingen. Ik zal ten slotte pleiten voor een output-gerichte benadering van morfologische processen en voor analogie als centraal mechanisme in de woordvorming. Ik kies voor een taalgebruiksperspectief en voor een probabilistische notie productiviteit omdat daardoor mijns inziens een adequatere omgang met het dynamische karakter van morfologie en taal in het algemeen mogelijk wordt. | ||||||||||||||||||
[pagina 57]
| ||||||||||||||||||
3. Diachrone aspectenDe hierboven gepresenteerde productiviteitsopvattingen zijn (ook) in de diachrone morfologie vaak moeilijk te hanteren. Productiviteit wordt immers, zoals we gezien hebben, over het algemeen opgevat als een synchrone notie en zegt iets over de mogelijke (en/of waarschijnlijke) woorden volgens een bepaalde regel op een bepaald moment. That is, we can speak of productivity in synchronic terms, or of changes in productivity in diachronic terms, but not of productivity as such in diachronic terms. (Bauer 2003: 74) Als men zich in het diachrone onderzoek wil richten op productiviteitsveranderingen, dan moet men eigenlijk aangeven welk aspect van productiviteit bedoeld is. Hebben we het over veranderingen in de taalsystematische beperkingen op een algemene regel? Of gaat het om relatieve restricties en verschuivingen in de graad van productiviteit, in de waarschijnlijkheid van toepassing van de regel? Voor oudere taalfases is dat moeilijk te bepalen. We beschikken immers alleen over geattesteerde woorden in teksten. Het beschikbare tekstcorpus zegt niets over mogelijkheden en waarschijnlijkheden. We kunnen niet beoordelen of een niet geattesteerd woord grammaticaal en mogelijk is volgens een bepaalde regel. We weten ook niet of de realisatie ervan waarschijnlijk is. Erger nog: we weten niet eens of er (voor de taalgebruikers) überhaupt een productieve regel was... Historische studies over morfologie zijn vaak gebaseerd op historische woordenboeken als het Oxford English Dictionary (OED), het Deutsches Wörterbuch van de gebroeders Grimm of het Woordenboek der Nederlandse Taal (WNT). Daar zitten een heleboel methodologische problemen aan vast (vgl. hiervoor o.a. Plag 1999 of Baayen 2009), maar het is een pragmatische aanpak die ook een heleboel interessante gegevens kan opleveren. Aan de hand van de dateringen wordt er gekeken welke woorden in een bepaalde tijd voor het eerst geattesteerd zijn en die attestaties worden geïnterpreteerd als neologismen volgens een bepaald procedé. We tellen en beschrijven de gevonden regelmaat in de nieuwvormingen. En de gehanteerde productiviteitsopvatting komt in feite weer neer op ‘het aantal nieuwe woorden die ontstaan zijn op basis van een bepaald morfologisch procedé’ (vgl. Bauer 1983: 100; zie hierboven). Daarmee zijn we in zekere zin terug bij af. Ook de mogelijkheid om gebruik te maken van historische tekstcorpora brengt geen wezenlijke verandering in dit dilemma. Los van het praktische probleem dat we voor veel talen (bijv. voor het Nederlands) nog steeds niet beschikken over goede historische corpora, blijft het meer principiële probleem overeind. Ook op basis van tekstcorpora blijft de bepaling van (de graad van) productiviteit als synchroon verschijnsel moeilijk of zelfs onmogelijk. Over het algemeen kan men proberen om op basis van de ge- | ||||||||||||||||||
[pagina 58]
| ||||||||||||||||||
attesteerde woorden een regelmaat te abstraheren. Vervolgens kan men door de vergelijking van taalmateriaal uit verschillende fases misschien een verandering afleiden die kan worden geïnterpreteerd als een verandering in productiviteit. Ook daarbij blijft dan echter nog steeds de vraag overeind over welke definitie van productiviteit we het hebben. Als hier überhaupt aandacht aan wordt besteed in diachrone studies (wat niet zo vaak gebeurt), dan gaat het over de kwalitatieve notie van productiviteit, dan wordt de productiviteit van een procedé weer bepaald als omgekeerd evenredig aan de restricties en productiviteitsverandering wordt gezien als een verandering van deze restricties. Dat wordt bijvoorbeeld voorgesteld door Cowie & Dalton-Puffer en dat is ook de opvatting die ten grondslag ligt aan het onderzoek van Carmen Scherer: Let us first turn to applications of the qualitative notion of productivity. If productivity is taken to express the combined effect of the restrictions on a morphological process, it follows that changes in productivity will go hand in hand with changes in the restrictions and vice versa. It should therefore be possible to trace the productivity of a given affix over time by tracing the restrictions that affect it. Very little work, however, has been done in this direction. (Cowie & Dalton-Puffer 2002: 421-422) De grens tussen absolute en relatieve restricities wordt in dergelijke diachrone studies veel minder strikt gehanteerd dan in synchrone studies over productiviteit. Over de vraag of iets mogelijk en waarschijnlijk is, beslist immers vooral onze intuïtie en daarom is een uitspraak hierover voor het verleden moeilijk of zelfs onmogelijk. Daarom zwijgen historische morfologen graag over productiviteit of ze hanteren deze notie op een betrekkelijk informele en pre-theoretische manier (illustratief is in dit opzicht de bundel van Habermann, Müller en Munske 2002 over Historische Wortbildung). Productiviteit wordt niet in eerste instantie ganalyseerd als ‘mogelijkheid tot nieuwvormingen’: potentialiteit wordt in de mij bekende studies over historische morfologie vervangen door wat men zou kunnen noemen ‘gerealiseerde productiviteit’ (vgl. hiervoor ook Baayen 2009). Nu is de ‘gerealiseerde productiviteit’ niet alleen voor diachrone studies interessant, ook in het synchrone onderzoek komt het daadwerkelijk gerealiseerde taalgebruik in de laatste decennia (weer) sterker in de belangstelling te staan van het taalkundig onderzoek. Vooral in de vorm van de zogenaamde ‘usage based approaches’ zien we een groeiende belangstelling voor het taalgebruik. Potentialiteit en competentie staan hier niet meer in het centrum van de belangstelling en de koppeling van productiviteit aan het generatieve regelconcept wordt in twijfel getrokken. | ||||||||||||||||||
[pagina 59]
| ||||||||||||||||||
Overigens is dat niet iets volstrekt nieuws. Zo was Jan de Vries al in 1975 van mening dat het feit dat productiviteit principieel een gradueel verschijnsel is ertoe zou moeten leiden om het regel-idee los te laten. Een regel voor een proces dat niet absoluut is, maar gradueel, is volgens hem niet zinvol: De productiviteit in de lexicale morfologie beweegt zich als het ware langs een lijn die enerzijds eindigt in een grote mate van productiviteit en anderzijds in improductiviteit. Het formuleren van regels heeft daarom geen zin. (De Vries 1975: 185) Het regelconcept is ook in het kader van de cognitieve taalkunde in twijfel getrokken. Zo wijst bijvoorbeeld Hans-Jörg Schmid op de sociale dimensie van talige regelmaat. De individuele taalgebruiker houdt zich volgens hem lang niet altijd aan de (veronderstelde) generatieve regels en beperkingen. Er ontstaan in het taalgebruik constant ‘irreguliere’ woorden en aan de andere kant worden ‘mogelijke’ woorden vaak niet gerealiseerd, waardoor er tal van (nauwelijks voorspelbare) lexicale leemtes bestaan. Volgens Schmid (2005: 119) vormen taalgebruikers nieuwe woorden op basis van voorbeelden en patronen die variabel zijn en uitzonderingen toelaten. Sommige resultaten daarvan worden door de taalgemeenschap overgenomen en geconventionaliseerd, ze gaan deel uitmaken van de woordenschat. Andere worden niet overgenomen, blijven ‘eendagsvliegen’. De geconstateerde regelmaat ontstaat dus voor een deel pas door dit selectieproces in de taalgemeenschap. Dit idee nu past volgens mij ook weer heel goed bij recente taalveranderingstheorieën als de ‘invisible hand theory’ van Rudi Keller (1990) of de opvattingen van Bill Croft.Ga naar voetnoot3 Croft (2000) ontwikkelt zijn evolutionaire benadering van taalverandering als een taalgebruikstheorie, of preciezer een ‘utterance-based theory’. Hij verdedigt de stelling dat taalverandering en biologische evolutie twee vormen zijn van een algemener evolutionair fenomeen. Een taal is voor Croft de populatie van uitingen in een taalgemeenschap. Ze worden bij elkaar gehouden door normen en conventies (gedragsregels). Taal is dus een ‘joint action’ met als doel communicatie. De biologische replicatie vindt haar parallel in wat Croft het ‘lingueem’ noemt. Dat zijn de repliceerbare structuren (klanken, woorden, constructies, patronen) die door sociaal leren worden vermenigvuldigd, die zich verspreiden in een taalgemeenschap, maar die ook kunnen verdwijnen. De replicatie van linguemen leidt zelf weer tot uitingen en selectie vindt plaats op basis van die uitingen, waarbij vooral de ‘altered replications’ van belang zijn, de individuele afwijkingen van de standaard, van de norm. Selectie kan leiden tot verspreiding en verankering (‘entrenchment’) van een conventie in de taalgemeenschap. Hierdoor ontstaat dus een constant conflict tussen convergentie, het instandhouden van de normen, en divergentie in de individuele realisatie van taal. | ||||||||||||||||||
[pagina 60]
| ||||||||||||||||||
Taal als populatie van uitingen. Klanken, woorden, patronen, constructies als datgene wat in het discours wordt gerepliceerd. Sociale interactie en het gebruik van taal als normconstituerende factoren - dit zijn volgens mij inderdaad geschikte ingrediënten voor een taaltheorie die verandering serieus neemt. Wat betekent een dergelijke taalgebruiks- en taalveranderingstheorie nu voor onze vraag naar de aard van het concept van morfologische productiviteit? De eerste en belangrijkste consequentie is volgens mij dat we - zoals De Vries al suggereerde - het concept van een woordvormingsregel in de zin van een generatieve regel moeten loslaten. Dit is volgens mij ook om andere redenen, redenen die los staan van de discussie over de notie productiviteit, geboden. Zo heeft bijv. Plag (2004) overtuigend aangetoond dat de koppeling van het concept woordvormingsregel aan de categorie van de mogelijke basiswoorden problematisch is. Hij verzet zich tegen Aronoffs ‘Unitary Base Hypothesis’ (1976) en laat zien dat de woordsoort van het basiswoord een ondergeschikte rol speelt voor de vorming van een afleiding. Volgens hem zijn het vooral de semantische eigenschappen van de output (de afleiding zelf) die verantwoordelijk zijn voor de realisatiekansen van een woord.Ga naar voetnoot4 Nog een keer ge- ter illustratie. Dit prefix kan niet alleen voor deverbale afleidingen worden gebruikt (gezeur), maar ook voor denominale afleidingen (2) en voor afleidingen op basis van een adjectief (3), een interjectie (4) of een woordgroep (5) (vgl. hiervoor ook Tálasi 2009). (2) | ||||||||||||||||||
[pagina 61]
| ||||||||||||||||||
Een regelaanpak moet dergelijke afleidingen als creatieve uitzonderingen beschouwen of aparte regels voor de diverse basiscategorieën formuleren.Ga naar voetnoot5 Daardoor missen we echter de overeenkomst tussen al die gevallen: telkens gaat het om de karakterisering van menselijk gedrag dat negatief gewaardeerd wordt. Als we het taalgebruik centraal stellen, dan moeten we ook dergelijke generalisaties adequaat verantwoorden. Voor de realiseringskans van een afleiding lijken de output-eigenschappen, de eigenschappen van de afleiding zelf, veel belangrijker dan (de woordsoort van) de basiswoorden. Een taalgebruikstheorie van taal en taalverandering, woordvorming op basis van voorbeelden en het primaat van de eigenschappen van de output - dit leidt tot een opvatting van morfologische productiviteit, waarbij deze output centraal staat. Een mogelijkheid om de factoren adequaat te verantwoorden die de (nieuw)vorming van morfologisch complexe woorden bepalen, biedt volgens mij een analogie-benadering van woordvormingsprocessen. | ||||||||||||||||||
4. AnalogieAnalogie is een van de sleutelbegrippen uit de historische taalkunde. Vaak wordt analogie zelfs gelijkgesteld met ‘analogical change’. Onderzoek naar historische fonologie en naar flexieverschijnselen gebruikt analogie om generalisaties en regularisaties (bijvoorbeeld in morfologische paradigma's) te verantwoorden. Belangrijke concepten in dit verband zijn ‘analogical levelling’ (of ‘Ausgleich’) en ‘analogical extension’ (vgl. hiervoor bijv. Van Bree 1996). Heel in het algemeen kan analogie worden gezien als de verwerking van overeenkomsten tussen opgeslagen instanties van taal. Het bekendste type van analogie is de zogenaamde proportionele analogie. Proportionele analogie is een specifiek geval van analogie, waarbij twee relaties een rol spelen. Het gaat om het oplossen van een vergelijking die bestaat uit vier elementen, zoals in bakken : bakker :: brouwen : X. De variabele X kan worden ingevuld op basis van de relatie met brouwen en bakker. Daarnaast zijn er ook niet-proportionele analogietypes, waarbij maar één relatie in het geding is. Hier zijn vooral de overeenkomsten tussen woorden van belang die bijvoorbeeld op basis van hun semantiek vergelijkbaar zijn. Dit type wordt in de historische taalkunde vaak ingeroepen ter verklaring van herinterpretaties en volksetymologie (denk aan klassieke voorbeelden als hamaca > hangmat). De nieuwe vorm wordt in dergelijke gevallen verklaard als heranalyse van de oorspronkelijke vorm op basis van de betekenis en door middel van analogie. | ||||||||||||||||||
[pagina 62]
| ||||||||||||||||||
Als synchrone notie wordt analogie vaak gezien als een soort aanvulling bij een regel-aanpak: het regelmatige patroon wordt verantwoord door middel van een symbolische regel, de ‘creatieve’ nieuwvormingen, de uitzonderingen op de regel, worden verantwoord door middel van analogie. Toch is analogie ook zeer geschikt om de synchrone regelmaat in taal te verantwoorden en op basis van de voorafgaande paragrafen lijkt het zinvol om nog eens opnieuw na te denken over de rol van analogie in de woordvorming. Misschien heeft Bauer het immers bij het rechte eind, wanneer hij schrijft: It might [...] be worth speculating whether language users work by analogy whereas linguists interpret such behaviour in terms of rules, so that a linguist's description is inevitably a fiction. (Bauer 1983: 296) Met de opkomst en bloei van de diverse taalgebruikstheorieën in de taalkunde krijgt Bauers speculatie mijns inziens nieuwe relevantie: het is nog maar de vraag of taalgebruikers werken met abstracte regels of via generalisaties over opgeslagen exemplaren van taalgebruik. Er is in de afgelopen jaren veel evidentie beschikbaar gekomen voor het belang van analogie door onder andere cognitief taalkundig onderzoek en door psycholinguïstische experimenten. Dit onderzoek wijst erop dat exemplaren van taalgebruik zijn opgeslagen en dat analogie wordt ingeroepen voor de verwerking en de productie van taal op basis van deze opgeslagen informatie. In dit verband kan bijvoorbeeld worden verwezen naar het onderzoek van Harald Baayen en zijn collega's (Ernestus & Baayen 2004; Krott et al. 2001). Ook Joan Bybee wijst op het belang van analogie niet alleen voor de verklaring van ‘uitzonderingen’, maar ook voor regelmatige patronen. Even the most general of patterns - for example, the patterns associated with the English auxiliary and Past Tense - can be explained as the by-products of exemplar clusters that are fully schematic, and thus highly productive. The fact that they have developed gradually over time, are acquired piecemeal, and have idiosyncrasies argues against description by a symbolic rule (Bybee 2010: 64) Volgens haar is het voldoende om voor de taalverwerking één mechanisme aan te nemen dat werkt op verschillende niveaus. Er is sprake van een continuüm: sommige nieuwvormingen zijn gebaseerd op een kleine groep analoge voorbeelden (soms ook op één voorbeeld), andere op een groep voorbeelden die een zeer regelmatig en schematisch patroon vertonen. Het mechanisme is echter volgens Bybee altijd hetzelfde: er wordt gegeneraliseerd door middel van analogie en op basis van bekende exemplaren of exemplaarclusters. With a single processing mechanism, an analogical model can handle the same range of data that is handled in the dual-processing model by two mechanisms. Thus the | ||||||||||||||||||
[pagina 63]
| ||||||||||||||||||
burden of proof is on those who propose two processing mechanisms rather than one and a discrete division between the two rather than a continuum.’ (Bybee 2010: 74) Dit idee - dat we ook al in oudere taalkundige studies vinden, o.a. bij Hermann Paul (1920: 110) - is de afgelopen jaren verder uitgewerkt onder andere in de vorm van computermodellen. Er is geprobeerd om een basisinzicht te verantwoorden, namelijk het inzicht dat weliswaar in principe elke analogie kan leiden tot nieuwvormingen, maar dat niet alle analogieën even waarschijnlijk zijn. Van de principieel mogelijke modelwoorden zijn niet alle woorden even geschikt als voorbeeld. De factoren die het toepassen van bepaalde analoge relaties in de productie en de verwerking van taal beïnvloeden, kunnen door middel van deze modellen worden geformaliseerd en getoetst. Bekende voorbeelden van dergelijke analogiemodellen zijn Analogical Modeling of Language van Skousen (1989) of het Memory-Based Learning model van Daelemans & Van den Bosch (2005). Voor de details van deze modellen en voor een toepassing ervan verwijs ik graag naar het artikel van Folgert Karsdorp en Barend Beekhuizen in dit nummer van Voortgang. De cruciale aanname is dus dat woordvorming (en taalproductie in het algemeen) niet regelgebaseerd is, maar ‘instance-based’. Het analogiemodel is geen aanvulling bij een regelaanpak, maar een vervanging daarvan. Analogical Modeling is not a model to use only when rules fail to describe behavior or change; the model invokes analogy whenever we produce language. (Chapman & Skousen 2005: 335) In een dergelijke analogiebenadering bestaan er geen woordvormingsregels zoals hierboven beschreven en ook een concept als ‘ongrammaticaliteit’ vindt daarin geen plaats. In principe is alles mogelijk waarvoor de taalgebruiker een analogie vindt in het taalgebruik, maar niet alles is even waarschijnlijk. De hele morfologie wordt daarmee op een schaal geplaatst van ‘extreem onwaarschijnlijke’ naar ‘zeer waarschijnlijke’ (nieuw)vorming, waarbij de waarschijnlijkheid wordt bepaald door formele, semantische, pragmatische, stilistische of sociolinguïstische factoren. En ook factoren als context en tekstsoort spelen een rol. Het grote voordeel van deze benadering is in mijn ogen dat ze door haar focus op de morfologische output, de daadwerkelijk gebruikte woorden, een aantal bezwaren niet kent die hierboven voor de regelaanpak geformuleerd zijn. Bovendien past de analogie-aanpak uitstekend bij een (evolutionaire) taalveranderingstheorie zoals de zojuist geschetste theorie van Croft die eveneens het taalgebruik centraal stelt. Talige dynamiek komt voort uit het taalgebruik en taalverandering moet worden gezien als een geleidelijk proces, waarbij de waarschijnlijkheden van de toepassing van een bepaalde analogie in en door het taalgebruik veranderen. De regelaanpak kent alleen abrupte veranderingen: een regel wordt vervangen door een andere. Vaak wordt verondersteld dat dat | ||||||||||||||||||
[pagina 64]
| ||||||||||||||||||
vooral gebeurt in het taalverwervingsproces. In een taalgebruiksbenadering kan meer recht worden gedaan aan talige dynamiek en de oorzaak voor taalverandering is te zoeken in het feit dat taal gebruikt wordt.Ga naar voetnoot6 Daarom zijn analogiebenaderingen volgens mij ook zeer geschikt voor het modelleren van taalverandering. Daar is op dit moment nog weinig onderzoek naar gedaan, maar Chapman & Skousen (2005) hebben hun model (Analogical Modeling) bijv. toegepast op de vorming van adjectieven met negatieve prefixen (un-able, im-possible, dis-connected enz.) in de geschiedenis van het Engels. Hoewel het model zeker nog niet volmaakt is, slagen ze erin met een waarschijnlijkheid van (in veel gevallen ver) boven de 75% goed te voorspellen, welk van de negatieve prefixen in de verschillende fases van het Engels wordt gekozen voor een bepaalde afleiding. The appeal of such an approach for explaining language change should be apparent. The same mechanism that produces language produces language change. Speakers invoke analogy every time they produce language, so the potential for creating new forms is present with every utterance. (Chapman & Skousen 2005: 340) Door hun focus op het taalgebruik en op grond van het feit dat ze allebei ‘utterance-based’ zijn, vullen de gepresenteerde benaderingen elkaar naar mijn mening uitstekend aan. Ze bieden een goede basis voor een adequate verantwoording van morfologische productiviteit en de verandering ervan. De vraag echter wat de notie morfologische productiviteit nu precies inhoudt, is daarmee nog niet beantwoord. Het zal duidelijk zijn, dat elke definitie en formalisering van deze notie recht moet doen aan het principieel graduele karakter ervan. De strikte onderscheiding van ‘mogelijke’ en ‘waarschijnlijke’ woorden houdt uiteindelijk niet stand: er zijn alleen graden van waarschijnlijkheid. De notie productiviteit is daarmee per definitie een probabilistische. Het ligt voor de hand om in dit verband nog een keer te verwijzen naar het werk van Harald Baayen, die in de afgelopen vijfentwintig jaar verschillende corpusgebaseerde maten ontwikkeld heeft om verschillende aspecten van morfologische productiviteit te verantwoorden (zie o.a. het overzicht in Baayen 2009). Hierbij kent hij een groot belang toe aan de zogenaamde ‘hapax legomena’, die woorden dus, die maar één keer voorkomen in een corpus. Het idee daarachter is dat woorden met een extreem lage tokenfrequentie (in het geval van hapaxen is dat 1) minder bekend zijn en misschien ook wel nieuw. Ze moeten daarom worden geanalyseerd en geïnterpreteerd en dat leidt ertoe dat de taalgebruiker zich bewust wordt van het mechanisme dat geleid heeft tot de vorming van dit woord. En daardoor wordt het weer waarschijnlijker dat dit mechanisme ook wordt toegepast op andere (nieuw)vormingen. Bybee is het met dit idee in principe | ||||||||||||||||||
[pagina 65]
| ||||||||||||||||||
eens: constructies of morfologische categorieën waarvan de leden (bijna) allemaal een hoge tokenfrequentie hebben, hebben de neiging niet productief te zijn. Dergelijke types (of woorden) worden verwerkt zonder andere exemplaren erbij te betrekken, ze worden gewoon opgehaald uit het geheugen. Een zekere mate van ‘parsing’ is echter voorwaarde om een procedé productief te kunnen gebruiken. Toch is volgens haar typefrequentie wel degelijk een belangrijke factor voor productiviteit, wanneer we een analogiebenadering hanteren: Given that the mechanism behind productivity is item-specific analogy, a construction with a high type frequency slot will be more likely to be used to form a novel utterance than one with lower type frequency, simply because there are more candidates on which to base the analogy. (Bybee 2010: 95) Een groot aantal types van een bepaalde categorie is in ieder geval een teken voor hoge gerealiseerde productiviteit. In die zin is productiviteit een diachrone notie. Dat alleen zegt echter nog weinig over de synchrone productiviteit, in de zin van ‘expanding productivity’ of ‘potential productivity’ (Baayen 2009). Het is duidelijk dat voor een goed begrip van het verschijnsel diachrone en synchrone, typegebaseerde en tokengebaseerde perspectieven met elkaar zullen moeten worden gecombineerd. Bovendien is inmiddels wel duidelijk dat productiviteit niet alleen door taalstructurele factoren wordt beïnvloed. Factoren als register of stijl of ook de tekstsoort, sociolinguïstische factoren als sekse of leeftijd van de spreker, regionale factoren enz. - ze spelen allemaal een rol voor de mate van uitbreidbaarheid van een bepaalde morfologische categorie. Interessant zijn ook recente psycholinguïstische resultaten en inzichten. Zo gaan we er over het algemeen van uit dat productiviteit een teken is van systematiek en dat systematische processen door taalgebruikers makkelijk en snel kunnen worden verwerkt. Zelfs dat is echter geenszins vanzelfsprekend. Zo laten Plag & Baayen (2009) zien dat de gemiddelde verwerkingstijd voor afgeleide woorden afneemt naarmate het derivationele suffix van het woord minder productief is. Productieve procedés met veel verschillende types lijken decompositie en analyse van de betrokken woorden te stimuleren, terwijl de leden van minder productieve procedés vaker uit het geheugen worden opgehaald, wat cognitief voordeliger lijkt (woordherkenning gaat sneller). Ze speculeren dat dit ‘may help explain the general trend for affixes to gravitate toward the unproductive over time’ (Plag & Baayen 2009: 149). Dit alles maakt duidelijk dat het onderzoek naar morfologische productiviteit van de afgelopen decennia in zekere zin meer vragen dan antwoorden opgeleverd heeft. En het wordt ook duidelijk dat alleen multifactoriële benaderingen kunnen leiden tot een beter begrip van het intrigerende verschijnsel productiviteit. | ||||||||||||||||||
[pagina 66]
| ||||||||||||||||||
5. BesluitDe notie productiviteit heeft een synchrone en een diachrone kant die in het onderzoek tot nu toe naar mijn mening nog veel te weinig geïntegreerd zijn. Om te komen tot een goed begrip van talige dynamiek lijkt het me essentieel om beter greep te krijgen op het multifactoriële karakter van deze notie. Daarom kan ik de laatste zin van Baayens (2009) overzicht volledig onderschrijven: In short, in order to come to a full understanding of the challenging phenomenon of morphological productivity, a truly interdisciplinary data-driven effort is required. (Baayen 2009) In principe kan een ‘usage based’ benadering van taal en taalverandering in combinatie met een corpusgebaseerde en probabilistische analogiebenadering van de morfologie de veelvuldige en zeer diverse factoren die morfologische productiviteit bepalen of beïnvloeden, wel degelijk verdisconteren. Voor een goed begrip lijkt het me noodzakelijk dat morfologen, historisch taalkundigen, sociolinguïsten, psycholinguïsten, computerlinguïsten enz. samenwerken. De beschikbare corpora blijven echter de flessenhals voor grootschalig onderzoek dat ook rekening houdt met het historisch perspectief. Een voorbeeld: kleine corpora maken het heel moeilijk om gebruik te maken van hapax legomena die, zoals we gezien hebben, van groot belang is in Baayens statistische benadering. Het eenmalig optreden van een bepaald woord in zo'n corpus hoeft immers helemaal niets te zeggen over het feit of het in een bepaalde tijd frequent of minder frequent was. Het kan heel goed ook een effect zijn van de samenstelling van het corpus. Voor de geschiedenis van het Nederlands en van veel andere talen zouden we daarom moeten kunnen beschikken over veel grotere en betere (goed uitgebalanceerde en geannoteerde) corpora om tot zinvolle uitspraken over productiviteit en productiviteitsverandering te komen. Na een fase waarin de formalisering van productiviteit in de vorm van generatieve woordvormingsregels in het centrum van de belangstelling stond, is er nu een nieuwe lijn van onderzoek die volgens mij uiteindelijk zal leiden tot een realistischere kijk op het verschijnsel. We staan pas aan het begin, maar door de combinatie van oude inzichten (analogie als centraal mechanisme van taalverwerking) met nieuwe, geavanceerde methodes (zoals corpusonderzoek, psycholinguïstische experimenten en computermodellen) wordt het nu mogelijk om een belangrijke stap vooruit te doen in ons onderzoek naar productiviteit en talige dynamiek. | ||||||||||||||||||
[pagina 67]
| ||||||||||||||||||
Bibliografie
| ||||||||||||||||||
[pagina 68]
| ||||||||||||||||||
| ||||||||||||||||||
[pagina 69]
| ||||||||||||||||||
|
|