| |
| |
| |
Het taalorgaan en andere linguistische curiositeiten:
de taalkunde in het nieuwe millennium
Petra Hendriks
0. Inleiding
‘Over enkele jaren weten we precies hoe het menselijk brein functioneert en hoe mensen denken en praten. Wellicht zijn we dan zelfs in staat een menselijke robot te bouwen waarmee we een boom op kunnen zetten over de nieuwste Hollywoodfilms, de risico's van beleggen en de rare gewoontes van de buurvrouw.’ Deze gedachte zou wel eens kunnen heersen bij mensen die vanaf een afstand de stormachtige ontwikkelingen hebben gadegeslagen binnen de cognitiewetenschap. De komst van steeds snellere en steeds krachtigere computers heeft het mogelijk gemaakt om complexe cognitieve processen te simuleren op een computer. Hierdoor kan meer inzicht worden verkregen in hoe bepaalde processen van de menselijke geest verlopen of juist niet verlopen. In sommige gevallen kun je zelfs beter spreken van het uitvoeren dan van het simuleren van cognitieve processen door de computer. Daarnaast is door recente ontwikkelingen binnen de neurowetenschappen, de ontwikkelingsbiologie en de moleculaire genetica ook meer inzicht ontstaan in de processen die plaatsvinden in het menselijk brein. Samen hebben deze nieuwe onderzoeksmethoden en technieken gezorgd voor een explosieve ontwikkeling van nieuwe ideeën binnen de cognitiewetenschap en voor spectaculaire toepassingen hiervan.
Toch is er niet alleen maar reden tot optimisme. Tegelijkertijd is namelijk gebleken dat cognitiewetenschappers het op een aantal fundamentele posities oneens zijn, en dat de kloof alleen maar groter lijkt te worden. Deze kloof lijkt met name een scheiding aan te brengen tussen taalkundigen en de overige cognitiewetenschappers. Het doel van dit artikel is om de precieze aard van die kloof vast te stellen en om de gevolgen ervan te onderzoeken voor de cognitiewetenschap in het algemeen en de taalkunde in het bijzonder. Een niet denkbeeldig gevolg van deze kloof zou kunnen zijn dat het onderzoek naar taal wordt overgenomen door niet-taalkundigen, die andere uitgangspunten hanteren en zich andere vragen stellen. De vraag is dus niet alleen of, en zo ja, wanneer er een pratende robot gebouwd zal worden. Een minstens zo belangrijke vraag is of die robot ontworpen zal worden door taalkundigen of door andere cognitiewetenschappers...
| |
1. Buitenspelspeler of voortrekker?
De laatste decennia heeft de cognitiewetenschap zich sterk ontwikkeld. Maar hoewel de taalkunde een aan de cognitiewetenschap bijdragende discipline is, lijkt de huidige theorievorming binnen de taalkunde toch grotendeels los te staan van de theorievorming binnen andere deelgebieden van de cognitiewetenschap. Er zijn een aantal punten die deze stelling ondersteunen. Zo blijkt de invloed van de taalkunde op de cognitiewetenschap en omgekeerd slechts marginaal te zijn, als je dit zou afmeten aan het aantal verwijzingen in taalkundige tijdschriften naar cognitiewetenschappelijk werk
| |
| |
en omgekeerd en aan de deelname van taalkundigen aan cognitiewetenschappelijke congressen (Schunn et al., 1998). De voorspelling van Schunn et al. (1998) is dat de invloed van de taalkunde binnen de cognitiewetenschap in de toekomst alleen maar zal afnemen. Ook vanuit de taalkunde zelf wordt een kloof geconstateerd tussen de theoretische (met name generatieve) taalkunde en de rest van de wereld. Zowel Henk van Riemsdijk (1998) als Lisa Cheng en Rint Sybesma (1999) wijzen in het tijdschrift Glot International verontrust op het schijnbaar algemene onbegrip over de taalkundige ideeën van generatief-taalkundigen in het algemeen en die van Noam Chomsky in het bijzonder. Tot de onwetende rest van de wereld behoren niet alleen het algemene publiek en politici, maar ook wetenschappers uit andere disciplines en zelfs andere taalkundigen dan generatief-taalkundigen. Niet onbelangrijk is tenslotte het feit dat bepaalde taalkundige stellingnames en uitgangspunten dwars op momenteel gangbare ideeën binnen andere deelgebieden van de cognitiewetenschap staan.
De vraag die dan ook centraal staat in dit artikel is in welke mate de ideeën binnen de taalkunde verschillen van de ideeën binnen andere deelgebieden van de cognitiewetenschap. Waar de ideeën en standpunten verschillen, is de vraag wat de achterliggende oorzaken en motieven zijn. Het antwoord op deze vragen is van groot belang voor de toekomst van de taalkunde. Zet de taalkunde zichzelf buitenspel door zich af te sluiten voor relevante ontwikkelingen in aanverwante wetenschappelijke disciplines? Of is de taalkunde de voortrekker wat betreft de doorbraak van belangrijke inzichten? In het eerste geval zal de taalkunde ernstig bij zichzelf te rade moeten gaan over de te volgen weg in de toekomst. Voor de taalkunde als wetenschappelijke discipline is het ongetwijfeld funest wanneer relevante ontwikkelingen en belangrijke inzichten uit aanverwante onderzoeksgebieden worden genegeerd. Niet alleen belemmert dit mogelijke doorbraken in het onderzoek naar taal. Maar bovendien zal het, zeker wanneer uit succesvol onderzoek in de aanverwante disciplines direct uitvoerbare en nuttige toepassingen volgen, leiden tot een herschikking van beschikbare onderzoeksgelden. Theoretisch taalkundig onderzoek zal dan ongetwijfeld gemarginaliseerd worden. Maar ook in het tweede geval dient er iets te gebeuren. Als inzichten uit de taalkunde van groot belang zijn voor andere deelgebieden van de cognitiewetenschap maar dit niet wordt ingezien door andere onderzoekers en politici die over de verdeling van onderzoeksgelden gaan, dan zal dit kunnen leiden tot eenzelfde herschikking van onderzoeksgelden als in het hiervoor besproken geval. In dit tweede geval zullen taalkundigen dus veel meer dan nu hun best moeten doen om die belangrijke taalkundige inzichten over te brengen op onderzoekers binnen andere disciplines. Helderheid en explicietheid in de onderbouwing van die inzichten zijn hierbij essentieel.
Het artikel is als volgt opgebouwd. Eerst zal kort worden ingegaan op de globale ontwikkeling en ontstaansgeschiedenis van de twee te vergelijken onderzoeksdisciplines, de cognitiewetenschap en de taalkunde. De ontstaansgeschiedenis is van belang om een aantal van de huidige ideeën en standpunten goed te kunnen begrijpen. Vervolgens zullen de twee disciplines vergeleken worden wat betreft hun huidige standpunt ten aanzien van een viertal wetenschappelijke discussiepunten. Het gaat hier om vragen naar de aard van denkprocessen, de manier waarop kennis gerepresenteerd wordt, de herkomst van kennis en de domeinspecificiteit van kennis. Over deze zaken wordt niet alleen binnen de taalkunde maar ook binnen de meeste andere deelgebieden van de cognitiewetenschap een standpunt ingenomen. Hierbij dient opgemerkt te worden dat dit standpunt niet in alle disciplines even expliciet wordt verwoord, en dat
| |
| |
bovendien niet binnen elke discipline een unaniem standpunt wordt ingenomen. Het zal jammer genoeg in het bestek van dit artikel niet altijd mogelijk zijn om recht te doen aan alle standpunten binnen een discipline. Gepoogd zal worden om in ieder geval de belangrijkste standpunten te bespreken.
| |
2. De cognitieve revolutie
Cognitiewetenschap is de wetenschap van kennis en de processen die betrokken zijn bij de manipulatie van deze kennis. Kennis moet onderscheiden worden van informatie, in die zin dat kennis informatie is die ‘gekend wordt’ door een ‘kennende instantie’. Onder kennis wordt niet alleen expliciete kennis verstaan, zoals weten dat NaCl de chemische formule is voor keukenzout en dat je vorig jaar op vakantie bent geweest naar Parijs, maar ook impliciete kennis. Zo worden de vaardigheid om auto te rijden en het vermogen om te lezen gezien als vormen van impliciete kennis. Een andere indeling van kennis die wel gehanteerd wordt is die in declaratieve en procedurele kennis, waarbij declaratieve kennis globaal gesproken overeenkomt met expliciete kennis. Het gaat hierbij om kennis die relatief gemakkelijk verwoord kan worden. Procedurele kennis is vaak impliciete kennis, dat wil zeggen dat men zich meestal niet bewust is van de kennis en deze slecht kan verwoorden.
Deze verschillende soorten kennis en de verwerving en verwerking ervan worden traditioneel vanuit verschillende disciplines bestudeerd. Binnen de cognitieve psychologie staan aspecten van cognitie zoals redeneren, geheugen, leren, aandacht en beslissen centraal. Door cognitiefpsychologen wordt onderzocht hoe diverse cognitieve processen plaatsvinden en op welke wijze kennis gerepresenteerd, geleerd en gebruikt wordt. De taalkunde heeft als onderwerp van studie een specifieke vorm van onbewuste kennis, namelijk taal. In de taalkunde staan de representatie, verwerving en verwerking van taalkundige kennis centraal. De filosofie houdt zich eigenlijk al vanaf de klassieke oudheid bezig met vragen zoals wat het betekent om iets te weten en wat nu precies de relatie is tussen de menselijke geest en het menselijk brein. Verder worden binnen de filosofie logische systemen ontwikkeld die specificeren hoe geredeneerd mag worden met kennis. Van deze logische systemen wordt gebruik gemaakt binnen de taalkunde en binnen de kunstmatige intelligentie, een onderdeel van de informatica. De kunstmatige intelligentie tracht onder andere intelligente processen te modelleren met behulp van de computer. Ook de biologie kan gezien worden als een voor het onderzoek naar cognitie relevant wetenschapsgebied. Binnen de biologie wordt waarneming, dat wil zeggen de verwerving van kennis via zintuigelijke ervaring, bestudeerd. Daarnaast wordt ook binnen de biofysica onderzoek gedaan naar waarneming, maar dan vanuit een natuurkundig perspectief. Neurowetenschappers doen onderzoek naar de structuur van de hersenen en de processen die zich in de hersenen afspelen. Dit is van belang voor onderzoek naar kennis omdat de hersenen het biologische substraat vormen waarin kennis bij mensen gerepresenteerd is en met behulp waarvan manipulatie van die kennis plaatsvindt. Door sommigen worden tenslotte vakgebieden als antropologie, onderwijskunde, sociologie en geneeskunde genoemd als aan de
cognitiewetenschap bijdragende disciplines. In alle genoemde disciplines vormt kennis in een of andere vorm onderwerp van studie, hoewel de gehanteerde methode van onderzoek en de invalshoek waarmee naar die kennis wordt gekeken, verschillen.
| |
| |
Het onderzoek naar cognitie belandde in het begin van de 20ste eeuw enige tijd op dood spoor door de opkomst van het behaviorisme. Volgens het behaviorisme dienden onderzoekers zich slechts te richten op het objectief observeerbare, en zich niet in te laten met mysterieuze mentale constructies als de menselijke geest, denken en mentale symboolverwerking. De onderzoeker diende zich in zijn onderzoek alleen te richten op waarneembaar menselijk gedrag. Pas toen eind jaren '50 werd aangetoond dat deze wijze van onderzoek geen adequate verklaring zou kunnen opleveren voor complex menselijk gedrag, richtte het onderzoek in verschillende disciplines zich weer op cognitie. Zo liet Noam Chomsky in zijn kritiek op Skinners boek ‘Verbal Behavior’ (Chomsky, 1959) zien dat de structuur van taal niet verklaard kan worden door middel van simpele associatieve ketens van stimulus en respons. In plaats daarvan veronderstelde hij dat sprekers beschikken over een mentale grammatica. Deze omwenteling in het onderzoek naar menselijk gedrag wordt wel de ‘cognitieve revolutie’ genoemd. Vanaf dit moment bloeide niet alleen het onderzoek naar cognitie binnen de afzonderlijke disciplines, maar werd bovendien een groot aantal interdisciplinaire onderzoeksprojecten gestart. Inzichten uit verschillende disciplines werden gecombineerd om tot meeromvattendere modellen en theorieën te komen. Vanaf dat moment werd ook de toepassing van onderzoeksmethoden van de ene discipline op een andere discipline gemeengoed. Daarbij begon de computer in al deze disciplines een steeds grotere rol te spelen als gereedschap voor het analyseren van data en het simuleren van cognitieve processen. Dit interdisciplinaire onderzoek naar cognitie is geëvolueerd tot wat tegenwoordig een afzonderlijk onderzoeksterrein vormt: de cognitiewetenschap.
| |
3. De Chomskyaanse revolutie
Systematische bestudering van taal vindt al plaats vanaf de oudheid. De eerste naam die in dit verband genoemd moet worden is die van de Indische taalkundige Pānini (4e eeuw v. Chr.), die regels opstelde ter beschrijving van het Sanskrit. Grieken zoals Plato (429-347 v. Chr.) en Aristoteles (384-322 v. Chr.) keken vanuit een meer filosofisch perspectief naar taal. Bij hen stonden vragen centraal als: wat is de oorsprong van taal, wat is het verband tussen vorm en betekenis, en is het mogelijk om logica te gebruiken bij het verklaren van grammatische vormen?
Hoewel er ook door de Stoïcijnen, Alexandrijnen en Romeinse taalgeleerden uitgebreid studie werd gedaan naar taal, is voor de huidige taalkunde met name de scheiding van belang die ontstond in de filosofie van de 17de eeuw tussen het empirisme aan de ene kant en het rationalisme aan de andere kant. In het empirisme, onder andere verdedigd door de filosoof John Locke (1632-1704), wordt uitgegaan van het idee dat alle kennis die mensen bezitten van buitenaf komt en verkregen wordt door ervaring. De mens komt volgens deze visie als tabula rasa, een onbeschreven blad, ter wereld. Daartegenover staat het rationalisme, aangehangen door bijvoorbeeld René Descartes (1596-1650), dat ervan uitgaat dat kennis verworven wordt door de menselijke ratio, het verstand. Volgens het rationalisme speelt de menselijke geest een actieve rol bij het verwerven van kennis, en zou de mens beschikken over aangeboren kennis. De ideeën van de rationalisten werden in de taalkunde o.a. uitgedragen door de Port-Royal-school. Aanhangers van deze school trachtten een universele (op logica gebaseerde) taaltheorie op te stellen die het wezen van alle natuurlijke talen weergeeft.
| |
| |
Tegen deze ideeën werd in de eerste helft van de 20ste eeuw geageerd door Leonard Bloomfield, die vervolgens weer tegengesproken werd door Noam Chomsky.
In de 19de eeuw werd het taalkundig onderzoek, dat zich met name richtte op de verwantschap tussen talen, meer analytisch van aard. Net als bij Pānini stonden taalkundige regels centraal. Taalveranderingen probeerde men weer te geven in regels. Zo formuleerde Jacob Grimm (1785-1863), die samen met zijn broer Wilhelm spookjes verzamelde en uitgaf, de wet van Grimm, een wet die diachronische klankverschuivingen beschreef. Een andere belangrijke stap in de ontwikkeling van de huidige taalkunde is de opkomst van het structuralisme. Deze stroming, waarvan Ferdinand de Saussure (1857-1913) de grondlegger was, kwam tot bloei in de eerste helft van de 20ste eeuw. Het idee achter het structuralisme is dat taalverschijnselen bepaald worden door het grotere geheel, en dus in samenhangende systemen behoren te worden onderzocht. Dit leidde tot een meer systematische bestudering van taal, met name van de distributie van elementen en andere vormeigenschappen van taal (syntaxis, morfologie en fonologie). Leonard Bloomfield (1889-1949) was een van de verdedigers van een structuralistische aanpak, waarbij de invloed van het empirisme en een specifieke psychologische uitwerking daarvan, het behaviorisme, duidelijk zichtbaar waren in zijn werk. Hij verdedigde het standpunt dat de taalkunde zich zou moeten ontdoen van het mentalisme, dat wil zeggen het verwijzen naar zaken als menselijke geest, menselijke wil en het gebruik van intuïties. De taalkundige behoorde volgens hem inductief te werk te gaan, en vanuit specifieke observaties te concluderen tot algemene taalregels. Bovendien meende Bloomfield dat betekenis geen onderwerp van onderzoek kan zijn, aangezien betekenis niet uitputtend beschreven kan worden als de som van situaties die bij een stimulus en bijbehorende respons horen.
De grote omslag in de 20ste eeuw werd veroorzaakt door het werk ‘Syntactic Structures’ van Noam Chomsky uit 1957. Een essentieel verschil met de aanpak van Bloomfield en andere structuralisten is dat Chomsky een voorkeur uitsprak voor deductie in plaats van inductie als methode van onderzoek. Deductie brengt met zich mee dat specifieke observaties verklaard worden vanuit een algemene theorie. Een algemene taaltheorie was hierdoor een centraal punt binnen het Chomskyaanse taalonderzoek, omdat het uitgangspunt vormt bij en richting geeft aan de analyse van de taaluitingen. Een ander belangrijk verschil met de structuralisten was het rationalistische uitgangspunt van Chomsky: mensen zouden beschikken over een aangeboren taalvermogen. Onderzoek naar de universele aspecten van taal werd daardoor hoog op de onderzoeksagenda van de hedendaagse taalkunde geplaatst. Tenslotte benadrukte Chomsky het belang van een formele, mathematische aanpak van taalonderzoek. Zijn invulling van de term ‘mentalisme’ was dan ook anders dan die van Bloomfield. Net als Bloomfield en de behavioristen was Chomsky sterk gekant tegen vage noties en onnauwkeurige formuleringen. Maar desalniettemin werden door Chomsky de menselijke geest en de daarin aanwezige mentale regels en representaties wel als geldige onderwerpen van onderzoek beschouwd.
| |
4. Enkele wetenschappelijke twistappels
Zoals uit de voorgaande twee paragrafen blijkt, zijn het ontstaan van de cognitiewetenschap en het ontstaan van de generatieve taalkunde nauw met elkaar verbonden. De cognitieve revolutie en de Chomskyaanse revolutie vonden min of meer
| |
| |
gelijktijdig plaats. Bovendien speelde Noam Chomsky in beide revoluties een belangrijke rol. Maar er zijn ook verschillen. Zo stond Chomsky in de cognitieve revolutie niet alleen, maar was hij een van een groep wetenschappers uit verschillende wetenschapsgebieden die gezamenlijk de cognitieve revolutie in gang zetten. Deze wetenschappers, waaronder ook de psycholoog George Miller en de computerwetenschappers Allen Newell en Herbert Simon, keerden zich op min of meer hetzelfde moment tegen het behaviorisme en pleitten voor het cognitivisme. Daarentegen lijkt het ontstaan van de generatieve taalkunde hoofdzakelijk Chomsky's signatuur te dragen.
Welke ideeën uit deze twee revoluties voortvloeiden, zal in de volgende vier paragrafen worden besproken. Deze bespreking zal verlopen aan de hand van vier onderwerpen waarover een positie dient te worden ingenomen binnen elk wetenschapsgebied dat zich bezighoudt met onderzoek naar cognitie. Het gaat hier om de aard van denkprocessen, hoe kennis gerepresenteerd wordt in ons brein, de herkomst van de kennis die mensen bezitten en de vraag hoe specifiek deze kennis is. Onderzocht zal worden of de ideeën binnen de taalkunde over deze onderwerpen overeenkomen met die binnen de overige deelgebieden van de cognitiewetenschap. Aangezien kennis van taal een vorm van kennis is, zou je mogen verwachten dat er weinig verschillen te zien zullen zijn.
| |
5. De aard van het denken
Ons brein is een netwerk van miljarden neuronen. Cognitieve processen vinden plaats doordat er activiteit plaatsvindt in dit netwerk van neuronen. Sommige neuronen worden geactiveerd via de zintuigen of via andere neuronen en geven signalen door aan de neuronen waarmee ze in verbinding staan. Andere neuronen worden juist niet actief. Van de doorgegeven signalen hebben sommigen een stimulerend effect op de ontvangende neuronen, terwijl andere signalen juist een remmend effect hebben. Al naar gelang het cognitieve proces dat uitgevoerd wordt, varieert het totale patroon van activatie in het gigantische neurale netwerk van het brein. Op een nog basaler niveau bestaat neurale activiteit uit chemische processen, zoals het transport van ionen door de celmembraan van het neuron heen en de uitscheiding van neurotransmitters in de synapsspleet tussen twee neuronen. Echter, pratend over cognitieve processen hebben we het meestal niet over het gedrag van neuronen en de hieraan ten grondslag liggende chemische processen. Liever gebruiken we in de dagelijkse omgang termen als denken, zich ergens van bewust zijn, herinneren, zien en praten. Om de cognitieve processen waarnaar deze termen verwijzen te verklaren, beschrijven we deze door middel van regels, principes, concepten en symbolen. Het eerste wat we moeten vaststellen als we een theorie willen formuleren over taal of over willekeurig welk cognitief proces, is wat nu precies de relatie is tussen cognitieve processen en hetgeen er op neurofysiologisch niveau gebeurt in het brein. Als we een theorie willen opstellen over taal, moet die theorie dan gebaseerd zijn op het gedrag van de atomen of de neuronen in het brein? Of mogen we daarvan abstraheren en in plaats daarvan onze theorie baseren op symbolen en regels? Kortom, wat is precies de relatie tussen de menselijke geest en het menselijk brein? Dit is het klassieke mind-body-probleem uit de filosofie.
| |
| |
| |
5.1 Het mind-body-probleem
Traditionele standpunten met betrekking tot het mind-body-probleem zijn o.a. het Cartesiaans dualisme (genoemd naar René Descartes), het behaviorisme, het materialisme en het functionalisme. Volgens het dualisme zijn geest en brein twee naast elkaar bestaande maar wel causaal met elkaar verbonden zaken, met elk hun eigen eigenschappen. Het klassieke behaviorisme daarentegen stelt dat er niet zoiets is als een geest, alleen een brein. Een gematigde versie van het behaviorisme houdt in dat de geest wel bestaat maar in de onderzoekspraktijk gereduceerd kan worden tot daadwerkelijk en mogelijk gedrag. Materialisten (met name de eliminativistisch-materialisten) reduceren de geest ook, maar dan tot het brein. Zij zijn van mening dat de geest eigenlijk identiek is aan het brein. Cognitieve processen kunnen volgens hen dan ook herleid worden tot neurofysiologische processen. Het standpunt van het functionalisme tenslotte is dat de geest wel ontstaat uit het brein maar niet gereduceerd kan worden tot het brein. Hoewel het brein bestaat uit neuronen en die weer uit atomen, en de geest niet los hiervan bestaat, heeft de menselijke geest volgens functionalisten zijn eigen cognitieve wetmatigheden en verklaringen, die niet te herleiden zijn tot neurofysiologische of natuurkundige wetmatigheden en verklaringen. Voor een uitgebreide bespreking van deze standpunten, al hun varianten en de geopperde bezwaren tegen elk van deze standpunten, verwijs ik de lezer naar Bechtel (1988).
Sinds de cognitieve revolutie kent het behaviorisme nog maar weinig aanhangers onder cognitiewetenschappers, hoewel de gematigde variant ervan in bijvoorbeeld het werk van de filosoof Daniel Dennett doorschemert. Ook echte dualisten zijn momenteel nog maar dun gezaaid. Een dualistische visie op de relatie tussen geest en brein is onder andere merkbaar bij de filosoof Karl Popper en de neurofysioloog Sir John Eccles.
Het functionalisme kan wel beschouwd worden als de ‘huisfilosofie’ van de cognitiewetenschap. De menselijke geest zou je volgens deze visie kunnen zien als een computerprogramma, dat toevallig bij mensen op de hardware van het brein draait, maar dat in principe ook door een ander fysisch medium gerealiseerd zou kunnen worden. Van belang is niet het medium op zich, maar de causale rol die de processen in dit medium vertonen. Cognitieve processen staan in oorzakelijk verband met zintuigelijke prikkels of andere cognitieve processen en daaropvolgend gedrag of andere cognitieve processen. Een geluidsprikkel kan bijvoorbeeld een bepaalde gedachte tot gevolg hebben, die weer kan leiden tot een andere gedachte of tot bepaald gedrag. Theoretisch is het heel goed mogelijk dat de voor het denken benodigde causale rol door een ander medium dan het brein gerealiseerd kan worden, bijvoorbeeld door een computer. En zoals men het gedrag van een computer het best kan begrijpen door de software te bestuderen en niet de hardware, zo zou men cognitie volgens functionalisten het beste kunnen bestuderen door het symbolische niveau te bestuderen en niet het subsymbolische of implementatieniveau.
Veel neurowetenschappers en sommige filosofen, daarentegen, hangen het eliminativistisch materialisme aan en menen dat het enige niveau om het menselijk denken te bestuderen het brein is. Uitspraken van bijvoorbeeld de filosofen Paul en Patricia Churchland getuigen vaak van een eliminativistisch-materialistische visie. De menselijke geest kan volgens eliminativistisch-materialisten gereduceerd worden tot het brein. Om het menselijk denken en het menselijk gedrag te bestuderen, kan het best de werking van afzonderlijke neuronen en netwerken van neuronen onderzocht worden.
| |
| |
Uitgaand van deze visie is veel onderzoek gedaan naar visuele waarneming. Zo ontdekten David Hubel en Torsten Wiesel in het visuele systeem van de kat het bestaan van neuronen die gevoelig zijn voor lijnen met een specifieke oriëntatie. Daarentegen is een andere bekende onderzoeker op het terrein van de visuele waarneming, David Marr, juist een duidelijke functionalist. Hiervan getuigt bijvoorbeeld zijn uitspraak: ‘trying to understand perception by studying only neurons is like trying to understand bird flight by studying only feathers: it just cannot be done. In order to understand bird flight, we have to study aerodynamics’ (Marr, 1982).
Een min of meer reductionistisch standpunt wordt ook wel ingenomen binnen het connectionisme, een tak van de informatica die intelligente processen tracht te modelleren met behulp van kunstmatige neurale netwerken. Een dergelijke visie is bijvoorbeeld zichtbaar in het werk van David Rumelhart en James McClelland (zie bijvoorbeeld Rumelhart en McClelland, 1986). Het achterliggende idee van het connectionisme is dat de werking van kunstmatige neurale netwerken meer licht kan werpen op de werking van het echte neurale netwerk in het menselijk brein, en dat dit vervolgens weer meer licht werpt op het menselijk denken en menselijk gedrag. Het menselijk denken wordt volgens deze visie direct bepaald door het gedrag van de neuronen. Maar er is geen sprake van expliciete regels die het menselijk denken sturen. De regels waaraan het menselijk denken en het menselijk gedrag lijkt te gehoorzamen, zijn zogenaamde emergent properties, die rechtstreeks voortvloeien uit het gedrag van de neuronen in het (kunstmatig of echte) neurale netwerk. Eigenschappen op het microniveau van het netwerk zorgen dus voor effecten op het macroniveau van het netwerk die de indruk wekken van een onderliggend, door regels gestuurd systeem. Deze regels zijn echter niet daadwerkelijk aanwezig in het netwerk.
| |
5.2 Een functionalistische kijk op cognitie
Net als de meeste andere cognitiewetenschappers nemen ook de meeste taalkundigen een min of meer functionalistisch standpunt in met betrekking tot het mind-body-probleem (echter, zie Sampson, 1997, voor een dualistische visie). Taal wordt bestudeerd als een symbolisch systeem, waarbij in eerste instantie wordt gekeken naar de eigenschappen van taal en taaluitingen zelf en niet naar het medium waarin de representatie en verwerking van taal plaatsvindt.
Een bezwaar dat taalkundigen en veel andere cognitiewetenschappers hebben ten aanzien van een reductionistische visie op cognitie en taal is het gebrek aan inzicht in hogere cognitieve processen dat deze visie oplevert. Neem bijvoorbeeld een connectionistisch model. Een connectionistisch netwerk bestaat uit een hoeveelheid knopen en de verbindingen tussen die knopen. Informatie wordt in dergelijke netwerken gerepresenteerd door het patroon van activatie over het hele netwerk. Wat het netwerk ‘weet’ hangt af van zijn architectuur (het aantal knopen en welke knopen met welke andere knopen verbonden zijn) en de sterkte van de verbindingen tussen de knopen. Het is echter niet mogelijk om direct aan het netwerk af te lezen wat het weet. Er bestaan slechts indirecte methoden om te achterhalen welke kennis gerepresenteerd wordt door het netwerk. Zo kunnen diverse statistische methoden worden toegepast, zoals hiërarchische-clusteranalyse en principale-componentenanalyse. Vaak blijkt uit een dergelijke analyse dat wat het netwerk representeert behoorlijk complexe, niet voor de hand liggende kenmerken zijn. Zo leverde hiërarchische-clusteranalyse bij Elmans
| |
| |
(1990) experiment, waarin een kunstmatig neuraal netwerk het volgende woord in de zin moest voorspellen, een woordclustering op die op een aantal punten nogal onverwacht is. Verschillende voorkomens van hetzelfde woord werden niet als hetzelfde woord herkend maar slechts als nauw aan elkaar gerelateerd. Het connectionistisch netwerk kan blijkbaar geen types en tokens uit elkaar houden. Bovendien werd eenzelfde soort onderscheid gemaakt tussen een woord als subject en het woord als object, als tussen twee verschillende typen woorden. Een andere negatieve kant van dergelijke statistische analysemethoden is dat ze soms bepaalde, wel in het netwerk aanwezige kennis onderdrukken (Clark, 1993). Het ontdekken van de kennis die een kunstmatig neuraal netwerk bezit is dus geen eenvoudige zaak.
Gezien het momenteel nog grote gat dat gaapt tussen het gedrag van een kunstmatig neuraal netwerk en een door mensen te begrijpen verklaring van dit gedrag, geven de meeste cognitiewetenschappers de voorkeur aan een begrijpelijk functionalistisch model. Het taalkundige standpunt met betrekking tot de relatie tussen geest en brein is niet anders dan dat van de meeste cognitiewetenschappers.
| |
6. De aard van representaties
Wanneer een positie is ingenomen met betrekking tot de relatie tussen geest en brein, is een volgende vraag die cognitiewetenschappers zich zouden kunnen stellen de vraag op welke manier kennis gerepresenteerd wordt in ons brein. Elk mens beschikt over een bepaalde hoeveelheid kennis. Het is een vaststaand feit dat die kennis op de een of andere manier gerepresenteerd moet zijn in het brein. Volgens de connectionistische visie hebben dergelijke representaties de vorm van activatiepatronen in het netwerk van neuronen in het brein. Volgens de symbolische visie is kennis gerepresenteerd als een systeem van regels en symbolen, dat op een lager niveau geïmplementeerd is in het neurale systeem.
| |
6.1 Symbolisme versus connectionisme
Het idee dat het menselijk denken gemodelleerd zou kunnen worden als een systeem dat berust op de manipulatie van symbolen, heeft zijn wortels in het werk van Alan Turing vlak voor de Tweede Wereldoorlog. Turing introduceerde toen de notie van berekenbaarheid (Turing, 1936). Een functie is berekenbaar wanneer de waarde van deze functie op een zuiver mechanische manier gevonden kan worden, door alleen te kijken naar de vorm van de functie en niet naar zijn betekenis. Turing, en na hem vele anderen, zijn van mening dat systemen die op deze manier zijn vormgegeven voldoende en zelfs noodzakelijk zouden zijn voor de modellering van intelligent gedrag. Denkprocessen bestaan volgens deze visie uit elementaire, mechanisch uitvoerbare berekeningsstappen, uitgevoerd op reeksen van symbolen. Deze visie wordt wel de computationele theorie van het denken genoemd. Het vormt het uitgangspunt van zowel de moderne formele taalkunde als van veel cognitief-psychologisch onderzoek naar redeneren, leren en geheugen.
Sinds enkele jaren wordt de computationele theorie van het denken bestreden door aanhangers van het connectionisme. Deze aanhangers bevinden zich met name in de informaticahoek. Hoewel het connectionisme bepaald niet nieuw is en berust op
| |
| |
McCulloch en Pitts' neurale-netwerktheorie uit 1943 (McCulloch en Pitts, 1943), is met de opkomst van steeds snellere computers in de jaren '80 een nieuwe golf van activiteit ontstaan. Volgens connectionisten is het juiste niveau om het menselijk denken te beschrijven niet het niveau van de symbolen, maar een lager niveau: het subsymbolische niveau. Dit subsymbolische niveau bestaat uit een netwerk van onderling sterk verbonden knopen. Deze knopen hebben allemaal een bepaalde activatiewaarde. Symbolen en concepten zijn niet zo maar aan te wijzen in zo'n netwerk maar worden gerepresenteerd door het totale patroon van activatiewaarden in het netwerk.
Een connectionistisch netwerk bestaat dus uit knopen, die elk een bepaalde activatiewaarde bezitten en sterk verbonden zijn met andere knopen. Via deze verbindingen ontvangen knopen exciterende (stimulerende) of inhiberende (remmende) signalen van verschillende sterktes van andere knopen. Een ontvangende knoop telt alle binnenkomende signalen op volgens een bepaalde rekensom. Meestal is het zo dat als de activatiewaarde van de ontvangende knoop boven een bepaalde drempelwaarde uitkomt, deze knoop een outputsignaal produceert. Processen in een dergelijk netwerk worden uitgevoerd doordat een input door het netwerk wordt geleid totdat een stabiel patroon van activatie ontstaat.
De architectuur van een connectionistisch netwerk is meestal zodanig dat er inputknopen, tussenliggende knopen en outputknopen worden onderscheiden. De input wordt gerepresenteerd door het patroon van de activatiewaarden van de inputknopen. Dit activatiepatroon wordt door de inputknopen via tussenliggende knopen doorgegeven aan de outputknopen. Doordat verbindingen tussen knopen kunnen verschillen in sterkte en exciterend of inhiberend kunnen zijn, kunnen bepaalde eigenschappen van de input meer of minder effect hebben op de uiteindelijke output. De verbindingssterktes tussen de knopen in het netwerk vormen als het ware de kennis die het netwerk heeft. De tussenliggende knopen hebben tot doel om uit de input bepaalde kenmerken te destilleren. Dit hoeven niet alleen oppervlakkig waarneembare kenmerken te zijn, maar kunnen ook abstractere kenmerken zijn. Deze kenmerken activeren vervolgens via de gewogen verbindingen tussen de tussenliggende knopen en de outputknopen bepaalde outputknopen. Door de gewogen verbindingen zal het ene kenmerk belangrijker zijn voor het vaststellen van het outputpatroon dan het andere kenmerk. Het uiteindelijke resultaat van de werking van een connectionistisch netwerk is de associatie van een specifiek inputpatroon met een specifiek outputpatroon.
Als voorbeeld nemen we een hypothetisch letterherkennetwerk. Het doel van dit netwerk is om op basis van de uiterlijke eigenschappen van een letter te herkennen om welke letter het gaat. De uiterlijke eigenschappen van een letter worden gevormd door een bepaald patroon van lichte en donkere puntjes. Dit patroon vormt de input van het netwerk. Het netwerk moet uiteindelijk aan dit inputpatroon een output koppelen die uniek de betreffende letter representeert. Hiervoor kan gezorgd worden door voor elke aangeboden letter uiteindelijk één outputknoop actief te laten worden. In totaal zijn er dan 26 outputknopen nodig. Op de laag van de tussenliggende knopen worden bepaalde letterkenmerken actief, bijvoorbeeld het kenmerk dat de letter een horizontaal streepje bevat (zoals geldt voor de A en de F), een schuin streepje (bijvoorbeeld A en R) of een verticaal streepje (bijvoorbeeld R en F). Als nu bijvoorbeeld de F wordt aangeboden aan het netwerk, dan wordt de tussenliggende knoop actief die reageert op horizontale streepjes in de input. Bovendien wordt de tussenliggende knoop actief die reageert op verticale streepjes. Deze activatie wordt doorgegeven aan de outputknopen. In de laag van outputknopen wordt vervolgens de knoop actief die de letter F representeert. Wordt
| |
| |
daarentegen de letter R aangeboden aan het netwerk, dan worden er deels dezelfde en deels andere tussenliggende knopen actief. De tussenliggende knoop die reageert op verticale streepjes wordt wel actief, maar de knoop die reageert op horizontale streepjes niet. Bovendien wordt bij de R de knoop actief die reageert op schuine streepjes en de knoop die reageert op gebogen lijnen. Er zal dus uiteindelijk een andere outputknoop actief worden.
Uiteraard is dit een sterke simplificatie van de werking van een dergelijk letterherkennetwerk. Er zal bijvoorbeeld ook onderscheid gemaakt moeten worden tussen de aanwezigheid van één horizontaal streepje en van twee horizontale streepjes in de input om bijvoorbeeld de letters F en T van elkaar te kunnen onderscheiden. Maar ter illustratie van de werking van kunstmatige neurale netwerken is een dergelijk letterherkennetwerk een inzichtelijk voorbeeld. Met dit voorbeeld kan ook het onderscheiden van abstracte of hogere-orde kenmerken worden geïllustreerd. In de laag van tussenliggende knopen kunnen namelijk ook bepaalde knopen actief worden voor niet direct waarneembare letterkenmerken. Zo is het denkbaar dat een bepaalde knoop actief wordt bij horizontale of verticale streepjes in de input maar juist niet als ze allebei voorkomen in de input. Omdat dit kenmerk gebaseerd is op twee andere kenmerken (het kenmerk van een horizontaal streepje en het kenmerk van een verticaal streepje), spreken we hier van een hogere-orde kenmerk. Door het vermogen om ook hogere-orde kenmerken te representeren is een meerlaags netwerk niet slechts in staat tot simpel behavioristisch stimulus-respons gedrag, waarbij een relatie wordt gelegd tussen oppervlakkige, statistische kenmerken van de input en een bepaalde output. In plaats daarvan kan een meerlaags netwerk, door gebruik te maken van interne (nietsymbolische) representaties op de laag van de tussenliggende knopen, ook de meer abstracte, functionele relaties tussen input en output representeren.
Het grote verschil tussen symbolische en subsymbolische of connectionistische systemen wordt gevormd door de aanwezigheid c.q. afwezigheid van expliciete regels in het systeem. In een neuraal netwerk zitten nergens expliciete regels, er is alleen sprake van een patroon van associaties tussen input en output. Toch kan zo'n systeem zich gedragen alsof het volgens regels werkt. Het is echter niet zo dat deze regels intern zijn opgeslagen en zo het gedrag van het systeem veroorzaken. Het gedrag van het systeem wordt bepaald door de patronen en de sterktes van de verbindingen in het netwerk. Dit is volgens connectionisten het enige juiste verklaringsniveau voor cognitieve processen. Connectionisten verwerpen het idee dat er echte verklaringen mogelijk zijn op het symbolische niveau, dat wil zeggen verklaringen in termen van expliciete regels. Connectionistische modellen presteren met name beter dan symbolische modellen op waarnemingstaken zoals patroonherkenning en andere taken waarvoor het lastig is om expliciete regels te formuleren.
| |
6.2 Kunstmatige neurale netwerken: realistische modellen van het brein?
Een argument voor de connectionistische modellering van cognitieve processen is het idee dat een connectionistisch netwerk veel meer dan een symbolisch systeem lijkt op het menselijk brein. Echter, hierbij moet wel in de gaten worden gehouden dat een kunstmatig neuraal netwerk nog steeds een zeer grof model vormt van het brein. Het gedrag van echte neuronen is oneindig veel complexer dan het gedrag van knopen en verbindingen in een kunstmatig netwerk. De vraag is dan ook in hoeverre kunstmatige
| |
| |
neurale netwerken een beter model van het menselijk brein vormen dan symbolische systemen. Bij echte neuronen is bijvoorbeeld de sterkte van een binnenkomend signaal geen onherleidbaar gegeven. Deze wordt namelijk bepaald door de plaats waar het signaal binnenkomt op het neuron en de precieze opeenvolging in de tijd in relatie tot andere signalen. Ook hebben neurotransmitters vaak langerdurende effecten dan alleen hun werking tijdens het doorgeven van het signaal. Het menselijk brein is bovendien vele malen groter dan een kunstmatig neuraal netwerk. Verder vindt het leren in veel kunstmatige neurale netwerken plaats op basis van de leertechniek van back propagation of error. Volgens deze leertechniek wordt de fout tussen de daadwerkelijke output en de gewenste output teruggestuurd in het netwerk, zodat de sterkte van de verbindingen kan worden aangepast om de fout te verkleinen. Van deze leertechniek wordt wel beweerd dat deze niet biologisch plausibel zou zijn en niet werkzaam zou kunnen zijn in het menselijk brein (Crick, 1989). Immers, echte neuronen geven signalen slechts in één richting door. Feedback via een lus van voorwaarts projecterende verbindingen zou echter deze kritiek kunnen ondervangen. De vraag is dan wel of dergelijke feedbacklussen ook daadwerkelijk voorkomen in het brein. Tenslotte wordt een belangrijk punt van kritiek op connectionistisch modelleren gevormd door het feit dat dergelijke netwerken leren doordat trainingsdata een groot aantal keren worden aangeboden aan het netwerk. In een simulatie van Elman (1993) waarin de verwerving door het netwerk werd onderzocht van de hiërarchische structuur van taal en het principe van inbedding, kreeg het netwerk bijvoorbeeld in totaal 250.000 zinnen (in 5 trainingsrondes, met per trainingsronde 5 groepen van 10.000 zinnen) aangeboden in de trainingsfase. Het is onwaarschijnlijk dat kinderen ook dergelijke grote aantallen voorbeelden nodig hebben om te
leren.
Bovenstaande problemen hebben te maken met de vergelijking tussen huidige kunstmatige neurale netwerken en het menselijk brein. Daarnaast zijn er ook een aantal meer fundamentele problemen voor connectionistische modellen (Fodor en Pylyshyn, 1988; Levelt, 1989). Een centraal probleem voor connectionistische modellen die gebruik maken van gedistribueerde representaties vormt het feit dat mentale representaties op een systematische manier gerelateerd zijn aan andere mentale representaties. Dit houdt in dat uit een bepaalde gerepresenteerde bewering bepaalde beweringen wel en andere juist niet volgen. Bijvoorbeeld als je weet dat Minoes miauwt en Bonzo blaft, dan weet je ook dat Minoes miauwt. Een connectionistisch netwerk maakt deze gevolgtrekking niet vanzelf, omdat het geen interne structuur toekent aan de gerepresenteerde samengestelde bewering Minoes miauwt en Bonzo blaft. Een representatie van Minoes miauwt en Bonzo blaft en een representatie van Minoes miauwt zijn voor het netwerk twee verschillende, ongerelateerde representaties. Je zou het netwerk wel kunnen leren om uit Minoes miauwt en Bonzo blaft te concluderen dat Minoes miauwt, maar dat is geen noodzakelijkheid. Voor hetzelfde geld zou je het netwerk uit Minoes miauwt en Bonzo blaft kunnen laten concluderen dat Minoes niet miauwt. Volgens Fodor en Pylyshyn (1988) toont dit aan dat connectionistische netwerken niet geschikt zijn voor de modellering van menselijke cognitie. Mensen zouden een dergelijke conclusie nooit trekken, omdat het menselijk denken een combinatorische structuur vertoont die een dergelijke conclusie niet toelaat. Een correct model van menselijke cognitie zou deze eigenschap van het menselijk denken moeten kunnen verklaren. Een connectionistisch netwerk kan dat echter niet, omdat het in principe alle denkbare conclusies toestaat.
| |
| |
Een ander probleem is dat representaties op de juiste manier aan elkaar gerelateerd moeten worden. Als bijvoorbeeld de bewering de rode roos ligt op een groene tafel gerepresenteerd wordt, dan is een probleem voor connectionistische netwerken hoe ervoor te zorgen dat rode met roos geassocieerd wordt en groene met tafel, en niet rode met tafel en groene met roos. Dit probleem is onderdeel van een veel algemener probleem, namelijk het onvermogen om alleen gerelateerde dingen aan elkaar te relateren en niet-gerelateerde dingen niet. Dit algemene onvermogen om onder andere woordgroepen aan hun functionele rollen te binden, waarden aan variabelen en eigenschappen aan concepten wordt wel aangeduid met de term ‘binding problem’. Oplossing van dit probleem is essentieel voor een adequate representatie van talige structuur. Overigens moet dit probleem niet verward worden met de taaltheoretische vraag naar de beperkingen op de interpretatie van anaforen en pronomina. Er zijn diverse voorstellen zijn gedaan om het probleem van ‘binding’ voor connectionistische netwerken op te heffen, onder andere het gebruik van een tensorprodukt tussen twee vectoren, het maken van onderscheid tussen de verschillende instanties van ‘binding’ via verschillende oscillatiefrequenties, en het gebruik van temporele synchronie tussen de vurende neuronen die de gerelateerde zaken representeren. Echter, ook al wordt dit probleem opgelost, dan nog is een connectionistisch netwerk niet automatisch in staat om in dezelfde mate de structuur te representeren van mentale representaties en talige uitdrukkingen als een symbolisch systeem. Een resterend probleem is bijvoorbeeld hoe meervoudige voorkomens van hetzelfde concept gerepresenteerd kunnen worden (Pinker en Prince, 1988). Deze eigenschap is nodig
om de twee zinnen Minoes ziet Bonzo en Bonzo ziet Minoes allebei te representeren. In dit geval draagt Minoes namelijk twee functionele rollen: zowel die van waarnemer als die van waargenomene. Symbolische modellen gebruiken in dit geval simpelweg meerdere kopieën van hetzelfde element. Een connectionistisch netwerk kan dit niet omdat twee elementen die dezelfde kenmerken hebben en dus hetzelfde patroon van activatie vertonen, niet te onderscheiden zijn binnen het netwerk.
Een probleem van een geheel andere orde is het probleem van kennisvermeerdering. Als in een symbolisch systeem iets wordt geleerd, dan wordt simpelweg een regel of feit toegevoegd aan het geheugen. In een kunstmatig neuraal netwerk is kennis gerepresenteerd als het activatiepatroon over een netwerk van neuronen. Wordt nu kennis toegevoegd, dan verandert dat activatiepatroon. Daarmee gaat helaas de voorheen geleerde kennis weer verloren. De enige manier waarop één enkel kunstmatig netwerk nieuwe kennis kan leren, is door de oude kennis weer opnieuw mee te leren. Dit is vanzelfsprekend geen erg efficiënte manier van leren. Een alternatieve oplossing is het onderverdelen van het netwerk in deelnetwerkjes. Nieuwe kennis kan dan worden geleerd op een bepaalde plaats in het netwerk, terwijl al eerder geleerde kennis in een ander deel van het netwerk wordt opgeslagen en daardoor niet verloren gaat. Het lijkt erop dat er in de menselijke hersenen iets gelijksoortigs plaatsvindt bij het leren. Nieuwe informatie wordt in eerste instantie tijdelijk vastgehouden in de hippocampus. Het deel van deze kennis dat uiteindelijk in ons lange-termijngeheugen belandt, wordt vervolgens gradueel omgezet in een permanente representatie in de cortex. Verwerving van diverse soorten kennis door één enkel, gestructureerd, kunstmatig neuraal netwerk is echter iets wat tot nu toe weinig aandacht heeft gekregen binnen het connectionisme. De huidige connectionistische modellen zijn over het algemeen slechts toegespitst op de verwerving van een specifiek soort kennis, bijvoorbeeld de verleden-tijdsvorm van
| |
| |
Engelse werkwoorden, het oplossen van balans-taakproblemen of het herkennen van gezichten.
Samenvattend kan worden gesteld dat kunstmatige neurale netwerken slechts sterk vereenvoudigde modellen zijn van het echte brein. Daarbij komt dat ze lijden aan enkele momenteel nog maar moeilijk oplosbare problemen. De meeste daarvan hebben te maken met het ontbreken van expliciete regels die aangeven hoe gerepresenteerde begrippen aan elkaar gerelateerd zijn. De representatie van talige structuur met de bijbehorende relaties tussen woorden en woordgroepen lijkt daarom, in ieder geval op dit moment nog, iets te hoog gegrepen voor connectionistische modellen. Voor de theorievorming met betrekking tot taal lijkt een symbolische benadering momenteel de meest geeigende. Opmerkelijk is dat de grotendeels taalkundige argumenten tegen een connectionistische benadering van cognitie ook veel niet-taalkundigen overtuigd hebben van de zwakke punten van deze benadering. Dit in tegenstelling tot de taalkundige argumenten voor een nativistische positie, die, zoals we in paragraaf 7 zullen zien, weinig weerklank hebben gevonden in andere domeinen van de cognitiewetenschap.
| |
6.3 De relatie tussen symbolische systemen en het brein
Voor veel cognitiewetenschappelijk onderzoek lijkt een symbolische benadering dus voorlopig nog de meest geschikte. Toch lijkt het onwaarschijnlijk dat de manier waarop onze hersenen functioneren volkomen los staat van de aard van de denk-processen die ze uitvoeren. Verwacht mag worden dat de eigenschappen die het netwerk van neuronen in het menselijk brein heeft, wel degelijk effect hebben op de soort en de aard van de cognitieve processen die plaatsvinden binnen dit netwerk. De laatste jaren zijn er theorieën voorgesteld die, hoewel niet connectionistisch van aard, zich toch laten leiden door fundamentele kenmerken van neurale netwerken.
De unified theory of cognition (wat dit inhoudt, wordt verderop besproken in paragraaf 8) ACT-R is zo'n theorie. ACT-R omvat twee niveaus van beschrijving: een symbolisch niveau en een subsymbolisch niveau. Op het symbolische niveau zijn productieregels werkzaam die zogenaamde chunks met informatie manipuleren. Soms echter is meer dan een productieregel toepasbaar of komen verschillende chunks in aanmerking voor manipulatie door een productieregel. De keuze tussen deze productieregels of chunks vindt plaats op het subsymbolische niveau van representatie. Dit subsymbolisch niveau maakt gebruik van bepaalde eigenschappen van het brein, zoals de eigenschap dat elk stukje gerepresenteerde informatie in het brein een bepaalde activatiewaarde bezit en het feit dat de verwerking van informatie beïnvloed wordt door ruis. De activatiewaarde van een chunk is afhankelijk van hoe vaak deze informatie geactiveerd is geweest en hoe goed de informatie in de betreffende context past. Des te hoger de activatiewaarde van een chunk, des te groter de kans dat de chunk gekozen wordt wanneer verscheidene chunks in aanmerking komen voor toepassing in een productieregel, en des te sneller de chunk opgehaald kan worden uit het geheugen. Wanneer de architectuur een keuze toestaat tussen verscheidene productieregels of chunks, dan zal die regel of chunk gekozen worden die de laagste kosten met zich meebrengt (in ACT-R komt dit neer op de minste tijd om het doel te bereiken) maar de grootste geschatte kans heeft op succes. Met andere woorden: er wordt gekozen voor de optimale regel of chunk met betrekking tot de huidige toestand van het systeem en de eisen van de omgeving.
| |
| |
In de theorievorming rond kunstmatige neurale netwerken wordt optimalisatie gezien als een belangrijke organiserend principe. Optimalisatie houdt in dat voor een bepaalde input gestreefd wordt naar een patroon van activatie dat zo optimaal mogelijk overeenstemt met de impliciet in de verbindingen van het netwerk aanwezige beperkingen. Een optimale output is een output die een zo goed mogelijke balans vindt tussen de veelal strijdige eisen die de beperkingen in het netwerk opleggen aan de output.
Zoals we zojuist zagen, speelt optimalisatie een belangrijke rol in ACT-R. Sinds enkele jaren wordt dit principe van optimalisatie ook toegepast op taal. De aldus ontstane taaltheorie staat bekend als Optimality Theory (Prince en Smolensky, 1991, 1997). Volgens Optimality Theory is een grammatica niets anders dan een verzameling van zachte of schendbare beperkingen op combinaties van talige elementen. Deze beperkingen kunnen gerangschikt worden naar sterkte. Een welgevormde structuur is hierdoor die structuur die het best aan de totale verzameling van beperkingen voldoet. Het is goed denkbaar dat een bepaalde beperking geschonden wordt, maar alleen als daarmee voldaan wordt aan een sterkere beperking. In een symbolische taaltheorie als het Minimalistisch Programma, daarentegen, resulteert schending van een grammaticale beperking onmiddelijk in ongrammaticaliteit.
| |
7. De herkomst van kennis
In de vorige paragraaf zijn twee tegenovergestelde visies besproken wat betreft de manier waarop kennis gerepresenteerd wordt in het brein. Een volgende vraag is de vraag waar de kennis die mensen bezitten precies vandaan komt. Wetenschappelijke ideeën over de herkomst van kennis hebben zich van oudsher tussen twee extreme posities heen en weer bewogen: de nativistische positie en de empiristische positie. Nativisten zijn van mening dat een groot deel van de kennis waarover mensen beschikken, aangeboren is. Empiristen daarentegen denken dat alle kennis verworven wordt via ervaring. De eerste bekende nativist was Plato. Plato geloofde dat de kennis die mensen bezaten in feite een weerspiegeling vormde van herinneringen aan een eerder bestaan in de Ideeënwereld. Later werd de nativistische positie onder meer verdedigd door de 17de eeuwse Franse filosoof René Descartes in het kader van het rationalisme. De tegengestelde visie dat alle kennis gegenereerd wordt door ervaring werd verdedigd door zijn Engelse tijdgenoot John Locke, en vormde in de eerste helft van de 20ste eeuw uitgangspunt voor de psychologische stroming van het behaviorisme. Noam Chomsky liet in de tweede helft van de 20ste eeuw, in ieder geval binnen de taalkunde, de slinger weer de andere kant op gaan door te pleiten voor een sterk nativistisch gekleurde visie op taal.
De meeste, zoniet alle, moderne wetenschappers zullen een positie innemen ergens tussen beide extreme standpunten in. Het is duidelijk dat mensen ervaringen die ze in de loop van hun leven opdoen en bepaalde min of meer toevallige feiten waarmee ze geconfronteerd worden op de een of andere manier kunnen opslaan in hun brein. Dit is wat intuïtief onder leren wordt verstaan. Ook aan taalverwerving zit een aspect van leren: een kind dat toevallig in Nederland geboren wordt leert Nederlands, terwijl een kind dat door een andere toevalligheid in China geboren wordt Chinees leert. Daartegenover staat de observatie dat het menselijk brein er bij ieder mens ongeveer hetzelfde uitziet: het weegt ongeveer anderhalve kilo, bestaat uit twee helften, die weer
| |
| |
uit cellen bestaan die onderling sterk met elkaar zijn verbonden, en vertoont vanaf een afstand een structuur met groeven en windingen en bij nadere inspectie kolommen en lagen van neuronen. Ook wat betreft de functionele architectuur zijn er grote overeenkomsten tussen individuen. Dit suggereert dat de organisatie van het brein wel eens voor een deel zou kunnen zijn aangeboren, en dat dit ook zou kunnen gelden voor bepaalde kennis of, iets voorzichtiger gesteld, voor mechanismen of structuren die leiden tot de verwerving van bepaalde kennis. Vrijwel elke wetenschapper zal beamen dat kennisverwerving zowel een kwestie is van nature als van nurture, van genen en omgeving.
| |
7.1 Nature, nurture of een mixture?
De stelling dat de organisatie van ons brein onder genetische controle staat (hoewel de manier waarop dit precies gebeurt nog grotendeels onduidelijk is), maar dat we ook nieuwe kennis verwerven door interactie met de omgeving, is weinig controversieel. De meeste cognitief-psychologen en neurowetenschappers nemen dan ook een dergelijk tussenstandpunt in, zonder zich er al te zeer op vast te leggen. Kennisverwerving wordt gezien als een combinatie van ontwikkeling en leren, van genetische bepaaldheid en invloeden van de omgeving. Waar de scheidslijn tussen nature en nurture precies loopt wordt niet van onmiddellijk belang geacht voor cognitiewetenschappers die zich concentreren op het volwassen individu.
Vanaf de Chomskyaanse revolutie staan de meeste taalkundigen daarentegen op het standpunt dat een aanzienlijk deel van de taalkundige kennis die iemand bezit wel aangeboren moet zijn. Volgens hen is taal zo complex en de informatie die over de structuur van taal beschikbaar is zo miniem, dat het logischerwijs onmogelijk is om de taal te leren zonder aangeboren ‘voorkennis’. Een soortgelijke redenering wordt door de filosoof Jerry Fodor (Fodor, 1975) gebruikt om nog een stapje verder te gaan en zelfs te pleiten voor de aangeborenheid van concepten. We zullen verderop in deze paragraaf dieper ingaan op de motivatie voor de nativistische visie op taal.
Halverwege de jaren '80 echter begon het connectionisme, de tak van de informatica die zich richt op de modellering van intelligente processen met behulp van kunstmatige neurale netwerken, zich sterk te verzetten tegen zelfs een gematigd nativistische visie op kennis. Er werden diverse neurale netwerken ontworpen die moesten aantonen dat een bepaald aspect van kennis ook zonder ingebouwde representaties kon worden geleerd. De te leren structuur zou direct uit de structuur van de input of de omgeving te halen zijn. Zo werd bijvoorbeeld een netwerk ontworpen dat in staat was om de juiste voorspellingen te doen met betrekking tot samengestelde zinnen (Elman, 1993). Een voorbeeld van zo'n samengestelde zin die dit netwerk voorgeschoteld kreeg is de volgende zin, die een betrekkelijke bijzin bevat: boys who chase dogs see girls.
Een opmerkelijke uitkomst van Elmans (1993) simulatie was de ontdekking dat het leerproces binnen zijn neurale netwerk alleen maar succesvol kon verlopen wanneer de input in eerste instantie eenvoudig werd gehouden en pas daarna gradueel complexer werd gemaakt. Omdat het niet waarschijnlijk is dat kinderen eerst eenvoudige zinnen te horen krijgen en pas later complexere zinnen, zou de regulering van de input van eenvoudig naar complex wel eens kunnen plaatsvinden door beperkingen die veroorzaakt worden door de ontwikkelingsprocessen die het kind zelf ondergaat (zie
| |
| |
ook Newport, 1990). Een zo'n ontwikkelingsproces zou bijvoorbeeld de ontwikkeling van het korte-termijngeheugen kunnen zijn. Beginnend met een beperkte geheugencapaciteit zou het kind in eerste instantie alleen simpele zinnen kunnen onthouden en verwerken. Pas later, na graduele vergroting van de geheugencapaciteit, zouden ook complexere zinnen verwerkt kunnen worden.
Deze hypothese leidde tot de veronderstelling dat het ontwikkelingproces zelf wel eens een grote rol zou kunnen spelen bij het leren van alle complexe kennis. Dit idee vormt de basis van een stroming die zich het neuroconstructivisme noemt (Elman et al., 1996; Karmiloff-Smith, 1998; Quartz, 1999). Het neuroconstructivisme bouwt in zekere zin voort op het constructivisme van Jean Piaget (1896-1980), met als hedendaagse toevoeging een combinatie van ideeën uit het connectionisme en ideeën uit de neurowetenschappen. Het achterliggende idee van het neuroconstructivisme is dat de ontwikkeling van cognitieve vaardigheden wordt bepaald door omgevingsinvloeden en intrinsieke ontwikkelingsprocessen samen. Door constante interactie tussen deze twee factoren ontstaan steeds complexere corticale representaties. Deze zijn te vergelijken met de ontwikkelingsstadia van Piaget. Het onderscheid tussen genen en omgeving is volgens neuroconstructivisten dan ook een te primitief onderscheid, dat geen recht doet aan de dynamische interactie tussen een zich ontwikkelend organisme en zijn omgeving. Een zich ontwikkelend organisme kiest voor een deel zijn omgeving uit en bepaalt op deze manier welke ervaringen het zal krijgen. Van groter belang dan de vraag naar wat precies aangeboren is en wat aangeleerd, is volgens neuroconstructivisten daarom de vraag naar het precieze verloop van de interactie tussen organisme en omgeving.
Het belangrijkste argument van neuroconstructivisten tegen een sterk nativistische positie is de plasticiteit van de hersenen. Aangezien kennis gerepresenteerd wordt in de verbindingen en verbindingssterktes tussen neuronen, wordt aangeboren kennis gevormd door aangeboren verbindingen tussen neuronen. Echter, omdat de ontwikkeling van de hersenen niet volgens een vantevoren vastgelegd plan verloopt maar nogal wat individuele variatie vertoont en in sterke mate onderhevig is aan omgevingsinvloeden, kan het volgens neuroconstructivisten niet zo zijn dat verbindingen tussen neuronen zijn aangeboren. Hierdoor is het onwaarschijnlijk dat kennis is aangeboren in de vorm van representaties. Wel zouden aangeboren beperkingen mogelijk zijn, maar die zijn niet zo gedetailleerd en domein-specifiek als nativisten beweren. De vraag hoe plastisch onze hersenen zijn is vanzelfsprekend een empirische kwestie, die beantwoord kan worden door moleculair-genetisch en neurowetenschappelijk onderzoek. Uit recent neurowetenschappelijk onderzoek blijkt inderdaad steeds duidelijker dat de cortex van het menselijke brein in ieder geval tijdens de ontwikkeling nog enorm plastisch is. Zo laten imaging-studies bij mensen die al vanaf jonge leeftijd blind zijn (Sadato et al., 1996) zien dat de zenuwbanen voor het doorgeven van informatie van de tastzintuigen bij deze mensen een andere route volgen dan bij niet-blinde proefpersonen. De zenuwbanen voor tastprikkels leiden bij deze blinde proefpersonen naar de corticale gebieden die normaal gereserveerd zijn voor visuele waarneming. Blijkbaar is er sprake van een aanzienlijke plasticiteit wat betreft de verbindingen tussen neuronen. De plasticiteit lijkt zich echter niet te beperken tot de verbindingen tussen neuronen. Recent neurowetenschappelijk onderzoek (Eriksson et al., 1998) suggereert zelfs dat er in het volwassen menselijke brein nog nieuwe neuronen gevormd worden. Vorming van nieuwe
neuronen zou met name plaatsvinden in de hippocampus, een gebied dat belangrijk is voor leren en geheugen.
| |
| |
Het lijkt er dus op dat taalkundigen tegen de resultaten van neurowetenschappelijk onderzoek ingaan met hun sterk nativistische visie op taal. Volgens deze visie zijn de belangrijkste aspecten van taal aangeboren in de vorm van universele principes en parameters. Wat geleerd dient te worden zijn slechts de waarden van een beperkt aantal parameters, willekeurige taalfeiten zoals het lexicon, en zaken die meer tot de periferie van de grammatica behoren. De hedendaagse generatieve taalkunde, vormgegeven binnen het Minimalistische Programma (Chomsky, 1995), is gebaseerd op deze sterk nativistische aanname. Maar ook een recentere taaltheorie, Optimality Theory (Prince en Smolensky, 1991, 1997), hanteert een nativistisch uitgangspunt. Binnen Optimality Theory wordt aangenomen dat alle beperkingen op zinstructuur zijn aangeboren, en dat taalverwerving simpelweg een herrangschikking van die beperkingen is (Tesar en Smolensky, 1998).
Doordat maar een deel van de uiteindelijke kennis die een spreker heeft van zijn of haar moedertaal geleerd hoeft te worden en doordat wat er wel geleerd moet worden in veel gevallen neerkomt op een keuze uit een beperkt aantal mogelijkheden, wordt de taalkundige theorievorming slechts in geringe mate beperkt door leerbaarheidsargumenten (zie Hendriks, 1998). Hierdoor kan de complexiteit en mate van abstractie van taalkundige theorieën een grote vlucht nemen. Dit is ook inderdaad wat in de praktijk gebeurt. Echter, vanwege hun grote complexiteit en hoge mate van abstractie zijn deze theorieën lastig empirisch te toetsen. Om deze reden is de sterkte van de onderbouwing van de nativistische stelling van eminent belang. In de volgende subparagraaf zullen de argumenten voor de nativistische stelling op een rijtje worden gezet en op hun waarde worden beoordeeld.
| |
7.2 Nativistische argumenten
De argumenten die hedendaagse taalkundigen aandragen voor hun nativistische visie zijn zeer divers van aard. Genoemd worden onder meer de grote snelheid waarmee kinderen hun moedertaal leren, de schijnbare moeiteloosheid van dit proces, de onmogelijkheid om op latere leeftijd nog een nieuwe taal vloeiend te leren spreken (het zogenaamde kritieke-periode-effect), de ontdekking van een familie (in de literatuur bekend staand als de KE familie) die ten gevolge van een genetisch defect aan een specifieke taalstoornis lijdt, het niet voorkomen van een op taal lijkend communicatiesysteem bij andere diersoorten zoals primaten, de observatie dat de structuur van taal lijkt te gehoorzamen aan regels die specifiek zijn voor taal, het feit dat sprekers van een taal min of meer dezelfde taal hebben leren spreken, de onafhankelijkheid van het vermogen om een taal te leren van algemene cognitieve vermogens en intelligentie, de universaliteit van taalprincipes en de schijnbare onmogelijkheid om een taal te leren vanuit de beperkte hoeveelheid zinnen die een kind te horen krijgt en die soms ook nog ongrammaticaal zijn. Dit laatste argument wordt wel het argument van de ‘armoede van de taalinput’ genoemd en vormt volgens sommigen Chomsky's meest unieke argument en het krachtigste argument voor de nativistische positie (Wexler, 1991).
Veel van deze argumenten lijken ook toepasbaar op andere cognitieve vermogens dan taal. Kinderen leren ook veel andere vaardigheden snel en schijnbaar zonder enige moeite, bijvoorbeeld het herkennen van voorwerpen en het reiken naar voorwerpen om ze te grijpen. Toch is het zeker niet zo dat voor alle cognitieve
| |
| |
vaardigheden die een kind al op haar vijfde jaar beheerst, wordt geconcludeerd dat die vaardigheid dan aangeboren moet zijn. Het reiken naar voorwerpen en het grijpen van voorwerpen wordt waarschijnlijk voor een zeer groot deel geleerd (Thelen, 1995). Verder geldt niet alleen voor het verwerven van een taal maar voor leren in het algemeen dat het moeilijker wordt met het verstrijken van de jaren. De plasticiteit van de hersenen neemt af naarmate een mens ouder wordt, wat tot gevolg heeft dat relatief grote reorganisaties van verbindingen tussen neuronen moeilijker kunnen plaatsvinden. De afname van de plasticiteit van de hersenen gebeurt bovendien geleidelijk, wat lijkt overeen te komen met de onder andere door Johnson en Newport (1991) geconstateerde geleidelijke afname in het vermogen om een taal te leren.
Enkele andere argumenten zijn op z'n minst twijfelachtig. Een zo'n argument is de onafhankelijkheid van het taalvermogen van andere cognitieve vermogens. Over het algemeen worden twee cognitieve vaardigheden verondersteld onafhankelijk te zijn wanneer er een zogenaamde dubbele dissociatie geconstateerd kan worden. Een dubbele dissociatie houdt in dat de ene cognitieve vaardigheid intact kan zijn terwijl de andere cognitieve vaardigheid beschadigd is, en omgekeerd. In de vroegere dagen van de generatieve taalkunde werd regelmatig benadrukt dat zelfs kinderen met het syndroom van Down normal leren spreken. Echter, nader onderzoek heeft uitgewezen dat de taalvaardigheid van kinderen met het syndroom van Down toch een stuk onder het niveau ligt van kinderen met een normale intelligentie. Een andere mentale afwijking waarbij het taalvermogen onaangetast lijkt te zijn gebleven, is het syndroom van Williams. Hoewel kinderen met het syndroom van Williams soms even goed presteren op sommige taaltesten dan normale kinderen, wijzen afwijkende patronen van hersenactiviteit erop dat er bij het syndroom van Williams sprake is van een geheel andere organisatie van de taalfunctie in plaats van het min of meer onaangetast blijven van de taalfunctie. Ook verloopt de verwerving van het lexicon anders dan bij normale kinderen en hebben deze patiënten enkele specifieke problemen met de syntaxis. Dit alles suggereert dat de taalfunctie bepaald niet onaangetast is gebleven bij kinderen met het syndroom van Williams (Karmiloff-Smith, 1998; Karmiloff-Smith et al., 1997; Karmiloff-Smith et al., 1998; Stevens en Karmiloff-Smith, 1997).
Tegenover mensen met een algemene cognitieve stoornis die wel in staat zijn taal te leren staan mensen met een normale intelligentie die toch niet in staat zijn tot het leren van een taal. Als voorbeeld van een dergelijke dissociatie wordt vaak gewezen naar mensen die lijden aan een zogenaamde specifieke taalstoornis. Zo wordt beweerd dat de hierboven genoemde KE familie aan een dergelijke taalspecifieke stoornis lijdt (Gopnik, 1990; Gopnik en Crago, 1991; Pinker, 1994). Echter, door Vargha-Khadem et al. (1995) is aangetoond dat het genetisch defect van de KE familie in feite tot veel algemenere problemen leidt. Het gemiddelde intelligentie-niveau van de getroffen familieleden lag bijvoorbeeld ver beneden het normale intelligentie-niveau. Er is hier dus geen sprake van een duidelijke relatie tussen een bepaald genetisch defect en een taalspecifieke stoornis. Taalspecifieke stoornissen zonder genetische basis zeggen daarentegen niets over het aangeboren zijn van het taalvermogen. Ook aangeleerde vaardigheden kunnen specifiek beschadigd raken. Zo is agraphia een stoornis waardoor patiënten niet meer in staat zijn te schrijven (Kolb en Whishaw, 1980). Ze kunnen zich niet meer de vorm van letters herinneren of zijn niet meer in staat om zich de correcte bewegingen te herinneren die ze moeten maken om de letters te produceren.
Sommige van de aangedragen argumenten zijn niet relevant voor de vraag of het taalvermogen al dan niet aangeboren is. Het niet voorkomen van een op taal lijkend
| |
| |
communicatiesysteem bij bijvoorbeeld primaten is bijvoorbeeld geen steekhoudend argument. Misschien beschikken primaten simpelweg niet over de voor het leren van taal vereiste algemene cognitieve vermogens. Ook het feit dat de structuur van taal lijkt te gehoorzamen aan regels die specifiek zijn voor taal zegt niets over het al dan niet aangeboren zijn van taal. Mensen zijn heel goed in staat om domein-specifieke kennis en vaardigheden te leren. Denk bijvoorbeeld aan de regels van het schaken, die slechts geldig zijn binnen het schaakdomein. Toch is het zeer goed mogelijk om de regels van het schaakspel binnen afzienbare tijd te leren.
Slechts enkele argumenten zijn specifiek van toepassing op taal en tevens niet al meteen te weerleggen door andere cognitiewetenschappers: het argument van de armoede van de taalinput en de universaliteit van taalprincipes. Deze argumenten worden beschouwd als de centrale motivatie voor een aangeboren taalvermogen. Echter, ook op deze argumenten valt bij nadere beschouwing veel af te dingen. De universaliteit van taalprincipes, bijvoorbeeld, is in feite een van de basisaannames waar generatief-taalkundigen van uitgaan bij de bestudering van taal. Iets wat een aanname is van een theorie, kan niet tegelijkertijd de conclusie zijn van dezelfde theorie (voor een uitgebreidere kritiek op het argument van de universaliteit van taalprincipes, zie Sampson, 1997). Ditzelfde geldt ook voor het schijnbaar uit het niets ontstaan van de grammatica van een creooltaal. Het is een empirische kwestie of er kenmerken van creooltalen zijn die niet te herleiden zijn tot de kenmerken van de aan de creooltaal ten grondslag liggende talen, en die niet uit andere zaken volgen. De ontdekking van universele kenmerken van taal hoeft overigens nog niet te wijzen op een aangeboren basis. Universele kenmerken kunnen ook volgen uit universele omgevingsfactoren of uit de beperkingen die aan taal opgelegd worden door het brein. Als bijvoorbeeld spiegeling een operatie is waar het menselijke brein grote moeite mee heeft, dan zullen we deze operatie met grote waarschijnlijkheid ook niet aantreffen in natuurlijke taal.
Het andere argument, de armoede van de taalinput, is iets complexer. Het achterliggende idee van het argument van de armoede van de taalinput is dat de zinnen die het kind te horen krijgt onvoldoende informatie bevatten om er logischerwijs de taal uit te kunnen deduceren. De taalinput zou kwalitatief onvoldoende zijn, aangezien het ook ongrammaticale zinnen bevat. De taalinput zou bovendien kwantitatief onvoldoende zijn, aangezien het niet alle relevante voorbeelden bevat. Tenslotte wordt niet aangegeven welke zinnen niet mogelijk zijn in de te leren taal. Toch kan ook dit argument weerlegd worden. De taalinput van een kind bevat namelijk vrijwel geen ongrammaticale zinnen, volgens een onderzoek door Newport et al. (1977). Volgens dit onderzoek was slechts 1 van de 1500 zinnen die door moeders tot hun kinderen werden gericht ongrammaticaal. Ook met de kwantitatieve tekortkomingen van de taalinput lijkt het wel mee te vallen. Een voorbeeld dat door nativisten veelvuldig gebruikt wordt is de formatie van ja/nee-vraagzinnen. Uit een statistische analyse van een tekstcorpus (Pullum, 1996) blijkt dat de zinsconstructies die voor de verwerving hiervan noodzakelijk zijn ongeveer 12% van het totale aantal vraagzinnen uitmaken. Aangenomen mag dus worden dat relevante voorbeelden voor de formatie van ja/neevraagzinnen ook vaak genoeg voorkomen in de taalinput van een kind. Tenslotte is het ontbreken van als zodanig gemarkeerde ongrammaticale zinnen slechts een probleem wanneer wordt aangenomen dat kinderen logisch redeneren (zie Hendriks, 1998, voor een discussie van dit punt). Aangezien deze aanname volgens divers cognitief-psychologisch onderzoek (Griggs en Cox, 1982; Mayer, 1983) erg implausibel is, komt het hele argument van de armoede van de taalinput daarmee op losse schroeven te staan.
| |
| |
Alles bij elkaar genomen kan geconcludeerd worden dat de sterk nativistische positie van de taalkunde een weinig solide onderbouwing heeft. De argumenten vanuit de taalkunde zelf zijn zeker niet sterker dan neuropathologische argumenten zoals het vermeende bestaan van dubbele dissociaties. Het sterkste taalkundige argument van de armoede van de taalinput wordt door de meeste andere cognitiewetenschappers niet als een onweerlegbaar argument gezien. Het argument is dan ook niet overgenomen voor gerelateerde kennisdomeinen, waarvoor het volgens de nativistische redenering ook zou moeten gelden. Dit maakt de uitzonderingspositie van taalkundigen ten aanzien van het nativisme-vraagstuk een moeilijk houdbare.
| |
8. De aard van kennis
Een vraag die gerelateerd is aan de vraag in de vorige paragraaf naar de herkomst van kennis is de vraag in hoeverre bepaalde vormen van kennis en bepaalde vaardigheden op zichzelf staan, oftewel als een domein-specifieke module functioneren. Het alternatief is dat deze kennis en vaardigheden sterk samenhangen met andere cognitieve vaardigheden, en niet wezenlijk van die andere cognitieve vaardigheden verschillen. Deze vraag is gerelateerd aan de vraag over de herkomst van kennis, aangezien een nativistische visie op taal meestal samengaat met een modulaire visie op taal. Hetgeen verondersteld wordt aangeboren te zijn, wordt vaak tegelijkertijd verondersteld als een autonome module te functioneren. Echter, de antwoorden op de twee vragen zijn niet noodzakelijkerwijs van elkaar afhankelijk. Modularisering kan ook ontstaan als het resultaat van ontwikkeling, en is dus niet alleen het kenmerk van aangeboren functies. Aan de andere kant is het heel goed denkbaar dat bepaalde algemene cognitieve principes aangeboren zijn, zodat aangeborenheid niet meteen domein-specificiteit en modulariteit impliceert.
| |
8.1 Mentale organen of een ondeelbaar brein?
Een modulaire visie op cognitieve vaardigheden is al behoorlijk oud. Al in de filosofie en psychologie van de voorgaande eeuwen werd de menselijke geest verondersteld opgedeeld te zijn in verschillende vermogens: bewustzijn, geheugen, aandacht, taal, maar ook wel meer obscure eigenschappen als standvastigheid, geslotenheid, verhevenheid, trouwlustigheid en menselijke aard (zie bijvoorbeeld het werk van Franz Joseph Gall (1758-1828)). Het achterliggende idee is niet onaannemelijk: de menselijke geest is in staat tot heel verschillende vaardigheden, van waarneming tot redeneren, van taal tot herinneren. Deze vaardigheden zijn op het eerste gezicht zo verschillend, dat er ook wel eens verschillende processen aan ten grondslag zouden kunnen liggen. Door Chomsky (1980) wordt dit idee plastisch weergegeven door de menselijke geest te vergelijken met het menselijk lichaam. Net zoals het menselijk lichaam bestaat uit verschillende organen die elk hun eigen functie en werkwijze hebben, zo zou ook de menselijke geest bestaan uit verschillende ‘mentale organen’ met elk hun eigen functie en werkwijze, aldus Chomsky. Chomsky's speciale aandacht gaat uit naar het ‘taalorgaan’, de functionele eenheid in het brein die verantwoordelijk is voor de verwerking van taal.
| |
| |
Maar ook de tegenovergestelde visie is niet onaannemelijk. Onze hersenen zijn opgebouwd uit neuronen, die allemaal op dezelfde manier werken. Waarom zouden dan niet alle cognitieve functies ook volgens identieke basisprincipes werken?
De meeste cognitiewetenschappers zullen het niet onmogelijk achten dat perifere functies zoals de eerste verwerking van binnenkomende perceptuele informatie en het aansturen van spieren taakspecifiek zijn. Immers, het omzetten van luchttrillingen (geluid) in neurale activiteit is een hele specifieke taak, die erg verschilt van bijvoorbeeld het omzetten van patronen van lichtquanta (beeld) in neurale activiteit of van het omzetten van chemische energie (geur) in neurale activiteit. Veel cognitief-psychologen, de meeste taalkundigen en een filosoof als Jerry Fodor (zie Fodor, 1983) zijn daarnaast van mening dat ook de hogere-orde verwerking op modulaire wijze plaats vindt. Talige input wordt verwerkt op een wijze die specifiek is voor taal, visuele input wordt verwerkt op een wijze die specifiek is voor visuele informatie, enzovoort. Sommige cognitiewetenschappers gaan nog verder door in het geheugen weer submodules te onderscheiden en de syntaxis te beschouwen als een autonome module binnen de taalmodule.
Maar voor andere cognitiewetenschappers vormt de rest van het cognitieve systeem een eenheid. Tegenover een modulaire visie staat de visie dat het hogere cognitieve systeem een unitair systeem is. Dit wil zeggen dat alle hogere cognitieve processen zoals geheugen, taal, redeneren, wiskunde en verbeelding verschillende manifestaties zijn van hetzelfde onderliggende systeem. Deze visie ligt ten grondslag aan zogenaamde unified theories of cognition, zoals Soar (Newell, 1990), ACT* (Anderson, 1983) en zijn opvolger ACT-R (Anderson, 1993). De modulaire en unitaire positie staan trouwens niet lijnrecht tegenover elkaar. In ACT-R worden naast de systemen voor perceptie en motoriek in ieder geval twee onderliggende systemen onderscheiden, namelijk een procedureel en een declaratief systeem.
| |
8.2 Argumenten voor de modulaire en de unitaire visie
Er lijken niet zo heel veel argumenten te bestaan voor hetzij een modulaire, hetzij een unitaire visie op cognitie. In ieder geval geen argument voor een modulaire visie op cognitie vormt de localisatie van bepaalde cognitieve functies in specifieke hersengebieden. Immers, het is heel goed denkbaar dat twee cognitieve functies die in verschillende hersendelen gelocaliseerd zijn, werkzaam zijn op basis van identieke principes. Ook de noodzaak tot taakverdeling is geen argument. Eenzelfde systeem kan heel goed verschillende taken tegelijkertijd uitvoeren. Neem bijvoorbeeld een computerprogramma dat verschillende subtaken uitvoert op basis van hetzelfde programma en hetzelfde type regels. Newell (1990) lijkt zijn streven naar een unified theory of cognition heel goed beargumenteerd te hebben met de negen argumenten die hij aandraagt. Echter, geen van deze argumenten heeft betrekking op eigenschappen van cognitie en cognitieve processen. In plaats daarvan hebben de door Newell gepresenteerde argumenten louter betrekking op wetenschapsbeoefening en wetenschapsmethodologie in het algemeen: unificatie is altijd een doel van de wetenschap, een unified theory vormt een opslagplaats van samenhangende kennis waardoor gegevens gemakkelijker vergeleken en gesorteerd kunnen worden en de snelheid van kennisvermeerdering toeneemt, er zijn meer toepassingen mogelijk omdat bij veel toepassingen een grote verscheidenheid aan aspecten betrokken is, bij computersimulaties
| |
| |
zouden geen grote aantallen stipulaties meer te hoeven worden gemaakt om de simulatie aan het draaien te krijgen maar zou gebruik kunnen worden gemaakt van de al vergaarde kennis binnen de unified theory, enzovoort, enzovoort. Deze argumenten noemen zeker een aantal voordelen van een unified theory of cognition, maar tonen op geen enkele manier aan dat een unitaire benadering ook daadwerkelijk de juiste manier is om cognitie te onderzoeken.
De belangrijkste argumenten in de discussie rond modulariteit zijn oneigenlijke argumenten, die te maken hebben met de positie met betrekking tot het nativisme-vraagstuk. Zo hebben twee van de drie argumenten die Anderson (1983) presenteert ten gunste van de unitaire benadering te maken met de onwaarschijnlijkheid dat de veronderstelde modulaire functies aangeboren zijn. Echter, zoals aan het begin van deze paragraaf werd opgemerkt is de vraag naar de domein-specificiteit van kennis in principe onafhankelijk van de vraag naar de herkomst van kennis.
Maar ook het andere kamp gebruikt niet louter harde argumenten. Chomsky (1980) stelt dat er geen reden lijkt te zijn om aan te nemen dat het brein verschilt van het lichaam, dat structuur bevat in de vorm van organen die elk een afzonderlijke functie hebben. Vanzelfsprekend is dit geen sterk argument, aangezien fysieke organen zoals het hart en de longen al op het eerste gezicht duidelijk van elkaar te onderscheiden zijn wat betreft hun structuur en functie, terwijl dit niet zo is voor de veronderstelde mentale modules. Een ander argument dat in dit kader soms gebruikt wordt zijn dubbele dissociaties zoals besproken in paragraaf 7.2. Dubbele dissociaties zijn gevallen waarin algemene cognitieve vermogens gestoord zijn maar het taalvermogen intact is gebleven, naast gevallen waarin sprake is van het omgekeerde. Echter, zoals al in paragraaf 7.2 werd uiteengezet wordt de onafhankelijkheid van het taalvermogen van algemene cognitieve vermogens betwist. Bovendien lijkt ook anderszins twijfel te bestaan over de geldigheid van dubbele dissociaties als argument voor het bestaan van autonome modules (Plaut, 1995; Van Orden et al., 1997).
De centrale kwestie in dit debat is de mate van overeenkomst tussen de verschillende hogere cognitieve functies. Aanhangers van een modulaire visie wijzen op de verschillen tussen de diverse cognitieve functies. Andere domeinen van cognitie kennen bijvoorbeeld geen structurele relaties die ook maar in de verste verte lijken op de taalkundige relatie c-commanderen, die o.a. een belangrijke rol speelt in de generatieve verklaring van referentiële afhankelijkheden. Aanhangers van de unitaire visie wijzen juist op de overeenkomsten tussen bijvoorbeeld taal en andere cognitieve vaardigheden. Dit vormde bijvoorbeeld Andersons (1983) derde argument voor een unitaire visie op cognitie en voor ACT*. In ACT* en ACT-R wordt taal, net als bijvoorbeeld wiskunde, programmeren en redeneren, geanalyseerd als een vorm van probleemoplossen. De overeenkomst c.q. het verschil tussen de verschillende hogere cognitieve functies lijkt dus eerder een a priori aanname dan een argument ter ondersteuning van de positie. Welke positie de juiste is, lijkt af te hangen van het succes van de respectievelijke onderzoeksprogramma's en zal zeker niet binnen afzienbare tijd beslist worden.
Kortom, zowel de modulaire positie als de unitaire positie wordt gekenmerkt door de afwezigheid van overtuigende argumenten. De sterke samenhang van deze kwestie met het nativisme-vraagstuk zorgt bovendien voor een weinig doorzichtige discussie. Een nativistische positie heeft meestal, hoewel niet noodzakelijkerwijs, de keuze voor een modulaire positie tot gevolg. Daarnaast lijkt de keuze voor een modulaire visie ook bepaald te worden door overwegingen van meer praktische aard.
| |
| |
Beperking van het onderzoeksdomein tot een enkele cognitieve functie (uit praktische of financiële motieven) resulteert al gauw in een al dan niet bewust ingenomen modulaire positie. De in de taalkunde dominante modulaire visie lijkt met name gemotiveerd te zijn door het ingenomen standpunt van het nativisme. Zoals we zagen in de vorige paragraaf, staat de taalkunde hierin vrijwel alleen binnen de cognitiewetenschap. De modulaire visie wordt in tegenstelling tot de sterk nativistische visie door meer cognitiewetenschappers aangehangen. De keuze hiervoor lijkt echter niet gefundeerd te zijn door overtuigende inhoudelijke argumenten.
| |
9. Conclusie
Afgezien van het nativistische standpunt met betrekking tot de herkomst van kennis wijken de ideeën van hedendaagse taalkundigen maar weinig af van de ideeën van andere cognitiewetenschappers. Toch wordt er van verschillende kanten nadrukkelijk gewezen op de kloof tussen de taalkunde en de rest van de cognitiewetenschap. Blijkbaar heeft het nativistische standpunt in de taalkunde dermate ingrijpende gevolgen voor de interactie tussen de taalkunde en de andere deelgebieden van de cognitiewetenschap dat wederzijdse communicatie moeilijk is geworden en wederzijdse beïnvloeding vrijwel niet plaatsvindt. Opvallend in dit licht is de zeer magere onderbouwing door taalkundigen van hun nativistische standpunt. Met het oog op de toekomst zou de taalkunde er wellicht verstandig aan doen deze onderbouwing aan een nader onderzoek te onderwerpen. Indien er geen sterkere argumenten gevonden worden voor het nativistische standpunt dan de tot nu toe gehanteerde argumenten, dan zou het afwijkende nativistische standpunt zeker heroverwogen dienen te worden. Immers, het zou de doodklap voor de taalkunde betekenen wanneer cognitiewetenschappers erin zouden slagen een pratende robot te ontwerpen, terwijl taalkundigen nog steeds druk bezig zijn zich af te vragen hoe kinderen er in hemelsnaam in slagen het principe te ontdekken van de verplaatsing van lege operatoren, die je niet hoort maar die vanuit theoretisch perspectief nodig zijn om de aanwezigheid te verklaren van andere lege elementen, die je vanzelfsprekend ook niet hoort maar die nodig zijn om het gedrag van andere, wel hoorbare, taalkundige elementen te verklaren. De enige die dan nog een luisterend oor zou willen bieden aan taalkundige ideeën zou wel eens diezelfde robot kunnen zijn...
| |
Bibliografie
Anderson, John R.
1983 |
The Architecture of Cognition, Harvard University Press, Cambridge, MA. |
1993 |
Rules of the mind, Lawrence Erlbaum, Hillsdale, NJ. |
Bechtel W.
1988 |
Philosophy of mind: An Overview for Cognitive Science, Lawrence Erlbaum, Hillsdale, NJ. |
Cheng, Lisa L.-S. en Rint Sybesma
1999 |
‘Chomsky's Universal Grammar under fire!’, Guest column, Glot International 4.4, 10. |
Chomsky, Noam
1957 |
Syntactic Structures, Mouton, 's Gravenhage. |
1959 |
‘Review of B.F. Skinner, Verbal Behavior’, Language 35, 26-58. |
| |
| |
1980 |
Rules and Representations, Blackwell, Oxford. |
1995 |
The Minimalist Program, MIT Press, Cambridge, MA. |
Clark, A.
1993 |
Associative Engines. Connectionism, Concepts, and Representational Change, MIT Press, Cambridge, MA. |
Crick, F.
1989 |
‘The recent excitement about neural networks’, Nature 337, 129-132. |
Elman, J.L.
1990 |
‘Finding structure in time’, Cognitive Science 14, 179-211. |
1993 |
‘Learning and development in neural networks: The importance of starting small’, Cognition 48, 71-99. |
Elman, J.L., E.A. Bates, M.H. Johnson, A. Karmiloff-Smith, D. Parisi & K. Plunkett 1996 |
Rethinking Innateness: A Connectionist Perspective on Development, MIT Press, Cambridge, MA. |
Eriksson, P.S. et al.
1998 |
‘Neurogenesis in the Adult Human Hippocampus’, Nature Medicine 4.11, 1313-1317. |
Fodor, Jerry A.
1975 |
The language of thought, Crowell, New York. |
1983 |
The Modularity of Mind, MIT Press, Cambridge, MA. |
Fodor, Jerry A. & Zenon W. Pylyshyn
1988 |
‘Connectionism and cognitive architecture: A critical analysis’, Cognition 28, 3-71. |
Gopnik, M.
1990 |
‘Feature-blind grammar and dysphasia’, Nature 344, 715. |
Gopnik, M. & M.B. Crago
1991 |
‘Familial aggregation of a developmental language disorder’, Cognition 39, 1-50. |
Griggs, R.A. & J.R. Cox
1982 |
‘The elusive thematic-materials effect in Wason's selection task’, British Journal of Psychology 73, 407-420. |
Hendriks, Petra
1998 |
‘Waarom Plato's probleem niet van toepassing is op de verwerving van taal’, Tabu 28.4, 43-58. |
Johnson, J.S. & E.L. Newport
1991 |
‘Critical period effects on universal properties of language: the status of subjacency in a second language’, Cognition 39, 215-258. |
Karmiloff-Smith, A.
1998 |
‘Development itself is the key to understanding developmental disorders’, Trends in Cognitive Sciences 2.10, 389-398. |
Karmiloff-Smith, A., J. Grant, I. Berthoud, M. Davies, P. Howlin & O. Udwin
1997 |
‘Language and Williams syndrome: how intact is “intact”?’ Child Development 68, 246-262. |
Karmiloff-Smith, A., L.K. Tyler, K. Voice, K. Sims, O. Udwin, P. Howlin & M. Davies 1998 |
‘Linguistic dissociations in Williams syndrome: evaluating receptive syntax in on-line and off-line tasks’, Neuropsychologia 36, 343-351. |
Kolb, B. & I.Q. Whishaw
1990 |
Fundamentals of human neuropsychology, Freeman, San Francisco. |
Levelt, W.J.M.
1989 |
‘De connectionistische mode’, in: C. Brown, P. Hagoort & T. Meijering (eds.), Vensters op de geest, Stichting Grafiet, Utrecht, 202-219. |
Marr, David
1982 |
Vision: A computational investigation into the human representation and |
| |
| |
|
processing of visual information, W.H. Freeman, San Francisco. |
Mayer, R.E.
1983 |
Thinking, problem solving, cognition. W.H. Freeman and Company, New York. |
McCulloch, W.S. & W. Pitts
1943 |
‘A logical calculus of the ideas immanent in neural nets’, Bulletin of Mathematical Biophysics 5, 115-137. |
Newell, Alan
1990 |
Unified theories of cognition, Harvard University Press, Cambridge, MA. |
Newport, Elissa L.
1990 |
‘Maturational constraints on language learning’, Cognitive Science 14. |
Newport, Elissa, Henry Gleitman en Lila R. Gleitman
1977 |
‘Mother, I'd rather do it myself: some effects and non-effects of maternal speech style’, in: C.E. Snow & C.A. Ferguson (eds.), Talking to Children: Language Input and Acquisition, Cambridge University Press, Cambridge, 109-149. |
Pinker, Steven
1994 |
The Language Instinct. The new science of language and mind. William Morrow and Co., New York. |
Pinker, Steven en Alan Prince
1988 |
‘On language and connectionism: Analysis of a parallel distributed processing model of language acquisition’, Cognition 28, 73-193. |
Plaut, D.
1995 |
‘Double dissociations without modularity: evidence from connectionist neuropsychology’, Journal of Clinical and Experimental europsychology 17.2, 291-321. |
Prince, Alan en Paul Smolensky
1991 |
Notes on Connectionism and Harmony Theory in Linguistics. Technical Report, University of Colorado, Boulder. |
1997 |
‘Optimality: From Neural Networks to Universal Grammar’, Science 275, 1604-1610. |
Pullum, Geoffrey K.
1996 |
‘Learnability, hyperlearning, and the poverty of the stimulus’, in Proceedings of the 22nd Annual Meeting: General Session and Parasession on the Role of Learnability in Grammatical Theory, Berkeley Linguistic Society, 498-513. |
Quartz, S.R.
1999 |
‘The constructivist brain’, Trends in Cognitive Sciences 3.2, 48-57. |
Riemsdijk, Henk van
1998 |
interview door L. Cheng & R. Sybesma, Glot International 3.5, 18-19. |
Rumelhart, David E. & James L. McClelland
1986 |
‘On learning the past tenses of English verbs’, in: D.E. Rumelhart & J.L. McClelland (eds.), Parallel distributed processing: Explorations in the microstructure of cognition. Volume 2: Psychological and biological models, MIT Press, Cambridge, MA, 216-271. |
Sadato, N., A. Pascual-Leone, J. Grafman, V. Ibañez, M.-P. Deiber, G. Dold & M. Hallett
1996 |
‘Activation of the primary visual cortex by Braille reading in blind subjects’, Nature 380, 526-528. |
Sampson, G.
1997 |
Educating Eve: The ‘Language Instinct’ Debate, Cassell, London. |
|
Schunn, C.D., K. Crowley & T. Okada
1998 |
‘The Growth of Multidisciplinarity in the Cognitive Science Society’, |
| |
| |
|
Cognitive Science 22.1, 107-130. |
Stevens, T. & A. Karmiloff-Smith
1997 |
‘Word learning in a special population: do individuals with Williams syndrome obey lexical constraints?’, Journal of Child Language, 24, 737-765. |
Tesar, Bruce en Paul Smolensky
1998 |
‘Learnability in Optimality Theory’. Linguistic Inquiry, 29.2, 229-268. |
Thelen, E.
1995 |
‘Time-Scale Dynamics and the Development of an Embodied Cognition’, in: R.F. Port & T. van Gelder (eds.), Mind as Motion: Explorations in the Dynamics of Cognition, MIT Press, Cambridge, MA, 69-100. |
Turing, Alan M.
1936 |
‘On computable numbers, with an application to the Entscheidungsproblem’, Proceedings of the London Mathematical Society 42, 230-265. |
Van Orden, G.C., M.A. Jansen op de Haar en A.M.T. Bosman
1997 |
‘Complex dynamic systems also predict dissociations, but they do not reduce to autonomous components’, Cognitive Neuropsychology 14.1, 131-165. |
Vargha-Khadem, F., K. Watkins, K. Alcock, P. Fletcher & R. Passingham
1995 |
‘Praxic and nonverbal cognitive deficits in a large family with a genetically transmitted speech and language disorder’, in: Proceedings of the National Academy of Sciences of the United States of America 92, 930-933. |
Wexler, Kenneth
1991 |
‘On the Argument from the Poverty of the Stimulus’, in: A. Kasher (ed.), The Chomskyan Turn. Blackwell, Cambridge, 252-270. |
|
|