| |
| |
| |
Taal en informatie: op zoek naar nieuwe toepassingen Johan van Benthem
In dit artikel wordt een overzicht gegeven van mogelijke verbindingslijnen tussen taalkundige semantiek en informatica. Er worden twee werkhypothesen voor verder onderzoek geformuleerd, die er samen op neer komen dat de problemen op beide gebieden sterke overeenkomsten vertonen, zodat er niet alleen sprake is van toepassing van taalkundige inzichten in informatietechnologie, maar ook van belangwekkende gevolgen voor de theoretische semantiek zelf.
| |
1. Aanleiding
Dit artikel is een bewerking van een lezing gegeven voor de Stichting Taalwetenschap, vanuit de werkgemeenschap ‘Syntaxis en Semantiek’, op 4 maart 1986. Het thema was toepassing van taalkundige theorieën, met name in de richting van Informatica: een ontwikkeling die de Stichting wil gaan stimuleren. Zulke toepassingen zijn denkbaar voor uiteenlopende takken van de linguïstiek. Daarvan zal hier de semantiek centraal staan - begrepen als een studie van het systeem van mogelijke betekenissen in taal, en hun koppeling aan taalstructuren. (Met dat laatste blijft overigens de syntaxis vanzelf in het spel.) Een dergelijke studie voert al snel tot kwesties van kennis en informatie: verwerving, bewerking en overdracht ervan; en daarmee tot verbanden met andere disciplines die deze thema's een warm hart toedragen, zoals cognitieve psychologie of ‘kunstmatige intelligentie’. Deze verbanden zijn in eerste instantie van theoretische aard, maar kunnen soms ook praktisch worden.
De bedoeling in het volgende is enkele lijnen te bespreken in het genoemde gebied, discursief, zonder te streven naar een totaaloverzicht. (Evenmin is wat volgt een complete ‘Who-is-Who’ in semantisch Nederland.) Wat dat totaalbeeld betreft, mogen we in elk geval aannemen dat de semantiek hier te lande bloeit, getuige de uiterst gunstige handelsbalans. We exporteren namelijk beduidend meer talentrijke jonge semantici naar het buitenland dan we hier zelf aan de universiteiten vermogen te plaatsen. Nochtans, de bewering is niet dat de toepassingen van de semantiek reeds overstelpend zouden zijn. Integendeel, we begeven ons in contreien waar visserslatijn de voertaal is - en de nodige scepsis over snelle successen derhalve dienstig. Wat momenteel bestaat zijn enkele veelbelovende aanknopingspunten, en daarover geeft dit artikel verdere informatie.
| |
2. Semantiek
Wat voor onderwerpen worden nu eigenlijk in de semantiek van natuurlijke taal onderzocht? Enkele voorbeelden mogen dit verduidelijken.
Om te beginnen is er het identificeren van fundamentele patronen die betekenis creëren, zoals het toekennen van een predikaat aan een subject (‘(Baby Doc) wankelt’), of het toepassen van een modificerende functie op een argument (‘niet (trotseren)’). Hierbij worden dan modellen geconstrueerd van toegekende ‘betekenissen’, uitgaande van ‘individuen’, met
| |
| |
daarover ‘predicaten’, en dan weer hogere functies die hierop werken. En de betekenis van uitdrukkingen wordt geformuleerd in zg. waarheidscondities, die vastleggen wanneer een bewering waar is in zo'n model. (Meer in het algemeen kan men spreken van ‘waarde-condities’ voor willekeurige uitdrukkingen.)
Vervolgens is er de vraag naar systematische opbouw van betekenissen, parallel met verdere syntactische constructies. Wat is bijvoorbeeld de betekenisopbouw corresponderend met een determinator-zin als ‘((Elke)Det(spitsspeler)N)NP(miste)VP’, of een voorzetsel-bepaling als ‘((zonder)Prep((enige)Det(consideratie met het publiek)N)NP)PP’?
Met deze opbouw verstrengeld zijn algemene linguïstische mechanismen, die traditioneel in de aandacht van semantici staan, zoals de betekenisbijdrage van anaforische relaties (‘Iedere ouder die zijn kind lief heeft kastijdt het.’), of temporele bepalingen (‘Gisteren ontstond Helen in de bocht van Yucatán, en ze zou nu al in Florida zijn aangekomen, als niet even voor zonsondergang... .’).
Maar er zijn ook semantici die, meer lexicaal geöriënteerd, speciale uitdrukkingen onder de loupe nemen, en hun betekenis-eigenaardigheden in kaart brengen. Zo is er veel onderzoek gedaan naar de betekenissen van specifieke determinatoren (‘de’, ‘alle’, ‘sommige’, ‘de meeste’, ...) of specifieke woordvormingsprocessen, zoals de vorming van comparatieven (‘gro(o)t-er’, ‘even oud als’, ...).
Al deze interessen leiden overigens niet steeds tot geruisloze cumulatie van inzichten. Soms vereist een adequate behandeling van een onschuldig ogend verschijnsel veranderingen in het semantisch model met repercussies elders. Een voorbeeld is de recente interesse voor nominalizeringen (‘(Opstaan voor iemand) misstaat niemand’), die heeft geleid tot een relativering van het eerder zo fundamentele onderscheid tussen individuen en predicaten. Deze laatste kunnen zich kennelijk toch in vele opzichten als individuen gedragen (zie Chierchia 1985).
Wanneer we dit verschijnsel semantisch gaan modelleren, dan komen er bovendien vele opties aan het licht - en dat is ook niet verwonderlijk. Taal beschrijft immers wel ten dele de wereld buiten ons, maar toch ook voor een groot deel de ‘conceptuele bovenbouw’ die wijzelf daaraan opleggen. En deze laatste is waarschijnlijk niet uniek bepaald. Dit mengsel van natuurlijke en door ons taalgebruikers opgelegde structuur maakt ook bijvoorbeeld de semantiek van tijdsaanduidende uitdrukkingen zo complex, en intrigerend. Tijd-in-taal is een mengsel van fysische tijd en linguïstische ordening van gegevens.
Een tweede bron van veranderingen in semantische modellen ligt in de nagestreefde systematische koppeling tussen syntactische structuur en semantische betekenissen: voor verschillende syntactische theorieën kan de ‘voorkeurssemantiek’ nogal uiteenlopen. Bovendien blijkt, bij nadere beschouwing, deze koppeling sterk beïnvloed door contextuele factoren, zoals omringende tekst, maar ook: situering en achtergrondkennis van spreker en hoorder, schrijver en lezer. Dergelijke ‘pragmatische’ effecten zijn zeker niet altijd
| |
| |
waterdicht van de semantiek af te schotten, en beïnvloeden de modellering.
De bedoeling van deze onderzoekingen is overigens niet zozeer een soort mammoet legpuzzle op te lossen, totdat het systeem der betekenissen voor de natuurlijke taal eens en voor altijd in elkaar is gepast. Wel vindt men niet zelden zo'n ideaal gepresenteerd - maar dit mag even weinig serieus genomen worden'als de gedachte dat de syntaxis klaar zou zijn met het construeren van één alomvattende grammatica voor een taal. Ten eerste moeten de gegeven semantische modellen en waarheidscondities verklarende waarde hebben. Ze dienen ons bijvoorbeeld beter te doen begrijpen welke verschillende ‘lezingen’ zinnen kunnen hebben, of waarom sommige anaforische verbanden wel gelegd kunnen worden en andere niet, of hoe de verschillende temporele uitdrukkingen samenwerken in het opbouwen van een temporeel perspectief in een verhaal. Bovendien vertoont elke taal op zich vele ‘hogere orde’ semantische verschijnselen die beschreven en verklaard moeten worden, zoals brede analogieën tussen diverse categorieën van uitdrukkingen (bijvoorbeeld, adjectieven en adverbia), of logische implicaties tussen diverse uitdrukkingen, en daarbij rijzende puzzles, problemen en paradoxen. En uiteindelijk komen we dan bij meer universele oogmerken, en wel het doorgronden van universele naast taalspecifieke aspecten in de semantiek van natuurlijke talen op deze wereld. In het vervolg van deze lezing zullen zelfs nog verdere thema's aan het licht treden, over semantiek als een theorie van informatie-structuur en -verwerking. De semantiek (en de taalkunde in het algemeen) kan dus nog wel even voort.
Dat dit soort systematische semantische studies zelfs maar mogelijk is werd vroeger in taalkundige kringen nog wel eens betwijfeld. Maar met name dankzij het voortrekkerswerk van Richard Montague zijn althans technieken ontwikkeld die voor fragmenten van de natuurlijke taal stelselmatig een bijbehorende betekenisopbouw geven. (Zie bijvoorbeeld GAMUT 1982 voor een inleiding met vele voorbeelden.) Inmiddels zijn op vrijwel ieder aspect van Montague's oorspronkelijke voorstellen wel amenderingen gekomen: maar de kerngedachte, dat dergelijke eisen van systematiek niet alleen wenselijk zijn maar ook haalbaar, is in bredere milieus van taalkundigen gemeengoed geworden. Daarbij is bovendien gebleken dat ver uiteenlopende syntactische theorieën zich zeer wel met een strenge semantiek verdragen. (Zie bv. Fenstad et al. 1985 voor het geval van Lexical-Functional Grammar.)
Voor een verder overzicht van wat zich in de taalkundig semantische literatuur afspeelt zij verwezen naar een internationale publicatie-serie als de Synthese Language Library/Studies in Linguistics and Philosophy (Reidel, Dordrecht), of de Nederlandse GRASS-serie (‘Groningen-Amsterdam Studies in Semantics’, Foris, Dordrecht.) Twee voorbeelden van vaktijdschriften zijn Linguistics and Philosophy (Reidel, Dordrecht) en het Journal of Semantics (Foris, Dordrecht). Er is overigens ook een bloeiend publicatiewezen op dit gebied in Duitsland en de Verenigde Staten.
| |
3. Toepassingen?
De bescheiden academische gemeenschap die de bovengenoemde onderwer- | |
| |
pen beheert is de laatste jaren in een stroomversnelling geraakt. Men hoort alom conversaties over ‘natural language processing’, ‘intelligente systemen’, ‘vijfde generatie’, ‘Esprit’, ‘Eureka’, kortom: het grote geld. Wij weten allen hoe ontwrichtend de komst van de technologische Twintigste Eeuw kan werken op rustieke samenlevingen - en ik hoef hier dus niet uit te weiden over de resulterende cultuurschok.
Toch bestaat zeker een reële basis voor deze contacten naar buiten toe. Hoe kan dan semantiek nuttig zijn bij concrete informatica-projecten? Bij wijze van illustratie kunnen we denken aan een project waarbij een gegevensbestand (data base) in natuurlijke taal bevraagd moet worden: zeg een uitleenbibliotheek. Laten we aannemen dat de gegevens over wie wat geleend heeft in een of andere technische vorm gecodeerd liggen. Dan vereist communicatie met dit systeem stappen als de volgende. Een vraagzin (‘Wie heeft “Oorlog en Vrede” geleend?’) moet eerst machinaal worden ontleed (hier speelt de syntaxis een rol), en dan worden omgezet in een abstracte betekenispresentatie die zinvol in verband gebracht kan worden met de ‘wereld’ van de bibliotheek(-gegevens). Zowel de aard van deze representatie als haar systematische voortbrenging vanuit de grammaticaal ontlede zin vallen, zoals we hebben gezien, binnen het terrein van de semantiek. Ook de specifieke onderwerpen die men daar reeds bestudeerd heeft blijken thans echter van groot belang. Voorbeelden zijn de genoemde anaphorische relaties (‘Wie leende Oorlog en Vrede en bracht het precies op tijd terug?’) en temporele structuren (de bibliotheek heeft een soort interne tijd van wisselende bestanden per peildatum, waaraan vragen refereren).
Vervolgens moet de vraag, eenmaal geïnterpreteerd op het niveau van de bibliotheekwereld, beantwoord worden. In klassieke data base systemen wordt dit opgevat als een deductie-probleem: de vraag stelt een mogelijke ‘conclusie’, die moet worden afgeleid uit de ‘axioma's’ van de data base. Maar wellicht natuurlijker is een perspectief van evaluatie: welke objecten maken de relevante bewering waar in deze wereld? En dat vooronderstelt weer de waarheidsconditionele kijk van de semantiek van natuurlijke taal. (Eerlijkheidshalve, voor gegevensbestanden met zg. ‘hogere informatie’ in de vorm van regels ligt de zaak complexer: zie paragraaf 6.) Een eenmaal verkregen abstract antwoord kan tenslotte de omgekeerde weg doorlopen, om weer in de kledij van natuurlijke taal aan de gebruiker te worden gepresenteerd.
Hiermee is overigens de rol van de semantiek nog niet afgelopen. Immers, het ligt voor de hand de interactie tussen gebruiker en systeem verder uit te breiden, bv. door het laten invoeren van nieuwe informatie door de gebruiker zelf. Aldus wordt een goede semantische theorie van belang voor verschillende taalhandelingen (mededelingen, vragen, opdrachten, ...). Bovendien hoeft hier geen alles-of-niets-communicatie op te treden. Eventueel kan het systeem tegenvragen stellen, ter verduidelijking (‘Bedoelt U “Rokende Colts” van Mickey Spillane of van Louis l'Amour?’) of waarschuwingen (‘Wat U thans invoert is in strijd met mijn eerdere informatie dat ...’). Hiermee komt de aanwezige kennis van de gesprekspartners in het geding. Wat een passende vraag of antwoord is in echt taalgebruik hangt immers sterk af van wat wij
| |
| |
(menen te) weten over de reeds aanwezige informatie bij de ander. (Vergelijk Groenendijk en Stokhof 1984.) En daarmee heeft een eenvoudig vraag-antwoord systeem zowat alle diepe kwesties overhoop gehaald, vanaf semantiek van natuurlijke taal tot een kennis-georiënteerde theorie over taalhandelingen. Een interessant punt hierbij is dat zelfs deze korte schets al niet spoort met gegroeide wetenschappelijke taakverdelingen, die een deel van het bovenstaande aan de taalkunde toeschrijven, maar bijvoorbeeld ‘zachter’ geachte teksten dialoog-gerichte thema's veelal uitbesteden bij de taalfilosofie.
Nu levert de bestaande semantiek natuurlijk geen pasklare oplossingen voor de technische implementatie van de genoemde data base systemen. Ze is echter wel een bron van ideeën en perspectieven. En, hoe weinig substantieel dat ook moge klinken, in de praktijk kan zoiets reeds zeer waardevol zijn. (Het valt wel vaker op in de informatica-literatuur hoe ‘filosofisch’ en algemeen sommige baanbrekende artikelen zijn. Theoretisch inzicht is het schaarse goed, niet praktische vaardigheid eenmaal gekozen inzichten te implementeren.)
Aan het voorbeeld van de data base zijn diverse andere toe te voegen. Zo komt semantiek op meerdere punten te pas bij projecten op het gebied van automatisch vertalen of artificiële intelligentie. Nu zijn dit gevallen met een voorgeschiedenis - die sommige taalkundigen wellicht liever zouden vergeten. Immers, reeds in de jaren zestig leefden alom heilsverwachtingen over de doorbraken die verwacht konden worden door een inzet van de moderne, transformationeel-generatieve grammatica in machinaal vertalen en cognitieve psychologie. En die zijn, kort samengevat, niet uitgekomen. Oude wijn in nieuwe zakken dus?
Er is in elk geval een verschil met destijds. Ten eerste is de semantische en algemeen taalkundige theorievorming verder gevorderd. En ten tweede zijn de pretenties sterk omlaag geschroefd: als dergelijke projecten al een kans van slagen hebben, dan is er semantiek bij nodig. Anders gesteld: het is niet gezegd dat het met semantiek zal slagen, maar zonder semantiek slaagt het in elk geval niet. (Zelfs deze stelling is overigens niet oncontroversieel.) Voor het geval van automatisch vertalen wordt een en ander uitvoerig beargumenteerd in Van Eynde 1985. De oude gedachte dat een betrekkelijk ‘oppervlakkig’ algorithme zou volstaan om teksten van de ene taal in de andere om te zetten is grotendeels verlaten, en zelfs het meenemen van diepere syntactische ontleding blijkt vaak onvoldoende voor bevredigende resultaten. Een semantisch geïnspireerde abstracte betekenisrepresentatie voor zinnen en teksten lijkt nodig, als kern van de overgedragen informatie. Taalspecifieke syntactische eigenaardigheden kunnen dan worden gelocaliseerd in de omzetting van zinnen van een natuurlijke taal naar en van zulke representaties. (In Nederland loopt momenteel een taalkundig-semantisch opgezet automatisch vertaal-project, te weten ROSETTA bij Philips Eindhoven. Eveneens taalkundig georiënteerd is de Nederlandse component van het EEG project EUROTRA, gebaseerd te Utrecht. Overigens is de realiteit van dergelijke systemen wel zo complex dat semantische representatie zeker geen toverstaf vormt voor snelle resultaten.) Voor een concreet voorbeeld, tenslotte, van parallellen tussen lopend semantisch onderzoek en werk in cognitieve psycho- | |
| |
logie/artificiële intelligentie zij verwezen naar van Benthem 1985, waar temporele
uitdrukkingen en temporeel perspectief worden vergeleken in de betreffende disciplines.
| |
4. Een nieuwe discipline
Men kan het ontstaan van mogelijke toepassingen zien als iets externs dat een vak overkomt. De Stichting Taalwetenschap schetst bovendien een niet bijster inspirerende achtergrond bij dit alles. We leven in een ‘informatiemaatschappij’, zo heet het in de officiële beleidsdocumenten, vol met informatieverwerkende apparatuur - en natuurlijke-taal-‘interfaces’ kunnen dan het verkeer tussen ons en die apparatuur vergemakkelijken. Deze laatste wordt dan, zoals dat heet, gebruikersvriendelijker. Natuurlijke taal als smeerolie dus voor het contact tussen expert-systemen en het lekenpubliek... Hoe men ook over de wenselijkheid van deze toepassing moge denken, er is in ieder geval méer aan de hand. De semantiek, en taalkunde in het algemeen, heeft ook een meer intrinsiek belang bij de informatica-connectie.
In vroege computer-implementaties van, bijvoorbeeld, Montague Grammatica werd dit belang wel omschreven als het practisch ‘de-buggen’ en ‘testen’ van semantische modelleringen. Eindelijk had de semantiek dan zoiets als een ‘experiment’ in de empirische wetenschappen. Iets hiervan is waar; hoewel de langs deze weg verworven inzichten hoogstens optellen tot enkele kleine hygiënische correcties op de bestaande theorieën. Er is echter ook een verder gaand belang bij het aanleggen van een computationeel perspectief voor semantische theorieën: leiden deze tot practisch werkbare systemen? Zeker voor die semantici die althans enig realiteitsgehalte willen claimen voor hun modelconstructies, als schema's van menselijk denken, is dit toch een onontkoombare proef op de som. (Maar gezegd moet worden dat veel semantici zelf dergelijke psychologische claims verwerpen.) Hoe dit ook zij, er laat zich een nog veel indringender these verdedigen, en wel dat de theoretische problemen op het gebied van de semantiek van natuurlijke taal en dat van de informatica fundamenteel analoog zijn! Dit inzicht werd reeds aangeduid door Montague, voor het geval van natuurlijke talen en formele talen uit logica en wiskunde - maar het valt ook uit te breiden tot programmeertalen. Het is bijvoorbeeld deze grondgedachte die in de Verenigde Staten heeft geleid tot de oprichting van het prestigieuze Center for the Study of Language and Information (CSLI) aan de Stanford University.
Voorbeelden van deze these zijn er in overvloed. Een mooie klassieke illustratie is te vinden in Janssen 1983, waarin (onder meer) de klassieke problematiek wordt behandeld van gelijkheid in zg. ‘intensionele contexten’. De logicus Frege merkte reeds in de negentiende eeuw op dat, hoewel de Ochtendster dezelfde planeet is als de Avondster (te weten Venus), uit de ware zin ‘De Babyloniërs ontdekten dat de Ochtendster de Avondster was’ toch niet volgt dat ‘De Babyloniërs ontdekten dat de Ochtendster de Ochtendster was’. Het eerste was een sensationele ontdekking, met grote repercussies voor bijvoorbeeld die volken in Arabia Felix die beide als verschillende godheden vereerden; het tweede was een allen bekende logische gemeen- | |
| |
plaats. De uitdrukking ‘ontdekken dat’ creëert een intensionele context, waarin naast de beschreven objecten zelf ook de aard van hun beschrijving van belang is. Taalkundige semantici hebben na Frege gaandeweg vele andere intensionele constructies ontdekt, dwars door de natuurlijke taal heen. Janssen laat nu zien dat deze verschijnselen zich ook voordoen binnen programmeertalen (hoewel ze daar niet als zodanig werden onderkend), en lost daarmee verbonden verwarringen en ingewikkeldheden in de informaticaliteratuur op, door gebruikmaking van Montague's natuurlijke taal semantiek.
Een meer recente illustratie is de boven vermelde herbezinning op de fundamentele indeling in ‘individuen’ en ‘predicaten’ bij de studie van nominalizeringen. Ook hier zijn er verrassende parallellen in de semantiek van programmeertalen - waar gangbare niveau-verschillen in modellen soms niet zijn te handhaven, zoals dat tussen ‘objecten’ en ‘procedures’ die bewerkingen weergeven op zulke objecten. (Soms fungeren ‘genominalizeerde’ procedures zelf weer als objecten waarmee gerekend kon worden: zie Stoy 1977.) In beide gevallen is hier een zg. Scott-domein-semantiek voorgesteld als remedie (zie Turner 1983).
Een derde voorbeeld betreft weer op kennis gebaseerde taalhandelingen. Hier hebben juist informatici de laatste tijd belangwekkende nieuwe ideeën ontwikkeld (zie Halpern & Moses 1984a, 1984b) over het ontstaan van ‘common knowledge’ aangaande elkaars informatie in een groep communicerende processoren met beperkte, gedeelde hoeveelheid (reken- en) gesprekstijd. Dit is in feite natuurlijk ook de situatie waarin wij verkeren tijdens een dialoog met meerdere taalgebruikers. Eén van de speculaties van het CSLI is dan ook dat een goed begrip van het thans sterk opkomende ‘parallel processing’ het best kan worden verkregen door middel van een gelijktijdige taalkundig-filosofische studie van gespreksvoering, en de daarin optredende strategieën.
In dit alles zijn de contouren te ontwaren van een nieuwe joint venture, zeg een ‘Informatica’ in de ruime zin des woords, waarin taalkunde, filosofie, logica, psychologie en informatica-als-informatietechnologie allen aandelen hebben. En, er is grote behoefte aan fundamenteel onderzoek op dit gebied. De begripsproblemen zijn zelfs groot genoeg om vertrouwde academische bestandslijnen, met de sluipschutters steeds in positie, even te negeren: iets wat in paragraaf 3 ook reeds vanzelf gebeurde. Deze urgentie hebben de Amerikaanse semantici pregnant verwoord, bij hun recente aanvragen van overheidsfondsen, in de constatering van een dreigende ‘theory gap’ tussen technische mogelijkheden en theoretisch inzicht. En gaten zijn er, het behoeft geen betoog, om door geldschieters te worden volgestort.
| |
5. Natuurlijke taal en informatie
Wat heeft in deze nieuwe constellatie nu juist de taalkunde te bieden? Zoals bekend, vormt volgens vele filosofen de natuurlijke taal geen geprivilegieerde toegang tot de ware betekenissen, ja ze verdoezelt die zelfs. Zo is de ‘Misleidende-Vorm-These’ van Frege, Russell en Carnap heel invloedrijk geweest, die onderwerping van het denken aan natuurlijke taalvormen zelfs verant- | |
| |
woordelijk stelde voor een hele syllabus errorum in de intellectuele geschiedenis. Als corollarium volgde dat een systematische betekenisanalyse voor natuurlijke talen niet mogelijk was (en een curieus monsterverbond met louter syntactisch georiënteerde linguïsten resulteerde). Voor dit doel zouden alleen speciaal geconstrueerde ‘formele talen’ geschikt zijn.
Langzamerhand is deze visie geërodeerd. Bij de Engelse ‘ordinary language philosophers’ begon dit omdat de natuurlijke taal, met al zijn onvolkomenheden, toch het enige medium is dat we bezitten om betekenis-structuur in eerste instantie op het spoor te komen. Bij meer formeel gerichte filosofen is allengs een grote rol gaan spelen dat een formele semantiek voor natuurlijke taal wel degelijk uitvoerbaar bleek, en dat die onderneming te interessant is om haar meteen te smoren in allerlei (vaak wat gezochte) ‘paradoxen’ die haar zouden ondergraven. (Zie van Benthem 1986c voor een uitvoering van deze hele discussie in het licht van de moderne semantiek). Los van deze filosofische perikelen blijft de simpele constatering dat er praktisch gesproken veel voor te zeggen is om bij de natuurlijke taal te beginnen in een studie van betekenis en informatie. Het is een concreet, gemakkelijk toegankelijk verschijnsel - en, er bestaat alvast de nodige theorie over. Dus, waarom niet?
| |
5.1
Wie een meer inspirerend vaandel nodig heeft, zou zich op dit punt kunnen wagen aan een Eerste Hypothese:
‘Taalstructuur weerspiegelt informatiestructuur’.
Nogmaals, dit is geen uitgemaakte zaak (en veel filosofen en logici zouden juist voor een principieel taalonafhankelijke kijk op kennis en informatie opteren). In elk geval is het echter een nuttig perspectief om diverse semantische onderzoeksthema's te plaatsen. Zo wordt nu de eerder genoemde studie van procedures om complexe betekenissen op te bouwen gelieerd aan de constructie van complexe informatie. Maar ook semantische detailstudies krijgen thans een ‘informatieve’ kleuring.
Een voorbeeld is te vinden in het lopende Groningse en Utrechtse onderzoek naar betekenissen van determinatoren. Basisdeterminatoren (‘alle’, ‘sommige’, ‘geen’) blijken een zekere stabiliteit te vertonen onder verandering van informatie. Als, zeg, de zin ‘Alle (voorgerechten) (zijn gekruid)’ waar is in zekere situatie, en we leren vervolgens dat meer dingen aan die dis gekruid zijn dan we eerst dachten, dan blijft de bewering toch waar. (‘Alle’ heet wel ‘monotoon stijgend’ in zijn rechter predicaat.) Daarentegen is ‘alle’ dalend in zijn linkerpredicaat: mochten minder (niet: meer) dingen blijken te kwalificeren als voorgerecht, dan blijft de eerdere bewering eveneens waar. Analoog blijkt bijvoorbeeld ‘Sommige XY’ stijgend in beide predicaten X en Y, en ‘Geen XY’ juist dalend. Zulke monotonieverschijnselen zijn op vele plaatsen door taalkundigen gesignaleerd: bij determinatoren, maar ook bij andere types uitdrukkingen (zie Zwarts 1981, 1986). Dit verschijnsel heeft ook tot meer theoretisch-logische vragen geleid. Zo valt ook een omgekeerde aan te tonen: alle mogelijke monotone relaties tussen predicaten kunnen worden gedefinieerd met behulp van de basis-determinatoren (zie van Benthem 1986a, hoofdstuk 1). Met een dergelijke informatie-analyse begrij- | |
| |
pen we dan iets meer van de uniformiteit van het basis-determinator vocabulaire door alle natuurlijke talen heen.
Een ander voorbeeld van een semantisch onderwerp met informatieperspectieven is het gebied der temporele uitdrukkingen. Zo is in taalkundig/filosofische hoek het orthodoxe wetenschappelijke tijdsbeeld van duurloze mathematische punten steeds meer aangevochten, en vervangen door een beeld van taal als beschrijving van processen en gebeurtenissen op ‘intervallen’ of ‘perioden’ met interne temporele structuur - die naar behoefte kunnen worden verfijnd indien nadere informatie daartoe aanleiding geeft. (Zie bijvoorbeeld Dowty 1979, of nog radicaler, Kamp 1979.) Nu is het verrassende dat eenzelfde stap onafhankelijk is voorgesteld binnen de artificiële intelligentie. Dergelijke interval-modellen zouden efficiënter zijn voor computationele algorithmen dan de klassieke: we maken alleen nieuwe intervallen aan indien nodig, zonder ons te bekommeren om alle mathematisch mogelijke punten. (Zie Allen 1983. Diens bewering staat overigens nog ter discussie.) Dat zulke kwesties van temporele representatie in de artificiële intelligentie van groot belang zijn komt omdat een planningssysteem achtereenvolgende handelingen moet beschouwen, met hun effecten.
Eén van de belangrijke taalkundige argumenten voor het overschakelen op intervalstructuren betrof het modelleren van verschillende temporele ‘inhouden’, opgeroepen door verschillende werkwoordelijke uitdrukkingen. Taalgebruikers houden systematisch verschillen bij tussen homogene tijdvullende gebeurtenissen, zoals ‘zingen’, en gebeurtenissen die in zekere perioden optreden, maar niet noodzakelijk ook elk deel daarvan kenmerken (‘de Marseillaise zingen’); en er zijn nog diverse andere genres te noemen. Taalkundigen hebben dit systeem lang bestudeerd (zie weer Dowty 1979; maar ook vele Nederlandse publicaties, beginnend bij Verkuyl 1972). En ook dit thema treffen we nu weer in recente informatica-publicaties (bijvoorbeeld Kowalski 1985, in de context van logic programming). Als informatie is gegeven voor een bepaalde periode, wat volgt dan voor de deelperioden hiervan voorzover aanwezig in het kennisbestand van de computer?
Iets waar onderzoekers binnen de informatica in dit verband op stuiten is het zg. ‘Frame Problem’ (zie Shoham & McDermott 1985). De moeilijkheid bij automatische planningssystemen is dat te veel informatie nodig lijkt. We bezitten in de praktijk slechts eindig veel gegevens omtrent wat zich afspeelt in een zekere constellatie van periodes - terwijl in principe volledige informatie nodig lijkt over wat wel en wat niet van kracht is op tussenliggende locaties. Bijvoorbeeld, bij het verplaatsen van een object in een kamer moet een plannende robot weten waar alle andere stukken meubilair zich in de tussentijd bevinden, om ‘klossen’ te voorkomen. (Dit is overigens slechts één facet van het ‘frame problem’, waarvan vele varianten in omloop zijn.) Nu lijken wijzelf in natuurlijk taalgebruik hier weinig moeite te hebben met de gesignaleerde, in principe nogal dreigende discrepantie. Dus, in het verlengde van de ideologie van paragraaf 4, zouden de semantische strategieën achter ons gebruik van temporele uitdrukkingen wel eens leerzaam kunnen zijn voor planning in het algemeen. (Toegegeven, dit soort meer dynamische vragen zijn bepaald nog niet ver ontwikkeld. Voor diverse aanzetten, zie Kamp 1979,
| |
| |
1981.)
Tenslotte valt nog een anders geaard emplooi te noteren voor semantiek van de natuurlijke taal, meer vanuit een lexicale oriëntatie bedreven. Het bovenstaande Allen-voorbeeld paste in een ontwikkeling binnen de artificiële intelligentie die wel bekend staat als ‘Naive’ of ‘Common Sense Physics’. Wat men daar nastreeft is het opzetten van redeneersystemen die de wereld representeren op de manier van onze gewone leefwereld, eerder dan een of ander verfijnd wetenschappelijk model (dat te complex is om mee te rekenen). Men mag immers aannemen dat ons gewone handelen zijn succes ontleent aan die common-sense-voorstellingen (eerder dan aan een ‘geheime’ wetenschappelijke rekenaar in onze hersenen). En, de snelste weg om dit netwerk van common-sense-begrippen in kaart te brengen loopt weer via de natuurlijke taal - waar linguïsten en taalfilosofen reeds ‘semantische velden’ hebben bestudeerd betreffende tijd, ruimte, causaliteit, beweging, enzovoorts. Voor diverse voorbeelden van deze werkwijze, zie Hobbs 1985: een uitvoerig werkverslag van een ‘common sense summer’ gehouden te Stanford.
| |
5.2
Nu is er nog een stap verder te zetten. Zelfs als de eerste hypothese juist is, dat natuurlijke taal de door mensen gehanteerde informatie weerspiegelt, dan nog zou onze normale taalverwerking niet noodzakelijk een efficiënte manier hoeven te zijn om met deze informatie om te springen. Maar het kan geen kwaad om (met de ‘naieve fysici’) een optimistische werkveronderstelling te maken, in de vorm van een Tweede Hypothese:
‘Menselijke taalverwerking is een efficiënt proces’.
Om dergelijke ideeën in de semantiek in te brengen zal overigens nog heel wat werk moeten worden verzet. Tot nu toe ontbreekt het ons namelijk zelfs grotendeels aan de juiste begrippen om te kunnen praten over meerdere of mindere efficiëntie van taalverwerkingsprocessen.
Een voorbeeld van een poging in deze richting biedt van Benthem 1986a (hoofdstuk 8), waar bepaalde talige uitdrukkingen worden gekoppeld aan procedures om waarheidscondities te testen. Zo kunnen de eerder genoemde determinatoren worden beschouwd als automaten, die opereren op (de individuen die vallen onder) de betrokken twee predikaten - en die na deze inspectie beslissen of de betreffende relatie opgaat. De monotone basis-determinatoren komen dan te voorschijn als eenvoudige eindige-toestandsmachines, terwijl meer complexe determinatoren corresponderen met ingewikkelder eindige automaten, of zelfs meer ingewikkelde genres automaten. Ook voor diverse andere categorieën van uitdrukkingen (zoals logische zinsoperatoren, bepaalde adjectieven) zijn zulke procedurele denotaties aan te geven. Vooralsnog is dit alles niet meer dan een theoretische proefboring, bedoeld om greep te krijgen op de notie ‘complexiteit’ van talige uitdrukkingen - en daarmee op de berekeningskosten verbonden aan hun waarheidscondities.
Een ander efficiëntie-gevoelig natuurlijke taal-gebaseerd proces is redeneren. Nu wordt doorgaans aangenomen, in het voetspoor van Frege en Russell, dat dit verschijnsel het best te bestuderen is via speciaal daartoe ontworpen logische formalismen. Maar de laatste tijd is een interesse groeiende in zg. ‘natuurlijke logica's’, die regelrecht opereren op grammaticale vormen (hoogstens
| |
| |
een weinig gefatsoeneerd). Een illustratie zagen we reeds bij het eerdere verschijnsel van monotonie voor determinatoren, dat we ook kunnen beschrijven als een bepaald genre redeneren. Bijvoorbeeld, indien ‘Alle XY’ waar is, dan volgt hieruit iedere bewering ‘alle XZ’ voor predikaten Z met een grotere ‘omvang’ (meer individuen voldoen eraan) dan Y. Dergelijke monotoniegevolgtrekkingen, voor determinatoren en vele andere uitdrukkingen, zijn eenvoudig algemeen te beschrijven vanuit grammaticale vormen, zonder bijkomende formele talen (zie van Benthem 1986a, hoofdstuk 6). Idealiter zou een natuurlijke logica dus kunnen bestaan uit logische redeneer-instructies, direct geformuleerd in termen van (ontlede) uitdrukkingen in natuurlijke taal. In de praktijk ligt dit toch wel iets ingewikkelder (zie van Benthem 1986b voor een overzicht van diverse redeneervormen en hun inpasbaarheid in zo'n natuurlijke logica). Niettemin is dit gebied zeker de moeite van het onderzoeken waard - en er zijn al de eerste pogingen ondernomen om te komen tot direct op natuurlijke taal gebaseerde mechanische bewijssystemen. (Zie bijvoorbeeld Kolb 1985, maar ook de aanzetten in Sommers 1981, Bacon 1985.)
Overigens spelen overwegingen van meer efficiënte informatieverwerking een minstens even grote rol in taalgebruik op het niveau van hele teksten of dialogen. Het zou evenzeer van belang zijn daar tot theorievorming te komen die zich kan meten met wat op zinsniveau reeds bereikt is. Er is met name voorgesteld hiertoe een meer speltheoretische invalshoek centraal te stellen - maar nog weinig significante resultaten zijn geboekt.
| |
6. Wisselwerkingen
Met de boven genoemde toepassingen gaan diverse interessante nevenverschijnselen gepaard. Eén is dat de kijk op het eigen vak enigszins wordt gerelativeerd - omdat in toepassingen de prioriteiten vaak anders liggen dan thuis. Zo is bijvoorbeeld een zekere distantie ten opzichte van de syntaxis van specifieke talen onvermijdelijk in een algemene studie van informatie - ook al omdat getrouwheid aan syntactische details onderhevig blijkt aan een sterke wet van verminderende meeropbrengsten. Eén voorbeeld (uit vele) is de observatie van Winograd in de Scientific American van september 1984 dat wij ons gemakkelijker kunnen aanpassen aan de beperkingen van een ‘natural language processing’ systeem dan de computer aan ons. Bijgevolg kunnen allerlei ‘compromissen’ wel eens veel efficiënter blijken dan het extreem van een totaal vernederlandste machine.
Maar niet alleen de kijk op een vak kan door toepassingen veranderen, ook de inhoud zelf kan erdoor worden beïnvloed. Zo is het natuurlijk niet toevallig dat de notie ‘informatie’ de laatste jaren steeds meer terrein wint in de semantiek, en dat de ideologie van het modelleren verschuivende is. Waar zo'n tien jaar geleden nog als het meest essentiële van semantiek werd gepresenteerd het relateren van taal aan een buitentalige realiteit (een soort ontsnapping uit wat filosofen ‘linguistic imprisonment’ noemen), leest men thans steeds vaker over semantiek als het oproepen en manipuleren van bij de taal behorende kennis- of informatiestructuren. Daarbij dient te worden aangetekend dat ‘Realisme’ in het algemeen in de filosofie weer moeilijke tijden
| |
| |
doormaakt, in het eeuwige stuivertje wisselen der Grote Positie - en zijn meer ‘idealistische’ visies in opmars. Zo bepleiten ook invloedrijke wetenschapsfilosofen recentelijk weer met klem ‘epistemische’ visies op kennis en redeneren, waar ‘assertability’ op basis van momentane geloofstoestanden de rol overneemt van ‘waarheid’ op grond van de feiten. Zo'n nieuwe ronde kan overigens heel goed nieuwe inzichten opleveren. Bijvoorbeeld, Gärdenfors 1986 geeft vanuit deze epistemische stellingname een uitvoerige en interessante theorie over de fundamentele operaties die geloofstoestanden kunnen ondergaan (te weten uitbreiding, inkrimping en revisie op grond van toegevoerde informatie).
In de recente semantische literatuur nemen informatiemodellen vaak de vorm aan van wat men ‘vertakkende patronen van kennistoestanden’ zou kunnen noemen (vergelijk paragraaf 3). Deze bevatten in elk stadium basisfeiten, en coderen verder ‘hogere orde’ informatie in beperkingen op de nog toegelaten uitbreidingen van de basisinformatie in dat stadium. Bijvoorbeeld, de regel dat een boek slechts door één persoon tegelijk geleend kan worden sluit in de beschrijving van een momentane bibliotheektoestand vele verdere in principe denkbare combinaties van uitleenfeiten uit. Er wordt in Nederland veel fundamenteel onderzoek gedaan op dit gebied, getuige de proefschriften Veltman 1985, Landman 1986, en diverse lopende onderzoeksprojecten over data bases op de grens van semantiek en informatica. Met name heeft Veldman een theorie uitgewerkt van op informatie gebaseerde ‘verificatie’ en ‘falsificatie’ condities (in plaats van de eerdere ‘waarheidscondities’) voor logische operatoren, die ook ruimere semantische perspectieven biedt.
Andere repercussies zijn de eerder vermelde computationele interessen in de semantiek. Er is overigens nog veel meer ruimte voor een complexiteitsbewuste houding in semantisch onderzoek: met meer aandacht voor algoritmische aspecten van waarheids- of verificatie-condities, gevolgtrekkingsregels en dergelijke. Dit is één facet van een meer algemene procedurele optiek. Wat gebeurt er bij het interpreteren/begrijpen van tekst: bijvoorbeeld, hoe veranderen informatietoestanden? (Vergelijk het eerder genoemde boek van Gärdenfors.) Een toenemende nadruk op dit dynamische karakter van semantiek is te vinden in, bijvoorbeeld, de ‘discourse representation semantics’ van Kamp 1981 (en verwant, Seuren 1985), of de ‘game-theoretical semantics’ van Hintikka (zie Hintikka & Kulas 1983). Dat het hoe van dit gebeuren (los van wat uiteindelijk uitgedrukt wordt) uiterst belangrijk kan zijn, weten we natuurlijk ook juist vanuit de informatica - waar het zg. controle-aspect (het sturen van de gewenste berekening) bij programmeren vaak het verschil uitmaakt tussen een draaiend en een onbruikbaar programma voor dezelfde taak. Hier ligt dus nog een richting waar de taalkunde haar voordeel kan doen met computationele inspiratie. Overigens blijft de traditionele semantiek hierbij onmisbaar, als waker over de uiteindelijke correctheid van instructies bedoeld voor een gegeven taak.
| |
7. Tenslotte
Dit artikel is niet meer geworden dan een kaleidoscopische terreinverkenning. Ze mag echter geslaagd heten indien althans de aard en potentiële reikwijdte
| |
| |
van de contacten tussen moderne semantiek en informatica-gerichte thema's duidelijk is geworden. Bovendien is verdedigd dat de taalkunde niet alleen munt kan slaan uit dit soort toepassingen, maar dat ze er zelf ook wetenschappelijk wijzer van kan worden. Kortom, er is een wereld voor ons te winnen, en dat zonder schade aan de eigen ziel. Is een happier end voor ons Nederlanders denkbaar?
Johan van Benthem is hoogleraar Mathematische logien aan de UvA
| |
Referenties
J. Allen, 1983, ‘Maintaining Knowledge about Temporal Intervals’, Communications of the Association for ComputingMachinery 26, 832-843. |
J. Bacon, 1985, ‘The Completeness of a Predicate-Functor Logic’, Journal of Symbolic Logic 50, 903-926. |
R. Bäuerle, U. Egli en A. von Stechow, red'n, 1979, Semantics from Different Points of View, Springer, Berlijn. |
J. van Benthem, 1985, ‘Semantics of Time’, in Jackson & Michon, red'n, 1985, 266-278. |
J. van Benthem, 1986a, Essays in Logical Semantics, Reidel, Dordrecht, (Studies in Linguistic and Philosophy 29). |
J. van Benthem, 1986b, ‘Meaning: Inference and Interpretation’, in Dalla Chiara & Toraldo di Francia, red'n, 1986. |
J. van Benthem, 1986c, ‘The Ubiquity of Logic in Natural Language’, in Leinfellner & Wuketits, red'n, 1986. |
M-L Dalla Chiara en G. Toraldo di Francia, red'n, 1986, Proceedings Workshop ‘Theories of Meaning’, Florence 1985, Synthese (speciaal nummer), te verschijnen. |
G. Chierchia, 1985, ‘Formal Semantics and the Grammar of Predication’, Linguistic Inquiry 16, 417-443. |
D. Dowty, 1979, Word Meaning and Montague Grammar, Reidel, Dordrecht. |
F. van Eynde, 1985, Betekenis, Vertaalbaarheid en Automatisch Vertalen, proefschrift, Katholieke Universiteit, Leuven. |
J-E Fenstad, P-K Halvorsen, T. Langholm en J. van Benthem, 1985, Equations, Schemata and Situations, CSLI-report 85-29, Center for the Study of Language and Information, Stanford University. |
GAMUT, 1982, Logica, Taal en Betekenis, Het Spectrum, Utrecht, twee delen, (AULA paperback 76 en 77). |
P. Gärdenfors, 1986, The Dynamics of Belief, Filosofiska Institutionen, Lunds Universitet. |
J. Groenendijk, T. Janssen en M. Stokhof, red'n, 1981, Truth, Interpretation and Information, Foris, Dordrecht, (GRASS serie, deel 2). |
J. Groenendijk en M. Stokhof, 1984, On the Semantics of Questions and the Pragmatics of Answers, proefschrift, Filosofisch Instituut, Universiteit van Amsterdam, (te verschijnen bij Oxford University Press). |
J. Halpern en Y. Moses, 1984a, ‘Knowledge and Common Knowledge in a Distributed Environment’, Proceedings Third ACM Conference on Principles of Distributed Computation, 1984, 50-61. |
J. Halpern en Y. Moses, 1984b, ‘Towards a Theory of Knowledge and Ignorance’, Preliminary Report RJ 4448 (48136), IBM San José. |
J. Hintikka en J. Kulas, 1983, The Game of Language: Studies in Game-theoretical Semantics and its Applications, Reidel, Dordrecht. |
J. Hobbs, red., 1985 Common Sense Summer Final Report, SRI International, Menlo Park. |
J. Jackson en J. Michon, red'n, 1985, Time, Mind and Behaviour, Springer, Heidelberg. |
T. Janssen, 1983, Foundations and Applications of Montague Grammar, proefschrift, Mathematisch Centrum, Amsterdam. |
H. Kamp, 1979, ‘Instants, Events and Temporal Discourse’, in Bäuerle et al., red'n, 1979, 376-417. |
H. Kamp, 1981, ‘A Theory of Truth and Semantic Representation’, in Groenendijk et al., red'n, 1981, 1-41. |
H.P. Kolb, 1985, Aspekte der Implementation der Diskursrepräsentationstheorie, Forschungsstelle für natursprächliche Systeme, Universitat Tübingen. |
R. Kowalski, 1985, A Logic-based Calculus of Events, department of Computer Science, Imperial College, London. |
| |
| |
F. Landman, 1986, Towards a Theory of Partial Information, proefschrift, Foris, Dordrecht, (GRASS serie, deel 6). |
W. Leinfellner en F. Wuketits, red'n, 1986, The Tasks of Contemporary Philosophy, Schriftenreihe der Wittgenstein Gesellschaft, Verlag Hölder-Pichler-Tempsky, Wenen. |
P. Seuren, 1985, Discourse Semantics, Blackwell, Oxford. |
S. Shapiro, red., 1986, Encyclopedia of Artificial Intelligence, Wiley-Interscience, New York. |
Y. Shoham en D. McDermott, 1985, ‘Temporal Reasoning’, in Shapiro, red., 1986. |
F. Sommers, 1981, The Logic of Natural Language, Cambridge University Press, Cambridge. |
J. Stoy, 1977, Denotational Semantics, The Scott-Strachey Approach to Programming Language Theory, MIT Press, Cambridge (Mass). |
R. Turner, 1983, ‘Montague Semantics, Nominalization and Scott's Domains’, Linguistics and Philosophy 6, 259-288. |
F. Veltman, 1985, Logics for Conditionals, proefschrift, Filosofisch Instituut, Universiteit van Amsterdam. |
H. Verkuyl, 1972, On the Compositional Nature of the Aspects, Reidel, Dordrecht. |
F. Zwarts, 1981, ‘Negatief-polaire Uitdrukkingen. I’, Glot 4, 35-132. |
F. Zwarts, 1986, Categoriale Grammatica en Algebraische Semantiek, proefschrift, Nederlands Instituut, Rijksuniversiteit, Groningen, (Engelse versie te verschijnen bij Foris, Dordrecht, GRASS serie). |
|
|