Spektator. Jaargang 20
(1991)– [tijdschrift] Spektator. Tijdschrift voor Neerlandistiek– Auteursrechtelijk beschermd
[pagina 361]
| |||||||||||||||||||||||||
Subtaal en lexicon
| |||||||||||||||||||||||||
[pagina 362]
| |||||||||||||||||||||||||
onderzocht welke implicaties dit heeft op het niveau van de lexicale descriptie. | |||||||||||||||||||||||||
2 Algemene taal, vaktaal en subtaal2.1 DefinitieproblemenOver vaktaal en subtaal is reeds veel geschreven en nog altijd worden nieuwe definities voorgesteld. Dit kan enerzijds worden verklaard uit het feit dat beide noties vanuit verschillende invalshoeken zijn benaderd, anderzijds uit de aard van de noties zelf, die een rigide omschrijving lijkt uit te sluiten. Voor zowel vaktaal als subtaal geldt, dat zij gedefinieerd worden in relatie tot ‘algemene taal’. Dit betekent dat eerst van de laatste een definitie moet worden opgesteld, wil men tot een zinvolle afbakening van vak- of subtaal komen. De problemen die zich bij het definiëren van beide noties voordoen, hebben sommige onderzoekers ertoe gebracht dit onderscheid los te laten en de taal als een conglomeraat van situationele varianten te beschouwen. Volgens hen is ‘algemene taal’ als zodanig een fictie: ‘If the identity of LSP [Language for Specific Purposes] is increasingly dissipated with each analytic step in the ultimate direction of atomization, so is our optimistic notion of a common language.’ (Opitz 1981: 186) Als oorzaak hiervoor wordt met name het dynamisch karakter van taal genoemd, dat iedere beschrijving te ‘monolithisch’ maakt. Ook heeft het te maken met de ambiguïteit van common language, term die zowel kan refereren naar de gemene deler van verschillende varianten als naar hun totaliteit. Anderen zijn vaak een wat gematigder mening toegedaan en passen het onderscheid wel toe; het is echter algemeen aanvaard dat het andere uiterste, waarin subtaal en algemene taal worden gezien als twee disjuncte noties, niet staande kan worden gehouden. Er zijn weliswaar verschillen op lexicaal, grammaticaal en pragmatisch niveau, maar geen van deze kenmerken levert een waterdichte, distinctieve definitie op. Subtaal wordt vaak als een selectie van taalmiddelen uit de algemene taal voorgesteld - als deel van een geheel -, maar in werkelijkheid ligt de relatie subtaal-algemene taal veel complexer. Hoffmann (1985) voert hiertegen als bezwaar aan dat algemene taal en subtaal feitelijk onvergelijkbare grootheden zijn, omdat de eerste te breed, te onbeperkt is; volgens hem kan algemene taal dan ook alleen beschouwd worden als het overkoepelende abstracte begrip van een reeks concrete subtalen.Ga naar eind3 Ook hij acht een pragmatische typering van algemene taal onmogelijk, maar voor subtalen is het volgens hem betrekkelijk eenvoudig. ‘Während sich das Inventar einer Fachsprache dank der Begrenzung ihres Wirkungsbereiches leichter vollständig erfassen lässt, bleibt das der Gemeinsprache schwer greifbar, weil nicht eindeutig feststeht, in welchen kommunikativen Bereichen oder Situationen davon Gebrauch gemacht wird.’ (Hoffmann 1985: 52) Frawley (1988) verwerpt zowel de opvatting dat subtaal een deelverzameling van algemene taal zou zijn als die waarin de algemene taal als overkoepe- | |||||||||||||||||||||||||
[pagina 363]
| |||||||||||||||||||||||||
lend abstract begrip wordt voorgesteld. De eerste acht hij onjuist, omdat subtaal ook kenmerken bezit die de algemene taal niet heeft (denk alleen al aan de woordenschat!). De tweede opvatting vindt hij niet zozeer verkeerd als wel nietszeggend. Hij karakteriseert de verhouding tussen subtaal en algemene taal als volgt: ‘As a sublanguage, the language of science appears not to be a proper subset of English or any other natural language, since the rules that operate in scientific language often are not in the standard form of the language of which the sublanguage appears to be a part. This means that the language of science is relatively autonomous.’ (Frawley 1988: 345) Ook Moskovich kent subtaal een relatieve autonomie toe, omdat subtaal over een aantal unieke eigenschappen beschikt die direct voortvloeien uit de behoefte aan eenduidige communicatie. Waar in de algemene taal polysemie en vaagheid als volkomen normale, zelfs functionele verschijnselen worden beschouwd, wordt er in bepaalde subtalen, m.n. die van de exacte wetenschappen, gestreefd naar ondubbelzinnig taalgebruik in de vorm van formele of zelfs kunstmatige taal. Vele hiertoe ontworpen symbolen en formules komen als zodanig niet in de algemene taal voor. ‘Sublanguages are parts of natural languages. This fact is reflected in the very term “sublanguage”. But not all the sublanguages are just subsets of natural languages. Some of them contain elements and rules specific only to them. For example, the sublanguages of mathematics and chemistry use specific signs and have special rules of construction of complex expressions.’ (Moskovich 1982: 194) Een en ander heeft ons ertoe geleid de relatie tussen algemene taal en subtaal voor te stellen als in figuur 1b (en niet als in 1a).
Uit deze voorstelling moge blijken dat de intuïtief plausibele categorieën algemene taal en subtaal geenszins op een zwart-wit onderscheid berusten, maar dat er sprake is van gedeeltelijke overlapping en flexibele grenzen. Verder achten wij het algemeen aanvaard dat de verschillen vnl. van functioneel-pragmatische aard zijn. Tot slot willen we nog enkele woorden wijden aan de relatie vaktaal-subtaal. De twee worden in dit artikel niet strikt gescheiden, omdat het in de kernFig. 1 Algemene taal vs. subtaal
| |||||||||||||||||||||||||
[pagina 364]
| |||||||||||||||||||||||||
vaak over hetzelfde talige/communicatieve verschijnsel gaat. In de literatuur over subtaal vinden we omschrijvingen als ‘the variety of language used in a given science or technology’ en ‘a subsystem of language that behaves essentially like the whole language, while being limited in reference to a specific subject domain’ (Grishman & Kittredge 1986: ix). Meer in het algemeen gesproken gaat het in elk geval steeds om een semantisch en pragmatisch gerestringeerd domein (want ook ‘subject domain’ of vakgebied is een moeilijk af te bakenen begrip). Zo kan in onderzoek naar dialoogsystemen de taal die gebruikt wordt bij het inwinnen en verstrekken van administratieve informatie de subtaal zijn (Deville 1989). Dit voorbeeld maakt duidelijk dat subtaal en vaktaal niet volledig synoniem zijn, omdat we in het laatste geval niet zo snel van vaktaal zouden spreken. Over het algemeen correspondeert vaktaal met de meer traditionele vakgebieden zoals scheikunde of recht, terwijl subtaal ieder beperkt semantisch gebied betreft (dat vaak beperkter is dan een vakgebied, zeker in het kader van NTV-onderzoek). Enerzijds is de term vaktaal te ruim, omdat deze nog steeds een tamelijk heterogene verzameling taaluitingen dekt; anderzijds is hij te eng omdat het deel van de realiteit waarnaar die taal verwijst niet altijd een vak(gebied) - hoe de omschrijving hiervan ook mag luiden - hoeft te zijn. Wij zullen dan ook in dit artikel de voorkeur (blijven) geven aan de term subtaal. Interessant is nu te zien in hoeverre de resultaten van (computer)linguïstisch en didactisch onderzoek naar subtaal elkaar aanvullen: computerlinguïsten waren totnogtoe vooral geïnteresseerd in de specifieke grammaticale eigenschappen van subtaal (en hun ‘implementeerbaarheid’), terwijl didactici zich aanvankelijk toelegden op lexicale aspecten (opbouw van de woordenschat) en teksttypologie. Dit zal onder 3. aan de orde komen. | |||||||||||||||||||||||||
2.2 Naar een operationele definitieHet zal duidelijk zijn dat voor dit artikel, dat o.m. beoogt een antwoord te geven op de vraag waarin een sublexicon eventueel afwijkt van een algemeen lexicon, een definitie van subtaal (en dus ook van algemene taal) een noodzakelijke voorwaarde is. We beroepen ons daarbij op een artikel over representatieve corpora voor woordenboeken (Martin 1988b). Ook lexicografen worden immers voortdurend gedwongen het ondefinieerbare te definiëren.Ga naar eind4 Martin brengt de heterogeniteit van taal in kaart door 5 assen te onderscheiden, waarlangs variatie optreedt, te weten: een regionale, sociale, tijds-, inhouds- en communicatieve situatie-as. Iedere taalvariant wordt nu recursief gedefinieerd aan de hand van deze assen. Voor de ‘algemene taal’ levert dit de volgende definitie op:
| |||||||||||||||||||||||||
[pagina 365]
| |||||||||||||||||||||||||
De recursiviteit van de definitie bestaat erin, dat bovenstaande kenmerken de kern uitmaken van ST, maar dat variatie/uitzonderingen hierop niet zijn uitgesloten; deze bevinden zich echter in de extensie of periferie van ST. Dergelijke perifere kenmerken kunnen op hun beurt tot de kern van een andere taalvariant behoren. Op deze manier kan een taaluiting t.a.v. de diverse assen worden gesitueerd en is hij een meer of minder karakteristiek voorbeeld van een bepaalde taalvariant. SubtaalGa naar eind6 nu vertoont dezelfde geleding als algemene taal, maar onderscheidt zich met name op de communicatieve situatie-as en de inhoudsas (punt (3) en (4)) van algemene taal: de kern van subtaal is de taal die wordt gebruikt in een beperkt aantal communicatieve situaties en die specifieke onderwerpen/kennis betreft. De communicatieve situatie-as telt twee parameters die hier van belang zijn: het kennisniveau van de betrokken taalgebruikers en het communicatiedoel. M.b.v. de eerste parameter kunnen communicatieve situaties worden gesitueerd op een schaal die gaat van vakinterne naar vakexterne communicatie (Martin 1988a, 1988b): de kern van subtaal wordt gevormd door de vakinterne communicatie (tussen specialisten uit eenzelfde vakgebied), en in iets mindere mate door een afgezwakte versie hiervan (die tussen specialisten uit verschillende, doch verwante vakgebieden); weer iets verderaf van de kern staat de vakinterne-vakexterne communicatie (tussen specialist en leek); het andere uiterste, de vakexterne communicatie (tussen leken), heeft nog nauwelijks iets met subtaal te maken. De tweede parameter maakt het mogelijk communicatieve situaties verder in te delen naar hun doel, functie (vgl. onderzoek op het gebied van teksttypologie). Hoewel deze parameter voor het onderscheid subtaal-algemene taal van ondergeschikt belang is - voor zover hij de typen communicatieve situaties van hierboven snijdt, zijn de betrokken taalgebruikers doorslaggevend -, speelt hij wel een rol bij de meer gedetailleerde beschrijving van subtaal. Subtaal wordt gekenmerkt door meer gestandaardiseerde tekstsoorten, b.v. een medisch rapport of een proces-verbaal; daarnaast blijkt dat met name variatie op syntactisch niveau nauw gerelateerd is aan de functie van de tekst (terwijl bijvoorbeeld lexicaal-semantische variatie meer vakgebied-afhankelijk is, dus de inhoudsas betreft).
We vinden hier dus grosso modo dezelfde omschrijving van subtaal terug, maar dan operationaliseerbaarGa naar eind7. Een taalvariant, bijv. subtaal, kan nu worden omschreven in termen van prototypische kenmerken, zonder dat andere, minder typische, kenmerken bij voorbaat worden uitgesloten. Om recht te doen aan de voortdurende veranderingen, verschuivingen die tussen taalvarianten plaatsvinden, kunnen we niet volstaan met een plus of min achter ieder kenmerk, maar zou ook het relatieve gewicht van ieder kenmerk moeten kunnen worden uitgedrukt. Bijvoorbeeld in de vakinterne-vakexterne communicatie zal de specialist/expert, zijn taalgebruik (m.n. woordkeus) zoveel mogelijk afstemmen op het kennisniveau van zijn gesprekspartner (of lezer). Dan is er geen sprake van meer van een strikte scheiding tussen subtaal en algemene taal en treedt er een voorkeursmechanisme in werking afhankelijk van de situatie. | |||||||||||||||||||||||||
[pagina 366]
| |||||||||||||||||||||||||
3 Linguïstische kenmerken van subtaalIn het voorgaande is subtaal beschouwd vanuit pragmatisch perspectief en getypeerd m.b.t. gebruikers en inhoud. We zullen nu ingaan op kenmerken van subtaal op woord-, zins- en tekstniveau. Om de complexe verhouding tussen subtaal en algemene taal uit te drukken, maken we gebruik van drie complementaire beschrijvingswijzen (zie Deville 1989: 58). T.a.v. algemene taal kunnen kenmerken van subtaal worden opgevat als:
In onderstaande tabel 1 geven wij de resultaten van het corpusonderzoek uit Deville 1989 weer. Daarna volgt een korte bespreking en een aangepaste, herwerkte versie in tabel 2. | |||||||||||||||||||||||||
3.1 Lexicale kenmerkenIn de eerste kolom vinden we gegevens die betrekking hebben op de omvang van het lexicon en de frequentiewaarden daarbinnen. Hierbij merken we het volgende op: a. Het blijkt dat het lexicon van een subtaal relatief gesloten is, d.w.z. dat het in principe - veel beter in elk geval dan een algemeen lexicon - uitputtend beschreven kan worden. In vergelijking met de algemene taal wordt in subtalen slechts een beperkte woordenschat gebruikt. Moskovich
Tabel 1. Lexicale, syntactische, semantische en pragmatische kenmerken van subtaal volgens Deville 1989: 92
| |||||||||||||||||||||||||
[pagina 367]
| |||||||||||||||||||||||||
formuleert het als volgt: ‘If we have a finite set of texts belonging to a certain sublanguage, we can determine its vocabulary and its inventory of grammatical constructions. Let us add to this set new texts of the same sublanguage. If the vocabulary and the inventory of grammatical constructions remain unchanged, the sublanguage is called a closed one - in the opposite case it is called an open one. (...) The degrees of closure of sublanguages may vary, but in contrast to the general language, sublanguages are more or less closed.’ (Moskovich 1982: 193) Dit betekent echter niet, dat sublexica relatief ‘verzadigd’ zijn, integendeel. In de literatuur over subtalen en terminologie wordt juist gewag gemaakt van de voortdurende aanwas van termen om nieuwe begrippen uit te drukken. Kocourek komt hierdoor zelfs tot de schijnbaar tegenovergestelde conclusie, nl. dat subtaal over een omvangrijker lexicon beschikt dan algemene taal: ‘Par contraste à la fois avec la langue usuelle et avec le langage symbolique, la langue de spécialité a un lexique très étendu ce qui lui permet de saisir le monde de la spécialité dans sa complexité et dans son intégralité ou, du moins, plus intégralement que les autres systèmes sémiotiques de spécialité.’ (Kocourek 1982: 31) Naar onze mening doelt Kocourek hier op uitbreiding van vaklexica in de diepte, om de steeds specifiekere kennis uit te drukken, terwijl Deville de nadruk legt op de beperkte omvang van sublexica in de breedte vanwege de voor subtaal karakteristieke inhoudelijke en pragmatische restricties. Natuurlijk is de ‘breedte’ van sublexica ook direct afhankelijk van de omvang van het domein dat wordt gedekt: het spreekt voor zich dat in een zgn. ‘kleine subtaal’ (b.v. dat van weerberichten) veel minder lexicale variatie voorkomt dan in de taal gebruikt in de organische chemie (Moskovich 1982: 203). b. De relatieve geslotenheid van sublexica kan ook vanuit morfologisch perspectief worden benaderd. De vorming van nieuwe termen is nl. niet alleen semantisch gezien beperkt, maar verloopt vergeleken bij woordvorming in het algemeen op een meer bewuste, gecontroleerde wijze. Subtalen gebruiken weliswaar dezelfde procédé's als algemene taal, maar doen dit systematischer. Het meest extreme voorbeeld hiervan zijn nomenclaturen zoals die worden gebruikt in de geneeskunde, scheikunde en biologie, maar het geldt ook voor andere subdomeinen (zie hiervoor ook Sager 1990: 57) c. Keren we terug naar de tabel van Deville, dan zien we dat subtaal gekenmerkt wordt door andere, afwijkende frequentiewaarden. Sommige woorden komen zowel in algemene taal als subtaal voor, maar vaker in de een dan in de ander. Dit onderstreept de eerdergenoemde recursiviteit van (definities van) taalvarianten: iedere subtaal heeft een kern die verschilt van die van algemene taal. Omdat het hier om gemeenschappelijke woorden gaat, zien wij dit echter eerder als een preferentieel verschil dan als een deviatie. d. Aansluitend stellen wij voor als deviatie op te nemen díe items die alléén in subtaal voorkomen. Deze items kunnen behalve lexemen ook morfemen zijn, omdat ook daar geldt dat sommige alleen in algemene taal | |||||||||||||||||||||||||
[pagina 368]
| |||||||||||||||||||||||||
voorkomen, andere subtaalspecifiek zijn en weer andere in beide taalvarianten voorkomen, maar met verschillende betekenis en/of frequentie. | |||||||||||||||||||||||||
3.2 Syntactische kenmerkena. Op syntactisch niveau onderscheidt subtaal zich door minder soorten constructies dan algemene taal (in weerberichten bijvoorbeeld komen geen directe vragen voor) en tegelijkertijd door constructies die in algemene taal als agrammaticaal gelden (bijv. weglating van lidwoorden, koppelwerkwoorden). De meeste constructies en categorieën hebben de varianten echter gemeen, al kunnen ze in verschillende frequenties voorkomen (sommige subtalen bv. worden gekenmerkt door een hoge nominalisatiegraad). b. Wat Deville hier niet expliciet noemt, maar in de literatuur over zowel sub- als vaktaal soms wel onder syntaxis wordt vermeld, zijn verschillen in werkwoordcomplementering en -argumentstructuur. Fluck signaleert afwijkende valentiepatronen in sommige (Duitse) vaktalen, die hoofdzakelijk neerkomen op een kleiner aantal argumenten: ‘In wissenschaftlich-technischen Fachtexten führt dieser Sachverhalt u.a. zum Wegfall nullwertiger, zur Zunahme zweiwertiger und zu einem gegenüber gemeinsprachlicher Verwendungsweise besonders sparsamen Gebrauch drei- und mehrwertiger Verben.’ (Fluck 1985: 206) Möhn/Pelka (1984) noemen behalve een afwijkend aantal verplichte argumenten ook verschillen op het niveau van selectierestricties. Ze vragen zich wel af in hoeverre het hier een syntactisch dan wel een lexicaal-semantisch kenmerk betreft. Bij Deville vallen de selectierestricties in elk geval onder de semantische descriptie, zij het dat ze ook daar niet expliciet genoemd worden. De monosemie (eerste semantische kenmerk in de tabel) van werkwoorden wordt nl. veroorzaakt door kwantitatieve en kwalitatieve beperkingen op de argumenten bij die werkwoorden. Na de bespreking van de semantische kenmerken van subtaal komen we nog terug op deze syntactisch-semantische kwestie. | |||||||||||||||||||||||||
3.3 Semantische kenmerkena. In feite geeft Deville hier lexicaal-semantische kenmerken, wat een logische invalshoek is, wil men tot natuurlijke taalverwerking komen. Eén van de grootste problemen bij automatische tekstanalyse en -interpretatie is nog altijd de desambiguering. Door te werken met subtalen wordt ambiguïteit voor een groot deel oplosbaar. Voor de bespreking van de semantische aspecten van subtaal gaat Deville dus uit van lexemen, die hij onderverdeelt in subtaalspecifieke (‘jargon words’) en niet altijd subtaalspecifieke woorden (lexemen die ook in algemene taal worden gebruikt). De eerste categorie is relatief gemakkelijk te verwerken (mits ze monoseem zijn, wat vaak wel maar niet altijd zo is). Van de laatste categorie zijn natuurlijk alleen die lexemen interessant, die in algemene taal en subtaal verschillende betekenissen bezitten (waarmee b.v. functiewoorden zijn uitgesloten). Deze groep valt weer uiteen in lexemen die in een subtalige context alléén in hun specifieke | |||||||||||||||||||||||||
[pagina 369]
| |||||||||||||||||||||||||
betekenis worden gebruikt (en in dat geval monoseem zijn) en lexemen die ook dan hun polysemie behouden, m.a.w. waarvan de algemene betekenis in een subtalige context niet zonder meer kan worden onderdrukt. In het laatste geval vindt er wel een herschikking van betekenissen plaats (volgens ‘the preferential mode’), zodat de subtaalspecifieke betekenis, die in een dergelijke context het meest waarschijnlijk is, als eerste wordt opgeroepen. Wij zijn het volkomen eens met Deville wanneer hij zegt dat het werken met preferenties vaak te verkiezen is boven de zuiver restrictieve benadering. Juist door de vage grenzen tussen algemene taal en subtaal, en hun voortdurende wederzijdse beïnvloeding, is het moeilijk op voorhand meer algemene betekenissen van een woord uit te sluiten al wordt dit woord in een subtaal gebruikt. Hetzelfde geldt in feite voor een karakterisering in termen van deviaties. Niet alleen heeft de wederzijdse beïnvloeding tot gevolg dat algemene woorden een betekenisverenging ondergaan (dat ze worden ‘geterminologiseerd’), maar omgekeerd komt het voor dat subtaalspecifieke expressies in het algemene taalgebruik worden overgenomen (waar ze een ruimere betekenis krijgen). Een voorbeeld hiervan is de medische term injectie, die inmiddels ook voor het ‘toedienen’ van geld wordt gebruikt. Natuurlijk is in een medische tekst de eerste, oorspronkelijke lezing het meest waarschijnlijk, maar de tweede is niet bij voorbaat uitgesloten. b. Een ander semantisch kenmerk van subtalen, dat o.i. niet onbesproken kan blijven, is de vraag waarin de semantische specificiteit van subtaal nu bestaat. Deville vooronderstelt subtaalspecifieke betekenissen en gaat in op de (graad van) eenduidigheid van de bijbehorende expressies. We zullen iets langer stilstaan bij het onderscheid tussen subtaalspecifieke en algemene betekenis. Zoals reeds is opgemerkt, wordt in subtaal regelmatig de betekenis van een algemeen woord vernauwd/verengd, b.v. portier dat in de geneeskunde ‘maaguitgang’ betekent. Vaktaal wordt nu eenmaal gekenmerkt door een voortgaande specialisatie, differentiatie van (vak)kennis. De semantische verschillen tussen subtaal en algemene taal zijn echter niet altijd alleen hierop terug te voeren, maar kunnen ook direct te maken hebben met de verschillende wijze waarop experts en leken hun omgeving conceptualiseren. Een concept als ‘patiënt’ lijkt in een algemene en specifieke (geneeskundige) context precies hetzelfde in te houden, nl. ‘persoon die ziek is’. Wanneer we echter de conceptuele structuur van het geneeskundig domein nader uitwerken, blijkt dat artsen een patiënt minder als ‘persoon’ dan als ‘ziekte’ zien. In een subdomein kunnen een aantal prominente concept(typ)en onderscheiden worden die met elkaar en met andere concepten in een bepaalde relatie staan en in feite het vertrekpunt vormen voor de semantische beschrijving van dat domein. Als we de conceptuele structuur van een domein representeren d.m.v. zgn. frames, bestaande uit een vast aantal features (relaties) waarin bepaalde waarden kunnen worden ingevuld, dan staan de prominente concepten ieder voor een frame, terwijl de minder prominente concepten alleen voorkomen als feature of waarde in één of meer van deze frames. Keren we terug naar ons voorbeeld, dan zien we dat voor de medische expert (in de medische wereld) niet het type PERSOON of | |||||||||||||||||||||||||
[pagina 370]
| |||||||||||||||||||||||||
ORGANISME, maar het concepttype ZIEKTE centraal staat, en dat dit concept middels de relatie TAST-AAN een concept van het type ORGANISME oproept (dat op zijn beurt de waarde MENS kan krijgen). Het blijkt dat er in subtalen niet altijd sprake hoeft te zijn van nieuwe concepten of relaties, maar wel dat de onderliggende conceptuele structuur van subtalen anders georganiseerd is dan die van algemene taal. | |||||||||||||||||||||||||
3.4 Collocationele (semantisch-syntactische) kenmerkena. Dit niveau wordt door ons aan de tabel van Deville toegevoegd, omdat subtaal zich ook op dit punt onderscheidt van algemene taal. Vanuit een verzamelingtheoretisch standpunt kan ook hier worden opgemerkt dat bepaalde algemeen gebruikelijke collocaties niet of nauwelijks in subtaal voorkomen, en dat er aan de andere kant subtaalspecifieke collocaties bestaan; veel interessanter echter is de bijzondere status van collocaties in subtaal door de wijze waarop ze totstandkomen. Het is zelfs de vraag, zoals we zullen proberen duidelijk te maken, of we in subtaal wel van collocaties kunnen spreken. Daarbij gaan we ervan uit dat een collocatie in het algemeen omschreven kan worden als een woordcombinatie die:
Zo kunnen prototypische van minder typische collocaties onderscheiden worden, afhankelijk van het aantal criteria waaraan een lexicale combinatie beantwoordt. b. Collocaties zijn lange tijd verwaarloosd in de literatuur over vaktaal en terminologie. Kocourek (1982) is één van de weinige uitzonderingen die wijst op de nauwe relatie tussen collocaties en de onderliggende semantische structuur van een subtaal: ‘les collocations relevées par l'intermédiaire du dépouillement de textes sont une source inépuisable d'expressions sémantiquement apparentées. La recherche de collocations et l'analyse des termes occurrents dans les textes contribuent d'une manière fondamentale à l'élaboration linguistique de l'aire sémantique du terme’ Picht heeft wel een aantal artikelen gewijd aan ‘fachsprachliche Phraseologie’, waarin hij dieper ingaat op de combineerbaarheid van termen, en de regels die daaraan ten grondslag kunnen liggen. Zijn definitie van collocaties in subtaal (‘Fachwendungen’) luidt: ‘“Fachsprachliche Wendung”, oder kurz “Fachwendung” ist das Ergebnis der syntaktischen Verbindung von mindestens zwei fachsprachlichen Elementen zu einer Äusserung fachlichen Inhalts, deren innere Kohärenz auf der begrifflichen Verknüpfbarkeit beruht.’ (Picht 1987: 30) Vergelijken we deze omschrijving met de algemene definitie van collocaties, | |||||||||||||||||||||||||
[pagina 371]
| |||||||||||||||||||||||||
dan valt op dat de lexicaliseringsaspecten in bovenstaand citaat niet genoemd worden, en dat combineerbaarheid in subtaal met name op syntactisch en op conceptueel (‘begrifflich’) niveau wordt bepaald. Dit wordt onderschreven door onderzoek naar subtalen in NTV-kader (zie Kittredge e.a. (1982) en Grishman e.a. (1986)), waaruit duidelijk naar voren komt dat beide niveaus nauw met elkaar verbonden zijn. In dit type onderzoek, waar (parseer-) methoden worden ontwikkeld om (semi-automatisch) een semantische representatie te genereren van teksten uit een bepaald subdomein, spelen subtaalspecifieke co-occurrentiepatronen (‘word co-occurrence patterns’) een cruciale rol. Op basis van deze patronen kunnen semantisch-syntactische woordklassen worden gevormd die helpen de inhoud van een tekst te bepalen en weer te geven. ‘these word classes form the bridge between the structure (syntax) of the sublanguage texts and their informational content (semantics)’ (L. Hirschman and N. Sager in: Kittredge and Lehrberger 1982: 27) Tot slot noemen we het werk van Frawley (1988), dat hier nauw bij aansluit. Frawley's uitgangspunt is eveneens dat de semantiek van subtaal besloten ligt in de lexicale en collocationele structuur van teksten in die taal. Om de inhoud van een tekst te expliciteren is dan ook een gesofisticeerd systeem nodig voor de representatie van lexicale relaties. Hij gaat nog een stapje verder wanneer hij stelt dat een dergelijk systeem ook de dynamiek in een subtaal zichtbaar maakt: gegeven het feit dat altijd slechts een deel van de conceptuele structuur is gelexicaliseerd, kunnen wellicht tendenzen onderscheiden worden welke relaties en/of typen dit met name betreft en voorspellingen worden gedaan over de richting waarlangs toekomstige lexicalisering en conceptualisering zal verlopen. Natuurlijk blijft het voorspellen van de wijze waarop wordt gelexicaliseerd, waarop nieuwe lexemen worden gevormd, een zeer delicate aangelegenheid. c. Samenvattend kunnen we stellen dat i.t.t. algemene taal woordcombinaties in subtaal veel meer semantisch bepaald zijn. De voor algemene collocaties zo karakteristieke onvoorspelbaarheid op semantisch-lexicaal niveau - zoals in koffie/thee zetten, sterke/slappe koffie - wordt hier sterk gereduceerd doordat conceptuele combineerbaarheid de sturende factor is geworden. In een beperkt semantisch en pragmatisch domein (bestaande uit een overzichtelijk aantal concepttypen en hun onderlinge relaties) is het mogelijk gebleken om naast syntactische regels criteria voor semantische welgevormdheid op te stellen. Omdat subtaal gekenmerkt wordt door minder synonymie en dus minder ‘kandidaat-lexemen’ bevat die de conceptuele combinatie kunnen uitdrukken, weegt het conventionele keuzeaspect bij variatie ook op lexicaal niveau minder zwaar. Een en ander betekent dat we in subtaal veeleer van semantisch-syntactische co-occurrentierestricties spreken dan van echte collocaties. | |||||||||||||||||||||||||
3.5 Pragmatische kenmerkena. Op pragmatisch niveau verwijst Deville onder de restricties naar het beperkt aantal communicatieve situaties waarin subtaal wordt gebezigd; deze | |||||||||||||||||||||||||
[pagina 372]
| |||||||||||||||||||||||||
zijn reeds genoemd in paragraaf 2.2. Karakteristiek voor subtaal is dat het om een situatie gaat waarbij in elk geval één taalgebruiker expert is op een bepaald gebied. Deze kan communiceren met een collega-expert (vakinterne communicatie), met een collega op een verwant gebied (interdisciplinaire communicatie) of met een leek (vakinterne-vakexterne communicatie). Op lexicaal niveau, blijkt dat de expert in zijn woordkeus rekening houdt met het kennisniveau van zijn gesprekspartner/lezer: artsen hebben het onderling over faryngitis maar zullen tegenover de patiënt eerder over keelontsteking spreken. Andere aspecten van de communicatieve situatie die voor variatie kunnen zorgen in subtaal zijn het doel van de communicatie en de afstand tussen de gebruikers (gerelateerd aan het communicatiemedium). Het communicatiedoelGa naar eind10 heeft minder lexicale dan syntactische repercussies, reden om er in dit bestek niet verder op in te gaan. Ook de communicatieve afstand is voor ons minder van belang, omdat dit aspect vnl. de tekststructuur beïnvloedt. b. Als deviatie kan nog het feature status van termen worden genoemd, met waarden als ‘gestandaardiseerd’, ‘geprefereerd’, ‘geaccepteerd’, ‘afgeraden’, ‘afgekeurd’ etc. Het kan hierbij gaan om spellings- en andere varianten, maar meestal ligt de nadruk op de koppeling concept-term en is deze object van standaardisatie.
Een en ander leidt ons tot het volgende schematisch overzicht van de kenmerken van subtaal:
Tabel 2. Herwerkt overzicht van lexicale, syntactische, semantische, semantisch-syntactische en pragmatische kenmerken van subtaal
| |||||||||||||||||||||||||
[pagina 373]
| |||||||||||||||||||||||||
4 ConclusieIn eerste instantie is (de kern van) subtaal gekarakteriseerd als semantisch en pragmatisch gerestringeerd/gespecificeerd. Dit loopt als een rode draad door de beschrijving van subtaal op verschillende linguïstische niveaus, dus niet uitsluitend op de zojuist genoemde. De pragmatische kenmerken staan in feite niet op één lijn met de andere kenmerken (zoals de tabel suggereert), maar geven het kader aan waarin de taal die op de overige niveaus wordt beschreven, wordt gebruikt. De semantische kenmerken daarentegen, maken wel zelf deel uit van de linguïstische structuur, maar werken toch ook door in de andere niveaus. De vraag is nu op welke manier dit gebeurt. We hebben gezien dat de beperkte referentie (het verwijzen naar slechts een deel van de werkelijkheid) in eerste instantie een vermindering van het aantal concepten betekent, hetgeen op lexicaal niveau kan leiden tot minder polysemie en/of tot minder lexemen. Daarnaast constateerden we een verdieping/verrijking van kennis in een subdomein, waardoor er concepten en termen bij komen. Inkrimping en uitbreiding speelt dus zowel op conceptueel als op lexicaal niveau. Omdat subtaal en algemene taal in voortdurende interactie staan, en de verhouding tussen beide niet slechts als eenvoudige optel- en aftreksom kan worden voorgesteld, zijn preferenties ingevoerd. Het lijkt hier niet zo eenvoudig om conceptueel en lexicaal niveau apart te bespreken of het zou moeten zijn, dat bepaalde concepttypen en hun relaties in een subtaal belangrijker zijn dan in algemene taal. Waar het hier eigenlijk om gaat, is dat de preferenties op lexicaal, (lexicaal-)semantisch en semantisch-syntaktisch niveau sterk concept-gestuurd zijn. Het is (o.m.) vanuit de inhoudelijke beperkingen van subtaal te verklaren, dat er (op lexicaal niveau) frequentieverschillen zijn met algemene taal, omdat andere concepten prominent zijn. Als blijkt dat in subtaal betekenissen van een woord anders zijn geordend dan in algemene taal, heeft dat ook te maken met de centraliteit van de onderliggende concepten. Misschien nog wel het belangrijkste kenmerk van subtaal is dat lexicale combinaties (of het nu samenstellingen, syntagma's of collocaties betreft) in hoge mate conceptueel bepaald zijn. Dit heeft nl. grote gevolgen voor de ontwikkeling van natuurlijke-taalverwerkende systemen. Als binnen een subdomein de concepttypen bekend zijn, evenals de verzameling relaties die ze mogelijkerwijs met elkaar aangaan, is dit een zeer krachtig instrument in de analyse en generatie van de subtaal in kwestie. Enerzijds wordt het mogelijk om een tekst te desambigueren en semantisch te representeren, zonder een zware syntaktische component (zie McNaught e.a. 1991, Martin/ten Pas 1991), anderzijds komt automatische termgeneratie een stapje dichterbij in die gebieden waar naast de conceptuele combinatie ook de morfologische aspecten ‘berekend’ kunnen worden (cf. 3.1). | |||||||||||||||||||||||||
[pagina 374]
| |||||||||||||||||||||||||
Bibliografie
| |||||||||||||||||||||||||
[pagina 375]
| |||||||||||||||||||||||||
|
|