| |
| |
| |
Thematische woordenlijsten: hoe maak je die aan? Agata
Kowalska (Wrocław)
Om diepgaand met elkaar te kunnen communiceren, hebben vertegenwoordigers van
twee culturen vaak een woordenboek nodig. Thematische woordenlijsten zijn ook
een soort woordenboek, ze hebben alleen een heel beperkte omvang en concentreren
zich op één concreet domein. In een goede woordenlijst met vakterminologie zal
men dus bijvoorbeeld geen basiswoordenschat verwachten, en het is evenmin een
soort taalgids voor wie als toerist een land binnenstapt. Goed bewerkte
woordenlijsten moeten je wegwijs maken op een bepaald gebied, ze zijn dus per
definitie voor een beperkt publiek bedoeld.
Op de achtergrond van mijn overwegingen staat het werk in het kader van een door
de Vlaamse Gemeenschap goedgekeurd samenwerkingsproject tussen de universiteiten
in Diepenbeek, Antwerpen en Gent enerzijds en Warschau en Wroclaw anderzijds.
Sinds ruim twee jaar werken we met onze collega's in Vlaanderen aan thematische
woordenlijsten die bedoeld zijn als hulpmiddel voor Nederlandstaligen die in
Polen zaken gaan doen. Ze kunnen ook een nuttige hulpbron zijn voor Polen die
voor een Vlaams of Nederlands bedrijf in Polen werken of voor Polen die in
Vlaanderen of Nederland werkzaam zijn. Ten slotte zouden ze ook als secundair
lesmateriaal kunnen dienen voor het steeds belangrijker wordende vak ‘zakelijk
Nederlands’.
Vanaf het begin werden we met een paar belangrijke vragen geconfronteerd. En
alhoewel daar intussen al antwoorden op gevonden zijn, blijven de vragen op zich
nog altijd een goed uitgangspunt voor een gedachtewisseling.
| |
| |
| |
1. Welke domeinen zijn belangrijk?
Binnen een periode van drie jaar kan men onmogelijk alles behandelen. Omdat
het werk al van tevoren aan bepaalde eisen moest voldoen, dat wil zeggen
voor een potentiële gebruiker op een concrete manier nuttig moest zijn,
luidde de eerste vraag als volgt: wat zal een Nederlandstalige in Polen in
eerste instantie nodig hebben? Enkele items lagen voor de hand: belastingen,
bank, handel. Later hebben we daar nog de thema's marketing, handelsrecht en
nijverheid aan toegevoegd. Er zijn uiteraard nog andere gebieden waarop
Vlamingen of Nederlanders in Polen actief zijn. Het is echter niet mogelijk
binnen een beperkte tijd - het project loopt maar drie jaar - alles te
behandelen. Daarom wilden we ons op problemen concentreren die van belang
zijn voor iedereen die in Polen zaken komt doen.
| |
2. Hoe omvangrijk kan zo 'n lijst zijn?
Het is niet de bedoeling om ten behoeve van het wetenschappelijk project een
echt woordenboek samen te stellen. Hoe graag we ook gewild hadden dat alle woorden binnen het thema ‘Handel’ bijvoorbeeld in
aanmerking kwamen, kon dat om allerlei. redenen niet. Niet alle vaktermen
zijn immers even frequent. Onze woordenlijsten zijn ook nagekeken door
Nederlandstalige deskundigen op de respectievelijke gebieden. En, al waren
we aanvankelijk erg trots op onze verzamelingen, vragen van de deskundige
als ‘Wat zou dit nou zijn? Dat ken ik helemaal niet!’ dwongen ons tot
nadenken. Bij een - volgens ons - wat te beperkt uitgevallen lijst hebben we
eveneens bij deskundigen hulp gezocht. Het resultaat is dat we nu een pakket
vakwoordenschat hebben dat de belangrijkste basistermen in de door ons
behandelde domeinen bevat.
Verder moet men met zes verschillende lijsten ook wat de omvang betreft
telkens consequent zijn. Als in één van de gekozen domeinen niet meteen
enkele duizenden woorden voorkomen, moeten de andere domeinen ook beperkt
worden tot een nuttig aantal vakwoorden. Ten behoeve van ons project zullen
de lijsten, afgezien van de collocaties, telkens zo'n driehonderd tot
vijfhonderd woorden bevatten.
| |
| |
| |
3. Wat komt er terecht in een dergelijke woordenlijst?
Wat moet er opgenomen worden in een dergelijke lijst? De vaktermen op zich -
dit spreekt vanzelf. Daarnaast ook hun equivalent in het Pools. Maar wat nog
meer?
Onze voorkeur ging uit naar collocaties en illustrerende citaten. Met
collocaties weet je soms niet welk werkwoord je in bepaalde contexten moet
gebruiken. Dat is bv. vaak het geval met het werkwoord ‘verzilveren’ dat
vrijwel automatisch geassocieerd dient te worden met een ‘cheque’’ Weet u
wel hoeveel soorten cheques er zijn? Een leek heeft er geen notie van. Maar
ze bestaan wel, en ze moeten dan ook in zo'n lijst opgenomen worden, want -
naar het blijkt - ze zijn nog steeds erg belangrijk in het bankverkeer. De
‘gekruiste cheques’ en andere komen dus - naast ‘een cheque tenaamstellen’ -
in onze lijsten als collocaties terecht bij de ‘cheque’.
Soms is het ook erg moeilijk om echt te weten wat er schuilgaat achter een
woord of een collocatie. Verder lijken sommige begrippen erg vaktechnisch.
Om die een beetje toegankelijker te maken, worden ze aan de hand van een
illustrerend citaat, een context gepresenteerd.
| |
4. Waar komt het materiaal vandaan?
In het kader van ons project hebben we twee verschillende werkwijzen
toegepast om aan het materiaal te komen. Het uitgangspunt bij de eerste
methode was een reeds bestaande woordenlijst of een lexicon. Uit een
dergelijke woordenlijst werden dan vaktermen op een concreet domein
geselecteerd en verder gesorteerd volgens onze criteria. Een nadeel van deze
methode is dat men dan passende contexten moet vinden (of zelf bedenken).
Een groot voordeel daarentegen - dat was het geval bij de
‘Bank’-terminologie - is dat men een ‘negatieve selectie’ maakt, dat wil
zeggen woorden schrapt die te zelden voorkomen of die te vaktechnisch zijn
voor een brochure van enkele honderden woorden, en dus dat men ook vrijwel
zeker kan zijn dat geen belangrijke term over het hoofd gezien zal worden.
De tweede methode begint met het ‘bewijsmateriaal’. Eerst hadden we een bron
van citaten, vervolgens werden uit deze bron lemma's | |
| |
geëxcerpeerd. In het geval van de ‘Belastingen’ waren het Vlaamse en
Nederlandse belastingaangiften met de bijbehorende uitleg en andere
documenten die men van de Belastingdienst toegezonden krijgt. Eén voordeel
lag al voor de hand: op die manier hadden we vaktermen voor onze lijst én
passende citaten. Deze methode geeft echter geen zekerheid dat alles wat
belangrijk is, in de lijst is opgenomen. Nadat de ingangen en de erbij
horende citaten op de juiste plaats zijn komen staan, begint het speurwerk -
opzoeken in woordenboeken, deskundigen (belastingadviseurs, medewerkers van
de Belastingdienst) om toelichting verzoeken, de lijst nog eens met ze
doornemen, en toevoegen wat zij belangrijk vinden.
| |
5. Wat is de opbouw van zo 'n thematische woordenlijst?
Bij de bewerking van onze domeinen zijn we algauw tot de conclusie gekomen
dat de algemene naam van het respectievelijke domein veel te algemeen is.
Bij ‘Handel’ staan bijvoorbeeld woorden als ‘balans’ en ‘C.A.O.’ bijna naast
elkaar. We hebben daardoor ingezien dat het niet genoeg is om de woorden die
we in een domein willen opnemen, alfabetisch te rangschikken. We vonden dat
we semantische velden nodig hadden, dat wil zeggen groepen van woorden -
binnen één domein dan - die een nauwere semantische verwantschap vertonen.
Bij de ‘Marketing’ kunnen dat bijvoorbeeld ‘verkoop’, ‘promotie’ of
‘personen’ zijn. Een begrip als ‘reclame’ komt dan nergens anders voor dan
bij ‘promotie’, de ‘sales manager’ vinden we bij ‘personen’, de ‘opruiming’
staat bij ‘verkoop’, enz. In de loop van de tijd hebben we trouwens kunnen
constateren dat we ook aanverwante subdomeinen hebben binnen de grote groep
van zes hoofddomeinen. Voor vrijwel elk stuk komen subdomeinen als
‘algemeen’ en ‘personen’ voor.
Binnen de subdomeinen werken we met tabellen. Elke tabel bevat vier kolommen.
In de eerste kolom komen lemma's terecht. De tweede kolom is bedoeld voor
samenstellingen en collocaties. In de derde kolom staan de illustrerende
citaten, en in de laatste kolom is er plaats voor de Poolse vertaling van
het lemma, de samenstellingen en de collocaties. Behalve de citaten wordt
dus alles vertaald.
| |
| |
De onderstaande tabel - een fragment van het domein ‘Belastingen’ - geeft
weer hoe de indeling er in feite uitziet.
aanslag |
|
Een aanslag is de uiteindelijk verschuldigde belasting. |
Wyliczona kwota całkowita podatku |
|
definitieve aanslag |
U ontvangt een bericht van de Belastingdienst;
meestal ontvangt u een definitieve of voorlopige
aanslag. |
Ostateczna kwota podatku |
|
voorlopige aanslag |
|
Tymczasowa kwota podatku |
|
aanslag van ambtswege |
De fiscus kan aan degene die nagelaten heeft een
aangifte in te dienen, een boete opleggen of een ‘aanslag
van ambtswege’ vestigen. |
Podatek obliczony urzędowo |
|
nihil-aanslag |
Als het verschil tussen voorheffingen en
werkelijk verschuldigde belasting minder is dan 410 NLG, is
de nihilaanslag van toepassing. |
Umorzenie (pozostałej do zapłaty części podatku mniejszej niż
określona kwota) |
|
vestiging van de aanslag |
De vestiging van de aanslag bevat onder meer de
berekening, de inkohiering en de eindafrekening. |
|
|
aanslagvoet (B) |
De aanslagvoet is wettelijk vastgesteld. In bepaalde gevallen
kan die tot 15% worden herleid. |
Stopa podatkowa |
| |
| |
| |
6. Wat is het nut van de afzonderlijke kolommen?
In de eerste kolom staan lemma's die we (in overleg met deskundigen) voor het
subdomein van essentieel belang vinden. Het zijn voornamelijk ingangen die
op zich het belangrijkst zijn voor het subdomein in kwestie. Binnen een
semantisch veld is het namelijk altijd zo dat woorden die centraal in het
veld staan, de mogelijkheid hebben om nieuwe woorden (afleidingen,
samenstellingen) te vormen.
Deze nieuwe woorden staan naast de collocaties bij onze indeling in kolom
twee. Een ‘aanslag’ in de belastingen kan bijvoorbeeld een ‘voorlopige
aanslag’ zijn of een ‘negatieve aanslag’; een ‘rekening’ in de financiën is
vaak een ‘bankrekening’ of een ‘zichtrekening’. Ook in de tweede kolom horen
hele frasen thuis: de gebruiker van onze woordenlijsten vindt hier
bijvoeglijke naamwoorden en werkwoorden die het lemma kunnen vergezellen.
De derde kolom heeft meer dan één functie. In eerste instantie dient die ter
verduidelijking van wat er met de ingang (op het eerste of tweede niveau,
dat wil zeggen in de eerste of tweede kolom) uitgedrukt wordt. We hebben
citaten proberen te vinden die het woord binnen een bepaalde context
plaatsen, dat wil zeggen die laten zien hoe het woord in een vrijwel
natuurlijke omgeving functioneert. Ten tweede, is het ook hulp-materiaal als
je de woordenlijst productief wilt gebruiken - uit de citaten zijn eveneens
uitdrukkingen te halen die bouwstenen kunnen zijn voor een nieuwe
taaluiting. Ten derde, als we de lijsten als didactisch materiaal beschouwen
kunnen ze ertoe bijdragen dat de studenten vertrouwd raken met constructies
uit specifieke bronnen. Wie de citaten goed bestudeerd heeft, zal het zeker
wat makkelijker hebben in de moeilijke wereld van specifiek taalgebruik.
De vierde kolom ten slotte is gereserveerd voor de Poolse equivalenten van
het lemma op het eerste of tweede niveau. De vertaling houdt in het Pools
ook een weergave in van uitdrukkingen en collocaties. Op die manier hebben
we - als we de contexten even buiten beschouwing laten - een tweetalige
lijst van Nederlandse en Poolse termen, uitdrukkingen en dergelijke.
| |
| |
Na rijp beraad hebben we er in de beginfase al van afgezien om de contexten
(kolom drie) te vertalen of er een Poolse context bij te voegen. De citaten
vertalen heeft niet altijd zin: soms is de omgeving van het woord in kwestie
in de doeltaal niet dezelfde. Een passend context-equivalent in het Pools
vinden kost ook nog veel extra werk. Personen die beroepshalve van zo'n
woordenlijst gebruik maken, zullen bovendien in de Nederlandse contexten
alleen een bevestiging vinden dat ze het juiste woord gevonden hebben dat in
een passende situatie gebruikt wordt. Zo'n bevestiging zal dan bijzonder
nuttig zijn wanneer ze een woord in de alfabetische lijst gaan opzoeken; dat
zullen ze meteen aan de hand van de citaten weten of ze inderdaad het
desbetreffende woord nodig hebben. Voor Poolse studenten Nederlands zou een
Poolse context overbodig zijn; dat zou het wennen aan bepaalde constructies
soms zelfs moeilijker kunnen maken.
| |
7. Hoe zal het uiteindelijke product eruitzien?
We zijn van plan de voltooide woordenlijsten inclusief een alfabetische lijst
van lemma's (in beide talen) te publiceren. De alfabetische lijst zal de
woordenschat uit alle zes domeinen omvatten; bij elk lemma wordt verwezen
naar het desbetreffende domein en subdomein. Op die manier zullen we een
gebruikersvriendelijk overzichtelijk geheel hebben, waarin alles makkelijk
te vinden is.
| |
8. Tot slot
Naar een bron van citaten op zoek gaan en een passende context opsporen kan
ook tot verrassende ontdekkingen leiden. Wat in het bijzonder opvalt, zijn
duidelijke verschillen in de aanpak in de Vlaamse en Nederlandse
bronteksten.
Bij de bewerking van de ‘Belastingen’ hebben we de Nederlandse en Vlaamse
belastingaangiften en de toelichtingen hierbij als bron van woorden en
citaten geraadpleegd. In de Vlaamse versie klinkt alles zeer ambtelijk, de
toelichting gebruikt een bureaucratische taal die geïsoleerd lijkt en een
hoge graad van concentratie vereist om de uitleg te kunnen | |
| |
volgen. De Nederlandse formulieren worden daarentegen aangeboden onder het
motto, geplaatst aan de achterkant van de toelichting: ‘Leuker kunnen we het
niet maken. Wel gemakkelijker’. In dat geval betreft het ook de taal en de
overzichtelijkheid van de aanwijzingen.
Wat onze lijsten betreft, hebben we ons best gedaan om het allemaal én
gemakkelijker én leuker te doen. Of dat gelukt is moet blijken uit de
respons van de toekomstige gebruikers.
|
|