CODE | - driecijferige toevoeging achter elke woordvorm om woordsoort en aard van gebruik aan te geven.
Voorbeeld:
Rotterdam 010 wil zeggen:
1e cijfer 0 = substantief
met 2e cijfer 1 = eigennaam
met 3e cijfer 0 = basisvorm
geweest 236 wil zeggen:
1e cijfer 2 = werkwoordsvorm
met 2e cijfer 3 = hulp- en koppelwerkwoord
met 3e cijfer 6 = voltooid deelwoord, onverbogen |
CORPUS | - het geheel van teksten waarover de frequentietellingen zijn verricht |
SUBCORPUS | - de verzameling teksten in een bepaalde taalsoort, bijv. dagbladen |
LEMMA | - de standaardvorm van een woordvorm. Of:
de woordenboekingang.
Voorbeeld: Vinden is het lemma bij de woordvorm vond |
TYPE | - een bepaald woord als abstract gegeven beschouwd |
TOKEN | - het individuele optreden van een woord
Voorbeeld: De zin ‘De jas hangt in de kast’, bevat 5 types en 6 tokens |