Neerlandica extra Muros. Jaargang 2000
(2000)– [tijdschrift] Neerlandica extra Muros / Internationale Neerlandistiek– Auteursrechtelijk beschermd
[pagina 1]
| |||||||
[Neerlandica extra Muros - februari 2000]Wegwijs op Internet
| |||||||
[pagina 2]
| |||||||
op het WWW, een bescheiden homepage dus, waarop men wat algemene informatie, adresgegevens, gegevens over de opleidingen enz. kan vinden. Niet alleen de vakgroepen Nederlands worden wat actiever, ook instellingen als de Nederlandse Taalunie of het Nederlands Literair Produktie en Vertalingen Fonds hebben een eigen site geopend. Deze sites zijn (nog) vrij bescheiden van opzet, maar het is te verwachten dat al deze universitaire en institutionele sites moeten worden gezien als eerste pogingen, als een soort kennismaking met het betrekkelijk nieuwe medium. De groei van het Internet levert uiteraard ook problemen op. Het waarschijnlijk grootste probleem in dit verband is al vaak gesignaleerd: gebruikers dreigen in de zee van informatie te verdrinken. Hoe meer informatie beschikbaar is hoe minder men geneigd is om er überhaupt nog naar te zoeken, want de ervaring leert dat men toch nooit vindt wat men zoekt. Een voorbeeld: als men met de zoekmachine AltaVista zoekt naar ‘Mulisch’ krijgt men op 18 augustus 1999 als antwoord: ‘AltaVista found 1229 Web pages’. Als men de taal beperkt tot ‘Dutch’ (maar wie zegt dat de meest interessante website over Mulisch niet juist Duitstalig is...) zijn er nog steeds 705, en ‘Harry Mulisch’ levert ook nog steeds 604 treffers op. Als men vervolgens ook maar één minuut per pagina zou besteden, dan wordt het al een behoorlijk lange werkdag. En Mulisch is dan nog niet eens een frequente naam; ‘Claus’ levert 354.990 gevonden webpagina's op. Dit is dus niet, of tenminste niet altijd, de goede manier om informatie te zoeken. In dit artikel wil ik daarom een aantal ‘wegwijzers’ voorstellen. Ik zal laten zien wat de sterke en de zwakke kanten van zoekmachines, catalogi, portalen en linklijsten zijn. Ik zal me daarbij uiteraard vooral richten op de neerlandistiek en ik zal dus websites noemen die van belang zijn voor het neerlandistiekonderzoek en voor de alledaagse praktijk van de (extramurale) neerlandistiek. Ik wil exemplarisch een aantal mogelijkheden en problemen laten zien om uiteindelijk te komen tot de beschrijving van een neerlandistische catalogus op het web, zoals ik hem graag zou zien. | |||||||
2 ZoekmachinesVoor serieuze bijbelstudie was ‘Abraham Trommius’ concordantie van de bijbel een paar eeuwen lang onmisbaar. Inmiddels zijn er ook elektronische versies van de bijbel die per computer doorzoekbaar zijn, maar het principe is hetzelfde: je hebt een index nodig om begrippen terug te vinden in de tekst. Hetzelfde geldt voor het hypertekst-netwerk dat bekend staat als World Wide Web. Al vroeg werd duidelijk dat ook dit gedeelte van het Internet een index nodig zou hebben. De eerste pogingen om te komen tot zo'n index werden aan het begin van de jaren '90 ondernomen. En in 1995 werd het dan menens: nadat in juli 1994 Michael Mauldins zoekmachine Lycos al on line gegaan was, gingen in 1995 drie andere van de ook nu nog actieve zoekmachines van start: Infoseek, Architex (later Exite) en AltaVista. De voorgangers en de eerste versies leverden nog ongeordende lijsten met verwijzingen (links), wanneer men | |||||||
[pagina 3]
| |||||||
een bepaalde zoekterm ingetikt had. Inmiddels werken de bekende zoekmachines van het type Lycos of AltaVista echter allang veel geraffineerder: ze houden rekening met de frequentie van de zoekterm(en) in een document, ze kijken of zo'n term misschien zelfs in de titel van het document voorkomt, ze kijken naar de ‘word proximity’ van zoektermen (of ze dicht bij elkaar staan dus), enz. Bovendien kan men als gebruiker ook het land en/of de taal van de documenten bepalen waarin moet worden gezocht. De resultaten worden nog steeds als linklijsten, met of zonder commentaar/samenvatting, geleverd, maar dan wel in volgorde van (door de machine veronderstelde) relevantie. Dat deze volgorde niet hoeft te correleren met de eigen relevantie spreekt vanzelf. Als voorbeeld nog een keer ‘Mulisch’. Onder de eerste 10 van de 1229 webpagina's die AltaVista vindt, bevindt zich een site van ‘Hanna Car Wash’, waar ene Mrs. Mulisch als contactpersoon wordt genoemd, en een pagina met ‘Conventions in Writing Humanities Papers’, waar Mulisch' The Assault een keer als voorbeeld wordt genoemd. De twee titels die helemaal bovenaan het lijstje staan, lijken echter veelbelovend: ‘Mulisch is Ajax!’ (met als adres: http://start.at/mulisch/) en ‘Harry Mulisch’ (met als adres: http://www.mulisch.nl/). Bij nader inzien blijkt de eerste echter niet zozeer over Mulisch te gaan (het is eerder een algemeen literaire site) en de tweede helemaal nog niet te bestaan (men krijgt - in augustus 1999 - een dummypagina met de mededeling dat er vanaf februari 2000 iets zal zijn). Naast de internationale zoekmachines zijn er inmiddels ook nationale, afgestemd op bepaalde taalgebieden: Ilse, Search.nl en Zoek.nl bijvoorbeeld zijn specifiek gericht op het Nederlandse taalgebied, Fireball is er voor het Duitse taalgebied en Frisyk is zoals ze zelf zeggen ‘de iennige folslein Frysktalige sykmasine fan it WWW’. Binnen drie, vier jaar is er dus een grote hoeveelheid van zoekmachines ontstaan, die allemaal vergelijkbaar werken: om de zoveel tijd (bijvoorbeeld één keer per maand) worden alle sites bezocht en worden de pagina's geïndexeerd. De zoekmachine gaat daarbij over het algemeen zelf op zoek naar links en bijbehorende documenten om ook deze in de index op te nemen. Om niet telkens alle zoekmachines op het web te moeten raadplegen, zijn er zogenaamde metazoekdiensten ontwikkeld, waar men een zoekterm intikt en die vervolgens zelfstandig laat zoeken via een aantal zoekmachines. Deze metazoekdiensten zijn er in twee smaken, on line (in de vorm van een website; vgl. bijvoorbeeld de Metacrawler-website) of off line (in de vorm van een pc-programma; bekende vertegenwoordigers van dit genre zijn bijvoorbeeld WebFerret of Copernic).
Van Oostendorp & Van der Wouden (1998) tonen aan dat men het Internet kan beschouwen als één gigantisch tekstcorpus en ze laten zien dat en hoe men het kan gebruiken voor taalkundig onderzoek. Ontsluiting door middel van degelijke (meta-)zoekmachines en indexen is daarvoor onmisbaar. Zij maken het Internet pas tot ‘corpus’, zij maken het materiaal pas toegankelijk voor onderzoek. Van Oostendorp en Van der Wouden laten zien dat het ‘corpus Internet’ een | |||||||
[pagina 4]
| |||||||
waardevolle bron voor taalkundige inzichten kan zijn en ze wijzen erop dat de beschikbaarheid van al dat materiaal gevolgen zal hebben voor de taalkundige methodologie. Zoekmachines zijn, zoals dit voorbeeld laat zien, uiterst nuttig voor allerlei doeleinden. Eén ding hebben deze zoekmachines echter allemaal gemeen (en dat beperkt hun toepassingsdomein): ze zijn dom. Documenten op het WWW worden blind geïndexeerd; er wordt niet gekeken naar de inhoud van het document en ook niet naar de afkomst. Om nog een keer Mulisch te nemen: als ik een document publiceer op het Internet met de titel ‘Mulisch’ en met als inhoud tien keer de naam ‘Mulisch’, dan zal zo'n document bij zoekmachines hoger scoren wanneer iemand zoekt op ‘Mulisch’, dan een briljant artikel over ‘De ontdekking van de hemel’, waarin de naam maar twee keer voorkomt. Een ander probleem voor ‘domme’ zoekmachines is het snelgroeiende aantal pagina's die niet statisch zijn, maar die telkens op aanvraag worden gegenereerd uit bijvoorbeeld een databestand. Dergelijke dynamische pagina's kunnen niet worden geïndexeerd en dus ook niet worden gevonden. Zoekmachines vinden dus aan de ene kant te veel materiaal en ze presenteren het op een manier die niet altijd adequaat is, en ze vinden aan de andere kant ook vaak te weinig, omdat ze alleen rekening houden met het statische gedeelte van het net. Dergelijke problemen zijn al vroeg onderkend en hebben geleid tot een compleet andere benadering van het probleem ‘Hoe maken we het WWW toegankelijk?’, namelijk de catalogus. | |||||||
3 CatalogiDe bekendste webcatalogus is zonder twijfel Yahoo!, eveneens opgericht in 1995 door twee studenten. Bij Yahoo! volgt men een compleet andere strategie dan bij de hiervoor besproken zoekmachines: webpagina's worden niet ‘blind’ geïndexeerd, maar moeten worden aangemeld door hun makers, waarbij men over het algemeen een korte beschrijving moet opgeven en een rubriek waarin de pagina thuishoort. Vervolgens wordt de pagina door een (menselijke) redacteur bekeken en gerubriceerd. Op deze manier ontstaat er een soort ‘Gouden Gids’ voor het Internet. Het voordeel ligt voor de hand: de relevantie van een webpagina voor de eigen vraagstelling kan door de rubricering veel beter worden beoordeeld dan wanneer men alleen de titel van de pagina ziet. Bovendien vindt men in dezelfde rubriek nog tientallen andere pagina's die misschien ook interessant zouden kunnen zijn voor het onderwerp in kwestie. Het Yahoo!-concept is inmiddels vaak gekopieerd. Ook van oorsprong als zoekmachines geconcipieerde diensten als Hotbot, Exite of Lycos hebben nu een cataloguscomponent, die het echter kwalitatief over het algemeen niet haalt bij Yahoo! Voor neerlandistische onderwerpen zijn deze internationale catalogi over het algemeen maar in beperkte mate bruikbaarGa naar eind(2). Daarvoor kan men beter terecht bij diensten uit de Lage Landen, zoals bijvoorbeeld Ilse. Ook Ilse biedt niet alleen een zoekmogelijkheid op trefwoord, maar daarnaast een ‘directory’. Doeltreffender is echter meestal het NL-menu, waar sites op naam of per | |||||||
[pagina 5]
| |||||||
rubriek kunnen worden gezocht. Het nadeel van deze catalogus: hij is beperkt tot sites in Nederland (buitenlandse servers worden niet opgenomen). Een zeer interessant project is DutchESS, de Dutch Electronic Subject Service van de KB in Den Haag. Hier wordt geprobeerd om een verantwoorde thematische selectie op te bouwen van verwijzingen naar kwalitatief goede, ook voor wetenschappelijke doeleinden bruikbare websites. In de DutchESS-catalogus kan men ‘bladeren’ door de rubrieken, maar de collectie is ook doorzoekbaar op trefwoord. Relevant voor de neerlandistiek zijn vooral de rubrieken 18.10 (Nederlandse taalkunde) en 18.11 (Nederlandse letterkunde), maar ook andere rubrieken bevatten interessant materiaal over de Nederlandse cultuur, zoals bijvoorbeeld rubriek 15 (Geschiedenis) of 20 (Kunstwetenschappen). | |||||||
4 PortalenVeel van deze zoekmachines en catalogi hebben hun aanbod duidelijk uitgebreid. Naast een combinatie van de zoek- en de catalogusfunctie bieden ze allerlei extra's om de gebruikers aan de site te binden. Voor commerciële sites zijn hoge bezoekersaantallen van belang omdat ze over het algemeen leven van reclame-inkomsten. Daarom wordt met alle middelen geprobeerd om de gebruikers zover te krijgen deze pagina als ingangspagina te nemen (als openingspagina, wanneer de browser wordt opgestart). Alles waarvan redelijkerwijs mag worden verwacht dat het van belang is voor veel mensen wordt direct via de openingspagina aangeboden: nieuws, weerberichten, sport enz. Veel van deze ‘portalen’ (zoals ze ook vaak worden genoemd) bieden bovendien de mogelijkheid om de inhoud van de pagina's individueel aangepast te laten genereren. Men geeft eigen interesses op en krijgt automatisch nieuwsberichten en linklijsten over deze onderwerpen op het scherm. Dergelijke portaalsites bieden inmiddels vaak een gratis e-mail-dienst aan. | |||||||
5 LinklijstenDe oudste en tegelijk misschien ook wel effectiefste manier om verwijzingen naar relevant materiaal op Internet toegankelijk te maken is via een linklijst, een soort bibliografie in de vorm van een doorgelinkte webpagina. De inhoudelijke samenstelling kan zijn gestuurd door het onderwerp (‘Alles over onderwerp X’), door de persoonlijke voorkeur van de samensteller (‘Mijn favoriete pagina's over onderwerp X’) of door meer toevallige factoren (‘Leuke pagina's die ik ooit ben tegengekomen’). Soms zijn dergelijke linkverzamelingen zeer geslaagd en getuigen ze van deskundigheid, vaker zijn ze ‘wel aardig’ tot ‘onbruikbaar’. Voor het Nederlands zijn er op deze manier inmiddels een paar zeer bruikbare verzamelingen ontstaan. Ook de academische wereld heeft ondertussen gezien dat het bijeenbrengen van Internet-resources een belangrijke taak is. Zo zijn er de afgelopen jaren tal van lijsten ontstaan waarvan ik er hier drie wil noemen, alledrie gemaakt door bibliotheekmedewerkers van de desbetreffende universiteiten: Internetbronnen Nederlandstalige Letterkunde (Universiteit Utrecht), | |||||||
[pagina 6]
| |||||||
Internetbronnen voor Neerlandistiek (Universiteit van Amsterdam) of de Internetbronnen Letteren (Katholieke Universiteit Brabant). De laatste is niet specifiek neerlandistisch, maar toch ook voor ons vak zeer bruikbaar. Naast deze linkverzamelingen die onderdeel zijn van de bibliotheekpagina's, zijn er ook een paar grotere collecties op sites die specifiek gericht zijn op de Nederlandse taal, literatuur en/of cultuur. Hier moet vooral worden gewezen op de ‘Koppelingen’ van de website van Onze Taal, een cluster van pagina's waarmee de redacteur, Marc van Oostendorp, probeert een uitputtende verzameling op te bouwen en bij te houden van webpagina's over het Nederlands (onderverdeeld in rubrieken en voorzien van korte beschrijvingen). De ‘Koppelingen’ zijn goed en deskundig samengesteld en er wordt moeite gedaan ze actueel te houden. Voor de Nederlandse en de Vlaamse literatuur zijn er meer van dit soort lijsten. Ik noem hier exemplarisch De Nederlandse Letteren, een oude bekende, die ik ook in 1996 al heb aanbevolen. Piet Wesselman heeft zijn pagina's een tijdje niet goed bijgehouden, maar is nu kennelijk sinds een paar maanden weer vol enthousiasme bezig. Op deze site vindt men ook de index ‘Schrijvers en dichters’, een goed uitgangspunt als men wil weten wat er zoal te vinden is op het net over een bepaald auteur. Naast De Nederlandse Letteren kan worden gewezen op de Meander-links (samengesteld door Jeannine Janssens en Rob de Vos). Deze doorzoekbare linkdatabase biedt een omvangrijke verzameling van gerubriceerde links, helaas over het algemeen zonder verdere beschrijving. Ook de NedWeb-Links van de vakgroep Nederlands in Wenen zijn gerubriceerd en zitten in een doorzoekbare database. Deze verzameling bevat niet alleen taalkundige en letterkundige verwijzingen, maar ook verwijzingen over de geschiedenis en de cultuur van de Lage Landen. Daarnaast zijn er rubrieken voor het Afrikaans en het Fries. Per rubriek zijn de NedWeb-Links minder omvangrijk dan andere lijsten. Er wordt niet alles in opgenomen wat op de een of andere manier met het onderwerp te maken heeft, maar er wordt een selectie gemaakt van materiaal dat door de redactie relevant wordt geacht. Naast de NedWeb-Links zijn er sinds kort ook de NedWeb-Tours: een soort virtuele touroperator die een interactieve rondleiding biedt langs een klein aantal geselecteerde sites rond een bepaald (wisselend) onderwerp. Een andere opzet dan de tot nu toe besproken linksites heeft HEIN, de ‘helper in het net’ van de Fachvereinigung Niederländisch in MünsterGa naar eind(3). Hier kan men zoeken op trefwoord, maar bijvoorbeeld ook op regio. De opzet van de database is interessant, maar hij werkt helaas niet erg gebruikersvriendelijk en intuïtief en heeft bovendien ook nog vaak te kampen met technische problemen, waardoor de site niet altijd bereikbaar is.
Hét probleem van dergelijke inventarissen is de kortstondigheid van het Internet. Het net groeit razendsnel, adressen van pagina's veranderen vaak, pagina's worden weer van het net gehaald, hele sites verdwijnen plotseling om een paar weken later onder een andere naam en op een ander adres weer op te duiken, inhouden worden constant gewijzigd. Snelheid en flexibiliteit is uiteraard een | |||||||
[pagina 7]
| |||||||
van de grote krachten van het Internet, maar voor het bijhouden van een goede en actuele bibliografie of linklijst zijn deze eigenschappen van het Internet funest. Zoekmachines vinden ‘dode links’ over het algemeen zelf (zij het met enige vertraging), omdat ze om de zoveel tijd proberen de pagina's opnieuw te indexeren. Pagina's die niet meer worden gevonden, worden gewoon geschrapt uit het bestand. Catalogi, linklijsten, linkdatabases daarentegen zijn aangewezen op redactioneel werk om actueel te blijven. Er zijn weliswaar hulpmiddelen om de validiteit van een link te testen, maar of de rubricering nog adequaat is en of de gegeven beschrijving de lading van een pagina (nog) dekt, dat zal toch om de zoveel tijd gewoon (handmatig als het ware) moeten worden gecontroleerd. En dat is dan ook het grootste probleem van de bestaande ‘bibliografieën’: ooit is iemand er enthousiast aan begonnen, maar na een tijdje blijkt dat het onderwerp niet meer zo interessant is, dat het misschien toch te veel werk is of dat men gewoon geen tijd meer heeft om het bij te houden. En binnen de kortste keren blijken 10, 20, 30 procent van de opgenomen verwijzingen niet meer te kloppen, omdat het adres niet meer bestaat, omdat titel en/of inhoud veranderd zijn. Om deze redenen is er dringend behoefte aan professionalisering op dit terrein. | |||||||
6 Het neerlandistische ideaalIn 1997 schreef Marc van Oostendorp: ‘Ik heb een ideaal: dat alles over de Nederlandse taal en literatuur op een dag op het Internet staat. Ik hou van onze taal en ik hou van onze literatuur. Ik zou willen dat ik alles wat ik erover weten wil via het Net kan vinden.’ (Van Oostendorp 1997: 8) Ik deel dit ideaal met Van Oostendorp. En ik hoop dat we erin zullen slagen om de almaar toenemende hoeveelheid informatie toegankelijk te houden.
Geen van de tot nu toe besproken mogelijkheden is optimaal als vertrekpunt voor allerlei verschillende neerlandistische zoektochten. Afhankelijk van de aard van de vraag zal men zijn toevlucht moeten nemen tot een of meer zoekmogelijkheden. Voor sommige vragen en problemen zijn de bestaande catalogi en zoekmogelijkheden goed en doeltreffend, andere zijn er nauwelijks mee te beantwoorden of op te lossen. Het zou daarom wenselijk zijn om op het web één centrale plek te hebben als vertrekpunt op het terrein van de Nederlandse taal en de Nederlandse en Vlaamse literatuur en cultuur. Er zijn goede voorbeelden: ArchNet, de ‘WWW Virtual Library Archaeology’ van de University of Connecticut, voor archeologische onderwerpen, om maar eens wat te noemen, of ook Linguist, de site die behoort bij de bekende taalkundige mailinglijst Linguist List, voor de taalkunde. Dit soort sites verzamelt alles wat in elektronische vorm beschikbaar is en te maken heeft met het vak: links, artikelen, bibliografieën, software, advertenties, projectbeschrijvingen, adressen, archieven van mailinglijsten enz. Het is allemaal toegankelijk via deze ene site. Zo'n site kan men het best om- | |||||||
[pagina 8]
| |||||||
schrijven als een thematische catalogus of zelfs als ‘themaportaal’. Ook voor de neerlandistiek zou zo'n portaal zeer wenselijk zijn, een site dus, die toegang verleent tot het neerlandistische gedeelte van het net. Dat kan in de vorm van een gewone catalogus, maar beter nog in de vorm van én een catalogus én een zoekmachine. De zoekmachine zou twee functies moeten vervullen: aan de ene kant zou ze moeten fungeren als een soort doorzoekbare bibliografie (men kan dus zoeken in titels, trefwoorden en beschrijvingen) en aan de andere kant zou ze op basis van deze bibliografie een index moeten bevatten van de erin opgenomen titels (= websites) die op deze manier vanaf één centrale site ‘full text’ doorzoekbaar zouden zijn. Naast deze basisfunctionaliteit zou zo'n neerlandistische portaalsite vrij eenvoudig kunnen worden verrijkt met allerlei technische speeltjes als attenderingslijsten die op de persoonlijke wensen en behoeften zijn afgestemd en dergelijke.
De vraag is, waar zo'n site zou moeten worden opgezet en door wie. Een belangrijk aspect hierbij is de kostenfactor. Ik vind het van groot belang dat zo'n site vrij en gratis toegankelijk is voor iedereen ter wereld die daar belangstelling voor heeft. Daarom mag zo'n initiatief niet worden overgelaten aan bijvoorbeeld commerciële uitgevers of andere op winst gerichte ondernemingen. Maar het is natuurlijk wel zo, dat er geld nodig is voor het opzetten en bijhouden van zo'n centrale neerlandistische site. Natuurlijk voor de techniek, maar ook (en dat is veel belangrijker) voor de menskracht. Elke universiteitsbibliotheek heeft haar ‘vakreferenten’. Dergelijke vakreferenten heeft ook de digitale bibliotheek (die soms ook wel Internet wordt genoemd) nodig. Er moet volgens mij een redactie komen, die de ontwikkelingen in de gaten houdt, die webpagina's bekijkt, rubriceert en beschrijft, die veranderingen registreert en verwerkt. Dit is een taak die op den duur niet door vrijwilligers kan worden volbracht, maar alleen door betaalde vakmensen. En deze vakmensen zal men alleen kunnen vinden onder de neerlandici. De verwijzing naar de vakreferenten doet de gedachte rijzen om zo'n site inderdaad te laten opbouwen en beheren door de (universiteits)bibliotheken. Ik denk echter dat dit nog niet realistisch is. Er zijn weliswaar eerste pogingen zoals de hierboven genoemde linklijsten en natuurlijk DutchESS, maar voor een goede neerlandistische site zijn we vooralsnog aangewezen op initiatieven van de neerlandistiek zelf. Uiteraard moeten neerlandici vooral de inhoud leveren en het is dan ook te hopen dat steeds meer ‘professionals’ meebouwen aan het neerlandistische gedeelte van het net. Maar daarnaast zijn zij ook de aangewezen personen voor de ontsluiting van dit gedeelte in de vorm van catalogi, bibliografieën, linklijsten enz. Een betere samenwerking op dit terrein zou zeker zinvol zijn en zou misschien ook nu al kunnen leiden tot één neerlandistische portaalsite. In de toekomst zal dan wel blijken of het Internet zich inderdaad naar verwachting verder ontwikkelt tot een onmisbaar hulpmiddel voor wetenschappelijk onderzoek en onderwijs. Ik ga ervan uit dat dat het geval zal zijn en dat daardoor ook de functies en de taken van de huidige bibliotheken zullen wijzigen. Het is te verwachten dat zij op den duur de functie van ‘portaal’ zullen | |||||||
[pagina 9]
| |||||||
overnemen voor de diverse wetenschappen en dat ze ook de daarvoor nodige specialisten zullen aantrekken. De bibliotheek zal steeds meer (ook) digitale bibliotheek zijn.Ga naar eind* | |||||||
Bibliografie
|
|