Jaarboek voor Nederlandse Boekgeschiedenis. Jaargang 4.
(1997)– [tijdschrift] Jaarboek voor Nederlandse Boekgeschiedenis– Auteursrechtelijk beschermdHet boek behouden
[pagina 191]
| |||||||||||||||||
J. de Vuijst & J.S. Mackenzie Owen
| |||||||||||||||||
[pagina 192]
| |||||||||||||||||
een moraal, de manier waarop bepaalde minderheidsgroepen onderling communiceren, maar ook besprekingen van recentelijk uitgebrachte muziek of literatuur. Soms, en steeds vaker, zijn de muziek en de literatuur zelf ook ter plekke beschikbaar. Kortom, uit kwalitatieve overwegingen zou men zeer wel kunnen vinden dat hier sprake is van een cultuuruiting die voor het nageslacht bewaard moet worden, ook al is duidelijk dat het begrip ‘publicatie’ hier niet in de gebruikelijke zin van toepassing is. Anderzijds spreken we, wanneer we het hebben over elektronische informatie, over een ontwikkeling van slechts enkele tientallen jaren: zou niet al datgene wat werkelijk de moeite waard is, zijn weg vinden naar de meer traditionele (in de zin van meer gebruikelijke) media en zich derhalve zo aanbieden voor bewaring? Met andere woorden: betreft de huidige stand van zaken een wezenlijke nieuwe vastlegging van informatie, of slechts een tijdelijk bij-effect van technische ontwikkelingen? Zou het om een tijdelijk bij-effect gaan, dan hoeft men ook niet serieus energie en geld te besteden aan de vraag hoe men de elektronisch vastgelegde informatie van het Internet bewaart en duurzaam toegankelijk maakt. Met enige spijt zou men kunnen constateren dat er ‘mooie dingen verloren gaan’, maar dat is wel eerder voorgekomen in de geschiedenis (de parallel met de orale traditie dringt zich uiteraard op), en men zou kunnen proberen het zelfselectieproces te stimuleren van die informatie die werkelijk de moeite waard is. Indien echter de vluchtige elektronische wereld van het Internet wel een nieuwe wezenlijke ontwikkeling is in de geschiedenis van de informatievastlegging, dan dient men zich snel te concentreren op de vraag hoe die informatie duurzaam toegankelijk kan worden gemaakt, waarbij het Internet als ‘drager’ wel het grootste probleem zal zijn. In deze bijdrage concentreren wij ons op twee vragen: wat is nu werkelijk de aard van elektronische informatie, en hoe zou men methoden kunnen ontwikkelen voor het bewaren en het beschikbaarstellen van elektronische informatie in de toekomst? | |||||||||||||||||
De aard van elektronische informatie. Meer van hetzelfde of nieuwe concepten?Met hoort wel beweren dat we momenteel in een ‘informatiemaatschappij’ leven, of, wat recenter en meer vanuit een economische invalshoek, een ‘kennismaatschappij’. Deze beweringen zullen wel juist zijn, maar verbleken enigszins bij het inzicht dat de mensheid altijd al in een informatiemaatschappij heeft geleefd. Het is de natuurlijke neiging van de mens, en tegelijk een overlevingsstrategie, om voortdurend informatie te verwerken en er kennis aan te ontlenen. Wij beschouwen creatieve informatieverwerking zelfs als een typisch menselijke eigenschap en we ontlenen er onze opvattingen over unieke menselijke intelligentie aan. Het begrip ‘informatiemaatschappij’ is daarmee geen onderscheidende aanduiding van ons tijdperk.Ga naar voetnoot1 Zolang er mensen zijn heeft informatieverwerking hen doen overleven. Wel zijn er opmerkelijke ontwikkelingen | |||||||||||||||||
[pagina 193]
| |||||||||||||||||
geweest in de menselijke geschiedenis, sprongen, die de aard van de informatie voor altijd wijzigden. Spraakontwikkeling is zo'n verandering geweest. Toen spraak eenmaal was ontstaan, was er onherroepelijk geen weg meer terug naar een spraakloze maatschappij. De ontwikkeling van spraak was in die zin werkelijk een revolutie. Er zijn meer zulke revoluties geweest. Spraak is uiteraard beperkt in haar toepassing: zij is gebonden aan plaats en aan tijd. Beide beperkingen zijn overwonnen in, opnieuw revolutionaire, ontwikkelingen die informatie tijdloos maakten (bijvoorbeeld rotstekeningen), of afstand deden overbruggen (vuur- en rooksignalen). In Van DijkGa naar voetnoot2 staat een schema waarin dergelijke ontwikkelingen in onderling verband zijn geplaatst. De ontwikkeling van het schrift is uiteraard een revolutie geweest die zowel tijd als plaats overwon. Behalve deze revolutionaire ontwikkelingen is er een groot aantal technische ontwikkelingen in de geschiedenis geweest, dat kon voortbouwen op de revoluties. Uit het overwinnen van plaats (de vuur- en rooksignalen) kwamen technische ontwikkelingen voort als telegraaf, telefoon, kortom alle latere draad- en straalverbindingen. In wezen voegden dergelijk technische hoogstandjes weinig meer toe dan de mogelijkeid om grotere hoeveelheden informatie sneller te verwerken: letterlijk ‘meer van hetzelfde’. Iets vergelijkbaars doet zich voor bij de uitvinding van de boekdrukkunst. Het schrift was er al en wat de boekdrukkunst toevoegt, hoe innovatief ook, is ‘meer van hetzelfde’. Dat dat tot maatschappelijke ontwikkelingen leidde die door sommigen op hun beurt weer als ‘revolutionair’ worden gekenschetst, wil niet zeggen dat de boekdrukkunst dat zelf ook was. Het was een indrukwekkende, invloedrijke, technische ontwikkeling, maar zelf geen informatierevolutie. Men vergelijke Kist, in zijn recente dissertatie BibliodynamicaGa naar voetnoot3, die de ‘Gutenberg-innovatie’ behandelt. De vraag is nu aan de orde of de elektronische vastlegging van informatie een revolutie is (dan wel zal blijken te zijn) of een technische ontwikkeling. Het belang van het juiste antwoord op die vraag mag niet onderschat worden. Stel dat elektronische vastlegging eigenlijk een technische ontwikkeling is. Dan kan men zich in de archivering en beschikbaarstelling ervan ook beperken tot technische vernieuwing. De logistiek van verwerving, ontsluiting enzovoort, zal aangepast moeten worden; de apparatuur, die nodig is voor de beschikbaarstelling, zal aangeschaft, onderhouden en vernieuwd moeten worden. Dat alleen al is een enorme opgaaf, aangezien de apparaten die we over tien jaar op de markt mogen verwachten niet in staat zullen zijn de huidige cd-rom's en dergelijke te lezen - later in dit artikel gaan we daar nader op in. Hoe dan ook: een technische ontwikkeling vergt technische aanpassing. Indien echter elektronische vastlegging een revolutionaire ontwikkeling is, dan kan men niet volstaan met technische maatregelen, maar moet men nieuwe concepten ontwikkelen, in overeenstemming met het revolutionaire karakter van de ontwikkeling. | |||||||||||||||||
[pagina 194]
| |||||||||||||||||
Informatie en dragerEen van de meest kenmerkende eigenschappen van de huidige ontwikkeling is dat informatie en drager gescheiden raken. Het grote verschil met de orale traditie is uiteraard dat ondanks de scheiding, de informatie wel vastlegbaar blijft en reproduceerbaar zonder enig kwaliteitsverlies. Dat is dan ook meteen het wel degelijk revolutionaire aan die ontwikkeling. In het verleden was informatie noodzakelijkerwijs gebonden aan de drager ervan. Het veranderen van de informatie vergde fysiek veranderen van de drager. Wetgeving bijvoorbeeld was gericht op de integriteit en het eigendom van de informatiedrager, niet op de informatie zelf. Men bedenke dat in het digitale tijdperk informatie gestolen kan worden zonder dat de bestolene het merkt: de oorspronkelijke drager blijft intact. Reproductie was voor het digitale tijdperk alleen mogelijk door de geregistreerde informatie op een andere drager over te brengen, en dat betekende altijd kwaliteitsverlies ten opzichte van de oorspronkelijke registratie. Wanneer de drager beschadigd was - bijvoorbeeld de inkt waarmee een letter was opgetekend, of er was een groef in een vinylplaat ontstaan - dan was de informatie zelf niet meer volledig opvraagbaar. Wanneer de drager vergaat, vergaat de informatie. Archivering en bewaring van informatie betrof in feite bewaring van de drager. Kortom: in het preëlektronische informatietijdperk is het succes van informatiebewaring volstrekt afhankelijk van het succes waarmee de drager bewaard kan worden. Alle reproductie is behelpen in vergelijking met de oorspronkelijke drager. In een elektronische informatieomgeving is informatie onafhankelijk van de drager. Men kan ook niet meer vaststellen welke drager de ‘oorspronkelijke’ was. In een elektronische omgeving kan informatie vrijelijk gekopieerd worden, gecombineerd en vervolgens zonder waarneembaar verschil ten opzichte van eerdere versies op een veelheid aan dragers opnieuw worden vastgelegd. Deze eigenschap is het rechtstreekse gevolg van de wijze waarop informatie geregistreerd wordt: middels digitale codering, dat wil zeggen in 1-en en 0-en. In het preëlektronische tijdperk was alle registratie noodzakelijkerwijs analoog van aard. Een sterker geluidssignaal doet naar rato de registrerende apparatuur sterker bewegen. Een tekening of letter is herkenbaar aan de vorm van de lijn die met inkt is opgetekend. Als de letter beschadigd raakt, dan kan alleen uit de context de oorspronkelijke vorm ervan gereconstrueerd worden. En vaak zullen we niet weten of dat inderdaad de juiste reconstructie is. Maar een ‘beschadigde 1’ kan altijd hersteld worden tot een ‘echte 1’, en een ‘beschadigde 0’ tot een ‘echte 0’. Dat maakt het ook mogelijk en eenvoudig, een digitaal gecodeerd signaal te versterken zonder kwaliteitsverlies. Een analoog signaal dat beschadigd raakt, laat dat merken door bijvoorbeeld ruis. Bij versterking wordt ook de ruis versterkt. In het digitale geval is dat niet aan de orde. De reproduceerbaarheid zonder kwaliteitsverlies en het feit dat informatie en drager los zijn gekomen van elkaar hebben ingrijpende gevolgen. Als niet meer waarneembaar is wat van een serie versies het origineel is, hoe zit het dan met rechten op het origineel, in verhouding tot het recht om te kopiëren? Men kan elektronische informatie stelen, zonder dat het origineel wordt weggenomen of zelfs maar fysiek benaderd | |||||||||||||||||
[pagina 195]
| |||||||||||||||||
hoeft te worden. Maar daar is wetgeving nu juist wel op gebaseerd. Dit verklaart uiteraard de verlegenheid in onze tijd over ‘intellectueel eigendom’ en de wijze waarop dat vastgesteld zou kunnen worden. De vertrouwde terminologie lijkt niet meer van toepassing. In feite zijn dit allemaal bij-effecten van het wezenlijk nieuwe, namelijk drageronafhankelijke, karakter van elektronische informatie. | |||||||||||||||||
NetwerkenEen tweede wezenlijke verandering ten opzichte van eerdere informatievastlegging betreft het gebruik van netwerken. Zogenaamde floppy's en cd-rom's kan men met enige fantasie nog beschouwen als ‘normale’ (bijvoorbeeld) tijdschriften, nu alleen elektronisch en niet op papier vastgelegd. Men kan ze in de kast zetten en zich inderdaad tot technische aanpassingen van de verwerkingsprocessen beperken. Maar dat gaat niet op voor informatie die beschikbaar is via een netwerk. Op een netwerk zijn informatie en communicatie in een proces verenigd geraakt en daarmee verdwijnt het vertrouwde concept van ‘een document’. Voor veel gebruikers is de combinatie van communicatie en informatie een doorslaggevende reden om met netwerken te werken. Het succes van het Internet is te danken aan het toenemend gebruik van nu juist die combinatie in de wetenschappelijke wereld. Het lezen van een document wordt op een net gecombineerd met de mogelijkheid rechtstreeks contact te zoeken met de auteur en met anderen die in de materie geïnteresseerd zijn.Ga naar voetnoot4 Een bijzonder effect daarvan is dat een document via verwijzingen, aangebracht door auteur of lezer, dermate hecht ‘gelinked’ raakt met andere tekstfragmenten, of met grafische documenten en zelfs met geluid en met (al dan niet bewegend) beeld, dat het niet meer mogelijk is, het oorspronkelijke document als zodanig te onderscheiden of nog los te maken uit de omgeving. Kortom: op het moment dat een document op het net beschikbaar gesteld wordt, kan iedereen, inclusief de eigenlijke auteur, zich ermee gaan of blijven bemoeien en het voortdurend veranderen of aan andere documenten hechten. Wat zou er dan bewaard moeten worden en beschikbaar moeten komen voor toekomstige raadpleging? Uiteraard moet hiervoor een nieuw concept gezocht worden - louter technische aanpassing in het al bestaande bewaringsproces volstaat niet. Ooit zal men wellicht in staat zijn een ‘snap shot’ te maken van het gehele Internet en men zal dat dan kunnen bewaren voor de toekomst. Momenteel is dat uitgesloten. Anderzijds mag men zich afvragen wat het belang zou zijn van een volledige dwarsdoorsnee van het Internet op een bepaald moment. Tegelijkertijd ziet men een ontwikkeling die van belang is voor het onderwerp dat we hier behandelen. Lange tijd was het Internet, in de beleving van de gebruikers, een ‘extra’ geheugenruimte, waaruit op dat moment nuttige informatie naar de eigen elektronische informatieomgeving kon worden gekopieerd. Momenteel ontwikkelt zich een andere beleving, | |||||||||||||||||
[pagina 196]
| |||||||||||||||||
waarin het Internet wordt gezien als een extensie van de eigen omgeving, of zelfs van het eigen brein. Die laatste dimensie valt buiten het bestek van dit artikelGa naar voetnoot5, maar het concept van een giga-geheugen dat voortdurend beschikbaar is, is wel van belang. Om in die oceaan van voortdurend veranderende informatie te kunnen vinden wat op een bepaald moment nodig of van nut is, zijn speciale hulpmiddelen nodig. Een ontwikkeling die momenteel aandacht vraagt is die van zogenaamde intelligente softwarerobotjes, ‘agents’.Ga naar voetnoot6 Een agent wordt door zijn eigenaar op pad gestuurd in het Internet om te vinden wat voor die eigenaar nuttig is. Een eenvoudig voorbeeld is een agent die op zoek gaat naar documenten die recentelijk op het net zijn verschenen en die handelen over een voor de eigenaar van de agent relevant onderwerp. De agent ‘weet’ dus wat de eigenaar al heeft en waaraan hij of zij behoefte heeft. Een al wat minder simpele toepassing is die van een agent die, al rondsnuffelend op het net, een andere agent tegenkomt, die voor hem of haar relevante informatie bij zich heeft. Dat kan leiden tot informatie-uitwisseling tussen agents onderling. Of misschien ook, maar opnieuw is dat iets dat buiten het bestek van dit artikel valt, bewuste desinformatie aan alle agents die op zoek zijn naar een bepaald soort informatie. De architectuur die zich daaromheen lijkt te ontwikkelen is tri-partite: er ontstaan agents die verstand hebben van de gebruiker en van het interpreteren van gevraagde informatie, er ontstaan agents die verstand hebben van het selecteren en vinden van de juiste informatie, agents derhalve die verstand hebben van het beoordelen van aangeboden informatie en er ontstaan agents die verstand hebben van het doen uitwisselen van vraag en aanbod, agents als makelaars. Aan deze ontwikkelingen kleven ook allerlei bezwaren (bij het sluiten van de kantoren in Amerika gaan vandaar allerlei vergelijkbare agents het net op, hetgeen tot vertraging en verstoring leidt), maar vanuit het perspectief van bewaring en duurzame beschikbaarstelling van elektronische informatie is het wel een wezenlijke ontwikkeling. De agents ‘komen thuis’ met een selectie van gevonden informatie, afhankelijk van de gestelde vraag. Die selectie en vraag zijn aanzienlijk gemakkelijker te bewaren en te ontsluiten dan elke andere willekeurige selectie van alles wat er op het Internet beschikbaar is. Een ontwikkeling is denkbaar waarin na enige tijd de gebruiker niet meer zelf op het gehele Internet ‘surft’ (ronddwaalt), maar alleen nog ziet wat een collectie van gespecialiseerde agents voor hem of haar heeft opgediept. Het huidige Internet is dan een onderlaag, een vluchtige voorraadkast, waaruit allerlei softwarehulpmiddelen selecties samenstellen. Die selecties zijn bij uitstek een object voor duurzame bewaring. Wij spreken hier over een ontwikkeling die nog in volle gang is en waarvan de uitkomst allerminst zeker is. Desalniettemin is het duidelijk dat ook in dit domein een louter technische aanpassing van al bestaande processen voor bewaring van informatie niet zal voldoen. | |||||||||||||||||
[pagina 197]
| |||||||||||||||||
Samenvattend constateren wij dat het bewaren van elektronische informatie aanzienlijke, technische en conceptuele, aanpassing zal vergen van de nu bekende processen. De wezenlijke verschillen met niet-elektronische informatie hebben betrekking op de aard en de gebondenheid aan de drager, op het vluchtige en dynamische karakter van het Internet, op de vrijelijke reproduceerbaarheid, op de combinatie van informatie en communicatie, op de verdwijnende notie van een ‘document’ en op de onmetelijke omvang van het Internet-gebied, waarin wellicht door agents samengestelde informatie nog het meest tastbaar zal blijken te zijn. De processen voor het bewaren van informatie zullen herontworpen moeten worden. Daarover handelt het tweede deel van dit artikel. | |||||||||||||||||
Archivering van elektronische informatie: de conservering van onze elektronische cultuurPublicaties vormen het documentaire geheugen van onze tijd. We vinden er de neerslag van onze cultuur, de inrichting en werking van onze samenleving, onze wetenschappelijke inzichten, en nog veel meer. Om dat alles voor het nageslacht te bewaren, moeten we de publicaties bewaren. In de meeste landen gebeurt dat in de vorm van een nationaal ‘depot’ -meestal onderhouden door de nationale bibliotheek - waarin alle ‘uitgeefproducten’ van het desbetreffende land worden bewaard. De gedachte achter een depot als bewaarcollectie is, dat het fungeert als ‘last resort’: het garandeert dat er op den duur (misschien wel na eeuwen) ten minste één exemplaar van een publicatie nog beschikbaar zal zijn. Het depot van nationale publicaties vervult dan ook vooral een archiveringsfunctie, omdat het op langere termijn gaat om het bewaren en toegankelijk houden van unieke documenten. Daarnaast dient de depotcollectie doorgaans als basis voor de nationale bibliografie. Is die functie nu ook nodig in het elektronische tijdperk? Ja zeker, en in versterkte mate. De mogelijkheid om elektronische media te bewaren is aanzienlijk geringer dan die van papier. Papier blijft in principe vele eeuwen leesbaar. De technische levensduur van elektronische media is meestal niet veel meer dan tien jaar en in het beste geval niet meer dan een eeuw.Ga naar voetnoot7 Daarnaast leidt de snelle verandering van de technologie ertoe dat, ook al vormt de kwaliteit van het medium geen probleem, de technische hulpmiddelen om een elektronisch document te lezen op den duur niet meer beschikbaar zijn. Door het gebruik van netwerken worden elektronische publicaties bovendien nauwelijks meer bewaard. Boeken en tijdschriften in gedrukte vorm worden in grotere oplagen geproduceerd en op tal van plaatsen in de wereld in bibliotheken opgenomen. De kans dat daar één exemplaar van bewaard blijft, is zelfs zonder depotbibliotheek nog aanzienlijk. Elektronische informatie wordt vaak slechts op een zeer beperkt aantal plaatsen opgeslagen, waardoor de kans dat de informatie op den duur verloren gaat veel groter is. Dit wordt verder in de hand gewerkt doordat elektronische informatie leidt | |||||||||||||||||
[pagina 198]
| |||||||||||||||||
tot een verschuiving van collectievorming naar toegankelijk maken. In plaats van op voorhand (gericht op toekomstig gebruik) te collectioneren, zullen bibliotheken in de toekomst informatie pas verwerven op het ogenblik dat er vraag naar is. In veel gevallen zal de bibliotheek het document ook niet zelf verwerven, maar de gebruiker toegang verlenen tot die ene plek op het netwerk waar de uitgever de publicatie heeft opgeslagen. Uitgevers zullen op den duur niet meer toestaan dat elektronische publicaties zonder meer in bibliotheken worden opgeslagen. Men wordt in die gevallen afhankelijk van één bron, beheerd door een uitgever die dikwijls geen commercieel belang zal hebben bij het langdurig bewaren en onderhouden van de informatie. In het algemeen is de termijn waarbinnen van elektronische informatie gebruik kan worden gemaakt, korter dan bij gedrukte informatie. Elektronische informatievoorziening is erop gericht om actuele informatie snel te verspreiden. Zulke informatie veroudert snel en de behoefte bij de producent (bijvoorbeeld de uitgever) om zulke informatie langdurig te bewaren is vaak gering. Zonder archivering door een depotbibliotheek gaat die informatie al op korte termijn voor eeuwig verloren.
De (wettelijke of vrijwillige) depotregelingen zijn in de meeste landen nog gebaseerd op gedrukte publicaties. Er is dus nog nauwelijks enige verplichting om elektronische publicaties te deponeren, en dat gebeurt dan ook niet. Zonder maatregelen zal, naarmate het elektronisch publiceren toeneemt, onze ‘intellectual record’ verdwijnen en zal de geschiedenis van het (elektronische) boek bij het begin van de eenentwintigste eeuw ophouden. Gelukkig is dit probleem onderkend en worden er wel degelijk maatregelen genomen. In een aantal landen is men al bezig om de depotwetgeving aan te passen. Daarnaast hebben de Europese nationale bibliotheken een aantal stappen ondernomen om de archivering van elektronische publicaties voor de toekomst veilig te stellen. Onder auspiciën van de Conference of European National Libraries (CENL) is een werkgroep CoBRA (Computerised Bibliographic Records Action) opgericht, met financiële ondersteuning van de Europese Commissie in het kader van het Libraries Programme. Deze CoBRA-groep, aanvankelijk opgericht ten behoeve van activiteiten op het gebied van nationale bibliografische gegevens, richt zich steeds meer op de problematiek van de elektronische archivering door middel van het wettelijk depot. Op verzoek van CoBRA heeft de Europese Commissie een studie laten uitvoeren door het NBBI Projectbureau voor Informatiemanagement. In deze zogenaamde ELDEP-studie zijn de belangrijkste aspecten van elektronische deponering onderzocht. Een opvallende conclusie is dat veel van de problemen rondom elektronische deponering en archivering zowel de bibliotheken als de uitgevers betreffen. Als vervolg op de studie wordt dan ook gewerkt aan het creëren van een overlegforum tussen nationale bibliotheken en uitgevers op Europees niveau. In de volgende paragrafen vatten we de resultaten van het onderzoek van Mackenzie Owen en Van de Walle samen.Ga naar voetnoot8 | |||||||||||||||||
[pagina 199]
| |||||||||||||||||
De huidige situatieWat is nu de huidige situatie met betrekking tot elektronisch publiceren en het archiveren van elektronische publicaties? De situatieanalyse uit het onderzoek leidt tot de volgende conclusies. Ten eerste vormen elektronische publicaties nog maar een klein deel van de totale output aan publicaties. Voor wetenschappelijke publicaties bedraagt het aandeel slechts 2%. De aandacht voor het archiveren ervan is dan ook betrekkelijk gering. Maar het elektronisch publiceren, en vooral het in elektronische vorm distribueren van publicaties, neemt snel toe. Daarom is meer aandacht nodig voor de problemen van het elektronisch archiveren. Ook is er tot nog toe onvoldoende theoretisch werk gedaan om tot goede criteria te komen voor het selecteren van publicaties die voor deponering in aanmerking komen. Dat is bij elektronische publicaties niet eenvoudig. Hoe moeten we het begrip ‘uitgever’ in een netwerkomgeving definiëren? Wanneer moeten we iets als een elektronische publicatie beschouwen? Hoe moeten we publicaties archiveren die voortdurend veranderen of waarvan de onderdelen over het wereldwijde netwerk verspreid zijn? Moeten we alles maar bewaren of zijn er inhoudelijke criteria aan te geven? Zonder antwoorden op zulke vragen is het bijzonder lastig om een wettelijk kader te scheppen en om criteria te ontwikkelen op basis waarvan depotbibliotheken kunnen bepalen wat wel en niet moet worden gearchiveerd. Omdat elektronische publicaties heel andere kenmerken vertonen dan gedrukte publicaties, zijn er nieuwe beschrijvingsregels nodig voor het creëren van bibliografische gegevens. Dergelijke regels zijn er nog onvoldoende en in ieder geval zijn ze onvoldoende gestandaardiseerd. Daar komt nog bij dat nationale bibliotheken de bibliografische beheersing steeds minder in eigen hand hebben, omdat elektronische publicaties steeds vaker bibliografische gegevens (in de vorm van ‘embedded metadata’) bevatten die al aan de bron (door de auteur en/of de uitgever) aan de publicatie worden toegekend. Zulke gegevens worden automatisch met de publicatie meegeleverd en zij zullen dan ook door gebruikers worden benut voor het maken van verwijzingen. Zonder goede standaards leidt dat tot tal van bibliografische complicaties. Bij nationale bibliotheken bestaat een neiging om de deponering van elektronische publicaties te beperken tot offline publicaties zoals die op diskette, cd-rom en cd-i. Dat ligt voor de hand, omdat deze fysiek nog het meest lijken op gedrukte publicaties en audiovisuele media, waarmee bibliotheken nu eenmaal de meeste ervaring hebben. Maar elektronisch publiceren gebeurt steeds meer online, via het netwerk. Het gaat om publicaties die vaak een dynamisch karakter hebben (periodieke updates zoals bij online databases, frequente wijzigingen in netwerkdocumenten) en sterk gedistribueerd zijn (zoals bij HTML-documenten op het World Wide Web met verwijzingen naar gerelateerde documenten op andere locaties). De omvang van het online publiceren zal in de toekomst vele malen groter worden dan die van het offline publiceren. Depotbibliotheken zullen oplossingen moeten zoeken voor de specifieke problemen die dat met zich brengt. Het elektronisch archiveren van publicaties veroorzaakt een aantal specifieke pro- | |||||||||||||||||
[pagina 200]
| |||||||||||||||||
blemen, waarvoor we nu nog geen oplossingen hebben. Hiertoe behoren problemen op het gebied van het conserveren (hoe ervoor te zorgen dat elektronische documenten eeuwenlang raadpleegbaar blijven), toegangsrechten (wie mag wanneer, op welke wijze en voor welke doeleinden elektronisch gedeponeerde publicaties raadplegen), kwaliteitscontrole en dergelijke. Op zulke terreinen is nog veel onderzoek nodig en dat dient minimaal op Europees niveau en op basis van samenwerking tussen bibliotheken en uitgevers te worden uitgevoerd. Het uitbreiden van de depotfunctie tot elektronische publicaties vereist een aanzienlijke capaciteitsuitbreiding bij de depotbibliotheek. Hierbij gaat het deels om een toename van het aantal medewerkers, maar vooral om het verwerven van nieuwe kennis en vaardigheden. Daarnaast is er een kostbare technische infrastructuur voor nodig. Alleen al voor Nederland schat men de benodigde opslagcapaciteit voor 1996 op 1.3 Terabyte, oplopend tot 4.4 Terabyte in het jaar 2000. Op langere termijn gaat het dus om enorme hoeveelheden informatie. Elektronisch archiveren is duur (en naar uit onderzoek blijkt ook zeker niet goedkoper dan papieren archivering) en er zullen dan ook aanzienlijke investeringen moeten worden gedaan om het ‘elektronisch geheugen’ voor het nageslacht in stand te houden. Ten slotte zijn wettelijke (of vrijwillige) depotregelingen noodzakelijk als basis om elektronische publicaties te kunnen verwerven. Maar gezien het toenemende aantal organisaties dat op de elektronische snelweg in de een of andere vorm als uitgever optreedt, is het niet reëel om te verwachten dat elektronische publicaties vanzelf zullen worden gedeponeerd. Depotbibliotheken zullen dus een veel pro-actievere houding moeten aannemen, zelf op zoek moeten gaan naar elektronische publicaties, en met de producenten daarvan concrete afspraken over deponering moeten maken. | |||||||||||||||||
Selectiecriteria voor elektronische archiveringEen van de conclusies van ons onderzoek is dat niet alles wat elektronisch wordt verspreid ook daadwerkelijk voor de eeuwigheid kan worden bewaard. Het ligt voor de hand te denken dat dat komt door de enorme hoeveelheid elektronische informatie die wordt geproduceerd en voor een deel is dat ook zo. Maar er is nog een reden. Veel elektronische informatie kan eenvoudigweg niet volledig worden bewaard. Van databases die van dag tot dag of zelfs continu worden gewijzigd en aangevuld, kunnen we niet alle ‘instances’ bewaren. In het algemeen geldt dat we van zulke ‘dynamische’ publicaties slechts enkele steekproeven kunnen bewaren. Er gaat dus onvermijdelijk informatie verloren. Een ander probleem is de ‘begrenzing’ van elektronische publicaties. Een gedrukte publicatie is een herkenbaar fysiek object. Dat is een elektronische publicatie niet per definitie. Hypertextdocumenten bestaan uit stukken informatie, die met andere hypertextdocumenten zijn gekoppeld, die ook weer koppelingen hebben, enzovoort. Waar houdt het ene document op en begint het andere? Volledige archivering zou bijvoor- | |||||||||||||||||
[pagina 201]
| |||||||||||||||||
beeld inhouden dat we het World Wide Web volledig moeten opslaan, in alle versies die het ooit in de loop van de tijd heeft gekend. Dat kan natuurlijk nooit de bedoeling zijn. Omdat het systeem van deponering per land anders is ingericht, ontstaat er nog een extra probleem. Als delen van een document in verschillende landen worden geproduceerd en ook op systemen in verschillende landen beschikbaar worden gesteld, is de ‘nationaliteit’ van de publicatie niet eenduidig en valt moeilijk vast te stellen bij welke bibliotheek er moet worden gedeponeerd, casu quo welke bibliotheek voor het archiveren verantwoordelijk is. Dynamische - zeer frequent veranderde - publicaties, hyperlinks tussen publicaties en geografische verspreiding nemen steeds meer toe. Gekoppeld aan de enorme hoeveelheden, betekent dit alles dat we ons erbij zullen moeten neerleggen dat niet alle informatie voor het nageslacht kan worden bewaard. De vluchtigheid van onze westerse samenleving aan het einde van de twintigste eeuw komt misschien niet duidelijker tot uitdrukking dan in het feit dat we een ‘intellectual record’ creëren dat de geschiedenis niet kan trotseren. Als we niet alles kunnen bewaren, zullen we moeten selecteren en daarvoor hebben we selectiecriteria nodig. Als eerste aanzet daartoe hebben we in onze studie voor nationale depothibliotheken een aantal voorlopige en globale selectieregels gedefinieerd:
| |||||||||||||||||
[pagina 202]
| |||||||||||||||||
| |||||||||||||||||
Opslag en beschikbaarstelling van elektronische publicatiesBij het bewaren en conserveren van elektronische publicaties is het nodig om onderscheid te maken tussen online publicaties en offline publicaties. Bij offline publicaties hebben we te maken met fysieke objecten (bijvoorbeeld een diskette of cd-schijf), die we als object kunnen bewaren. Maar zoals we hierboven al aangaven, is de levensduur van elektronische media beperkt. Om die reden - en ook om redenen van efficiency - zal men er al snel toe over moeten gaan om de informatie-inhoud op andere media op te slaan. Dat lijkt voor de hand te liggen, maar het levert twee onverwachte problemen op. Het fysieke object zelf bevat immers ook informatie: mededelingen die op het medium zijn gedrukt, informatie op de verpakking, en allerlei begeleidend materiaal (bijsluiters, handleidingen en dergelijke). Naast elektronische archivering is dus ook fysieke archivering noodzakelijk om alle informatie rondom de publicatie te bewaren. Een tweede probleem is de keuze tussen het bewaren van de ‘intellectual content’ van een publicatie en het bewaren van de publicatie als ‘artefact’. Bibliothecarissen kiezen voor het eerste, maar veel uitgevers stellen juist prijs op het tweede en zijn | |||||||||||||||||
[pagina 203]
| |||||||||||||||||
huiverig voor iedere verandering (zelfs conversie naar een ander medium) die men in hun producten aanbrengt. Het is duidelijk dat hier nog veel discussie over moet worden gevoerd tussen bibliothecarissen en uitgevers en tevens dat de depotbibliotheek verschillende garanties zal moeten geven om de integriteit van de gedeponeerde publicaties te waarborgen. Bij online publicaties is er geen fysiek object en spelen deze problemen dus niet. Niettemin is er bij uitgevers weerstand tegen deponering, omdat men al snel de omgeving waarbinnen een publicatie bij de uitgever toegankelijk is, als onderdeel van de publicatie ziet. Deze omgeving kan niet zonder meer bij de depotbibliotheek worden gereproduceerd: de publicatie staat daar los van haar oorspronkelijke omgeving en is in die zin dus in feite gewijzigd. Wat betreft het conserveren - voor zeer lange tijd bewaren - van elektronische publicaties, krijgen we met een aantal problemen te maken waarvoor we eigenlijk nog geen oplossingen kennen. Het probleem komt erop neer dat elektronische publicaties in hun oorspronkelijke vorm op langere termijn niet meer toegankelijk zijn. Daarvoor zijn er een paar redenen, die hierboven al deels zijn aangestipt:
Vooral de mate waarin media bewaard kunnen worden en veranderingen in de gebruikte informatietechnologie vormen op langere termijn een punt van zorg. Om deze problemen te ondervangen, zijn verschillende strategieën mogelijk:
| |||||||||||||||||
[pagina 204]
| |||||||||||||||||
Op de langere duur vormen migratie en emulatie van de technologische omgeving de enige opties voor het toegankelijk houden van gearchiveerde elektronische publicaties. Beide strategieën zijn kostbaar en dat is dan ook de reden waarom elektronische archivering, ondanks de relatief lage kosten van elektronische opslag, naar alle waarschijnlijkheid aanzienlijk duurder zal blijken dan de archivering van gedrukte publicaties. Voor wat betreft de beschikbaarstelling van gedeponeerde elektronische publicaties zijn er ogenschijnlijk geen problemen, op voorwaarde dat het conserveringsprobleem door middel van conversie, migratie en emulatie goed wordt opgelost. De gedeponeerde publicaties kunnen immers gemakkelijk via het netwerk aan gebruikers ter beschikking worden gesteld. De depotbibliotheek kan op basis van haar elektronische collectie nieuwe diensten gaan aanbieden. Helaas ligt de zaak niet zo eenvoudig. Dat komt omdat uitgevers er, begrijpelijkerwijs, bezwaar tegen maken dat gedeponeerde publicaties zonder meer door de depotbibliotheek aan haar gebruikers ter beschikking worden gesteld. Dan zou men immers de depotbibliotheek gaan raadplegen, in plaats van zelf de publicatie te kopen of tegen betaling bij de uitgever te raadplegen. Uitgevers stellen dus voorwaarden aan de wijze waarop de depotbibliotheek haar collectie voor gebruikers openstelt. Momenteel is hierover in het algemeen nog volstrekt geen overeenstemming. Wel wordt gepraat over een aantal modellen op basis waarvan dat zou kunnen gebeuren:
| |||||||||||||||||
[pagina 205]
| |||||||||||||||||
Het is begrijpelijk dat bibliothecarissen hun gebruikers toegang willen verlenen tot gedeponeerd materiaal, en daartoe voor elektronisch materiaal het liefst gebruik willen maken van de mogelijkheden van de informatietechnologie, met name het netwerk. Dergelijke dienstverlening kan - als het tegen betaling gebeurt - zelfs noodzakelijk zijn om het elektronische depot mede te financieren. Toch dient men daarbij de kernfunctie van het depot - het fungeren als ‘last resort’ - niet uit het oog verliezen. Het gaat er vooral om met uitgevers afspraken te maken, die waarborgen dat gedeponeerde publicaties vrijelijk toegankelijk worden via de depotbibliotheek op het moment dat andere bronnen niet meer beschikbaar zijn. In de praktijk zou voor dit laatste als criterium moeten gelden dat de uitgever (of een opvolgende rechthebbende) de publicatie niet meer beschikbaar stelt, casu quo dat het auteursrecht is vervallen. | |||||||||||||||||
Deponering van elektronische publicaties in NederlandIn Nederland beheert de Koninklijke Bibliotheek sinds 1974 een Depot van Nederlandse Publikaties. Hierin worden, op basis van een vrijwillige overeenkomst met de uitgevers, de meeste Nederlandse gedrukte publicaties opgenomen. Hiermee neemt Nederland overigens een uitzonderingspositie in binnen Europa: in de meeste andere landen is het depot gebaseerd op een wettelijke regeling, en worden de nationale publicaties al veel langer - vaak al eeuwen - door de nationale bibliotheek verzameld.
Ondanks het ontbreken van een wettelijke regeling loopt de Koninklijke Bibliotheek in veel opzichten voorop als het gaat om het archiveren van elektronische publicaties. De Koninklijke Bibliotheek is zeer actief binnen de CoBRA-groep en is ook nauw betrokken geweest bij het ELDEP-onderzoek. Belangrijker nog dan deze internationale activiteiten is hetgeen in Nederland gebeurt. In 1994 heeft de Koninklijke Bibliotheek een begin gemaakt met het opzetten van een Depot van Nederlandse Elektronische Publikaties (DNEP). De doelstellingen (verzamelen, bewaren, ontsluiten beschrijven van elektronische publicaties) en ook de logistieke opzet sluiten zo goed mogelijk aan bij die van het reeds bestaande Depot voor Nederlandse Publikaties. Daarnaast wordt binnen het DNEP vooral aandacht besteed aan het bewaken van de integriteit van elektronische publicaties. Inmiddels beginnen concrete afspraken tot stand te komen tussen de Koninklijke Bibliotheek en Nederlandse uitgevers over de deponering van elektronisch materiaal. Zulke afspraken zijn niet alleen nodig omdat de bestaande afspraken alleen betrekking hebben op gedrukte publicaties, maar ook omdat bij elektronische publicaties immers nog tal van andere zaken moeten worden geregeld met betrekking tot toelevering, conservering, toegankelijkheid en dergelijke. De algemene, educatieve en wetenschappelijke uitgevers die zijn aangesloten bij het Algemeen Uitgeversverbond hebben zich | |||||||||||||||||
[pagina 206]
| |||||||||||||||||
bereid verklaard van alle in Nederland geproduceerde elektronische offline publicaties een exemplaar aan het DNEP af te staan. Hiermee is in ieder geval geregeld dat de Nederlandse cd-rom's en cd-i's voor de toekomst bewaard blijven. Een grotere uitdaging vormt natuurlijk de archivering van publicaties die in elektronische vorm via het netwerk (dat wil in de praktijk zeggen: het Internet) worden verspreid. Een eerste stap in deze richting is nu gezet doordat een tweetal grote wetenschappelijke uitgevers (Elsevier Science en Kluwer Academic Publishers) zich bereid heeft getoond om elektronisch gedistribueerde tijdschriften bij de Koninklijke Bibliotheek te deponeren. Als experiment zullen deze gedeponeerde tijdschriften niet alleen ter plaatse in de Koninklijke Bibliotheek te raadplegen zijn, maar ook voor een beperkte groep gebruikers via het netwerk. Met al deze activiteiten heeft de Koninklijke Bibliotheek in ieder geval de eerste stappen gezet op weg naar het herontwerpen van de archivering van ons cultureel erfgoed en naar de inrichting van een elektronisch archief waarin toekomstige generaties nog iets zullen kunnen terugvinden van onze elektronische cultuur. |
|