| |
| |
| |
Mike Kestemont
Het gewicht van de auteur Reflecties over auteursattributie in samenleving en wetenschap
In juni 2006 pakte het weekblad Knack uit met wat op het eerste gezicht een primeur van formaat leek: journalist Koen Meulenaere beschuldigde Freya Van den Bossche er openlijk van dat zij haar afstudeerscriptie niet zelf geschreven zou hebben. De toenmalige vicepremier en minister van Begroting had haar diploma communicatiewetenschappen in 1999 behaald op basis van de scriptie Waar eindigt onthullingsjournalistiek en begint sensatiejournalistiek? Meulenaere - overigens publiekelijk gesteund door de redactie van Knack en allicht ook stiekem geïnspireerd door de titel van de scriptie - was er rotsvast van overtuigd geraakt dat Van den Bossche niet zelf de pen had gevoerd in het bewuste werkstuk. Tastbaar bewijs voor die aantijgingen werden niet vrijgegeven maar de geruchtenmolen wilde dat Frank De Moor, voormalig werknemer van Knack en vriend des huizes bij de Van den Bossches, een ‘meer dan ondersteunende rol’ gespeeld had in de totstandkoming van de scriptie. Het weekblad blaakte van zelfvertrouwen en besloot tot een heuse volksraadpleging over te gaan: Van den Bossches scriptie werd - als ware het een Watergate-tape - volledig ingescand en online geplaatst zodat de lezers van Knack het recht in eigen handen konden nemen. ‘Oordeel nu zelf of een 22-jarige linkse studente, bovendien net moeder geworden en dus met andere dan academische besognes aan haar hoofd, zelf de tekst heeft geschreven die u leest’, luidde het begeleidende commentaar. De volksraadpleging miste zijn effect niet want de Freya-tapes hielden de geschreven pers verscheidene dagen in de ban. De ‘welles-nie- | |
| |
tes’-storm ging uiteindelijk pas liggen toen Van den Bossche Knack voor de rechter daagde voor eerroof en het tijdschrift de thesis offline haalde.
Het is intussen weer even geleden maar ik herinner me nog goed dat ik de berichtgeving rond Van den Bossches thesis als laatstejaarsstudent taal- en letterkunde met argusogen heb gevolgd, niet het minst omdat ik op dat moment zelf de laatste hand aan een afstudeerscriptie legde. Ik worstelde echter vooral met een aantal vragen die me tot vandaag bezighouden. Ten eerste, welk belang moet men eigenlijk hechten aan auteurschap? Kan het belang van het auteurschap van een tekst in bepaalde gevallen, zoals dat van Van den Bossche, prevaleren over het belang van de tekst zelf? Ten tweede, mocht het zo zijn dat iedere tekst onlosmakelijk verbonden is met zijn auteur, moet het dan in principe niet mogelijk zijn om de auteur van iedere tekst te herkennen, louter op basis van die tekst? Was dat immers niet wat Knack met het referendum voor mogelijk hield? Hieronder wil ik deze vragen essayistisch bespreken, bij wijze van reflectie over auteursattributie in de wetenschap en de samenleving van vandaag.
| |
Bye bye Barthes
Welk belang moest men anno 2006 hechten aan het auteurschap van een tekst? Niet veel, volgens Michel Foucault, die in zijn invloedrijke essay Qu'est-ce qu'un auteur? (1969) niet toevallig zonder bronverwijzing Samuel Beckett citeerde: ‘Qu'importe qui parle, quelqu'un a dit qu'importe qui parle’. Of, wat maakt het uit wie spreekt? Ook tijdens mijn studie hadden eminente hoogleraren mij tot alle prijs trachten te overtuigen dat de vraag naar het auteurschap van literaire teksten voorbijgestreefd was. Wie de auteur van een tekst was, maakte niet uit want de literaire tekst was een autonoom kunstwerk dat los van tijd en ruimte - en zeker de auteur - bestudeerd moest worden. Natuurlijk was een tekst wel door iemand geschreven, maar het was veiliger aan te nemen dat de tekst door wie dan ook kon zijn geschreven. Tijdens mijn studiejaren was het dan ook bon ton - in zowel aula als kroeg - te declameren dat de auteur dood was. Dit alles natuurlijk in navolging van de hele roedel Franse denkers die in hun filosofische geschriften hadden gefulmineerd tegen de obsessie voor het individuele auteursgenie, die de literatuur(wetenschap) al sedert de romantiek als een erfelijke kwaal met zich meezeulde. In een uiterst invloedrijk essay in Manteia (1968) had Roland Barthes dé auteur dood verklaard. In poëtische bewoordingen beargumenteerde hij dat eens een auteur een tekst aan een tekst-drager had toevertrouwd, de auteur die tekst ook onvermijdelijk had losgelaten. De tekst werd vanaf dat moment losgekoppeld van elke intentie die de auteur ermee gehad kon hebben en ging een eigen leven
| |
| |
leiden. Amper een jaar later zou Michel Foucault zijn landgenoot in die opvatting bijtreden en vele anderen volgden in hun voetspoor. De overlijdensakte van de auteur werkte duidelijk bevrijdend: de laatste decennia van de vorige eeuw ademden een vrolijk dédain voor de romantische notie van de auteur als ontzagwekkend figuur. De tekst en vooral de lezer traden daarentegen uit de schaduw. De vrijheid van interpretatie kreeg opnieuw de ademruimte die zij zo lang had moeten missen.
Maar wat dan met Van den Bossche, dacht ik verward. Als auteurschap niet langer een privilege was dat men kon opeisen, moest het concept ‘plagiaat’ toch ook onverwijld worden opgegeven? De inhoud van Van den Bossches thesis zou in dat opzicht toch moeten primeren op het auteurschap ervan. De polemiek die resulteerde uit de publicatie van de Freya-tapes maakte niettemin duidelijk dat internettend Vlaanderen destijds geen boodschap had aan het auteursrelativisme dat in Academia gepredikt werd. De toestroom van emotionele reacties in elektronische media - waarbij overigens meestal partij gekozen werd voor de beschuldigde - maakte duidelijk dat auteurschap in de ogen van de communis opinio geen oppervlakkig nevenproduct of vernis van schrijfarbeid was of een intellectuele verantwoordelijkheid die men lichtelijk kon af- dan wel opnemen. Auteurschap lijkt opnieuw een gevoelig onderwerp dat iedereen aanbelangt, ook in de letterkunde. Thomas Vaessens, hoogleraar Nederlandse letterkunde in Amsterdam, kwam bijvoorbeeld recent naar buiten met een ophefmakende studie, De revanche van de roman. Literatuur, autoriteit en engagement. Daarin maakte hij korte metten met de visie op het kunstwerk als autonoom gegeven en bezorgde hij een vurig pleidooi om de roman niet langer te isoleren van samenleving én auteur. Dat een neerlandistisch werk voor de verandering ook buiten de universiteitsbibliotheken een breed publiek vond, spreekt boekdelen.
Vaessens' pamflet lijkt daarmee helemaal van deze ‘laat-postmodernistische’ tijd, waarin auteurschap in verschillende gedaantes opnieuw de gemoederen bezighoudt. Andere recente symptomen van die toestand behelzen bijvoorbeeld het hoog opflakkerende debat rond het illegaal downloaden van muziek - ‘piraterij is een misdrijf’ - of de scandalitis rond Martin Stone, een Britse hoogleraar in Leuven die zijn hele bibliografie al plagiërend zou hebben bijeengepuzzeld. In deze tijd van complexloos copy-pasten waarin informatie en gedachtegoed stuurloos over het internet uitzaaien, groeit begrijpelijkerwijs de bekommernis om de oorsprong, casu quo het auteurschap van teksten. Bye bye Barthes, zo lijkt de teneur, ook volgens Harold Love, auteur van de indrukwekkende monografie Attributing Authorship: An Introduction (2002), die de toestand niet zonder ironische ondertoon als volgt kenschetste:
| |
| |
Yet this erasure of the author has remained paradoxical, not least because it was powered by the creativity of a number of profoundly individualistic thinkers and writers. There was never any doubt as to where royalty cheques for Barthes, Foucault, Lacan, Kristeva and Derrida ought to be sent: they reasserted heroic authorship even in their questioning it. (Love, 2002, blz. 7)
Zelfs in de exacte wetenschappen is het debat trouwens verre van afwezig. Tegenwoordig worden ontdekkingen in deze disciplines meestal gerapporteerd door een opvallend groot aantal samenwerkende auteurs. Dit heet een resultaat te zijn van de voortschrijdende Big Science, waarbij wetenschappelijke experimenten de steeds meer omvangrijke samenwerking vereisen van een almaar groter aantal wetenschappers met elk een eigen specialisatie en onvervangbare inbreng. In 2008 publiceerde het Journal for Instrumentation bijvoorbeeld een artikel over de Large Hadron Collider, de 27 kilometer lange Frans-Zwitserse deeltjesversneller waarover in de media veel wordt bericht. Het resultaat van dit tot de verbeelding sprekende onderzoeksproject werd gepubliceerd op naam van zo maar even 2926 auteurs. Dat deze auteurs niet allemaal een even grote inbreng hebben gehad in de tekst zelf, is begrijpelijk. Wetenschappelijk auteurschap kan in die zin ook niet té eng worden opgevat. Maar ook in de exacte wetenschappen nodigt de verregaande betekenisverglijding van het concept ‘auteurschap’ uit tot een zekere melancholie. Pregnant is bijvoorbeeld volgend citaat uit een opiniestuk in het gerenommeerde vakblad Nature (1997):
In one respect at least, artists are to be envied by scientists. Artists may lack the benefit of science's capacity for objective certainty and the immediate recognition of worth that usually comes with it; they may lack the technological relevance that stimulates large investment; and they tend to lack the relative security of an employment contract. But they can generally take for granted what for a scientist is an increasingly rare privilege: being the sole originator of his or her creation.
Gek genoeg - of toch niet? - vermeldt de publicatie geen expliciete auteursnaam.
| |
‘Oordeel nu zelf’
Het schandaal rond de Freya-tapes heeft mij echter nog om een andere reden erg geboeid. Vreemd genoeg was de Knack-redactie erg zeker van haar zaak. Mogelijk had zij off the record contextuele informatie in haar bezit die De Moors coauteurschap bewees, maar die schijnt niet te zijn
| |
| |
vrijgegeven. Het weekblad ging er duidelijk van uit dat het onechte auteurschap ook uit de tekst zelf zou blijken, vandaar immers de publicatie van het bezwarende document. Knack had er alle vertrouwen in - ‘oordeel nu zelf’ - dat wie de tekst las en dus geen ander bezwarend bewijsmateriaal ter beschikking had, eveneens tot de conclusie zou moeten komen dat Freya Van den Bossche niet de (enige) auteur kon zijn geweest van de bewuste scriptie. Dat is toch opmerkelijk: is het inderdaad zo dat de gemiddelde Knacklezer - die waarschijnlijk niet thuis is in het onderwerp van deze scriptie - zich een betrouwbaar beeld kon vormen van het auteurschap, louter op basis van de inhoud en stijl? Dat zou toch verwonderen, zeker bij gebrek aan adequaat vergelijkingsmateriaal voor de ad hoe in het leven geroepen ‘stijldetectives’. Het weekblad heeft zich immers niet eens de moeite getroost om andere, enigszins vergelijkbare schrijfsels van de ‘verdachte’ te publiceren. Bovendien had ook het oeuvre van Frank De Moor buitengewoon interessant vergelijkingsmateriaal geboden. In dat opzicht verbaast het nog meer hoeveel reacties de Freya-tapes hebben losgeweekt, want wie kon onder deze omstandigheden eigenlijk gefundeerde uitspraken doen over de zaak?
Het toeschrijven van teksten aan auteurs is een probleem met een lange geschiedenis in de filologie maar kent sinds enkele jaren een belangrijke heropleving. Die hernieuwde interesse komt vooral uit computationele hoek en lijkt in de eerste plaats samen te hangen met het groeiend aantal beschikbare elektronische teksten van auteurs. Momenteel zijn tekst- en taalwetenschappers binnen de ‘stylometrie’ - de kwantitatieve stijlstudie - druk bezig met het verkennen van geavanceerde methodes, bijvoorbeeld ontleend aan de Artificiële Intelligentie, die tekstwetenschappers toelaten om aan automatische auteursherkenning te doen. In de rest van deze bijdrage zou ik kort de stand van zaken in dit studiedomein willen voorstellen. In het licht van het maatschappelijke belang dat momenteel aan auteurschap gehecht wordt, is het waarschijnlijk geen slecht idee om de recente wetenschappelijke inzichten in dit vakgebied op een rijtje te zetten.
| |
De mens zelf
De stijlleer gaat wat auteurschap betreft, soms nogal sterk uit van een individualistisch standpunt, of, zoals de graaf van Buffon het al in 1792 verwoordde: Le style c'est l'homme même. Met enig chargeren is het uitgangspunt van veel stylometristen dat wanneer iemand een tekst schrijft, diens schrijfstijl zich in die tekst noodzakelijk manifesteert als een styloom, een verzameling nauwkeurig te benoemen stijlkenmerken die uniek zijn voor een auteur, en onderscheiden kan worden van het styloom van welke andere auteur dan ook. Vooraf dient gezegd dat deze
| |
| |
basisaanname, het bestaan van ‘auteurs-DNA’, momenteel slechts een werkhypothese is en verre van bewezen.
Op stijl gebaseerde auteursherkenning heeft zich in het verleden vooral toegespitst op ‘opvallende’ kenmerken die typerend zouden zijn voor de schrijfstijl van een auteur. Men moet daarbij denken aan in het oog springende stop- of voorkeurswoorden (bijvoorbeeld zeldzame naamwoorden of ongebruikelijke voegwoorden). Veel onderzoekers hebben zich daarom bezig gehouden met het opstellen van lijstjes met dergelijke ‘auteurshapaxen’. Die lijstjes konden dan helpen bij het toeschrijven van anonieme teksten: als een anonieme tekst opvallend veel treffers had in het voorkeursjargon van een bepaalde auteur, stond nog weinig een toeschrijving in de weg. Het voornaamste voordeel van deze toeschrijvingstechniek was dat zij gemakkelijk door een mens - zonder computer - kon worden toegepast. Een getrainde lezer kon zich zo immers relatief eenvoudig een oordeel vormen over welke stijlkenmerken eigen leken aan de schrijfstijl van een auteur. In de laatste decennia is die traditionele aanpak echter zwaar onder vuur komen te liggen. Ten eerste bleek de selectie van dergelijke voorkeurswoorden een erg subjectieve aangelegenheid die zelden met concrete cijfers gestaafd werd. Ten tweede bleken dergelijke woorden vaak een erg beperkte slagkracht te hebben: als zij voorkwamen in een anonieme tekst kon dat sterk pleiten voor een bepaalde attributie, maar als de voorkeurswoorden niet voorkwamen in een tekst was het vaak onzeker of dit een toeschrijving wel volledig kon uitsluiten. Een laatste bezwaar was zo mogelijk nog fundamenteler: de mots préférés van auteurs zijn per definitie relatief ‘opvallend’, niet alleen voor tekstwetenschappers maar ook voor mensen met minder eervolle bedoelingen. Als men iemands stijl wil kopiëren, zullen het waarschijnlijk in eerste instantie precies deze woorden zijn die gretig geïmiteerd worden. Denk maar aan bombrieven of zelfmoordbrieven die bestudeerd worden
in de ‘forensische linguïstiek’: als een dader zichzelf buiten verdenking wil stellen, kan die in dergelijke teksten gemakkelijk de stijl van iemand anders kopiëren, zeker wat deze in het oog springende woorden betreft. Voorkeurswoorden zijn erg gevoelig voor imitatie - denk ook aan literaire schoolvorming - en daarom een onbetrouwbare basis voor het objectief bestuderen van de eigen stijl van een auteur.
| |
Wie het kleine niet eert
In 1964 leverden twee Amerikaanse statistici, Mosteller en Wallace, een pioniersstudie. Zij bogen zich over een exemplarische casus in de stylometrie: het auteurschap van de Federalist Papers, een verzameling eind-achttiende-eeuwse geschriften die pleitten voor de bekrachtiging
| |
| |
van de Amerikaanse grondwet. Ten tijde van de publicatie werd het werkelijke auteurschap van de pamfletten - alle geschreven onder het pseudoniem ‘Publius’ - angstvallig geheim gehouden, maar er ontstonden al gauw gefundeerde vermoedens over het kwartet pamflettisten dat de Papers naar alle waarschijnlijkheid, zij het postuum, op zijn conto mag plaatsen. Mosteller en Wallace benaderen de zaak in 1964 vanuit een statistisch perspectief dat revolutionair is gebleken: in plaats van de gebruikelijke werkwijze te volgen, met voorkeurswoorden, gebruikten zij de frequenties van functiewoorden. Functiewoorden zijn een linguïstische aanduiding voor die kleine groep woorden in een taal die louter functioneel zijn en geen of weinig betekenis in zich dragen. Het gaat dan om lidwoorden, voorzetsels of voegwoorden. Sinds het onderzoek van Mosteller en Wallace is men ervan overtuigd geraakt dat veeleer deze kleine, op het eerste gezicht onbeduidende woordjes interessant zijn voor auteursonderzoek. Voor die opvatting bestaan namelijk goede argumenten.
Ten eerste zijn functiewoorden frequent in taal: ze duiken in grote mate op in alle teksten want wie kan een tekst schrijven zonder lidwoorden of voorzetsels? Dat is interessant vanuit een kwantitatief perspectief: er zijn veel ‘observaties’, hetgeen leidt tot een relatief grote betrouwbaarheid in de metingen. Een bekend adagium luidt dan ook: There's no data like more data. Een ander voordeel hangt samen met de hoge frequentie van deze woorden, namelijk hun goede spreiding over de tekst. Dat wil zeggen dat ze frequent zijn, ongeacht de tekstsoort waarin ze opduiken of het onderwerp: of een tekst nu gaat over inflatie in Zuidoost-Azië of over hedendaags ballet in de Balkan, er zullen hoe dan ook veel functiewoorden in gebruikt worden. Dat biedt perspectieven voor het beschrijven van een eigen stijl, over de grenzen van genres en tekstsoorten heen. In het algemeen is men enthousiast over de inzetbaarheid van functiewoorden in auteursonderzoek, omdat deze woorden doorgaans niet bewust gecontroleerd (kunnen) worden door auteurs: wie houdt bij het schrijven van een tekst immers in het oog wat het relatieve aandeel van een bepaald voorzetsel in zijn tekst is? Om die reden kan men inderdaad vermoeden dat deze onopvallende functiewoorden veel minder kwetsbaar zijn voor bijvoorbeeld al dan niet kwaadwillige imitatie. Functiewoorden zouden daarom erg robuuste indicaties kunnen bevatten voor het auteurschap van teksten.
Hoewel dit in de letteren een relatief recent inzicht is, is gebleken dat deze gedachte een veel oudere tegenhanger kent in de kunstgeschiedenis. Het is algemeen bekend dat ook veel schilderwerken anoniem zijn overgeleverd: verschillende meesters uit de Renaissanceschilderkunst hadden bijvoorbeeld nog niet de gewoonte om hun werken met veel poeha van een handtekening te voorzien. Veel van hun schilderijen zijn
| |
| |
dan ook anoniem overgeleverd, hetgeen heeft geleid tot bloeiend attributie-onderzoek in de kunstgeschiedenis. Een goed voorbeeld is de indrukwekkende tentoonstelling over de Vlaamse primitief Rogier van der Weyden De passie van de meester in het Leuvense Museum M (2009). Een magistrale collectie werken was er zo kundig en coherent voorgesteld dat men makkelijk kon vergeten dat er eigenlijk nog geen handvol werken met zekerheid aan de meester zelf zijn toegeschreven. Giovanni Morelli (1816-1891) was een van de eerste kunsthistorici die opmerkte dat de attributie van schilderwerken niet kon gebeuren aan de hand van de inhoud ervan, zoals tot dan toe de gewoonte was geweest. Morelli - overigens niet toevallig als ‘exact’ wetenschapper geschoold - hechtte geen belang aan de kleur van Maria's mantel, het aantal toeschouwers dat was afgebeeld of welke Bijbelse scène een schilderij uitbeeldde. Deze ‘inhoudelijke’ aspecten waren volgens de Italiaan veel te sterk onderhevig aan modeverschijnselen, de smaak van een mecenas of het atelier waar een schilder zijn opleiding had genoten. Hij baseerde zijn attributies op minder opvallende, meer ‘functionele’ aspecten van een schilderij zoals de afbeelding van handen, oren en voeten. Dergelijke elementen - de ‘functiewoorden’ van de schilderkunst - kwamen natuurlijk vaak voor op schilderijen, ongeacht hun ‘inhoud’ en maakten ook hier attributie mogelijk over de grenzen van genres en inhoud heen. Bovendien waren kunstenaars ongetwijfeld weinig bewust bezig met de weergave van deze elementen maar waren ze anderzijds wel verplicht om ze te gebruiken - probeer maar eens een kruisigingstafereel zonder oren of handen weer te geven. Wat betreft auteursherkenning, blijkt er zo een verrassende gelijkenis te bestaan tussen Michelangelo's oren en Shakespeares voorzetsels.
Toch vindt de gedachte dat functiewoorden zo belangrijk zijn in het beschrijven van een persoonlijke stijl soms maar moeizaam ingang bij traditionele filologen. Het is begrijpelijk dat onderzoekers die hun hele leven hebben gewijd aan de studie van het oeuvre van Shakespeare of Jane Austen moeilijk vrede kunnen nemen met de gedachte dat het eigene van Shakespeare nog het best valt te beschrijven aan de hand van de relatieve frequentie van de voorzetsels in zijn werk. Mensen hebben de neiging om auteurs en hun werk net op meer waarderende, ‘kwalitatieve’ manieren te evalueren en zullen betwijfelen of dergelijke op het eerste gezicht zinloze ‘kwantificeringen’ niet veeleer een verarming dan een verrijking van de literatuurstudie inhouden. In die context is het interessant een voorbeeld uit de hedendaagse rechtspraktijk aan te halen. Als een getuige in de rechtszaal de verdachte van een moord moet ‘karakteriseren’, kan dat bijvoorbeeld aan de hand van abstracte eigenschappen: de verdachte kan dan bijvoorbeeld ‘extravert’, ‘hulpvaardig’ of ‘gedienstig’ blijken. Dergelijke ‘kwalitatieve’ argumenten zijn natuur- | |
| |
lijk van het grootste belang, want welke rechter zou een verlegen, hulpvaardig en immer beleefd meisje durven veroordelen voor een gruwelijke steekpartij? Maar wat als op de plaats van de misdaad een bloederige haarlok is aangetroffen waarvan het DNA een perfecte overeenkomst vertoont met dat van de frêle verschijning op de beschuldigdenbank? Op dat moment zal dergelijk droog ‘kwantitatief’ bewijs naar alle waarschijnlijkheid belangwekkender worden bevonden dan de meegaande ‘kwalitatieve’ karakterisering van de verdachte. Hoewel de stylometrie natuurlijk veel minder ver staat dan het vergevorderde DNA-onderzoek moeten we ons toch op zijn minst openstellen voor de mogelijkheid dat het kwantitatief onderzoek naar
schijnbaar onbelangrijke taalelementen het traditioneel kwalitatief onderzoek naar auteursidentiteit wel eens zou kunnen overvleugelen. Toch zal dat laatste nog niet voor morgen zijn.
In een recent overzichtsartikel (2009) stelt de Griek Efstathios Stamatatos dat het onderzoek naar stijlgebaseerde auteursherkenning in de laatste jaren belangrijke vooruitgangen heeft geboekt. Momenteel wordt bijvoorbeeld vrij algemeen geaccepteerd dat men in een aantal specifieke situaties inderdaad op betrouwbare wijze aan automatische auteursherkenning kan doen. Een voorbeeld: stel dat men binnen eenzelfde genre een aantal teksten van auteur A ter beschikking heeft en een gelijkaardige hoeveelheid tekst van auteur B, dan is men inderdaad in staat om van een ongeziene tekst binnen hetzelfde genre met grote nauwkeurigheid vast te stellen of die door auteur A dan wel B is geschreven. Deze toeschrijving gebeurt doorgaans op basis van geavanceerde statistische technieken uit het domein van de ‘tekstclassificatie’. Deze worden overigens ook voor een aantal andere praktische problemen gebruikt, zoals de automatische spam filtering van e-mailberichten - met wisselend succes, zoals u zelf ongetwijfeld uit ervaring weet. De betrouwbaarheid van deze toeschrijvingstechnieken wordt vaak geëvalueerd door het ‘simuleren’ van de anonimiteit van teksten: we schotelen de computer bijvoorbeeld een aantal ongeziene teksten voor waarvan wij zeker zijn dat ze door auteur A of B zijn geschreven en vervolgens gaan we na of de machine de correcte auteurs van de teksten aanwijst.
Dat dit reeds kan, is op zich veelbelovend. Maar mensen als Stamatatos merken terecht op dat op deze toeschrijvingstechnieken nog enkele beperkingen rusten. Een eerste belangrijke beperking is dat totnogtoe weinig onderzoek is gebeurd naar het ‘verwerpen’ van auteurschap. In het voorbeeld in de vorige paragraaf gaan we er bijvoorbeeld van uit dat de ongeziene tekst wel degelijk door auteur A of B is geschreven. Maar er zijn heel wat situaties - denk maar aan een bombrief - waarin we principieel niet zeker zijn of de juiste auteur zich wel degelijk tussen de vergeleken auteurs bevindt. Bovendien beperkten we ons
| |
| |
in het voorbeeld hierboven tot een keuze tussen twee auteurs: verschillende studies - onder meer aan de Universiteit Antwerpen door Kim Luyckx en Walter Daelemans - tonen aan dat de resultaten van auteursherkenning slechter worden als het aantal kandidaat-auteurs in een experiment wordt opgevoerd. Een ander probleem heeft te maken met genrebeperkingen: zelfs als men werkt met betrekkelijk inhoudsonafhankelijke functiewoorden vertonen auteurs voor zover we weten nog sterk de neiging om hun schrijfstijl aan te passen aan onderwerp of tekstsoort. In het geval van Freya Van den Bossche zouden we zo idealiter niet alleen willen beschikken over andere teksten die zij (zeker) heeft geschreven maar liefst ook over andere publicaties van haar hand in het domein van de communicatiewetenschappen: hoe relevanter het vergelijkingsmateriaal, hoe betrouwbaarder de analyse natuurlijk. Een andere beperking betreft dan weer de omvang van de geanalyseerde teksten: niet alleen benadrukken studies dat er voor iedere auteur in een attributie-experiment voldoende voorbeelddata beschikbaar moeten zijn, bovendien moeten de toe te schrijven teksten voldoende lang zijn. Duizend woorden wordt vaak genoemd als minimale ondergrens voor de lengte van een toe te schrijven tekst, waardoor de auteursherkenning bij bom- of zelfmoordbrieven duidelijk in de problemen komt. In het geval van Van den Bossche zou de lengte van de toe te schrijven tekst - een volledige scriptie - nog moeten meevallen. Veel moeilijker zou het zijn om evenveel relevante vergelijkingsteksten van haar hand te verzamelen.
| |
Auteursherkenning: doen of laten?
De relativerende opmerkingen in voorgaande paragrafen kunnen allicht enkele wenkbrauwen doen fronsen: het mag duidelijk zijn dat de stylometrie nog aan een flink arsenaal kinderziektes lijdt en helemaal nog niet geschikt is voor blindelings gebruik in een ‘productieomgeving’, laat staan in de rechtspraak, zoals in het verleden wel eens is gebeurd. Niettemin mag evenzeer duidelijk zijn dat stylometrische methodes tot de meest veelbelovende en vernieuwende methodes in het hedendaagse tekstonderzoek behoren: alleen al het potentieel van deze methodes of de maatschappelijke relevantie ervan zou ons als samenleving moeten aanmoedigen meer tijd en geld in het onderzoek ernaar te investeren. Dat zou bovendien des te zinvoller zijn in de huidige context waarin de notie ‘auteurschap’ in alle lagen van de bevolking opnieuw volop in de belangstelling staat - het debat omtrent Vaessens' Revanche is een voorbeeld bij uitstek. Dat Barthes et al. in dezen in het defensief worden gedwongen mag duidelijk zijn: de band tussen kunst en kunstenaar wordt in de samenleving strakker dan ooit aangehaald. De tekstwetenschap mag niet achterblijven.
| |
| |
| |
Verder lezen
Roland Barthes, ‘La mort de l'auteur’, in Manteia, nr. 5, 1968, blz. 12-17. |
Michel Foucault, ‘Qu'est-ce qu'un auteur’, in Bulletin de la Société française de philosophie, nr. 3, 1969, blz. 73-104. |
‘Games People Play with Authors' Names’, in Nature, nr. 387, 1997, blz. 831. |
Hans van Halteren e.a., ‘New Machine Learning Methods Demonstrate the Existence of a Human Stylome’, in Journal of Quantitative Linguistics, nr. 12, 2005, blz. 65-77. |
David Holmes, ‘The Evolution of Stylometry in Humanities Scholarship’, in Literary and Linguistic Computing, nr. 13, 1998, blz. 111-117. |
Harold Love, Attributing Authorship: An Introduction, Cambridge University Press, Cambridge, 2002. |
Kim Luyckx en Walter Daelemans, ‘The Effect of Author Set Size and Data Size in Authorship Attribution’, [te verschijnen in Literary and Linguistic Computing, 2011]. |
Efstathios Stamatatos, ‘A Survey of Modern Authorship Attribution Methods’, in Journal of the American Society for Information Science and Technology, nr. 26, 2009, blz. 471-495. |
Thomas Vaessens, De revanche van de roman. Literatuur, autoriteit en engagement, Uitgeverij Vantilt, Nijmegen, 2009. |
|
|