Onleesbaar!
Door: Kees van der Meer
Sommige digitale artikelen zijn onleesbaar. Dor, flets, moeizaam geschreven, kennelijk een maandagochtendartikel. Overslaan! Arme auteur: als U niets te melden hebt, meld het dan niet.
Gelukkig zijn er interessante digitale artikelen, de moeite van lezen en bewaren waard. Die worden onleesbaar!
We moeten eens kijken naar het gevolg van de vernieuwingsdrift van ICT. Formaten, verwerkingsprogrammatuur, operating systems en media zijn binnen een decennium verouderd. Zelfs de bouwstenen van digitale documenten als officiële ICT normen en standaarden verouderen snel. Vernieuwingsdrift en behoud sporen niet. ICT en archieven sporen ook niet gemakkelijk. Alleen door leuke dingen te laten zien kan ik toekomstige informatici interesseren voor mijn technische-informatica cursus over digitale duurzaamheid van de digitale schatten in archieven en andere erfgoedinstellingen. Die informatici zijn hard nodig om hulpmiddelen te maken voor preservering, onder behoud van authenticiteit.
Om documenten leesbaar te houden moeten we ze preserveren! Deze bijdrage gaat over preservering en authenticiteit.
Authenticiteit bij een game
Authenticiteit is een centraal begrip in het archief. De eis tot authenticiteit vloeit in de eerste plaats voort uit de juridische waarde: ‘Is dit document wat het voorgeeft te zijn’.
Maar ook buiten een juridisch kader is authenticiteit van belang.
Een bekend artikel van M. Hedstrøm en C. Lampe heeft als titel: Emulation vs. migration: do users care? [1]. Van een leuk, verslavend spelletje voor de BBC micro computer, Chuckie egg, waren in het kader van het CAMiLEON project een gemigreerde versie en een geëmuleerde versie gemaakt. Spelers konden met het origineel en met een van beide nieuwe versies spelen en werden gevraagd naar hun ervaringen. ‘A striking finding from this limited test was the sensitivity of users to small changes in the digital object. Users noticed small differences in graphics, sounds, character motion, and speed of play’.
De auteurs stellen dus: ‘gamers’ zien scherp hoe het derivaat afwijkt van het origineel. Zij zijn gespitst op ‘authenticiteit’ ondanks dat de juridische invalshoek hun koud laat!
Authenticiteit: een model voor de toekomst
Een belangwekkend artikel is van Gladney en Bennett: What do we mean by authentic? What is the real McCoy? [2]. Is een weergave van een muziekuitvoering vanaf een CD, bijvoorbeeld, authentiek? De analoge geluidsgolven worden op CD digitaal opgeslagen en bij afspelen weer analoog gemaakt. Na de registratie op een CD (conversie analoog à digitaal) en afspelen van de CD (conversie digitaal à analoog) zijn de geluidsgolven ten opzichte van het origineel behoorlijk verminkt. Dus niet authentiek? Dus is er geen auteursrecht verschuldigd op een muziek-CD?
Deze gedachtegang spreekt aan, maar zo ligt het natuurlijk niet. Authenticiteit is door Gladney en Bennett uitgewerkt voor de volgende gevallen.
- Uitvoeringen of kopieën van muziekuitvoeringen, waarbij de analoge signalen van de uitvoering zijn bijgesteld en versterkt en de achtergrond ruisarm is gemaakt;
- Artefacten als een Louis XV stoel met een kras die er vorig jaar in is gekomen, die dus op atomair niveau niet meer identiek is aan de oorspronkelijke stoel;
- Dinosaurusbotten, die er (hoogstwaarschijnlijk) nog net zo uitzien als 80 miljoen jaar geleden, waarvan het kalk van de botten in de loop der eeuwen vervangen is door steen (silicaat) zodat zowat geen atoom nog afkomstig is uit het oorspronkelijke bot;
- Een bitstream, die weliswaar foutloos gekopieerd kan worden, maar waarvan de weergave van de bitstream en de kopieën ervan op een scherm of papier afhankelijk is van een ICT omgeving;
- Om de discussie spannend te maken: zijn wij mensen wel authentiek? De moleculen waaruit wij bestaan worden regelmatig ververst, een halfwaardetijd voor vervanging van bijna een jaar wordt vaak genoemd. Zijn wij wel dezelfden als destijds? Hoe is het trouwens mogelijk dat wij ons iets kunnen herinneren uit onze kinderjaren!
Gladney en Bennett komen door een analyse uiteindelijk tot een veralgemeniseerde beschrijving van het begrip authentiek. ‘The real McCoy’ wordt beschouwd als (een) authentiek(e kopie) als het een voldoende betrouwbaar derivaat is met echte herkomst. Voor de liefhebber: de herkomst van de Amerikaanse uitdrukking ‘the real McCoy’ kan men nalezen op Yahoo ask [3]. En er is nu enige duidelijkheid over voorwaarden voor authenticiteit in een digitale omgeving.
Preservering bij een game
Bij preservering wordt (naast refreshing) gedacht aan migratie of emulatie. Het klassieke debat tussen Rothenberg en Bearman of migratie dan wel emulatie de voorkeur verdiende is voorbij. Soms zal het verantwoord zijn om te migreren, soms zal men kiezen voor emulatie.
Emulatie betreft de mogelijkheid van apparatuur en/of programmatuur om andere apparatuur en/of programmatuur te imiteren, om zich te gedragen als die apparatuur en/of programmatuur. Emulatie lijkt aantrekkelijk vanuit een oogpunt van authenticiteit. Nu kan imiteren op een heleboel manieren. In het artikel van Hedstrøm en Lampe heeft men ook door emulatie de grootste afwijkingen van het originele platform ondervangen, en er is een spel ontstaan dat zeer redelijk leek op het origineel. Dat is geen kleine prestatie. De oude geluidsinstallatie is wellicht niet meer leverbaar, maar dat is het minste probleem. Moderne computers zijn veel sneller dan die van vroeger. Stelt U zich Chuckie egg of Pacman of iets dergelijks maar eens voor op een moderne 3 GHz machine met snelle grafische kaart. Het spel is pijlsnel afgelopen, tenzij er opzettelijk in de snelle machine vertraging in ingebouwd.
Ook is de werking van de centrale processing unit bij moderne computers meer gestroomlijnd dan bij oude computers het geval is. Authentiek? De verandering doet gevoelsmatig afbreuk.
Het is mogelijk computers zo af te stellen dat er voor iedere oude ‘chip’ in een moderne machine een analogon bestaat, dat hetzelfde werkt als het origineel. Is dat meer authentiek?
Emulator: een model voor toekomstige computers
Kunnen we een emulator bouwen die op toekomstige computers kan draaien? Wat weten we van de architectuur van toekomstige computers? Weinig, maar meer dan niets. We kunnen er wel iets over voorspellen, ongeveer op de manier waarop (we nu denken dat) een Middeleeuwer zou hebben kunnen voorspellen welke rekenkundige instructies (zoals optellen) er anno 2000 zouden bestaan.
R. Lorie was een van de makers van SGML, Standard Generalized Markup Language, ISO norm 8879:1986, de voorloper van XML, oorspronkelijk SGML = de Standaard van Mosher, Goldfarb en Lorie! Die R. Lorie, alsmede R. van Diessen en anderen hebben een minimale set instructies opgesteld waarvan aannemelijk is dat computers ze ook over 1000 jaar nog zullen uitvoeren. Het zijn maar 25 instructies! Een toekomstige computer zal onder meer een instructie hebben om op te tellen, dat kan niet anders, en ook herhaald optellen (dat is vermenigvuldigen); de Boolean operatoren ‘en’, ‘of’, en ‘en niet’; vergelijken (‘is groter dan’, ‘is gelijk aan’); ophalen van data uit het geheugen en data opslaan in het geheugen; en stop!
Deze aanpak staat bekend als de Universal Virtual Computer, de UVC aanpak. Voor behoud van een bladzijde met bijvoorbeeld tekst en een foto moet men vastleggen het aantal pixels horizontaal en verticaal, van iedere pixel de waarde – zwart, grijs, groen, … kortom, het soort dingen dat in een formaat zit. De bladzijde wordt als image vastgelegd en bewaard in een standaard formaat. En nu komt het: dat formaat moet (een dezer dagen) worden geconverteerd naar de basis van 25 instructies. We bewaren zorgvuldig het image en ook het formaat in de 25 instructies.
In een verre toekomst wil men dit image weer hebben. Dan worden de 25 instructies ingevoerd in de toekomstige computer (jawel, ze zitten er al in, ik bedoel: ze moeten zijn instructienummers koppelen aan onze huidige instructies), en dan wordt het zorgvuldig bewaarde formaat (in onze huidige instructies) en het zorgvuldig bewaarde image ingevoerd in de toekomstige computer, uitgerekend en getoond. Einde probleem!
Een volstrekt onveranderde, ‘authentieke’ bladzijde kan over 10, 100 of 1000 jaar geleverd worden ondanks dat het formaat dan volstrekt verouderd kan zijn! Deze UVC-aanpak is gemaakt, getest, het werkt en het is beschreven in het artikel van J.R. van der Hoeven [4].
Einde probleem was misschien wat haastig gezegd. Er waren nog twee minpuntjes.
Ten eerste: emuleren met onze huidige kleine instructieset gaat langzaam. Een pagina A4 emuleren vraagt in de orde van grootte van een dag rekentijd. Voor deze vorm van emulatie is het prettig als computers voorlopig steeds sneller blijven worden, conform de huidige versie van de wet van Moore, die stelt dat computers iedere 18 maanden tweemaal zo snel worden.
Ten tweede: van elk formaat waarin we images willen opslaan moet het formaat geconverteerd worden naar de instructieset. Dat is veel en moeilijk werk, ofschoon het maar een keer behoeft te worden gedaan voor ieder formaat. Het maken van de conversie was lastig en foutgevoelig werk. In dit opzicht hebben we weer nieuws: recentelijk is het N.J.C. Kol gelukt om master-conversieprogrammatuur te maken in Java [5]. De ontwikkeltijd van een converteerprogrammatuur, die (bijvoorbeeld) gif87a beschrijft in de instructieset van de UVC, is nu nog maar 1½ uur.
De UVC aanpak is getest bij de Nederlandse Koninklijke Bibliotheek, die hem wil inzetten voor digitale duurzaamheid als dat nodig is, en de UVC tool kan gratis worden gedownload [6].
Zo is bewezen dat emulatie via de UVC-aanpak mogelijk is en daarmee is een bijdrage geleverd aan authenticiteit van leesbare documenten in de toekomst.
Wordt vervolgd
Preservering heeft geen zin zonder toegankelijkheid. Dat wordt hier niet meer besproken. Aan alle leesbare documenten komt een einde. Om toegankelijkheid van digitale objecten te bespreken geef ik het toetsenbord over aan dr. M.P.M. van Horik.
Referenties
[1] M. Hedstrom en C. Lampe: Migration vs. emulation: Do users care? RLG DigiNews 5(6), (2001). http://www.rlg.org/legacy/preserv/diginews/diginews5-6.html#feature1
[2] H.M. Gladney en J.M. Bennett: What do we mean by authenticity? What is the real McCoy? D-Lib Magazine 9(7/8), (2003). http://www.dlib.org/dlib/july03/gladney/07gladney.html .
[3] Where did the expression "the real McCoy" come from?http://ask.yahoo.com/ask/20010601.html.
[4] J.R. van der Hoeven, R.J. van Diessen en K. van der Meer: Development of a Universal Virtual Computer (UVC) for long-term preservation of digital objects. Journal of Information Science 31(3), (2005), 196-208.
[5] N.J.C. Kol, R.J. van Diessen en K. vander Meer: An improved Universal Virtual Computer approach for long-term preservation of digital objects. Information Services and Use 26(4), (2006), 283-291.
[6] Digit Asset Preservation Tool http://www.alphaworks.ibm.com/tech/uvc.
Let Op: Deze url’s zijn gecontroleerd op 27 maart 2007.
Dr. K. (Kees) van der Meer
Is Universitair hoofddocent bij de opleiding Technische Informatica aan de TU Delft, wetenschappelijk onderzoeker bij het onderzoekslab DECIS (Delft) en gastprofessor bij de opleiding Informatie- en Bibliotheekwetenschap aan de Universiteit van Antwerpen




