Het Project | Aanpak
Selectie en voorbewerking van het materiaal
Voor Dutch Prints Online is een selectie gemaakt van oude drukken uit de periode 1781-1800. Deze selectie heeft plaatsgevonden op basis van inhoudelijke én praktische criteria. Zo zijn boeken die in een Gotische letter zijn gedrukt uit de selectie gelaten, omdat het OCR-en van deze letter nog niet het gewenste resultaat oplevert. Ten behoeve van de digitalisering wordt een materiaalvoorbewerking uitgevoerd.
Van elk boek wordt bepaald of de fysieke conditie voldoende is en of het boek geschikt is voor scanning en OCR. Boeken die te kwetsbaar zijn, niet goed open kunnen of waarvan bijvoorbeeld de OCR geen goed resultaat zal opleveren worden uit de selectie verwijderd. Daarnaast wordt tijdens de materiaalvoorbewerking bekeken of er uitklapbare kaarten of prenten in de boeken zitten. Deze boeken worden apart gedigitaliseerd. De resultaten van de materiaalvoorbewerking worden vastgelegd in een database.
Europese aanbesteding
De aanbesteding wordt in opdracht van de Koninklijke Bibliotheek uitgevoerd. Het scannen en OCR-en wordt in één aanbesteding gedaan vanwege het belang van een goede aansluiting van het ene product op het andere. Dit is gebleken bij aanbesteding van eerdere projecten die bij de KB zijn uitgevoerd.
De overige onderdelen van het project vallen buiten de Europese aanbestedingsregelgeving, omdat de afzonderlijke bedragen onder de minimum norm liggen. Er is gekozen voor de openbare procedure van aanbesteden.
Ontwikkeling webdienst
De gedigitaliseerde werken zullen in 2010 digitaal beschikbaar worden gesteld via de website Dutch Prints Online. De boeken zijn volledig gefotografeerd, maar zijn door de toepassing van optische tekenherkenning uiteraard ook digitaal doorzoekbaar op woordniveau. Daarnaast zullen door het toevoegen van gegevens uit de Short Title Catalogue Netherlands (STCN) ruime zoekmogelijkheden geboden worden. Voor de ontsluiting en beschikbaarstelling wordt gebruik gemaakt van verschillende internationale standaarden die hiervoor bij de KB in gebruik zijn
De gedigitaliseerde boeken worden dus op verschillende manieren ontsloten:
- het toevoegen van de beschrijvingen uit de STCN;
- het toevoegen van structurele metadata zodat in de digitale boeken gebladerd kan worden;
- optische tekenherkenning (OCR) zodat gezocht kan worden op woorden in de tekst;
- het toevoegen van woordcoördinaten zodat zoektermen opgelicht kunnen worden in de afbeelding van de betreffende pagina's.
Prince2
Het project wordt uitgevoerd volgens de projectmanagementmethodiek Prince2. De organisatie, verantwoordelijkheden en de projectbeheersing zijn ingericht volgens deze methode.
Kosten
De kosten van het project bedragen 3 miljoen euro. Hiervoor heeft het ministerie van Onderwijs, Cultuur en Wetenschap in maart 2006 een eenmalige bijdrage ter beschikking gesteld.

