Klik om de nieuwsbrief als PDF te downloaden

Sluit venster

home
 

Het Project | Aanpak

Selectie en voorbewerking van het materiaal

Voor Dutch Prints Online is een selectie gemaakt van oude drukken uit de periode 1781-1800. Deze selectie heeft plaatsgevonden op basis van inhoudelijke én praktische criteria. Zo zijn boeken die in een Gotische letter zijn gedrukt uit de selectie gelaten, omdat het OCR-en van deze letter nog niet het gewenste resultaat oplevert. Ten behoeve van de digitalisering wordt een materiaalvoorbewerking uitgevoerd.

Van elk boek wordt bepaald of de fysieke conditie voldoende is en of het boek geschikt is voor scanning en OCR. Boeken die te kwetsbaar zijn, niet goed open kunnen of waarvan bijvoorbeeld de OCR geen goed resultaat zal opleveren worden uit de selectie verwijderd. Daarnaast wordt tijdens de materiaalvoorbewerking bekeken of er uitklapbare kaarten of prenten in de boeken zitten. Deze boeken worden apart gedigitaliseerd. De resultaten van de materiaalvoorbewerking worden vastgelegd in een database.

Europese aanbesteding

De aanbesteding wordt in opdracht van de Koninklijke Bibliotheek uitgevoerd. Het scannen en OCR-en wordt in één aanbesteding gedaan vanwege het belang van een goede aansluiting van het ene product op het andere. Dit is gebleken bij aanbesteding van eerdere projecten die bij de KB zijn uitgevoerd.

De overige onderdelen van het project vallen buiten de Europese aanbestedingsregelgeving, omdat de afzonderlijke bedragen onder de minimum norm liggen. Er is gekozen voor de openbare procedure van aanbesteden.

Ontwikkeling webdienst

De gedigitaliseerde werken zullen in 2010 digitaal beschikbaar worden gesteld via de website Dutch Prints Online. De boeken zijn volledig gefotografeerd, maar zijn door de toepassing van optische tekenherkenning uiteraard ook digitaal doorzoekbaar op woordniveau. Daarnaast zullen door het toevoegen van gegevens uit de Short Title Catalogue Netherlands (STCN) ruime zoekmogelijkheden geboden worden. Voor de ontsluiting en beschikbaarstelling wordt gebruik gemaakt van verschillende internationale standaarden die hiervoor bij de KB in gebruik zijn

De gedigitaliseerde boeken worden dus op verschillende manieren ontsloten:

  • het toevoegen van de beschrijvingen uit de STCN;
  • het toevoegen van structurele metadata zodat in de digitale boeken gebladerd kan worden;
  • optische tekenherkenning (OCR) zodat gezocht kan worden op woorden in de tekst;
  • het toevoegen van woordcoördinaten zodat zoektermen opgelicht kunnen worden in de afbeelding van de betreffende pagina's.

Prince2

Het project wordt uitgevoerd volgens de projectmanagementmethodiek Prince2. De organisatie, verantwoordelijkheden en de projectbeheersing zijn ingericht volgens deze methode.

Kosten

De kosten van het project bedragen 3 miljoen euro. Hiervoor heeft het ministerie van Onderwijs, Cultuur en Wetenschap in maart 2006 een eenmalige bijdrage ter beschikking gesteld.

Planning

De doorlooptijd van het project bedraagt 36 maanden. Het project is gestart 1 mei 2007.