Menasseh: klein portret   

OCR van Hebreeuws en presentatie op het Web

  Moderne tekst als voorproefje van 17de eeuwse drukwerk
 

|| collectie || bestandsformaten || projectbeschrijving || eindrapport || biografie || brieven || publikaties ||

 


Een pagina met duidelijke modern Hebreeuwse tekst met HP DeskScan II gescanned

De tekst bestond uit 1596 tekens. In proLector was training van 42 patronen (accuracy 2), waaronder één tweetal, nodig voordat automatisch lezen perfect ging, inclusief de spatiëring. Dit was ca 15 min. werk.

Om hetzelfde resultaat met Omnipage te bereiken was een training van 86 patronen nodig, waaronder 19 tweetallen. Doordat voor de training van één teken meerdere handelingen moeten worden verricht duurde dit ca. 45 min.

U kunt zelf het OCR-resultaat vergelijken met het origineel.

Om de Hebreeuwse tekst goed te bekijken moet u in Netscape een Hebreeuws font installereren.
Op www1.snunit.k12.il/heb_pc.html staat alle informatie die nodig is en een link naar de ftp-site.
Het is wel eens lang wachten voor een verbinding tot stand komt.

De resultaten van OCR met proLector van boeken uit de Menasseh collectie kunt u ook bekijken:


21 februari 1997
Gré Ootjers (ootjers@uba.uva.nl)