clear

zoeken

search

Tag: OCR

Perfect OCR: het geld niet waard

Als ik tegenwoordig zelf documenten scan maak ik gebruik van de app Genius Scan. Zo eenvoudig als een flatbed scanner werkt dat niet, maar het is een goed alternatief dat je altijd bij de hand hebt. Het is ideaal dat je na het scannen meteen kunt beschikken over een PDF- of JPEG-bestand om die desgewenst […]

Lees meer

Gescande documenten voortaan ook vindbaar in Google

Google maakte gisteren bekend dat gescande documenten voortaan ook geïndexeerd zullen worden door de zoekmachine. Het verschil tussen gewone en gescande documenten lijkt misschien niet zo heel groot te zijn maar in het tweede geval gaat het feitelijk om een foto van een tekst. Dat is iets waar computers aanzienlijk meer moeite mee hebben dan […]

Lees meer

Terug in de tijd met de Krantenbank Zeeland

Aan de Krantenbank Zeeland kom ik maar zelden toe maar als ik er dan eens een beetje in snuffel stuit ik iedere keer weer op interessante, grappige en opmerkelijke berichten. Je vindt er beschrijvingen van oude moordzaken in Middelburg maar bijvoorbeeld ook mijlpalen uit de geschiedenis van bibliotheken in Zeeland. Neem nu de bovenstaande passage. […]

Lees meer

Chronicling America: Historische Amerikaanse kranten 1900-1910 gedigitaliseerd

The Library of Congress ontsluit op Chronicling America gedigitaliseerde kranten uit de periode 1900-1910. De database bevat inmiddels 310.000 pagina’s. De navigatie binnen de zoekresultaten is niet zodanig dat je direct enthousiast wordt maar inhoudelijk bieden de documenten een aardig inkijkje in het Amerika van het begin van de vorige eeuw. De zoekfunctie is prima […]

Lees meer

reCAPTCHA: draag een steentje bij aan het digitaliseren van boeken

Wat een CAPTCHA is kun je hier lezen. Op Tweakers lees ik vandaag dat onderzoekers van de Carnegie Mellon University captcha’s hebben voorzien van een update waardoor ze gebruikt kunnen worden als hulp voor het digitaliseren van oude boeken, tijdschriften en kranten en dat de dienst bovendien gecombineerd kan worden met spam-beveiliging voor e-mailadressen. De […]

Lees meer

De DIY-ethiek en de meerwaarde van OCR

Het is fijn als je kunt zoeken in gedigitaliseerde documenten. Je moet er bijvoorbeeld niet aan denken dat je alle gedigitaliseerde kranten van de KB een voor een zou moeten doorworstelen als je op zoek bent naar een bepaald onderwerp. Optische tekenherkenning (OCR) zorgt ervoor dat de zoektechnieken voor gescande documenten steeds beter worden. Je […]

Lees meer