clear

zoeken

search

Stichtelyke gedichten, de OCR van Google Books en Christipedia

14 juni 2009


Bladerend door Google Books kwam ik terecht in de gedigitaliseerde versie van Stichtelyke Gedichten, van Pieter Boddaert. (het origineel is ook in de Zeeuwse Bibliotheek te vinden)

Omdat het me wel leuk leek een passage uit het lange gedicht Het verdartelde Middelburg te gebruiken koos ik voor de optie ‘platte tekst’. Je krijgt de inhoud van het boek dan te zien zoals OCR het ook ziet. Het resultaat viel me nogal tegen:

Q Dartle Burgery van myne Vaderftad , r
Durft gy , tot hoon van God, in fpyt van zyne Hagen,
U 3 even of ‘t ii al voor wind en ftroom ging, dragen?
Zeg, op wat grond is dus mv quistzucht uitgelpat?
Waar wil “t op ‘t lest noch met uw tomdoosheid liecn?
Zy t gy ‘t klein overfchot der zegeningen moede ?
O diep vervallen Stad!
merkt gy niet dat Gods roede Zo zwaar en zichtbaar
nist op ‘t Land en op de fteên ?
Gy waart, ö Middelburg, voorhencn overal
Door uw godsdienftigheid en onbefproken zeden
Vermaard; nu zyt gy ‘t door uw wulpfche dartel heden,
En licht in ‘t kort noch meest door uw geduchten val.
De koopmanfchap verfchaft geen winst, ‘t geen ydcr klaagt
De winkelnering quynt en onze landery^n
Voorheen 1s Lands rykdom, zyn een last in deze tyc’n

Met enige inspanning kan je hier nog wel chocola van maken, maar om nu te zeggen dat het relaxed wegleest…

Deze ervaring herinnerde mij aan een posting die ik afgelopen week vluchtig las: Google Books Mutilates the Printed Past. In die posting legt Ronald Musto uit waarom hij zich zorgen maakt over de ‘goed genoeg strategie’ van Google Books. De scans van boeken zijn lang niet altijd van dusdanige kwaliteit dat ze in de toekomst ook nog meerwaarde zullen hebben. Ik op mijn beurt vraag me nu dan af of dit ook weer van invloed is op de OCR…en krab nog eens aan mijn hoofd bij de afsluitende woorden van Musto: But should Google Books prevail, and the resources of the scholarly community be made irrelevant by Google’s sheer scale and force, the future of our past will be in great doubt.

De toekomst van ons verleden; dat klinkt erg mooi maar het is inderdaad wel iets dat ons zorgen zou moeten baren. Wat doen de beperkingen van de techniek van nu met ons cultureel erfgoed in de toekomst?

Ondertussen zocht ik nog even naar de precieze betekenis van het woord ‘stichtelijk’. Tussen de treffers van Google zag ik tot mijn verbazing een Nederlandse variant van Conservapedia staan: Christipedia. Een Wikipedia voor Christenen.

Het lemma stichtelijk lijkt me niet verkeerd maar na het lezen van het lemma Evolutietheorie haak ik af. Deze bron laat ik over aan de liefhebbers.

Maar de stichtelijke zoekresultaten duiken dus wel op in Google. Het is maar dat je het weet.

@

2 Reacties

  1. Henk schreef:

    Die Christipedia lijkt wel een soloprojectje van meneer Kees Langeveld. De meeste wijzigingen staan op zijn naam.

    Heb eens gekeken naar de artikelen over homoseksualiteit en over islam. Zelfs het Calvijncollege kan dit toch niet als serieuze bron adviseren.

  2. Hij trekt de kar dan behoorlijk. De genoemde artikelen heb ik nu ook gezien. Da's niet best inderdaad. Bij nadere bestudering zie ik dat er ook veel lemma's zijn die niet af zijn, zoals //christipedia.wik.is/Artikelen/K/Kerkverlating en ik merkte ook dat de zoekfunctie het niet goed doet.

Reageer