clear

zoeken

search

Internet Archive importeert honderdduizenden scans uit Google Books

16 augustus 2009


Ik kijk in Netvibes regelmatig in de feed voor nieuwe (tekst-) aanwinsten van Internet Archive. Toen ik vandaag eens doorklikte naar de website zelf viel me opeens op dat de meeste werken die je er aantreft zijn geĆ¼pload door een gebruiker met de naam “tpb”. De scans (in ieder geval die op de laatste 20 pagina’s) zijn bijna allemaal afkomstig uit…Google Books.

Het uploadtempo van de boeken ligt zo hoog dat ik me begon af te vragen of er hier sprake is van een robot. Dat riep meteen allerlei vragen bij me op:

  • Google heeft andere doelen dan Internet Archive. Zijn het daarmee ook concurrenten?
  • Wie zit er achter die gebruiker tpb?
  • Is het iemand die wil voorkomen dat Google het monopolie over gedigitaliseerde boeken krijgt?
  • Of iemand die vindt dat Google Books te veel beperkingen heeft?
  • Is het iemand van Google Books die vindt dat de boeken ook in IA moeten zitten?
  • Is het een Europeaan die de blokkades van Google Books buiten de VS op een andere manier dan met Hotspot Shield probeert te omzeilen?
  • Hoe zit dit juridisch? Google doet tenslotte al het scanwerk bij de universiteiten.
  • Heeft dit iets te maken met het feit dat Internet Archive net zo’n deal als Google Books zou willen?
  • Staat tpb misschien voor The Pirate Bay? Die houden ook wel van een geintje.

Van de forums van IA word ik niet veel wijzer. Het uploaden van al die titels wordt wel besproken, maar in die discussies gaat het vooral over de beperkingen van de scans en links.

Als ik doorklik naar de speciaal daarvoor ingerichte pagina van IA snap ik het helemaal niet meer. Welcome to Google Books, staat daar doodleuk. Ernaast lees ik dat die dataset maar liefst 830.112 items bevat. Het Archief introduceert die collectie met de volgende tekst:

Digitized books from many different libraries from the Google Book Search program. These digital files have been downloaded from the Google site and uploaded to the Internet Archive by users.
While these books may be old enough to be in the public domain, but there is no guarantee by anyone of their legal status.
These books have been made text searchable as a finding aid and downloading refers to Google’s site. Please refer to Google’s site for any rights issues or restrictions.

Is er iemand die weet wat hier allemaal aan de hand is? Dit is toch wel een merkwaardige disclaimer? Of heb ik gewoon niet goed opgelet en zijn de twee organisaties een samenwerkingsverband gestart? In dat geval vraag ik me dan weer af wat de toegevoegde waarde is van opslag op twee verschillende plaatsen.

Als iemand suggesties heeft: graag. Als dat niet het geval is ga ik binnenkort toch eens wat dieper graven.

@

2 Reacties

  1. Yvette Hoitink schreef:

    Er zijn meer mensen die zich erover verbazen.

  2. Inderdaad, maar ze gaan niet echt in op die gebruiker tpb…

Reageer op Edwin Mijnsbergen