clear

zoeken

search

Google aan uitgevers: 2 regels code

17 juli 2009


Toen ik er over las bij @mjk begreep ik niet meteen wat de uitgevers van kranten nu precies willen van Google maar na het lezen van verschillende andere bijdragen, zoals deze van Raymond, viel het kwartje eindelijk:

Onderdeel hiervan is de ontwikkeling van een nieuw protocol, ACAP, dat feitelijk een (veel) uitgebreidere versie is van de bekende robots.txt en waarmee instructies gegeven kunnen worden aan de crawlers van zoekmachines als het gaat om wat er geindexeerd kan/mag worden van een site.

Nu hebben de uitgevers het verlangen uitgesproken om dit wettelijk vast te gaan leggen zodat zoekmachines (Google wordt natuurlijk met name genoemd) zich moeten conformeren aan dit protocol. Het maakt het voor uitgevers mogelijk om bijv. de duur van de indexering te beperken zodat nieuws(artikelen) slechts korte periode beschikbaar zijn in de indexen van Google. Natuurlijk met als doel dat na die periode het artikel nog steeds wel, waarschijnlijk niet zonder creditcard, via de originele nieuwssite verkrijgbaar is.

Fail. De uitgevers janken dat Google de grote zondebok is maar willen ondertussen wel profiteren van de kracht en de populariteit van de zoektechnologie van het bedrijf.

Op 15 juli reageerde Google op het Google Public Policy Blog:

For more than a decade, search engines have routinely checked for permissions before fetching pages from a web site. Millions of webmasters around the world, including news publishers, use a technical standard known as the Robots Exclusion Protocol (REP) to tell search engines whether or not their sites, or even just a particular web page, can be crawled. Webmasters who do not wish their sites to be indexed can and do use the following two lines to deny permission:

User-agent: *
Disallow: /

If a webmaster wants to stop us from crawling a specific page, he or she can do so by adding another code to the page. In short, if you don’t want to show up in Google search results, it doesn’t require more than one or two lines of code.

Zo simpel is het, uitgevers. Twee regels code.

Maar neen, daar waagt geen uitgever zich aan. De in paniek verkerende parasitoïden blijven roepen dat Google de parasiet is en daarom verplicht is nieuwe protocollen te aanvaarden.

Het is de omgekeerde wereld, als je het mij vraagt. Waarom niet proberen een verdienmodel te verzinnen dat gebaseerd is op symbiose?

Eenvoudig is dat niet…

…maar wel zo eerlijk.

@

Foto

1 Reactie

Reageer