Internet Archive varuje, že jeho Wayback Machine čelí vážnému ohrožení. Některá velká média blokují archivaci, přestože sama archiv používají při vlastní práci.
Wayback Machine je pro internet něco jako paměť, která nezapomíná: ukládá starší verze webů a pomáhá dohledat změny, které by jinak zmizely. Teď ale Internet Archive hlásí nepříjemný problém — část velkých vydavatelů blokuje jeho crawler, a tím oslabuje nástroj, na který se spoléhají novináři i veřejnost.
Co se kolem Wayback Machine změnilo
Podle aktuálních zjištění blokuje přístup webovému crawleru Internet Archive už 23 velkých zpravodajských webů. Jde o systém, který Wayback Machine používá k ukládání kopií stránek. Bez něj archiv nemůže spolehlivě zachytávat nové verze obsahu a časem se zmenšuje množství dostupné historie.
Nejde přitom jen o technický detail. Wayback Machine dlouhodobě pomáhá ověřovat, co weby tvrdily dřív, jak se měnily jejich články, výrazy nebo data. V praxi to znamená, že když se na webu něco upraví nebo smaže, archiv často zůstává jediným důkazem původního znění.
Na paradox celé situace upozorňuje i to, že právě novináři Wayback Machine sami využívají. V jednom z příkladů posloužil archiv redakci USA Today při analýze dat kolem detenčních politik ICE. Zatímco tedy archiv pomáhá jejich práci, některé stejné mediální domy mu současně zavírají dveře.
Proč na tom záleží i běžným uživatelům
Pro čtenáře to není jen spor institucí. Když weby blokují archivaci, je těžší dohledat staré články, porovnat změny v tvrzeních nebo ověřit, co bylo na stránce zveřejněno dřív. To se hodí nejen novinářům, ale i studentům, výzkumníkům nebo komukoli, kdo si chce zkontrolovat historii nějaké informace.
Internet Archive navíc není jen nástroj pro jednu profesi. V době, kdy řada lokálních médií končí a digitální obsah mizí rychleji než dřív, má archiv mnohem větší význam než dřív. Právě on často drží stopu po článcích, které by jinak zmizely bez náhrady.
Vydavatelé argumentují ochranou proti scraping botům, tedy automatickým nástrojům, které sbírají obsah ve velkém. Podle nich nejde cíleně o blokaci Internet Archive. Jenže z pohledu uživatelů je výsledek stejný: méně dostupné historie webu a slabší možnost vracet se k původním verzím stránek. A přesně to je pro celý internet špatná zpráva.
Podrobnosti přinesl také 9to5mac.













