[ Zavřít ] 


 

RSS Kanál

 

I kusy internetu mizí v propadlišti dějin

Internet, obrovské úložiště informací a znalostí, se zdá být nekonečným. Přesto se i zde skrývá temná stránka: velká část online obsahu nenávratně mizí. Ať už je to kvůli technickým chybám, změnám na webových stránkách, nebo úmyslnému mazání, ztrácíme cenné informace a svědectví o naší digitální historii.

 

I kusy internetu mizí v propadlišti dějin (Zdroj: Visualpharm.com)

Podle studie Pew Research Center z roku 2024 38 % online obsahu vytvořeného před rokem 2010 je dnes nedostupné. To zahrnuje články, blogy, fóra, diskusní skupiny, a další formy online komunikace.

„38 % webů stránek z roku 2013 není ani o dekádu později již dostupných.“

 

Proč kusy internetu mizí?

Důvody pro tento úbytek jsou různé:

  • technické chyby: webové stránky se mění, servery selhávají, a data se ztrácejí v důsledku hackerských útoků nebo softwarových chyb;
  • změny na webových stránkách: mnoho webů je aktualizováno, přetvářeno, nebo kompletně smazáno, čímž dochází k nenávratné ztrátě starého obsahu;
  • úmyslné mazání: v některých případech je obsah mazaný záměrně, ať už z důvodu politické cenzury, ochrany osobních údajů, nebo z jiných komerčních důvodů.

Příklady mizení obsahu

  • webové stránky: studie Pew Research Center uvádí, že 25 % všech webových stránek, které existovaly mezi lety 2013 a 2023, je dnes nepřístupných. Tento trend je ještě výraznější pro starší obsah.
  • novinky: na webových stránkách s novinkami bývá až 23 % nefunkčních odkazů. Zvláště náchylné jsou stránky místních samospráv.
  • Wikipedie: 54 % odkazů v sekci Reference na Wikipedii vede na neexistující stránky.
  • sociální sítě: Studie zkoumala také mizení obsahu na sociálních sítích. Téměř u jedné pětiny tweetů zveřejněných na jaře 2023 došlo během tří měsíců k jejich nedostupnosti. Ve většině případů (60 %) bylo na vině zrušení nebo pozastavení daného účtu. U zbývajících 40 % byl smazán samotný tweet, ale účet zůstal aktivní. Tweety v určitých jazycích (turečtina, arabština) a od uživatelů s výchozím nastavením profilu mizí častěji než ostatní.

Dopady

Ztrácíme cenné informace o historii, kultuře a vývoji společnosti v digitálním věku. Online obsah představuje obrovské úložiště dat, která nám umožňují sledovat trendy, studovat minulost a lépe porozumět současnosti. Jeho zmizení znamená nenávratnou ztrátu poznatků a svědectví o našem životě v digitálním světě.

Vědci a historici se potýkají s narůstajícími problémy při shromažďování a analýze dat z online zdrojů. Mizející obsah ztěžuje výzkum a studium v mnoha oblastech, od sociologie a politologie až po historii a umění. Vědci se tak musejí obracet k alternativním zdrojům, které nemusí být vždy spolehlivé nebo dostupné.

Selektivní mazání obsahu může vést ke zkreslenému zobrazení historie a událostí online. Pokud se z online archivů ztrácí jen některé typy obsahu, může to vést k tomu, že určité události a perspektivy budou vymazány z historie. To může mít vážné dopady na naše chápání minulosti a na to, jak se díváme na svět.

Další dopady

  • omezování svobody slova a informací: může docházet k cenzuře a mazání obsahu, který se nelíbí mocným, a tím k omezování svobody slova a informací.
  • ztráta důkazů o trestných činech: mizející online obsah může ztěžovat vyšetřování a stíhání trestných činů, které se odehrávají v online prostředí.
  • ekonomické ztráty: firmy a organizace mohou přijít o cenné informace a data v důsledku ztráty online obsahu.

Snahy o záchranu mizejícího internetu

Naštěstí existují iniciativy, které se snaží zachovat mizející online svět a zpřístupnit ho pro budoucí generace. Mezi nejdůležitější z nich patří:

  • webové archivy: organizace jako Internet Archive a Wayback Machine systematicky ukládají kopie webových stránek, čímž vytváří rozsáhlé digitální archivy, které umožňují uživatelům procházet a zkoumat online obsah z minulosti.
  • digitální knihovny: knihovny a muzea po celém světě digitalizují a archivují online obsah, včetně knih, článků, fotografií a dalších materiálů. To umožňuje široké veřejnosti přístup k cenným informacím, které by jinak mohly být ztraceny.
  • web scraping: vývojáři neustále vyvíjejí nástroje pro automatické sbírání a ukládání online obsahu, čímž zachraňují data, která jsou ohrožena smazáním. Tyto nástroje hrají klíčovou roli v boji proti ztrátě digitální historie.

Mizející internet je vážný problém, který si vyžaduje naši pozornost. Je důležité si uvědomit, že online obsah není trvalý a že se musíme aktivně snažit o jeho záchranu a zpřístupnění budoucím generacím. Podpora webových archivů, digitalizace online obsahu a využívání nástrojů pro web scraping jsou jen některé z kroků, které lze podniknout, aby digitální historie nezmizela úplně.

Zdroje

 

 

 

 

 

Gemini 2.0: multimodální a více po ruce

Google uvádí Gemini 2.0, novou generaci svého ústředního modelu AI. Přináší zásadní vylepšení napříč spektrem svých funkcí: od bleskurychlého zpracování dat s projektem Flash, přes multimodální...

Mistral demokratizuje pokročilé funkce AI

Francouzský vývojář AI Mistral AI přichází s multimodálním modelem Pixtral Large, aktualizuje vlajkový jazykový model Mistral Large na verzi 24.11 a ve zdarma přístupné betě nabízí pokročilé funkce, jako jsou Web Search, Canvas a...

SearchGPT kombinuje důvěryhodnost, kontext a přístupnost

OpenAI představilo SearchGPT, novou funkci v rámci ChatGPT, která kombinuje sílu umělé inteligence a schopnosti přímého vyhledávání na internetu. Jde o krok směrem k plně integrovaným systémům, které mohou na základě uživatelských...

Claude 3.5 Sonnet a Haiku: nová kapitola ve vývoji LLM

Neustálý vývoj jazykových modelů přináší nové možnosti, jakým způsobem umělá inteligence ovlivňuje nejen interakci mezi uživateli a počítači, ale práci s daty jako takovou. Společnost Anthropic nyní představuje 2  nové modely –...


 
© 2005-2024 PS Media s.r.o. - digital world
 

reklama