Jedyny w Polsce serwis o internecie, prywatności i mediach społecznościowych pisany z perspektywy technologicznej, humanistycznej i społecznej

Jeśli w odpowiedzi na tweet lub wpis na Facebooku znajomego umieściliście kiedykolwiek jeden ze swoich ulubionych memów, jest duża szansa, że trafi on do bazy danych Biblioteki Kongresu USA. W tej największej na świecie bibliotece można znaleźć zarówno jeden z trzech kompletnych pergaminowych egzemplarzy Biblii Gutenberga jak i memy z Grumpy Cat czy “Dziwnym Panem ze Stocka”.

Internetowy katalog kultury

Przez ostatnie dwie dekady mały zespół archiwistów codziennie zajmuje się archiwizowaniem gifów, tweetów, wpisów na blogach, memów oraz wszelkich zdjęć, które z różnych przyczyn stały się “wirusowe”. Według dziennika “New York Times” biblioteka zgromadziła już ponad 2,129 petabajtów danych, co przekłada się na 18 miliardów dokumentów cyfrowych.

Projekt archiwizacji treści internetowych nie jest sam w sobie niczym nowym. Na początku, w ramach pilotażowego projektu, archiwiści z Biblioteki Kongresu USA chcieli zebrać wszystkie dane, które pojawią się w sieci podczas kampanii prezydenckiej w Stanach Zjednoczonych w 2000 roku. Po atakach terrorystycznych z 11 września, kiedy w krótkim czasie pojawiło się w internecie miliony zdjęć i wpisów oraz rozpoczęła się zaciekła debata polityczna, zespół archiwistów uznał, że potrzebny jest oficjalny i długofalowy program archiwizacji treści.

Kryteria selekcji

Selekcja jest żmudna, a stały przepływ treści wirusowych sprawia, że wybór treści, które mają trafić do przyszłych pokoleń jest utrudniony. Stosowane są tutaj podobne kryteria jak w przypadku gromadzenia papierowych źródeł. Przede wszystkim cyfrowe dane muszą mieć wartość dla przyszłych uczonych oraz muszą być wyjątkowe. Dobrze również jeśli każdy może takie zdjęcie lub mem samodzielnie przerobić, dostosować w zależności od potrzeby jaka nim kieruje. Przykładem tego typu może być chociażby słynne zdjęcie oglądającego się za siebie chłopaka – znane w sieci jako Distracted Boyfriend lub Man Looking at Other Woman.

Przez lata gromadzono informacje z najważniejszych wydarzeń rozgrywających się na świecie: II wojna w Zatoce Perskiej (2003) czy wybory prezydenckie w Stanach Zjednoczonych w 2004 roku. Około roku 2009 rozszerzono katalog archiwizowanych treści. Nie chodziło już tylko o udokumentowanie ważnych w dziejach historii wydarzeń, ale raczej o stworzenie swoistego katalogu kultury internetowej, która będzie reprezentatywna dla naszych czasów, tak, aby za 100 lat przyszłe pokolenia badaczy mogło mieć szczegółowy wgląd w obraz naszego społeczeństwa.

„Nagle pojawiły się nowe technologie i platformy mediów społecznościowych oraz nowe sposoby, w jaki ludzie komunikowali się lub dzielili się danymi w sieci”zauważa cytowana przez NYT Abbie Grotke, która od 2002 roku kieruje zespołem archiwistów Biblioteki Kongresu USA.

Marzec 2020 roku okazał się ogromnym wyzwaniem dla całego zespołu, który pracując z domu, bierze udział zarówno w międzynarodowym projekcie mającym na celu zebranie treści na temat koronawirusa jak i w dodawaniu cyfrowych danych do własnej bazy danych.

Internetowa baza danych jest dostępna jest dla wszystkich, ale jak nietrudno się domyślić, panuje w niej straszny bałagan. W obliczu milionów memów i treści wirusowych zespół jest bardziej zainteresowany ich gromadzeniem niż tworzeniem ułatwień dostępu do nich.

„Stosujemy metodę ‘wszystkie ręce na pokład’”- podkreśla Grotke. „Nie usuwamy niczego. Jesteśmy cyfrowymi zbieraczami”.

Archiwum internetowe Biblioteki Kongresu nie jest oczywiście jedynym tego typu projektem gromadzenia treści w internecie. Największym i najbardziej znanym archiwum internetowym jest projekt Wayback Machine założony przez amerykańską organizację non profit Internet Archive w San Francisco. Od rozpoczęcia swojej działalności w 1996 roku Wayback Machine zarchiwizował ponad 424 miliardy stron internetowych (stan na 10.04.2020 r.)

Opublikowano w: Internet,Nowe technologie
Więcej na podobne tematy: , , ,
// Ronald Muroń Więcej wpisów

Specjalizuje się w prawnych aspektach technologii informatycznych. Interesuje się stosunkami międzynarodowymi, prawem międzynarodowym oraz tematyką gospodarczą

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *