Még pár évtized, és semmit sem fogunk tudni a 21. század elejéről

Szerző: Pintér Bence
2019.02.03. 07:51

Zúdul ránk az információ, percenként több adatot generálunk, mint bármikor korábban a világtörténelemben, mégis: ezeket az éveket valószínűleg a digitális sötét középkorként tartják majd számon a jövő történészei. Hiába ugyanis a rengeteg adat, ha nem tudjuk őket kutatható módon megőrizni; márpedig jelenleg még ötlet sincs arra, hogy hogyan kéne ezt csinálni, miközben naponta tűnnek el teljes webes közösségek.

Még pár évtized, és semmit sem fogunk tudni a 21. század elejéről

Tavaly nyáron értekeztünk arról, hogy valójában miért is megismerhetetlen a történelem úgy, ahogy az valójában történt. A román történész, Neagu Djuvara valahogy így foglalja össze: egy adott időpillanat végtelen sok adatot tartalmaz, amit a történész már alapvetően is csak a különféle források szűrőin keresztül, tehát másodkézből ismerhet meg.

Mindehhez pedig hozzájön az, hogy maga a történész is egy ilyen szűrő, hiszen alkata, neveltetése, oktatása, képzettsége, nyelvismerete és elszántsága, valamint az általa feltett kérdés jellege és az általa használt források milyensége is megszabja azt, hogy a szóban forgó történetet hogyan fogja elmesélni.

Djuvara szerint tehát a történelem állandóan változik, a múlt reprezentációját, tehát végső soron a múltat a jelen határozza meg. A jelen azonban egyre csak gyorsul. Vajon meg tudjuk-e majd határozni a múltunkat a jövőben?

Lesz-e miből dolgoznia a jövő történészeinek, vagy a kétezres évek eleje egy sötét folt, egy digitális sötét középkor marad az emlékezetben?

Kezdjük kicsit messzebbről.

Hogyan dolgozik ma egy történész?

Amikor mesterszakos egyetemistaként szakdolgozattémát kerestem, két, számomra kifejezetten érdekes témát vegyítettem. Az egyik a krími háború, amiről bár keveset beszélünk mostanában, több szempontból is fontos fordulópontja a tizenkilencedik századi történelemnek; a másik pedig a magyar sajtó története, ami az adott korszakban különösen érdekes, hiszen a krími háború kezdetén, 1853-ban magyar sajtóélet éppen csak éledezni kezdett a világosi fegyverletétel sokkja és a Habsburg neoabszolutista rendszer felállása után. (Itt el is lehet olvasni egyébként.)

A témaválasztás egyben nagyon kényelmesen behatárolta a használandó források körét, hiszen egészen pontosan azt akartam vizsgálni, hogy hogy néztek ki az újságok egy adott korban, hogy működtek, mit tartottak hírnek, mi tartotta lázban szerzőiket és olvasóikat, hogyan strukturálták az információt. (Ha belegondolunk, az újságírás és a történelemtudomány nem áll messze egymástól: mindegyik a világ eseményeit próbálja feltárni, értelmezni és rendszerbe helyezni. Éppen ezért a sajtó kellő forráskritikával kezelve mindig remek forrás a modern kor történészeinek.) 

A témámhoz passzolt még a korszak két nagy hírlapírójának, Falk Miksának és Kecskeméthy Aurélnak könyvben is kiadott levelezése, és bár ehhez a szakdolgozathoz nem használtam ilyesmit, de más témákhoz forgattam például történelmi szereplők naplóit is.

Mi a közös ezekben a forrástípusokban? Az, hogy papírra írták őket kézzel vagy nyomtatták géppel,

majd ezeket a papíralapú dokumentumokat valakik megőrizték levéltárakban, könyvtárakban és más archívumokban eredeti formájukban, dián vagy digitálisan, esetleg könyvben kiadva.

A krími háború és a magyar sajtó kapcsolatát így egy mesterszakos dolgozatnak megfelelő részletességgel könnyedén be tudtam mutatni: a legtöbb fontos adatot megtaláltam hozzá az Országos Széchényi Könyvtár és a Fővárosi Szabó Ervin Könyvtár állományában, meg az internetes adatbázisokban, csak kicsit kellett pepecselnem diafilmek böngészésével.

Közel sem lesz azonban ilyen könnyű dolguk a jövő történészeinek, akik a huszonegyedik század elejének történéseit próbálják majd felfejteni egy mesterszakos szakdolgozathoz.

És akkor az Úristen megteremtette a Facebookot

Elsőre talán pozitív fejleménynek tűnik a történettudomány szempontjából a tény, hogy mára a bürokrácia, a kommunikáció és a média egyre nagyobb szeletei már alapvetően digitálisan folynak, még sosem volt ennyire összekötve a világ globálisan, még soha ennyi adat nem zúdult ránk a világtörténelemben.

Cikkeket ma már főleg digitálisan olvasunk, Falk Miksa és Kecskeméthy Aurél ha ma élne, a Messengeren chatelne, napló helyett meg ott van a Facebook-newsfeedünk.

Az egyre több általunk generált adatot egyre okosabb, egyre hatékonyabb algoritmikus megoldásokkal tudjuk rendszerezni és keresni, így látszólag egyre jobban megismerhetjük, leírhatjuk és interpretálhatjuk a minket körülvevő világot – legalábbis az adatok egy bizonyos részét tekintve.

Jobban belegondolva ugyanis világos lesz, hogy

óriási problémák fognak tornyosulni azok előtt a történészek előtt, akik a digitális éra történelmét próbálják majd kutatni.

Vegyük sorra ezeket.

1. A nyomtatott sajtó eltűnése

A printlapok nagy előnye, hogy nagyjában-egészében, de legalábbis viszonylag hosszú időszakokon keresztül pontosan ugyanúgy néznek ki, van egy címlap, azon egy vezető anyag, van egy állandó rovatstruktúra.

Ez nem csak azért jó, mert az olvasó (és a történész) könnyen el tud igazodni benne, hanem azért is, mert egy adott hír megjelenésének kontextusa – helye az újságban – nagyon sokat elárul a történésznek arról, hogy milyen jelentősége, szerepe volt az adott ügynek az adott korszakban és az adott lapban.

Mutatok egy példát:

A SAJTÓ MINDEN TÖRTÉNÉSZNEK REMEK FORRÁS (FOTÓ: BUKOVICS MARTIN / AZONNALI)

A Magyar Nemzet napilap utolsó négy megjelent számának címlapja (és kormánypárti újraindítása esetén az új folyam első címlapja) a megfelelő interpretációval, de végső soron önmagában is el tudja mesélni a 2018-as magyar választások történetét.

Az online orgánumok esetén sokkal nehezebb az ilyenfajta kontextusokat és metaadatokat megérteni, hiszen a címlapok percenként változnak, sőt, gyakran egészen máshogy jelennek meg különböző felhasználóknak; illetve egészen más logikák (keresőoptimalizálás, stb.) alapján vannak strukturálva, mint egy printlap címlapja.

Mivel egy adott időpillanatban elérhető címlapot a legtöbb helyen nem lehet reprodukálni (a Mandineren pl. van ilyen funkció, de máshol nem nagyon), ezért a történész nem fogja tudni, hogy egy adott hír milyen súllyal, milyen más anyagok kontextusában, egészen pontosan milyen címlapos, a cikkoldalon láthatótól akár eltérő címmel, képpel és kiajánlóval jelent meg.

Még súlyosabb a helyzet manapság, amikor a legtöbben nem is olvassák konkrétan a lapok címlapjait, hanem a közösségi médiás felületekről érkeznek az oldalakra, hiszen azt még kevésbé lehet majd utólag megmondani, hogy a Facebookon vagy a Twitteren milyen kontextusban került az olvasó elé az adott anyag, ott mondjuk lájkot nyomott rá, vagy mérges fejet.

2. Rendezetlen és megőrizhetetlen adatok

Ha már szóba került a közösségi média. Nyilván mindenki ismeri azt az érzést, amikor egy Facebook-csoportban akár csak pár héttel azelőtti posztot próbál visszakeresni, de a kereső nem találja, ő meg pörgethet vissza kétszáz irreleváns posztot, mire megtalálja azt, amit keres.

Ha valaki nem törődik a korrekt címkézéssel, hashtageléssel az olyan közösségi médiás felületeken, mint a Facebook vagy a Tumblr, akkor megszívta. És megszívják a jövő történészei is,

akiknek ugyan rengeteg rendezett és számszerűsített statisztikai adatuk lehet majd egy sor személyes adatunkról, illetve online viselkedési mintánkról, amivel most ezek a cégek kufárkodnak, de bele fognak őszülni, ha konkrét eseményeket, kapcsolati hálókat, beszélgetéseket, stb. akarnak majd rekonstruálni.

Ahogy a témával foglalkozó kutató, Katrin Weller felhívta a figyelmünket: itt is ugyanúgy probléma ráadásul, hogy maga a felület rendszeresen változik, a Facebook tizenöt év alatt számtalan dizájnváltáson esett keresztül, rengeteg funkcióval bővült, és itt sem feltétlenül mindegy, hogy milyen kontextusban jelent meg egy-egy kontent, hogy használtak egy-egy felületet a felhasználók.

A kultúrtörténet és a mindennapok története szempontjából még nagyobb gondot jelent az olyan kontent megőrzése, ami nem feltétlenül ugyanúgy jelenik meg egyes felhasználóknak. Ilyenek a videójátékok történetei, vagy például a Black Mirror című sorozat legutóbbi interaktív filmje, a Bandersnatch, amit a Netflix platformján lehet megnézni – de mi lesz akkor, ha már nem lesz Netflix?

Ez utóbbi probléma csak egyre súlyosabb lesz, ha elterjed a Bandersnatch-hez hasonlatos interaktív, vagy akár személyre szabott történetmesélés.

3. Zárt fórumok és magánlevelezések

Külön problémát jelent ezen belül, hogy a közösségi médiás posztok jelentős része nem nyilvános, illetve például egy-egy jövőbeli kutatás szempontjából akár kulcsfontosságú Facebook-csoportok nagy része zárt; az egymás közti személyes érintkezés pedig olyan chatalkalmazásokon keresztül folyik, amelyre csak a felhasználóknak és az azt kezelő cégeknek van rálátása. (Meg a szakszolgálatoknak, ha olyan ügyről van szó.)

Lefordítva: ha Kecskeméthy Aurél elment a barátaival sörözni, és ott megbeszéltek egy izgalmas politikai kérdést, akkor azt utána otthon lekörmölte a naplójába, vagy megírta levélben Falk Miksa barátjának,

aki válaszolt, aztán Kecskeméthy ezek nyomán írt egy hét múlva egy cikket. A gondolat kialakulása, mondjuk egy költő esetében egy vers keletkezési körülményei ilyen forrásokból jó közelítéssel kikövetkeztethetőek.

Ha azonban én most egy zárt csoportban megvitatok egy ügyet az ismerőseimmel, majd chaten megbeszélem külön az egyikükkel, hogy a többiek hülyék, aztán posztolok róla valamit nem nyilvánosan a falamra, és végül cikket írok belőle, abból száz év múlva a legjobb esetben is csak a végső produktum, a cikk lesz olvasható. Már akkor, ha...

4. A digitális archívumok sebezhetősége

...ha nem tűnik el a fenébe az egész. A hetekben kisebb szívrohamot kaptam, mikor egy technikai átállás miatt egy időre elérhetetlenné vált a Mandiner.sci-fi archívuma, benne egy sor olyan cikkel, amelyek fontosak nekem. Megvannak egyébként lementve pdf-ben, de akkor is: egész más érzés tudni, hogy a cikk elérhető a világ számára.

Ha számba vesszük, hogy

csak az elmúlt években hány magyar sajtóorgánum zárt be, és/vagy került olyan kezekbe, ahol hosszú távon valójában nem érdeke az új tulajdonosoknak a korábbi tartalom kereshető, használható módon való megőrzése,

akkor máris ráakadtunk egy problémára.

Persze vannak különféle eszközök, ahol nagy nehezen visszavarázsolható egy internetről eltűntetett oldal (pl. az Internet Archive Wayback Machine nevű szolgáltatása), de ezek legtöbbször töredékes pillanatképet adnak, vagy egyáltalán nem működnek, tovább nehezítve a történész dolgát.

De ha kivesszük az egyenletből a direkt eltüntetést, véletlenül is történhet végleges adatvesztés.

Az elmúlt tíz évben háromszor cseréltem számítógépet, és bármennyire is igyekeztem, soha nem fogom már meghallgatni a tizenévesen Guitar Proban írt kottáim jelentős részét, az MSN Messengerben folytatott beszélgetéseim archivált verzióit nem adja már vissza nekem senki, és az iWiW- vagy Hotdog.hu-profilom is nagyjából nyomtalanul tűnt el az internetről.

De a személyes térből a publikusba átlépve is hónapról hónapra tűnik el a kontent, legutóbb például a Tumblr nevű mikroblogszolgáltató vált meg a pornót tartalmazó posztoktól és teljes blogoktól, amivel nagyjából egy évtizednyi szerteágazó kontentet tett napok alatt elérhetetlenné.

És akkor még nem vettük számba azt az eshetőséget, hogy bár a papír könnyen gyullad, a digitális világunk is rendkívül sebezhető, a működtetéséhez nagyon bonyolult és kifinomult, rendkívül energiaigényes rendszerekre van szükségünk, amelyeket tulajdonképpen egy-egy támadás vagy egy világméretű katasztrófa könnyedén ki tud ütni, nyom nélkül eltörölve az egészet.

Felmerül a kérdés: ha tudjuk is archiválni ezeket az adatokat, mi a fenére archiváljuk? Milyen platformra, fizikai adathordozóra, és milyen fájlformátumban?

5. Széttöredezettség

Az egészhez hozzájön még az is, hogy a Facebook, a YouTube és a Twitter nem fedi le a bolygó egészét. Ahogy Katrin Weller egy interjúban már kifejtette: egy Amerikát érő hurrikánról sokkal több bejegyzés lesz az USA-ban, mint mondjuk a Karibi-térségben, mivel az amerikaiak jóval inkább hajlamosak használni a közösségi médiát. Olyan helyekről, ahol mondjuk nincs internet, vagy kevesebb embernek van okostelefonja, sokkal kevesebb ilyen jellegű adatunk lesz.

Ráadásul az internetet, illetve egyes szolgáltatókat cenzúrázzák a világ egy sor országában, sok helyen pedig más közösségi oldalak népszerűek, mint a nyugati világban. Magyarországon például sokkal kevésbé népszerű a Twitter, mint tőlünk nyugatra, Oroszországban a Facebook helyett a vKontakte, Brazíliában az Orkut, Kínában a Twitter helyett a Weibo hasít.

A digitális világ egészét tehát éppen a globalizációt csúcsra járató korban lesz majd a legnehezebb egyben archiválni és megőrizni.

Szakmai szinten egyelőre nincsenek megoldások

A tradíció szerint nagyjából harminc év elteltével tekinthet a történettudomány vizsgálódása tárgyának egy adott időszakot, tehát jelenleg „hivatalosan” 1989, a rendszerváltás környéke számít már történelemnek. Ez azt is jelenti egyben, hogy a fent vázolt problémák a század közepén fognak igazán fejfájást jelenteni a történészeknek, akik megpróbálják majd összerakni, hogy akkor hogyan is volt Trump megválasztása, vagy a brexitszavazás. Tenni azonban most tudnánk az ellen, hogy ez az időszak sötét folt legyen a történelemben.

Bár a probléma meglétét már regisztrálták egyesek, nagy beszélgetés egyelőre nincs a történész- és levéltáros szakmában arról, hogy mit is kéne tenni.

Ezt erősítette meg Lugosi András, a Budapesti Fővárosi Levéltár főlevéltárosa is, amikor telefonon kerestük. Szerinte egyértelműen fontos a probléma, hiszen a közszereplők hivatalos csatornái mellett – amelyet alapvetően is érdemes a levéltáraknak megőrizni – a közösségi média fontos forrásanyag lesz a huszonegyedik század mindennapjainak történetéhez.

Szerinte teljes mértékben megoldatlan egyelőre, hogy hogyan és milyen szempontok alapján folyhat le a közösségi médiás tartalmak esetében az iratértékelés – az a folyamat, ami eldönti, hogy érdemes-e levéltári megőrzésre az irat, hiszen egy levéltárnak sem lesz akkora tárolókapacitása, ahol mindent meg lehet őrizni. Nyilván a digitálisan születő források esetében teljesen új módszertanra lesz szükség.

Bármilyen megoldás is születik a jövőben a közösségi médiás tartalmak levéltári megőrzésére, az a fontos hogy az adatok kereshető, rendszerezett formában megmaradjanak addig. Ez pedig szerinte jelenleg elsősorban a szolgáltató magáncégek felelőssége.

Persze van felelőssége a levéltárosoknak is, mégpedig az, hogy készüljön dokumentációs stratégia arról, hogy például a Budapesti Fővárosi Levéltár szempontjából mely tartalmak számítanak maradandó, megőrzendő értéknek az online tartalmak közül.

Lugosi szerint ilyen tartalom például a Budapest régi képeken nevű Facebook-csoport, vagy a Gangvégek, avagy egyszer a körfolyosó is véget ér nevű Facebook-oldal, ahol nem csak a fotóanyag, de a hozzájuk tartozó viták és kommentfolyamok is megőrzésre érdemesek.

Némi párbeszéd azért van már a témáról, például tavaly a ELTE-n elindult a Digitális Bölcsészet folyóirat, benne rögtön egy tanulmánnyal a webtérről mint történeti forrásról.

Mit kéne tenni?

Mint azt például a Franz Kafka után maradt dokumentumok hányattatott sorsa nyomán láthatjuk, egyébként sem egyszerű dolog a történelmi forrásokat hozzáférhető módon megőrizni, hát még akkor,

ha a képletbe bevesszük azokat a közösségi médiás cégóriásokat, akik vagy létezni fognak akkor, vagy nem, és vagy együttműködőek lesznek, vagy nem.

Eddig egyedül a Twitter foglalkozott komolyan a kérdéssel, akik 2010-ben bejelentették, hogy a mikroblog-oldal teljes archívumát az amerikai Library of Congress (LoC) fogja rendezni. Aztán a következő években semmi nem derült ki a projektről, az oda érkező kutatók nem fértek hozzá az adatbázishoz, végül 2018-ban az ambíciózus projektet bezárták, és bejelentették, hogy innentől kezdve csak szelektálva őriznek meg tweeteket: főleg közszereplőkét, vagy fontos eseményhez, például választáshoz kapcsolódó bejegyzéseket.

Erről a buktáról írt cikket Axel Bruns, a Queensland University of Technology Digitális Média Kutatóközpontjának professzora, akitől megkérdeztük, hogy ő egyáltalán el tud-e képzelni olyan módszert, amivel meg lehet őrizni a közösségi médiás tartalmakat.

Bruns szerint ez egyáltalán nem lehetetlen, a Twitter és az LoC projektje is megvalósítható lett volna, ha egy digitális megőrzéshez jobban értő intézményt bíznak meg vele, és a Twitter is komolyabban foglalkozik az üggyel, nem csak azért, hogy pár napig legyen némi pozitív médiavisszahangjuk.

„Ma is ugyanúgy lehetséges lenne az akkor javasolt módon lemásolni a Twitter saját adatbázisát.

„Persze ki kell bogozni azokat a kérdéseket, hogy mit kezdünk az azóta törölt tweetekkel és felhasználókal, illetve hogy milyen módon biztosítunk hozzáférést az adatbázishoz a kutatóknak, de ezt meg lehet oldani” – írta nekünk Bruns. (A politikusok törölt tweetjeit egyébként például a Politwoops nevű projekt ma is gyűjti.)

De a Twitter esetében sem elég megőrizni a publikus tweeteket, hiszen ezekben gyakran vannak linkek vagy képek. A linkek ráadásul nem az eredeti URL-lel, hanem a Twitter URL-rövidítőjével (t.co) átfuttatva jelennek meg gyakran, ha pedig ez a jövőben megszűnik, nem fogjuk tudni, hogy hová mutattak egyes linkek.

Egy kutatás során már ők is belefutottak ilyen problémába: Mitt Romney republikánus elnökjelölt ugyanis saját URL-rövidítőt használt a kampány alatt (mi.tt), amely azonban a kampány után röviddel már nem működött, így nem tudjuk, milyen oldalakra linkelt a politikus profilja egy-egy tweetben.

A kutató szerint más platformok, mint a Facebook, komolyabb problémát jelentenek az általunk fent vázolt problémák (nem nyilvános posztok, zárt csoportok) miatt. Bruns nem lát egységes megoldást erre a problémára, mivel bármilyen adatátengedés sértené a felhasználók jogait. 

Az egyedüli útnak azt látja, ha a felhasználók, illetve örököseik önkéntesen megosztják a releváns adatokat az archívumokkal.

De még ez a megoldás is kérdéses, hiszen az így létrejövő adatbázisok eléggé esetlegesek lesznek, ráadásul ha én megosztom a Messenger-üzeneteimet egy archívummal, abban nyilván ott lesznek más felhasználók nem publikusnak szánt adatai is.

Az archiválás magányos harcosai

Mivel egyelőre sem a történészszakma, sem az állami, sem pedig a magánszereplők nem foglalkoznak átfogóan a kérdéssel, maradnak az underground megoldások. Egy ilyen projektet hívott életre Jason Scott, aki korábban sikeres erőfeszítéseket tett, hogy archivált formátumban megőrizze az internet előtti idők internete, a bulletin board system nagy szeletét.

Scott 2009-ben indította el az Archive Team nevű projektet, amelynek kifejezett célja, hogy a megszűnő/eltűnő weboldalak, közösségi hálók adatait archiválják.

Az Archive Team lelkes önkéntesei archiválták a Yahoo által megszüntetett, kilencvenes években népszerű webtárhely-szolgáltató, a Geocities adatbázisának egy részét 2009-ben, amit egy 652 gigbájtos torrent formájában bárki letölthet magának, vagy megnézheti a neten. Ugyanígy archiválták a 2014-ben megszüntetett TwitPic képmegosztót, de foglalkoznak például a fent említett URL-rövidített linkek archiválásával is, illetve igyekeztek megmenteni a Tumblr pornótartalmait is, amiről fent már tettünk említést, de a szolgáltató letiltotta őket.

A közösségi médiás tartalmak megőrzésére koncentrál a Shift Design, a University of Maryland és University of Virginia közreműködésében működő Documenting the Now, főleg történelmileg jelentősnek tűnő események kapcsán gyűjtik össze a vonatkozó nyilvános posztokat. De – mint egy olvasónk jelezte – ilyen projekt az Országos Széchenyi Könyvtár Webaratás-projektje is, amihez kapcsolódóan tavaly konferenciát is rendeztek. Itt is a nyilvánosan, .hu domain alatt elérhető weboldalak jelentik a fő profilt.

A digitális sötét középkort csak mi tudjuk megelőzni

Egy biztos: a jövő felől tekintve abszurdnak fog tűnni, hogy ha meg is marad valami a kétezres évek első felének szerteágazó webes kultúrájából kutatható módon, azt jelen állás szerint főleg egy csapat önkéntesnek köszönhetjük majd, akik szabadidejükben – és gyakran a techóriásokkal szembeszállva – archiválták azt, amit lehetett.

Mivel a probléma egyelőre se jogi, se technikai, se elvi szempontból nincs igazán megoldva; a szereplők pedig sokrétűek a magáncégektől kezdve a közpénzből működő levéltárokon és állami szerveken át a nonprofit önkéntesekig, ezért végső soron az marad, hogy mi magunk igyekszünk minél több adatot és emléket megőrizni az online jelenlétünkből.

Ha mi magunk lementegetjük a Twitter- és Facebook-profilunkat és beszélgetéseinket, és jól elrakjuk őket külső winchesterekre, vagy esetleg visszatérünk elődeink módszereihez, és igyekszünk fontos dolgokat mondjuk papíralapon is megőrizni, akkor máris sokat tettünk azért, hogy

egy történész ötven év múlva ne csak annyit tudjon írni erről a korszakról, hogy WTF.
Pintér Bence
Pintér Bence az Azonnali külsős munkatársa

Nappal újságíró a győri Ugytudjuknál; éjszaka fantasztikus irodalomról író blogger.

olvass még a szerzőtől

Tetszett a cikk?

Az Azonnali hírlevele

Nem linkgyűjtemény. Olvasmány. A Reggeli fekete hétfőn, szerdán és pénteken jön, még reggel hét előtt – tíz baristából kilenc ezt ajánlja a kávéhoz!

Feliratkozásoddal elfogadod az adatkezelési szabályzatot.

Kommentek