2010. április 12., hétfő

Az adatmennyiség története

Amikor Alexandriában létrejött az első igazi könyvtár, akkor ez – többek között – azt eredményezte, hogy „létrejött a kritikusok első iskolája”. Ez aztán „olyan módszereket fejlesztett ki, melyek majd csak a könyvnyomtatás korában terjednek el”, jegyzi meg a média társadalomtörténetét tárgyalva az Asa Briggs – Peter Burke szerzőpáros. Innentől kezdve az információkezelés története a rendelkezésre álló információmennyiség változásainak történeteként is leírható.
Valószínűleg az Alexandriai Könyvtár volt az első olyan hely, ahol több információt tároltak egyszerre, mint amennyit egy ember az élete folyamán fel tudott dolgozni, és hasonló állapot csak a könyvnyomtatás elterjedésekor állt elő.
Az első „információrobbanásra” ekkor került sor: egy itáliai szerző már 1550 körül arra panaszkodott, hogy „annyi a könyv, hogy még arra sincs időnk, hogy a címüket elolvassuk”, és minden bizonnyal ez az egyik fordulópont az emberiség történetében, mert a nem a túl kevés, hanem a túl sok információból fakadó problémák – katalógusok és keresőgépek ide vagy oda – azóta is velünk vannak.
A második „információrobbanást”: az internet elterjedését követően a rendelkezésünkre álló információk mennyiségének további növekedése azt eredményezte, hogy az úgynevezett „surface web” egyre inkább elkülönül az „mély webtől”, és ez utóbbi a egyre inkább elérhetetlen a hagyományos search engine-ek számára, mert egyszerűen kicsi hozzá a kapacitásuk.
De ezzel még nincs vége a történetnek. Ma még úgy gondolunk az elektronikusan tárolt információra, mint amik túlságosan könnyen hozzáférhetetlenné válnak vagy megsemmisülnek. Viszont arról sem szabad elfeledkeznünk, az 1930-ban kiadott 10,047 különböző könyvből az ezredforduló után mindössze 174 létezett nyomtatott formában (azaz kevesebb, mint 2 százalék). Amennyiben viszont digitálisan tároljuk őket, úgy másolatot is gyakorlatilag költségmentesen tudunk róluk előállítani, és így hosszú távon is fennmaradhatnak. Az pedig, hogy kezdetben inkompabilitiási problémák voltak, nem meglepő: a vasút története is azzal kezdődött, hogy az USA-ban fél tucat különböző sínszélességi szabványt használtak.
Vagyis az effajta problémák meg fognak oldódni, és a digitális adattárolás éppen, hogy nem az adatok megsemmisülését, hanem fennmaradását fogja eredményezni. És ehhez fog járulni például a lifelog, amikor már a folyamatosan videóra rögzített életünket is tároljuk (ami ismét csak iszonyatos mennyiségű adatot jelent), és így tovább.
Ami a jövőt illeti, elvileg persze semmi akadálya sincs, hogy továbbra is ugyanúgy törekedjünk minden információ megőrzésére, mint ahogy azok is teszik, akik soha nem törlik a leveleiket (mivel a szolgáltató elég helyet biztosít a számukra). Az pedig más kérdés, hogy a legtöbbre egyszerűen soha többé nem lesz szükségünk, és nyugodtan megszabadulhatnánk tőlük - például olyan algoritmusokat használva, amelyek mérlegelik, hogy mit érdemes megtartani, és mit nem.
És ugyanezt megtehetnénk nagy léptékben is, általában véve a tárolt információkkal. Egy az adatvesztést meg az adatfelhalmozást felváltó „tudatos törlésre” való átállás persze korántsem lenne egyszerű, és valószínűleg majd az fog dönteni a lehetséges stratégiák között, hogy az összes adat tárolásához szükséges hardver bizonyul-e drágábbnak, vagy pedig a módszeres leválogatás.