Andmemahud on viimase paarikümne aastaga pea hoomamatult kasvanud ning seda hea põhjusega. Digimaailm on muutunud kvaliteetsemaks, andmed põhjalikumaks ning nutikad tööriistad veelgi nutikamaks. Kõige kasuliku kõrval on aga mühinal kasvanud ka digiprügi hulk ning kui me selle probleemiga teadlikult ei tegele, varitseb nurga taga reaalne oht olla varsti silmini kasututesse andmehulkadesse uppuda. Elisa ärikliendiüksuse juht Artur Praun kirjutab, et see pole halb ainult jätkusuutlikkuse vaatest, vaid mida aeg edasi, seda käegakatsuvamaks muutub ka äriline risk.
Tehnoloogiliste võimaluste kasvades kasvavad ka meie salvestusvajadused. Mida suurema resolutsiooniga pilte me teha suudame, seda rohkem need pildid ka salvestusruumi nõuavad. Mida rohkem tahame talletada klientide andmeid, seda enam tuleb hankida pilveruumi. Kui veel 2000ndate algul oli ühe maailma populaarseima telefoni – tänaseks kultusstaatuse omandanud Nokia 3310 – mälumaht hämmastavad 1 kilobaiti, siis täna on kõige väiksema iPhone’i salvestusruum 64 gigabaiti. See on loomulik osa tehnoloogilisest arengust.
Küll aga ei ole loomulik see, kui hakkame säilitama kõike digitaalset lihtsalt sellepärast, et me saame. Kahjuks oleme täna aga suuresti sinna punkti jõudmas. Oma osa on siin mängida meil kõigil, kes me ei viitsi tšekkidest tehtud fotosid pilvest ära kustutada, kuid mastaapide vaatest on probleemi eesotsas siiski suured ettevõtted ja organisatsioonid, kes ei viitsi, taha või oska mõistliku andmehaldusega tegeleda. Sest lihtsam on pilvekettale ruumi juurde osta ja kõik justkui vajalik sinna lükata.
Aga see ei ole jätkusuutlik ega mõistlik.
Andmetel peab olema mingi väärtus
Põhiküsimus, millele andmete talletamise teema puhul alati vastust vajame, on see, miks andmeid kogutakse või miks me neid üldse alles hoida tahame. Nii ettevõte kui eraisik peaksid suures pildis teadma, mis tulemusi, järeldusi ja analüüsi täna alles hoitavate andmete pealt tulevikus teha saab. See on pealtnäha lihtsa vastusega küsimus – kõiki andmeid on ju vaja, äkki kunagi kuluvad ära! Aga kui veidi sügavamalt mõelda saab igaüks aru, et nii asjad siiski pole.
Ajaloolised raamatupidamisandmed on mõistagi kasulikud, aga miks on vaja kümne aasta pärast teada, mis veebilehitsejat kasutas klient X ostes toodet Y?
Peamine andmete kogumise mõte seisnebki lõpuks ju selles, et nende pealt saab teha otsuseid. Näiteks selgitada täpsemini välja, mis klientidele meeldib, mis ei meeldi, mis on konkreetne tagasiside iga toote või teenuse kohta. Andmed sellise tagasiside kohta on väga olulised ja aitavad näha ning selgitada mustreid ja trende, mille põhjal saab neid samu tooteid ja teenuseid ka paremaks muuta. Sageli moodustavad sellised väärtuslikud andmed aga vaid väikese osa ettevõte andmepangast, samas kui andmemaht pidevalt kasvab.
Seega kui mingite andmetega pole ikka midagi peale hakata, siis pole neid ka mõtet hoida. Muidugi on vajalikkus iga inimese ja iga ettevõtte puhul suhteline ja sõltub tugevalt sellest, mida teha tahetakse. Aga pole olemas kedagi, kes vajaks alati kõiki andmeid. Andmehorder olla on lihtne, aga see pole midagi, mille üle uhkust tunda. Pigem on tegu probleemiga: kuskil faasis on jäänud tegemata mõistlik otsus selle kohta, mida me päriselt teha tahame.
Ka pilv jookseb elektri ja vee peal
Andmete liigtalletamine pole ka pelgalt hüpoteetiline või filosoofiline probleem. See on midagi, millel on käegakatsutav mõju loodusele, firma rahakotile ja ärilisele edukusele.
Kui füüsilises maailmas näeme oma silmaga, kuidas laoruum ebavajalikku koli täis saab, siis pilves andmeid säilitades kipub lao täitumise tunne ära kaduma. Piisab vaid klikist ja natukesest rahast, et laopinda veelgi juurde saada. Pilv on müstiline loom, mis suudab süüa lõputus koguses bite-baite, ilma, et keegi selle pärast liialt muretsema peaks.
Aga asuvad ka need pilves olevad andmekillud lõpuks ikkagi füüsiliselt kuskil serveriruumis, tihti isegi kahes-kolmes serveriruumis. Need andmekeskused omakorda vajavad töötamiseks nii elektrit kui vett. Andmekeskustes asuvad serveriruumid kulutavad aga iga-aastaselt aina rohkem energiat ja seda üsna meeletutes kogustes. Rahvusvahelise Energia Agentuuri andmetel olid andmekeskused 2020. aastal vastutavad ligi protsendi eest kõigist süsinikheidetest.
Ehk lihtsamalt öeldes – igal sinu failil on reaalne ökoloogiline jalajälg.
Mida rohkem üks ettevõte digiprügi kogub ja andmeruumi – olgu see maja enda serveriruumis või pilves – kasutab, seda suuremaks see jalajälg paisub. Ja digiprügi toota on meeletult lihtne: saame selleks lugeda kõike alates vanade töötajate emailidest, mida ei kustutata ära, vaid arhiveeritakse, kuni suvaliste kasutuid andmeid täis Exceliteni.
Sel kõigel on ka rahaline mõju
Andmete ökoloogilise jalajälje kõrval on digiprügi kogumisel veel teinegi tuntav negatiivne mõju – ressurssikulu. Liigkogumine teeb paratamatult igapäevase töö keeruliseks ja tüütumaks. Mitte ainult ei tule ettevõttel maksta aina rohkema pilveruumi eest, vaid ka nende ebavajalike andmete vahel navigeerimine muutub ajapikku keerukamaks ja aeganõudvamaks. Mida rohkem ja pikema ajaperioodi jooksul neid andmeid ka tekib, seda tõenäolisemalt kaob nende üle ka kontroll. Inimesed vahetuvad, kaob ülevaade selle üle, kus ja mida hoitakse.
Ja mida keerulisem on häid andmeid ära kasutada, seda suurema ärilise riski ettevõte võtab. See risk on kiire tekkima, kui ükspäev enam kasulikku infot kasutust eristada ei suudeta. Või seda lihtsalt üles ei leita.
Tähelepanuta ei saa ka jätta kõike turvalisust puudutavat. Erinevat sorti andmetele kehtivad erinevad karmid nõuded ja mida rohkemat alles hoida, seda keerulisem on seda kõike lõpuks hallata.
Asjade omasoodu tiksuma jätmine ja nendega õigel ajal mitte tegelemine võib aga tulevikus valusalt kätte maksta. Seega on iga andmekild korraga nii tugevus kui nõrkus – oluline on alles jätta vaid see, mille puhul nende kahe äärmuse vahel kõikumine mõistlik investeering on.