Tartust pärit Ilmar Uduste hakkas huvi andmete vastu tundma juba lapsepõlves, kui nägi, kuidas robot inimesele arvutimängus pähe teeb. Täna töötab 26-aastane Ilmar maailma ühes suuremas tehnoloogiaettevõttes Microsoft andmeinsenerina ja seisab digitaalse innovatsiooni eesliinil. Uurime järele, mis nipiga sai lapsepõlvehuvist karjäär ning kuidas aitab Ilmar kaasa Microsofti missioonile muuta andmed maailma jaoks tähendusrikkamaks. Millist rolli mängib selle kõige juures andmekultuur ja mida see üldse tähendab?
Huvi andmeteaduse vastu tärkas Ilmaris juba lapsena. Peretuttav näitas 10-aastasele poisile, kuidas õpetada roboteid mängima arvutimänge. “Mulle näidati, kuidas on võimalik piitsa ja prääniku meetodil õpetada robotitele, kuidas mängida mingeid tankimänge. Kohe tekkis huvi, et issand, robot võib olla sellistes mängudes targem kui inimene,” meenutab Ilmar. Samamoodi teeb robot inimestele pähe malemängus.
Ilmari tiim jälgib Teamsi kõnede “tervist”
Bakalaureuse tegi Ilmar materjaliteaduses. Õnneliku kokkusattumusena avati andmeteaduse magistriõppekava Tartu Ülikoolis 2020. aastal – aasta pärast seda, kui Ilmar oli bakakraadi kätte saanud. “Mõtlesin, et see on suurepärane viis, kuidas pivotit teha,” naerab ta. Magistriõpingute kõrvalt töötas Ilmar andmeteadlasena, kuid hakkas teise aasta lõpus otsima uut väljakutset. “Nägin Microsofti töökuulutust ja kandideerisin, arvates, et minusugust nad ei võta. Pärast pikka protsessi valiti aga just mind välja ja olen siiani väga rahul,” kirjeldab Ilmar, kuidas sattus endalegi ootamatult Microsoft Eesti meeskonda andmeinseneri ametipostile. Tänaseks on Ilmar sel kohal töötanud poolteist aastat.
Microsofti juures köitis Ilmarit algusest peale võimalus teha tööd, mis mõjutab inimesi üle maailma. Näiteks jälgib tema tiim erinevate võrgukomponentide “tervist” ehk kvaliteeti Microsoft Teamsi kõnede kontekstis. “Kui toimub Teamsi kõne, on tsentraalne server, kuhu kõik osapooled ühenduvad. Server saadab kõigile osapooltele isikustatud heli ja video välja. Meie monitoorime muuhulgas nende tsentraalsete serverite tervist: kui hea on jõudlus, milline on erinevate internetipakkujate võrgu tervis üle maailma ja kohe kui näeme mingit probleemi, saame sellest teistele tiimidele teada anda ja nad saavad hakata seda parandama,” selgitab Ilmar.
Ilmari tiimi ülesanne on ehitada taristut, mis laseb taolistest hädadest automaatselt teada anda. “Kui kuskil piirkonnas on looduskatastroof, saame huvitaval kombel sellest kohe teada Teamsi kõnede kvaliteedi kaudu: näeme, et selles piirkonnas kõnede kvaliteet ja tõenäoliselt ka arv langeb. Samas võib kõnede arv ka tõusta, kuna looduskatastroofide korral jäävad inimesed tihtipeale kodudesse ja teevad kohtumisi veebis,” toob Ilmar näite.
Andmekultuur parandab kliendikogemust ja päästab valeinfo levimisest
Kuidas on see aga seotud andmekultuuriga? Tegelikult väga otseselt – ühtki järeldust ei saa teha andmete pealt, mis on vigased. “Kui meil on terabaitide viisi Teamsi kõnede metaandmeid, tuleb hoolitseda, et andmed näitaksid “õiget asja”. See tähendab, et andmetes ei esineks mingeid andmeridu, andmeväljasid, mis viiksid sind ekslikule teele,” selgitab Ilmar, miks on tähtis andmekultuuri põhimõtteid jälgida. Kui valeinfo liigub ühest üksusest edasi teise ja veel kolmandassegi, peavad lõpuks mitu lüli selles ahelas vaeva nägema, et parandada valeinfo põhjal tehtud järeldusi. “Meie töö on optimeerida protsessi, et ei oleks valeinfot ja teave, mida saame, oleks alati õige – nii saame kohe jälile, milles reaalne probleem seisneb. Andmekultuur on selles väga tähtis aspekt,” sõnab Ilmar.
Valeinfo levikule tuleb tähelepanu pöörata ka tehisintellekti populaarsuse valguses. Pooleteise aasta jooksul Microsoftis on Ilmar tähele pannud, et sissetulevat informatsiooni vaadatakse üha kriitilisemalt, kuna ChatGPT võib “hallutsineerida”. Teisalt on tehisintellekt võimas abiline. “Nüüd on väga tavaline olukord, kus inimene ise ei pea andmeid analüüsima, vaatama tabelist mingisuguseid numbreid või panema neid ise graafikule, vaid AI lihtsalt ütleb sulle, et kuule, siin on mingi anomaalia, siin on mingi probleem, uuri seda täpsemalt,” kiidab Ilmar. Tänu sellele on inimeste aega kõvasti optimeeritud.
Kui firmas on andmekultuur paigas, tähendab see ka klientide vaates, et informatsioon jõuab õigel ajal kohale ega pea topelt üle kontrollima, kas kõik on hästi või mitte. “Kui andmekultuuri ei eksisteeriks, ei pruugiks me teada, kui klientidel on mingi tootega probleeme,” sõnab Ilmar.
Näiteks paar kuud tagasi avastas tema tiim, et üks ühele Teamsi kõnedel oli suur bug sees, mis tähendas, et kõned ei pruugi läbi minna. “Meie saime sellest bug’ist teada viis sammu allavoolu (allavoolu ehk downstream siin tähendab teenuseid, mis kõnekvaliteedi üks teise järel monitoorivad – toim.) seda protsessi, mis peaks need bug’id kinni püüdma. Tänu sellele, et meil on selle kohta automatiseeritud teave, saime üldse teada, et see bug eksisteerib, andsime kõigile osapooltele teada ja siis saadi seda lõpuks parandama hakata,” toob Ilmar ühe näite. “Kui meil poleks automatiseeritud teavet olemas ja andmete visualiseerimine paigas, ei oleks meil sellest veast olnud aimugi,” lisab ta.
Lõppude lõpuks paranes sellest ka kliendikogemus. Usaldusväärsed andmed aitavad säästa aega ning teha juhtidel otsuseid, mis põhinevad faktidel, mitte kõhutundel.
Kui andmed on “prügi”, siis on ka otsused “prügi”
Mida soovitab Ilmar ettevõtetele, kus andmekultuuri veel juurutatud pole? Esiteks on vaja aru saada, millised andmed sul üldse olemas on ja mis nende taga peitub: kust ja miks need tulevad, mis kujul need on. Seda nimetatakse data literacy’ks ehk andmekirjaoskuseks. Tähtis aspekt selle juures on, et oskaksid neid andmeid ka visualiseerida. “Kõige labasem näide: kui näitad firma väärtuse kasvamist ajas, siis ära ole rahul Exceli kõige esimese graafikuga, mis ette antakse, vaid näe andmete visualiseerimisega nii palju vaeva, et ka võõras inimene saab peale vaadates aru, millega on tegemist – mis on graafikult see, mida pean tähele panema,” annab andmeinsener kasuliku soovituse.
Vähemalt sama tähtis on andmete kvaliteet. “Andmeteaduses on levinud ütlus “garbage in, garbage out”, mis tähendab, et kui andmed, mille põhjal sa otsuseid teed, on piltlikult öeldes prügi, on ka need otsused prügi. Lihtsamalt öeldes tähendab see, et hoolitse oma andmete eest,” sõnab Ilmar.
Viimane samm andmekultuuris on andmete automatiseerimine. Selle kohta jagab Ilmar järgmist: “Andmeid on tohutult palju, inimesi ja ressurssi aga vähem, seega kus võimalik, soovitan automatiseerida andmetepõhine teave ära ja leida viise, kuidas optimeerida enda inimeste aega.”