Microsofti kõnerakenduste tõrked lahendatakse tihti juba enne, kui kasutaja midagi märkab. Selleks on oma nipid

Tanel Vakker juhib Microsoftis meeskonda, kelle töö on kõrvaldada tõrked enne, kui kasutajad neid märgata jõuavad. (c) Foto: erakogu
Tanel Vakker juhib Microsoftis meeskonda, kelle töö on kõrvaldada tõrked enne, kui kasutajad neid märgata jõuavad.Foto: erakogu

“See oli 17 aastat tagasi, kui olin Skype’i tööle läinud. Meil oli just tiimi üritus, olime koos väljas ja ka napsu võtnud. Kuni äkki sõitis meile peokoha ette firma üks juhte Ott Kaukver, kamandas meid kõiki autosse ja sõidutas meid Skype’i kontorisse tekkinud suurt tõrget lahendama,” meenutab Tanel Vakker. Üks mees palus ennast poolel teel maha panna, sest IT-süsteemidega tegelemine oleks talle sel hetkel paraku üle jõu käinud.

Sellest ajast on omajagu vett merre voolanud. Skype on vahepeal ühinenud Microsoftiga ja kunagine startup’ilik reeglite puudumine asendunud palju läbimõelduma töökorraldusega.

Meeskond, mida Vakker Microsoftis juhib, tegeleb süsteemivigade otsimisega juba enne seda, kui kasutajad neid üldse märgata jõuavad. “Kui mingi häire tekib, siis ei avasta me seda alles järgmisel päeval, vaid juba pool tundi hiljem,” kinnitab Vakker. Oluline on klienti rahustada, andes märku, et probleemiga tegeletakse.

Selleks peab tema meeskond saama aru, millal anomaaliad tekivad (nüüd teeb seda suures osas küll arvuti, keegi enam kuvaritel pidevalt silma peal hoidma ei pea). Ja kui klient on pöördunud kasutajatoe poole, aga nemad probleemi lahendamisega hakkama ei saa, siis suunatakse ta samuti Vakkeri meeskonna juurde.

Sideettevõtted, klientide keskjaamad ja Microsofti lahendused

Vakkeri meeskonna fookuses on klassikaliste sideettevõtete nagu Telia ja Elisa, kasutajafirmade keskjaamade ning kaasaegseid internetikõnesid pakkuva Microsofti süsteemide Skype’i ja Teamsi omavahel kokku ühendamine. Telefon pole enam ainult laual, vaid kõned võivad kasutajani jõuda näiteks otse läbi Teamsi. Ja kui peaks tekkima probleem, siis tuleb see võimalikult kiiresti ära lahendada.

“Meil on samal platvormil palju erinevaid tooteid. Viise, kuidas asi katki võib minna, on väga palju,” räägib Vakker oma tööst. “Meie meeskond peab sellisel juhul saama aru, millest tema süsteemis viga tuleb.”

Kliendid räägivad päeva jooksul kokku miljoneid minuteid. Vakkeri meeskond peab igal hetkel teadma, kas kõnedega on kõik korras: kas need ühenduvad nii nagu peab, kas kõnede kvaliteet on korralik. Jälgima peab, kuidas töötab Microsofti enda süsteem, aga küsimus on ka selles, kuidas on seis telekomiettevõttes.

Miks kõne läbi ei läinud?

Kuidas siis eristada olukorrad, kus helistaja ei saanud vajalikku inimest kätte süsteemi vea tõttu, juhtumitest, kui kõne vastuvõtja oli hõivatud muude tegevustega ega saanud seepärast lihtsalt vastata? Samas võib mõni klient, kes kohe vajalikku inimest kätte ei saa, helistada talle kümme korda järjest. See näeb välja nagu viga, aga tegelikult pole vaja sellele reageerida, sest viga ei tulnud süsteemist, vaid kõne jäi ühendamata kasutajate endi tõttu.

“Vead, mis tulenevad süsteemist, tehakse kindlaks suurandmete analüüsi põhjal,” selgitab Vakker. “Me ei vaata asja ühe kõne kaupa, vaid suuremat statistikat. Mingi hulk vigu käib elu juurde. Iga vea peale reageerida ei saa, sest selliseid häireteateid tuleb meile miljoneid.”

Microsofti enda süsteemist tulenevate vigade väljasõelumiseks on Vakkeri meeskond välja valinud meetrikad, mille põhjal saab süsteemi toimimise viga kahtlustama hakata. Kõikide kõnede parameetrid salvestatakse ja iga kõne kohta luuakse ülevaated ehk nii-öelda kõnekirjed: kes oli klient, millal kõne algas, millal lõppes ja tuhandeid teisi sarnaseid näitajaid sinna juurde. Samuti salvestatakse vigaste kõnede näitajad.

Näitajad muutuvad päevade, kuude ja riikide lõikes

Andmeid analüüsides vaadatakse näiteks, milline on keskmine kõne kestus või mitu protsenti kõnedest vastu võetakse. Need näitajad muutuvad nii päevade kui kuude lõikes. Seda võrreldakse siis samal päeval varasemate nädalatega. Niimoodi silma jäänud anomaaliate puhul hakataksegi uurima, mis neid põhjustas ja süsteemi vea korral parandama.

Ka riigiti on inimeste käitumine väga erinev. Selleks, et andmeid analüüsida, peab teadma, mis maailma eri nurkades toimub, ja tundma erinevaid kultuure. Vakkeri meeskond jälgib näiteks pidevalt, millistes riikides on parasjagu riigipühad. Sellest sõltub kõneminutite arv väga palju.

“Ja näiteks Jaapanis on lõuna nii püha asi, et sel ajal mitte keegi telefonile ei vasta. Saksamaal seevastu võetakse kõnesid ka lõuna ajal edasi. See väljendub kohe ka meetrikates,” selgitab Vakker.

Intsidentidele oma andmebaas

Kuidas need meetrikad on välja sõelutud? Paljud neist põhinevad interneti standarditele. Harilikult on spetsialistidest koosnevad töögrupid välja töötanud parimad praktikad, kuidas mõnda teenust implementeerida või mõõta.

Siiski peab iga ettevõtte puhul vaatama asja konkreetsemalt just läbi selle ettevõtte.

“Meil on oma sisemine tõrkehaldussüsteem. Iga kord kui ükskõik kus kohas Microsofti tekib mingi anomaalia, jõuab selle kohta teade meeskonnani, kes selle lahendamise eest vastutab,” räägib Vakker.

Vakker ütleb selle kohta intsident. “Intsident on ülevaade vahejuhtumist, raport selle kohta, mis juhtus. Selle kohta saadetakse teade vastutavale meeskonnale. Kui see meeskond asja lahendada ei saa, siis läheb asja kohta teade juba järgmisele.”

Vahel tekib ühest tõrkest väga palju, isegi tuhandeid intsidente. Need koonduvad lõpuks meeskonna kätte, kes oskab probleeme tekitava juurpõhjuse lahendada.

“Meil on palju selliseid intsidente, mida klient isegi ei märka, kus automaatselt tekib mingisugune ümberlülitus. Aga meie analüüsime need ikkagi läbi,” kinnitab meeskonna juht. Nii saab tulevikus oma teenuse veelgi paremaks muuta.

Mis on DigiPRO ja kes seda teevad? Loe siit

Populaarsed lood mujal Geeniuses

Kolm korda nädalas

Telli DigiPRO uudiskiri

Kolm korda nädalas spetsiaalne DigiPRO liikmetele tehtud uudiskiri, et sa midagi olulist maha ei magaks.