Tallinnas käib töö lahenduse kallal, mis aitaks üle maailma videokõneväsimusest jagu saada!

Microsoft Eesti vanem-audioinsener Patrick Marmaroli.Foto: Microsoft

Kui räägitakse videokõnedest või -koosolekutest, mõeldakse – nagu nimetuski ütleb – eelkõige videopildile, ent vahest tähtsamgi on heli. Ilmselt teab tänaseks juba igaüks omast käest, et kehva heliga koosolek, kus üks ei kuule teist ega teine kolmandat, on paras peavalu. See on ka üks põhjustest, miks meil on tänapäeval olemas väljend nagu “videokõneväsimus“. Kui räägid, aga pooled sõnad ei kosta või jookseb midagi poole jutu pealt kokku, siis ongi väsitav!

300 miljonit kasutajat, 300 miljonit eri tingimust

Videokõneplatvormid, nagu Microsoft Teams, on viimaste aastatega saanud igapäevase töörutiini lahutamatuks osaks, eriti ettevõtetes, kus saab töötada kodu- või hübriidkontoris. Koroonaajast saati on nõudlus selliste platvormide järele hüppeliselt kasvanud. Üha enam kasutatakse neid ka hariduses ja telemeditsiinis (st tervishoiuteenuste osutamisel, kus patsient ja arst või õde ei asu samal ajal samas kohas ning saavad suhelda vaid sidevahendite abil).

Sellepärast ongi Microsoftis inimesed nagu Patrick Marmaroli, kelle tööks Microsofti Tallinna kontoris on panna videokõned kõlama nii hästi kui võimalik. “Kõne helikvaliteeti võib mõjutada terve hulk tegureid, nende hulgas töökoha akustilised tingimused (taustamüra ja kaja), seadmete kvaliteet (mikrofonid, kõlarid, kõrvaklapid), kaugus seadmetest ja isegi interneti kiirus,” selgitab vanem-audioinsener. Kuna Teamsi kasutab igas kuus üle 300 miljoni inimese, kes teevad kõnesid nii kodust, kontorist, kohvikust, rongist, tänavalt, metsast kui ka veel sajast teisest kohast üle maailma, tuleb Microsofti audioinseneridel arvestada iga võimaliku stsenaariumiga.

Paljudele sellistele stsenaariumitele annab vastuse AI ehk tehisintellekt. AI-mudelid suudavad juba praegu efektiivselt reaalajas eemaldada kaja ja summutada taustamüra. Tehisaru teeb vahet müral ja kõnel. “Kui sööd kõne ajal midagi krõbisevat, siis teine osapool seda ei kuule,” toob Marmaroli ühe lihtsa näite.

2022. aastal võttis Microsoft kasutusele DeepVQE, tehisintellekti toega heli digitaalse signaalitöötluse, mis on integreeritud Teamsi, ning Windowsi mikrofonide heli töötluse protsessi süsteemi Voice Clarity, mis tagab optimaalse kõnekvaliteedi ka siis, kui kasutaja liigub või on oma sülearvutist kaugel. Kui varem oli Voice Clarity saadaval vaid Surface’i seadmetele, siis tänavu muutub see Windows 11 sisseehitatud helitöötlusobjektiks ja jõuab nii laiema kasutajaskonnani.

Microsoft lubab kõnesid töödelda vaid sertifitseeritud seadmetel

Samal ajal töötavad ka kõrvaklappide ja kõlarite tootjad selle kallal, et tagada parim võimalik helikvaliteet. Mõned tootjad integreerivad isegi oma toodete spetsiifikale vastavalt kohandatud riistvaralises kiibis töötavaid signaalitöötluse algoritme. “Olukordades, kus parema helikvaliteedi tagab seade ise, saab Teams signaalitöötluse üle anda seadme enda algoritmidele, mis vähendab arvuti protsessori koormust ja pakub kasutajale peenhäälestatud täiustusi,” selgitab Marmaroli.

Igal mündil on aga kaks külge – juhul kui helikvaliteet on mingil põhjusel ikkagi kehv, ei pruugi sel olla negatiivne mõju ainult kasutajale, vaid ka Microsofti mainele. Seetõttu lubab Microsoft seadme enda signaalitöötlust hallata ainult sertifitseeritud seadmetel, mis vastavad Microsoft Teamsi helitesti nõuetele (Audio Test Specifications).

Sellele sertifitseerimisprogrammile aidatakse kaasa ka Tallinnast Akadeemia teel asuvast endisest Skype’i majast. Audioinsener Ergo Eskeni juhitud Meedia Võrdlusanalüüsi tiim teostab heliteste, seab paika heli seadistused ja mõõtmismeetodid ning tagab nii vastavuse telekommunikatsioonistandarditele, lähtudes aastatepikkusest kogemusest, mis on pärit juba Skype’i ajast.

“Meie audiolabori testid on loodud selleks, et kehtestada standardiseeritud protseduurid, tagades ühtsuse kõikides testimisrajatistes ja võimalikult lähedaselt, peegeldades reaalse maailma kasutustingimusi,” selgitab Marmaroli. Tema sõnul on peamine eesmärk hinnata seadme võimet häält tõhusalt salvestada ja taasesitada, vähendada müra, kõrvaldada kaja, hallata topeltkõnet ning reageerida akustilistele muutustele nii kajavates kui ka ideaalsetes akustilistes tingimustes. Lihtsamalt öeldes tähendabki see, et süsteem peab vett pidama igas olukorras.

Tallinnas tehtav põhjalik sertifitseerimisprotsess aitab luua ülemaailmseid kõrgeid helikvaliteedi standardeid videokõnedele ja veebikoosolekutele, et suhtlus oleks selge ja efektiivne erinevatel platvormidel ja seadmetel.

Mis on DigiPRO ja kes seda teevad? Loe siit

Populaarsed lood mujal Geeniuses

Kolm korda nädalas

Telli DigiPRO uudiskiri

Kolm korda nädalas spetsiaalne DigiPRO liikmetele tehtud uudiskiri, et sa midagi olulist maha ei magaks.