Kajavaba ruum ning pea ja kõrva simulaator: Microsofti Eesti arenduskeskuse audiotiim kasutab töövahendeid, millest paljud ei ole kuulnudki

Need näota mannekeenid aitavad Teamsi kõnede kvaliteeti paremaks muuta.Foto: Evert Palmets

Kas oled Microsoft Teamsis koosolekut pidades kuulnud läbi kellegi mikrofoni ebameeldivat sahinat, tüütut kaja või kukkunud hoopis musta auku, kust enam midagi kuulda ei ole? Võib-olla on murekohaks saanud hoopis Bluetooth kõrvaklapid, mis ei taha mingi hinna eest arvutiga ühenduda? Nendele ja paljudele teistele probleemidele aitab lahendusi leida Microsofti Eesti arenduskeskuses töötav audioinsener Ergo Esken.

Ergo töö on töötada välja audioseadmete tehnilisi nõudmisi. Selleks tuleb tal testida kõikvõimalikke seadmeid alates kõrvaklappidest ja mikrofonidest kuni soundbaride ja videotelefonideni ning tagada, et need vastaksid Microsoft Teamsi nõuetele. Erinevate seadmete kasutusjuhtude etteaimamine nõuab loomingulist lähenemist ja ontlike töövahendite kasutamist, kuid tänu Ergo tööle muutuvad kasutajasõbralikumaks nii Teams kui ka Skype.

Ergo Esken. Foto: JP Hion

Sinu tiimi fookuses on eelkõige Teams, kuid millisel määral tegeletakse Eestis jätkuvalt Skype’i audiokvaliteedi parendamisega?

Viimastel aastatel on meie peamiseks fookuseks tõesti saanud Teams. Skype’i ja Teamsi kasutajaliidesed näevad välja erinevad, aga kõne tegemiseks kasutatavad tehnoloogilised lahendused, audio- ja videoseadmete käitamine, müratasandus ja kaja eemaldamine toimivad põhimõtteliselt samal koodil. Suur osa sellest, mida teeme, on kasulik mõlemale teenusele. 

Nüüd on juurde tulnud ka Azure Communications Services, arendusplatvorm audio-video kõnede tegemiseks, mille peale saavad Microsofti partnerid ehitada endale sobiva kliendilahenduse. Selle “hammasrattad” on ka Teamsi ja Skype’i veebikliendi tehnoloogiaga sarnased.

Milliste probleemide lahendamisega audio sertifitseerimise tiimis tegeletakse?

Üldjoontes tegeleme Teamsi jaoks ehitatud ja optimeeritud seadmete jaoks testide arendamisega. Nende testide edukal läbimisel saavad need seadmed Teamsi jaoks sertifitseeritud. 

Näiteks anname peakomplektidele välja Premium Microphone for Open Office sertifikaati. Neid peakomplekte laboris testides ei katseta me ainult, kuidas hääl vaikses keskkonnas läbi mikrofoni kostab, vaid kasutame segajat, mis loob efekti nagu lobiseks läheduses pidevalt teine inimene. Selle sertifikaadiga peakomplektid suruvad seda jutuvada tugevalt maha, kuna kasutavad ka mikrofoni signaali teel aktiivset mürasummutust. Sellised seadmed on kasulikud näiteks avatud kontoris, kus keegi istub sinu vastas või kõrval.

Praegu lahendame Bluetoothiga seotud probleeme ja töötame selle kallal, et saaks laialdasemalt kasutada seadmesse sisseehitatud Bluetoothi funktsionaalsust. Tänaseni kehtib Teamsi jaoks sertifitseeritud seadmetele nõue, et kõik Bluetoothi peakomplektid peavad tulema Bluetoothi USB dongliga, sest sülearvutitesse sisseehitatud Bluetoothi kiibistik on sageli tohutult erineva kvaliteediga. See kas ei tööta ühe või teise peakomplektiga või ei paaritu seadmetega üldse. Kõne halvas kvaliteedis kipuvad inimesed sageli süüdistama kõrvaklappe või mikrofone, kuid tegelikult võib olla murekohaks hoopis arvutisse sisseehitatud Bluetooth kiip, mis ei toeta vajalikku audio koodekit. 

Tahame tagada, et vähemalt kõik Windowsi sülearvutid töötaksid probleemideta olukordades, kus ilma donglita Bluetoothi peakomplekt arvutiga paaritatakse. Telefonide maailmas on selles valdkonnas asjad juba päris hästi, aga sülearvutitega on veel probleeme.

Pea ja kõrva simulaatori saab rääkima panna mehe ja naisena mistahes keeles. Foto: Evert Palmets

Sa kasutad töövahendeid, millest paljud inimesed ei ole kuulnudki. Üks nendest vahenditest on mannekeeni meenutav pea ja kõrva simulaator. Milleks selline seade ja mida sellega tehakse? 

Pea ja kõrva simulaator võimaldab korratavat testimist, mis on audio testimise ja sertifitseerimise maailmas oluline. Mina võin Tallinnas mingid spetsifikatsioonid valmis teha, kuid Teamsi jaoks testivad seadmeid ka laborid Floridas ja Taiwanis ning mujal maailmas. Kui testime näiteks mõnda peakomplekti, siis kõigi kolme labori tulemused peavad välja tulema identsed. Pea ja kõrva simulaator tagab, et testid oleksid korratavad ja kõik saaksid täpselt samad tulemused.

Pea ja kõrva simulaatoril on suu kohal avaus ning sisseehitatud kõlar. Teda võib rääkima panna mehe või naise häälega mistahes keeles. Eesmärk on simuleerida reaalset elu, seega simulaator kõlab nagu päris inimene. Mannekeeni kõrvades on mikrofonid, mis tähendab, et ta kuuleb läbi testitava kõrvaklapi tulevat kõnet ja suudab selle ära salvestada. See võimaldab ära mõõta nii mikrofoni kui kuulari tundlikkuse, signaali ja müra suhte, sageduskarakteristiku ja palju muid omadusi, mis näitavad, kui kvaliteetse kõrvaklapipaariga tegu on ning kas seade vastab Teamsi sertifitseerimise nõuetele.

Kui mannekeeni eesmärk on simuleerida reaalset elu, siis miks mitte kasutadagi testimisel päris inimest?

Sõltuvalt näiteks meeleolust või tervisest ei räägi reaalne inimene kunagi kaks päeva järjest identselt. Kui mul on nina kinni või hääl ära, siis mu kõne sagedusspekter on hoopis teine. Testimise eesmärk on saada korratavaid tulemusi ning inimesi kasutades ei ole see võimalik.

Lisaks pea ja kõrva simulaatorile on teil kontoris olemas ka kajavaba ruum. Milleks seda kasutatakse?

Kajavabas ruumis saab isoleerida testitava seadme ümbritsevast maailmast. Kui tahan välja selgitada näiteks mikrofoni omamüra detsibellides, siis ma ei saa seda testida tavalises argises keskkonnas, kus ümberringi on inimesed ja jutuvada. See kõik läheb mikrofoni sisse ja rikub mõõtmise tulemused ära. Kajavabas ruumis on piisavalt vaikne, et kätte saada testitava seadme müranivoo. Iga mikrofon teeb müra, aga kajavabas ruumis võib kindel olla, et tuba on igatahes mikrofonist vaiksem.

Igas tavalises füüsilises ruumis tekivad akustilised seisulained. Näiteks võib sageduskarakteristikusse tekkida 400 hertsi peale võimendus ja 500 hertsi peal on auk. Kui muuta seadme asukohta ruumis, siis need sagedused nihkuvad. Kajavabas ruumis seda probleemi ei ole, sest seal sumbub heli täielikult seina sisse ära, mitte ei peegeldu tagasi. See võimaldab mõõta, mida teeb seade ise ilma ruumi mõjuta ning on taaskord oluline just korratavuse seisukohast. Kui mõni meie partner saab uut seadet arendades oma laboris mingid tulemused ja saadab seadme meile sertifitseerimiseks, siis meie võiksime saada samad tulemused. Ilma kajavaba ruumita seda ei juhtu, kuna keskkonna mõju mõõtmisele on liiga suur.

Pea ja kõrva simulaator kajavabas ruumis. Foto: Evert Palmets

Millistele probleemidele lahenduste leidmine on osutunud sinu tiimi jaoks kõige keerulisemaks?

Üks aspekt, mis meie töö keeruliseks teeb, on seadmete paljusus ja erinevad kasutusjuhud ning vastavalt kasutusjuhule testimisjuhendite välja töötamine. Näiteks koosolekuruumides kasutatakse seadmeid väga erinevates tingimustes. Väikese miitinguruumi jaoks on vaja laia vaateväljaga kaamerat, et kõik 4-5 toas viibivat inimest pildile mahutada. Suuremasse ruumi liikudes tingimused muutuvad, inimesed istuvad kitsamalt ja kaugemal, seega kaamera vaateväli võib olla kitsam. Samuti ei pruugi suuremas koosolekuruumis enam üks speakerphone ära katta kogu ruumi ja seega tuleks kasutada mitut speakerphone’i või mikrofoni. Meie testspetsifikatsioonid püüavad kõiki neid juhtumeid katta erinevate teststsenaariumitega.

Meil on vaja leida suur hulk potentsiaalseid kasutusjuhtumeid ja testida, kas seadmed nendes oludes päriselt töötavad. Näiteks koroona ajal tekkis tohutu USB mikrofonide buum, mis tähendab, et me hakkasime ka neid sertifitseerima. Tuli leida stsenaariumid, kuidas neid laboris testida selliselt, et kõik laborid tegutseksid ühte moodi ja testid oleksid korrelatsioonis reaalses elus kohatavate kasutusolukordadega? Sarnane teema on näiteks soundbaridega, mis käivad monitori peale või alla. Paari aasta eest ei olnud selliseid asju veel olemaski, kuid koroona ajal muutus see lahendus populaarseks, mis tähendab, et seda oli vaja hakata testima.

Millised on kõige olulisemad uuendused ja muutused, mis jõuavad tulevikus Microsofti teenustesse ja audiomaailma laiemalt?

Üha enam tehnoloogiat muutub tulevikus juhtmevabaks. Audioinsenerina see mulle eriti ei meeldi, kuna juhtmega on kvaliteet alati parem. Kui võtad arvuti tagant võrgukaabli ära ja asendad selle WiFiga, muutub ühenduse kvaliteet kehvemaks. Audio puhul kehtib sama loogika. Aga mis teha, mugavuse vastu ei saa.

Peakomplektidest hakkavad kaduma suu lähedale ulatuvad varrega mikrofonid. Näeb ju ilusam välja, kui peas on ainult kõrvaklapid. Aga kui viia mikrofon suu juurest kõrvade juurde klappidesse, siis läheb kohe mitmes mõttes jamaks. Isegi võimsa audiotöötlusega tuleb klappidesse sisse rohkem keskkonna müra, mida küll digitaalse töötlusega maha surutakse, aga selle tõttu kipub rääkija enda kõne kvaliteet kõnes siiski kehvemaks muutuma. 

Hiljuti tuli välja Bluetooth Low Energy Audio spetsifikatsioon, mis võib Bluetooth klappidega tehtavate kõnede kvaliteeti oluliselt parandada. Pikalt on olnud USB ühendusega peakomplektid Bluetooth klappidest oluliselt parema kõne kvaliteediga, eriti mikrofoni signaali osas. Mõne aasta pärast võib see muutuda. Bluetooth LE standardiseerib uue audio koodeki, mis võimaldab kõnet edastada laiemas audioribas ja parema kvaliteediga.

Veel üks tendents on masinõpe, mis hakkab jõudma kõikvõimalikesse seadmetesse. Kaamerad võivad näiteks salvestada laia vaatenurgaga pilti, kuid tehnoloogia õpib õigel ajal õigesse kohta sisse suumima ja kindlale inimesele keskenduma. Audiomaailmas hakatakse masinõpet üha enam kasutama mürasummutuseks. Näiteks on osadesse seadmetesse ja ka Teamsi juba sisse ehitatud müratasandus, mis kaotab täielikult ära klaviatuuriklõbina või krõpsude söömise heli. Võid kõne ajal krõpsupakis krõbistada, aga teisele poolele ei jõua sellest midagi. 

Sellest järgmine samm saab olema seadmete digitaalse signaalitöötluse personaliseerituks muutumine. Sa õpetad seadme või tarkvara ja tema masinõppe ära tundma oma häält ja pärast seda lastakse kõnesse läbi ainult sinu juttu. Näiteks kui oled kodukontorist koosolekul kõnes ja su abikaasa hakkab kõrval rääkima, siis tema juttu teised kõnes viibijad ei kuule. Saab olema huvitav näha, milliseks kujuneb õpetamise protsess ja kui sõbralik on see tehnoloogia eesti keele suhtes.

Mis on DigiPRO ja kes seda teevad? Loe siit

Populaarsed lood mujal Geeniuses

Kolm korda nädalas

Telli DigiPRO uudiskiri

Kolm korda nädalas (esmaspäeviti, kolmapäeviti ja reedeti) spetsiaalne DigiPRO liikmetele tehtud kommenteeritud uudiskiri, et sa midagi olulist maha ei magaks. Iga uudiskirja magnet on meie ajakirjanike kirjutatud pikem artikkel, mis meie arvates võiks selles valdkonnas töötavaid inimesi huvitada ja neile vajalik olla