Pole tehisintellekti ilma andmekeskuseta

Selline hakkab välja nägema jämedalt miljard dollarit maksev andmekeskuste kompleks, mida ehitab Meta USA-s Tennessee osariigis Gallatini linnas. Ilma selliste keskusteta AI areneda ei saaks.Foto: Meta Platforms Inc.

Tänaseks on masinõppele toetuv tehisaru muutunud kõigile kättesaadavaks ning eriti kuumaks teemaks muutus see ChatGPT levikuga. Tehisaru baasil toimivaid lahendusi oleme kasutanud aga juba mõnda aega. Näiteks rakendavad pangad ning ka Eesti maksu- ja tolliamet tehisaru süsteeme, mis analüüsivad tehinguid ja käitumismustreid, et tuvastada pettuseid ja kahtlaseid tegevusi. Paljud ettevõtted kasutavad klienditeeninduse automatiseerimiseks chatbot’e ehk vestlusroboteid ning masinõppemeetodeid võib süüdistada reklaamivalikus, mida kasutajatele internetis kuvatakse. Kõigi nende ja kümnete teiste rakenduste valguses on aga väga vähe tähelepanu saanud, kuidas üks tehisaru üleüldse tööle pannakse.

Kõik algab tehnoloogiast

Laias laastus on tehisaru rakendamiseks vaja kahte komponenti. Arvutusvõimsust ja andmeid ning mõlemat neist suures koguses. Läbi aastakümnete, mil tehisaru arendamisega on tegeletud, on just arvutusvõimsuse puudumine toonud kaasa seisakuid. Neile arenduspausidele on lausa oma termin loodud – AI winter – ning need pausid on kestnud teinekord aastaid. Igale seisakule on aga järgnenud edasiliikumine ning võib üsna kindlalt väita, et hetkel tehnoloogiast põhjustatud “talve” ei paista. 

Oma rolli on AI-talvedes mänginud ka andmete nappus. Tehisaru algoritmide õpetamiseks on vaja suurt hulka kvaliteetseid andmeid ning seda ressurssi on just viimasel ajal ohtralt lisandunud. Tänapäeval saab näiteks tehisaru treenimiseks kasutada infot sotsiaalmeediast, asjade interneti seadmetest ning digitaalsetest avalikest andmebaasidest. Samuti luuakse masinate treenimiseks nn sünteetilisi andmeid ning palgatakse inimesi, kes annavad tehisarule tagasisidet tehtud otsustele kindlatest parameetritest lähtuvalt.

Kus suured tehisarud paiknevad?

Suured tehisarud asuvad sageli andmekeskustes, sest nõuavad ohtralt elektrit, kontrollitud keskkonda ning kõrget turvalisust. Nõuded ja ootused taristule muidugi ajas kasvavad. Näiteks on USA tehnoloogiahiid Meta teatanud, et kavatseb 2028. aastaks oma andmekeskuste arvu kahekordistada. Juba praegu kuulub ettevõttele 21 “andmelinnakut” üle maailma, mis tähendab ühtekokku 16 miljardi dollari jagu investeeringuid ja üle 3,7 miljoni ruutmeetri jagu põrandapinda andmekeskustes. Kuna tehisaru rakenduste edu sõltub andmete töötlemise võimekusest, siis on see ainuvõimalik tee.

Igasse järgmise põlvkonna andmekeskusesse lisab Meta rohkem arvutusvõimsust, kasutades uut majasiseselt disainitud kiipi, mis olevat Meta enda sõnul kaks korda tõhusam kui enamikus AI-infrastruktuuris kasutatav GPU (graafikaprotsessor).

Meta esitles oma esimest AI-kiipi tänavu mais.Foto: Meta

Mida tehisaru andmekeskustelt nõuab?

“Mida keerukamad ja nõudlikumad on IT-seadmed, seda kõrgemaid nõudmisi seab see keskkonnale, kus nad töötavad. Üks keskmine kontorihoone ei suuda tagada ulatusliku tehisaru jooksutamiseks vajalikku voolu ning jahutust. Seepärast ehitataksegi kohati neile lausa eraldi andmekeskuseid,” räägib Baltikumi suurima andmekeskuse idee autor Kert Evert. Tema sõnul leidub ka nende majas tehisaru arendavaid ja rakendavaid ettevõtteid. Üheks heaks ja rahvusvaheliselt edukaks näiteks on n-ö garaažist välja sirgunud ning tänaseks 15 riigis üle kogu Euroopa tegutsev R8 Technologies, mis juhib tehisaru toel suurte, tehniliselt keerukate hoonete sisekliimat ja energiakasutust. Täpsemalt saab nende eduloost lugeda teisest blogipostitusest

“Arvestades, et meil on elektrivõimsust keskmise Eesti linna jagu, siis suudame suure energiatarbimisega tehisarusid majutada veelgi,” kinnitab Evert.

Eesti ja kogu Baltikumi suurim andmekeskus asub Tallinna külje all Hüürus.Foto: Greenergy Data Centers

Kõige levinum riistvara, mida tehisaru tarvis rakendatakse, on varem Meta näite juures mainitud graafikaprotsessorid ehk GPU-d, sest nad suudavad teha paljusid arvutusi paralleelselt. Seetõttu täidavad GPU-d tehisaru kontekstis oma ülesande sageli mitusada korda kiiremini kui klassikalised protsessorid (CPU). Tänaseks on nendest protsessoritest juba loomulikult välja töötatud ka väga tõhusad (ja kallid) eriversioonid.

Sama kehtib ka salvestusseadmete kohta, mis suudavad käidelda nii struktureeritud kui ka struktureerimata andmeid. Loomulikult on selles võrrandis kriitilise tähtsusega ka side. See tähendab, et paralleelselt töötlevate arvutusüksuste vahelised ühendused peavad läbi laskma tohutuid mahte.

Siin kehtib reegel, et mida spetsiifilisema kasutusega ja uuem on seade, seda enam tuleb selle eest rahakotti kergendada. Võttes ainuüksi protsessorid, siis näiteks Meta tehisaru LLaMA treenimiseks kasutati selle aasta alguses 2048 Nvidia A100 GPU-d. Ühe sellise GPU hind artikli kirjutamise hetkel ulatub 10 000 euro kanti ehk ainuüksi protsessorite hind ületab 20 miljoni piiri. “Selles kontekstis võib väita, et kahtlemata on tehisaru treenimise ja rakendamise kontekstis lisaks töökindlusele tähtis ka füüsiline turvalisus. Kaitsta tuleb nii seadmeid endid kui ka neil asuvat intellektuaalset omandit,” täiendab Evert. 

Kokkuvõttes toetuvad meie tulevikumaailma ümber kujundavad tehisarud suuresti kahele komponendile: arvutusvõimsus ning andmed. Esimene neist eeldab spetsiifilist riistvara ning andmekeskuseid nende majutamiseks. Kui andmeid tekib maailma pidevalt juurde, siis andmekeskused ja neis töötav tehnika iseenest ei teki ning siin ootab meid lähemas tulevikus ees kiire areng. 

Mis on DigiPRO ja kes seda teevad? Loe siit

Populaarsed lood mujal Geeniuses

Kolm korda nädalas

Telli DigiPRO uudiskiri

Kolm korda nädalas spetsiaalne DigiPRO liikmetele tehtud uudiskiri, et sa midagi olulist maha ei magaks.