Počelo je: Novi AI model je emocionalno inteligentan

Foto: Bonitet.com/Midjourney

Ključne tačke
  • Realtime TTS-2 rešava problem tako što analizira glasovne elemente kao što su ton, tempo i visina glasa
  • Inworld-ov model kombinuje nekoliko naprednih funkcija
  • Važno za biznis

Dok su tekstualni modeli i generisanje slika do sada dominirali industrijom, nova faza veštačke inteligencije usredsređena je na ono najprirodnije – ljudski glas i emociju koju nosi. Kompanija Inworld AI lansirala je novi glasovni model pod nazivom Realtime TTS-2, koji obećava revoluciju u načinu na koji mašine komuniciraju sa ljudima.

Emocionalni nivo komunikacije

Glavni problem današnjih AI glasova nije kvalitet zvuka, već nedostatak autentičnosti. Prema rečima direktora kompanije Inworld, Kajlana Gibsa, današnji AI zvuči kao čovek koji čita scenario ili izveštaj, što stvara osećaj distance.

„Možda zvuči dobro, ali osećaj je loš. Zamislite da samo razgovarate sa audio-knjigom“, objašnjava Gibs.

Realtime TTS-2 rešava ovaj problem tako što analizira glasovne elemente kao što su ton, tempo i visina glasa kako bi u realnom vremenu procenio emocionalno stanje onoga ko govori. Na osnovu toga, AI dinamički prilagođava sopstveni glas i način izlaganja.

Kako funkcioniše „emocionalno inteligentni“ AI?

Za razliku od konkurenata poput Google-a ili ElevenLabs-a, Inworld-ov model kombinuje nekoliko naprednih funkcija kako kažu iz kompanije:

Kontekstualna istorija: AI razume celokupan tok razgovora – ista rečenica će zvučati drugačije ako je izgovorena nakon šale ili nakon loših vesti.

Detekcija „stanja“ korisnika: Model kontinuirano ažurira ono što nazivaju „stanje korisnika“, prilagođavajući odgovor u sekundi.

Tokom demonstracije uživo, model je uspeo da u par sekundi pređe iz „saosećajnog i direktnog“ tona (rešavajući reklamaciju klijenta) u „strpljiv i srdačan“ ton, zavisno od toga kako mu se sagovornik obraćao.

Zašto je ovo važno za biznis?

Inworld AI se ne pozicionira kao proizvod za krajnje korisnike, već kao infrastruktura za programere. Putem API-ja, kompanije mogu da implementiraju ovaj model u svoje sisteme, što otvara vrata širokoj primeni:

  • Korisnički servis: Personalizovana podrška koja „oseća“ frustraciju klijenta.
  • Zdravstvo i obrazovanje: AI asistenti koji pružaju saosećajnu podršku ili prilagođavaju tempo učenja.
  • AI pratioci: Prirodnija interakcija u gejming industriji i zabavi.

Zanimljivo je da Inworld izbegava kreiranje sopstvenih aplikacija kako ne bi postao konkurent svojim klijentima. Gibs veruje da je vrednost u samom modelu, naročito u eri gde AI alati za programiranje čine razvoj aplikacija lakšim nego ikada.

„Mi sada zaista proizvodimo samo modele i API-je“, dodaje Gibs, naglašavajući da je cilj Inworld-a da postane osnova na kojoj će drugi graditi budućnost glasovne komunikacije.

Sledeći nivo rasta AI tehnologije neće zavisiti samo od toga šta mašine govore ljudima, već od toga kako govore. Ako se danas angažovanost ceni iznad svega, emocionalna inteligencija je ipak postaje najvredniji alat.

Strogo je zabranjeno kopiranje tekstova osim u slučaju preciznog navođenja izvora i linka ka originalnom tekstu.

Podeli tekst

Ako ste propustili

Povezane vesti

Komentari +

OSTAVITE KOMENTAR

Molimo unesite svoj komentar!
Molimo unesite svoje ime ovde