Dok su tekstualni modeli i generisanje slika do sada dominirali industrijom, nova faza veštačke inteligencije usredsređena je na ono najprirodnije – ljudski glas i emociju koju nosi. Kompanija Inworld AI lansirala je novi glasovni model pod nazivom Realtime TTS-2, koji obećava revoluciju u načinu na koji mašine komuniciraju sa ljudima.
Emocionalni nivo komunikacije
Glavni problem današnjih AI glasova nije kvalitet zvuka, već nedostatak autentičnosti. Prema rečima...