Kompanija OpenAI predstavila je novi AI model nazvan Sora za koji tvrdi da može da kreira „realistične“ i „maštovite“ video snimke od 60 sekundi iz brzih tekstualnih upita.
U postu na blogu kompanije, OpenAI piše da je Sora sposobna da generiše video zapise dužine do 60 sekundi iz tekstualnih uputstava, sa mogućnošću da prikaže scene sa više karaktera, specifičnim tipovima pokreta i detaljnim detaljima o pozadini.
Dužina i tačnost
„Model razume ne samo šta je korisnik tražio u promptu, već i kako te stvari postoje u fizičkom svetu“, navodi se u postu.
OpenAI je saopštio da namerava da obuči AI modele tako da mogu „pomoći ljudima da reše probleme koji zahtevaju interakciju u stvarnom svetu“.
Ovo je najnoviji napor kompanije koja stoji iza četbota ChatGPT, koji nastavlja da gura napred generativni AI pokret. Ono što Soru izdvaja od ostalih modela ‘tekst-video’ je dužina i tačnost za koje OpenAI tvrdi da ona ima.
Sora još ima “slabosti”
OpenAI je napomenuo da Sora još ima „slabosti“, posebno kada su u pitanju prostorni detalji prompta – mešanje levog i desnog – i uzroka i posledica.
Za sada, poruke OpenAI-a ostaju fokusirane na bezbednost. Kompanija je saopštila da planira da sarađuje sa timom stručnjaka na testiranju najnovijeg modela i pažljivom razmatranju različitih oblasti, uključujući dezinformacije, sadržaj mržnje i pristrasnost. Kompanija je rekla da takođe pravi alate za otkrivanje lažnih informacija.
Sora će prvo biti stavljena na raspolaganje profesorima sajber bezbednosti, zvanim „crveni timovi“, koji mogu da procene štetu ili rizike u proizvodu. Takođe daje pristup brojnim vizuelnim umetnicima, dizajnerima i filmskim stvaraocima da prikupe povratne informacije o tome kako bi kreativni profesionalci mogli da ga koriste.