Google čini svoje AI modele jeftinijim i bržim. Veća računarska snaga pomaže mu da ubrza. To je ista strategija koja je kompaniji donela pobedu u oblasti pretrage. Dok kompanije sve pažljivije analiziraju svoje račune za veštačku inteligenciju, Google aktivira svoju ključnu prednost.
Kompanija Anthropic agresivno reklamira svoj još uvek neobjavljeni model Mythos AI kao opasno moćan, a za to vreme Google menja temu razgovora i usredsređuje se na cenu i brzinu.
Iz Google-a tvrde da njihov najnoviji model, Gemini 3.5 Flash, parira vodećim konkurentskim modelima na tržištu, dok istovremeno štedi novac kompanijama koje gomilaju ogromne račune trošeći milijarde tokena.
„Kompanije već sada troše svoje godišnje budžete za tokene, a tek je maj“, izjavio je nedavno izvršni direktor Google-a, Sundar Pičai. „Kada bi firme koristile kombinaciju Flash-a i drugih vodećih modela na tržištu, mogle bi da uštede ogroman novac.“
Tajming lansiranja ovog Google-ovog modela nije slučajan. Kako kompanije sve više usvajaju kompleksne „AI agente“ koji proždiru tokene, tako počinju i da obraćaju mnogo više pažnje na svoje finansije. U isto vreme, manje AI kompanije, koje su pod pritiskom da hitno generišu prihode, podižu cene svojih proizvoda, što tera klijente da preispitaju koliko troše na veštačku inteligenciju.
To otvara prostor za pobedu na osnovu ekonomičnosti i vrednosti, a ne samo na osnovu sirove snage modela. Upravo tu Google ima prednost koju će konkurenti teško ponoviti, prednost na kojoj kompanija radi već četvrt veka.
Rasprodaja „Flash“ modela
Tokom prve tri godine, rat u svetu generativne veštačke inteligencije uglavnom se svodio na to ko ima najveći i najpametniji model. Sada, kada se razlika u performansama između laboratorija smanjuje, prednost se seli na stranu infrastrukture i procesa koji se zove inferenca (odnosno, načina i troška pod kojim se modeli pokreću).
Kao što je suosnivač kompanije OpenAI, Greg Brokman nedavno izjavio: „Sam model više nije proizvod.“
Glavni razlog za ovaj zaokret jesu AI agenti, koji postaju sve korisniji, ali i sve skuplji za operativni rad.
Google dobro zna koliko je visoka potrošnja tokena. Pičai je nedavno istakao da je mesečna upotreba njihovih AI proizvoda skočila sedam puta u odnosu na prošlu godinu, dostigavši neverovatnih 3,2 kvadriliona tokena. On je takođe dodao da ukoliko bi najveći korisnici Google Cloud-a prebacili 80% svojih AI zadataka na kombinaciju modela Gemini 3.5 Flash i drugih naprednih modela, mogli bi da uštede više od milijardu dolara godišnje.
Firme uveliko primećuju koliko troškovi za AI rastu.
„Kako AI agenti postaju kompleksniji, dugotrajni procesi su postali norma“, izjavio je za Business Insider Dan Morgan, analitičar u firmi Synovus Trust. „To je izazvalo pravi šok kod mnogih organizacija kada dobiju račun.“
Troškovi i povrat investicije (ROI) idu ruku pod ruku, jer je u ovom sektoru trenutno veoma teško ostvariti profit, dodaje Morgan. Za mnoge kompanije, pristup apsolutno najnaprednijim modelima na tržištu više nije neophodan. „Dovoljno dobro“ postaje sasvim dovoljno.
Tu na scenu stupa Google. Ova kompanija ima znatno čvršću kontrolu nad troškovima i brzinom AI-ja od većine svojih rivala jer poseduje kompletan tehnološki lanac – sopstvene čipove, data centre, klaud infrastrukturu, modele, kao i brojne velike aplikacije koje se nalaze na vrhu tog sistema.
„Analitičari investicione banke William Blair procenili su ovog meseca da Google plaća oko 50% manje (a potencijalno i do 75% manje) za svoje interne AI proračune u poređenju sa rivalima. Razlog leži u tome što Google koristi sopstvene TPU čipove i nabavlja komponente direktno od proizvođača.
Sa druge strane, OpenAI plaća maržu kompanijama Microsoft, Oracle i drugim klaud gigantima za svaki upit koji prođe kroz ChatGPT ili Codex, a ti provajderi zatim plaćaju kompaniji Nvidia za grafičke procesore (GPU) koji sve to pokreću. Zapravo, skoro svaka tehnološka kompanija koja nije globalni „hiperskejler“ (poput Google-a ili Microsoft-a) trenutno mora nekom drugom da plaća za korišćenje infrastrukture“ piše BI.
Strategija iz ere internet pretrage
Ako je računarska snaga sudbina, kao što to voli da kaže izvršni direktor OpenAI-ja Sem Altman, Google je proveo više od 25 godina osiguravajući svoju sudbinu.
Godine 2006. Google pretraga je kontrolisala više od 40% tržišta i ubrzano je slamala konkurenciju ne samo zato što su rezultati bili dobri, već zato što je Google činio svoj pretraživač bržim i jeftinijim za održavanje. Google je voleo da se hvali time, prikazujući korisnicima tačan broj milisekundi koji je bio potreban da se isporuče odgovori.
„Umesto da investira u preskupe servere, Google je sklapao prilagođene sisteme koristeći jeftine, masovno dostupne delove kako bi maksimizovao brzinu i održao niske troškove. U isto vreme, podaci prikupljeni iz svih tih pretraga, kojih je bilo sve više kako je Google postajao popularniji, dodatno su unapređivali sistem. To je stvorilo zamajac koji je polako eliminisao tadašnje rivale poput kompanije Yahoo“ pišu analaitičari.
Google-ovi rezultati nisu morali da budu apsolutno najbolji na svetu. Morali su samo da budu dovoljno brzi i dovoljno jeftini za isporuku da bi se korisnici iznova vraćali.
Kompanija sada kreira sličan zamajac sa Gemini modelima. Jedina razlika je u tome što danas Google poseduje i enormno uspešan biznis sa oglasima u pretrazi, koji može finansijski da subvencioniše njegove AI poduhvate, dok rivali poput kompanija OpenAI i Anthropic moraju stalno da trče trku za novim investicijama i dodatnom računarskom snagom.
„Trka za dominaciju u internet pretrazi zapravo je bila prerušena trka u izgradnji infrastrukture. Google se kladi da će se AI trka završiti na potpuno isti način“ tvrde bolje obavešteni BI analitičari.
