Vaš račun za AI je izmakao kontroli. Google je čekao upravo taj trenutak

Ključne tačke

Eksplozija troškova za veštačku inteligenciju naterala je kompanije da umesto o snazi modela počnu da razmišljaju o ceni i brzini
Google vidi svoju šansu zbog posedovanja kompletnog lanca infrastrukture i sopstvenih čipova
Ovo je repriza strategije iz ere internet pretrage, gde Google ponovo koristi stabilan profit od oglasa da subvencioniše bržu i jeftiniju tehnologiju

Google čini svoje AI modele jeftinijim i bržim. Veća računarska snaga pomaže mu da ubrza. To je ista strategija koja je kompaniji donela pobedu u oblasti pretrage. Dok kompanije sve pažljivije analiziraju svoje račune za veštačku inteligenciju, Google aktivira svoju ključnu prednost.

Kompanija Anthropic agresivno reklamira svoj još uvek neobjavljeni model Mythos AI kao opasno moćan, a za to vreme Google menja temu razgovora i usredsređuje se na cenu i brzinu.

Iz Google-a tvrde da njihov najnoviji model, Gemini 3.5 Flash, parira vodećim konkurentskim modelima na tržištu, dok istovremeno štedi novac kompanijama koje gomilaju ogromne račune trošeći milijarde tokena.

„Kompanije već sada troše svoje godišnje budžete za tokene, a tek je maj“, izjavio je nedavno izvršni direktor Google-a, Sundar Pičai. „Kada bi firme koristile kombinaciju Flash-a i drugih vodećih modela na tržištu, mogle bi da uštede ogroman novac.“

Tajming lansiranja ovog Google-ovog modela nije slučajan. Kako kompanije sve više usvajaju kompleksne „AI agente“ koji proždiru tokene, tako počinju i da obraćaju mnogo više pažnje na svoje finansije. U isto vreme, manje AI kompanije, koje su pod pritiskom da hitno generišu prihode, podižu cene svojih proizvoda, što tera klijente da preispitaju koliko troše na veštačku inteligenciju.

To otvara prostor za pobedu na osnovu ekonomičnosti i vrednosti, a ne samo na osnovu sirove snage modela. Upravo tu Google ima prednost koju će konkurenti teško ponoviti, prednost na kojoj kompanija radi već četvrt veka.

Rasprodaja „Flash“ modela

Tokom prve tri godine, rat u svetu generativne veštačke inteligencije uglavnom se svodio na to ko ima najveći i najpametniji model. Sada, kada se razlika u performansama između laboratorija smanjuje, prednost se seli na stranu infrastrukture i procesa koji se zove inferenca (odnosno, načina i troška pod kojim se modeli pokreću).

Kao što je suosnivač kompanije OpenAI, Greg Brokman nedavno izjavio: „Sam model više nije proizvod.“

Glavni razlog za ovaj zaokret jesu AI agenti, koji postaju sve korisniji, ali i sve skuplji za operativni rad.

Google dobro zna koliko je visoka potrošnja tokena. Pičai je nedavno istakao da je mesečna upotreba njihovih AI proizvoda skočila sedam puta u odnosu na prošlu godinu, dostigavši neverovatnih 3,2 kvadriliona tokena. On je takođe dodao da ukoliko bi najveći korisnici Google Cloud-a prebacili 80% svojih AI zadataka na kombinaciju modela Gemini 3.5 Flash i drugih naprednih modela, mogli bi da uštede više od milijardu dolara godišnje.

Firme uveliko primećuju koliko troškovi za AI rastu.

„Kako AI agenti postaju kompleksniji, dugotrajni procesi su postali norma“, izjavio je za Business Insider Dan Morgan, analitičar u firmi Synovus Trust. „To je izazvalo pravi šok kod mnogih organizacija kada dobiju račun.“

Troškovi i povrat investicije (ROI) idu ruku pod ruku, jer je u ovom sektoru trenutno veoma teško ostvariti profit, dodaje Morgan. Za mnoge kompanije, pristup apsolutno najnaprednijim modelima na tržištu više nije neophodan. „Dovoljno dobro“ postaje sasvim dovoljno.

Tu na scenu stupa Google. Ova kompanija ima znatno čvršću kontrolu nad troškovima i brzinom AI-ja od većine svojih rivala jer poseduje kompletan tehnološki lanac – sopstvene čipove, data centre, klaud infrastrukturu, modele, kao i brojne velike aplikacije koje se nalaze na vrhu tog sistema.

„Analitičari investicione banke William Blair procenili su ovog meseca da Google plaća oko 50% manje (a potencijalno i do 75% manje) za svoje interne AI proračune u poređenju sa rivalima. Razlog leži u tome što Google koristi sopstvene TPU čipove i nabavlja komponente direktno od proizvođača.

Sa druge strane, OpenAI plaća maržu kompanijama Microsoft, Oracle i drugim klaud gigantima za svaki upit koji prođe kroz ChatGPT ili Codex, a ti provajderi zatim plaćaju kompaniji Nvidia za grafičke procesore (GPU) koji sve to pokreću. Zapravo, skoro svaka tehnološka kompanija koja nije globalni „hiperskejler“ (poput Google-a ili Microsoft-a) trenutno mora nekom drugom da plaća za korišćenje infrastrukture“ piše BI.

Google će upropastiti internet: Zašto ovo treba sve da zabrine?

Strategija iz ere internet pretrage

Ako je računarska snaga sudbina, kao što to voli da kaže izvršni direktor OpenAI-ja Sem Altman, Google je proveo više od 25 godina osiguravajući svoju sudbinu.

Godine 2006. Google pretraga je kontrolisala više od 40% tržišta i ubrzano je slamala konkurenciju ne samo zato što su rezultati bili dobri, već zato što je Google činio svoj pretraživač bržim i jeftinijim za održavanje. Google je voleo da se hvali time, prikazujući korisnicima tačan broj milisekundi koji je bio potreban da se isporuče odgovori.

„Umesto da investira u preskupe servere, Google je sklapao prilagođene sisteme koristeći jeftine, masovno dostupne delove kako bi maksimizovao brzinu i održao niske troškove. U isto vreme, podaci prikupljeni iz svih tih pretraga, kojih je bilo sve više kako je Google postajao popularniji, dodatno su unapređivali sistem. To je stvorilo zamajac koji je polako eliminisao tadašnje rivale poput kompanije Yahoo“ pišu analaitičari.

Google-ovi rezultati nisu morali da budu apsolutno najbolji na svetu. Morali su samo da budu dovoljno brzi i dovoljno jeftini za isporuku da bi se korisnici iznova vraćali.

Kompanija sada kreira sličan zamajac sa Gemini modelima. Jedina razlika je u tome što danas Google poseduje i enormno uspešan biznis sa oglasima u pretrazi, koji može finansijski da subvencioniše njegove AI poduhvate, dok rivali poput kompanija OpenAI i Anthropic moraju stalno da trče trku za novim investicijama i dodatnom računarskom snagom.

„Trka za dominaciju u internet pretrazi zapravo je bila prerušena trka u izgradnji infrastrukture. Google se kladi da će se AI trka završiti na potpuno isti način“ tvrde bolje obavešteni BI analitičari.

Google nov način zapošljavanja inženjera: Šta je sada ključno u intervjuima?

Podeli tekst

Prethodni tekst

Više matematike, više novca: Kako je potraga za profitom pokrenula matematičke inovacije

Sledeći tekst

Lekcije iz Monaka: Ko je proglašen za najboljeg svetskog preduzetnika i zašto Amerika ne sme da otpiše Evropu

Vaš račun za AI je izmakao kontroli. Google je čekao upravo taj trenutak

Rasprodaja „Flash“ modela

Strategija iz ere internet pretrage

Podeli tekst

Ako ste propustili

Ljudi nisu dobro, ljudi nisu stvoreni za ovoliko promena

Pet načina da zagarantovano ostanete siromašni

Već viđeno iz 1929: Da li Amerika crta put ka novoj Velikoj depresiji?

Povezane vesti

Nobelovac Krugman: Zašto svi mrze veštačku inteligenciju?

Kineski Moonshot predstavio Kimi K3: najveći AI model otvorenog koda menja odnos snaga u globalnoj trci

Šta presuda protiv Gugla znači za YouTube i druge digitalne platforme

Komentari +

Vaš račun za AI je izmakao kontroli. Google je čekao upravo taj trenutak

Rasprodaja „Flash“ modela

Strategija iz ere internet pretrage

Podeli tekst

Ako ste propustili

Ljudi nisu dobro, ljudi nisu stvoreni za ovoliko promena

Pet načina da zagarantovano ostanete siromašni

Već viđeno iz 1929: Da li Amerika crta put ka novoj Velikoj depresiji?

Povezane vesti

Nobelovac Krugman: Zašto svi mrze veštačku inteligenciju?

Kineski Moonshot predstavio Kimi K3: najveći AI model otvorenog koda menja odnos snaga u globalnoj trci

Šta presuda protiv Gugla znači za YouTube i druge digitalne platforme

Komentari +

OSTAVITE KOMENTAR Otkaži odgovor