Vaš AI postaje gluplji i skuplji: Kako znalci izbegavaju ovu zamku?

Foto: Bonitet.com/Midjourney

Ključne tačke

  • AI pretplate postaju skuplje, a pristup sve ograničeniji
  • Korisnici troše drastično više tokena nego pre godinu dana
  • Lokalni modeli kao alternativa, ali ni to nije jednostavno

Termin „šrinkflacija“ se već neko vreme pominje u tekstovima o veštačkoj inteligenciji. Zapravo, svako je iskusio pravo značenje – to je situacija kada u supermarketu plaćate isto ili više, a dobijate manje. Čokoladice su tanje, toalet papir kraći, pakovanja manja. Prema podacima CapitalOne, svaki treći proizvod u prosečnoj korpi pogodila je ova „tiha inflacija“.

Ali šrinkflacija nije više samo „fizički fenomen“. Stigla je i u svet veštačke inteligencije.

U poslednjih nekoliko sedmica, primetili ste da su kompanije koje razvijaju AI sisteme ili pooštrile uslove pretplate, ili podigle cene, ili ograničile pristup modelima. GitHub je u aprilu privremeno zaustavio nova prijavljivanja na Copilot Pro i tako najavio prelazak na naplatu po potrošnji od 1. juna. OpenAI je uveo više cenovnih nivoa kako bi „bolje razumeo“ različite načine korišćenja svojih proizvoda. A Anthropic je prošlog meseca bio prinuđen da prizna grešku: korisnicima je, umesto punog modela, servirani okrnjeni Claude, nastao u pokušaju da se sistemi učine efikasnijim.

Sve je to deo jedne šire borbe: AI laboratorije pokušavaju da izađu na kraj sa rastućom potražnjom, a istovremeno nude proizvode koji su, po svim procenama, i dalje subvencionisani. Nvidia, koja dominira tržištem čipova koji pokreću AI revoluciju, već otvoreno kaže da AI može da košta više od zaposlenog radnika.

Navike korisnika su se drastično promenile

„Jedan od ključnih izazova za provajdere jeste da nekako usklade svoja ograničenja sa načinom na koji programeri zaista koriste alate“, kaže Triša Gi, softverska programerka koja prati usvajanje AI alata za kodiranje u industriji.

Analiza korišćenja platforme OpenRouter pokazuje koliko se situacija promenila: između novembra 2024. i novembra 2025. godine, prosečan broj tokena po upitu porastao je sa oko 1.500 na čak 6.000 tokena. U isto vreme, prosečan output je skočio sa 150 na 400 tokena.

Kineski AI provajder Zhipu AI, tvorac GLM modela koji se takmiče sa Anthropic-ovim velikim jezičkim modelima, saopštio je ovog meseca da svakodnevno procesiraju 5,5 triliona tokena što je ekvivalent četiri triliona reči, ili oko 45 miliona prosečnih knjiga. Goldman Sachs procenjuje da bi potrošnja tokena mogla da bude čak 24 puta veća od ukupnih kapaciteta koji danas postoje, a pokretač tog rasta su agentni AI sistemi.

Pre godinu ili dve, tipičan korisnik bi postavio kratko pitanje, dobio kratak odgovor, eventualno razmenio nekoliko poruka i završio razgovor. Danas je scenario potpuno drugačiji: korisnici AI modele pokreću na dugotrajnim projektima koji uključuju analizu podataka, pisanje koda i paralelne zadatke koji traju satima.

„Jedinica potrošnje više nije razmena poruka“, objašnjava Eduardo Arinjo de la Rubia, profesor na Centralnoevropskom univerzitetu u Beču. „Sada je to opsežna agentna putanja koja često uključuje višestruke asinhrone agente, višestruke pozadinske agente, ponekad i desetine ili čak stotine poziva alatima.“ Subvencionisane cene koje su AI provajderi nudili jednostavno ne mogu da prate ovakav rast.

Kompanije najčešće naplaćuju pristup modelima na jedan od dva načina: mesečna pretplata sa ograničenjima, ili neograničen pristup uz naplatu po tokenu putem API poziva. „Kako bi odgovorili na eksploziju agentnih AI sistema – koji troše mnogo više tokena već samim „otkucajima srca“ kojima proveravaju stanje sistema u realnom vremenu – neki provajderi, poput Anthropica, zatvorili su mogućnost „flat pretplate“ za agentne aplikacije“ rekao je profesor.

Kako korisnici zaobilaze poskupljenja

Na ovom mestu vredi pomenuti lično iskustvo koje je podelio Kris Stokel, autor jedne od analiza objavljene na nekoliko portala koji se bave AI tematikom: on lično koristi između 75 i 100 miliona tokena dnevno od kojih su dve trećine kroz lokalno hostovane modele. Razlog je jednostavan, kako je napisao – strah da će, „kako se plafoni snižavaju“, biti primoran na skuplje planove, za koje bi za godinu dana potrošio više nego što bi koštalo njegov lični hardver.

Nije jedini koji tako razmišlja. Mac Mini računari, koje mnogi biraju za lokalno pokretanje modela, sve se teže nabavljaju u Apple prodavnicama. Cene grafičkih kartica, čak i polovnih, naglo su porasle, navodi autor.

„Prelazak na lokalne modele mora biti deo rešenja“, smatra de la Rubia. Ali, uz važno pitanje: za šta se ti modeli zapravo koriste? „Koristimo li ih za asinhron pregled koda? Kao pozadinski alat za otkrivanje bezbednosnih propusta? Ili nešto treće? Kako se sve to uklapa?“

To zapravo praktično znači da korisnici umesto da plaćaju pristup AI modelima kroz cloud servise (OpenAI, Anthropic, Google), preuzmu i pokreću te modele direktno na sopstvenom računaru ili serveru.

Šta to u praksi znači?

Na šta konkretno misli kad kaže „lokalno“? Skinete model (npr. Llama, Mistral, DeepSeek). Pokrenete ga lokalno, na svom računaru sa dobrom grafičkom karticom, ili na sopstvenom serveru. Koristite ga neograničeno, bez mesečne pretplate i bez ograničenja tokena

Zašto je to „deo rešenja“? Jer cloud provajderi mogu da ti smanje limit, podignu cenu ili okrnje model — a vi to ne možete da kontrolišete. Sa lokalnim modelom, jednom kad kupite hardver, troškovi su gotovi. Međutim, hardver koji može da pokrene ozbiljne modele nije jeftin, a održavanje tih sistema zna da bude naporno za laike pogotovo. Zbog toga to nije rešenje za svakog korisnika, nego pre svega za one koji intenzivno koriste AI. Upravo to navodi De la Rubia.

„Ostaje i pitanje da li su uštede zaista uštede: kupovina hardvera dovoljno snažnog za lokalne LLM modele ozbiljan je finansijski poduhvat. A uz to dolazi i svakodnevni izazov održavanja sistema koji znaju da budu nestabilni.

I možda je upravo ta komplikacija razlog zašto će mnogi ostati na pretplatama, bez obzira na pomenutu šrinkflaciju. Ne vidim da ljudi odustaju od planova od 200 dolara mesečno. Nisam primetio nikakav signal da najskuplji sveobuhvatni planovi nestaju. Pretpostavljam da će postati skuplji, ali da će opstati.

Pitanje je samo: do kog nivoa cene možemo da pratimo pre nego što kalkulator počne da govori drugačije?“

Strogo je zabranjeno kopiranje tekstova osim u slučaju preciznog navođenja izvora i linka ka originalnom tekstu.

Podeli tekst

Ako ste propustili

Povezane vesti

Komentari +

OSTAVITE KOMENTAR

Molimo unesite svoj komentar!
Molimo unesite svoje ime ovde