Kompanije racionišu AI tokene: kraj ere tokenmaxinga

Posle nekoliko meseci u kojima su velike kompanije podsticale zaposlene da koriste što više veštačke inteligencije, sada stižu računi. Kako su krajem juna izvestili TechCrunch i CNBC, finansijski timovi u nizu globalnih firmi uvode limite, izveštaje i pravila o tome ko sme da troši na AI alate i koliko. Period koji su tehnološki mediji nazvali tokenmaxxing, takmičenje u potrošnji, smenjuje faza koju isti ti mediji opisuju kao racionisanje tokena.

Token je osnovna jedinica obrade kod jezičkih modela, otprilike deo reči, i po njemu se naplaćuje korišćenje. Početkom 2026. godine poruka iz industrije i samih poslodavaca bila je jednostavna: koristite AI gde god možete. Pojedine kompanije su, kako navodi izveštavanje, vodile interne rang-liste potrošnje tokena da bi ohrabrile zaposlene da posežu za modelima. Nekoliko meseci kasnije slika je drugačija.

Od podsticaja do troškovne stavke

Prelomni trenutak, prema TechCrunch-u, dobro opisuje primer konsultantske kuće Accenture. Ta kompanija je ranije zaposlenima poručivala da rizikuju da ostanu bez unapređenja ako ne koriste AI. Sada pokušava da ih spreči da troše skupe tokene na rutinske poslove, poput pretvaranja PDF dokumenata u prezentacije.

"Stižemo do prelomne tačke u kojoj AI postaje materijalna stavka u troškovnoj strukturi", izjavio je Justice Kwak, koji u Accenture vodi strategiju za agentski AI, prenosi TechCrunch. Ta rečenica sažima zaokret: ono što je donedavno tretirano kao eksperiment i prednost, sada se pojavljuje u kvartalnim izveštajima kao trošak koji direktori finansija moraju da objasne.

Problem nije samo u ceni pojedinačnog upita. Finansijski direktori, kako se navodi u izveštavanju, uglavnom nisu planirali ovakav rast u godišnjim budžetima, niti su imali razrađene alate da ga prate. Računi su stizali veći od očekivanih, a pitanje koje se postavlja na nivou rukovodstva sada glasi da li uložen novac donosi srazmernu vrednost.

Limiti, nivoi i kvote

Konkretne mere razlikuju se od firme do firme. Prema navodima CNBC-ja, Uber je potrošio projektovani godišnji budžet za AI za samo četiri meseca, pa je uveo mesečne nivoe potrošnje za pojedine alate, sa osnovnim nivoom i mogućnošću da zaposleni zatraže viši pristup. Volmart je, takođe prema CNBC-ju, ograničio mesečnu kvotu po zaposlenom nakon što je tražnja daleko premašila planirano. Meta je svojim zaposlenima najavila ograničenja posle, kako je opisano, eksponencijalnog rasta troškova.

U izveštavanju se pominje i pojedinačan slučaj jedne neimenovane kompanije koja je, navodno, za mesec dana potrošila oko 500 miliona dolara na kredite za Claude pošto nije postavila jasna ograničenja korišćenja. Taj podatak nije nezavisno potvrđen i treba ga uzeti kao ilustraciju razmera o kojima mediji pišu, a ne kao zvaničnu cifru.

Zajednički imenitelj svih ovih poteza je pomeranje odgovornosti. Tamo gde je ranije postojao podsticaj da se troši, sada postoji zahtev da se troškovi mere, dodeljuju timovima i opravdaju rezultatom.

Zašto agentski alati menjaju računicu

Deo objašnjenja leži u tome kako rade noviji AI alati. Agentski sistemi, koji samostalno planiraju i izvršavaju zadatke kroz više koraka, troše znatno više tokena od običnog pitanja i odgovora. Tehnološki sajt Tom's Hardware navodi da agentski tok rada može da potroši i do hiljadu puta više tokena nego standardna upotreba modela.

To se posebno vidi u programiranju potpomognutom veštačkom inteligencijom, gde je kultura intenzivne potrošnje i nastala. Alati koji pišu, testiraju i ispravljaju kod u više prolaza brzo akumuliraju potrošnju, a poslovna vrednost tog rada nije uvek lako merljiva. Upravo zato finansijski timovi sada traže preglede, limite i jasnu vezu između potrošnje i učinka.

Jedan od odgovora koji se pominje u izveštavanju jeste i zamena modela. Umesto da se najskuplji frontijer modeli koriste za svaki zadatak, firme za jednostavnije poslove sve češće biraju jeftinije ili modele otvorenog koda, a najjače modele čuvaju za složene zadatke gde se isplate.

Kako reaguju OpenAI i Anthropic

Promena navika korisnika direktno pogađa dve vodeće laboratorije. OpenAI je, prema izveštavanju, dodao analitiku i kontrole za poslovne korisnike koje administratorima omogućavaju da prate potrošnju kredita, postave limite i daju zaposlenima uvid u budžete. Anthropic je, navodi se, takođe uveo alate za dodelu naloga, analitiku i ograničenja potrošnje.

Za kompanije čiji prihod u velikoj meri zavisi od potrošnje po tokenu, ovaj zaokret nije neutralan. Analitičari koje prenose mediji upozoravaju da bi sadašnje stope rasta za OpenAI i Anthropic mogle biti najbrže koje će te firme videti, jer najveći poslovni korisnici počinju da obuzdavaju potrošnju.

U tom kontekstu pojavila se i informacija o mogućim sniženjima cena. Wall Street Journal je, kako prenosi CNBC, izvestio da OpenAI razmatra značajno sniženje naknada za tokene kako bi preuzeo poslovne klijente od Anthropica, uz očekivanje da bi Anthropic mogao da odgovori sličnim potezom. Nijedna od kompanija nije javno potvrdila konačnu odluku o cenama, pa ovu mogućnost za sada treba posmatrati kao najavu pravca, a ne kao sprovedenu meru.

Šira slika

Za firme u regionu koje tek uvode AI alate u svakodnevni rad, ova epizoda nosi praktičnu pouku o planiranju. Trošak korišćenja modela nije fiksan, raste sa složenošću zadataka i brojem koraka koje agent izvede, pa budžetiranje bez praćenja lako izmakne kontroli. Iskustvo velikih kompanija pokazuje da je vredno unapred definisati ko ima pristup kojim alatima i za koje namene.

Iza svega stoji pitanje koje industrija još nije zatvorila: koliko od uloženog novca u veštačku inteligenciju zaista donosi merljivu vrednost. Dok se na to ne odgovori jasnije, racionisanje tokena verovatno neće biti prolazna faza, već način na koji kompanije pristupaju AI troškovima.

Često postavljana pitanja

Šta znači pojam tokenmaxxing?

Reč je o neformalnom nazivu za period početkom 2026. godine u kojem su kompanije podsticale zaposlene da koriste što više veštačke inteligencije, ponekad i kroz interne rang-liste potrošnje tokena. Token je jedinica obrade po kojoj se naplaćuje korišćenje modela.

Zašto kompanije sada uvode limite na AI?

Računi su, prema izveštavanju TechCrunch-a i CNBC-ja, ispali veći od planiranih, a finansijski timovi nisu imali alate da prate potrošnju. Firme poput Uber-a i Volmarta uvele su mesečne kvote i nivoe pristupa, dok Accenture pokušava da ograniči korišćenje skupih modela za rutinske zadatke.

Kako ovo utiče na OpenAI i Anthropic?

Obe kompanije dodale su poslovnim korisnicima alate za praćenje i ograničavanje potrošnje. Pošto njihov prihod zavisi od potrošnje po tokenu, obuzdavanje potrošnje kod velikih klijenata moglo bi da uspori rast, zbog čega se pominje i mogućnost sniženja cena.

Da li su sve navedene cifre potvrđene?

Deo podataka, poput potrošnje od oko 500 miliona dolara na kredite za Claude u jednom mesecu, dolazi iz medijskog izveštavanja i nije nezavisno potvrđen. Takve navode treba čitati kao ilustraciju razmera, a ne kao zvanične brojke kompanija.

Kraj trke u potrošnji: kompanije počinju da racionišu AI tokene

Od podsticaja do troškovne stavke

Limiti, nivoi i kvote

Zašto agentski alati menjaju računicu

Kako reaguju OpenAI i Anthropic

Šira slika

Često postavljana pitanja

Šta znači pojam tokenmaxxing?

Zašto kompanije sada uvode limite na AI?

Kako ovo utiče na OpenAI i Anthropic?

Da li su sve navedene cifre potvrđene?

Možda vas zanima

Anthropic objavio izveštaj Cadences: ritam dana i radne nedelje...

Claude sustiže ChatGPT među korisnicima koji plaćaju za AI

Micron ulaže u Anthropic i potpisuje višegodišnju nabavku memori...

Budi u toku sa AI revolucijom