OpenAI je 24. juna predstavio Jalapeño, prvi procesor koji je kompanija sama projektovala, namenjen isključivo pokretanju velikih jezičkih modela. Čip je razvijen u saradnji sa Broadcomom, a proizvodi ga tajvanski TSMC. Predstavljanjem ovog rešenja OpenAI ulazi u red kompanija koje pokušavaju da smanje zavisnost od Nvidije, dosadašnjeg gotovo isključivog dobavljača hardvera za veštačku inteligenciju.
Kompanija je čip opisala kao svoj prvi "procesor inteligencije", arhitekturu građenu oko sopstvene predstave o tome kako će izgledati buduće izvršavanje jezičkih modela. Za razliku od Nvidijinih grafičkih procesora opšte namene, Jalapeño je, prema navodima OpenAI-ja, projektovan samo za jedan posao: inferenciju, odnosno fazu u kojoj već istreniran model odgovara na upite korisnika.
Šta je tačno objavljeno
Jalapeño je namensko integrisano kolo, u industriji poznato pod skraćenicom ASIC. Reč je o čipu koji nije univerzalan, već je njegova silicijumska struktura podešena za obrasce koje stvara rad jezičkih modela zasnovanih na arhitekturi transformera. Tu spadaju česta čitanja iz memorije, računanje u nižoj preciznosti i predvidljivo izvršavanje sloj po sloj, kao i mrežno ponašanje pri istovremenom opsluživanju velikog broja korisnika.
Prema saopštenju kompanija, čip je projektovan tako da smanji nepotrebno pomeranje podataka i da uravnoteži računske, memorijske i mrežne resurse. Cilj je da iskorišćenost hardvera bude bliža teorijskom maksimumu, što je kod opštenamenskih procesora obično teško postići. OpenAI navodi i da je Jalapeño zamišljen sa dovoljno fleksibilnosti da radi sa različitim jezičkim modelima, ne samo sa sopstvenim.
Razvoj za devet meseci
Jedan od podataka koje su obe kompanije istakle jeste brzina razvoja. Od prvog nacrta do takozvanog tape-out trenutka, kada je dizajn spreman za proizvodnju, prošlo je oko devet meseci. To je neuobičajeno kratak rok za projektovanje čipa ovog reda složenosti. OpenAI tvrdi da je proces ubrzan korišćenjem sopstvenih modela u fazama dizajna, mada kompanija nije objavila detaljne podatke koji bi taj doprinos precizno izmerili.
Tehnički mediji koji su pratili predstavljanje opisali su Jalapeño kao veliki čip dimenzija blizu granice koju dozvoljava proces proizvodnje. Takvi čipovi, sa velikom površinom silicijuma, po pravilu su skupi za izradu i zahtevni za hlađenje, što su faktori koje će tek pokazati stvarna primena u podatkovnim centrima.
Tvrdnje o performansama i ceni
Najviše pažnje privukle su tvrdnje o odnosu cene i učinka. Izvršni direktor Broadcoma Hok Tan izjavio je da rana laboratorijska testiranja pokazuju učinak uporediv sa Nvidijinim čipovima iz serije Blackwell i Googleovim tenzorskim procesorima. Prema njegovim rečima, Jalapeño bi mogao da donese uštedu od oko 50 odsto po tokenu pri inferenciji u poređenju sa postojećom generacijom grafičkih procesora.
OpenAI je sa svoje strane naveo da čip pruža znatno bolji učinak po vatu utrošene energije od trenutno najboljih rešenja na tržištu. Te brojke za sada počivaju na internim merenjima i izjavama rukovodilaca, a ne na nezavisnim testovima. Do prve šire primene biće teško proveriti koliko se laboratorijski rezultati prenose na svakodnevni rad pod punim opterećenjem.
Ekonomski značaj inferencije je velik upravo zato što se ona ponavlja milijardama puta. Treniranje modela je jednokratan, mada skup posao, dok se inferencija odvija svaki put kada neko postavi pitanje pomoćniku poput ChatGPT-a. Smanjenje troška po odgovoru zato direktno utiče na profitabilnost kompanija koje pružaju ovakve usluge.
Udarac na Nvidijinu poziciju
Nvidija već godinama drži dominantan udeo na tržištu čipova za veštačku inteligenciju, a njeni grafički procesori postali su praktično standard za treniranje i pokretanje velikih modela. Visoke cene i ograničena dostupnost tih čipova naveli su najveće kupce da traže alternative, bilo kroz sopstveni dizajn, bilo kroz saradnju sa proizvođačima poput Broadcoma.
OpenAI tako sledi put kojim su ranije krenuli Google sa svojim tenzorskim procesorima, Amazon sa čipovima Trainium i Inferentia, kao i druge velike kompanije. Logika je slična: ako se najveći deo troška svodi na hardver jednog dobavljača, sopstveni čip prilagođen tačno određenom poslu može da snizi cenu i smanji pregovaračku moć tog dobavljača.
Važno je naglasiti da OpenAI ovim potezom ne napušta Nvidiju u potpunosti. Kompanija i dalje koristi velike količine Nvidijinog hardvera, a Jalapeño je za sada usmeren na jedan deo posla. Realnija slika je da se gradi mešovita infrastruktura, u kojoj sopstveni čipovi preuzimaju deo opterećenja kako bi se ukupni troškovi spustili.
Vremenski okvir
Prva primena Jalapeño čipova planirana je za kraj 2026. godine, uz postepeno širenje u narednom periodu. OpenAI je saopštio i ambiciozniji cilj: da do 2029. godine sopstveni čipovi pokreću oko deset gigavata računske snage. Reč je o izuzetno velikom kapacitetu, uporedivom sa potrošnjom čitavih gradova, što ukazuje na razmere ulaganja u infrastrukturu koje kompanija planira.
Ostvarenje tog plana zavisi od više činilaca koji su izvan kontrole same kompanije. Tu su proizvodni kapaciteti TSMC-a, dostupnost napredne memorije, kao i izgradnja podatkovnih centara i njihovo napajanje. Svaka od tih karika može da uspori najavljeni tempo, pa najavljene brojke za 2029. godinu treba posmatrati kao cilj, ne kao zagarantovan ishod.
Šta to znači za korisnike i tržište
Za krajnje korisnike pomoćnika zasnovanih na veštačkoj inteligenciji efekat neće biti vidljiv odmah. Ako se uštede u ceni inferencije ostvare, one mogu dugoročno da utiču na cene pretplata, na velikodušnost besplatnih planova i na brzinu odgovora. U regionu, gde su mnoge firme i pojedinci osetljivi na cenu ovakvih usluga, svako sniženje troška pružanja usluge moglo bi vremenom da se odrazi i na dostupnost.
Za tržište hardvera predstavljanje Jalapeña je još jedan znak da se najveći kupci sve ozbiljnije okreću sopstvenim rešenjima. To ne znači kraj Nvidijine dominacije, ali pokazuje da se oko nje stvara konkurentski pritisak. Da li će taj pritisak doneti niže cene i veću raznovrsnost, pokazaće tek naredne godine i prvi nezavisni rezultati iz stvarne primene.
Često postavljana pitanja
Šta je Jalapeño?
Jalapeño je prvi čip koji je OpenAI sam projektovao, namenjen pokretanju velikih jezičkih modela. Reč je o namenskom integrisanom kolu, takozvanom ASIC-u, koji proizvode Broadcom i TSMC, a usmeren je na inferenciju, odnosno na fazu davanja odgovora.
Da li Jalapeño zamenjuje Nvidijine čipove?
Ne u potpunosti. OpenAI i dalje koristi Nvidijin hardver, a sopstveni čip preuzima deo posla vezan za inferenciju. Cilj je da se ukupni troškovi snize i da se smanji zavisnost od jednog dobavljača, a ne potpuna zamena.
Koliko je čip brži ili jeftiniji?
Broadcom navodi učinak uporediv sa Nvidijinim Blackwell čipovima i Googleovim tenzorskim procesorima, uz uštedu od oko 50 odsto po tokenu pri inferenciji. Te brojke za sada počivaju na internim testovima i izjavama rukovodilaca, pa ih treba uzeti uslovno do nezavisnih provera.
Kada čip stiže u primenu?
Prva primena planirana je za kraj 2026. godine, uz postepeno širenje. OpenAI je najavio cilj da do 2029. godine sopstveni čipovi pokreću oko deset gigavata računske snage, što zavisi od proizvodnih i infrastrukturnih uslova.
