Google je 30. juna predstavio dva nova modela iz porodice Gemini namenjena programerima, Nano Banana 2 Lite za generisanje slika i Gemini Omni Flash za pravljenje i obradu videa. Oba su, kako je kompanija saopštila, od prvog dana dostupna preko Gemini API-ja i alata Google AI Studio, a Nano Banana 2 Lite stiže i u Gemini Enterprise Agent Platform za poslovne korisnike.
Potez pokazuje kuda Google usmerava svoju ponudu generativnih modela. Umesto jednog modela koji pokušava da radi sve, kompanija sada nudi laganije i jeftinije verzije skrojene za konkretne zadatke, gde su brzina i cena važniji od maksimalnog kvaliteta.
Šta je Nano Banana 2 Lite
Nano Banana 2 Lite, koji se u tehničkoj dokumentaciji vodi i kao Gemini 3.1 Flash-Lite Image, Google opisuje kao najbrži i cenovno najpovoljniji model u Nano Banana porodici. Prema navodima kompanije, model pravi sliku za oko četiri sekunde, a prosečna cena preko API-ja iznosi 0,034 dolara za hiljadu slika.
Reč je o svesnom kompromisu. Model podržava isključivo rezoluciju od jednog kilopiksela, dakle standardnu 1K sliku, i nije namenjen radu na finalnim materijalima najvišeg kvaliteta. Google ga pozicionira za brzo skiciranje ideja i za razvojne procese velikog obima, tamo gde tim treba mnogo varijanti u kratkom roku i uz nisku cenu po slici.
Za razvoj proizvoda to znači da se generisanje slika može ugraditi u tokove rada koji do sada nisu bili isplativi. Aplikacija koja korisniku nudi desetine predloga vizuala, alat za brzo pravljenje reklamnih varijanti ili sistem koji automatski generiše ilustracije uz tekst, sve to sada ima jasniju računicu jer trošak po slici pada na nivo koji se lakše planira.
Gde će model biti dostupan
Osim programerima, Google je najavio da Nano Banana 2 Lite stiže i na potrošačke servise kompanije. Na spisku su AI Mode u pretrazi, aplikacija Gemini, NotebookLM, Google Photos, alat Stitch, Google Flow i Google Ads. Time se isti model provlači kroz širok skup Google proizvoda, od pretrage do oglašivačke platforme.
Gemini Omni Flash i pomak ka videu
Drugi model, Gemini Omni Flash, prvi je iz nove Omni porodice. Google ga opisuje kao mesto gde se multimodalno rezonovanje Geminija spaja sa generisanjem i obradom videa. Model prihvata kombinaciju teksta, slika i video zapisa kao ulaz, a zatim na osnovu toga pravi ili menja snimak.
Cena za Omni Flash postavljena je na 0,10 dolara po sekundi generisanog videa. Model podržava razgovornu obradu, pa se izmene traže običnim uputstvima. Prema Google navodima, moguće je zameniti lik ili proizvod u kadru, primeniti prenos stila, dodati objekte u scenu ili promeniti osvetljenje.
Kompanija je istovremeno jasno navela i granice. U ovoj fazi Omni Flash pravi snimke do deset sekundi, a duže trajanje je najavljeno kao nešto što tek dolazi. Zvučne reference još nisu podržane, produžavanje scene nije dostupno, a video reference do tri sekunde, iako ih šema formalno prihvata, model za sada ne obrađuje ispravno. Google te stavke navodi otvoreno, što olakšava programerima da unapred znaju na šta mogu da računaju.
Dva pravca iste strategije
Zajedničko lansiranje slike i videa nije slučajno. Google gradi slojeve alata koji pokrivaju ceo vizuelni sadržaj, od statične slike do kratkog snimka, i sve to nudi kroz isti API i isti studio. Za programere to znači da mogu da grade aplikacije koje kombinuju oba modela bez prelaska na različite platforme.
Konkurencija na ovom polju je zaoštrena. OpenAI i druge laboratorije razvijaju sopstvene modele za sliku i video, a tržište alata za generisanje sadržaja raste brže nego što se većina segmenata veštačke inteligencije širi. Google odgovara pritiskom na cenu i brzinu, računajući da će jeftiniji modeli privući programere koji grade proizvode za širu publiku.
Šta to znači za korisnike u regionu
Za razvojne timove u Srbiji i regionu, koji često rade za inostrane klijente ili grade sopstvene proizvode sa ograničenim budžetom, niska cena po slici može biti presudna. Alat koji generiše vizuale za marketing, aplikacije koje prave sadržaj na zahtev ili interni sistemi za brzo prototipiranje dobijaju model čija se potrošnja lakše uklapa u male budžete.
Treba imati u vidu da su ograničenja rezolucije i dužine videa stvarna. Nano Banana 2 Lite nije zamena za modele koji prave materijale najvišeg kvaliteta, a Omni Flash u ovoj fazi pravi kratke snimke bez zvuka. Za mnoge svakodnevne zadatke, međutim, to je dovoljno, a odnos cene i brzine je ono što ove modele izdvaja.
Pitanje autorskih prava i porekla podataka za treniranje ostaje otvoreno, kao i kod ostalih generativnih modela. Google u zvaničnim najavama naglašava dostupnost i cenu, dok šira debata o tome ko poseduje materijale nastale uz pomoć ovakvih alata i dalje traje.
Često postavljana pitanja
Koliko košta generisanje slike modelom Nano Banana 2 Lite
Prema Google navodima, cena je 0,034 dolara za hiljadu slika preko Gemini API-ja, uz vreme generisanja od oko četiri sekunde po slici u rezoluciji od jednog kilopiksela.
Šta radi Gemini Omni Flash
Omni Flash je model za generisanje i obradu videa iz kombinacije teksta, slike i snimka. U ovoj fazi pravi snimke do deset sekundi i podržava razgovornu obradu, poput zamene lika ili objekta i promene stila, dok zvučne reference i produžavanje scene još nisu dostupni.
Gde su modeli dostupni
Nano Banana 2 Lite dostupan je preko Google AI Studio, Gemini API-ja i Gemini Enterprise Agent Platform, uz najavljeno širenje na potrošačke servise kao što su pretraga, Gemini aplikacija i Google Photos. Gemini Omni Flash se programerima nudi preko Gemini API-ja i Google AI Studio.
Za koga su ovi modeli namenjeni
Google ih pozicionira za programere i timove kojima su brzina i cena važniji od maksimalnog kvaliteta, na primer za brzo skiciranje ideja, generisanje sadržaja na zahtev i razvojne procese velikog obima.
