Kompanija OpenAI objavila je 22. juna uputstvo pod nazivom „Codex-maxxing for long-running work", u kojem opisuje kako se njen agent za programiranje Codex može koristiti za zadatke koji traju satima ili danima, a ne samo za jedan upit. Tekst je potpisao Jason Liu iz OpenAI, a fokus je na tome da se Codex tretira kao stalno radno mesto koje zadržava kontekst, vodi složene tokove rada i održava napredak kroz duže projekte.
Reč je o smernicama, ne o novom modelu ili proizvodu. Prema navodima kompanije, cilj je da se promeni način na koji timovi sarađuju sa agentom, od kucanja pojedinačnih komandi ka usmeravanju i nadzoru rada koji se odvija u pozadini. OpenAI tu praksu predstavlja kao odgovor na poznatu slabost agentskih alata, gubitak konteksta i koherentnosti kada zadatak pređe granicu jedne sesije.
Od jednokratnog odgovora ka trajnom toku rada
Dosadašnji obrazac rada sa pomoćnicima za kod uglavnom je bio jednokratan. Korisnik postavi pitanje, dobije odgovor, pa sledeći zadatak počinje iz početka. OpenAI tvrdi da takav pristup brzo nailazi na zid kod obimnih poslova, poput velikih refaktorisanja koda, dugotrajnih istraživanja ili migracija koje se rade u više navrata.
Uputstvo razlaže nekoliko principa koje OpenAI smatra osnovom za održiv rad agenta. Najveći deo se svodi na to da se velik cilj razloži na manje, proverljive korake, da se kontekst čuva na način koji je vidljiv i čoveku, i da se jasno odredi kada agent radi sam, a kada je potreban ljudski nadzor.
Trajne niti
Centralni pojam je takozvana trajna nit, dugotrajan razgovor u kojem se kontekst gomila tokom vremena. Umesto da svaki put kreće iz početka, korisnik se vraća istoj niti i nastavlja tamo gde je stao. Prema uputstvu, takav pristup je pogodan za projekte koji traju više dana, kao što su veća refaktorisanja ili istraživački zadaci.
OpenAI istovremeno navodi i cenu ovog pristupa. Duže niti troše više računarskih resursa od kratkih, izolovanih interakcija, jer agent mora da nosi sve veći kontekst. To je kompromis koji kompanija otvoreno pominje, umesto da dugotrajne sesije predstavi kao rešenje bez troška.
Beležnica umesto sirove istorije poruka
Kako razgovor raste, sirova istorija poruka postaje nedovoljna. Zato uputstvo predlaže poseban sloj memorije, opisan kao beležnica koja eksplicitno beleži kontekst. U njoj se, kako se navodi, čuvaju projektne beleške, donete odluke, osobe uključene u posao, otvorena pitanja i stanje zadatka.
Ono što OpenAI posebno ističe jeste da ta memorija ostaje vidljiva za ljudski pregled, a ne skrivena u pozadini. Time se, prema kompaniji, smanjuje rizik da agent radi na osnovu pretpostavki koje korisnik ne može da proveri. Memorija postaje deo radnog prostora koji čovek može da čita i ispravlja.
Ciljevi koji se mogu proveriti
Uputstvo upozorava da nejasne instrukcije tipa „sprovedi plan" ne daju agentu način da prepozna kada je posao gotov. Umesto toga, preporučuje se da cilj sadrži očekivano ponašanje, kriterijume za pregled, ograničenja i testove koje treba da prođe. Tek tada, kako se navodi, Codex može sam da utvrdi da je zadatak završen.
Ovaj princip je u skladu sa širim pravcem u razvoju agentske veštačke inteligencije, gde se merljivi i proverljivi koraci sve više vide kao uslov da bi se automatizaciji uopšte moglo verovati na dužim zadacima.
Čovek ostaje u upravljačkoj petlji
Uprkos naglasku na samostalnosti, uputstvo zadržava čoveka u centru procesa. Opisani mehanizam usmeravanja omogućava da korisnik koriguje pravac dok posao traje, odobrava korake, dodaje kontekst, menja pristup ili dodaje nove zadatke u red, bez potrebe da svaku radnju izvodi ručno.
OpenAI to predstavlja kao pomak od kucanja upita ka nadzoru i stalnoj saradnji. U praksi, agent obavlja izvršni deo posla, dok čovek zadržava odluke o pravcu i prihvatanju rezultata. Pitanje koliko je takav nadzor u stvarnosti aktivan, a koliko formalan, ostaje otvoreno i zavisiće od toga kako timovi koriste alat.
Rezultati vidljivi tokom rada
Uputstvo pominje i bočne panele u kojima ostaju vidljivi međurezultati, poput Markdown dokumenata, tabela, PDF datoteka, beležnica i veb aplikacija. Ideja je da izlaz bude deo aktivnog toka rada, a ne tek konačni proizvod koji se vidi na kraju. Na taj način korisnik može da prati šta agent stvara dok posao još traje.
Šta ovo znači u praksi
Za razvojne timove u regionu, uključujući one u Srbiji koji već koriste agentske alate za programiranje, ovakve smernice imaju praktičnu vrednost jer opisuju kako se rad sa agentom organizuje na dužim projektima, a ne samo na pojedinačnim zadacima. Pristup sa trajnim nitima i eksplicitnom memorijom mogao bi da olakša rad na obimnim bazama koda, pod uslovom da se računa i sa većom potrošnjom resursa koju OpenAI sam pominje.
Treba imati u vidu da je reč o uputstvu koje dolazi od same kompanije, pa odražava njen pogled na to kako bi alat trebalo koristiti. Nezavisne provere efikasnosti opisanih praksi, kao i konkretni pokazatelji uštede vremena ili učestalosti grešaka, u tekstu nisu navedeni. Uputstvo nudi okvir i preporuke, dok će stvarnu vrednost pokazati primena u realnim projektima.
Često postavljana pitanja
Šta je „Codex-maxxing za dugotrajan rad"?
Reč je o uputstvu koje je OpenAI objavio 22. juna, sa praksama za korišćenje agenta Codex na zadacima koji traju duže od jedne sesije. Nije novi model ni proizvod, već skup preporuka za organizaciju rada.
Šta su trajne niti?
To su dugotrajni razgovori u kojima se kontekst gomila tokom vremena, pa korisnik nastavlja posao tamo gde je stao umesto da kreće iz početka. OpenAI navodi da duže niti troše više računarskih resursa.
Kako agent zna da je zadatak završen?
Uputstvo preporučuje da se cilj definiše kroz proverljive kriterijume, očekivano ponašanje, ograničenja i testove. Na osnovu njih agent prepoznaje kada je posao obavljen, umesto da radi po nejasnoj instrukciji.
Da li čovek i dalje učestvuje u radu?
Da. Uputstvo zadržava čoveka u upravljačkoj petlji kroz mehanizam usmeravanja, koji omogućava odobravanje koraka, dodavanje konteksta i promenu pristupa dok posao traje.
