Dok se prva generacija AI agenata seli iz demo snimaka u stvarne radne tokove, kompanije se sudaraju sa pitanjem koje chatbotovi nikada nisu postavljali: kako da budem siguran da će agent uraditi tačno ono što sme, i ništa više od toga? Microsoft je ove nedelje predstavio dva alata koja direktno gađaju taj problem — prenosive fajlove sa pravilima za ponašanje agenata i open source okvir za njihovo testiranje. Iako zvuče tehnički, oba menjaju način na koji će firme — uključujući i one kod nas — uopšte smeti da puste agente u produkciju.
Zašto je kontrola ponašanja agenata odjednom goruća tema
Klasičan chatbot je reaktivan: postavite pitanje, dobijete odgovor, kraj priče. AI agent je nešto sasvim drugo — on samostalno bira korake, poziva alate, šalje mejlove, menja podatke u bazi, plaća račune, otvara tikete. Ta autonomija je upravo ono zbog čega su agenti korisni, ali i ono što ih čini rizičnim. Agent koji pogrešno protumači zadatak ne daje samo loš odgovor — on može da preduzme pogrešnu akciju.
Zato se težište u industriji prebacuje sa pitanja „koliko je model pametan“ na pitanje „koliko mu mogu verovati“. Kompanije sve češće traže mehanizme kojima developeri, pravni timovi i bezbednosni timovi mogu da postave jasne granice — pre nego što agent uopšte dobije pristup pravim sistemima.
Šta su prenosivi fajlovi sa pravilima
Microsoftova specifikacija omogućava developerskim, compliance i bezbednosnim timovima da definišu sopstvene politike koje agenti moraju da prate — i to u prenosivim fajlovima sa pravilima. Ključna reč je prenosivi. Umesto da pravila budu zakopana u kodu jedne aplikacije ili u sistemskom promptu jednog modela, ona postaju zaseban dokument koji putuje sa agentom.
To znači da ista politika može da važi bez obzira na to da li agent radi u alatu za korisničku podršku, u internom HR sistemu ili u aplikaciji za fakturisanje. Pravila piše tim koji je za njih odgovoran — pravnik definiše šta sme da se kaže o ugovorima, bezbednjak definiše kojim podacima agent ne sme da pristupi — a ne developer koji nagađa šta bi oni hteli.
Kako to izgleda u praksi
Zamislite osiguravajuću kuću u Beogradu koja pušta agenta da obrađuje prve korake u prijavama šteta. Politika u prenosivom fajlu mogla bi da nalaže: agent sme da pročita prijavu i zatraži dokumentaciju, ali ne sme da odobri isplatu iznad određenog praga bez čoveka; ne sme da pokaže podatke jednog klijenta drugom; mora da odbije svaki zahtev koji nije vezan za štetu. Kada se ta ista firma sutra odluči da pređe na drugog dobavljača modela, politika ostaje — ne mora da se piše ispočetka.
Testiranje agenata: od „radi kod mene“ do merljivog kvaliteta
Pravila su tek pola priče. Drugi Microsoftov alat, open source okvir za evaluaciju agenata, rešava problem koji svako ko je gradio nešto sa LLM-ovima dobro poznaje: kako uopšte dokazati da agent radi kako treba, i da ga poslednja izmena nije pokvarila?
Okvir omogućava developerima da postave testove ponašanja agenata jednostavnim opisima na prirodnom jeziku — umesto da ručno pišu stotine test slučajeva u kodu. Praktično, možete da opišete šta očekujete („agent treba da odbije zahtev za povraćaj novca stariji od 30 dana“) i okvir generiše i pokreće odgovarajuće provere.
Ovo je važnije nego što deluje. Najveća razlika između običnog softvera i AI agenata je nepredvidivost: isti ulaz može dati malo drugačiji izlaz, a sitna promena prompta može da sruši ponašanje koje je juče radilo savršeno. Bez sistematskog testiranja, svaka nova verzija agenta je kockanje. Sa njim, dobijate nešto nalik regresionim testovima koje developeri već decenijama koriste za običan kod.
Šta ovo znači za firme u Srbiji i regionu
Na našem tržištu, gde mnoge firme tek razmatraju prve ozbiljne agentske projekte, ovakvi alati spuštaju prag za ulazak. Glavna prepreka usvajanju kod nas retko je tehnička — češće je to nepoverenje menadžmenta i strah od greške koja završi pred inspekcijom ili pred klijentom.
Prenosiva pravila tu pomažu na konkretan način. Compliance tim u banci ili u telekomu može da napiše politiku koju razume — bez prevođenja zahteva preko tri sastanka do developera. A okvir za testiranje daje menadžmentu ono što do sada nije imao: dokaz, u brojkama, da agent prolazi definisane provere pre nego što dođe do pravih klijenata.
Treba biti realan: ovo nisu čarobni štapići. Pravila vrede onoliko koliko je dobro napisan svaki pojedinačni red, a testovi hvataju samo ona ponašanja koja se neko setio da proveri. Ali pomeranje odgovornosti za granice agenta sa developera na timove koji te granice zaista poznaju — pravne, bezbednosne, regulatorne — jeste pravac u kom cela industrija ide.
Praktični prvi koraci
Ako vaša firma tek kreće, ne morate da čekate veliki projekat. Krenite od jednog uskog zadatka sa jasnim granicama — na primer, agent koji odgovara na najčešća pitanja kupaca, ali nikada ne obećava popuste i uvek prosleđuje složene slučajeve čoveku. Zapišite ta pravila eksplicitno, napravite šaku test scenarija (uključujući one u kojima agent treba da odbije zahtev) i tek onda ga pustite u rad. Disciplina od prvog dana štedi mnogo glavobolja kasnije.
Često postavljana pitanja
Po čemu se AI agent razlikuje od običnog chatbota?
Chatbot odgovara na pitanja, dok agent samostalno preduzima akcije — poziva alate, menja podatke, šalje poruke, izvršava zadatke u više koraka. Ta autonomija ga čini korisnijim, ali i rizičnijim, pa zahteva jasne granice i kontrolu ponašanja.
Da li su prenosivi fajlovi sa pravilima dostupni samo u Microsoftovom okruženju?
Suština prenosivosti je upravo nezavisnost od jednog sistema — ideja je da ista politika važi kroz različite alate i modele. Microsoft je predstavio specifikaciju, ali smer u kom industrija ide jesu otvoreni, deljivi standardi za upravljanje agentima, a ne rešenja zaključana za jednog proizvođača.
Može li mala firma da koristi ovakve alate?
Da. Open source okviri za testiranje i jednostavni fajlovi sa pravilima ne zahtevaju veliki tim. Najvažnije je početi od jednog uskog, dobro definisanog zadatka i postepeno širiti opseg kako raste poverenje u sistem.
Da li testiranje agenta garantuje da neće pogrešiti?
Ne garantuje — testovi hvataju samo ona ponašanja koja ste se setili da proverite. Ali sistematsko testiranje dramatično smanjuje rizik i daje vam merljiv dokaz kvaliteta pre objave, što je ogroman korak u odnosu na puštanje agenta „na slepo“.