8. јануар 2026.

Netomi lekcije za skaliranje agentnih sistema u preduzeću

Napravljen uz OpenAI GPT‑4.1 i GPT‑5.2, Netomi nudi obrazac za bezbedno i predvidivo skaliranje agentnih sistema u celoj kompaniji.

Контактирајте са одељењем продаје

Veličina kompanije: Стартап

Region: Северна Америка

Industrija: Технологија

Proizvodi: API

Учитавање…

Kompanije očekuju da AI agenti pouzdano obrađuju neuredne tokove rada, podrazumevano poštuju politike, rade pod velikim opterećenjem i prikazuju svoj rad.

Netomi⁠⁠(отвара се у новом прозору) gradi sisteme koji ispunjavaju taj visoki standard i opslužuju klijente sa liste Fortune 500 kao što su United Airlines i DraftKings. Njihova platforma kombinuje GPT‑4.1 za pouzdano korišćenje alata uz malu latenciju sa GPT‑5.2 za dublje, višekoračno planiranje, pri čemu oba rade unutar upravljanog sloja izvršavanja osmišljenog da akcije vođene modelom ostanu predvidive u stvarnim produkcionim uslovima.

Rad sa agentnim sistemima u ovom obimu dao je Netomiju jasan obrazac za ono što čini da ovakva uvođenja funkcionišu u velikim kompanijama.

„Naš cilj je bio da orkestriramo mnoge sisteme kojima bi ljudski agent inače upravljao i da to uradimo bezbedno, brzinom mašine.“

Puneet Mehta, direktor

Lekcija 1: Gradite za složenost stvarnog sveta, ne za idealizovane tokove

Jedan poslovni zahtev retko odgovara jednom API-ju. Stvarni tokovi rada obuhvataju sisteme za rezervacije, baze podataka lojalnosti, CRM sisteme, logiku politika, plaćanja i izvore znanja. Podaci su često nepotpuni, kontradiktorni ili vremenski osetljivi. Sistemi koji zavise od krutih tokova pucaju pod ovom promenljivošću.

Netomi je osmislio svoj Agentic OS tako da OpenAI modeli budu u centru upravljanog orkestracionog procesa izgrađenog za ovaj nivo neodređenosti. Platforma koristi GPT‑4.1 za brzo, pouzdano rezonovanje i pozivanje alata — ključno za tokove rada u realnom vremenu — a GPT‑5.2 kada su potrebni višekoračno planiranje ili dublje rezonovanje.

Da bi obezbedio dosledno ponašanje agenta tokom dugih, složenih zadataka, Netomi prati obrasce agentnih instrukcija koje preporučuje OpenAI:

Podsetnici na istrajnost koji pomažu GPT‑5.2 da održi rezonovanje kroz duge, višekoračne tokove rada
Jasna očekivanja za korišćenje alata, suzbijajući halucinirane odgovore tako što usmeravaju GPT‑4.1 da poziva alate za autoritativne informacije tokom transakcionih operacija
Strukturisano planiranje, koje koristi dublje rezonovanje GPT‑5.2 za skiciranje i izvršavanje višekoračnih zadataka
Odluke o bogatim medijima koje vodi agent, oslanjajući se na GPT‑5.2 da prepozna i signalizira kada poziv alata treba da vrati slike, video, obrasce ili druge bogate, multimodalne elemente

Zajedno, ovi obrasci pomažu modelu da pouzdano mapira nestrukturisane zahteve na višekoračne tokove rada i održava stanje kroz diskontinuirane interakcije.

Malo koja industrija tako jasno pokazuje potrebu za višekoračnim rezonovanjem kao avio-industrija, gde jedna interakcija rutinski obuhvata više sistema i slojeva politika. Jedno pitanje može zahtevati proveru pravila tarife, ponovno izračunavanje pogodnosti lojalnosti, pokretanje izmene karte i koordinaciju sa operacijama leta.

„U avio-industriji se kontekst menja iz minuta u minut. AI mora da rezonuje o situaciji u kojoj se korisnik nalazi — ne samo da izvrši izolovan zadatak“, rekao je Mehta. „Zato je svest o situaciji mnogo važnija od samih tokova rada i zato je arhitektura ansambla vođena kontekstom neophodna.“

Uz GPT‑4.1 i GPT‑5.2, Netomi može da nastavi da širi ove obrasce na bogatije višekoračne automatizacije — koristeći modele ne samo da odgovaraju na pitanja, već i da planiraju zadatke, redosled akcija i koordinaciju backend sistema od kojih velika avio-kompanija zavisi.

Lekcija 2: Paralelizujte sve da biste ispunili očekivanja poslovne latencije

U trenucima visokog pritiska — ponovno rezervisanje tokom oluje, rešavanje problema sa naplatom ili obrada naglih skokova potražnje — korisnici će odustati od svakog sistema koji okleva. Latencija određuje poverenje.

Većina AI sistema ne uspeva zato što zadatke izvršava sekvencijalno: klasifikacija → preuzimanje → validacija → pozivanje alata → generisanje izlaza. Netomi je umesto toga projektovao sistem za konkurentnost, koristeći prednosti niskolatentnog strimovanja i stabilnog pozivanja alata u GPT‑4.1.

Dijagram toka koji ilustruje poslovni AI tok rada za korisničku podršku. Upit korisnika o ponovnom rezervisanju otkazanog leta ulazi kroz više kanala (društvene mreže, ćaskanje, SMS, imejl, pretraga, glas). Sistem prepoznaje zahtev kao scenario ponovnog rezervisanja, primenjuje bezbednosne zaštitne ograde, orkestrira pozive alata za preuzimanje alternativa i primenu pravila tarifa i lojalnosti, izvršava radnje kroz sisteme za rezervacije i CRM i sastavlja validiran odgovor. Konačni izlaz korisniku isporučuje personalizovane opcije ponovnog rezervisanja i kompenzaciju za lojalnost.

GPT‑4.1 obezbeđuje brzo vreme do prvog tokena i predvidivo ponašanje pri pozivanju alata, što ovu arhitekturu čini održivom u velikom obimu; dok GPT‑5.2 obezbeđuje dublje višekoračne putanje rezonovanja kada su potrebne. Netomijev okvir konkurentnosti obezbeđuje da ceo sistem, a ne samo model, ostane ispod kritičnih pragova latencije.

Ovi zahtevi za konkurentnošću nisu jedinstveni za avio-industriju. Svakom sistemu izloženom naglim, ekstremnim skokovima saobraćaja potrebna je ista arhitektonska disciplina. DraftKings, na primer, redovno stres-testira ovaj model, pri čemu saobraćaj tokom velikih sportskih događaja skače na više od 40.000 istovremenih korisničkih zahteva u sekundi.

Tokom takvih događaja, Netomi je održao odgovore kraće od tri sekunde uz 98% tačnosti klasifikacije namere, čak i kada tokovi rada zahvataju naloge, plaćanja, pretrage znanja i regulatorne provere.

„AI je centralan i ključan za način na koji podržavamo korisnike u trenucima koji su najvažniji“, rekao je Paul Liberman, suosnivač i predsednik operacija u kompaniji DraftKings. „Netomijeva platforma nam pomaže da agilno i precizno obradimo ogromne skokove aktivnosti.“

U velikom obimu, Netomijev model konkurentnosti zavisi od brzog i predvidivog pozivanja alata u GPT‑4.1, što održava višekoračne tokove rada odzivnim pod ekstremnim opterećenjem.

Lekcija 3: Učinite upravljanje sastavnim delom izvršavanja

Poslovni AI mora biti pouzdan po dizajnu, sa upravljanjem utkanim direktno u izvršavanje — ne dodatim kao spoljnim slojem.

Kada poverenje u nameru padne ispod praga ili kada zahtev ne može da se klasifikuje sa visokom sigurnošću, Netomijevi mehanizmi upravljanja se aktiviraju da odrede kako će zahtev biti obrađen, obezbeđujući da se sistem povuče iz slobodnog generisanja u korist kontrolisanih putanja izvršavanja.

Na tehničkom nivou, sloj upravljanja obuhvata:

Validaciju šeme, koja proverava svaki poziv alata u odnosu na očekivane argumente i OpenAPI ugovore pre izvršavanja
Sprovođenje politika koje primenjuje filterske teme, ograničenja brenda i provere usklađenosti u toku rezonovanja i upotrebe alata
Zaštitu PII za otkrivanje i maskiranje osetljivih podataka kao deo predobrade i obrade odgovora
Deterministički povratak, koji vraća na poznata bezbedna ponašanja kada su namera, podaci ili pozivi alata dvosmisleni
Vidljivost tokom izvršavanja, koja izlaže tragove tokena, korake rezonovanja i dnevnike lanca alata za inspekciju i otklanjanje grešaka u realnom vremenu

U strogo regulisanim oblastima kao što je dentalno osiguranje, ovakvo upravljanje nije predmet pregovora. Jedan Netomijev klijent iz industrije osiguranja obrađuje blizu dva miliona zahteva pružalaca usluga godišnje u svih 50 saveznih država, uključujući provere podobnosti, pretrage pogodnosti i upite o statusu zahteva, gde jedan netačan odgovor može stvoriti naknadni regulatorni ili uslužni rizik.

Tokom otvorenog upisa, kada su nadzor i obim dostigli vrhunac, kompaniji je bio potreban AI koji sprovodi politiku kao deo samog izvršavanja. Netomijeva arhitektura je odgovorila na taj složen zahtev.

„Izgradili smo sistem tako da, ako agent ikada dođe do neizvesnosti, tačno zna kako bezbedno da se povuče“, rekao je Mehta. „Upravljanje nije naknadno dodato — ono je deo izvršavanja.“

Obrazac za izgradnju agentnih sistema koji rade za preduzeća

Netomijev put pokazuje šta je potrebno da bi se zadobilo poverenje velikih kompanija: gradite za složenost, paralelizujte da zadovoljite zahteve latencije i ugradite upravljanje u svaki tok rada. OpenAI modeli čine kičmu rezonovanja, dok Netomijev sistemski inženjering obezbeđuje da inteligencija bude operativno bezbedna, proverljiva i spremna za Fortune 500 okruženja.

Ovi principi pomogli su Netomiju da skalira kroz neke od najzahtevnijih industrija na svetu — i nude obrazac za svaki startup koji želi da agentni AI pretvori u infrastrukturu spremnu za produkciju.

Rezultati na prvi pogled

Uvođenje agentnih sistema u Fortune 500 okruženjima zahteva brzinu, tačnost i ugrađeno upravljanje. Netomijeva arhitektura isporučuje sve troje, održavajući performanse čak i tokom ekstremnih skokova saobraćaja i složenih, višekoračnih tokova rada.

Obezbeđeni odgovori kraći od tri sekunde tokom događaja sa velikim saobraćajem
Održana tačnost klasifikacije namere od 98% u velikom obimu
Obrađeni skokovi saobraćaja veći od 40.000 istovremenih korisničkih zahteva u sekundi
Upravljanje ugrađeno direktno u izvršavanje, uz deterministički povratak i sprovođenje politika

OpenAI <3 startape

Pridružite se zajednici Počnite da gradite

Наставите са читањем

Advancing responsible AI across Europe — card

Унапређење одговорне ВИ широм Европе

Глобална питања31. јул 2026.

Building abundant intelligence

Компанија31. јул 2026.

Univé builds an AI-ready workforce

31. јул 2026.