8 de gener del 2026

Lliçons de Netomi per escalar sistemes d'agents a l'empresa

Creat amb OpenAI GPT‑4.1 i GPT‑5.2, Netomi ofereix un model per escalar sistemes d'agents segurs i previsibles a tota l'empresa.

Contacta amb vendes

Mida de l'empresa: Empresa emergent

Regió: Amèrica del Nord

Indústria: Tecnologia

Productes: API

S'està carregant…

Les empreses esperen que els agents d'IA gestionin fluxos de treball desordenats de manera fiable, respectin les polítiques per defecte, operin sota una gran càrrega i mostrin la seva feina.

Netomi⁠⁠(s'obre en una finestra nova) construeix sistemes que compleixen aquest alt nivell, donant servei a clients del Fortune 500 com United Airlines i DraftKings. La seva plataforma combina GPT‑4.1 per a un ús d'eines fiable i de baixa latència amb GPT‑5.2 per a una planificació més profunda i en múltiples passos, fent funcionar tots dos dins d'una capa d'execució governada dissenyada per mantenir les accions impulsades pel model previsibles en condicions reals de producció.

Fer funcionar sistemes d'agents a aquesta escala ha donat a Netomi un model clar del que fa que aquests desplegaments funcionin dins de l'empresa.

«El nostre objectiu era orquestrar els molts sistemes que normalment gestionaria un agent humà i fer-ho amb seguretat a velocitat de màquina.»

Puneet Mehta, CEO

Lliçó 1: construeix per a la complexitat del món real, no per a fluxos idealitzats

Una sola sol·licitud empresarial rarament es correspon amb una sola API. Els fluxos de treball reals abasten motors de reserves, bases de dades de fidelització, sistemes CRM, lògica de polítiques, pagaments i fonts de coneixement. Sovint les dades són incompletes, contradictòries o sensibles al temps. Els sistemes que depenen de fluxos fràgils s'ensorren davant d'aquesta variabilitat.

Netomi va dissenyar el seu Agentic OS perquè els models d'OpenAI se situïn al centre d'un pipeline d'orquestració governat construït per a aquest nivell d'ambigüitat. La plataforma usa GPT‑4.1 per a un raonament ràpid i fiable i per a la crida d'eines —crític per als fluxos de treball en temps real— i GPT‑5.2 quan cal planificació en múltiples passos o un raonament més profund.

Per garantir un comportament coherent de l'agent en tasques llargues i complexes, Netomi segueix els patrons d'indicació agentica recomanats per OpenAI:

Recordatoris de persistència per ajudar GPT‑5.2 a mantenir el raonament al llarg de fluxos de treball llargs i en múltiples passos
Expectatives explícites d'ús d'eines, suprimint respostes al·lucinades orientant GPT‑4.1 a cridar eines per obtenir informació autoritzada durant operacions transaccionals
Planificació estructurada, que aprofita el raonament més profund de GPT‑5.2 per esquematitzar i executar tasques en múltiples passos
Decisions multimèdia riques impulsades per l'agent, basant-se en GPT‑5.2 per detectar i indicar quan una crida a una eina hauria de retornar imatges, vídeos, formularis o altres elements rics i multimodals

En conjunt, aquests patrons ajuden el model a mapar de manera fiable sol·licituds no estructurades a fluxos de treball en múltiples passos i a mantenir l'estat al llarg d'interaccions discontínues.

Poques indústries mostren la necessitat de raonament en múltiples passos tan clarament com les aerolínies, on una sola interacció sol abastar múltiples sistemes i capes de polítiques. Una sola pregunta pot requerir comprovar regles tarifàries, recalcular beneficis de fidelització, iniciar canvis de bitllet i coordinar-se amb les operacions de vol.

«En les aerolínies, el context canvia cada minut. La IA ha de raonar sobre l'escena en què es troba el client, no només executar una tasca aïllada», va dir Mehta. «Per això la consciència situacional importa molt més que només els fluxos de treball, i per això és essencial una arquitectura d'ensamblatge guiada pel context.»

Amb GPT‑4.1 i GPT‑5.2, Netomi pot continuar estenent aquests patrons cap a automatitzacions més riques i en múltiples passos, utilitzant els models no només per respondre preguntes, sinó per planificar tasques, seqüenciar accions i coordinar els sistemes de backend dels quals depèn una gran aerolínia.

Lliçó 2: paral·lelitza-ho tot per complir les expectatives de latència empresarials

En moments d'alta pressió —reubicacions durant una tempesta, resolució d'un problema de facturació o gestió de pics sobtats de demanda— els usuaris abandonaran qualsevol sistema que dubti. La latència defineix la confiança.

La majoria de sistemes d'IA fallen perquè executen les tasques seqüencialment: classificar → recuperar → validar → cridar eines → generar sortida. Netomi, en canvi, va dissenyar per a la concurrència, aprofitant el streaming de baixa latència i l'estabilitat en la crida d'eines de GPT‑4.1.

Diagrama de flux que il·lustra un flux de treball de suport al client amb IA empresarial. Una consulta de client sobre la reubicació d'un vol cancel·lat entra per diversos canals (xarxes socials, xat, SMS, correu electrònic, cerca, veu). El sistema identifica la sol·licitud com un escenari de reubicació, aplica barreres de seguretat, orquestra crides d'eines per recuperar alternatives i aplicar regles tarifàries i de fidelització, executa accions en sistemes de reserves i CRM, i munta una resposta validada. La sortida final ofereix opcions de reubicació personalitzades i compensació de fidelització al client.

GPT‑4.1 ofereix un temps ràpid fins al primer segment i un comportament previsible en la crida d'eines, cosa que fa viable aquesta arquitectura a escala; mentre que GPT‑5.2 aporta vies de raonament més profundes i en múltiples passos quan cal. El marc de concurrència de Netomi garanteix que el sistema total, no només el model, es mantingui per sota dels llindars crítics de latència.

Aquestes exigències de concurrència no són exclusives de les aerolínies. Qualsevol sistema exposat a pujades sobtades i extremes de trànsit necessita la mateixa disciplina arquitectònica. DraftKings, per exemple, posa regularment aquest model sota proves d'estrès, amb trànsit durant grans esdeveniments esportius que supera les 40.000 sol·licituds simultànies de clients per segon.

Durant aquests esdeveniments, Netomi ha mantingut respostes de menys de tres segons amb una precisió del 98% en la classificació de la intenció, fins i tot quan els fluxos de treball toquen comptes, pagaments, consultes de coneixement i comprovacions normatives.

«La IA és central i crítica per a com donem suport als clients en els moments que més importen», va dir Paul Liberman, cofundador i president d'operacions de DraftKings. «La plataforma de Netomi ens ajuda a gestionar pics massius d'activitat amb agilitat i precisió.»

A escala, el model de concurrència de Netomi depèn de la crida d'eines ràpida i previsible de GPT‑4.1, que manté els fluxos de treball en múltiples passos reactius sota càrregues extremes.

Lliçó 3: fes de la governança una part intrínseca del runtime

La IA empresarial ha de ser fiable des del disseny, amb la governança integrada directament en el runtime, no afegida com una capa externa.

Quan la confiança en la intenció cau per sota del llindar, o quan una sol·licitud no es pot classificar amb una alta certesa, entren en joc els mecanismes de governança de Netomi per determinar com es gestiona la sol·licitud, garantint que el sistema s'allunyi de la generació lliure en favor de camins d'execució controlats.

A nivell tècnic, la capa de governança gestiona:

Validació d'esquemes, que valida cada crida a eina contra els arguments esperats i els contractes OpenAPI abans de l'execució
Aplicació de polítiques que aplica filtres temàtics, restriccions de marca i comprovacions de compliment en línia durant el raonament i l'ús d'eines
Protecció de PII per detectar i emmascarar dades sensibles com a part del preprocessament i del tractament de respostes
Fallback determinista, redirigint cap a comportaments coneguts i segurs quan la intenció, les dades o les crides a eines són ambigües
Observabilitat del runtime, mostrant traces de segments, passos de raonament i registres de la cadena d'eines per a inspecció i depuració en temps real

En àmbits altament regulats com l'assegurança dental, aquest tipus de governança no és negociable. Un client de Netomi del sector assegurador processa prop de dos milions de sol·licituds de proveïdors cada any als 50 estats, incloent comprovacions d'elegibilitat, consultes de prestacions i consultes sobre l'estat de reclamacions, on una sola resposta incorrecta pot generar risc normatiu o de servei aigües avall.

Durant la matrícula oberta, quan l'escrutini i el volum van assolir el màxim, l'empresa necessitava una IA que fes complir la política com a part del mateix runtime. L'arquitectura de Netomi estava a l'altura d'aquest requisit complex.

«Vam construir el sistema perquè, si l'agent arriba mai a una situació d'incertesa, sàpiga exactament com retirar-se amb seguretat», va dir Mehta. «La governança no està enganxada després: forma part del runtime.»

Un model per construir sistemes d'agents que funcionin per a l'empresa

El camí de Netomi mostra què cal per guanyar-se la confiança empresarial: construir per a la complexitat, paral·lelitzar per satisfer les exigències de latència i integrar la governança en cada flux de treball. Els models d'OpenAI formen la columna vertebral del raonament, mentre que l'enginyeria de sistemes de Netomi garanteix que la intel·ligència sigui operativament segura, auditable i preparada per a entorns Fortune 500.

Aquests principis han ajudat Netomi a escalar en algunes de les indústries més exigents del món i ofereixen un model per a qualsevol startup que vulgui convertir la IA agentica en una infraestructura de nivell de producció.

Resultats d'un cop d'ull

Desplegar sistemes d'agents dins d'entorns Fortune 500 exigeix velocitat, precisió i governança integrada. L'arquitectura de Netomi ofereix les tres coses, mantenint el rendiment fins i tot durant pics extrems de trànsit i fluxos de treball complexos i en múltiples passos.

Va oferir respostes de menys de tres segons durant esdeveniments d'alt trànsit
Va mantenir una precisió del 98% en la classificació de la intenció a escala
Va gestionar pics de trànsit superiors a 40.000 sol·licituds simultànies de clients per segon
Va integrar la governança directament en el runtime, amb fallback determinista i aplicació de polítiques

OpenAI <3 startups

Uneix-te a la comunitat Comença a crear

Continuar llegint

Ampliant la frontera de preu-rendiment amb GPT-5.6

Producte30 de jul. del 2026

How avatarin built a 24/7 retail agent with GPT-Realtime

30 de jul. del 2026

Com activar dos paràmetres va triplicar la puntuació a la prova ARC-AGI-3

Recerca29 de jul. del 2026