Netomi-дің агенттік жүйелерді кәсіпорынға енгізу сабақтары
OpenAI GPT‑4.1 және GPT‑5.2 негізінде жасалған Netomi кәсіпорын ауқымында қауіпсіз, болжамды агенттік жүйелерді масштабтаудың үлгісін ұсынады.

Кәсіпорындар AI агенттерінен күрделі жұмыс ағындарын сенімді атқаруды, саясаттарды әдепкі бойынша сақтауды, жоғары жүктемеде жұмыс істеуді және өз жұмысының логикасын көрсетуді күтеді.
Netomi(жаңа терезеде ашылады) осы жоғары талапқа сай келетін жүйелер құрып, United Airlines және DraftKings сияқты Fortune 500 клиенттеріне қызмет көрсетеді. Олардың платформасы кідірісі төмен, құралдарды сенімді пайдалануға арналған GPT‑4.1 мен тереңірек, көпқадамды жоспарлауға арналған GPT‑5.2 моделін біріктіреді; екеуі де нақты өндірістік жағдайда модель басқаратын әрекеттердің болжамдылығын сақтауға арналған басқарылатын орындау қабатының ішінде жұмыс істейді.
Осындай ауқымда агенттік жүйелерді іске қосу Netomi-ге кәсіпорын ішінде мұндай енгізулердің табысты болуына не әсер ететінінің нақты үлгісін берді.
«Мақсатымыз — адам агенті әдетте қатар алып жүретін көптеген жүйені үйлестіріп, оны машина жылдамдығымен қауіпсіз орындау болды.»
Кәсіпорындағы бір сұрау сирек жағдайда бір ғана API-ге сәйкес келеді. Нақты жұмыс ағындары брондау жүйелерін, адалдық дерекқорларын, CRM жүйелерін, саясат логикасын, төлемдерді және білім көздерін қамтиды. Деректер көбіне толық емес, бір-біріне қайшы немесе уақытқа сезімтал болады. Осал ағындарға сүйенетін жүйелер мұндай құбылмалылыққа төтеп бере алмайды.
Netomi өзінің Agentic OS жүйесін OpenAI модельдері осындай белгісіздік деңгейіне арналған басқарылатын оркестрлеу желісінің ортасында тұратындай етіп жобалады. Платформа нақты уақыттағы жұмыс ағындары үшін аса маңызды жылдам, сенімді ой қорыту мен құрал шақыруға GPT‑4.1 қолданады, ал көпқадамды жоспарлау не тереңірек ой қорыту қажет болғанда GPT‑5.2 пайдаланады.
Ұзақ, күрделі тапсырмаларда агент мінез-құлқының тұрақтылығын қамтамасыз ету үшін Netomi OpenAI ұсынған агенттік көмексөз үлгілерін ұстанады:
- Тұрақтылық ескертпелері — GPT‑5.2-ге ұзақ, көпқадамды жұмыс ағындары бойы ой қорыту желісін сақтауға көмектеседі
- Құралды пайдалану бойынша айқын күтулер — транзакциялық операциялар кезінде беделді ақпарат алу үшін GPT‑4.1-ді құрал шақыруға бағыттап, жалған жауаптарды тежейді
- Құрылымдалған жоспарлау — GPT‑5.2-нің тереңірек ой қорытуын пайдаланып, көпқадамды тапсырмаларды сипаттап, орындайды
- Агент басқаратын бай медиа шешімдері — GPT‑5.2-ге құрал шақыруының суреттерді, видеоларды, формаларды немесе басқа да бай мультимодальды элементтерді қайтаруы керек сәтті анықтап, белгілеуге сүйенеді
Бұл үлгілер бірге модельге құрылымдалмаған сұрауларды көпқадамды жұмыс ағындарына сенімді түрде сәйкестендіріп, үзік-үзік әрекеттесулер арасында күйді сақтауға көмектеседі.
Көпқадамды ой қорытудың қажеттілігін әуе компанияларындай анық көрсететін салалар аз: мұнда бір әрекеттесу әдетте бірнеше жүйе мен саясат қабаттарын қамтиды. Бір ғана сұрақ тариф ережелерін тексеруді, адалдық жеңілдіктерін қайта есептеуді, билет өзгерістерін бастауды және ұшу операцияларымен үйлестіруді талап етуі мүмкін.
«Әуе саласында контекст минут сайын өзгеріп тұрады. AI тек оқшауланған тапсырманы орындап қана қоймай, клиенттің қандай жағдайда тұрғанын ой елегінен өткізуі керек», — деді Mehta. «Сондықтан жағдайлық хабардарлық жай жұмыс ағындарынан әлдеқайда маңызды, ал контекстке негізделген ансамбль архитектурасы — аса қажет.»
GPT‑4.1 және GPT‑5.2 көмегімен Netomi бұл үлгілерді байырақ көпқадамды автоматтандыруға одан әрі кеңейте алады — модельдерді тек сұрақтарға жауап беру үшін емес, тапсырмаларды жоспарлау, әрекеттер ретін құру және ірі әуе компаниясы сүйенетін бэкенд жүйелерін үйлестіру үшін қолданады.
Қысым жоғары сәттерде — дауыл кезіндегі қайта брондау, төлем мәселесін шешу немесе сұраныстың күрт артуын өңдеу кезінде — пайдаланушылар кідірген кез келген жүйеден бас тартады. Кідіріс сенімді анықтайды.
Көптеген AI жүйелері тапсырмаларды тізбектей орындайтындықтан сәтсіздікке ұшырайды: жіктеу → іздеу → тексеру → құрал шақыру → нәтиже шығару. Ал Netomi GPT‑4.1 моделінің төмен кідірісті стримингі мен тұрақты құрал шақыруын пайдаланып, архитектураны қатарластыққа арнап жобалады.

GPT‑4.1 алғашқы токенге дейінгі жылдам уақыт пен болжамды құрал шақыру мінез-құлқын береді, бұл осы архитектураны ауқымда өміршең етеді; ал GPT‑5.2 қажет кезде тереңірек көпқадамды ой қорыту жолдарын ұсынады. Netomi-дің қатарластық фреймворкі тек модель емес, бүкіл жүйе маңызды кідіріс шектерінен аспауын қамтамасыз етеді.
Мұндай қатарластық талаптары тек әуе саласына ғана тән емес. Кенеттен және өте жоғары трафик өсіміне ұшырайтын кез келген жүйеге дәл осындай архитектуралық тәртіп керек. Мысалы, DraftKings бұл модельді тұрақты түрде стресс-тесттен өткізеді: ірі спорт оқиғалары кезінде трафик секундына 40 000-нан астам бір мезеттегі клиент сұрауына дейін көтеріледі.
Осындай оқиғалар кезінде Netomi жұмыс ағындары аккаунттарды, төлемдерді, білім іздеуді және реттеуші тексерістерді қамтыса да, 98% ниет жіктеу дәлдігімен үш секундтан аз жауап уақытын сақтап қалды.
«AI — ең маңызды сәттерде клиенттерге қалай қолдау көрсететініміздің өзегі әрі шешуші бөлігі», — деді DraftKings-тің тең құрылтайшысы және операциялар президенті Paul Liberman. «Netomi платформасы бізге белсенділіктің орасан секірістерін икемділікпен және дәлдікпен басқаруға көмектеседі.»
Ауқымда Netomi-дің қатарластық моделі GPT‑4.1-дің жылдам әрі болжамды құрал шақыруына сүйенеді, бұл көпқадамды жұмыс ағындарының өте жоғары жүктеме астында да жедел болуын қамтамасыз етеді.
Кәсіпорындық AI жобалауынан бастап сенімді болуы керек, сондықтан басқару сыртқы қабат ретінде қосылмай, орындалу ортасына тікелей тоқылуы тиіс.
Ниетке деген сенім белгіленген шектен төмендегенде немесе сұрауды жоғары сеніммен жіктеу мүмкін болмағанда, Netomi-дің басқару тетіктері сұраудың қалай өңделетінін анықтау үшін іске қосылады, осылайша жүйе еркін формадағы генерациядан бас тартып, бақыланатын орындау жолдарын таңдауды қамтамасыз етеді.
Техникалық деңгейде басқару қабаты мыналарды атқарады:
- Схеманы тексеру — орындауға дейін әр құрал шақыруын күтілетін аргументтер мен OpenAPI келісімшарттарына қарсы тексереді
- Саясаттарды орындау — ой қорыту мен құрал пайдалану кезінде тақырып сүзгілерін, бренд шектеулерін және сәйкестік тексерістерін тікелей қолданады
- PII қорғанысы — алдын ала өңдеу мен жауапты өңдеу аясында сезімтал деректерді анықтап, бүркемелейді
- Детерминдік кері шегіну — ниет, дерек не құрал шақыруы түсініксіз болғанда, белгілі қауіпсіз әрекеттерге қайта бағыттайды
- Орындалу ортасының бақылануы — нақты уақыттағы тексеру мен жөндеуге арналған токен іздерін, ой қорыту қадамдарын және құрал тізбегі журналдарын ашады
Тіс сақтандыруы сияқты қатаң реттелетін салаларда мұндай басқару — талқыланбайтын талап. Сақтандыру саласындағы Netomi клиенттерінің бірі жыл сайын барлық 50 штат бойынша екі миллионға жуық провайдер сұрауын өңдейді, олардың ішінде жарамдылықты тексеру, жеңілдіктерді қарау және шағым күйін сұрау бар, мұнда бір ғана қате жауап кейін реттеуші не сервистік тәуекел тудыруы мүмкін.
Ашық тіркелу кезеңінде бақылау мен көлем шегіне жеткенде, компанияға саясаттарды орындалу ортасының өз бөлігі ретінде орындайтын AI қажет болды. Netomi архитектурасы осы күрделі талапқа сай келді.
«Жүйені агент белгісіздікке тап болса, қалай қауіпсіз түрде кері шегінуді дәл білетіндей етіп құрдық», — деді Mehta. «Басқару сыртынан жапсырылған емес — ол орындалу ортасының бөлігі.»
Netomi-дің жолы кәсіпорын сеніміне ие болу үшін не қажет екенін көрсетеді: күрделілікке арнап құру, кідіріс талаптарын өтеу үшін қатарластыру және басқаруды әрбір жұмыс ағынына енгізу. OpenAI модельдері ой қорыту тірегін құрайды, ал Netomi-дің жүйелік инженериясы бұл интеллектіні операциялық тұрғыда қауіпсіз, аудитке қолайлы және Fortune 500 ортасына дайын етеді.
Осы қағидалар Netomi-ге әлемдегі ең талапшыл салалардың кейбірінде ауқымдануға көмектесті — және агенттік AI-ды өндірістік деңгейдегі инфрақұрылымға айналдырғысы келетін кез келген стартапқа үлгі ұсынады.
Fortune 500 орталарында агенттік жүйелерді енгізу жылдамдықты, дәлдікті және ішіне ендірілген басқаруды талап етеді. Netomi архитектурасы осы үшеуін де қамтамасыз етіп, тіпті шектен тыс трафик өсімі мен күрделі, көпқадамды жұмыс ағындары кезінде де өнімділікті сақтайды.
- Жоғары трафик оқиғалары кезінде үш секундтан аз жауап уақытын берді
- Ауқымда ниетті жіктеудің 98% дәлдігін сақтады
- Секундына 40 000-нан асатын бір мезеттегі клиент сұрауы өсімін өңдеді
- Детерминдік кері шегіну мен саясатты орындаумен басқаруды орындалу ортасына тікелей енгізді


