8 იანვარი, 2026

Netomi-ს გაკვეთილები: აგენტური სისტემების მასშტაბირება ბიზნესში

OpenAI GPT‑4.1‑ითა და GPT‑5.2‑ით შექმნილი Netomi უსაფრთხო, პროგნოზირებადი აგენტური სისტემების ბიზნესში მასშტაბირების მაგალითს იძლევა.

გაყიდვების სამსახურთან დაკავშირება

კომპანიის ზომა: სტარტაპი

რეგიონი: ჩრდილოეთ ამერიკა

ინდუსტრია: ტექნოლოგია

პროდუქტები: API

იტვირთება…

ბიზნესები ელიან, რომ AI აგენტები რთულ სამუშაო ნაკადებს საიმედოდ გაუმკლავდებიან, ნაგულისხმევად დაიცავენ წესებს, იმუშავებენ მაღალი დატვირთვის ქვეშ და შეძლებენ თავიანთი მოქმედებების ახსნას.

Netomi⁠⁠(იხსნება ახალ ფანჯარაში) ქმნის სისტემებს, რომლებიც ამ მაღალ სტანდარტს აკმაყოფილებს და ემსახურება Fortune 500-ის მომხმარებლებს, როგორიცაა United Airlines და DraftKings. მათი პლატფორმა აერთიანებს GPT‑4.1-ს დაბალი დაყოვნების, საიმედო tool use-ისთვის და GPT‑5.2-ს უფრო ღრმა, მრავალსაფეხურიანი დაგეგმვისთვის; ორივე მუშაობს მართული შესრულების შრეში, რომელიც შექმნილია იმისთვის, რომ მოდელზე დაფუძნებული ქმედებები რეალურ საწარმოო პირობებში პროგნოზირებადი დარჩეს.

ამ მასშტაბზე აგენტური სისტემების მართვამ Netomi-ს მისცა მკაფიო ხედვა, თუ რა განაპირობებს ასეთ დანერგვებს ბიზნესში წარმატებას.

„ჩვენი მიზანი იყო იმ მრავალ სისტემის ორკესტრირება, რომლებსაც ადამიანური აგენტი ჩვეულებრივ მართავს, და ამის უსაფრთხოდ შესრულება მანქანის სიჩქარით.“

Puneet Mehta, CEO

გაკვეთილი 1: ააგეთ რეალური სამყაროს სირთულეებისთვის და არა იდეალიზებული ნაკადებისთვის

ერთი ბიზნეს-მოთხოვნა იშვიათად შეესაბამება ერთ API-ს. რეალური სამუშაო ნაკადები მოიცავს ჯავშნის ძრავებს, ლოიალურობის მონაცემთა ბაზებს, CRM სისტემებს, წესების ლოგიკას, გადახდებსა და ცოდნის წყაროებს. მონაცემები ხშირად არასრულია, ურთიერთსაწინააღმდეგოა ან დროზეა დამოკიდებული. სისტემები, რომლებიც მყიფე ნაკადებზეა დამოკიდებული, ამ ცვალებადობას ვერ უძლებს.

Netomi-მ თავისი Agentic OS ისე შექმნა, რომ OpenAI მოდელები იყოს მართული ორკესტრაციის მილის ცენტრალური ნაწილი, რომელიც სწორედ ასეთ გაურკვევლობაზეა გათვლილი. პლატფორმა იყენებს GPT‑4.1-ს სწრაფი, საიმედო მსჯელობისა და tool-calling-ისთვის — რაც გადამწყვეტია რეალურ დროში სამუშაო ნაკადებისთვის — ხოლო GPT‑5.2-ს მაშინ, როცა საჭიროა მრავალსაფეხურიანი დაგეგმვა ან უფრო ღრმა მსჯელობა.

გრძელი და რთული ამოცანების განმავლობაში აგენტის თანმიმდევრული ქცევის უზრუნველსაყოფად, Netomi მიჰყვება OpenAI-ის მიერ რეკომენდებულ აგენტურ მოთხოვნის პატერნებს:

მდგრადობის შეხსენებები, რათა GPT‑5.2-მ მსჯელობა გრძელ, მრავალსაფეხურიან სამუშაო ნაკადებში შეინარჩუნოს
tool use-ის მკაფიო მოლოდინები, რაც ამცირებს ჰალუცინირებულ პასუხებს და GPT‑4.1-ს მიმართავს, რომ ტრანზაქციული ოპერაციების დროს სარწმუნო ინფორმაციისთვის ინსტრუმენტები გამოიძახოს
სტრუქტურირებული დაგეგმვა, რომელიც GPT‑5.2-ის ღრმა მსჯელობას იყენებს მრავალსაფეხურიანი ამოცანების დასაგეგმად და შესასრულებლად
აგენტის მიერ მართული მდიდარი მედიის გადაწყვეტილებები, სადაც GPT‑5.2 ადგენს და მიუთითებს, როდის უნდა დააბრუნოს tool call-მა სურათები, ვიდეოები, ფორმები ან სხვა მდიდარი, მულტიმოდალური ელემენტები

ერთობლიობაში ეს პატერნები მოდელს ეხმარება, რომ არასტრუქტურირებული მოთხოვნები საიმედოდ დააკავშიროს მრავალსაფეხურიან სამუშაო ნაკადებთან და შეინარჩუნოს მდგომარეობა გაწყვეტილ ინტერაქციებს შორის.

ცოტა ინდუსტრია აჩვენებს მრავალსაფეხურიანი მსჯელობის საჭიროებას ისე მკაფიოდ, როგორც ავიაცია, სადაც ერთი ინტერაქცია ჩვეულებრივ რამდენიმე სისტემასა და წესების ფენას მოიცავს. ერთ კითხვას შეიძლება დასჭირდეს ტარიფების წესების შემოწმება, ლოიალურობის სარგებლის ხელახლა გამოთვლა, ბილეთის ცვლილებების ინიციაცია და ფრენის ოპერაციებთან კოორდინაცია.

„ავიაციაში კონტექსტი წუთიდან წუთამდე იცვლება. AI-მ უნდა იმსჯელოს იმ სიტუაციაზე, რომელშიც მომხმარებელია — და არა უბრალოდ შეასრულოს იზოლირებული ამოცანა,“ თქვა მეჰტამ. „ამიტომ სიტუაციური ცნობიერება ბევრად მნიშვნელოვანია, ვიდრე მხოლოდ სამუშაო ნაკადები, და ამიტომ კონტექსტზე დაფუძნებული ensemble არქიტექტურა აუცილებელია.“

GPT‑4.1-ითა და GPT‑5.2-ით Netomi-ს შეუძლია ეს პატერნები კიდევ უფრო მდიდარ მრავალსაფეხურიან ავტომატიზაციებში გააფართოოს — გამოიყენოს მოდელები არა მხოლოდ კითხვებზე პასუხის გასაცემად, არამედ ამოცანების დასაგეგმად, ქმედებების დასალაგებლად და იმ backend სისტემების საკოორდინაციოდ, რომლებზეც დიდი ავიაკომპანიაა დამოკიდებული.

გაკვეთილი 2: ყველაფერი პარალელურად გაუშვით, რომ ბიზნესის დაყოვნების მოლოდინებს უპასუხოთ

მაღალი წნეხის მომენტებში — ქარიშხლის დროს ხელახალი დაჯავშნა, ბილინგის პრობლემის მოგვარება ან მოთხოვნის მოულოდნელი ზრდა — მომხმარებლები მიატოვებენ ნებისმიერ სისტემას, რომელიც ყოყმანობს. დაყოვნება ნდობას განსაზღვრავს.

AI სისტემების უმეტესობა მარცხდება, რადგან ამოცანებს მიმდევრობით ასრულებს: კლასიფიცირება → მოძიება → ვალიდაცია → ინსტრუმენტების გამოძახება → შედეგის გენერირება. ამის ნაცვლად Netomi-მ სისტემა კონკურენტულობაზე ააგო, გამოიყენა GPT‑4.1-ის დაბალდაყოვნებიანი სტრიმინგი და სტაბილური tool-calling.

დიაგრამა, რომელიც აჩვენებს ბიზნესის AI მომხმარებელთა მხარდაჭერის სამუშაო ნაკადს. გაუქმებული ფრენის ხელახალი დაჯავშნის შესახებ მომხმარებლის შეკითხვა შემოდის მრავალ არხში (სოციალური, ჩატი, SMS, ელფოსტა, ძიება, ხმა). სისტემა მოთხოვნას ხელახალი დაჯავშნის სცენარად განსაზღვრავს, იყენებს უსაფრთხოების დამცავ მექანიზმებს, ორკესტრირებს tool call-ებს ალტერნატივების მისაღებად და ტარიფისა და ლოიალურობის წესების გამოსაყენებლად, ასრულებს ქმედებებს ჯავშნისა და CRM სისტემებში და აწყობს ვალიდირებულ პასუხს. საბოლოო შედეგი მომხმარებელს აწვდის პერსონალიზებულ ხელახალი დაჯავშნის ვარიანტებსა და ლოიალურობის კომპენსაციას.

GPT‑4.1 უზრუნველყოფს სწრაფ time-to-first-token-სა და პროგნოზირებად tool-calling ქცევას, რაც ამ არქიტექტურას მასშტაბზე სიცოცხლისუნარიანს ხდის; ხოლო GPT‑5.2 საჭიროებისას უფრო ღრმა მრავალსაფეხურიან მსჯელობის გზებს უზრუნველყოფს. Netomi-ის concurrency ჩარჩო უზრუნველყოფს, რომ კრიტიკულ დაყოვნების ზღვარს არ გადააჭარბოს მთელმა სისტემამ და არა მხოლოდ მოდელმა.

კონკურენტულობის ეს მოთხოვნები მხოლოდ ავიაციას არ ეხება. ნებისმიერ სისტემას, რომელიც მოულოდნელ და უკიდურეს ტრაფიკის ზრდას ექვემდებარება, იგივე არქიტექტურული დისციპლინა სჭირდება. მაგალითად, DraftKings ამ მოდელს რეგულარულად ამოწმებს მაღალი დატვირთვით — დიდ სპორტულ ღონისძიებებზე ტრაფიკი წამში 40,000-ზე მეტ ერთდროულ მომხმარებლის მოთხოვნამდე იზრდება.

ასეთ მოვლენებზე Netomi-მ შეინარჩუნა სამ წამზე ნაკლები პასუხის დრო და განზრახვის კლასიფიკაციის 98% სიზუსტე, მაშინაც კი, როცა სამუშაო ნაკადები ეხებოდა ანგარიშებს, გადახდებს, ცოდნის მოძიებასა და რეგულატორულ შემოწმებებს.

„AI ცენტრალური და კრიტიკულია იმისთვის, თუ როგორ ვუჭერთ მხარს მომხმარებლებს ყველაზე მნიშვნელოვან მომენტებში,“ თქვა DraftKings-ის თანადამფუძნებელმა და ოპერაციების პრეზიდენტმა პოლ ლიბერმანმა. „Netomi-ის პლატფორმა გვეხმარება აქტივობის მასშტაბურ პიკებს მოქნილობითა და სიზუსტით გავუმკლავდეთ.“

მასშტაბზე Netomi-ის concurrency მოდელი დამოკიდებულია GPT‑4.1-ის სწრაფ და პროგნოზირებად tool-calling-ზე, რაც მრავალსაფეხურიან სამუშაო ნაკადებს ექსტრემალური დატვირთვის დროსაც რეაგირებადს ტოვებს.

გაკვეთილი 3: მმართველობა runtime-ის ორგანულ ნაწილად აქციეთ

ბიზნესისთვის AI უნდა იყოს სანდო by design პრინციპით, სადაც მმართველობა პირდაპირ runtime-შია ჩაქსოვილი და არა დამატებულია როგორც გარე ფენა.

როდესაც განზრახვის ნდობა ზღვარზე ქვემოთ ეცემა, ან როდესაც მოთხოვნის მაღალი სიზუსტით კლასიფიკაცია შეუძლებელია, Netomi-ის მმართველობის მექანიზმები ერთვება, რათა განსაზღვროს როგორ დამუშავდეს მოთხოვნა და უზრუნველყოს, რომ სისტემა თავისუფალი გენერაციის ნაცვლად კონტროლირებად შესრულების გზებზე გადავიდეს.

ტექნიკურ დონეზე მმართველობის ფენა მართავს:

სქემის ვალიდაციას, რომელიც შესრულებამდე ამოწმებს თითოეულ tool call-ს მოსალოდნელ არგუმენტებთან და OpenAPI კონტრაქტებთან
წესების აღსრულებას, რომელიც მსჯელობისა და tool use-ის დროს inline რეჟიმში ამოქმედებს თემატურ ფილტრებს, ბრენდის შეზღუდვებსა და შესაბამისობის შემოწმებებს
PII-ის დაცვას მგრძნობიარე მონაცემების აღმოსაჩენად და დასამალად წინასწარი დამუშავებისა და პასუხის მართვის ფარგლებში
დეტერმინისტულ fallback-ს, რომელიც განზრახვის, მონაცემების ან tool call-ების ბუნდოვანებისას სისტემას ცნობილ უსაფრთხო ქცევებზე აბრუნებს
runtime დაკვირვებადობას, რომელიც რეალურ დროში ინსპექტირებისა და გამართვისთვის აჩენს token trace-ებს, მსჯელობის ნაბიჯებსა და tool-chain ჟურნალებს

მკაცრად რეგულირებულ სფეროებში, როგორიცაა სტომატოლოგიური დაზღვევა, ასეთი მმართველობა არ ექვემდებარება მოლაპარაკებას. დაზღვევის ინდუსტრიაში Netomi-ის ერთი მომხმარებელი ყოველწლიურად ამუშავებს თითქმის ორ მილიონ მომწოდებლის მოთხოვნას ყველა 50 შტატში, მათ შორის უფლების შემოწმებებს, სარგებლის მოძიებასა და პრეტენზიის სტატუსის შეკითხვებს, სადაც ერთმა არასწორმა პასუხმა შეიძლება შემდგომი რეგულატორული ან სერვისის რისკი შექმნას.

ღია რეგისტრაციის პერიოდში, როცა კონტროლი და მოცულობა პიკს აღწევდა, კომპანიას სჭირდებოდა AI, რომელიც წესებს runtime-ის ნაწილად აღასრულებდა. Netomi-ის არქიტექტურა ამ რთულ მოთხოვნას შეესაბამებოდა.

„სისტემა ისე ავაგეთ, რომ თუ აგენტი ოდესმე გაურკვევლობას მიაღწევს, ზუსტად იცის, როგორ დაიხიოს უსაფრთხოდ უკან,“ თქვა მეჰტამ. „მმართველობა ზედ არ არის მიმაგრებული — ის runtime-ის ნაწილია.“

გეგმა აგენტური სისტემების ასაშენებლად, რომლებიც ბიზნესისთვის მუშაობს

Netomi-ის გზა აჩვენებს, რა არის საჭირო ბიზნესის ნდობის მოსაპოვებლად: ააშენეთ სირთულისთვის, მოახდინეთ პარალელიზაცია დაყოვნების მოთხოვნების დასაკმაყოფილებლად და ჩააშენეთ მმართველობა ყველა სამუშაო ნაკადში. OpenAI მოდელები ქმნის მსჯელობის საფუძველს, ხოლო Netomi-ის სისტემური ინჟინერია უზრუნველყოფს, რომ ეს ინტელექტი ოპერაციულად უსაფრთხო, აუდიტირებადი და Fortune 500-ის გარემოებისთვის მზად იყოს.

ეს პრინციპები დაეხმარა Netomi-ს მასშტაბირებაში მსოფლიოს ყველაზე მომთხოვნ ინდუსტრიებში — და წარმოადგენს გზამკვლევს ნებისმიერი სტარტაპისთვის, რომელსაც სურს აგენტური AI საწარმოო დონის ინფრასტრუქტურად აქციოს.

შედეგები მოკლედ

აგენტური სისტემების დანერგვა Fortune 500-ის გარემოში მოითხოვს სიჩქარეს, სიზუსტეს და ჩაშენებულ მმართველობას. Netomi-ის არქიტექტურა სამივეს უზრუნველყოფს და ინარჩუნებს წარმადობას ექსტრემალური ტრაფიკის ზრდისა და რთული, მრავალსაფეხურიანი სამუშაო ნაკადების დროსაც.

უზრუნველყო სამ წამზე ნაკლები პასუხები მაღალი ტრაფიკის მოვლენების დროს
შეინარჩუნა განზრახვის კლასიფიკაციის 98% სიზუსტე მასშტაბზე
გაუმკლავდა ტრაფიკის პიკებს, რომლებიც წამში 40,000-ზე მეტ ერთდროულ მომხმარებლის მოთხოვნას აჭარბებდა
მმართველობა ჩააშენა პირდაპირ runtime-ში, დეტერმინისტული fallback-ით და წესების აღსრულებით

OpenAI <3 სტარტაპებს

შეუერთდით საზოგადოებას დაიწყეთ შექმნა

განაგრძეთ კითხვა

ფასი–წარმადობის მოწინავე ზღვრის გაფართოება GPT-5.6-ით

პროდუქტი30 ივლ. 2026

How avatarin built a 24/7 retail agent with GPT-Realtime

30 ივლ. 2026

როგორ გაასამმაგა ორმა პარამეტრმა ჩვენი ქულები ARC-AGI-3 ბენჩმარკზე

კვლევა29 ივლ. 2026