
Бүгін біз әзірлеушілер мен кәсіпорындарға пайдалы әрі сенімді агенттер құруға көмектесетін алғашқы негізгі құрамдастарды ұсынамыз. Біз агенттерді пайдаланушылардың атынан тапсырмаларды дербес орындайтын жүйелер деп қарастырамыз. Соңғы бір жылда біз агенттерді құруға қажет күрделі, көпқадамды тапсырмаларды модельдеріміз орындай алатындай негіз қалаған жаңа модель мүмкіндіктерін — мысалы, жетілдірілген ой қорыту, мультимодаль өзара әрекеттесулер және жаңа қауіпсіздік әдістерін — таныстырдық. Алайда клиенттер бұл мүмкіндіктерді өндіріске дайын агенттерге айналдыру қиын болуы мүмкін екенін, оған көбіне көмексөздерді көп рет қайталау мен жеткілікті көріну не кіріктірілген қолдау жоқ кезде арнайы оркестрация логикасы қажет болатынын айтты.
Осы қиындықтарды шешу үшін біз агенттік қосымшаларды әзірлеуді жеңілдетуге арнайы арналған жаңа API мен құралдар жиынтығын іске қосып жатырмыз:
- Жаңа Responses API(жаңа терезеде ашылады), ол агенттер құру үшін чат жауаптарын құратын API-дың қарапайымдылығын Assistants API-дың құралдарды пайдалану мүмкіндіктерімен біріктіреді
- Кіріктірілген құралдар, соның ішінде веб іздеу(жаңа терезеде ашылады), файлдар бойынша іздеу(жаңа терезеде ашылады) және компьютерді пайдалану(жаңа терезеде ашылады)
- Бір агентті және көп агентті жұмыс ағындарын оркестрациялауға арналған жаңа Agents SDK(жаңа терезеде ашылады)
- Агент жұмыс ағындарының орындалуын қадағалап, тексеруге арналған біріктірілген бақылау құралдары(жаңа терезеде ашылады)
Бұл жаңа құралдар агенттің негізгі логикасын, оркестрациясын және өзара әрекеттесулерін оңтайландырады, соның арқасында әзірлеушілерге агенттерді құруды бастау айтарлықтай жеңілдейді. Алдағы апталар мен айларда біз платформада агенттік қосымшаларды құруды одан әрі жеңілдету және жеделдету үшін қосымша құралдар мен мүмкіндіктерді шығаруды жоспарлап отырмыз.
Responses API — OpenAI-дың кіріктірілген құралдарын пайдаланып агенттер құруға арналған жаңа API примитивіміз. Ол Chat Completions қарапайымдылығын Assistants API-дың құралдарды пайдалану мүмкіндіктерімен біріктіреді. Модель мүмкіндіктері дами берген сайын, біз Responses API агенттік қосымшалар құрып жатқан әзірлеушілер үшін икемдірек негіз болады деп сенеміз. Responses API-ге бір ғана шақыру арқылы әзірлеушілер бірнеше құрал мен модельдің бірнеше айналымын пайдаланып, барған сайын күрделене түсетін тапсырмаларды шеше алады.
Бастапқы кезеңде Responses API веб іздеу, файлдар бойынша іздеу және компьютерді пайдалану сияқты жаңа кіріктірілген құралдарды қолдайды. Бұл құралдар модельдерді нақты әлеммен байланыстырып, тапсырмаларды орындауда оларды пайдалырақ ету үшін бірге жұмыс істеуге арналған. Сондай-ақ ол бірнеше ыңғайлылық жақсартуларын ұсынады, соның ішінде элементтерге негізделген біріздендірілген құрылым, қарапайымырақ полиморфизм, интуитивті ағындық оқиғалар және модельдің мәтіндік шығысына оңай қол жеткізуге арналған response.output_text сияқты SDK көмекшілері бар.
Responses API бірнеше API-ді немесе сыртқы жеткізушілерді біріктірудің күрделілігінсіз OpenAI модельдері мен кіріктірілген құралдарды өз қолданбаларына оңай біріктіргісі келетін әзірлеушілерге арналған. Бұл API сонымен қатар OpenAI ішінде деректерді сақтауды жеңілдетеді, сондықтан әзірлеушілер tracing және evaluations сияқты мүмкіндіктердің көмегімен агент өнімділігін бағалай алады. Еске сала кетейік, деректер OpenAI ішінде сақталса да, біз әдепкі бойынша модельдерімізді іскерлік деректерде үйретпейміз. API бүгіннен бастап барлық әзірлеушілерге қолжетімді және бөлек ақы алынбайды — токендер мен құралдар біздің баға бетінде(жаңа терезеде ашылады) көрсетілген стандартты мөлшерлемелер бойынша есептеледі. Толығырақ білу үшін Responses API жылдам бастау нұсқаулығын(жаңа терезеде ашылады) қарап шығыңыз.
- Chat Completions API(жаңа терезеде ашылады): Chat Completions әлі де біздің ең кең қолданылатын API болып қала береді және біз оны жаңа модельдермен және мүмкіндіктермен қолдауға толықтай ниеттіміз. Кіріктірілген құралдар қажет емес әзірлеушілер Chat Completions қолдануын сенімді түрде жалғастыра алады. Жаңа модельдердің мүмкіндіктері кіріктірілген құралдарға немесе бірнеше модель шақыруына тәуелді болмаса, біз оларды Chat Completions жүйесіне шығаруды жалғастырамыз. Дегенмен, Responses API — дәл сондай жоғары өнімділікке ие Chat Completions API-дың кеңейтілген нұсқасы(жаңа терезеде ашылады), сондықтан жаңа интеграциялар үшін Responses API-ден бастауды ұсынамыз.
- Assistants API(жаңа терезеде ашылады): Assistants API бета-нұсқасы бойынша әзірлеушілердің пікірлеріне сүйене отырып, біз негізгі жақсартуларды Responses API-ге енгіздік, соның арқасында ол икемдірек, жылдамырақ және қолдануға жеңілірек болды. Біз Assistants API мен Responses API арасында мүмкіндіктердің толық сәйкестігіне қол жеткізу бағытында жұмыс істеп жатырмыз, оның ішінде Assistant тәрізді және Thread тәрізді нысандарды, сондай-ақ Code Interpreter құралын қолдау бар. Бұл аяқталғаннан кейін, біз 2026 жылдың ортасын нысаналы тоқтату мерзімі ретінде белгілеп, Assistants API-дың ескіретілетінін ресми түрде жариялауды жоспарлап отырмыз. Ескірету кезінде біз әзірлеушілерге барлық деректерін сақтап, қолданбаларын көшіруге мүмкіндік беретін Assistants API-ден Responses API-ге көшу жөніндегі нақты нұсқаулықты ұсынамыз. Ескірету ресми жарияланғанға дейін біз жаңа модельдерді Assistants API-ге жеткізуді жалғастырамыз. Responses API — OpenAI платформасында агенттер құрудың болашақ бағыты.
Енді әзірлеушілер интернеттен анық әрі өзекті дәйексөздері бар жылдам, өзекті жауаптар ала алады. Responses API ішінде веб іздеу gpt-4o және gpt-4o-mini қолданылғанда құрал ретінде қолжетімді және оны басқа құралдармен немесе функция шақыруларымен бірге пайдалануға болады.
Ерте тестілеу барысында біз әзірлеушілердің веб іздеуді түрлі қолдану жағдайларында, соның ішінде сауда көмекшілерінде, зерттеу агенттерінде және сапар брондау агенттерінде — яғни интернеттен уақтылы ақпарат қажет болатын кез келген қолданбада — пайдаланып жатқанын көрдік.
Мысалы, Hebbia(жаңа терезеде ашылады) веб іздеу құралын активтерді басқарушыларға, жеке капитал және кредит фирмаларына, сондай-ақ заң практикасына кең ауқымды ашық және жабық деректер жиынтықтарынан әрекетке жарамды инсайттарды жылдам алуға көмектесу үшін қолданады. Зерттеу жұмыс ағындарына нақты уақыттағы іздеу мүмкіндіктерін біріктіру арқылы Hebbia контекстке бейімделген бай нарықтық барлау ұсынады және өз талдауларының дәлдігі мен өзектілігін үздіксіз жақсартып, қолданыстағы бенчмарктерден озып келеді.
API-дегі веб іздеу ChatGPT search үшін қолданылатын сол модель арқылы жұмыс істейді. Қысқа, нақты сұрақтарға жауап берудегі LLM (үлкен тілдік модель) дәлдігін бағалайтын SimpleQA бенчмаркі бойынша GPT‑4o search preview және GPT‑4o mini search preview тиісінше 90% және 88% нәтиже көрсетеді.
SimpleQA дәлдігі (жоғары болғаны жақсы)
API-дегі веб іздеу арқылы жасалған жауаптарда пайдаланушыларға көбірек білуге мүмкіндік беретін жаңалық мақалалары мен блог жазбалары сияқты дереккөздерге сілтемелер болады. Осындай анық, жолішілік дәйексөздердің арқасында пайдаланушылар ақпаратпен жаңа тәсілмен жұмыс істей алады, ал контент иелері кеңірек аудиторияға жетудің жаңа мүмкіндіктеріне ие болады.
Кез келген веб-сайт немесе баспа иесі API-дегі веб іздеуде көрінуді таңдай алады(жаңа терезеде ашылады).
Веб іздеу құралы Responses API ішінде preview ретінде барлық әзірлеушілерге қолжетімді. Сонымен қатар біз әзірлеушілерге чат жауаптарын құратын API арқылы gpt-4o-search-preview және gpt-4o-mini-search-preview көмегімен іздеуге арнайы бейімделген модельдерімізге тікелей қолжеткізу ұсынамыз. Бағалар(жаңа терезеде ашылады) GPT‑4o search үшін мың сұрауға $30-дан, ал 4o-mini search үшін мың сұрауға $25-тен басталады. Веб іздеуді сынақ алаңында(жаңа терезеде ашылады) қарап көріңіз және толығырақ біздің құжаттамадан(жаңа терезеде ашылады) біліңіз.
Енді әзірлеушілер жетілдірілген файлдар бойынша іздеу құралының көмегімен үлкен көлемдегі құжаттардан тиісті ақпаратты оңай ала алады. Бірнеше файл түрін қолдау, сұрауды оңтайландыру, метадеректер бойынша сүзгілеу және қайта ранжирлеу арқылы ол жылдам әрі дәл іздеу нәтижелерін бере алады. Ал Responses API арқылы оны біріктіру үшін бар болғаны бірнеше жол код жеткілікті.
Файлдар бойынша іздеу құралын әртүрлі нақты қолдану жағдайларында пайдалануға болады, соның ішінде клиенттерді қолдау агентіне ЖҚС-қа оңай қол жеткізуге мүмкіндік беру, заң көмекшісіне білікті маман үшін өткен істерге жылдам сілтеме жасауға көмектесу және кодтау агентіне техникалық құжаттама бойынша сұрау жіберуге жәрдемдесу. Мысалы, Navan(жаңа терезеде ашылады) файлдар бойынша іздеуді өзінің AI негізіндегі сапар агентінде пайдаланушыларға білім базасындағы мақалалардан (мысалы, компанияның сапар саясаты) нақты жауаптарды жылдам ұсыну үшін қолданады. Кіріктірілген сұрауды оңтайландыру және қайта ранжирлеу арқылы олар қосымша баптау не конфигурациясыз-ақ қуатты RAG (retrieval-augmented generation) конвейерін орната алады. Әр пайдаланушы тобына арналған бөлек векторлық сақтау орындарының арқасында Navan жауаптарды жеке аккаунт параметрлері мен пайдаланушы рөлдеріне бейімдей алады, бұл клиенттер мен олардың қызметкерлерінің уақытын үнемдеп, дәл әрі жекелендірілген қолдау көрсетуге көмектеседі.
Бұл құрал Responses API ішінде барлық әзірлеушілерге қолжетімді. Пайдалану құны мың сұрауға $2.50(жаңа терезеде ашылады), ал файл сақтау құны $0.10/GB/күн, алғашқы GB тегін. Құрал Assistants API ішінде де қолжетімді болып қала береді. Соңында, біз Vector Store API нысандарына басқа қолданбалар мен API-лерде пайдалану үшін деректеріңізге тікелей сұрау жіберетін жаңа іздеу соңғы нүктесін қостық. Толығырақ біздің құжаттамадан(жаңа терезеде ашылады) біліңіз және сынақ алаңында(жаңа терезеде ашылады) тестілеуді бастаңыз.
Компьютерде тапсырмаларды орындай алатын агенттерді құру үшін әзірлеушілер енді Responses API ішіндегі компьютерді пайдалану құралын қолдана алады, ол Computer-Using Agent (CUA) model арқылы жұмыс істейді және сол модель Operator мүмкіндігін де қамтамасыз етеді. Бұл зерттеу preview моделі толық компьютерді пайдалану тапсырмалары бойынша OSWorld(жаңа терезеде ашылады) көрсеткішінде 38.1%, WebArena(жаңа терезеде ашылады) бойынша 58.1%, ал веб-негізді өзара әрекеттесулерге арналған WebVoyager(жаңа терезеде ашылады) бойынша 87% нәтижеге қол жеткізіп, ең озық жаңа рекорд орнатты.
Кіріктірілген компьютерді пайдалану құралы модель жасаған тінтуір мен пернетақта әрекеттерін тіркейді, соның арқасында әзірлеушілер бұл әрекеттерді өз орталарында орындалатын командаларға тікелей түрлендіру арқылы компьютерді пайдалану тапсырмаларын автоматтандыра алады.
Әзірлеушілер компьютерді пайдалану құралын веб-қосымшаларда сапаны тексеру жүргізу немесе ескі жүйелерде дерек енгізу тапсырмаларын орындау сияқты браузерге негізделген жұмыс ағындарын автоматтандыру үшін пайдалана алады. Мысалы, Unify(жаңа терезеде ашылады) — кірісті өсіруге арналған әрекет жүйесі; ол агенттерді ниетті анықтау, аккаунттарды зерттеу және сатып алушылармен байланысу үшін қолданады. OpenAI-дың компьютерді пайдалану құралын қолдана отырып, Unify агенттері бұрын API арқылы қолжетімсіз болған ақпаратқа қол жеткізе алады — мысалы, мүлікті басқару компаниясына бизнестің жылжымайтын мүлік ауқымын кеңейткенін онлайн карталар арқылы тексеруге мүмкіндік береді. Бұл зерттеу жекелендірілген байланыс орнатуды іске қосатын арнайы сигнал ретінде қызмет етеді — нарыққа шығу стратегиясы командаларына сатып алушылармен дәл әрі ауқымды түрде жұмыс істеуге мүмкіндік береді.
Тағы бір мысал ретінде, Luminai(жаңа терезеде ашылады) API қолжетімділігі мен стандартталған деректері жоқ ескі жүйелері бар ірі кәсіпорындар үшін күрделі операциялық жұмыс ағындарын автоматтандыру мақсатында компьютерді пайдалану құралын біріктірді. Жақында ірі қоғамдық қызмет ұйымымен жүргізілген пилоттық жоба барысында Luminai өтінімдерді өңдеу мен пайдаланушыларды тіркеу үдерісін небәрі бірнеше күнде автоматтандырды — ал мұны дәстүрлі роботтандырылған процестерді автоматтандыру (RPA) айлар бойы күш салғанымен орындай алмады.
Өткен жылы Operator ішінде CUA-ны іске қоспас бұрын, біз қауіпсіздік бойынша ауқымды тестілеу мен редтиминг жүргіздік, тәуекелдің үш негізгі бағытын қарастырдық: теріс пайдалану, модель қателері және шекаралық тәуекелдер. Operator мүмкіндіктерін API-дегі CUA арқылы жергілікті операциялық жүйелерге кеңейтумен байланысты тәуекелдерді азайту үшін біз қосымша қауіпсіздік бағалауларын және редтиминг жүргіздік. Сондай-ақ әзірлеушілер үшін көмексөзге зиян келтіруден қорғайтын қауіпсіздік тексерулерін, сезімтал тапсырмаларға арналған растау көмексөздерін, орталарын оқшаулауға көмектесетін құралдарды және саясатты ықтимал бұзуларды жетілдірілген анықтауды қоса алғанда, қосымша қорғаныс шараларын енгіздік. Бұл шаралар тәуекелді азайтуға көмектескенімен, модель әлі де, әсіресе браузерден тыс ортада, кездейсоқ қателіктерге бейім. Мысалы, нақты тапсырмаларда AI агенттерінің өнімділігін өлшеуге арналған OSWorld бенчмаркіндегі CUA нәтижесі қазір 38.1% болып отыр, бұл модельдің операциялық жүйелердегі тапсырмаларды автоматтандыру үшін әлі жоғары сенімді емес екенін көрсетеді. Мұндай сценарийлерде адам қадағалауы ұсынылады. API-ге қатысты қауіпсіздік жұмысымыз туралы толығырақ жаңартылған жүйе картасынан біле аласыз.
| Бенчмарк түріы | Эталон | Компьютерді пайдалану (әмбебап интерфейс) | Веб-шолу агенттері | Адам | |
|---|---|---|---|---|---|
| OpenAI CUA (компьютерді пайдаланушы агент) | Алдыңғы SOTA | Алдыңғы SOTA | |||
| Компьютерді пайдалану | OSWorld | 38,1% | 22,0% | - | 72,4% |
| Браузерді пайдалану | WebArena | 58,1% | 36,2% | 57,1% | 78,2% |
| WebVoyager | 87,0% | 56,0% | 87,0% | - | |
Бүгіннен бастап компьютерді пайдалану құралы Responses API ішінде пайдалану деңгейлері 3-5(жаңа терезеде ашылады) аясындағы таңдаулы әзірлеушілер үшін research preview ретінде қолжетімді. Пайдалану құны $3/1M кіріс токендері(жаңа терезеде ашылады) және $12/1M шығыс токендері болып белгіленген. Толығырақ біздің құжаттамадан(жаңа терезеде ашылады) біліңіз және осы құралмен қалай құруға болатынын көрсететін үлгі қолданбаны(жаңа терезеде ашылады) қарап шығыңыз.
Агенттердің негізгі логикасын құрып, оларды пайдалы ету үшін құралдарға қолжеткізу берумен қатар, әзірлеушілер агенттік жұмыс ағындарын да оркестрациялауы керек. Біздің жаңа ашық бастапқы кодты Agents SDK көп агентті жұмыс ағындарын оркестрациялауды жеңілдетеді және өткен жылы шығарған, әзірлеушілер қауымдастығы кең қабылдаған әрі бірнеше клиент сәтті енгізген тәжірибелік Swarm(жаңа терезеде ашылады) SDK-сымен салыстырғанда елеулі жақсартулар ұсынады.
Жақсартулар мыналарды қамтиды:
- Агенттер: нақты нұсқаулары және кіріктірілген құралдары бар оңай бапталатын LLM-дер.
- Handoffs: басқаруды агенттер арасында интеллектуалды түрде беру.
- Guardrails: кіріс пен шығысты тексеруге арналған бапталатын қауіпсіздік тексерулері.
- Tracing & Observability: қателерді түзету және өнімділікті оңтайландыру үшін агенттің орындалу іздерін визуализациялау.
Agents SDK клиенттерді қолдауды автоматтандыру, көпқадамды зерттеу, контент жасау, кодты тексеру және ықтимал клиенттерді іздеу сияқты әртүрлі нақты қолданбаларға сай келеді. Мысалы, Coinbase(жаңа терезеде ашылады) Agents SDK-ны пайдаланып, AI агенттеріне криптоәмияндармен және әртүрлі on-chain әрекеттерімен кедергісіз өзара әрекеттесуге мүмкіндік беретін құралдар жиынтығы — AgentKit-ті жылдам прототиптеп, енгізді. Небәрі бірнеше сағат ішінде Coinbase өздерінің Developer Platform SDK ішіндегі арнайы әрекеттерді толық жұмыс істейтін агентке біріктірді. AgentKit-тің оңтайландырылған архитектурасы жаңа агент әрекеттерін қосуды жеңілдетіп, әзірлеушілерге күрделі агент баптауларын айналып өтуден гөрі маңызды интеграцияларға көбірек назар аударуға мүмкіндік берді.
Бір-екі күн ішінде Box(жаңа терезеде ашылады) веб іздеу мен Agents SDK-ны пайдалана отырып, кәсіпорындарға Box ішінде сақталған құрылымдалмаған деректерден және ашық интернет көздерінен іздеу, сұрау және инсайттар алу мүмкіндігін беретін агенттерді жылдам жасай алды. Бұл тәсіл клиенттерге тек соңғы ақпаратқа қол жеткізіп қана қоймай, сонымен бірге ішкі рұқсаттары мен қауіпсіздік саясаттарын сақтай отырып, өздерінің ішкі, меншікті деректерін қауіпсіз түрде іздеуге мүмкіндік береді. Мысалы, қаржылық қызметтер фирмасы Box-та сақталған ішкі нарықтық талдауын интернеттен алынған нақты уақыттағы жаңалықтармен және экономикалық деректермен біріктіру үшін Box AI агентін шақыратын арнайы агент құра алады, бұл олардың талдаушыларына инвестициялық шешімдер үшін жан-жақты көрініс береді.
Agents SDK Responses API және Chat Completions API-пен жұмыс істейді. Сондай-ақ SDK басқа провайдерлердің модельдерімен де жұмыс істейді, егер олар чат жауаптарын құратын API стиліндегі соңғы нүктені ұсынса. Әзірлеушілер оны Python код базаларына бірден біріктіре алады, ал Node.js қолдауы жақында қосылады. Толығырақ біздің құжаттамадан(жаңа терезеде ашылады) біліңіз.
Agents SDK-ны жобалау кезінде біздің команда қауымдастықтағы өзге де тамаша жұмыстардан, соның ішінде Pydantic(жаңа терезеде ашылады), Griffe(жаңа терезеде ашылады) және MkDocs(жаңа терезеде ашылады) жобаларынан шабыт алдық. Біз Agents SDK-ны ашық бастапқы кодты фреймворк ретінде дамытуды жалғастыруға ниеттіміз, сонда қауымдастықтағы басқалар біздің тәсілді одан әрі кеңейте алады.
Біз агенттер жақын арада жұмыс күшінің ажырамас бөлігіне айналып, түрлі салалардағы өнімділікті едәуір арттырады деп сенеміз. Компаниялар күрделі тапсырмалар үшін AI мүмкіндіктерін пайдалануға көбірек ұмтылған сайын, біз әзірлеушілер мен кәсіпорындарға нақты әлемде әсер ететін автономды жүйелерді тиімді жасауға мүмкіндік беретін негізгі құрамдастарды ұсынуға бейілміз.
Бүгінгі шығарылымдармен біз әзірлеушілер мен кәсіпорындарға сенімді, жоғары өнімді AI агенттерін оңайырақ құруға, енгізуге және ауқымдауға мүмкіндік беретін алғашқы негізгі құрамдастарды ұсынып отырмыз. Модель мүмкіндіктері барған сайын агенттік сипатқа ие болған сайын, біз API-леріміздегі тереңірек интеграцияларға және агенттерді өндірісте енгізуге, бағалауға және оңтайландыруға көмектесетін жаңа құралдарға инвестиция салуды жалғастырамыз. Біздің мақсатымыз — кез келген саладағы түрлі тапсырмаларға көмектесе алатын агенттерді құру үшін әзірлеушілерге біртұтас платформа тәжірибесін ұсыну. Әзірлеушілердің келесіде не құратынын көруге қуаныштымыз. Бастау үшін біздің құжаттаманы(жаңа терезеде ашылады) қарап шығыңыз және жуық арада болатын жаңартуларды күтіңіз.