Әзірлеушілерге арналған GPT‑5.1‑ді таныстырамыз
Бүгін біз API платформасында GPT‑5.1‑ді шығарып отырмыз — бұл GPT‑5 сериясындағы агенттік және кодтау тапсырмаларының кең ауқымында интеллект пен жылдамдықты теңестіретін келесі модель. GPT‑5.1 тапсырманың күрделілігіне қарай ойлануға қанша уақыт жұмсайтынын динамикалы түрде бейімдейді, соның арқасында модель қарапайым күнделікті тапсырмаларда едәуір жылдамырақ әрі токенді тиімдірек пайдаланады. Сондай-ақ модельде терең ойлануды қажет етпейтін тапсырмаларға тезірек жауап беру үшін “no reasoning” режимі бар, бұл ретте GPT‑5.1‑дің озық интеллекті сақталады.
GPT‑5.1‑ді одан да тиімді ету үшін біз кэшті 24 сағатқа дейін сақтайтын кеңейтілген көмексөз кэштеуін ұсынамыз, бұл кейінгі сұрақтарға тезірек әрі арзанырақ жауап беруге мүмкіндік береді. Біздің Priority Processing(жаңа терезеде ашылады) клиенттері де GPT‑5‑пен салыстырғанда GPT‑5.1‑де айтарлықтай жылдамырақ өнімділікті сезінеді.
Кодтау жағынан біз Cursor, Cognition, Augment Code, Factory және Warp сияқты стартаптармен тығыз жұмыс істеп, GPT‑5.1‑дің кодтау мәнерін, басқарылуын және код сапасын жақсарттық. Жалпы алғанда, GPT‑5.1 код жазу үшін анағұрлым интуитивті сезіледі және тапсырмаларды орындау барысында пайдаланушыға бағытталған жаңартулармен көбірек хабарласады.
Соңында, біз GPT‑5.1‑мен бірге екі жаңа құралды таныстырып отырмыз: кодты сенімдірек өңдеуге арналған apply_patch құралы және модельге shell пәрмендерін орындауға мүмкіндік беретін shell құралы.
GPT‑5.1 — GPT‑5 сериясындағы келесі ілгерілеу, және біз әзірлеушілерге сенімді агенттік жұмыс ағындарын құруға көмектесу үшін одан да ақылды әрі қабілетті модельдерге инвестициялауды жалғастырамыз.
GPT‑5.1‑ді жылдамырақ ету үшін біз оны ойлауға үйрету тәсілін түбегейлі жаңарттық. Қарапайым тапсырмаларда GPT‑5.1 ойлануға азырақ токен жұмсайды, бұл өнімнің шапшаң жұмысын және токен шығынының төмендеуін қамтамасыз етеді. Қосымша ойлануды қажет ететін күрделі тапсырмаларда GPT‑5.1 табандылық танытып, нұсқаларды зерттеп, сенімділікті барынша арттыру үшін өз жұмысын тексереді.
Balyasny Asset Management(жаңа терезеде ашылады) GPT‑5.1 «біздің толық динамикалық бағалау жиынтығымызда GPT‑4.1 мен GPT‑5‑тен де озып, сонымен бірге GPT‑5‑тен 2–3 есе жылдамырақ жұмыс істеді» деді. Олар сондай-ақ құралдарға көп сүйенетін ой қорыту тапсырмаларында GPT‑5.1 «ұқсас немесе одан жақсы сапада жетекші бәсекелестерге қарағанда шамамен екі есе аз токенді тұрақты түрде қолданды» деді. Сол сияқты, AI сақтандыру BPO Pace(жаңа терезеде ашылады) те модельді сынап көріп, олардың агенттері «GPT‑5.1‑де 50% жылдамырақ жұмыс істеп, сонымен қатар біздің eval нәтижелерімізде GPT‑5 пен басқа жетекші модельдердің дәлдігінен асып түсті» деді.
GPT‑5.1 ойлану уақытын GPT‑5‑ке қарағанда әлдеқайда динамикалы өзгертеді. ChatGPT тапсырмаларының өкілдік үлестірімінде GPT‑5.1 жеңіл тапсырмаларда, тіпті жоғары ой қорыту күшінде де, әлдеқайда жылдам.
Мысалы, «жаһандық орнатылған пакеттерді тізімдеу үшін npm пәрменін көрсет» деген сұрауға GPT‑5.1 10 секундтың орнына 2 секундта жауап береді.
GPT-5 (Medium) ~250 токен алады (~10 секунд)
GPT-5.1 (Medium) ~50 токен алады (~2 секунд)
Енді әзірлеушілер reasoning_effort параметрін 'none' деп орнату арқылы GPT‑5.1‑ді ой қорытуынсыз қолдана алады. Бұл модельді кідіріс уақыты маңызды қолдану жағдайларында ой қорытуы жоқ модель сияқты ұстайды, бірақ GPT‑5.1‑дің жоғары интеллекті мен құрал шақыруының өнімділігі сақталады. 'minimal' ой қорытумен GPT‑5‑пен салыстырғанда, ой қорытуы жоқ GPT‑5.1 параллель құрал шақыруында (бұл өз кезегінде тапсырмаларды толық орындау жылдамдығын арттырады), кодтау тапсырмаларында, нұсқауларды орындауда және іздеу құралдарын пайдалануда жақсырақ — әрі біздің API платформасында веб іздеуді(жаңа терезеде ашылады) қолдайды. Sierra(жаңа терезеде ашылады) өздерінің нақты eval нәтижелерінде GPT‑5.1‑дің “no reasoning” режимі «GPT‑5 minimal reasoning-пен салыстырғанда төмен кідірісті құрал шақыру өнімділігін 20% жақсартқанын» бөлісті.
reasoning_effort ішіндегі мән ретінде 'none' енгізілуімен әзірлеушілер енді өздерінің қолдану жағдайы үшін жылдамдық, құн және интеллект арасындағы тепе-теңдікті басқаруда одан да көбірек икемділік пен бақылауға ие. GPT‑5.1 әдепкі бойынша 'none' мәнін қолданады, бұл кідіріс уақытына сезімтал жүктемелер үшін өте қолайлы. Күрделілігі жоғарырақ тапсырмалар үшін әзірлеушілерге 'low' немесе 'medium', ал интеллект пен сенімділік жылдамдықтан маңыздырақ болғанда 'high' мәнін таңдауды ұсынамыз.
Кеңейтілген кэштеу көмексөздердің бүгінгі бірнеше минуттың орнына кэште 24 сағатқа дейін белсенді қалуына мүмкіндік беру арқылы ой қорыту тиімділігін жақсартады. Сақтау терезесінің ұзағырақ болуы кейінгі сұраулардың көбірегі кэштелген контексті пайдалана алатынын білдіреді — соның нәтижесінде кешігу азаяды, құн төмендейді және көп айналымды чат, кодтау сессиялары немесе білімді іздеу жұмыс ағындары сияқты ұзақ өзара әрекеттер бірқалыптырақ жүреді.
Көмексөз кэшінің бағасы өзгеріссіз қалады: кэштелген кіріс токендері кэштелмеген токендерге қарағанда 90% арзан, ал кэшке жазу немесе сақтау үшін қосымша ақы алынбайды. GPT‑5.1‑мен кеңейтілген кэштеуді пайдалану үшін Responses немесе чат жауаптарын құратын API-де “prompt_cache_retention='24h'” параметрін қосыңыз. Толығырақ ақпаратты көмексөз кэштеу құжаттамасынан(жаңа терезеде ашылады) қараңыз.
GPT‑5.1 GPT‑5‑тің кодтау мүмкіндіктерін анағұрлым басқарылатын кодтау мәнерімен, аз артық ойланумен, код сапасының жақсаруымен, құрал шақырулары тізбегі кезіндегі пайдаланушыға бағытталған жаңарту хабарламаларымен (preambles) және әсіресе төмен ой қорыту күшінде неғұрлым функционалды frontend дизайндарымен дамытады.
Жылдам код түзетулері сияқты қарапайым кодтау тапсырмаларында GPT‑5.1‑дің жоғары жылдамдығы итерацияны жеңілдетеді. GPT‑5.1‑дің қарапайым тапсырмалардағы жылдамдығы күрделі тапсырмалардағы өнімділікті төмендетпейді. SWE-bench Verified-та GPT‑5.1 GPT‑5‑тен де ұзағырақ жұмыс істеп, 76.3%-ға жетеді.
SWE-bench Verified ішінде модельге код репозиторийі мен мәселе сипаттамасы беріледі, және ол мәселені шешу үшін патч жасауы керек. Белгілер ой қорыту күшін көрсетеді. Дәлдік барлық 500 мәселе бойынша орташаланған. Барлық модельдер JSON-негізді apply_patch құралы бар harness пайдаланды.
Біз GPT‑5.1 туралы бастапқы пікірлерді бірнеше кодтау компаниясынан алдық. Міне, олардың әсерлері:
- Augment Code(жаңа терезеде ашылады) GPT‑5.1‑ді «ысырап әрекеттері аз, әдейірек, ой қорытуы тиімдірек және тапсырмаға зейіні жақсырақ» деп атады, әрі олар «көп файлды жобаларда дәлірек өзгерістерді, бірқалыптырақ өзгеріс сұраныстарын және жылдамырақ итерацияны» көріп отыр.
- Cline(жаңа терезеде ашылады) өз eval нәтижелерінде «GPT‑5.1 біздің diff өңдеу бенчмаркімізде 7% жақсартумен SOTA нәтижесіне жетіп, күрделі кодтау тапсырмаларында айрықша сенімділікті көрсетті» деп бөлісті.
- CodeRabbit(жаңа терезеде ашылады) GPT‑5.1‑ді «PR шолулары үшін таңдаулы үздік моделіміз» деп атады.
- Cognition(жаңа терезеде ашылады) GPT‑5.1 «сіз не сұрап тұрғаныңызды едәуір жақсырақ түсінеді және соны орындау үшін сізбен жақсырақ жұмыс істейді» деді.
- Factory(жаңа терезеде ашылады) «GPT‑5.1 айтарлықтай шапшаңырақ жауап береді және өз ой қорыту тереңдігін тапсырмаға бейімдейді, бұл артық ойлануды азайтып, әзірлеуші тәжірибесін жақсартады» деді.
- Warp(жаңа терезеде ашылады) GPT‑5.1‑ді жаңа пайдаланушылар үшін әдепкі нұсқа етіп жатыр, өйткені ол «GPT‑5 сериясы енгізген әсерлі интеллект өсімін жалғастыра отырып, әлдеқайда сезімтал модель болып табылады» дейді.
«GPT 5.1 жай ғана кезекті LLM емес — ол шынымен агенттік қабілеті бар, мен сынаған модельдердің ішіндегі ең табиғи автономдысы. Ол сіз сияқты жазады, сіз сияқты код жазады, күрделі нұсқауларды оңай орындайды және front-end тапсырмаларында өте мықты, сіздің бар кодбазаңызға ұқыпты үйлеседі. Оның толық әлеуетін Responses API-де аша аласыз, және оны IDE-мізде ұсынатынымызға қуаныштымыз.»
Біз GPT‑5.1‑мен бірге әзірлеушілерге Responses API-де модельдің мүмкіндігін барынша пайдалануға көмектесетін екі жаңа құралды ұсынып отырмыз: JSON escaping қажетінсіз кодты одан да сенімді өңдеуге арналған еркін пішінді apply_patch құралы және модельге жергілікті компьютеріңізде орындалатын пәрмендерді жазуға мүмкіндік беретін shell құралы.
Еркін пішінді apply_patch құралы GPT‑5.1‑ге құрылымдалған diff-тер арқылы кодбазада файлдар жасауға, жаңартуға және жоюға мүмкіндік береді. Модель жай ғана түзетулер ұсынудың орнына, қолданба орындайтын және нәтижесін хабарлайтын patch операцияларын шығарады, бұл итерациялық, көпқадамды код өңдеу жұмыс ағындарын іске қосады.
Responses API-де apply_patch құралын пайдалану үшін оны tools массивіне "tools": [{“type”: “apply_patch”}] түрінде қосыңыз және не кіріске файл мазмұнын беріңіз, не модельге файл жүйеңізбен әрекеттесуге арналған құралдарды беріңіз. Модель файлдарды жасауға, жаңартуға немесе жоюға арналған apply_patch_call элементтерін жасайды, олардың ішінде сіз файл жүйеңізде қолданатын diff-тер болады. apply_patch құралымен интеграциялау туралы толығырақ білу үшін біздің әзірлеуші құжаттамасын(жаңа терезеде ашылады) қараңыз.
Shell құралы модельге басқарылатын пәрмен жолы интерфейсі арқылы жергілікті компьютермен әрекеттесуге мүмкіндік береді. Модель shell пәрмендерін ұсынады; әзірлеуші интеграциясы оларды орындайды және нәтижелерін қайтарады. Бұл модельдерге тапсырманы аяқтағанша жүйені тексеруге, утилиталарды іске қосуға және дерек жинауға мүмкіндік беретін қарапайым жоспарлау-орындау циклін жасайды.
Responses API-де shell құралын пайдалану үшін әзірлеушілер оны tools массивіне "tools": [{“type”: “shell”}] түрінде қоса алады. API орындалатын shell пәрмендерін қамтитын "shell_call" элементтерін жасайды. Әзірлеушілер пәрмендерді жергілікті ортада орындайды да, келесі API сұрауында орындау нәтижелерін "shell_call_output" элементімен қайта жібереді. Толығырақ біздің әзірлеуші құжаттамасынан(жаңа терезеде ашылады) біліңіз.
GPT‑5.1 және gpt-5.1-chat-latest API-дегі барлық ақылы деңгейлердегі әзірлеушілерге қолжетімді. Бағалар мен rate limit-тер(жаңа терезеде ашылады) GPT‑5‑пен бірдей. Біз сондай-ақ API-де gpt-5.1-codex және gpt-5.1-codex-mini нұсқаларын шығарып отырмыз. GPT‑5.1 кодтау тапсырмаларының көбінде өте жақсы болғанымен, gpt-5.1-codex модельдері Codex немесе Codex-ке ұқсас harness-тердегі ұзақ орындалатын агенттік кодтау тапсырмалары үшін оңтайландырылған.
Әзірлеушілер GPT‑5.1 бойынша біздің әзірлеуші құжаттамамызды(жаңа терезеде ашылады) және модельге көмексөз беру нұсқаулығын(жаңа терезеде ашылады) пайдаланып, бірден құра бастай алады. Қазірше GPT‑5‑ті API-ден алып тастауды жоспарлап отырған жоқпыз, ал егер ондай шешім қабылдасақ, әзірлеушілерге алдын ала хабарлаймыз.
Біз шынайы агенттік және кодтау жұмысына арналған ең қабілетті, сенімді модельдерді кезең-кезеңімен енгізуге ниеттіміз — тиімді ойлайтын, жылдам итерация жасайтын және әзірлеушілерді ағымнан шығармай күрделі тапсырмаларды орындайтын модельдерді. Бейімделгіш ой қорыту, күштірек кодтау өнімділігі, пайдаланушыға арналған анығырақ жаңартулар және apply_patch пен shell сияқты жаңа құралдардың арқасында GPT‑5.1 сізге кедергіні азайтып құрастыруға көмектесу үшін жасалған. Біз бұл бағытқа әлі де көп инвестиция салып жатырмыз: алдағы апталар мен айларда одан да қабілетті агенттік және кодтау модельдерін күте аласыз.
Бағалау | GPT‑5.1 (high) | GPT‑5 (high) |
SWE-bench Verified | 76.3% | 72.8% |
GPQA Diamond | 88.1% | 85.7% |
AIME 2025 | 94.0% | 94.6% |
FrontierMath | 26.7% | 26.3% |
MMMU | 85.4% | 84.2% |
Tau2-bench Airline | 67.0% | 62.6% |
Tau2-bench Telecom* | 95.6% | 96.7% |
Tau2-bench Retail | 77.9% | 81.1% |
BrowseComp Long Context 128k | 90.0% | 90.0% |
* Tau2-bench Telecom үшін біз GPT‑5.1‑ге оның өнімділігін жақсарту үшін қысқа, жалпы пайдалы көмексөз бердік.


