2026 жылғы 24 сәуірдегі жаңарту: GPT‑5.5 және GPT‑5.5 Pro енді API-де қолжетімді. Жүйе картасы да қолданылатын қосымша қорғаныс шараларын сипаттау үшін жаңартылды.
Біз GPT‑5.5‑ті ұсынып отырмыз — бұл әзірге ең ақылды әрі қолдануға ең интуитивті модельіміз және компьютерде жұмысты орындаудың жаңа тәсіліне қарай келесі қадам.
GPT‑5.5 сіз не істеуге тырысып жатқаныңызды тезірек түсінеді және жұмыстың көбірек бөлігін өзі атқара алады. Ол код жазу мен жөндеуде, интернеттен зерттеу жүргізуде, деректерді талдауда, құжаттар мен кестелер жасауда, бағдарламалық жасақтаманы пайдалануда және тапсырма аяқталғанша құралдар арасында ауысуда үздік. Әр қадамды мұқият басқарудың орнына, GPT‑5.5‑ке ретсіз, көп бөлікті тапсырма беріп, оның жоспарлайтынына, құралдарды қолданатынына, өз жұмысын тексеретініне, екіұштылықта жол табатынына және жалғастыра беретініне сене аласыз.
Әсіресе агенттік кодтауда, компьютерді пайдалануда, білім жұмысы мен ерте ғылыми зерттеуде ілгерілеу айқын — бұл контекст бойынша ой қорытуға және уақыт өте әрекет етуге тәуелді салалар. GPT‑5.5 интеллектегі осы секірісті жылдамдықты құрбан етпей береді: ірірек, қабілеті жоғары модельдер көбіне баяу қызмет көрсетеді, бірақ GPT‑5.5 нақты қызмет көрсетуде бір токенге шаққандағы кідіріспен GPT‑5.4‑пен тең, сонымен бірге интеллект деңгейі әлдеқайда жоғары. Ол сондай-ақ дәл сол Codex тапсырмаларын орындау үшін едәуір азырақ токен қолданады, сондықтан ол қабілетті ғана емес, тиімдірек те.
Біз GPT‑5.5‑ті бүгінге дейінгі ең күшті қорғаныс шаралары жиынтығымен шығарып отырмыз; олар пайдалы жұмысқа қолжетімділікті сақтай отырып, теріс пайдалануды азайтуға арналған. Біз бұл модельді қауіпсіздік пен дайындық шеңберлеріміздің толық жиынтығында бағаладық, ішкі және сыртқы red team мамандарымен жұмыс істедік, кеңейтілген киберқауіпсіздік және биология мүмкіндіктері үшін нысаналы тестілеу қостық және шығарылым алдында ерте қолжетімділік алған сенімді 200-ге жуық серіктестен нақты пайдалану жағдайлары бойынша пікір жинадық.
Бүгін GPT‑5.5 ChatGPT және Codex ішінде Plus, Pro, Business және Enterprise пайдаланушыларына, ал GPT‑5.5 Pro ChatGPT ішінде Pro, Business және Enterprise пайдаланушыларына біртіндеп қолжетімді бола бастады. API-ге орналастыру басқа қорғаныс шараларын талап етеді, сондықтан оны ауқымды түрде ұсынуға арналған қауіпсіздік талаптары бойынша серіктестермен және клиенттермен тығыз жұмыс істеп жатырмыз. GPT‑5.5 пен GPT‑5.5 Pro-ны API-ге өте жақын арада әкелеміз.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
Expert-SWE (Ішкі) | 73.1% | 68.5% | - | - | - | - |
GDPval (жеңістер немесе тең нәтижелер) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
OSWorld-Verified | 78.7% | 75.0% | - | - | 78.0% | - |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
FrontierMath 1–3 деңгейі | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath 4-деңгей | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
OpenAI агенттік AI үшін жаһандық инфрақұрылым құрып жатыр, бұл бүкіл әлемдегі адамдар мен бизнеске AI көмегімен жұмыс атқаруға мүмкіндік береді. Соңғы бір жылда біз AI бағдарламалық инженерияны айтарлықтай жеделдеткенін көрдік. Codex пен ChatGPT‑тегі GPT‑5.5 арқылы дәл осы өзгеріс енді ғылыми зерттеуге және адамдардың компьютерде атқаратын кеңірек жұмысына тарала бастады.
Осы салалардың бәрінде GPT‑5.5 тек ақылдырақ қана емес; ол мәселелерді шешу тәсілінде де тиімдірек, жиі азырақ токенмен және азырақ қайта талпыныспен жоғарырақ сапалы нәтиже береді. Artificial Analysis-тің Coding Index көрсеткішінде GPT‑5.5 озық кодтау модельдерімен бәсекеде құны екі есе төмен бола тұра, ең озық интеллект береді.
Artificial Analysis Intelligence Index(жаңа терезеде ашылады) — сыртқы тарап жүргізген 10 бағалаудың салмақталған орташа көрсеткіші: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5 — бүгінге дейінгі ең мықты агенттік кодтау моделіміз. Жоспарлау, қайталау және құралдарды үйлестіруді қажет ететін күрделі пәрмен жолы жұмыс ағындарын тексеретін Terminal-Bench 2.0 бағалауында ол 82.7% деңгейіндегі ең озық дәлдікке жетеді. GitHub-тағы нақты мәселе шешімдерін бағалайтын SWE-Bench Pro көрсеткішінде ол 58.6%-ға жетіп, алдыңғы модельдерге қарағанда бір өтуде толық шешілген тапсырмалар санын арттырады. Ұзақ көкжиекті кодтау тапсырмаларына арналған ішкі озық бағалауымыз Expert-SWE бойынша, адам үшін болжамды медианалық орындау уақыты 20 сағат болса да, GPT‑5.5 GPT‑5.4‑тен озады.
Осы үш бағалаудың бәрінде GPT‑5.5 GPT‑5.4 ұпайларын жақсартып, сонымен қатар азырақ токен қолданады.
Модельдің кодтаудағы артықшылықтары әсіресе Codex-та айқын көрінеді: ол енгізуден және қайта құрылымдаудан бастап жөндеу, тестілеу және валидацияға дейінгі инженерлік жұмысты орындай алады. Алғашқы тестілеу GPT‑5.5 нақты инженерлік жұмысқа қажет мінез-құлықтарда жақсырақ екенін көрсетеді: ірі жүйелерде контексті сақтау, екіұшты ақауларды ой елегінен өткізу, құралдармен болжамдарды тексеру және өзгерістерді код базасының айналасына дейін жеткізу.
Көрсетілген траекторияда Orion, Ай және Күн үшін NASA/JPL Horizons векторлық деректері пайдаланылған, ал көрсетуге ыңғайлы болу үшін масштабтау қолданылған.
Көмексөз: [тіркелген сурет] Мұны Artemis II миссиясының нақты деректерін пайдаланып, webgl және vite негізінде жаңа қолданба ретінде іске асырыңыз. Қолданба толық жұмыс істеп, суреттегі қолданбаға ұқсағанша оны мұқият тексеруді ұмытпаңыз. Планеталар мен ұшу траекторияларының көрсетілуіне ерекше назар аударыңыз. Мен 3D көрсетіліммен өзара әрекеттесе алғым келеді. Онда шынайы орбиталық механика болуын қамтамасыз етіңіз.
Бенчмарктардан тыс, ерте тестілеушілер GPT‑5.5 жүйенің пішінін жақсырақ түсінетінін айтты: неге бірдеңе істемей тұр, түзету қай жерге түсуі керек және код базасының тағы қай бөліктеріне әсер етеді.

«Мен қолданған, шын мәнінде байыпты тұжырымдамалық айқындығы бар алғашқы кодтау моделі.»
Dan Shipper, Every негізін қалаушы және CEO, GPT‑5.5‑ті «мен қолданған, шын мәнінде байыпты тұжырымдамалық айқындығы бар алғашқы кодтау моделі» деп сипаттады.
Қосымшаны іске қосқаннан кейін, ол іске қосылғаннан кейінгі бір мәселені жөндеуге бірнеше күн жұмсады, содан соң жүйенің бір бөлігін қайта жазу үшін өзінің ең үздік инженерлерінің бірін қосты. GPT‑5.5‑ті тексеру үшін ол уақытты кері айналдырғандай болды: модель бұзылған күйге қарап, инженер ақырында таңдаған қайта жазудың дәл сондай түрін ұсына ала ма? GPT‑5.4 ұсына алмады. GPT‑5.5 ұсына алды.

«Шынымен де мен жоғарырақ зердемен жұмыс істеп жатқандай сезіледі, тіпті белгілі бір құрмет сезімі бар.»
Pietro Schirano, MagicPath CEO-сы, GPT‑5.5 жүздеген frontend және refactor өзгерістері бар тармақты едәуір өзгерген негізгі тармаққа қосқанда, жұмысты шамамен 20 минут ішінде бір әрекетте шешкен кезде осындай сапалық секірісті байқады.
Модельді сынаған аға инженерлер GPT‑5.5‑тің GPT‑5.4 пен Claude Opus 4.7-ден ой қорыту мен автономияда едәуір күштірек болғанын, мәселелерді алдын ала байқап, тестілеу мен шолу қажеттіліктерін нақты көмексөзсіз болжай алғанын айтты. Бір жағдайда инженер одан бірлескен markdown редакторындағы пікір жүйесін қайта архитектуралауды сұрап, қайтып келгенде іс жүзінде дайын 12 diff-тен тұратын стек тапқан. Басқалары енгізуді түзету таңғаларлықтай аз керек болғанын және GPT‑5.5 жоспарларына GPT‑5.4‑пен салыстырғанда көбірек сенгенін айтты.
Модельге ерте қолжетімділік алған NVIDIA инженерлерінің бірі тіпті былай деді: "GPT‑5.5‑ке қолжетімділікті жоғалту қолымнан айырылғандай сезіледі."
«GPT-5.5 GPT-5.4-ке қарағанда анық ақылдырақ әрі табандырақ, кодтау көрсеткіші мықтырақ және құралдарды сенімдірек қолданады. Ол ерте тоқтамай, тапсырмада айтарлықтай ұзақ қалады; бұл біздің пайдаланушылар Cursor-ға сеніп тапсыратын күрделі, ұзақ жұмыс үшін аса маңызды.»
GPT‑5.5‑ті кодтауда мықты ететін сол артықшылықтар оны компьютердегі күнделікті жұмыс үшін де қуатты етеді. Модель ниетті жақсырақ түсінетіндіктен, ол білім жұмысының толық циклі бойымен табиғи түрде қозғала алады: ақпарат табу, маңыздысын ұғу, құралдарды пайдалану, нәтижені тексеру және шикі материалды пайдалы нәрсеге айналдыру.
Codex-та GPT‑5.5 құжаттар, кестелер және слайд презентацияларын жасауда GPT‑5.4‑тен жақсырақ. Альфа-тестілеушілер оның операциялық зерттеу, кестелік модельдеу және ретсіз бизнес кірістерін жоспарларға айналдыру сияқты жұмыстарда алдыңғы модельдерден озық екенін айтты. Codex-тің компьютерді пайдалану дағдыларымен біріктірілгенде, GPT‑5.5 бізді модель компьютерді сізбен бірге шынымен пайдалана алатындай сезімге жақындатады: экрандағыны көру, шерту, теру, интерфейстерде жүру және құралдар арасында дәл ауысу.
OpenAI командалары бұл артықшылықтарды қазірдің өзінде нақты жұмыс ағындарында қолданып жүр. Бүгінде компанияның 85%-дан астамы Codex-ті апта сайын бағдарламалық инженерия, қаржы, коммуникациялар, маркетинг, деректер ғылымы және өнімді басқару сияқты функцияларда қолданады. Comms тобында команда GPT‑5.5‑ті Codex ішінде алты айлық сөйлеу өтінімі деректерін талдауға, ұпайлау және тәуекел шеңберін құруға, сондай-ақ тәуекелі төмен өтінімдер автоматты өңделіп, тәуекелі жоғарысы адам қарауына жіберілетіндей автоматтандырылған Slack агентін валидациялауға пайдаланды. Finance тобында команда Codex-ті 24 771 K-1 салық формасын, жалпы көлемі 71 637 бет, қарап шығу үшін пайдаланды; бұл жұмыс ағыны жеке ақпаратты алып тастап, команданың тапсырманы алдыңғы жылмен салыстырғанда екі аптаға жылдам аяқтауына көмектесті. Нарыққа шығу стратегиясы командасында бір қызметкер апта сайынғы бизнес есептерін жасауды автоматтандырып, аптасына 5–10 сағат үнемдеді.
ChatGPT ішінде GPT‑5.5 Thinking күрделірек мәселелерге жылдамырақ көмек ашады, күрделі жұмыстан тиімдірек өтуге көмектесетін анағұрлым ақылды және ықшам жауаптар береді. Ол әсіресе плагиндерді қолданғанда кодтау, зерттеу, ақпаратты синтездеу мен талдау және құжатқа бай тапсырмалар сияқты кәсіби жұмыстарда үздік.
GPT‑5.5 Pro нұсқасында ерте тестілеушілер ChatGPT орындай алатын жұмыстың әрі күрделілігі, әрі сапасы жағынан елеулі секіріс көріп отыр; кідіріс уақытының жақсаруы оны талапшыл тапсырмалар үшін әлдеқайда қолайлы етті. GPT‑5.4 Pro-мен салыстырғанда, тестілеушілер GPT‑5.5 Pro жауаптарын едәуір жан-жақты, жақсы құрылымдалған, дәл, өзекті және пайдалы деп тапты; әсіресе бизнес, құқық, білім және деректер ғылымында өнімділігі күшті болды.
GPT‑5.5 осындай жұмыс түрін көрсететін бірнеше бенчмаркта ең озық нәтижеге жетеді. 44 мамандық бойынша агенттердің жақсы нақтыланған білім жұмысын шығару қабілетін тексеретін GDPval бағалауында GPT‑5.5 84.9% алады. Модель нақты компьютерлік орталарды өздігінен басқара ала ма, соны өлшейтін OSWorld-Verified бойынша ол 78.7%-ға жетеді. Ал күрделі клиентке қызмет көрсету жұмыс ағындарын тексеретін Tau2-bench Telecom бағалауында ол көмексөзді баптаусыз 98.0%-ға жетеді. GPT‑5.5 сондай-ақ білім жұмысына қатысты басқа бенчмарктарда да мықты нәтиже көрсетеді: FinanceAgent бойынша 60.0%, инвестициялық банкинг модельдеудің ішкі тапсырмаларында 88.5% және OfficeQA Pro бойынша 54.1%.
Tau2-bench Telecom көмексөз баптауынсыз (ал пайдаланушы моделі ретінде GPT‑4.1 қолданылып) іске қосылды. GPT‑5.5 тапсырманың ниетін жақсырақ түсінеді және өзінен бұрынғыларға қарағанда токен тұрғысынан тиімдірек.
«GPT-5.5 орындауы көп жұмыста қажет болатын тұрақты өнімділікті береді. NVIDIA GB200 NVL72 жүйелерінде жасалып, қызметке енгізілген бұл модель біздің командаларға табиғи тілдегі көмексөздерден бастап, басынан аяғына дейінгі функцияларды шығаруға, жөндеу уақытын күндерден сағаттарға қысқартуға және күрделі код базаларындағы апталарға созылатын эксперименттерді бір түндік ілгерілеуге айналдыруға мүмкіндік береді. Бұл жай ғана жылдамырақ кодтау емес — бұл адамдарға түбегейлі басқа жылдамдықпен жұмыс істеуге көмектесетін жаңа жұмыс тәсілі.»
GPT‑5.5 ғылыми және техникалық зерттеу жұмыс ағындарында да өсім көрсетеді; мұнда тек күрделі сұраққа жауап беру жеткіліксіз. Зерттеушілерге идеяны зерттеу, дәлел жинау, болжамдарды тексеру, нәтижелерді түсіндіру және ары қарай нені байқап көру керегін шешу қажет. GPT‑5.5 осы циклде басқа модельдерге қарағанда табандырақ.
Атап айтқанда, GPT‑5.5 генетика мен сандық биологиядағы көпсатылы ғылыми деректерді талдауға бағытталған жаңа бағалау — GeneBench(жаңа терезеде ашылады) бойынша GPT‑5.4‑тен айқын озады. Бұл тапсырмалар модельдерден ықтимал екіұшты не қате деректер туралы ең аз сыртқы жетекшілікпен ой қорытуын, жасырын шатастырушы факторлар немесе QC ақаулары сияқты шынайы кедергілерді еңсеруін және заманауи статистикалық әдістерді дұрыс іске асырып, дұрыс түсіндіруін талап етеді. Мұндағы тапсырмалар көбіне ғылыми сарапшылар үшін бірнеше күндік жобаларға сай келетінін ескерсек, модельдің өнімділігі ерекше әсер қалдырады.
Сол сияқты, нақты биоинформатика мен деректер талдауы айналасында жасалған BixBench(жаңа терезеде ашылады) бенчмарктында GPT‑5.5 жарияланған ұпайлары бар модельдер арасында жетекші нәтиже көрсетті. Модельдің ғылыми қабілеттері енді биомедициналық зерттеудің озық шебінде прогресті шынайы тең ғалым ретінде елеулі жеделдетуге жеткілікті деңгейге жетті.
Тағы бір мысалда, арнайы harness-пен жабдықталған GPT‑5.5‑тің ішкі нұсқасы комбинаторикадағы негізгі нысандардың бірі — Ramsey сандары туралы жаңа дәлелді(жаңа терезеде ашылады) табуға көмектесті. Комбинаторика дискрет нысандардың қалай үйлесетінін зерттейді: графтар, желілер, жиындар және үлгілер. Ramsey сандары шамамен айтқанда, белгілі бір тәртіптің міндетті түрде пайда болуы үшін желі қаншалықты үлкен болуы керектігін сұрайды. Бұл саладағы нәтижелер сирек әрі техникалық тұрғыдан жиі күрделі. Мұнда GPT‑5.5 диагональдан тыс Ramsey сандары туралы бұрыннан келе жатқан асимптотикалық фактінің дәлелін тапты, кейін ол Lean жүйесінде тексерілді. Бұл нәтиже GPT‑5.5‑тің жай код немесе түсіндірме ғана емес, негізгі зерттеу саласындағы тосын әрі пайдалы математикалық уәж ұсына алатынының нақты мысалы.
Ерте тестілеушілер ChatGPT‑тегі GPT‑5.5 Pro-ны бір ғана жауап беретін қозғалтқыштан гөрі зерттеу серіктесі ретінде көбірек қолданды: қолжазбаларды бірнеше өтуде сынау, техникалық дәлелдерді қысыммен тексеру, талдаулар ұсыну және кодпен, жазбалармен және PDF контекстімен жұмыс істеу. Ортақ желі — GPT‑5.5 зерттеушілерге сұрақтан экспериментке, одан нәтижеге өтуге жақсырақ көмектеседі.
Derya Unutmaz, Jackson Laboratory for Genomic Medicine мекемесінің иммунология профессоры және зерттеушісі, GPT‑5.5 Pro-ны 62 үлгі мен 28,000-ға жуық гені бар ген экспрессиясы деректер жиынтығын талдау үшін пайдаланды; нәтижесінде қорытындыларды жинақтап қана қоймай, негізгі сұрақтар мен түсініктерді де ашатын егжей-тегжейлі зерттеу есебін алды — оның айтуынша, мұндай жұмыс оның командасына айлар алатын еді.
Bartosz Naskręcki, Польшаның Познань қаласындағы Adam Mickiewicz University математика кафедрасының ассистент профессоры, Codex ішіндегі GPT‑5.5 көмегімен бір ғана көмексөзден 11 минутта алгебралық геометрия қолданбасын жасап, квадраттық беттердің қиылысын визуализациялап, алынған қисықты Вейерштрасс моделіне айналдырды.
Кейін ол қолданбаны тұрақтырақ сингулярлық визуализациясымен және кейінгі жұмыста қайта пайдалануға болатын дәл коэффициенттермен кеңейтті. Оның ойынша, үлкенірек өзгеріс — Codex енді бұрын арнайы құралдарды қажет еткен арнайы математикалық визуализация және компьютерлік алгебра жұмыс ағындарын іске асыруға көмектесе алады. Бұл мысалдар GPT‑5.5‑тің сарапшы ниетін жұмыс істейтін зерттеу құралдары мен талдауларға айналдыратынын көрсетеді.

Credit: Bartosz Naskręcki(жаңа терезеде ашылады)
Көмексөз: # Алгебралық геометриядағы беттердің қиылысуы
Екі квадраттық бетті сызатын және олардың қиылысу қисығын қызыл түспен бояйтын қолданба жасаңыз. Мұны Вейерштрасс қисығына айналдыру үшін есептік Риманн–Рох теоремасын қолданыңыз.
## Негізгі терезе
Аздап мөлдір реңкі бар екі бояулы бет, жоғары сапалы көрсетілім, қызыл түсті алгебралық қисық бойымен қиылысады
Тінтуірмен екі бағытта бұру, зумға толық pinch механизмі, әр беттің коэффициенттерін өзгертуге арналған шағын мәзірді шығару үшін haptic басу; анықтау Z-buffor деңгейі арқылы
## Оң жақ бүйір терезе
Тиімді Риманн–Рох теоремасы формулалары арқылы сол сәтте есептелетін қысқа Вейерштрасс теңдеуі (Q үстінде немесе квадраттық өріс кеңейтілімінде)
## Барлық басқару элементтері жасырылған ambient режимі, онда пайдаланушы пішіндердің сұлулығына тамсана алады
## Техникалық сипаттамалар
Қолданба браузерде жұмыс істейді, толық стекке арналған ең жаңа кітапханалармен жеңіл іске асыру, тасымалды, орналастыруға болады
## Құжаттама
Git репозиторийі, журнал, жоспар (Markdown файлдары)
«OpenAI-дың жаңа GPT-5.5 моделін біздің тесттік ортада пайдалану, оның ауқымды биохимиялық деректер жиынтықтары бойынша ой қорытып, адамдағы дәрі нәтижелерін болжауы, содан кейін ең қиын дәрі табу бағалауларымызда дәлдіктің елеулі өсуін көрсетуі — керемет шабыттандырады. Егер OpenAI осылай қарқынмен жалғастырса, жыл соңына қарай дәрі табудың негіздері өзгереді.»
GPT‑5.5‑ті GPT‑5.4 кідірісімен ұсыну inference-ті оқшау оңтайландырулар жиынтығы емес, тұтас жүйе ретінде қайта ойластыруды талап етті. GPT‑5.5 NVIDIA GB200 және GB300 NVL72 жүйелеріне арнап бірге жобаланды, солармен бірге үйретілді және солардың үстінде ұсынылды. Codex пен GPT‑5.5 өнімділік мақсаттарымызға жетуде шешуші рөл атқарды. Codex командаға идеядан бенчмарк жасай алатын іске асыруға дейін жылдамырақ жетуге көмектесті: тәсілдерді нобайлады, эксперименттерді байланыстырды және қай оңтайландыруға тереңірек инвестиция салу керек екенін анықтауға жәрдемдесті. GPT‑5.5 стектің өзіндегі негізгі жақсартуларды табуға және енгізуге көмектесті. Қарапайым айтқанда, модель өзіне қызмет көрсететін инфрақұрылымды жақсартуға көмектесті.
Осындай жақсартулардың бірі жүктемені теңгеру мен бөлшектеу эвристикалары болды. GPT‑5.5‑ке дейін біз үлкен және кіші сұраныстар бір GPU-де қатар жұмыс істей алуы үшін, есептеу ядролары арасында жұмысты теңгеріп, жеделдеткіштегі сұраныстарды алдын ала белгіленген тұрақты бөліктер санына бөлетінбіз. Алайда статикалық бөліктердің алдын ала белгіленген саны трафиктің барлық пішіндері үшін оңтайлы емес. GPU-ларды жақсырақ пайдалану үшін Codex бірнеше апта бойғы өндірістік трафик үлгілерін талдап, жұмысты оңтайлы бөлу мен теңгеруге арналған арнайы эвристикалық алгоритмдер жазды. Бұл күштің әсері аса зор болды: токен генерациясы жылдамдығын 20%-дан астам арттырды.
Қауіпсіздік осалдықтарын табу мен түзетуде өте мықты модельдерге әлемді дайындау — командалық жұмыс, әрі бұл үшін бүкіл экожүйе тұрақтылықты құруға көп еңбек салуы керек; оған модельдерге демократияланған қолжетімділік пен киберқорғаныстың келесі дәуірі үшін кезең-кезеңімен орналастыру кіреді.
Озық модельдер киберқауіпсіздік саласында барған сайын қабілетті болып келеді. Бұл мүмкіндіктер кеңінен таралады, және біз алға басудың ең жақсы жолы — оларды киберқорғанысты жеделдетуге және экожүйені нығайтуға пайдалануға болатындығына көз жеткізу деп санаймыз.
GPT‑5.5 — киберқауіпсіздік сияқты әлемнің ең қиын сын-тегеуріндерінің бір бөлігін шеше алатын AI-ға қарай маңызды, бірақ біртіндеп жасалған қадам. Желтоқсанда GPT‑5.2‑мен бірге біз модельдеріміздің ықтимал кибертеріс пайдаланылуын шектеу үшін қажетті киберқорғаныс шараларын алдын ала орналастырдық; ал енді GPT‑5.5‑пен бірге ықтимал кибертәуекелге арналған қатаңырақ классификаторларды енгізіп жатырмыз, оларды уақыт өте баптағанша кейбір пайдаланушыларға бастапқыда қолайсыз көрінуі мүмкін.
Біз киберқауіпсіздікті Дайындық шеңбері(жаңа терезеде ашылады) аясында көп жылдан бері санат ретінде қарастырып келеміз, себебі модельдеріміз біртіндеп жақсарып жатыр; сонымен қатар елеулі киберқауіпсіздік мүмкіндіктері бар модельдерді жауапкершілікпен шығара алу үшін жұмсарту шараларын итеративті түрде әзірлеп, калибрлеп келеміз.
- Біз кибермүмкіндіктің осы деңгейі үшін саладағы жетекші қорғаныс шараларын енгізіп жатырмыз. Біз киберге тән қорғаныс шараларын алғаш рет өткен жылы GPT‑5.2(жаңа терезеде ашылады) нұсқасымен таныстырдық, содан бері оларды кейінгі орналастыруларда сынап, жетілдіріп, дамытып келеміз. GPT‑5.5 үшін біз тәуекелі жоғары әрекеттерге, сезімтал киберсұрауларға қатысты қатаңырақ бақылаулар жасап, қайталанатын теріс пайдалануға қарсы қорғаныс қостық. Кең қолжетімділік модель қауіпсіздігіне, аутентификацияланған пайдалануға және рұқсат етілмеген қолдануды мониторингтеуге салған инвестицияларымыз арқылы мүмкін болды. Біз бірнеше ай бойы сыртқы сарапшылармен бірге осы қорғаныс шараларының беріктігін әзірлеу, сынау және итерациялау үстінде жұмыс істедік. GPT‑5.5 көмегімен біз әзірлеушілерге кодын оңай қорғауға мүмкіндік бере отырып, зиянды акторлар ең ықтимал зиян келтіруі мүмкін кибержұмыс ағындарына қатаңырақ бақылау қойып отырмыз.
- Біз барлық деңгейде киберқорғанысты жеделдету үшін қолжетімділікті кеңейтіп жатырмыз. Біз киберге рұқсат етілген модельдерімізді Trusted Access for Cyber арқылы ұсынудамыз, алдымен Codex-тен бастаймыз; ол іске қосылған кезде белгілі бір сенім сигналдарына(жаңа терезеде ашылады) сай келетін тексерілген пайдаланушыларға азырақ шектеумен GPT‑5.5‑тің кеңейтілген киберқауіпсіздік мүмкіндіктеріне қолжетімділікті қамтиды. маңызды инфрақұрылымды қорғауға жауапты ұйымдар GPT‑5.4‑Cyber сияқты киберге рұқсат етілген модельдерге қолжетімділікке өтініш бере алады, сонымен бірге бұл модельдерді ішкі жүйелерін қорғау үшін қолдану мақсатында қатаң қауіпсіздік талаптарын орындауы тиіс. Бұл тексерілген қорғаушылардың кең ауқымына маңызды қорғаныс мүмкіндіктеріне қолжетімділікті демократияландыру үшін артық кедергіні азайта отырып, заңды қауіпсіздік жұмысына анағұрлым қабілетті құралдар береді. Пайдаланушылар GPT‑5.5‑ті тексерілген қорғаныс жұмысына қолданғанда артық бас тартуларды азайту үшін chatgpt.com/cyber(жаңа терезеде ашылады) сайтында сенімді қолжетімділікке өтініш бере алады.
- Біз үкіметтік серіктестермен бірге қоғам үшін маңызды инфрақұрылымды қорғауға көмектесіп жатырмыз. Бірлесе отырып, біз озық AI-дың адамдар сенетін жүйелерге жауапты сенімді лауазымды тұлғалардың қорғаныс жұмысына қалай қолдау көрсете алатынын зерттеп жатырмыз — маңызды салық төлеуші деректерін қорғайтын цифрлық жүйелерден бастап жергілікті қауымдастықтардағы электр желілері мен су жүйелеріне дейін.
Біз GPT‑5.5‑тің биологиялық/химиялық және киберқауіпсіздік мүмкіндіктерін Дайындық шеңбері(жаңа терезеде ашылады) бойынша High деңгейі деп бағалап отырмыз. GPT‑5.5 Critical киберқауіпсіздік мүмкіндігі деңгейіне жетпесе де, бағалауларымыз бен тестілеуіміз оның киберқауіпсіздік қабілеттері GPT‑5.4‑пен салыстырғанда бір саты жоғары екенін көрсетті.
Бұған қоса, GPT‑5.5 шығарылымға дейін толық қауіпсіздік және басқару үдерісімізден өтті, оған дайындық бағалаулары, доменге тән тестілеу, кеңейтілген биология мен киберқауіпсіздік мүмкіндіктеріне арналған жаңа нысаналы бағалаулар және сыртқы сарапшылармен мұқият тестілеу кірді. Толығырақты GPT‑5.5 жүйе картасында(жаңа терезеде ашылады) бөлісеміз.
Бұл жұмыс біздің кеңірек AI төзімділігі тәсілімізді көрсетеді; модель мүмкіндіктері дамыған сайын бұл қажет деп санаймыз. Біз қуатты AI-дың жүйелерді, институттарды және қоғамды қорғау үшін оны қолданатын адамдарға қолжетімді болғанын қалаймыз. Өміршең жол — сенімді қолжетімділік, мүмкіндікпен бірге ауқымданатын мықты қорғаныс шаралары және елеулі теріс пайдалануды анықтап, оған жауап беруге арналған операциялық қабілет.
Бүгін GPT‑5.5 ChatGPT және Codex ішінде Plus, Pro, Business және Enterprise пайдаланушыларына, ал GPT‑5.5 Pro ChatGPT ішінде Pro, Business және Enterprise пайдаланушыларына біртіндеп қолжетімді бола бастады. GPT‑5.5 пен GPT‑5.5 Pro-ны API-ге өте жақын арада әкелеміз.
ChatGPT ішінде GPT‑5.5 Thinking Plus, Pro, Business және Enterprise пайдаланушыларына қолжетімді. Одан да күрделі сұрақтар мен жоғары дәлдікті жұмысқа арналған GPT‑5.5 Pro Pro, Business және Enterprise пайдаланушыларына қолжетімді.
Codex ішінде GPT‑5.5 Plus, Pro, Business, Enterprise, Edu және Go жоспарлары үшін 400K контекст терезесімен қолжетімді. GPT‑5.5 Fast режимінде де қолжетімді, мұнда токендер 1.5 есе жылдамырақ, бірақ құны 2.5 есе жоғары генерацияланады.
API әзірлеушілері үшін gpt-5.5 жақын арада Responses және Chat Completions API-лерінде 1M кіріс токеніне $5 және 1M шығыс токеніне $30 бағасымен, 1M контекст терезесімен қолжетімді болады. Batch және Flex бағалары стандарт API тарифінің жартысымен қолжетімді, ал Priority өңдеу стандарт тарифтен 2.5 есе жоғары бағамен қолжетімді. Біз сондай-ақ API-де одан да жоғары дәлдік үшін gpt-5.5-pro нұсқасын шығарамыз, оның бағасы 1M кіріс токеніне $30 және 1M шығыс токеніне $180 болады. Толық мәлімет үшін бағалар бетін қараңыз.
GPT‑5.5 бағасы GPT‑5.4‑тен жоғары болғанымен, ол әрі ақылдырақ, әрі токен жағынан әлдеқайда тиімді. Codex-та біз тәжірибені мұқият баптадық, соның арқасында GPT‑5.5 пайдаланушылардың көбі үшін GPT‑5.4‑ке қарағанда азырақ токенмен жақсырақ нәтиже береді, сонымен бірге жазылым деңгейлерінің бәрінде жомарт пайдалану мүмкіндігін сақтап отырмыз.
Код жазу
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (Жария) * | 58.6% | 57.7% | - | - | 64.3% | 54.2% |
Terminal-Bench 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
Expert-SWE (Ішкі) | 73.1% | 68.5% | - | - | - | - |
*Зертханалар бұл бағалауда жаттап алу белгілерін(жаңа терезеде ашылады) байқағанын атап өтті
Кәсіби
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (жеңістер немесе тең нәтижелер) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
FinanceAgent v1.1 | 60.0% | 56.0% | - | 61.5% | 64.4% | 59.7% |
Investment Banking Modeling Tasks (Ішкі) | 88.5% | 87.3% | 88.6% | 83.6% | - | - |
OfficeQA Pro | 54.1% | 53.2% | - | - | 43.6% | 18.1% |
Компьютерді пайдалану және көру
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-Verified | 78.7% | 75.0% | - | - | 78.0% | - |
MMMU Pro (құралдарсыз) | 81.2% | 81.2% | - | - | - | 80.5% |
MMMU Pro (құралдармен) | 83.2% | 82.1% | - | - | - | - |
Құралдарды қолдану
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
MCP Atlas** | 75.3% | 70.6% | - | - | 79.1% | 78.2% |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
Tau2-bench Telecom*** | 98.0% | 92.8% | - | - | - | - |
** MCP Atlas: нәтижелер Scale AI тарапынан 2026 жылғы сәуірдегі соңғы жаңартудан кейін алынды.
*** Tau2-bench telecom: 5.5 және 5.4 нәтижелері бастапқы көмексөздермен, яғни көмексөзді түзетусіз. Бұл көмексөз түзетулерімен бағаланған басқа зертханалардың нәтижелерін қамтымайды.
Академиялық
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25.0% | 19.0% | 33.2% | 25.6% | - | - |
FrontierMath 1–3 деңгейі | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath 4-деңгей | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
BixBench | 80.5% | 74.0% | - | - | - | - |
GPQA Diamond | 93.6% | 92.8% | - | 94.4% | 94.2% | 94.3% |
Humanity's Last Exam (құралдарсыз) | 41.4% | 39.8% | 43.1% | 42.7% | 46.9% | 44.4% |
Humanity's Last Exam (құралдармен) | 52.2% | 52.1% | 57.2% | 58.7% | 54.7% | 51.4% |
Киберқауіпсіздік
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Capture-the-Flags challenge tasks (Ішкі)**** | 88.1% | 83.7% | - | - | - | - |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
**** Қосымша қиын сынақтармен кеңейтілген, жүйе карталарында қолданылған ең қиын CTF-тердің кеңейтілген нұсқасы.
Ұзын контекст
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256k f1 | 73.7% | 62.5% | - | - | 76.9% | - |
Graphwalks BFS 1mil f1 | 45.4% | 9.4% | - | - | 41.2% (Opus 4.6) | - |
Graphwalks parents 256k f1 | 90.1% | 82.8% | - | - | 93.6% | - |
Graphwalks parents 1mil f1 | 58.5% | 44.4% | - | - | 72.0% (Opus 4.6) | - |
OpenAI MRCR v2 8-needle 4K-8K | 98.1% | 97.3% | - | - | - | - |
OpenAI MRCR v2 8-needle 8K-16K | 93.0% | 91.4% | - | - | - | - |
OpenAI MRCR v2 8-needle 16K-32K | 96.5% | 97.2% | - | - | - | - |
OpenAI MRCR v2 8-needle 32K-64K | 90.0% | 90.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 64K-128K | 83.1% | 86.0% | - | - | - | - |
OpenAI MRCR v2 8-needle 128K-256K | 87.5% | 79.3% | - | - | 59.2% | - |
OpenAI MRCR v2 8-needle 256K-512K | 81.5% | 57.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 512K-1M | 74.0% | 36.6% | - | - | 32.2% | - |
Абстрактілі ой қорыту
Бағалау | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (Тексерілген) | 95.0% | 93.7% | - | 94.5% | 93.5% | 98.0% |
ARC-AGI-2 (Тексерілген) | 85.0% | 73.3% | - | 83.3% | 75.8% | 77.1% |
GPT бағалаулары ой қорыту күші xhigh деңгейіне қойылып орындалды және зерттеу ортасында жүргізілді, сондықтан кейбір жағдайларда өндірістік ChatGPT‑тен сәл өзгеше нәтиже беруі мүмкін.








