Update noong Abril 24, 2026: Available na ngayon sa API ang GPT‑5.5 at GPT‑5.5 Pro. Ang card ng system ay na-update na rin upang ilarawan ang mga karagdagang pananggalang na nalalapat.
Ilalabas namin ang GPT‑5.5, ang pinakamatalino at pinaka-intuitive naming modelo hanggang ngayon, at ang susunod na hakbang tungo sa bagong paraan ng pagtatrabaho gamit ang computer.
Mas mabilis na nauunawaan ng GPT‑5.5 kung ano ang sinusubukan mong gawin, at kaya nitong akuin ang mas marami sa gawain nang mag-isa. Mahusay ito sa pagsusulat at pag-debug ng code, pananaliksik online, pagsusuri ng data, paglikha ng mga dokumento at spreadsheet, pagpapatakbo ng software, at paglipat sa mga tool hanggang matapos ang isang gawain. Sa halip na maingat na pamahalaan ang bawat hakbang, maaari mong bigyan ang GPT‑5.5 ng gawaing magulo at maraming bahagi, at pagkatiwalaan itong magplano, gumamit ng mga tool, suriin ang gawa nito, mag-navigate sa kalabuan, at magpatuloy.
Malakas ang mga pag-unlad sa agentic na pag-code, paggamit ng computer, gawaing pangkaalaman, at maagang pananaliksik na pang-agham—mga larangang nakasalalay ang progreso sa pangangatuwiran sa iba’t ibang konteksto at pagkilos sa paglipas ng panahon. Naghahatid ang GPT‑5.5 ng pag-angat na ito sa katalinuhan nang hindi sinasakripisyo ang bilis: ang mas malalaki at mas may kakayahang mga modelo ay kadalasang mas mabagal maghatid, ngunit tumutugma ang GPT‑5.5 sa pagkaantala sa bawat token ng GPT‑5.4 sa aktuwal na paghahatid, habang gumaganap sa mas mataas na antas ng katalinuhan. Gumagamit din ito ng mas kaunting token para makumpleto ang parehong mga gawain sa Codex, kaya nagiging mas mahusay at mas may kakayahan ito.
Ilalabas namin ang GPT‑5.5 kasama ang aming pinakamalakas na hanay ng mga pananggalang hanggang ngayon, na dinisenyo upang mabawasan ang maling paggamit habang pinapanatili ang access para sa mga makabuluhang gawain. Sinuri namin ang modelong ito sa buong hanay ng aming mga balangkas sa kaligtasan at kahandaan, nakipagtulungan sa mga panloob at panlabas na redteamer, nagdagdag ng naka-target na pagsubok para sa mga advanced na kakayahan sa cybersecurity at biyolohiya, at nangolekta ng feedback sa mga aktuwal na kaso ng paggamit mula sa halos 200 pinagkakatiwalaang katuwang na may maagang pag-access bago ito ilabas.
Ngayong araw, ilulunsad ang GPT‑5.5 para sa mga user ng Plus, Pro, Business, at Enterprise sa ChatGPT at Codex. Ilulunsad din ang GPT‑5.5 Pro para sa mga user ng Pro, Business, at Enterprise sa ChatGPT. Ang mga pag-deploy ng API ay nangangailangan ng iba’t ibang pananggalang. Nakikipagtulungan kami nang husto sa mga katuwang at customer hinggil sa mga kinakailangan sa kaligtasan at seguridad para sa malawakang paghahatid nito. Malapit na naming dalhin ang GPT‑5.5 at GPT‑5.5 Pro sa API.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
Expert-SWE (Panloob) | 73.1% | 68.5% | - | - | - | - |
GDPval (panalo o tabla) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
OSWorld-Na-verify | 78.7% | 75.0% | - | - | 78.0% | - |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
FrontierMath Tier 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath tier 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
Ang OpenAI ay bumubuo ng pandaigdigang imprastraktura para sa agentic AI, na nagbibigay-daan sa mga tao at negosyo sa buong mundo na magawa ang trabaho gamit ang AI. Noong nakaraang taon, nakita namin na lubhang pinabilis ng AI ang software engineering. Dahil ang GPT‑5.5 ay nasa Codex at ChatGPT, ang kaparehong pagbabagong iyon ay nagsisimula nang umabot sa pananaliksik na pang-agham at sa mas malawak na gawaing ginagawa ng mga tao sa mga computer.
Sa mga larangang ito, ang GPT‑5.5 ay hindi lamang mas matalino; mas episyente rin ito sa paraan ng paglutas ng mga problema, kadalasang nakakamit ang mas mataas na kalidad ng mga resulta gamit ang mas kaunting token at mas kaunting pag-uulit. Sa Indeks ng Pag-code ng Artipisyal na Pagsusuri, naghahatid ang GPT‑5.5 ng makabagong katalinuhan sa kalahati ng halaga ng mga kakumpitensiyang frontier na modelo sa pag-code.
Ang Indeks ng Katalinuhan sa Artipisyal na Pagsusuri(magbubukas sa bagong window) ay weighted average ng 10 ebalwasyong isinagawa ng panlabas na partido: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
Ang GPT‑5.5 ang pinakamalakas naming modelo sa agentic na pag-code hanggang ngayon. Sa Terminal-Bench 2.0, na sumusubok sa mga kumplikadong daloy ng trabaho sa command line na nangangailangan ng pagpaplano, pag-iterate, at koordinasyon ng mga tool, nakakamit nito ang makabagong antas ng katumpakan na 82.7%. Sa SWE-Bench Pro, na sumusuri sa paglutas ng mga pambuong mundong isyu sa GitHub, umaabot ito sa 58.6%, na lumulutas ng mas maraming gawain mula simula hanggang katapusan sa iisang pass kaysa sa mga naunang modelo. Sa Expert-SWE, ang aming panloob na frontier eval para sa mga long-horizon na gawain sa pag-code na may median na tinatayang oras ng pagkumpleto ng tao na 20 oras, nahihigitan din ng GPT‑5.5 ang GPT‑5.4.
Sa tatlong pagsusuri, pinapahusay ng GPT‑5.5 ang mga marka ng GPT‑5.4 habang gumagamit ng mas kaunting mga token.
Ang lakas ng modelo sa pag-code ay malinaw na nakikita sa Codex, kung saan kaya nitong humawak ng gawaing pang-engineering mula sa implementasyon at mga pag-refactor hanggang sa pag-debug, pagsubok, at beripikasyon. Ipinapakita ng mga maagang pagsusuri na mas mahusay ang GPT‑5.5 sa mga pagkilos na mahalaga sa tunay na gawaing pang-engineering, tulad ng pagpapanatili ng konteksto sa malalaking sistema, pangangatuwiran sa mga hindi malinaw na pagpalya, pagsusuri ng mga palagay gamit ang mga tool, at pagpapalaganap ng mga pagbabago sa nakapaligid na codebase.
Ang na-render na trajectory ay gumagamit ng NASA/JPL Horizons vector data para sa Orion, sa Buwan, at sa Araw, na may inilapat na pampalawak ng display para sa mas madaling pagbabasa.
Prompt: [attached image] Ipatupad ito bilang bagong app gamit ang WebGL at Vite gamit ang totoong data mula sa misyon ng Artemis II. Subukan nang mabuti ang app hanggang sa ganap na gumagana ito at katulad na ng app sa larawan. Masusing bigyang-pansin ang pag-render ng mga planeta at mga landas ng paglipad. Gusto kong makipag-ugnayan sa 3D pag-render. Tiyakin na mayroon itong makatotohanang mekanika ng orbita.
Higit pa sa mga pamantayan, sinabi ng mga naunang tagasubok na nagpapakita ang GPT‑5.5 ng mas malakas na kakayahang maunawaan ang kabuuang istraktura ng isang sistema: kung bakit may pumapalya, kung saan dapat ilapat ang pag-aayos, at kung ano pa sa codebase ang maaapektuhan.

“Ang unang modelo sa pag-code na nagamit ko na may talagang malinaw na konseptwal na pag-unawa.”
Inilarawan ni Dan Shipper, Founder at CEO ng Every, ang GPT‑5.5 bilang “ang unang modelo sa pag-code na nagamit ko na may malinaw na pagkaunawa sa konsepto.”
Matapos maglunsad ng isang app, gumugol siya ng ilang araw sa pag-debug ng isyung lumitaw matapos ang paglulunsad bago humingi ng tulong sa isa sa kaniyang pinakamahusay na mga engineer upang muling isulat ang bahagi ng sistema. Para subukan ang GPT‑5.5, epektibo niyang ibinalik ang oras: maaari bang tingnan ng modelo ang sirang estado at makagawa ng kaparehong uri ng muling pagsulat pinagpasyahan din naman ng engineer? Hindi ito nagawa ng GPT‑5.4. Nagawa ito ng GPT‑5.5.

“Pakiramdam ko ay talagang nakikipagtulungan ako sa isang mas mataas na uri ng katalinuhan, na kagalang-galang.”
Si Pietro Schirano, CEO ng MagicPath, ay nakakita ng katulad na malaking pagbabago nang pinagsama ng GPT‑5.5 ang sangay na may daan-daang pagbabago sa frontend at refactor sa pangunahing sangay na malaki rin ang nabago, na minsanang nilutas ang gawain sa loob ng humigit-kumulang 20 minuto.
Sinabi ng mga senior engineer na sumubok sa modelo na ang GPT‑5.5 ay kapansin-pansing mas mahusay kaysa sa GPT‑5.4 at Claude Opus 4.7 sa pangangatuwiran at awtonomiya, natutukoy ang mga isyu nang maaga at nahuhulaan ang mga pangangailangan sa pagsubok at pagsusuri nang walang tahasang pag-uudyok. Sa isang kaso, hiniling ng engineer dito na muling idisenyo ang sistema sa pagkomento sa collaborative markdown editor, at pagbalik niya ay may 12-diff stack na halos tapos na. Sinabi ng iba na nakakagulat na kaunti lang ang kinailangan nilang pagwawasto sa implementasyon at mas nagtitiwala sila sa mga plano ng GPT‑5.5 kumpara sa GPT‑5.4.
May isang engineer sa NVIDIA na nagkaroon ng maagang pag-access sa modelo na nagsabing: "Ang mawalan ng access sa GPT‑5.5 ay parang naputulan ng isang paa o kamay.”
“Ang GPT-5.5 ay kapansin-pansing mas matalino at mas pursigido kaysa sa GPT-5.4, na may mas mahusay na pagganap sa pag-code at mas maaasahang paggamit ng mga tool. Nananatili ito sa gawain nang mas matagal nang hindi agad humihinto, na siyang pinakamahalaga para sa kumplikado at pangmatagalang trabahong inaatas ng aming mga user sa Cursor.”
Ang parehong kalakasan na nagpapahusay sa GPT‑5.5 sa pag-code ay siya ring nagpapalakas nito para sa pang-araw-araw na trabaho sa computer. Dahil mas mahusay ang modelo sa pag-unawa sa layunin, mas natural na makakakilos ito sa buong loop ng gawaing pangkaalaman: paghahanap ng impormasyon, pag-unawa sa mahalaga, paggamit ng mga tool, pagsuri sa resulta, at pagbabago ng hilaw na materyal tungo sa bagay na kapaki-pakinabang.
Sa Codex, mas mahusay ang GPT‑5.5 kaysa sa GPT‑5.4 sa pagbuo ng mga dokumento, spreadsheet, at slide presentation. Sinabi ng mga alpha na tagasubok na mas mahusay ito kaysa sa mga nakaraang modelo sa mga gawaing tulad ng operational na pananaliksik, pagmomodelo ng spreadsheet, at pag-convert ng magugulong input ng negosyo tungo sa mga plano. Kapag isinama sa mga kakayahan sa paggamit ng computer ng Codex, mas inilalapit tayo ng GPT‑5.5 sa pakiramdam na talagang magagamit ng modelo ang computer kasama mo: nakikita kung ano ang nasa screen, nagki-click, nagta-type, nagna-navigate sa mga interface, at lumilipat sa iba’t ibang tool nang may katumpakan.
Gumagamit na ang mga team sa OpenAI ng mga lakas na ito sa mga tunay na daloy ng trabaho. Ngayon, mahigit sa 85% ng kumpanya ang gumagamit ng Codex bawat linggo sa iba’t ibang tungkulin, kabilang ang software engineering, pananalapi, komunikasyon, marketing, agham ng data, at pamamahala ng produkto. Sa Comms, ginamit ng team ang GPT‑5.5 sa Codex upang suriin ang anim na buwang data ng mga kahilingan sa pagsasalita, bumuo ng balangkas ng pagmamarka at panganib, at patotohanan ang awtomatikong Slack agent upang ang mga kahilingang mababa ang panganib ay maasikaso nang awtomatiko, habang ang mga kahilingang mas mataas ang panganib ay idinadaan pa rin sa pagsusuri ng tao. Sa Pananalapi, ginamit ng team ang Codex upang suriin ang 24,771 K-1 na form na buwis na may kabuuang 71,637 pahina, gamit ang daloy ng trabaho na nagbukod ng personal na impormasyon at nakatulong sa team na mapabilis ang gawain nang dalawang linggo kumpara sa nakaraang taon. Sa Go-to-Market team, nag-automate ang isang empleyado ng pagbuo ng lingguhang ulat ng negosyo, na nakakatipid ng 5-10 oras bawat linggo.
Sa ChatGPT, ang GPT‑5.5 Thinking ay nagbibigay ng mas mabilis na tulong para sa mas mahihirap na problema, sa pamamagitan ng mas matalino at mas maiikling mga sagot upang mas mahusay mong malampasan ang mga komplikadong gawain. Napakahusay nito sa mga propesyonal na gawain tulad ng pagko-code, pananaliksik, pagbubuklod ng impormasyon, pagsusuri, at mga gawain na marami ang dokumento, lalo na kapag gumagamit ng mga plugin.
Sa GPT‑5.5 Pro, nakikita ng mga unang tagasubok ang makabuluhang pag-angat sa parehong hirap at kalidad ng mga gawaing kayang gawin ng ChatGPT, kasama ang mga pagpapahusay sa pagkaantala kaya mas nagiging praktikal ito para sa mga gawain na maraming pangangailangan. Kung ihahambing sa GPT‑5.4 Pro, napag-alaman ng mga tagasubok na ang mga tugon ng GPT‑5.5 Pro ay mas komprehensibo, maayos ang pagkakabalangkas, tumpak, may kaugnayan, at kapaki-pakinabang, na may lalo pang mahusay na pagganap sa negosyo, batas, edukasyon, at agham ng data.
Nakakamit ng GPT‑5.5 ang makabagong pagganap sa maraming pamantayan na sumasalamin sa ganitong uri ng gawain. Sa GDPval, na sumusubok sa kakayahan ng mga agent na makagawa ng detalyadong trabahog pangkaalaman sa 44 na trabaho, ang GPT‑5.5 ay nakakuha ng 84.9%. Sa OSWorld-Verified, na sumusukat kung kayang magpatakbo ng modelo ng mga tunay na computer environment nang mag-isa, umaabot ito sa 78.7%. At sa Tau2-bench Telecom, na sumusubok ng mga kumplikadong daloy ng trabaho ng serbisyo sa customer, umaabot ito sa 98.0% nang walang pagpipino ng prompt. Malakas din ang pagganap ng GPT‑5.5 sa iba pang mga pamantayan ng trabahong pangkaalaman: 60.0% sa FinanceAgent, 88.5% sa mga panloob na gawain sa pagmomodelo sa pamumuhunan sa bangko, at 54.1% sa OfficeQA Pro.
Ang Tau2-bench Telecom ay pinatakbo nang walang pagpipino ng prompt (at GPT‑4.1 bilang modelo ng user). Mas nauunawaan ng GPT‑5.5 ang layunin ng gawain at mas mahusay ito sa paggamit ng token kaysa sa mga nauna rito.
“Naghahatid ang GPT-5.5 ng tuloy-tuloy na pagganap na kinakailangan para sa mga gawaing mabigat na isakatuparan. Binuo at inihatid sa mga system na NVIDIA GB200 NVL72, binibigyang-daan ng modelo ang aming mga team na makapaghatid ng mga tampok mula sa simula hanggang katapusan, mula sa mga prompt sa natural na pananalita, mapababa ang oras ng pag-debug mula ilang araw hanggang ilang oras, at gawing magdamagang pag-unlad ang ilang linggo ng pag-eeksperimento sa mga kumplikadong codebase. Hindi lang ito tungkol sa mas mabilis na pag-code—ito ay bagong paraan ng pagtatrabaho na tumutulong sa mga tao na kumilos sa di-pangkaraniwang kabilisan.”
Nagpapakita rin ang GPT‑5.5 ng mga pag-unlad sa mga daloy ng trabaho sa pananaliksik na siyentipiko at teknikal, na nangangailangan ng higit pa sa pagsagot sa mahirap na tanong. Kailangang galugarin ng mga mananaliksik ang isang ideya, mangalap ng ebidensya, subukan ang mga palagay, bigyang-kahulugan ang mga resulta, at magpasya kung ano ang susunod na hakbang. Mas mahusay ang GPT‑5.5 sa pagpapatuloy sa prosesong iyon kaysa sa ibang mga modelo.
Kapansin-pansin, ang GPT‑5.5 ay nagpapakita ng malinaw na pagbuti kumpara sa GPT‑5.4 sa GeneBench(magbubukas sa bagong window), isang bagong eval na nakatuon sa maraming-yugtong pagsusuri ng data sa henetika at kwantitatibong biyolohiya. Kinakailangan ng mga problemang ito na mangatuwiran ang mga modelo tungkol sa posibleng malabo o may kamaliang data nang may kaunting gabay na superbisoryo, tugunan ang mga makatotohanang hadlang tulad ng mga nakatagong confounder o mga pagkabigo sa QC, at ipatupad at bigyang-kahulugan nang tama ang mga makabagong pamamaraang estadistikal. Kapansin-pansin ang pagganap ng modelo kung isasaalang-alang na ang mga gawain dito ay kadalasang katumbas ng mga proyektong tumatagal ng maraming araw para sa mga eksperto sa agham.
Katulad nito, sa BixBench(magbubukas sa bagong window), isang pamantayan na dinisenyo batay sa tunay na bioinformatics at pagsusuri ng data, nakamit ng GPT‑5.5 ang nangungunang pagganap sa mga modelo na may nailathalang mga marka. Ang mga kakayahang siyentipiko ng modelo ay may sapat nang kalakasan upang makabuluhang mapabilis ang pag-unlad sa frontier ng biomedikal na pananaliksik bilang isang tunay na katuwang na siyentipiko.
Sa isa pang halimbawa, nakatulong ang panloob na bersyon ng GPT‑5.5 na may pasadyang harness na makatuklas ng bagong patunay(magbubukas sa bagong window) tungkol sa mga numerong Ramsay, isa sa mga pangunahing paksa sa combinatorics. Pinag-aaralan ng Combinatorics kung paano nagsasama-sama ang mga hiwalay na bagay: mga graph, mga network, mga set, at mga pattern. Ang mga numerong Ramsay ay nagtatanong, sa pangkalahatan, kung gaano kalaki ang kailangang maging network bago tiyak na lumitaw ang ilang uri ng kaayusan. Ang mga resulta sa larangang ito ay bihira at kadalasang mahirap sa teknikal na aspeto. Dito, nakatuklas ang GPT‑5.5 ng patunay ng isang matagal nang kilalang asimptotikong katotohanan tungkol sa mga off-diagonal na numerong Ramsey, na sa kalaunan ay napatunayan sa Lean. Ang resulta ay kongkretong halimbawa ng pag-aambag ng GPT‑5.5 hindi lamang ng code o paliwanag, kundi ng nakakagulat at kapaki-pakinabang na argumentong matematikal sa pangunahing larangan ng pananaliksik.
Ginamit ng mga naunang tagasubok ang GPT‑5.5 Pro sa ChatGPT hindi bilang minsanang tagasagot na makina kundi bilang katuwang sa pananaliksik: pagsusuri ng mga manuskrito nang paulit-ulit, pagsubok sa mga teknikal na argumento, pagmumungkahi ng mga pagsusuri, at pakikipagtulungan gamit ang code, mga tala, at konteksto mula sa PDF. Ang karaniwang tema ay mas mahusay ang GPT‑5.5 sa pagtulong sa mga mananaliksik na lumipat mula sa tanong patungo sa eksperimento at pagkatapos sa output.
Si Derya Unutmaz, isang propesor ng immunology at mananaliksik sa Jackson Laboratory for Genomic Medicine, ay gumamit ng GPT‑5.5 Pro upang suriin ang dataset ng gene expression na may 62 sample at halos 28,000 gene, na nakabuo ng detalyadong ulat ng pananaliksik na hindi lamang nagbuod ng mga natuklasan kundi naglahad din ng mahahalagang tanong at kaalaman—isang gawaing sinabi niyang aabutin sana ng ilang buwan para matapos ng kaniyang team.
Si Bartosz Naskręcki, assistant professor sa matematika sa Adam Mickiewicz University sa Poznań, Poland, ay gumamit ng GPT‑5.5 sa Codex upang bumuo ng algebraic-geometry app mula sa iisang prompt sa loob ng 11 minuto, na isinasalarawan ang interseksyon ng mga kwadratikong ibabaw at ikinonvert ang nagresultang kurba sa modelong Weierstrass.
Sa kalaunan, pinalawak niya ang app gamit ang mas matatag na biswalisasyon ng singularity at eksaktong mga coefficient na maaaring magamit muli sa mga susunod na gawain. Para sa kanya, ang mas malaking pagbabago ay makakatulong na ngayon ang Codex na magpatupad ng mga pasadyang daloy ng trabaho para sa matematikal na biswalisasyon at computer-algebra na dati ay nangangailangan ng mga nakalaang tool. Kung pagsasama-samahin, ipinapakita ng mga halimbawang ito na ginagawang gumaganang mga tool at pagsusuri sa pananaliksik ng GPT‑5.5 ang layunin ng eksperto.

Ni: Bartosz Naskręcki(magbubukas sa bagong window)
Prompt: # Interseksyon ng mga Ibabaw sa Alhebraikong Heometriya
Gumawa ng app na nagguguhit ng dalawang kwadratikong ibabaw at kinukulayan ng pula ang kurba ng interseksyon. Gamitin ang computational Riemann-Roch theorem upang i-convert ito sa kurbang Weierstrass.
## Pangunahing window
Dalawang may kulay na ibabaw na may bahagyang transparent na pagtatabing, ang de-kalidad na pag-render ay nagsasalubong sa kahabaan ng alhebraikong kurba na kulay pula
Pag-ikot gamit ang mouse sa parehong direksyon, buong mekanismong pinch para sa zoom, haptic na pagpindot upang ipakita ang maliit na menu na may mga slider para sa pagbabago ng mga coefficient ng bawat ibabaw; pagtukoy sa pamamagitan ng antas ng Z-buffer
## I-slide ang kanang window
Ang Short Weierstrass na ekwasyon (over Q o quadratic field extension) na kino-compute nang mabilisan gamit ang mga formula ng effective Riemann-Roch theorem
## Ambient mode kung saan nakatago ang lahat ng kontrol at maaaring hangaan ng gumagamit ang ganda ng mga hugis
## Mga Spec
Ang app ay tumatakbo sa browser, magaan na implementasyon na may pinakabagong mga full-stack library, portable, at nade-deploy.
## Mga Dokumento
Git repo, journal, plan (mga file ng Markdown)
“Nakakapagpasigla nang husto ang paggamit ng bagong GPT-5.5 na modelo ng OpenAI sa aming harness, ang pagpapalalim ng pag-iisip nito sa napakalalaking biokemikal na data upang mahulaan ang mga magiging resulta ng gamot sa tao, at pagkatapos ay makita itong maghatid ng makabuluhang pagtaas sa katumpakan sa aming pinakamahihirap na pagsusuri sa pagtuklas ng gamot.” Kung magpapatuloy ang OpenAI sa ganitong bilis ng pag-unlad, magbabago ang mga pundasyon ng pagtuklas ng gamot bago matapos ang taon.”
Ang paghahatid ng GPT‑5.5 sa pagkaantala ng GPT‑5.4 ay nangailangan ng muling pag-iisip sa imperensya bilang pinagsamang sistema, hindi bilang hanay ng magkakahiwalay na pag-optimize. Ang GPT‑5.5 ay magkatuwang na dinisenyo, sinanay at inihatid sa mga system na NVIDIA GB200 at GB300 NVL72. Mahalaga ang naging papel ng Codex at GPT‑5.5 sa pagkamit ng aming mga target sa pagganap. Nakatulong ang Codex sa team na mas mabilis na makalipat mula sa ideya patungo sa nasusukat na pagpapatupad, sa pagbalangkas ng mga pamamaraan, pagbuo ng mga eksperimento, at pagtukoy kung alin sa mga pag-optimize ang karapat-dapat paglaanan ng mas malalim na pamumuhunan. Nakatulong ang GPT‑5.5 sa pagtukoy at pagpapatupad ng mahahalagang pagpapabuti sa mismong stack. Sa madaling sabi, nakatulong ang modelo na mapahusay ang imprastrakturang naghahatid rito.
Isa sa mga naturang pagpapabuti ay ang pagbabalanse ng load at mga heuristic sa pagpa-partition. Bago ang GPT‑5.5, hinahati namin ang mga kahilingan sa accelerator sa nakapirming bilang ng mga bahagi, upang mabalanse ang trabaho sa mga computing core at matiyak na ang malalaki at maliliit na request ay maaaring tumakbo sa iisang GPU. Gayunman, ang paunang itinakdang bilang ng mga static na chunk ay hindi pinakamainam para sa lahat ng anyo ng trapiko. Para mas mahusay na magamit ang mga GPU, sinuri ng Codex ang mga pattern ng trapiko ng produksyon sa loob ng ilang linggo at sumulat ng mga custom na heuristic algorithm upang maayos na maipamahagi at mabalanse ang trabaho. Ang pagsisikap ay nagkaroon ng napakalaking epekto, pinapataas ang bilis ng pagbuo ng token nang mahigit 20%.
Ang paghahanda sa mundo para sa mga modelo na mahusay sa pagtukoy at pag-patch ng mga kahinaan sa seguridad ay isang pagsisikap ng buong team at mangangailangan ng buong ecosystem na magtrabaho nang husto upang bumuo ng katatagan, sa pamamagitan ng demokratikong pag-access sa mga modelo at sunud-sunod na pag-deploy para sa susunod na yugto ng depensa sa cyber.
Ang mga modelo ng frontier ay lalong nagiging mas may kakayahan sa cybersecurity. Ang mga kakayahang ito ay malawak na maipapamahagi, at naniniwala kami na ang pinakamainam na hakbang pasulong ay tiyakin na magagamit ang mga ito upang pabilisin ang depensa sa cyber at patatagin ang ecosystem.
Ang GPT‑5.5 ay unti-unti ngunit mahalagang hakbang patungo sa AI na kayang lumutas ng ilan sa pinakamahihirap na hamon sa mundo, gaya ng cybersecurity. Sa GPT‑5.2 noong Disyembre, aktibo naming inilunsad ang mga kinakailangang pananggalang sa cyber upang limitahan ang potensyal na pang-aabuso sa cyber sa aming mga modelo; ngayon, sa GPT‑5.5, naglalagay kami ng mas mahihigpit na mga pang-uri para sa potensyal na panganib sa cyber na maaaring kainisan ng ilang user sa simula, habang pinipino namin ang mga ito sa pagdaan ng panahon.
Sa loob ng maraming taon, tinukoy na namin ang cybersecurity bilang isang kategorya sa aming Preparedness Framework(magbubukas sa bagong window) habang unti-unting humusay ang aming mga modelo, kasabay ng pagbuo at paulit-ulit na pag-calibrate ng mga mitigasyon, upang responsableng makapaglabas ng mga modelo na may makabuluhang kakayahan sa cybersecurity.
- Ipinatutupad namin ang mga nangungunang pananggalang sa industriya para sa antas na ito ng kakayahan sa cyber. Una naming ipinakilala ang mga pananggalang na partikular sa cyber sa GPT‑5.2(magbubukas sa bagong window) noong nakaraang taon, na patuloy naming sinusubok, pinipino, at pinalalawak sa mga sumunod na pag-deploy. Para sa GPT‑5.5, nagdisenyo kami ng mas mahihigpit na kontrol para sa mga aktibidad na may mas mataas na panganib, sensitibong kahilingan sa cyber, at nagdagdag ng mga proteksyon laban sa paulit-ulit na maling paggamit. Ang malawak na pag-access ay nagiging posible sa pamamagitan ng aming pamumuhunan sa kaligtasan ng modelo, na-authenticate na paggamit, at pagsubaybay sa hindi pinahihintulutang paggamit. Ilang buwan na kaming nakikipagtulungan sa mga panlabas na eksperto upang bumuo, sumubok, at paulit-ulit na pahusayin ang katatagan ng mga pag-iingat na ito. Sa GPT‑5.5, tinitiyak namin na madaling maprotektahan ng mga developer ang kanilang code, habang naglalagay ng mas mahihigpit na kontrol sa mga cyber na daloy ng trabaho na malamang magamit ng mga may masasamang intensyon upang magdulot ng pinsala.
- Pinapalawak namin ang access para pabilisin ang depensa sa cyber sa bawat antas. Ginagawa naming available ang aming mga modelo na mas mapagbigay sa cyber sa pamamagitan ng Pinagkakatiwalaang Pag-access para sa Cyber, simula sa Codex, na kinabibilangan ng pinalawak na access sa mga advanced na kakayahan sa cybersecurity ng GPT‑5.5 na may mas kaunting mga limitasyon para sa mga beripikadong user na nakatutugon sa ilang mga senyales ng tiwala(magbubukas sa bagong window) sa paglulunsad. Ang mga organisasyong responsable sa pagtatanggol sa kritikal na imprastraktura ay maaaring mag-apply para magkaroon ng access sa mga modelong mapagbigay sa cyber tulad ng GPT‑5.4‑Cyber, habang natutugunan ang mahihigpit na kinakailangan sa seguridad upang magamit ang mga modelong ito para sa pag-secure ng kanilang mga panloob na sistema. Nagbibigay ito ng malawak na hanay ng mga beripikadong tagapagtanggol ng mas may kakayahang mga tool para sa lehitimong gawaing pangseguridad, na may mas kaunting hindi kinakailangang hadlang, upang matiyak na nagagawa naming gawing mas demokratiko ang pag-access sa mahahalagang kakayahang pangdepensa. Maaaring mag-apply ang mga user para sa pinagkakatiwalaang pag-access sa chatgpt.com/cyber(magbubukas sa bagong window) upang mabawasan ang mga hindi kinakailangang pagtanggi habang ginagamit ang GPT‑5.5 para sa beripikadong gawaing depensibo.
- Nakikipagtulungan kami sa mga katuwang sa pamahalaan upang makatulong na maprotektahan ang kritikal na imprastraktura para sa publiko. Sama-sama naming sinusuri kung paano makakasuporta ang advanced na AI sa gawaing pangdepensa ng mga pinagkakatiwalaang opisyal na responsable sa mga sistemang inaasahan ng mga tao, mula sa mga digital na sistemang nagpoprotekta sa mahahalagang data ng mga nagbabayad ng buwis hanggang sa power grid at mga suplay ng tubig sa mga lokal na komunidad.
Tinuturing namin ang mga kakayahang biyolohikal/kemikal at cybersecurity ng GPT‑5.5 bilang Mataas sa ilalim ng aming Preparedness Framework(magbubukas sa bagong window). Bagama't hindi umabot ang GPT‑5.5 sa antas ng kritikal na kakayahan sa cybersecurity, ipinakita ng aming mga ebalwasyon at pagsusuri na mas mataas ang mga kakayahan nito sa cybersecurity kumpara sa GPT‑5.4.
Bukod pa rito, dumaan ang GPT‑5.5 sa aming buong proseso ng kaligtasan at pamamahala bago ilabas, kabilang ang mga pagsusuri sa kahandaan, pagsubok na partikular sa larangan, mga bagong naka-target na pagsusuri para sa mga advanced na kakayahan sa biyolohiya at cybersecurity, at masusing pagsubok kasama ang mga panlabas na eksperto. Nagbabahagi kami ng higit pang mga detalye sa card ng system(magbubukas sa bagong window) ng GPT‑5.5.
Ipinapakita ng gawaing ito ang aming mas malawak na paraan sa katatagan ng AI, na sa aming paniniwala ay kinakailangan habang umuunlad ang mga kakayahan ng modelo. Gusto naming maging available ang makapangyarihang AI sa mga taong gumagamit nito upang ipagtanggol ang mga sistema, institusyon, at ang publiko. Ang praktikal na landas ay pinagkakatiwalaang pag-access, matitibay na pananggalang na umaayon sa antas ng kakayahan, at kakayahan sa pamamalakad upang matukoy at matugunan ang malubhang maling paggamit.
Ngayong araw, ilulunsad ang GPT‑5.5 para sa mga user ng Plus, Pro, Business, at Enterprise sa ChatGPT at Codex. Ilulunsad din ang GPT‑5.5 Pro para sa mga user ng Pro, Business, at Enterprise sa ChatGPT. Malapit na naming dalhin ang GPT‑5.5 at GPT‑5.5 Pro sa API.
Sa ChatGPT, available ang GPT‑5.5 Thinking sa mga user ng Plus, Pro, Business, at Enterprise. Available ang GPT‑5.5 Pro, na dinisenyo para sa mas mahihirap pang tanong at trabahong nangangailangan ng mas mataas na katumpakan, para sa mga user ng Pro, Business, at Enterprise.
Sa Codex, available ang GPT‑5.5 para sa mga plan na Plus, Pro, Business, Enterprise, Edu, at Go na may 400,000 window ng konteksto. Available din ang GPT‑5.5 sa Fast mode, na bumubuo ng mga token nang 1.5× na mas mabilis kapalit ng 2.5× na mas mataas na gastos.
Para sa mga API developer, ang gpt-5.5 ay malapit nang maging available sa Responses and Chat Completions API sa halagang $5 kada 1M input token at $30 kada 1M output token, na may 1M window ng konteksto. Ang presyo ng Batch at Flex ay makukuha sa kalahati ng karaniwang halaga ng API, habang ang Priority na pagpoproseso ay makukuha sa 2.5x ng karaniwang halaga. Ilalabas din namin ang gpt-5.5-pro sa API para sa mas mataas pang katumpakan, na nagkakahalaga ng $30 kada 1M input token at $180 kada 1M output token. Tingnan ang pahina ng pagpepresyo para sa buong detalye.
Bagama't mas mataas ang presyo ng GPT‑5.5 kaysa sa GPT‑5.4, mas matalino at higit na mas mahusay ito sa paggamit ng token. Sa Codex, maingat naming pinino ang karanasan upang makapaghatid ang GPT‑5.5 ng mas magagandang resulta gamit ang mas kaunting token kaysa sa GPT‑5.4 para sa karamihan ng mga user, habang patuloy na nag-aalok ng malawak na paggamit sa iba’t ibang antas ng subscription.
Pag-code
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (Pampubliko) * | 58.6% | 57.7% | - | - | 64.3% | 54.2% |
Terminal-Bench 2.0 | 82.7% | 75.1% | - | - | 69.4% | 68.5% |
Expert-SWE (Panloob) | 73.1% | 68.5% | - | - | - | - |
*Napansin ng Labs ang ebidensya ng pagsasaulo(magbubukas sa bagong window) sa pagsusuring ito
Propesyonal
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (panalo o tabla) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
FinanceAgent v1.1 | 60.0% | 56.0% | - | 61.5% | 64.4% | 59.7% |
Mga Gawain sa Pagmomodelo sa Investment Banking (Panloob) | 88.5% | 87.3% | 88.6% | 83.6% | - | - |
OfficeQA Pro | 54.1% | 53.2% | - | - | 43.6% | 18.1% |
Paggamit ng computer at vision
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-Na-verify | 78.7% | 75.0% | - | - | 78.0% | - |
MMMU Pro (walang mga tool) | 81.2% | 81.2% | - | - | - | 80.5% |
MMMU Pro (may mga tool) | 83.2% | 82.1% | - | - | - | - |
Paggamit ng mga tool
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
MCP Atlas** | 75.3% | 70.6% | - | - | 79.1% | 78.2% |
Toolathlon | 55.6% | 54.6% | - | - | - | 48.8% |
Tau2-bench Telecom*** | 98.0% | 92.8% | - | - | - | - |
** MCP Atlas: mga resulta mula sa Scale AI pagkatapos ng pinakabagong update noong Abril 2026.
*** Tau2-bench Telecom: mga resulta para sa 5.5 at 5.4 na may mga orihinal na prompt, ibig sabihin, walang pagsasaayos ng prompt. Hindi kasama rito ang mga resulta mula sa iba pang mga lab na sinuri na may pagsasaayos ng prompt.
Pang-akademiko
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | 25.0% | 19.0% | 33.2% | 25.6% | - | - |
FrontierMath Tier 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
FrontierMath tier 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
BixBench | 80.5% | 74.0% | - | - | - | - |
GPQA Diamond | 93.6% | 92.8% | - | 94.4% | 94.2% | 94.3% |
Huling Pagsusulit sa Humanity (walang mga tool) | 41.4% | 39.8% | 43.1% | 42.7% | 46.9% | 44.4% |
Huling Pagsusulit sa Humanity (na may mga tool) | 52.2% | 52.1% | 57.2% | 58.7% | 54.7% | 51.4% |
Cybersecurity
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Mga gawain sa hamong Capture-the-Flag (Panloob) | 88.1% | 83.7% | - | - | - | - |
CyberGym | 81.8% | 79.0% | - | - | 73.1% | - |
**** Isang pinalawak na bersyon ng pinakamahihirap na CTF na ginagamit sa mga card ng system na may mga karagdagang mahihirap na hamon.
Mahabang konteksto
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256k f1 | 73.7% | 62.5% | - | - | 76.9% | - |
Graphwalks BFS 1mil f1 | 45.4% | 9.4% | - | - | 41.2% (Opus 4.6) | - |
Mga parent ng Graphwalks 256k f1 | 90.1% | 82.8% | - | - | 93.6% | - |
Mga parent ng Graphwalks 1mil f1 | 58.5% | 44.4% | - | - | 72.0% (Opus 4.6) | - |
OpenAI MRCR v2 8-needle 4K-8K | 98.1% | 97.3% | - | - | - | - |
OpenAI MRCR v2 8-needle 8K-16K | 93.0% | 91.4% | - | - | - | - |
OpenAI MRCR v2 8-needle 16K-32K | 96.5% | 97.2% | - | - | - | - |
OpenAI MRCR v2 8-needle 32K-64K | 90.0% | 90.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 64K-128K | 83.1% | 86.0% | - | - | - | - |
OpenAI MRCR v2 8-needle 128K-256K | 87.5% | 79.3% | - | - | 59.2% | - |
OpenAI MRCR v2 8-needle 256K-512K | 81.5% | 57.5% | - | - | - | - |
OpenAI MRCR v2 8-needle 512K-1M | 74.0% | 36.6% | - | - | 32.2% | - |
Abstract na pangangatwiran
Eval | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (Na-verify) | 95.0% | 93.7% | - | 94.5% | 93.5% | 98.0% |
ARC-AGI-2 (Na-verify) | 85.0% | 73.3% | - | 83.3% | 75.8% | 77.1% |
Isinagawa ang mga ebalwasyon ng GPT na nakatakda sa xhigh ang kakayahan sa pangangatuwiran sa dako ng pananaliksik, kaya sa ilang pagkakataon, maaaring bahagyang magkaiba ang resulta kumpara sa produksyon na ChatGPT.








