23 April 2026

Ngenalake GPT‑5.5

Kelas kecerdasan anyar kanggo karya nyata

Lagi dimuat…

Update tanggal 24 April 2026: GPT‑5.5 lan GPT‑5.5 Pro saiki wis kasedhiya ing API. Kertu sistem uga wis dianyari kanggo njlentrehake safeguard tambahan sing ditrapake.

Kami ngluncurake GPT‑5.5, model paling pinter lan paling intuitif kanggo digunakake nganti saiki, lan langkah sabanjure menyang cara anyar kanggo ngrampungake pakaryan ing komputer.

GPT‑5.5 luwih cepet mangerteni apa sing arep panjenengan lakoni lan bisa nanggung luwih akeh pakaryane dhewe. Model iki unggul kanggo nulis lan ndandani bug kode, riset online, nganalisis data, nggawe dokumen lan spreadsheet, ngoperasikake piranti lunak, lan pindhah antar alat nganti tugas rampung. Tinimbang kudu ngatur saben langkah kanthi tliti, panjenengan bisa menehi GPT‑5.5 tugas sing acak-acakan lan akeh bageane, banjur percaya yen model iki bakal ngrancang, nggunakake alat, mriksa pakaryane, ngliwati ambiguitas, lan terus maju.

Peningkatan iki utamane kuwat ing coding agen, panggunaan komputer, knowledge work, lan riset ilmiah tahap awal—wilayah sing kemajuane gumantung marang nalar ing saindenging konteks lan njupuk tumindak saka wektu ke wektu. GPT‑5.5 menehi peningkatan intelijensi iki tanpa ngorbanake kecepatan: model sing luwih gedhe lan luwih mumpuni kerep luwih alon dilayani, nanging GPT‑5.5 nyandhingi latensi per-token GPT‑5.4 ing serving nyata, nalika kinerjane ana ing tingkat intelijensi sing luwih dhuwur. Model iki uga nggunakake token sing luwih sithik banget kanggo ngrampungake tugas Codex sing padha, dadi luwih efisien saliyane luwih mumpuni.

Kami ngluncurake GPT‑5.5 kanthi set safeguard paling kuwat nganti saiki, dirancang kanggo nyuda panyalahgunaan tanpa ngurangi akses kanggo pakaryan sing migunani. Kami ngevaluasi model iki ing sakabehe rangka kerja safety lan kesiapan, kerja bareng red teamer internal lan eksternal, nambah testing sing ditargetake kanggo kapabilitas cybersecurity lan biologi tingkat lanjut, lan nglumpukake umpan balik babagan kasus panggunaan nyata saka meh 200 mitra early-access sing dipercaya sadurunge rilis.

Dina iki, GPT‑5.5 lagi digelar kanggo pangguna Plus, Pro, Business, lan Enterprise ing ChatGPT lan Codex, lan GPT‑5.5 Pro lagi digelar kanggo pangguna Pro, Business, lan Enterprise ing ChatGPT. Deployment API mbutuhake safeguard sing beda lan kami lagi kerja cedhak karo mitra lan pelanggan babagan syarat safety lan security kanggo nyedhiyakake model iki ing skala gedhe. Kami bakal nggawa GPT‑5.5 lan GPT‑5.5 Pro menyang API rauh banget.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (Internal)	73.1%	68.5%	-	-	-	-
GDPval (menang utawa seri)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
OSWorld-Verified	78.7%	75.0%	-	-	78.0%	-
Toolathlon	55.6%	54.6%	-	-	-	48.8%
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
FrontierMath Tier 1–3	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
FrontierMath Tier 4	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
CyberGym	81.8%	79.0%	-	-	73.1%	-

Kapabilitas model

OpenAI lagi mbangun infrastruktur global kanggo AI agen, supaya wong lan bisnis ing saindenging jagad bisa ngrampungake pakaryan nganggo AI. Sajrone setaun kepungkur, kami wis ndeleng AI kanthi dramatis nyepetake rekayasa piranti lunak. Kanthi GPT‑5.5 ing Codex lan ChatGPT, transformasi sing padha saiki wiwit ngrembaka menyang riset ilmiah lan pakaryan sing luwih jembar sing ditindakake wong ing komputer.

Ing kabeh domain iki, GPT‑5.5 ora mung luwih cerdas; model iki uga luwih efisien ing cara ngrampungake masalah, kerep tekan output kualitas luwih dhuwur kanthi token luwih sithik lan retry luwih sithik. Ing Coding Index saka Artificial Analysis, GPT‑5.5 menehi intelijensi state-of-the-art kanthi biaya separo saka model coding tercanggih pesaing.

Indeks Kecerdasan Artificial Analysis⁠(mbukak ing jendhela anyar) yaiku rerata bobot saka 10 eval sing ditindakake dening pihak eksternal: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Coding agen

GPT‑5.5 yaiku model coding agen paling kuwat saka kami nganti saiki. Ing Terminal-Bench 2.0, sing nguji alur kerja command-line kompleks sing mbutuhake perencanaan, iterasi, lan koordinasi alat, model iki nggayuh akurasi state-of-the-art 82.7%. Ing SWE-Bench Pro, sing ngevaluasi penyelesaian issue GitHub ing donya nyata, model iki tekan 58.6%, ngrampungake luwih akeh tugas end-to-end mung ing siji pass tinimbang model sadurunge. Ing Expert-SWE, eval frontier internal kami kanggo tugas coding jangka dawa kanthi median perkiraan wektu rampung manungsa 20 jam, GPT‑5.5 uga ngluwihi GPT‑5.4.

Ing telung eval kasebut, GPT‑5.5 nambah skor GPT‑5.4 nalika nggunakake token luwih sithik.

Kaunggulan coding model iki katon cetha banget ing Codex, amarga bisa nangani pakaryan engineering wiwit implementasi lan refactor nganti debugging, testing, lan validasi. Testing awal nuduhake yen GPT‑5.5 luwih apik ing prilaku sing dadi dhasar pakaryan engineering nyata, kaya njaga konteks ing sistem gedhe, nalar liwat kegagalan sing ambigu, mriksa asumsi nganggo alat, lan nerusake owah-owahan ing sakubenge codebase.

Lintasan sing dirender nggunakake data vektor NASA/JPL Horizons kanggo Orion, Bulan, lan Srengenge, kanthi skala tampilan sing ditrapake supaya gampang diwaca.

Prompt: [gambar ditempel] Terapna iki dadi app anyar nganggo webgl lan vite nganggo data nyata saka misi artemis II. Priksa manawa app dites kanthi tuntas nganti bisa mlaku kanthi sampurna lan katon kaya app ing gambar. Gatekna kanthi tenanan rendering planit lan jalur mabure. Aku pengin bisa sesambungan karo rendering 3D. Pasthekna nduweni mekanika orbit sing realistis.

Ngluwihi benchmark, para tester awal ngomong yen GPT‑5.5 nuduhake kemampuan sing luwih kuwat kanggo mangerteni wangun sawijining sistem: kenapa ana sing gagal, ing ngendi perbaikane kudu diterapake, lan apa maneh ing codebase sing bakal kena pengaruh.

“Model ngoding pisanan sing takgunakake sing nduweni kejernihan konseptual sing serius.”

Dan Shipper, Founder lan CEO Every, njlèntrèhaké GPT‑5.5 minangka “model ngoding pisanan sing takgunakake sing nduweni kejernihan konseptual sing serius.”

Sawise ngluncurake app, dheweke ngentekake pirang-pirang dina kanggo debugging masalah sawise peluncuran sadurunge pungkasane njaluk salah siji engineer paling apik kanggo nulis ulang bagean sistem. Kanggo nguji GPT‑5.5, dheweke kaya muter maneh wektu: apa model iki bisa ndeleng kondisi sing rusak kuwi lan ngasilake jinis penulisan ulang sing padha kaya sing pungkasane dipilih engineer mau? GPT‑5.4 ora bisa. GPT‑5.5 bisa.

“Iki tenan krasa kaya aku lagi kerja bareng kecerdasan sing luwih dhuwur, lan meh ana rasa ngajeni.”

Pietro Schirano, CEO MagicPath, ndeleng lompatan sing padha nalika GPT‑5.5 nggabungake branch kanthi atusan owah-owahan frontend lan refactor menyang branch utama sing uga wis owah kanthi gedhe, ngrampungake karya kasebut sepisan langsung sajrone kira-kira 20 menit.

Engineer senior sing nguji model iki ngomong yen GPT‑5.5 katon luwih kuwat tinimbang GPT‑5.4 lan Claude Opus 4.7 ing nalar lan otonomi, bisa nyekel masalah luwih dhisik lan prédhiksi kebutuhan testing lan review tanpa prompt sing eksplisit. Ing salah siji kasus, ana engineer sing njaluk model iki ngrancang ulang sistem komentar ing editor markdown kolaboratif lan bali maneh nemokake tumpukan 12 diff sing meh rampung. Liyane uga ngomong yen koreksi implementasi sing dibutuhake mung sithik banget lan dheweke luwih yakin marang rencana GPT‑5.5 dibandhingake GPT‑5.4.

Salah siji engineer ing NVIDIA sing nduweni akses awal marang model iki nganti ngomong: "Kelangan akses menyang GPT‑5.5 rasane kaya lengenku diamputasi.”

“GPT-5.5 is noticeably smarter and more persistent than GPT-5.4, with stronger coding performance and more reliable tool use. It stays on task for significantly longer without stopping early, which matters most for the complex, long-running work our users delegate to Cursor.”

— Michael Truell, Co-founder & CEO at Cursor

Knowledge work

Kaunggulan sing padha sing nggawe GPT‑5.5 apik banget kanggo coding uga nggawe model iki kuat kanggo pakaryan saben dina ing komputer. Amarga model iki luwih apik ing mangerteni maksud, model iki bisa mlaku luwih alami ing kabeh loop knowledge work: nggoleki informasi, mangerteni endi sing penting, nggunakake alat, mriksa output, lan ngowahi bahan mentah dadi soko sing migunani.

Ing Codex, GPT‑5.5 luwih apik tinimbang GPT‑5.4 kanggo ngasilake dokumen, spreadsheet, lan presentasi slide. Para alpha tester ngomong yen model iki ngluwihi model sadurunge kanggo pakaryan kaya riset operasional, modeling spreadsheet, lan ngowahi input bisnis sing semrawut dadi rencana. Yen digabung karo kapabilitas panggunaan komputer Codex, GPT‑5.5 nggawa kita luwih cedhak marang rasa yen model iki pancen bisa nggunakake komputer bareng panjenengan: ndeleng apa sing ana ing layar, ngeklik, ngetik, navigasi antarmuka, lan pindhah antar alat kanthi presisi.

Tim-tim ing OpenAI wis nggunakake kaunggulan iki ing alur kerja nyata. Dina iki, luwih saka 85% perusahaan nggunakake Codex saben minggu ing fungsi kalebu software engineering, finance, communications, marketing, data science, lan product management. Ing Comms, tim nggunakake GPT‑5.5 ing Codex kanggo nganalisis data panjaluk bicara nem sasi, mbangun kerangka penilaian lan risiko, lan validasi agen Slack otomatis supaya panjaluk berisiko rendah bisa ditangani otomatis dene panjaluk risiko luwih dhuwur tetep dialihaké menyang review manungsa. Ing Finance, tim nggunakake Codex kanggo mriksa 24.771 formulir pajak K-1 sing totalé 71.637 kaca, nganggo alur kerja sing ngecualekake informasi pribadi lan mbantu tim nyepetake tugas iki rong minggu dibandhing taun sadurunge. Ing tim Go-to-Market, ana karyawan sing ngotomatisasi pembuatan laporan bisnis mingguan, ngirit wektu 5-10 jam saben minggu.

Ing ChatGPT, GPT‑5.5 Thinking mbukak bantuan sing luwih cepet kanggo masalah sing luwih angel, kanthi jawaban sing luwih pinter lan luwih ringkes supaya panjenengan bisa ngliwati pakaryan kompleks kanthi luwih efisien. Model iki unggul kanggo pakaryan profesional kaya coding, riset, sintesis lan analisis informasi, lan tugas sing akeh dokumene, utamane nalika nggunakake plugin.

Ing GPT‑5.5 Pro, para tester awal ndeleng lompatan sing signifikan ing tingkat kesulitan lan kualitas pakaryan sing bisa ditangani ChatGPT, kanthi peningkatan latensi sing ndadekake model iki luwih praktis kanggo tugas sing nuntut. Dibandhingake GPT‑5.4 Pro, para tester nemokake yen respons GPT‑5.5 Pro luwih komprehensif, terstruktur apik, akurat, relevan, lan migunani, kanthi performa utamane kuwat ing bisnis, hukum, pendidikan, lan data science.

GPT‑5.5 tekan performa state-of-the-art ing pirang-pirang benchmark sing nggambarake pakaryan kaya iki. Ing GDPval⁠⁠, sing nguji kemampuan agen kanggo ngasilake knowledge work sing spesifik kanthi apik ing 44 profesi, GPT‑5.5 nyetak 84.9%. Ing OSWorld-Verified, sing ngukur apa sawijining model bisa ngoperasikake lingkungan komputer nyata dhewekan, model iki tekan 78.7%. Lan ing Tau2-bench Telecom, sing nguji alur kerja layanan pelanggan kompleks, model iki tekan 98.0% tanpa prompt tuning. GPT‑5.5 uga nduweni performa kuwat ing benchmark knowledge work liyane: 60.0% ing FinanceAgent, 88.5% ing tugas modeling investment banking internal, lan 54.1% ing OfficeQA Pro.

Tau2-bench Telecom dijalanke tanpa tuning prompt (lan GPT‑4.1 minangka model pangguna). GPT‑5.5 luwih apik mangerteni maksud tugas lan luwih efisien token tinimbang pendahulune.

“GPT-5.5 menehi kinerja sing lestari sing dibutuhake kanggo pakaryan sing abot ing eksekusi. Dibangun lan disajekake ing sistem NVIDIA GB200 NVL72, model iki ndadekake tim kita bisa ngirim fitur end-to-end saka prompt basa alami, nyuda wektu debug saka dina dadi jam, lan ngowahi eksperimen pirang-pirang minggu dadi kemajuan sewengi ing codebase sing kompleks. Iki luwih saka mung ngoding luwih cepet—iki cara kerja anyar sing mbantu wong bisa makarya kanthi kecepatan sing beda sacara dhasar.”

— Justin Boitano, VP of Enterprise AI ing NVIDIA

Riset ilmiah

GPT‑5.5 uga nuduhake peningkatan ing alur kerja riset ilmiah lan teknis, sing mbutuhake luwih saka mung njawab pitakon angel. Peneliti kudu njelajah gagasan, nglumpukake bukti, nguji asumsi, nerjemahake asil, lan mutusake apa sing kudu dicoba sabanjure. GPT‑5.5 luwih apik ing njaga terus loop iki tinimbang model liyane.

Utamane, GPT‑5.5 nuduhake peningkatan sing cetha dibanding GPT‑5.4 ing GeneBench⁠(mbukak ing jendhela anyar), eval anyar sing fokus ing analisis data ilmiah multi-tahap ing genetika lan biologi kuantitatif. Masalah-masalah iki mbutuhake model kanggo nalar babagan data sing bisa wae ambigu utawa ngandhut kesalahan kanthi tuntunan pengawasan sing minimal, ngatasi alangan nyata kaya confounder sing didhelikake utawa kegagalan QC, lan ngetrapake lan nerjemahake metode statistik modern kanthi bener. Performa model iki nggumunake yen dielingi manawa tugas-tugas ing kene asring cocog karo proyek pirang-pirang dina kanggo ahli ilmiah.

Semono uga, ing BixBench⁠(mbukak ing jendhela anyar), benchmark sing dirancang adhedhasar bioinformatika lan analisis data donya nyata, GPT‑5.5 nggayuh performa terdepan ing antarane model sing skoré wis dipublikasikake. Kapabilitas ilmiah model iki saiki wis cukup kuwat kanggo nyepetake kemajuan kanthi nyata ing wates riset biomedis minangka rekan ilmiah sejati.

Ing conto liyane, versi internal GPT‑5.5 kanthi harness kustom mbantu nemokake bukti anyar⁠(mbukak ing jendhela anyar) babagan bilangan Ramsey, salah siji obyek pusat ing kombinatorika. Kombinatorika nyinaoni carane obyek diskret saling nyambung: graf, jaringan, himpunan, lan pola. Bilangan Ramsey takon, kurang luwih, sepira gedhene sawijining jaringan sadurunge ana jinis keteraturan tartamtu sing dijamin bakal muncul. Asil ing wilayah iki langka lan kerep angel sacara teknis. Ing kene, GPT‑5.5 nemokake bukti babagan sawijining fakta asimtotik sing wis suwe babagan bilangan Ramsey off-diagonal, sing banjur diverifikasi ing Lean. Asil iki dadi conto konkret yen GPT‑5.5 menehi kontribusi ora mung kode utawa penjelasan, nanging uga argumen matematika sing ngagetake lan migunani ing wilayah riset inti.

Para tester awal nggunakake GPT‑5.5 Pro ing ChatGPT ora kaya mesin jawaban conto pisanan, nanging luwih kaya mitra riset: ngkritik manuskrip liwat pirang-pirang puteran, nguji ketahanan argumen teknis, ngusulake analisis, lan kerja karo kode, cathetan, lan konteks PDF. Benang umumé yaiku GPT‑5.5 luwih apik kanggo mbantu peneliti maju saka pitakon menyang eksperimen menyang output.

Derya Unutmaz, profesor imunologi lan peneliti ing Jackson Laboratory for Genomic Medicine, nggunakke GPT‑5.5 Pro kanggo nganalisis dataset ekspresi gen kanthi 62 sampel lan meh 28.000 gen, ngasilake laporan riset rinci sing ora mung ngringkes temuané nanging uga ngangkat pitakon lan wawasan utama—karya sing miturut dheweke bakal butuh pirang-pirang wulan kanggo timé.

Bartosz Naskręcki, asisten profesor matematika ing Adam Mickiewicz University ing Poznań, Polandia, nggunakke GPT‑5.5 ing Codex kanggo mbangun app geometri aljabar saka siji prompt sajrone 11 menit, nggambarake irisan permukaan kuadratik lan ngowahi kurva asil dadi model Weierstrass.

Dheweke banjur ngembangake app kasebut kanthi visualisasi singularitas sing luwih stabil lan koefisien pas sing bisa digunakake maneh ing karya sabanjure. Kanggo dheweke, owah-owahan sing luwih gedhe yaiku Codex saiki bisa mbantu ngetrapake visualisasi matematika khusus lan alur kerja aljabar komputer sing sadurunge mbutuhake alat khusus. Bebarengan, conto-conto iki nuduhake GPT‑5.5 ngowahi maksud ahli dadi alat lan analisis riset sing bisa digunakake.

Kredit: Bartosz Naskręcki⁠(mbukak ing jendhela anyar)

Prompt: # Irisan permukaan geometri aljabar

Gawe app sing nggambar loro permukaan kuadratik lan menehi warna abang ing kurva irisane. Gunakake teorema Riemann-Roch komputasional kanggo ngowahi iki dadi kurva Weierstrass.

## Jendhela utama

Loro permukaan berwarna kanthi shading rada transparan, rendering kualitas dhuwur sing beririsan sepanjang kurva aljabar warna abang

Rotasi nganggo mouse ing loro arah, mekanisme pinch lengkap kanggo zoom, pencet haptik kanggo nampilake menu cilik kanthi slider kanggo ngganti koefisien saben permukaan; deteksi liwat level Z-buffor

## Jendhela sisih tengen

Persamaan Weierstrass cekak (ing ndhuwur Q utawa ekstensi medan kuadratik) diitung langsung nganggo rumus teorema Riemann-Roch efektif

## Mode ambient nalika kabeh kontrol didhelikake lan pangguna bisa nikmati endahé wangun-wangun kasebut

## Spesifikasi

App mlaku ing browser, implementasi entheng nganggo pustaka full stack paling anyar, portabel, bisa di-deploy

## Dokumen

Repo Git, jurnal, rencana (berkas Markdown)

“It’s incredibly energizing to use OpenAI’s new GPT-5.5 model in our harness, have it reason over massive biochemical datasets to predict human drug outcomes, and then see it deliver significant accuracy gains on our hardest drug discovery evals. If OpenAI keeps cooking like this, the foundations of drug discovery will change by the end of the year.”

— Brandon White, Co-Founder & CEO at Axiom Bio

Efisiensi inferensi generasi sabanjure

Nglayani GPT‑5.5 kanthi latensi GPT‑5.4 mbutuhake pamikiran ulang babagan inferensi minangka sistem terpadu, dudu kumpulan optimasi sing kapisah. GPT‑5.5 dirancang bareng, dilatih nganggo, lan dilayani ing sistem NVIDIA GB200 lan GB300 NVL72. Codex lan GPT‑5.5 nduweni peran penting kanggo nggayuh target performa kami. Codex mbantu tim maju luwih cepet saka ide menyang implementasi sing bisa dibenchmark, nyusun pendekatan, nyambungake eksperimen, lan mbantu ngenali optimasi endi sing pantes diinvestasi luwih jero. GPT‑5.5 mbantu nemokake lan ngetrapake peningkatan kunci ing stack dhewe. Cekake, model iki mbantu ningkatake infrastruktur sing nglayani awake dhewe.

Salah siji peningkatan kaya ngono yaiku load balancing lan heuristik partitioning. Sadurunge GPT‑5.5, kami mbagi request ing sawijining akselerator dadi jumlah chunk tetep kanggo nyeimbangkan pakaryan antar inti komputasi, supaya request gedhe lan cilik bisa mlaku ing GPU sing padha. Nanging, jumlah chunk statis sing wis ditemtokake sadurunge ora optimal kanggo kabeh bentuk lalu lintas. Supaya GPU bisa dimanfaatake luwih apik, Codex nganalisis pola lalu lintas produksi sajrone pirang-pirang minggu lan nulis algoritma heuristik kustom kanggo mbagi lan nyeimbangkan pakaryan kanthi optimal. Upaya iki menehi dampak gedhe banget, nambah kecepatan generasi token luwih saka 20%.

Majokake cybersecurity kanggo keamanan kabeh wong

Nyiyapake donya kanggo model sing trampil banget nemokake lan nambal kerentanan keamanan iku pakaryan bebarengan lan mbutuhake kabeh ekosistem kerja keras kanggo mbangun ketahanan, kanthi akses model sing didemokratisasi lan deployment iteratif kanggo era sabanjure pertahanan siber⁠.

Model tercanggih dadi saya mumpuni ing cybersecurity. Kapabilitas iki bakal nyebar kanthi wiyar lan kami percaya dalan paling apik yaiku mesthekake yen model kasebut bisa digunakake kanggo nyepetake pertahanan siber lan nguwatake ekosistem.

GPT‑5.5 iku langkah bertahap nanging penting menyang AI sing bisa ngrampungake sawetara tantangan paling angel ing donya kaya cybersecurity. Kanthi GPT‑5.2 ing Desember, kami kanthi proaktif nerapake safeguard siber⁠ sing dibutuhake kanggo mbatesi potensi penyalahgunaan siber saka model-model kami; saiki karo GPT‑5.5, kami nerapake classifier sing luwih ketat kanggo risiko siber potensial sing bisa waé dirasa ngganggu dening sawetara pangguna ing awal, nalika kami nyetelnya saka wektu ke wektu.

Kami wis ngenali cybersecurity minangka kategori ing Kerangka Kesiapan⁠(mbukak ing jendhela anyar) suwene pirang-pirang taun nalika model-model kami saya apik sethithik demi sethithik, bebarengan karo pangembangan lan kalibrasi mitigasi kanthi iteratif, supaya kami bisa kanthi tanggung jawab ngrilis model kanthi kapabilitas cybersecurity sing migunani.

Kami nerapake safeguard terdepan ing industri kanggo tingkat kapabilitas siber iki. Kami pisanan ngenalake safeguard khusus siber nganggo GPT‑5.2⁠(mbukak ing jendhela anyar) taun kepungkur, sing terus kami uji, sempurnakake, lan kembangake ing deployment sabanjure. Kanggo GPT‑5.5, kami ngrancang kontrol sing luwih ketat kanggo aktivitas sing risikone luwih dhuwur, request siber sensitif, lan nambah proteksi kanggo penyalahgunaan sing bola-bali. Akses sing jembar dimungkinkan liwat investasi kami ing safety model, panggunaan terautentikasi, lan pemantauan kanggo panggunaan sing ora diidini. Kami wis kerja bareng ahli eksternal suwene pirang-pirang wulan kanggo ngembangake, nguji, lan ngiterasi ketahanan safeguard iki. Kanthi GPT‑5.5, kami mesthekake pangembang bisa ngamanake kode kanthi gampang, nalika nerapake kontrol sing luwih kuwat ing alur kerja siber sing paling mungkin nyebabake cilaka dening pelaku jahat.
Kami nggedhekake akses kanggo nyepetake pertahanan siber ing saben tingkat. Kami nyedhiyakake model-model kami sing cyber-permissive liwat Trusted Access for Cyber⁠, diwiwiti saka Codex, sing kalebu akses sing luwih jembar menyang kapabilitas cybersecurity tingkat lanjut saka GPT‑5.5 kanthi watesan luwih sithik kanggo pangguna terverifikasi sing nyukupi sinyal kepercayaan⁠(mbukak ing jendhela anyar) tartamtu nalika peluncuran. Organisasi sing tanggung jawab kanggo mbela infrastruktur kritis⁠ bisa ndhaptar kanggo ngakses model cyber-permissive kaya GPT‑5.4‑Cyber, kanthi netepi syarat keamanan sing ketat kanggo nggunakake model-model iki guna ngamanake sistem internal. Iki menehi luwih akeh alat mumpuni marang macem-macem pembela terverifikasi kanggo pakaryan keamanan sing sah kanthi gesekan sing ora perlu luwih sithik supaya akses menyang kapabilitas pertahanan penting bisa didemokratisasi. Pangguna bisa ndhaptar akses tepercaya ing chatgpt.com/cyber⁠(mbukak ing jendhela anyar) kanggo nyuda penolakan sing ora perlu nalika nggunakake GPT‑5.5 kanggo pakaryan pertahanan terverifikasi.
Kami kerja bareng mitra pemerintah kanggo mbantu nglindhungi infrastruktur kritis kanggo publik. Bebarengan, kami njelajah carane AI tingkat lanjut bisa ndhukung pakaryan pertahanan para pejabat tepercaya sing tanggung jawab kanggo sistem sing diandelake masyarakat, wiwit sistem digital sing ngamanake data wajib pajak penting nganti jaringan listrik lan pasokan banyu ing komunitas lokal.

Kami nganggep kapabilitas biologis/kimia lan cybersecurity saka GPT‑5.5 minangka Tinggi miturut Kerangka Kesiapan⁠(mbukak ing jendhela anyar) kami. Sanajan GPT‑5.5 ora tekan tingkat kapabilitas cybersecurity Kritis, evaluasi lan testing kami nuduhake yen kapabilitas cybersecurity-nya munggah tingkat dibandhing GPT‑5.4.

Saliyane iku, GPT‑5.5 liwat proses safety lan tata kelola lengkap sadurunge rilis, kalebu evaluasi kesiapan, testing khusus domain, evaluasi anyar sing ditargetake kanggo kapabilitas biologi lan cybersecurity tingkat lanjut, lan testing sing kuat karo ahli eksternal. Rincian luwih akeh kami bagi ing kertu sistem⁠(mbukak ing jendhela anyar) GPT‑5.5.

Pakaryan iki nggambarake pendekatan ketahanan AI kami sing luwih amba, sing miturut kami dibutuhake nalika kapabilitas model maju. Kami pengin AI sing kuat kasedhiya kanggo wong-wong sing nggunakke kanggo mbela sistem, institusi, lan masyarakat. Dalan sing layak yaiku akses tepercaya, safeguard sing kuat lan bisa ngimbangi kapabilitas, lan kapasitas operasional kanggo ndeteksi lan nanggapi penyalahgunaan serius.

Kasedhiyan lan rega

Ing ChatGPT, GPT‑5.5 Thinking kasedhiya kanggo pangguna Plus, Pro, Business, lan Enterprise. GPT‑5.5 Pro, sing dirancang kanggo pitakon sing luwih angel lan pakaryan akurasi luwih dhuwur, kasedhiya kanggo pangguna Pro, Business, lan Enterprise.

Ing Codex, GPT‑5.5 kasedhiya kanggo paket Plus, Pro, Business, Enterprise, Edu, lan Go kanthi jendhela konteks 400K. GPT‑5.5 uga kasedhiya ing mode Fast, ngasilake token 1,5x luwih cepet kanthi biaya 2,5x.

Kanggo pangembang API, gpt-5.5 bakal enggal kasedhiya ing Responses API lan chat completions API kanthi rega $5 saben 1M token input lan $30 saben 1M token output, kanthi jendhela konteks 1M. Rega Batch lan Flex kasedhiya setengah saka tarif API standar, dene pemrosesan Priority kasedhiya kanthi tarif 2,5x saka standar. Kami uga bakal ngrilis gpt-5.5-pro ing API kanggo akurasi sing luwih dhuwur maneh, kanthi rega $30 saben 1M token input lan $180 saben 1M token output. Delengen kaca rega⁠ kanggo rincian lengkap.

Sanajan rega GPT‑5.5 luwih dhuwur tinimbang GPT‑5.4, model iki luwih cerdas lan uga luwih efisien token. Ing Codex, kami wis nyetel pengalaman iki kanthi teliti supaya GPT‑5.5 menehi asil sing luwih apik kanthi token luwih sithik tinimbang GPT‑5.4 kanggo umume pangguna, nalika tetep nawakake panggunaan sing loma ing macem-macem tingkat langganan.

Evaluasi

Ngoding

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (Publik) *	58.6%	57.7%	-	-	64.3%	54.2%
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (Internal)	73.1%	68.5%	-	-	-	-

^*^{Lab wis nyatakake ana}^{bukti memorisasi}⁠(mbukak ing jendhela anyar)^{ing eval iki}

Profesional

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GDPval (menang utawa seri)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
FinanceAgent v1.1	60.0%	56.0%	-	61.5%	64.4%	59.7%
Tugas Modeling Investment Banking (Internal)	88.5%	87.3%	88.6%	83.6%	-	-
OfficeQA Pro	54.1%	53.2%	-	-	43.6%	18.1%

Panggunaan komputer lan visi

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
OSWorld-Verified	78.7%	75.0%	-	-	78.0%	-
MMMU Pro (tanpa alat)	81.2%	81.2%	-	-	-	80.5%
MMMU Pro (nganggo alat)	83.2%	82.1%	-	-	-	-

Panggunaan alat

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
MCP Atlas**	75.3%	70.6%	-	-	79.1%	78.2%
Toolathlon	55.6%	54.6%	-	-	-	48.8%
Tau2-bench Telecom*** (prompt asli)	98.0%	92.8%	-	-	-	-

^{** MCP Atlas: asil saka Scale AI sawise update paling anyar April 2026.
*** Tau2-bench telecom: asil kanggo 5.5 lan 5.4 nganggo prompt asli yaiku tanpa penyesuaian prompt. Iki ora nyakup asil saka lab liya sing dievaluasi nganggo penyesuaian prompt.}

Akademik

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25.0%	19.0%	33.2%	25.6%	-	-
FrontierMath Tier 1–3	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
FrontierMath Tier 4	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
BixBench	80.5%	74.0%	-	-	-	-
GPQA Diamond	93.6%	92.8%	-	94.4%	94.2%	94.3%
Humanity's Last Exam (tanpa alat)	41.4%	39.8%	43.1%	42.7%	46.9%	44.4%
Humanity's Last Exam (nganggo alat)	52.2%	52.1%	57.2%	58.7%	54.7%	51.4%

Keamanan siber

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Capture-the-Flags challenge tasks (Internal)****	88.1%	83.7%	-	-	-	-
CyberGym	81.8%	79.0%	-	-	73.1%	-

^{**** Pangembangan saka CTF paling angel sing digunakake ing kertu sistem kanthi tantangan angel tambahan.}

Konteks dawa

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k f1	73.7%	62.5%	-	-	76.9%	-
Graphwalks BFS 1jt f1	45.4%	9.4%	-	-	41.2% (Opus 4.6)	-
Graphwalks parents 256k f1	90.1%	82.8%	-	-	93.6%	-
Graphwalks parents 1jt f1	58.5%	44.4%	-	-	72.0% (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K-8K	98.1%	97.3%	-	-	-	-
OpenAI MRCR v2 8-needle 8K-16K	93.0%	91.4%	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96.5%	97.2%	-	-	-	-
OpenAI MRCR v2 8-needle 32K-64K	90.0%	90.5%	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83.1%	86.0%	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87.5%	79.3%	-	-	59.2%	-
OpenAI MRCR v2 8-needle 256K-512K	81.5%	57.5%	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74.0%	36.6%	-	-	32.2%	-

Nalar abstrak

Eval	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (Terverifikasi)	95.0%	93.7%	-	94.5%	93.5%	98.0%
ARC-AGI-2 (Terverifikasi)	85.0%	73.3%	-	83.3%	75.8%	77.1%

Eval GPT dijalanke kanthi reasoning effort disetel menyang xhigh lan ditindakake ing lingkungan riset, sing ing sawetara kasus bisa menehi output sing rada beda saka ChatGPT produksi.