24 Nisan 2026 güncellemesi: GPT‑5.5 ve GPT‑5.5 Pro artık API'de kullanılabilir. Ayrıca uygulanan ek koruma tedbirlerini açıklayan sistem kartı da güncellenmiştir.
Şimdiye kadarki en akıllı ve kullanımı en sezgisel modelimiz olan, bilgisayarda iş yapmanın yeni bir yoluna doğru atılmış bir sonraki adım olan GPT‑5.5'i yayınlıyoruz.
GPT‑5.5, ne yapmaya çalıştığınızı daha hızlı anlar ve işin daha büyük bir kısmını kendi başına üstlenebilir. Kod yazma ve hata ayıklama, online araştırma yapma, veri analizi, doküman ve tablo oluşturma, yazılımları kullanma ve bir görev tamamlanıncaya kadar araçlar arasında ilerleme konularında mükemmeldir. Her adımı dikkatle yönetmek yerine, GPT‑5.5'e dağınık ve çok parçalı bir görev verebilir ve planlama yapmasına, araçları kullanmasına, kendi çıktısını kontrol etmesine, belirsizlik içinde yolunu bulmasına ve süreci sürdürmesine güvenebilirsiniz.
Bu gelişmeler özellikle ajan tabanlı kodlama, bilgisayar kullanımı, bilgiye dayalı işler ve erken aşama bilimsel araştırma gibi alanlarda belirgindir; çünkü bu alanlarda ilerleme, bağlam içinde akıl yürütmeye ve zaman içinde aksiyon almaya bağlıdır. GPT‑5.5, hızdan ödün vermeden bu zeka sıçramasını sunar: daha büyük ve daha yetenekli modeller genellikle daha yavaş çalışırken, GPT‑5.5 gerçek dünya kullanımında token başına gecikme açısından GPT‑5.4 ile benzer performans gösterirken çok daha yüksek bir zeka seviyesinde çalışır. Aynı Codex görevlerini tamamlamak için belirgin şekilde daha az token kullanır; bu da onu hem daha verimli hem de daha yetenekli hale getirir.
GPT‑5.5'i bugüne kadarki en güçlü güvenlik önlemleriyle birlikte yayınlıyoruz; bu önlemler, faydalı kullanım alanlarını korurken kötüye kullanımı azaltmak üzere tasarlanmıştır. Bu modeli, güvenlik ve hazırlık çerçevelerimizin tamamında değerlendirdik, kurum içinde ve dışında yer alan, sistemdeki açıkları ve riskleri ortaya çıkarmaya yönelik stres testi uygulayıcılarıyla çalıştık, gelişmiş siber güvenlik ve biyoloji yetenekleri için hedef odaklı testler ekledik ve yayınlanmadan önce yaklaşık 200 güvenilir erken erişim iş ortağından gerçek kullanım senaryolarına dair geri bildirim topladık.
Bugün GPT‑5.5, ChatGPT ve Codex'te Plus, Pro, Business ve Enterprise kullanıcılarına; GPT‑5.5 Pro ise ChatGPT'de Pro, Business ve Enterprise kullanıcılarına sunuluyor. API devreye alımları farklı güvenlik önlemleri gerektirir ve bunu ölçekli şekilde sunabilmek için güvenlik ve emniyet gereksinimleri konusunda iş ortaklarımız ve müşterilerimizle yakın çalışıyoruz. GPT‑5.5 ve GPT‑5.5 Pro'yu çok yakında API'ye getireceğiz.
GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro | |
Terminal-Bench 2.0 | %82,7 | %75,1 | - | - | %69,4 | %68,5 |
Expert-SWE (Kurum İçi) | %73,1 | %68,5 | - | - | - | - |
GDPval (daha iyi veya eşit performans) | %84,9 | %83,0 | %82,3 | %82,0 | %80,3 | %67,3 |
OSWorld-Verified | %78,7 | %75,0 | - | - | %78,0 | - |
Toolathlon | %55,6 | %54,6 | - | - | - | %48,8 |
BrowseComp | %84,4 | %82,7 | %90,1 | %89,3 | %79,3 | %85,9 |
FrontierMath Tier 1–3 | %51,7 | %47,6 | %52,4 | %50,0 | %43,8 | %36,9 |
FrontierMath Tier 4 | %35,4 | %27,1 | %39,6 | %38,0 | %22,9 | %16,7 |
CyberGym | %81,8 | %79,0 | - | - | %73,1 | - |
OpenAI, ajan tabanlı yapay zeka için küresel altyapıyı inşa ediyor; bu da dünyanın dört bir yanındaki insanların ve işletmelerin yapay zeka ile iş yapmasını mümkün kılıyor. Geçtiğimiz yıl içinde yapay zekanın yazılım mühendisliğini önemli ölçüde hızlandırdığını gördük. Codex ve ChatGPT'de GPT‑5.5 ile bu dönüşüm artık bilimsel araştırma ve bilgisayar üzerinde yapılan daha geniş kapsamlı işlere de yayılmaya başlıyor.
Bu alanların genelinde GPT‑5.5 yalnızca daha akıllı değil; problemler üzerinde çalışma biçiminde de daha verimli; çoğu zaman daha az token ve daha az deneme ile daha yüksek kaliteli çıktılara ulaşıyor. Artificial Analysis Coding Index'te GPT‑5.5, rakip en üst seviye kodlama modellerine kıyasla yarı maliyetle en ileri seviye zeka sunuyor.
Artificial Analysis Zeka Endeksi(yeni bir pencerede açılır), harici bir kuruluş tarafından yürütülen 10 farklı kıyaslamanın ağırlıklı ortalamasıdır: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.
GPT‑5.5, bugüne kadarki en güçlü ajan tabanlı kodlama modelimizdir. Planlama, yineleme ve araç koordinasyonu gerektiren karmaşık komut satırı iş akışlarını test eden Terminal-Bench 2.0'da %82,7 doğrulukla en ileri seviye performans elde ediyor. Gerçek dünyadaki GitHub sorun çözümünü değerlendiren SWE-Bench Pro’da %58,6'ya ulaşarak, önceki modellere kıyasla tek seferde daha fazla görevi uçtan uca çözüyor. Uzun vadeli kodlama görevleri için geliştirdiğimiz ve insan tarafından ortalama tamamlama süresi 20 saat olan dahili en üst seviye değerlendirmemiz Expert-SWE'de GPT‑5.5 yine GPT‑5.4'ü geride bırakıyor.
Bu üç değerlendirmede de GPT‑5.5, daha az token kullanırken GPT‑5.4'ün puanlarını geçiyor.
Modelin kodlama gücü özellikle Codex’te açıkça görülüyor; burada uygulama geliştirme ve yeniden düzenlemeden hata ayıklama, test ve doğrulamaya kadar uzanan mühendislik işlerini üstlenebiliyor. İlk testler, GPT‑5.5'in gerçek mühendislik işlerinin gerektirdiği davranışlarda (örneğin, büyük sistemlerde bağlamı koruma, belirsiz hatalar üzerinde akıl yürütme, araçlarla varsayımları kontrol etme ve değişiklikleri tüm kod tabanına yayma) daha başarılı olduğunu gösteriyor.
Oluşturulan yörünge görselleştirmesi, Orion, Ay ve Güneş için NASA/JPL Horizons vektör verilerini kullanmaktadır; okunabilirliği artırmak için görüntü ölçeklemesi uygulanmıştır.
Prompt: [attached image] Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.
Kıyaslamaların ötesinde, ilk kullanıcılar GPT‑5.5'in bir sistemin yapısını daha iyi anladığını belirtiyor: bir şeyin neden başarısız olduğunu, düzeltmenin nereye uygulanması gerektiğini ve kod tabanının başka hangi bölümlerinin etkileneceğini daha iyi kavrıyor.

"Kullandığım ilk gerçekten güçlü kavramsal netliğe sahip kodlama modeli."
Every'nin Kurucusu ve CEO'su Dan Shipper, GPT‑5.5'i "kullandığım ilk, ciddi düzeyde kavramsal netliğe sahip kodlama modeli" olarak tanımladı.
Bir uygulamayı yayınladıktan sonra, ortaya çıkan bir sorunu çözmek için günlerce hata ayıklama yaptıktan sonra en iyi mühendislerinden birini sistemin bir bölümünü yeniden yazması için görevlendirdi. GPT‑5.5'i test etmek için süreci adeta başa sardı: Model, hatalı durumu inceleyip mühendisin sonunda ulaştığı yeniden yazım çözümünü kendi başına üretebilir miydi? GPT‑5.4 başaramadı. GPT‑5.5 başardı.

"Gerçekten daha üstün bir zihinle çalışıyormuşum gibi hissettiriyor; hatta insanda ister istemez bir saygı duygusu uyandırıyor."
MagicPath CEO'su Pietro Schirano, GPT‑5.5'in yüzlerce ön uç ve yeniden düzenleme değişikliğini içeren bir dalı, önemli ölçüde değişmiş ana dala birleştirdiğinde benzer bir sıçrama gözlemledi; tüm işi tek seferde yaklaşık 20 dakika içinde çözdü.
Modeli test eden kıdemli mühendisler, GPT‑5.5'in akıl yürütme ve otonomi açısından GPT‑5.4 ve Claude Opus 4.7'ye göre belirgin şekilde daha güçlü olduğunu; sorunları önceden fark edebildiğini ve açık bir prompt verilmeden test ve inceleme ihtiyaçlarını öngörebildiğini söylüyor. Bir mühendis, ortak kullanılan bir markdown editöründeki yorum sistemini baştan tasarlamasını istedi. Geri döndüğünde, 12 ayrı değişiklikten oluşan ve neredeyse tamamlanmış bir çalışma hazırdı. Diğer kullanıcılar da uygulama aşamasında şaşırtıcı derecede az düzeltme yapmaları gerektiğini ve GPT‑5.4'e kıyasla GPT‑5.5'in planlarına daha çok güvendiklerini söyledi.
NVIDIA'da modele erken erişimi olan bir mühendis şöyle diyor: "GPT‑5.5'e erişimi kaybetmek, sanki bir uzvumu kaybetmişim gibi hissettiriyor."
"GPT-5.5, GPT-5.4'e kıyasla belirgin şekilde daha akıllı ve işi bırakmadan sürdürme konusunda daha kararlı. Kodlama performansı daha güçlü ve araçları daha güvenilir kullanıyor. Görevi yarıda kesmeden çok daha uzun süre devam edebiliyor; bu da özellikle kullanıcılarımızın Cursor'a devrettiği karmaşık ve uzun soluklu işler için büyük fark yaratıyor."
GPT‑5.5'i kodlama konusunda güçlü kılan aynı özellikler, onu bilgisayarda günlük işler için de güçlü hale getiriyor. Model, niyeti daha iyi anladığı için bilgiye dayalı işlerin tüm döngüsünde daha doğal biçimde ilerleyebilir: bilgiyi bulur, neyin önemli olduğunu anlar, araçları kullanır, çıktıyı kontrol eder ve ham veriyi işe yarar bir sonuca dönüştürür.
Codex'te GPT‑5.5, dokümanlar, tablolar ve sunumlar oluşturma konusunda GPT‑5.4'ten daha başarılıdır. Alpha test kullanıcıları; operasyonel araştırma, tablo modelleme ve dağınık iş girdilerini planlara dönüştürme gibi işlerde önceki modellere kıyasla daha iyi performans gösterdiğini belirtiyor. Codex'in bilgisayar kullanım yetenekleriyle birleştiğinde GPT‑5.5, ekranda olanı algılayıp tıklayarak, yazarak, arayüzlerde gezinerek ve araçlar arasında hassas biçimde geçiş yaparak bilgisayarı gerçekten sizinle birlikte kullanabildiği hissine daha da yaklaşıyor.
OpenAI'daki ekipler bu güçlü yönleri gerçek iş akışlarında şimdiden kullanıyor. Bugün şirketin %85'inden fazlası, yazılım mühendisliği, finans, iletişim, pazarlama, veri bilimi ve ürün yönetimi dahil olmak üzere farklı alanlarda her hafta Codex kullanıyor. İletişim ekibi, GPT‑5.5'i Codex'te kullanarak altı aylık konuşma talebi verisini analiz etti, bir puanlama ve risk çerçevesi oluşturdu ve düşük riskli taleplerin otomatik olarak işlenmesini, yüksek riskli taleplerin ise insan incelemesine yönlendirilmesini sağlayan bir Slack ajanını doğruladı. Finans ekibi, Codex'i kullanarak toplam 71.637 sayfadan oluşan 24.771 adet K-1 vergi formunu inceledi; kişisel bilgileri hariç tutan bir iş akışıyla süreci önceki yıla kıyasla iki hafta hızlandırdı. Pazara Giriş Stratejisi ekibinde bir çalışan, haftalık iş raporlarının oluşturulmasını otomatikleştirerek haftada 5-10 saat tasarruf sağladı.
ChatGPT'de GPT‑5.5 Thinking, daha zor problemler için daha hızlı destek sunar; daha akıllı ve daha net yanıtlarla karmaşık işleri daha verimli şekilde ilerletmenize yardımcı olur. Kodlama, araştırma, bilgi sentezi ve analiz gibi profesyonel işlerde ve doküman ağırlıklı görevlerde öne çıkar; özellikle eklentiler kullanıldığında daha da güçlüdür.
GPT‑5.5 Pro'da ilk test kullanıcıları, ChatGPT'nin üstlenebileceği işlerin hem zorluk seviyesinde hem de kalitesinde belirgin bir sıçrama görüyor; gecikme iyileştirmeleri sayesinde bu model, zorlu görevler için çok daha pratik hale geliyor. GPT‑5.4 Pro ile karşılaştırıldığında test kullanıcıları, GPT‑5.5 Pro'nun yanıtlarının çok daha kapsamlı, iyi yapılandırılmış, doğru, alakalı ve kullanışlı olduğunu belirtiyor; özellikle iş dünyası, hukuk, eğitim ve veri bilimi alanlarında güçlü performans gösteriyor.
GPT‑5.5, bu tür işleri yansıtan birden fazla kıyaslamada en ileri seviye performansa ulaşıyor. 44 farklı meslekte iyi tanımlanmış bilgi işlerini ölçen GDPval kıyaslamasında GPT‑5.5, %84,9 puan alıyor. Bir modelin gerçek bilgisayar ortamlarında kendi başına çalışabilmesini ölçen OSWorld-Verified'da %78,7 puana ulaşıyor. Karmaşık müşteri hizmetleri iş akışlarını test eden Tau2-bench Telecom'da ise prompt ayarlaması olmadan %98,0 puana ulaşıyor. GPT‑5.5, farklı bilgi işi kıyaslamalarında da güçlü performans sergiliyor: FinanceAgent'ta %60,0, kurum içi yatırım bankacılığı modelleme görevlerinde %88,5 ve OfficeQA Pro'da %54,1 puan alıyor.
Tau2-bench Telecom, prompt ayarlaması olmadan (ve kullanıcı modeli olarak GPT‑4.1 ile) çalıştırıldı. GPT‑5.5, görevin amacını daha iyi anlıyor ve önceki versiyonlarına kıyasla token açısından daha verimli.
"GPT-5.5, yoğun uygulama gerektiren görevler için ihtiyaç duyulan sürdürülebilir performansı sunar. NVIDIA'nın GB200 NVL72 sistemleri üzerinde geliştirilen ve çalıştırılan bu model, ekiplerimizin doğal dilde yazılan promptlardan uçtan uca özellikler geliştirmesine olanak tanır; hata ayıklama süresini günlerden saatlere indirir ve karmaşık kod tabanlarında haftalar sürecek denemelerin bir gecede tamamlanmasını sağlar. Bu sadece kod yazmayı hızlandırmakla ilgili değil; insanların çalışma temposunu kökten değiştiren yeni bir çalışma biçimi."
GPT‑5.5, yalnızca zor sorulara yanıt vermenin ötesine geçen bilimsel ve teknik araştırma iş akışlarında da gelişim gösteriyor. Araştırmacıların bir fikri keşfetmesi, kanıt toplaması, varsayımları test etmesi, sonuçları yorumlaması ve sonraki adımı belirlemesi gerekir. GPT‑5.5, bu döngüyü sürdürme konusunda diğer modellere göre daha başarılıdır.
Dikkat çekici biçimde, genetik ve nicel biyolojide çok aşamalı veri analizine odaklanan yeni bir kıyaslama olan GeneBench(yeni bir pencerede açılır)'te GPT‑5.4'e kıyasla belirgin bir ilerleme gösteriyor. Bu problemler, modellerin minimum yönlendirmeyle potansiyel olarak belirsiz veya hatalı veriler üzerinde akıl yürütmesini, gizli karıştırıcı değişkenler veya kalite kontrol (QC) hataları gibi gerçekçi zorluklarla başa çıkmasını ve modern istatistiksel yöntemleri doğru şekilde uygulayıp yorumlamasını gerektirir. Buradaki görevlerin çoğunun bilim insanları için günler süren projelere karşılık geldiği düşünüldüğünde, modelin performansı özellikle dikkat çekicidir.
Benzer şekilde, gerçek dünya biyoinformatik ve veri analizine odaklanan bir kıyaslama olan BixBench(yeni bir pencerede açılır)'te GPT‑5.5, yayınlanmış puanlara sahip modeller arasında en yüksek performansı elde etmiştir. Modelin bilimsel yetenekleri artık biyomedikal araştırmanın ön saflarında ilerlemeyi anlamlı şekilde hızlandırabilecek kadar güçlüdür ve adeta gerçek bir ortak araştırmacı gibi katkı sağlar.
Başka bir örnekte, özel bir çalıştırma düzeneğiyle kullanılan GPT‑5.5'in kurum içi bir versiyonu, kombinatoriğin temel kavramlarından biri olan Ramsey sayıları hakkında yeni bir kanıt(yeni bir pencerede açılır) keşfedilmesine yardımcı oldu. Kombinatorik; grafikler, ağlar, kümeler ve desenler gibi ayrık yapıların nasıl bir araya geldiğini inceler. Ramsey sayıları, kabaca, bir ağın belirli bir düzenin ortaya çıkmasının garanti edilmesi için ne kadar büyük olması gerektiğini sorar. Bu alandaki sonuçlar nadirdir ve çoğu zaman teknik olarak zordur. Burada GPT‑5.5, çapraz Ramsey sayılarıyla ilgili uzun süredir bilinen bir asimptotik olgunun kanıtını bulmuş, bu sonuç daha sonra Lean'da doğrulanmıştır. Bu sonuç, GPT‑5.5'in yalnızca kod veya açıklama üretmekle kalmayıp, temel bir araştırma alanında şaşırtıcı ve faydalı bir matematiksel katkı sağlayabildiğine dair somut bir örnektir.
İlk test kullanıcıları, ChatGPT'de GPT‑5.5 Pro'yu tek seferlik yanıt veren bir sistemden çok bir araştırma ortağı gibi kullandı: metinleri çoklu geçişlerle eleştirme, teknik argümanları zorlayarak test etme, analizler önerme ve kod, notlar ile PDF bağlamı üzerinde birlikte çalışma gibi. Ortak nokta, GPT‑5.5'in araştırmacıların sorudan deneye, deneyden çıktıya ilerlemesine daha iyi yardımcı olmasıdır.
Derya Unutmaz, Jackson Laboratory for Genomic Medicine'de görev yapan bir immünoloji profesörü ve araştırmacı olarak, 62 örnek ve yaklaşık 28.000 geni içeren bir gen ifade veri setini analiz etmek için GPT‑5.5 Pro'yu kullandı; model, bulguları özetlemekle kalmayıp önemli soruları ve analizleri de ortaya koyan detaylı bir araştırma raporu üretti. Kendisinin belirttiğine göre bu çalışma normalde ekibinin aylarını alacak bir işti.
Poznań, Polonya'daki Adam Mickiewicz Üniversitesi'nde matematik doçenti olan Bartosz Naskręcki, GPT‑5.5'i Codex'te kullanarak tek bir prompt ile 11 dakika içinde bir cebirsel geometri uygulaması geliştirdi; bu uygulama kuadratik yüzeylerin kesişimini görselleştiriyor ve ortaya çıkan eğriyi Weierstrass modeline dönüştürüyor.
Daha sonra uygulamayı, daha kararlı tekillik görselleştirmeleri ve sonraki çalışmalarda yeniden kullanılabilecek kesin katsayılarla genişletti. Ona göre asıl fark, Codex'in artık daha önce özel araçlar gerektiren özelleştirilmiş matematiksel görselleştirme ve bilgisayarlı cebir iş akışlarını da hayata geçirebilmesi. Tüm bu örnekler birlikte, GPT‑5.5'in uzmanların zihnindeki fikirleri doğrudan çalışan araştırma araçlarına ve analizlere dönüştürebildiğini gösteriyor.

Kaynak: Bartosz Naskręcki(yeni bir pencerede açılır)
Prompt: # Algebraic geometry surface intersection
Make an app which draws two quadratic surfaces and colors in red the intersection curve. Use computational Riemann-Roch theorem to convert this into Weierstrass curve.
## Main window
Two tinted surfaces with a slightly transparent shading, high quality rendering intersect along a red colored algebraic curve
Rotation with mouses in both directions, full pinch mechanism for zoom, haptic press to show the little menu with sliders for changing the coefficients of each surface; detection via Z-buffor level
## Side right window
Short Weierstrass equation (over Q or quadratic field extension) computed on the go via effective Riemann-Roch theorem formulas
## Ambient mode where all the controls are hidden and the user can admire the beauty of the shapes
## Specs
App is running in the browser, light-weight implementation with full stack newest libraries, portable, deployable
## Docs
Git repo, journal, plan (Markdown files)
"OpenAI’ın yeni GPT-5.5 modelini sistemlerimizde kullanmak inanılmaz derecede heyecan verici; modelin büyük biyokimyasal veri setleri üzerinde akıl yürüterek insanlarda ilaç sonuçlarını tahmin edebilmesi ve en zorlu ilaç keşfi değerlendirmelerimizde belirgin doğruluk artışları sağlaması gerçekten etkileyici. OpenAI bu hızla gelişmeye devam ederse, yıl sonuna kadar ilaç keşfinin temelleri değişebilir."
GPT‑5.5'i GPT‑5.4 ile aynı gecikme seviyesinde sunabilmek, çıkarımı birbirinden bağımsız optimizasyonlar yerine entegre bir sistem olarak yeniden düşünmeyi gerektirdi. GPT‑5.5, NVIDIA GB200 ve GB300 NVL72 sistemleri için birlikte tasarlandı, bu sistemlerle eğitildi ve bu altyapı üzerinde sunuluyor. Codex ve GPT‑5.5, performans hedeflerimize ulaşmamızda kritik rol oynadı. Codex, ekibin fikirden ölçülebilir uygulamaya daha hızlı ilerlemesine yardımcı oldu; yaklaşımların tasarlanması, deneylerin kurulması ve hangi optimizasyonların daha derin yatırım gerektirdiğinin belirlenmesinde destek sağladı. GPT‑5.5 ise doğrudan altyapı katmanında önemli iyileştirmelerin bulunmasına ve uygulanmasına yardımcı oldu. Basitçe ifade etmek gerekirse, model onu çalıştıran altyapının da iyileştirilmesine katkı sağladı.
Bu iyileştirmelerden biri, yük dengeleme ve iş bölme sezgisel yöntemleriydi. GPT‑5.5'ten önce, bir hızlandırıcı üzerindeki istekleri işlem çekirdekleri arasında dengelemek için sabit sayıda parçalara bölüyorduk; bu sayede büyük ve küçük istekler aynı GPU üzerinde çalışabiliyordu. Ancak önceden belirlenmiş sabit parça sayısı, tüm trafik türleri için optimal değildir. GPU'ları daha verimli kullanmak için Codex, haftalar süren üretim trafiği desenlerini analiz etti ve işleri en iyi şekilde bölmek ve dengelemek için özel sezgisel algoritmalar geliştirdi. Bu çalışma, token üretim hızlarını %20'den fazla artırarak büyük bir etki yarattı.
Güvenlik açıklarını tespit etme ve kapatma konusunda çok başarılı olan modellerin dünyaya hazırlanması, bir ekip işidir ve dayanıklılığı artırmak için tüm ekosistemin birlikte çalışmasını gerektirir; bu da gelecek siber savunma çağında model erişiminin daha geniş kitlelere açılmasını ve yinelemeli şekilde devreye alınmasını kapsar.
En üst seviye modeller, siber güvenlik alanında giderek daha yetkin hale geliyor. Bu yetenekler geniş ölçekte yaygınlaşacak ve biz de en doğru ilerleme yolunun, bunların siber savunmayı hızlandırmak ve ekosistemi güçlendirmek için kullanılmasını sağlamak olduğuna inanıyoruz.
GPT‑5.5, siber güvenlik gibi dünyanın en zorlu sorunlarından bazılarını çözebilecek yapay zekaya doğru atılmış kademeli ama önemli bir adımdır. Aralık ayında GPT‑5.2 ile, modellerimizin potansiyel kötüye kullanımını sınırlamak için gerekli siber güvenlik tedbirlerini proaktif olarak devreye aldık; şimdi GPT‑5.5 ile zaman içinde ayarlayacağımız daha sıkı risk sınıflandırıcılarını devreye alıyoruz. Bazı kullanıcılar bunu başlangıçta kısıtlayıcı bulabilir.
Modellerimiz geliştikçe, siber güvenliği yıllardır Risklere Hazırlık Çerçevesi(yeni bir pencerede açılır) kapsamında ayrı bir kategori olarak ele alıyoruz; aynı zamanda anlamlı siber güvenlik yeteneklerine sahip modelleri sorumlu şekilde yayınlayabilmek için risk azaltıcı önlemleri yinelemeli olarak geliştirip kalibre ediyoruz.
- Bu düzeydeki siber yetenekler için sektör lideri güvenlik tedbirlerini devreye alıyoruz. Geçtiğimiz yıl GPT‑5.2(yeni bir pencerede açılır) ile siber güvenliğe özel önlemleri ilk kez tanıttık ve sonraki devreye alımlarda bunları test etmeye, iyileştirmeye ve geliştirmeye devam ettik. GPT‑5.5 için, daha yüksek riskli faaliyetler ve hassas siber talepler etrafında daha sıkı kontroller tasarladık ve tekrar eden kötüye kullanımlara karşı ek korumalar ekledik. Model güvenliği, kimliği doğrulanmış kullanım ve uygunsuz kullanımı izleme konusundaki yatırımlarımız sayesinde geniş kapsamlı erişim mümkün oluyor. Bu güvenlik tedbirlerinin dayanıklılığını geliştirmek, test etmek ve yinelemek için aylardır kurum dışı uzmanlarla birlikte çalışıyoruz. GPT‑5.5 ile geliştiricilerin kodlarını kolayca güvence altına alabilmesini sağlarken, kötü niyetli aktörlerin zarar verme olasılığı en yüksek olan siber iş akışları etrafında daha güçlü kontroller uyguluyoruz.
- Siber savunmayı her seviyede hızlandırmak için erişimi genişletiyoruz. Siber kullanım açısından daha esnek olan modellerimizi, Siber Ortam için Güvenilir Erişim aracılığıyla kullanıma sunuyoruz; başlangıçta Codex ile birlikte, belirli güven sinyallerini(yeni bir pencerede açılır) karşılayan doğrulanmış kullanıcılar için daha az kısıtlamayla GPT‑5.5'in gelişmiş siber güvenlik yeteneklerine genişletilmiş erişim sağlanıyor. Kritik altyapıyı savunmaktan sorumlu kuruluşlar, kurum içi sistemlerini güvence altına almak amacıyla bu modelleri kullanabilmek için sıkı güvenlik gereksinimlerini karşılayarak GPT‑5.4‑Cyber gibi siber odaklı modellere erişim başvurusunda bulunabilir. Bu yaklaşım, doğrulanmış savunucuların meşru güvenlik çalışmaları için daha yetkin araçlara daha az gereksiz engelle erişmesini sağlar ve önemli savunma yeteneklerine erişimi daha geniş kitlelere açmayı hedefler. Kullanıcılar, doğrulanmış savunma çalışmaları için GPT‑5.5 kullanırken gereksiz reddedilmeleri azaltmak amacıyla chatgpt.com/cyber(yeni bir pencerede açılır) adresinden güvenilir erişim başvurusunda bulunabilir.
- Kamuya yönelik kritik altyapıyı korumaya yardımcı olmak için devlet iş ortaklarıyla birlikte çalışıyoruz. Birlikte, vergi verilerini koruyan dijital sistemlerden yerel topluluklardaki enerji şebekeleri ve su altyapılarına kadar insanların güvendiği sistemlerden sorumlu yetkililerin savunma çalışmalarını, gelişmiş yapay zekanın nasıl destekleyebileceğini araştırıyoruz.
GPT‑5.5'in biyolojik/kimyasal ve siber güvenlik yeteneklerini Risklere Hazırlık Çerçevesi(yeni bir pencerede açılır) kapsamında "Yüksek" seviyede değerlendiriyoruz. GPT‑5.5, "Kritik" siber güvenlik yetenek seviyesine ulaşmamış olsa da, yapılan değerlendirmeler ve testler bu alandaki yeteneklerinin GPT‑5.4'e kıyasla geliştiğini gösteriyor.
Ayrıca GPT‑5.5, yayınlanmadan önce risklere hazırlık değerlendirmeleri, alana özel testler, gelişmiş biyoloji ve siber güvenlik yeteneklerine yönelik yeni hedefli değerlendirmeler ve kurum dışı uzmanlarla yapılan kapsamlı testler gibi tüm güvenlik ve yönetişim süreçlerimizden geçirilmiştir. Daha fazla detayı GPT‑5.5 sistem kartında(yeni bir pencerede açılır) paylaşıyoruz.
Bu çalışma, model yetenekleri geliştikçe gerekli olduğuna inandığımız daha geniş kapsamlı yapay zeka dayanıklılığı yaklaşımımızı yansıtmaktadır. Güçlü yapay zekanın; sistemleri, kurumları ve kamuoyunu savunmak için onu kullanan kişilerin erişimine açık olmasını istiyoruz. Uygulanabilir yol; güvenilir erişim, yeteneklerle birlikte ölçeklenen güçlü koruma önlemleri ve ciddi kötüye kullanımları tespit edip yanıtlayabilecek operasyonel kapasitedir.
Bugün GPT‑5.5; ChatGPT ve Codex'te Plus, Pro, Business ve Enterprise kullanıcılarına; GPT‑5.5 Pro ise ChatGPT'de Pro, Business ve Enterprise kullanıcılarına sunuluyor. GPT‑5.5 ve GPT‑5.5 Pro'yu çok yakında API'ye getireceğiz.
ChatGPT'de GPT‑5.5 Thinking; Plus, Pro, Business ve Enterprise kullanıcılarına sunuluyor. Daha zor sorular ve daha yüksek doğruluk gerektiren işler için tasarlanan GPT‑5.5 Pro; Pro, Business ve Enterprise kullanıcılarına sunuluyor.
Codex'te GPT‑5.5; Plus, Pro, Business, Enterprise, Edu ve Go planlarında 400K bağlam penceresiyle kullanılabilir. GPT‑5.5, Hızlı modda da da kullanılabilir; 2,5 kat maliyetle 1,5 kat daha hızlı token üretir.
API geliştiricileri için gpt-5.5 yakında Responses ve Chat Completions API'lerinde, 1 milyon bağlam penceresiyle, 1 milyon girdi token'ı için 5 $ ve 1 milyon çıktı token'ı için 30 $ fiyatlandırmayla sunulacak. Toplu ve Esnek fiyatlandırma seçenekleri, standart API ücretinin yarısı oranında sunulurken; Öncelikli işlem, standart ücretin 2,5 katı oranında sunulmaktadır. Daha yüksek doğruluk için gpt-5.5-pro'yu da API'de yayınlayacağız; fiyatlandırması 1 milyon girdi token'ı için 30 $ ve 1 milyon çıktı token'ı için 180 $ olacaktır. Tüm ayrıntılar için fiyatlandırma sayfasını inceleyin.
GPT‑5.5, GPT‑5.4'ten daha yüksek fiyatlandırılmış olsa da hem daha akıllıdır hem de token açısından çok daha verimlidir. Codex'te, çoğu kullanıcı için GPT‑5.5'in GPT‑5.4'e kıyasla daha az token kullanarak daha iyi sonuçlar vermesini sağlamak üzere deneyimi dikkatle optimize ettik; abonelik seviyeleri genelinde cömert kullanım sunmaya da devam ediyoruz.
Kodlama
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
SWE-Bench Pro (Herkese Açık) * | %58,6 | %57,7 | - | - | %64,3 | %54,2 |
Terminal-Bench 2.0 | %82,7 | %75,1 | - | - | %69,4 | %68,5 |
Expert-SWE (Kurum İçi) | %73,1 | %68,5 | - | - | - | - |
*Labs bu değerlendirmede ezberleme kanıtı(yeni bir pencerede açılır) olduğunu tespit etmiştir
Profesyonel
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GDPval (daha iyi veya eşit performans) | %84,9 | %83,0 | %82,3 | %82,0 | %80,3 | %67,3 |
FinanceAgent v1.1 | %60,0 | %56,0 | - | %61,5 | %64,4 | %59,7 |
Yatırım Bankacılığı Modelleme Görevleri (Dahili) | %88,5 | %87,3 | %88,6 | %83,6 | - | - |
OfficeQA Pro | %54,1 | %53,2 | - | - | %43,6 | %18,1 |
Bilgisayar kullanımı ve görme
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
OSWorld-Verified | %78,7 | %75,0 | - | - | %78,0 | - |
MMMU Pro (araçsız) | %81,2 | %81,2 | - | - | - | %80,5 |
MMMU Pro (araçlı) | %83,2 | %82,1 | - | - | - | - |
Araç kullanımı
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
BrowseComp | %84,4 | %82,7 | %90,1 | %89,3 | %79,3 | %85,9 |
MCP Atlas** | %75,3 | %70,6 | - | - | %79,1 | %78,2 |
Toolathlon | %55,6 | %54,6 | - | - | - | %48,8 |
Tau2-bench Telecom*** | %98,0 | %92,8 | - | - | - | - |
** MCP Atlas: en son Nisan 2026 güncellemesinin ardından Scale AI sonuçları.
*** Tau2-bench Telecom: orijinal promptlarla, başka bir deyişle promptlarla herhangi bir ayarlama yapılmadan elde edilen 5.5 ve 5.4 sonuçları. Bu, prompt ayarlamalarıyla değerlendirilen diğer laboratuvarların sonuçlarını içermez.
Akademik
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
GeneBench | %25,0 | %19,0 | %33,2 | %25,6 | - | - |
FrontierMath Tier 1–3 | %51,7 | %47,6 | %52,4 | %50,0 | %43,8 | %36,9 |
FrontierMath Tier 4 | %35,4 | %27,1 | %39,6 | %38,0 | %22,9 | %16,7 |
BixBench | %80,5 | %74,0 | - | - | - | - |
GPQA Diamond | %93,6 | %92,8 | - | %94,4 | %94,2 | %94,3 |
Humanity's Last Exam (araçsız) | %41,4 | %39,8 | %43,1 | %42,7 | %46,9 | %44,4 |
Humanity's Last Exam (araçlı) | %52,2 | %52,1 | %57,2 | %58,7 | %54,7 | %51,4 |
Siber güvenlik
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Capture-the-Flag (Bayrak Kapmaca) yarışma görevleri (Kurum İçi)**** | %88,1 | %83,7 | - | - | - | - |
CyberGym | %81,8 | %79,0 | - | - | %73,1 | - |
**** Sistem kartlarında kullanılan en zorlu CTF'lerin, ek olarak daha da zorlayıcı görevlerle genişletilmiş bir versiyonu.
Uzun bağlam
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
Graphwalks BFS 256.000 f1 | %73,7 | %62,5 | - | - | %76,9 | - |
Graphwalks BFS 1 milyon f1 | %45,4 | %9,4 | - | - | %41,2 (Opus 4.6) | - |
Graphwalks üst düğüm 256.000 f1 | %90,1 | %82,8 | - | - | %93,6 | - |
Graphwalks üst düğüm 1 milyon f1 | %58,5 | %44,4 | - | - | %72,0 (Opus 4.6) | - |
OpenAI MRCR v2 8-needle 4000-8000 | %98,1 | %97,3 | - | - | - | - |
OpenAI MRCR v2 8-needle 8000-16.000 | %93,0 | %91,4 | - | - | - | - |
OpenAI MRCR v2 8-needle 16.000-32.000 | %96,5 | %97,2 | - | - | - | - |
OpenAI MRCR v2 8-needle 32.000-64.000 | %90,0 | %90,5 | - | - | - | - |
OpenAI MRCR v2 8-needle 64.000-128.000 | %83,1 | %86,0 | - | - | - | - |
OpenAI MRCR v2 8-needle 128.000-256.000 | %87,5 | %79,3 | - | - | %59,2 | - |
OpenAI MRCR v2 8-needle 256.000-512.000 | %81,5 | %57,5 | - | - | - | - |
OpenAI MRCR v2 8-needle 512.000-1 milyon | %74,0 | %36,6 | - | - | %32,2 | - |
Soyut akıl yürütme
Değerlendirme | GPT‑5.5 | GPT‑5.4 | GPT‑5.5 Pro | GPT‑5.4 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
ARC-AGI-1 (Verified) | %95,0 | %93,7 | - | %94,5 | %93,5 | %98,0 |
ARC-AGI-2 (Verified) | %85,0 | %73,3 | - | %83,3 | %75,8 | %77,1 |
GPT değerlendirmeleri, akıl yürütme seviyesi xhigh olarak ayarlanmış bir araştırma ortamında gerçekleştirildi. Bu nedenle bazı durumlarda canlı kullanımdaki ChatGPT'den biraz farklı sonuçlar verebilir.








