Ana içeriğe atla
OpenAI

17 Mart 2026

ŞirketÜrün

GPT‑5.4 mini ve nano ile tanışın

Kodlama ve alt otonom ajanlar için optimize edilmiş hızlı ve verimli modeller

Yükleniyor...

Bugün şimdiye kadarki en yetenekli küçük modellerimiz olan GPT‑5.4 mini ve nano'yu yayınlıyoruz. Bu modeller, GPT‑5.4'ün birçok güçlü yönünü yüksek hacimli iş yükleri için tasarlanmış daha hızlı ve daha verimli modellere taşıyor.

GPT‑5.4 mini; kodlama, akıl yürütme, çok modlu anlama ve araç kullanımı alanlarında GPT‑5 mini'ye kıyasla önemli iyileştirmeler sunuyor ve iki katından daha hızlı çalışıyor. Ayrıca SWE-Bench Pro ve OSWorld-Verified gibi çeşitli değerlendirmelerde daha büyük GPT‑5.4 modelinin performansına yaklaşıyor.

GPT‑5.4 nano ise hız ve maliyetin en kritik olduğu görevler için GPT‑5.4'ün en küçük ve en uygun maliyetli versiyonudur. Ayrıca GPT‑5 nano'ya göre de önemli bir yükseltme sunar. Bu modeli, sınıflandırma, veri ayıklama, sıralama ve daha basit destek görevlerini yerine getiren kodlama alt otonom ajanları için öneriyoruz.

Bu modeller; gecikmenin doğrudan ürün deneyimini etkilediği iş yükleri için tasarlandı: hızlı yanıt vermesi gereken kodlama asistanları, destek görevlerini hızla tamamlayan alt otonom ajanlar, ekran görüntülerini yakalayıp yorumlayan bilgisayar kullanımı sistemleri ve görüntüler üzerinde gerçek zamanlı akıl yürütebilen çok modlu uygulamalar. Bu tür senaryolarda en iyi model çoğu zaman en büyük model değildir; hızlı yanıt verebilen, araçları güvenilir şekilde kullanabilen ve yine de karmaşık profesyonel görevlerde güçlü performans gösterebilen modeldir.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini için mevcut olan en yüksek akıl yürütme düzeyi "high"dır.

Müşterilerimizin GPT‑5.4 mini ve nano'yu iş akışlarında test ettikten sonra paylaştıkları görüşler:

"GPT-5.4 mini, bu sınıftaki bir model için güçlü uçtan uca performans sunuyor. Değerlendirmelerimizde, çok daha düşük maliyetle birçok çıktı görevi ve alıntı geri çağırma ölçümünde rekabetçi modellerle eşleşti veya onları geride bıraktı. Ayrıca daha büyük GPT-5.4 modeline kıyasla daha yüksek uçtan uca başarı oranları ve daha güçlü kaynak atıfı sağladı."
- Aabhas Sharma, Hebbia Teknoloji Genel Müdür Yardımcısı

Kodlama

GPT‑5.4 mini ve nano, hızlı yinelemelerden fayda sağlayan kodlama iş akışlarında özellikle etkilidir. Model; hedefli düzenlemeler, kod tabanı içinde gezinme, ön uç üretimi ve hata ayıklama döngülerini düşük gecikmeyle yönetir. Bu da onları daha yüksek hızda ve daha düşük maliyetle tamamlanması gereken kodlama görevleri için güçlü bir seçenek haline getirir.

Kıyaslama testlerinde GPT‑5.4 mini, benzer gecikme sürelerinde GPT‑5 mini'yi sürekli olarak geride bırakıp çok daha hızlı çalışırken GPT‑5.4 düzeyindeki başarı oranlarına yaklaşır. Böylece kodlama iş akışları için en güçlü performans-gecikme dengelerinden birini sunar.

Modellerimizin canlı kullanım ortamındaki davranışlarını analiz ederek ve bu davranışı offline simüle ederek gecikmeyi tahmin ediyoruz. Gecikme tahmininde araç çağrısı süresi (örn. kod çalıştırma süresi), örneklenen token'lar ve girdi token'ları dikkate alınır. Gerçek dünyadaki gecikme önemli ölçüde değişkenlik gösterebilir ve simülasyonumuzda yakalanmayan birçok etkene bağlıdır. Benzer şekilde, maliyetler bu modellerin yazının kaleme alındığı tarihteki API fiyatlandırmasına göre tahmin edilmektedir. Maliyetler gelecekte değişebilir. Akıl yürütme işlem düzeyi, low'dan xhigh'a yükseltildi.

Alt otonom ajanlar

GPT‑5.4 mini, farklı boyutlardaki modelleri birleştiren sistemler için de güçlü bir seçenektir. Örneğin, Codex'te, GPT‑5.4 gibi daha büyük bir model planlama, koordinasyon ve nihai değerlendirmeyi üstlenebilirken; bir kod tabanında arama yapmak, büyük bir dosyayı incelemek veya destekleyici belgeleri işlemek gibi daha dar kapsamlı alt görevleri yerine getiren GPT‑5.4 mini alt otonom ajanlara bu işleri paralel olarak devredebilir. Codex'te alt otonom ajanların nasıl çalıştığını belgelerde(yeni bir pencerede açılır) öğrenebilirsiniz.

Küçük modeller daha hızlı ve daha yetenekli hale geldikçe bu yaklaşım daha da faydalı hale gelir. Her şey için tek bir model kullanmak yerine geliştiriciler, büyük modellerin ne yapılacağına karar verdiği ve küçük modellerin bunu ölçekli şekilde hızlıca gerçekleştirdiği sistemler kurabilir. GPT‑5.4 mini, bu tür iş akışları için şimdiye kadarki en güçlü mini modelimizdir.

Bilgisayar kullanımı

GPT‑5.4 mini ayrıca çok modlu görevlerde, özellikle bilgisayar kullanımıyla ilgili olanlarda da güçlüdür. Bu model, yoğun kullanıcı arayüzlerinin ekran görüntülerini hızlıca yorumlayarak bilgisayar kullanımı görevlerini hızla tamamlayabilir. OSWorld-Verified değerlendirmesinde GPT‑5.4 mini, GPT‑5 mini'yi belirgin şekilde geride bırakırken GPT‑5.4 performansına yaklaşmaktadır.

Kullanılabilirlik ve fiyatlandırma

GPT‑5.4 mini bugün API, Codex ve ChatGPT'de kullanılabilir.

API'de GPT‑5.4 mini; metin ve görsel girdilerini, araç kullanımını, fonksiyon çağrısını, web aramasını, dosya aramasını, bilgisayar kullanımını ve becerileri destekler. Bu model, 400K bağlam penceresine sahiptir ve 1 milyon girdi token'ı başına 0,75 $, 1 milyon çıktı token'ı başına ise 4,50 $ maliyetle sunulur.

Codex'te GPT‑5.4 mini; Codex uygulaması, CLI, IDE uzantısı ve web genelinde kullanılabilir. Bu model, GPT‑5.4 kotasının yalnızca %30'unu kullanır; böylece geliştiriciler Codex'te daha basit kodlama görevlerini yaklaşık üçte bir maliyetle hızlıca gerçekleştirebilir. Codex, daha az akıl yürütme gerektiren işlerin daha düşük maliyetli model üzerinde çalıştırılması için GPT‑5.4 mini alt otonom ajanlara da görev devredebilir.

ChatGPT'de GPT‑5.4 mini, + menüsündeki "Thinking" özelliği aracılığıyla Free ve Go kullanıcılarına sunulmaktadır. Diğer tüm kullanıcılar için GPT‑5.4 mini, GPT‑5.4 Thinking için hız sınırı aşıldığında devreye giren bir yedek model olarak kullanılabilir.

GPT‑5.4 nano ise yalnızca API’de sunulmaktadır ve 1 milyon girdi token'ı başına 0,20 $, 1 milyon çıktı token'ı başına ise 1,25 $ maliyete sahiptir.

Modellerin güvenlik önlemleri hakkında daha fazla bilgi için Devreye Alım Güvenlik Merkezimizde(yeni bir pencerede açılır) Sistem Kartı ekine göz atabilirsiniz.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini için mevcut olan en yüksek akıl yürütme düzeyi "high"dır.

2 Genel Düzenleme Mesafesi. OmniDocBench, düşük maliyetli ve düşük gecikmeli performansı yansıtmak amacıyla akıl yürütme düzeyi "none" olarak ayarlanmış şekilde çalıştırıldı.

Yazar

OpenAI