Geliştiriciler için GPT‑5.1 ile tanışın
Bugün, API platformunda GPT‑5.1'i kullanıma sunuyoruz. GPT‑5 serisinin en yeni modeli olan GPT‑5.1, çok çeşitli otonom ve kodlama görevlerinde zekayı ve hızı dengeli bir şekilde bir araya getiriyor. Görevin karmaşıklığına göre düşünme süresini dinamik olarak ayarlayarak özellikle daha basit günlük işlemlerde çok daha hızlı ve token açısından verimli çalışıyor. Ayrıca, derin muhakeme gerektirmeyen görevlerde yanıt hızını artıran bir "akıl yürütme olmadan çalışan" mod da sunuyor ve bunu yaparken GPT‑5.1'in gelişmiş yeteneklerini korumaya devam ediyor.
GPT‑5.1'i daha da verimli hale getirmek için, önbelleğe alınmış istemlerin 24 saate kadar saklanabildiği genişletilmiş istem önbelleğe alma özelliğini de yayınlıyoruz. Bu özellik, takip sorularında hem daha hızlı hem de daha düşük maliyetli yanıtlar sağlıyor. Öncelikli İşlem(yeni bir pencerede açılır) müşterilerimiz de GPT‑5'e kıyasla GPT‑5.1'de belirgin şekilde daha hızlı performans deneyimleyecek.
Kodlama tarafında ise Cursor, Cognition, Augment Code, Factory ve Warp gibi startup'lar ile yakın temas halinde çalışarak GPT‑5.1'in kodlama kişiliğini, yönlendirilebilirliğini ve ürettiği kod kalitesini iyileştirdik. Genel olarak GPT‑5.1, kodlamayı çok daha akıcı ve anlaşılır bir deneyim haline getiriyor; görevleri tamamlarken kullanıcıya sunduğu ara bildirimlerde de daha net ve güçlü bir iletişim kuruyor.
Son olarak, GPT‑5.1 ile iki yeni araç sunuyoruz: kodu daha güvenilir şekilde düzenlemek için tasarlanan apply_patch aracı ve modele shell komutları çalıştırma yetkisi veren "shell" aracı.
GPT‑5.1, GPT‑5 serisinin geliştirilmiş yeni versiyonu. Geliştiricilerin güvenilir ve otonom is akışları oluşturmasına yardımcı olacak daha zeki ve daha yetenekli modeller geliştirmek üzere yatırım yapmaya devam edeceğiz.
GPT‑5.1’i hızlandırmak için düşünme yönteminin eğitimini uçtan uca yeniledik. Basit görevlerde GPT‑5.1 daha az token harcayarak düşünür; bu da daha hızlı ürün deneyimleri ve daha düşük token maliyetleri sunar. Daha fazla muhakeme gerektiren zor görevlerde ise GPT‑5.1, kararlılığını koruyarak seçenekleri inceler ve kendi çıktısını denetleyerek güvenilirliği en üst düzeye çıkarmaya çalışır.
Balyasny Asset Management(yeni bir pencerede açılır), "GPT‑5.1’in kapsamlı dinamik değerlendirme paketimizde GPT‑4.1 ve GPT‑5’in her ikisinden daha iyi performans gösterdiğini ve bunu GPT‑5'ten 2-3 kat daha hızlı çalışırken başardığını" söyledi. Ayrıca, araç kullanımının yoğun olduğu akıl yürütme görevlerinde GPT‑5.1'in "benzer veya daha iyi kalite sunarken, önde gelen rakiplerin yaklaşık yarısı kadar token kullandığını" da belirtti. Benzer şekilde, yapay zeka destekli sigorta BPO şirketi Pace(yeni bir pencerede açılır) yaptığı testlerde ajanlarının "GPT‑5.1 ile yüzde 50 daha hızlı çalıştığını ve değerlendirmelerimizde GPT‑5'in ve diğer önde gelen modellerin doğruluğunu geçtiğini" bildirdi.
GPT‑5.1, düşünme süresini GPT‑5'e kıyasla daha dinamik şekilde değiştiriyor. ChatGPT görevlerinin temsili bir dağılımında GPT‑5.1, yüksek akıl yürütme düzeyi gerektiren durumlarda bile daha kolay görevlerde çok daha hızlıdır.
Örneğin, "global olarak yüklü paketleri listelemek için bir npm komutu göster" sorusu sorulduğunda GPT‑5.1, yanıtı 10 saniye yerine 2 saniyede veriyor.
GPT-5 (Orta), yaklaşık 250 token kullanır (yaklaşık 10 saniye)
GPT-5.1 (Orta), yaklaşık 50 token kullanır (yaklaşık 2 saniye)
Geliştiriciler artık reasoning_effort değerini 'none' olarak ayarlayarak GPT‑5.1'i akıl yürütme olmadan kullanabilir. Bu ayar, gecikmeye duyarlı senaryolarda modeli akıl yürütme gerektirmeyen bir model gibi davranmaya yönlendirirken, GPT‑5.1'in yüksek zekasını ve güçlü araç çağırma yeteneklerini korur. Akıl yürütme olmadan çalışan GPT‑5.1, GPT‑5'in 'minimum' akıl yürütme moduna kıyasla paralel araç çağırmada (bu da uçtan uca görev tamamlama hızını artırır), kodlama görevlerinde, talimat izleme başarımında ve arama araçlarının kullanımında daha iyi performans gösterir. Ayrıca API platformumuzda web araması(yeni bir pencerede açılır) desteği de sunulur. Sierra(yeni bir pencerede açılır), gerçek dünya değerlendirmelerinde GPT‑5.1'in "akıl yürütme olmadan çalışan" modunun, GPT‑5'in minimum akıl yürütme moduna kıyasla düşük gecikmeli araç çağırma performansında yüzde 20 iyileşme sağladığını bildirdi.
Reasoning_effort için 'none' değerinin sunulmasıyla birlikte geliştiriciler artık kullanım senaryolarında hız, maliyet ve zeka arasında çok daha esnek ve kontrollü bir denge kurabiliyor. GPT‑5.1'de varsayılan değer 'none' olarak belirlenmiştir; bu ayar gecikmeye duyarlı iş yükleri için idealdir. Daha karmaşık görevlerde geliştiricilere 'low' veya 'medium' değerlerini tercih etmelerini; zeka ve güvenilirliğin hızdan daha kritik olduğu durumlarda ise 'high' değerini seçmelerini öneriyoruz.
Genişletilmiş istem önbelleğe alma işlevi, istemlerin birkaç dakikalık mevcut sınır yerine 24 saate kadar önbellekte tutulmasına olanak tanıyarak akıl yürütme verimliliğini artırır. Saklama süresinin uzaması sayesinde daha fazla takip isteği, önbelleğe alınmış bağlamdan yararlanabilir; bu da daha düşük gecikme, daha düşük maliyet ve uzun diyalog şeklindeki sohbetler, kodlama oturumları veya bilgi alma süreçleri gibi uzun süreli etkileşimlerde daha akıcı bir performans sunar.
İstem önbelleği fiyatlandırması değişmedi; önbelleğe alınmış girdi tokenleri, önbelleğe alınmamış tokenlere göre %90 daha ucuzdur ve önbelleğe yazma veya önbellekte depolama için ek bir ücret yoktur. GPT‑5.1 ile genişletilmiş önbelleğe alma işlevini kullanmak için Responses veya Chat Completions API'sine “prompt_cache_retention='24h'” parametresini ekleyin. Daha fazla bilgi için istem önbelleğe alma belgelerine(yeni bir pencerede açılır) göz atabilirsiniz.
GPT‑5.1, GPT‑5'in kodlama yeteneklerini daha yönlendirilebilir bir kodlama kişiliği, daha az gereksiz düşünme, iyileştirilmiş kod kalitesi, araç çağrıları sırasında kullanıcıya yönelik daha iyi ara bildirimler (preamble'lar) ve özellikle düşük akıl yürütme düzeylerinde daha işlevsel arayüz tasarımlarıyla ileri taşıyor.
Hızlı kod düzenlemeleri gibi daha basit görevlerde GPT‑5.1'in artırılmış hızı, ileri geri yinelemeyi çok daha kolay hale getiriyor. Üstelik basit görevlerdeki hız kazancı, zorlu görevlerde performans kaybına neden olmuyor. SWE-bench Verified testinde GPT‑5.1, GPT‑5'ten daha uzun süre çalışarak %76.3 başarı oranına ulaşıyor.
SWE-bench Verified değerlendirmesinde, bir modele bir kod deposu ve bir sorun tanımı verilir ve modelin bu sorunu çözmek için bir patch üretmesi gerekir. Etiketler, kullanılan akıl yürütme düzeyini gösterir. 500 problemin tamamı üzerinden doğruluk ortalaması alınır. Tüm modeller, JSON tabanlı apply_patch aracını içeren bir çalışma ortamı kullanmıştır.
GPT‑5.1 hakkında, çeşitli kodlama şirketlerinden önden geri bildirimler aldık. İşte öne çıkan izlenimler:
- Augment Code(yeni bir pencerede açılır), GPT‑5.1’i "daha az gereksiz işlem yapan, daha bilinçli, daha verimli muhakeme yapan ve göreve daha iyi odaklanan" bir model olarak tanımladı. Ayrıca "daha doğru kod değişiklikleri, daha akıcı pull request'ler ve çok dosyalı projelerde daha hızlı yineleme" elde ettiklerini ifade etti.
- Cline(yeni bir pencerede açılır), kendi değerlendirmelerinde "GPT‑5.1'in diff düzenleme kıyaslamamızda %7'lik bir iyileşmeyle SOTA seviyesine ulaştığını ve karmaşık kodlama görevleri için olağanüstü güvenilirlik gösterdiğini" paylaştı.
- CodeRabbit(yeni bir pencerede açılır), GPT‑5.1'i "PR incelemeleri için en çok tercih ettikleri model" olarak niteledi.
- Cognition(yeni bir pencerede açılır), GPT‑5.1'in "kullanıcının ne istediğini anlamada ve görevi birlikte tamamlama konusunda belirgin şekilde daha başarılı olduğunu" ifade etti.
- Factory(yeni bir pencerede açılır), "GPT‑5.1'in belirgin biçimde daha daha hızlı yanıtlar sunduğunu ve muhakeme derinliğini göreve uyarlayarak gereksiz düşünmeyi azalttığını, böylece genel geliştirici deneyimini iyileştirdiğini" belirtti.
- Warp(yeni bir pencerede açılır), GPT‑5.1'i yeni kullanıcılar için varsayılan model haline getiriyor ve modelin "GPT‑5 serisinin sunduğu etkileyici zeka kazanımlarını geliştirirken çok daha hızlı tepki veren bir model olduğunu" söylüyor.
"GPT-5.1 sıradan bir LLM değil; gerçekten otonom çalışan, şimdiye kadar test ettiğim en doğal otonomiye sahip model. Sizin gibi yazar, sizin gibi kodlar, karmaşık talimatları zahmetsizce takip eder ve mevcut kod tabanınıza sorunsuz bir şekilde uyum sağlayarak özellikle ön uç görevlerde olağanüstü performans gösterir. Responses API içinde gerçek potansiyelini tamamen açığa çıkarabilirsiniz ve bunu IDE'mizde sunmaktan büyük heyecan duyuyoruz."
GPT‑5.1 ile birlikte, geliştiricilerin bu modeli Responses API içinde en verimli şekilde kullanmalarını destekleyen iki yeni araç sunuyoruz: JSON escaping gerektirmeden daha güvenilir kod düzenlemeleri yapmayı sağlayan serbest biçimli apply_patch aracı ve modelin yerel makinenizde çalıştırılacak komutlar üretmesine olanak tanıyan shell aracı.
Serbest biçimli apply_patch aracı, GPT‑5.1'in yapılandırılmış diff’ler kullanarak bir kod tabanındaki dosyaları oluşturmasına, güncellemesine ve silmesine olanak sağlar. Bu model yalnızca düzenleme önerileri sunmakla kalmaz; bir uygulamanın doğrudan uygulayıp geri bildirim verebileceği patch’ler üretir. Bu yaklaşım, yinelemeli ve çok adımlı kod düzenleme iş akışlarını mümkün kılar.
apply_patch aracını Responses API ile kullanmak için, tools dizisine "tools": [{“type”: “apply_patch”}] şeklinde ekleyin ve girdinize dosya içeriğini dahil edin veya modelin dosya sisteminizle etkileşime geçmesi için araçlar sağlayın. Bu model, dosya sisteminiz üzerinde uygulayacağınız diff'leri içeren, dosya oluşturma, güncelleme veya silme amacı taşıyan apply_patch_call öğeleri üretir. Apply_patch aracını nasıl entegre edeceğiniz hakkında daha fazla bilgi için geliştirici belgelerimize(yeni bir pencerede açılır) göz atabilirsiniz.
Shell aracı, modelin kontrollü bir komut satırı arayüzü üzerinden yerel bir bilgisayarla etkileşim kurmasını sağlar. Bu model, shell komutları önerir; geliştiricinin entegrasyonu bu komutları çalıştırır ve çıktıları getirir. Böylece modellerin sistemi incelemesine, yardımcı programları çalıştırmasına ve görevi tamamlayıncaya kadar veri toplamasına imkan tanıyan basit bir planlama-çalıştırma döngüsü oluşturulur.
Geliştiriciler, shell aracını Responses API ile kullanmak "tools": [{“type”: “shell”}] komutuyla bu aracı tools dizisine ekleyebilir. API, çalıştırılması gereken shell komutlarını içeren "shell_call" öğeleri üretir. Geliştiriciler bu komutları yerel ortamlarında çalıştırır ve sonuçları bir sonraki API talebinde "shell_call_output" aracılığıyla geri gönderir. Daha fazla bilgi için geliştirici belgelerimize(yeni bir pencerede açılır) göz atabilirsiniz.
GPT‑5.1 ve gpt-5.1-chat-latest, API'de tüm ücretli katmanlardaki geliştiricilere sunulmaktadır. Fiyatlandırma ve hız limitleri(yeni bir pencerede açılır), GPT‑5 ile aynıdır. Ayrıca API’de gpt-5.1-codex ve gpt-5.1-codex-mini modellerini de kullanıma sunuyoruz. GPT‑5.1 çoğu kodlama görevinde mükemmel performans gösterse de, gpt-5.1-codex modelleri, Codex veya Codex benzeri çalışma ortamlarında uzun süreli ve otonom kodlama görevleri için optimize edilmiştir.
Geliştiriciler, GPT‑5.1 geliştirici belgelerimizi(yeni bir pencerede açılır) ve model yönlendirme (prompting) rehberimizi(yeni bir pencerede açılır) kullanarak oluşturma sürecine başlayabilir. Şu anda API'de GPT‑5'i kullanımdan kaldırmayı planlamıyoruz. Böyle bir karar alınması durumunda geliştiricileri önceden bilgilendireceğiz.
Gerçek anlamda otonom ve kodlamaya odaklı işler için en yetenekli ve en güvenilir modelleri; başka bir deyişle, verimli düşünen, hızlı yineleme yapan, karmaşık görevleri yönetebilen ve geliştiricilerin çalışma akışını kesintiye uğratmadan ilerleyen modelleri kademeli olarak sunma konusunda kararlıyız. Uyarlanabilir akış yürütme, daha güçlü kodlama performansı, daha net kullanıcıya dönük güncellemeler ve apply_patch ve shell gibi yeni araçlarla GPT‑5.1, geliştirme sürecindeki sürtünmeyi azaltacak şekilde tasarlandı. Bu alana yoğun biçimde yatırım yapmayı sürdürüyoruz; önümüzdeki haftalar ve aylarda daha da yetenekli otonom ve kodlama modelleri görmeyi bekleyebilirsiniz.
Değerlendirme | GPT‑5.1 (yüksek) | GPT‑5 (yüksek) |
SWE-bench Verified | %76,3 | %72,8 |
GPQA Diamond | %88,1 | %85,7 |
AIME 2025 | %94,0 | %94,6 |
FrontierMath | %26.7 | %26,3 |
MMMU | %85,4 | %84,2 |
Tau2-bench Airline | %67,0 | %62,6 |
Tau2-bench Telecom* | %95,6 | %96,7 |
Tau2-bench Retail | %77,9 | %81,1 |
BrowseComp Long Context 128k | %90,0 | %90,0 |
* Tau2-bench Telecom için, GPT‑5.1'in performansını artırmak amacıyla kısa ve genel olarak yardımcı bir istem sunduk.


