Bugün, GPT‑5.3‑Codex'in daha küçük bir versiyonu olan GPT‑5.3‑Codex‑Spark'ın araştırma önizlemesini yayınlıyoruz. Bu model, gerçek zamanlı kodlama için tasarlanan ilk modelimizdir. Codex-Spark, Ocak ayında duyurduğumuz Cerebras iş birliğimizdeki ilk dönüm noktasını temsil ediyor. Codex-Spark, ultra düşük gecikmeli donanımda sunulduğunda neredeyse anlık bir deneyim sunacak şekilde optimize edilmiştir ve gerçek dünya kodlama görevlerinde yüksek yetkinliğini korurken saniyede 1000'den fazla token üretebilir.
Codex-Spark'ı ChatGPT Pro kullanıcılarına Cerebras üzerinde bir araştırma önizlemesi olarak sunuyoruz, böylece geliştiriciler erken aşamada denemelere başlayabilir. Bu süreçte, Cerebras ile birlikte veri merkezi kapasitesini artırmak, uçtan uca kullanıcı deneyimini güçlendirmek ve daha büyük en üst seviye modellerimizi devreye almak için çalışıyoruz.
En yeni ve en üst seviye modellerimiz; saatler, günler veya haftalar boyunca müdahale olmadan otonom şekilde çalışarak uzun süreli görevleri yerine getirme konusunda belirgin güçlü yönler göstermiştir. Codex-Spark, Codex ile gerçek zamanlı çalışmak üzere özel olarak tasarlanmış ilk modelimizdir; hedefli düzenlemeler yapmak, mantığı yeniden şekillendirmek veya arayüzleri iyileştirmek ve sonuçları anında görmek için geliştirilmiştir. Codex-Spark ile Codex artık hem uzun vadeli, iddialı görevleri hem de anlık işleri destekliyor. Erişimi kademeli olarak genişletirken, geliştiricilerin ürünü nasıl kullandığını yakından takip etmeyi ve aldığımız geri bildirimleri doğrudan ürüne yansıtmayı hedefliyoruz.
Lansman itibarıyla Codex-Spark, 128 bin bağlam penceresine sahiptir ve yalnızca metin desteklidir. Araştırma önizlemesi süresince Codex-Spark'ın kendine ait hız limitleri olacak ve kullanımı, standart hız limitlerine dahil edilmeyecektir. Ancak talep yüksek olduğunda, kullanıcılar arasında güvenilirliği dengelemek için sınırlı erişim veya geçici kuyruklar görebilirsiniz.
Codex-Spark, gecikmenin en az zeka kadar kritik olduğu etkileşimli çalışmalar için optimize edilmiştir. Modelle gerçek zamanlı şekilde ortak çalışabilir, çalışırken müdahale ederek onu durdurabilir veya yönlendirebilir ve neredeyse anında yanıtlarla hızlıca yineleme yapabilirsiniz. Hız odaklı tasarımı nedeniyle Codex-Spark, varsayılan olarak daha hafif bir çalışma stili benimser: Minimum ve hedefli düzenlemeler yapar; siz özellikle talep etmedikçe otomatik olarak test çalıştırmaz.
Codex-Spark, hızlı çıkarım için optimize edilmiş, yüksek yetkinliğe sahip kompakt bir modeldir. Otonom ajan tabanlı yazılım mühendisliği yeteneklerini değerlendiren iki kıyaslama ölçütü olan SWE-Bench Pro ve Terminal-Bench 2.0'da GPT‑5.3‑Codex‑Spark, görevleri GPT‑5.3‑Codex'e kıyasla çok daha kısa sürede tamamlarken güçlü bir performans sergiler.
Süre, şu bileşenlerin toplamı olarak tahmin edilir: (1) çıktı üretim süresi (çıktı token'ları ÷ örnekleme hızı), (2) ön işleme süresi (ön işleme token'ları ÷ ön işleme hızı), (3) toplam araç çalıştırma süresi ve (4) toplam ağ ek yükü.
Codex-Spark’ı geliştirirken, gerçek zamanlı ortak çalışmada yalnızca model hızının yeterli olmadığını gördük; uçtan uca istek-yanıt hattındaki gecikmeyi de azaltmamız gerekiyordu. Tüm modellere fayda sağlayacak uçtan uca gecikme iyileştirmelerini altyapımıza entegre ettik. Arka planda; yanıtların istemci ile sunucu arasında aktarım sürecini sadeleştirdik, çıkarım altyapımızın temel bileşenlerini yeniden yazdık ve oturum başlatma mekanizmasını yeniden yapılandırdık. Böylece ilk görünür token daha erken üretiliyor ve Codex yineleme yaptıkça kesintisiz biçimde yanıt vermeye devam ediyor. Kalıcı bir WebSocket bağlantısının devreye alınması ve Responses API içinde yapılan hedefli optimizasyonlar sayesinde; istemci-sunucu arasındaki her gidiş-dönüşte oluşan ek yükü %80, token başına ek yükü %30 ve ilk token'a ulaşma süresini %50 oranında azalttık. WebSocket yolu, Codex-Spark için varsayılan olarak etkindir ve yakında tüm modeller için varsayılan olacaktır.
Codex-Spark, Cerebras'ın Wafer Scale Engine 3(yeni bir pencerede açılır) altyapısı üzerinde çalışır. Bu sistem, yüksek hızlı çıkarım için özel olarak tasarlanmış bir yapay zeka hızlandırıcısıdır ve Codex'e gecikme odaklı bir servis katmanı sağlar. Cerebras ile iş birliği yaparak bu düşük gecikmeli hattı mevcut üretim servis altyapımıza entegre ettik. Böylece Codex genelinde sorunsuz bir deneyim sunarken, aynı zamanda gelecekteki modeller için ölçeklenebilir bir temel oluşturduk.
"GPT-5.3-Codex-Spark hakkında bizi en çok heyecanlandıran nokta, OpenAI ve geliştirici topluluğuyla birlikte hızlı çıkarımın sunduğu olanakları keşfetmek; bu sayede ortaya çıkabilecek yeni etkileşim biçimlerini, yeni kullanım senaryolarını ve temelden farklı bir model deneyimini birlikte şekillendirmektir. Bu önizleme, yolculuğun yalnızca ilk adımıdır."
GPU'lar; eğitim ve çıkarım süreçlerimizin temelini oluşturmaya devam eder ve geniş ölçekli kullanım için en uygun maliyetli token üretimini sağlar. Cerebras ise son derece düşük gecikme gerektiren iş akışlarında üstün performans göstererek bu altyapıyı tamamlar. Sonuç olarak uçtan uca döngü daha da sıkılaşır ve siz yineleme yaptıkça Codex daha hızlı ve daha duyarlı hale gelir. GPU'lar ve Cerebras, en iyi performansı elde etmek için tekil iş yüklerinde birleştirilebilir.
Codex-Spark bugün Codex uygulamasının, CLI'nın ve VS Code uzantısının en son versiyonunda tüm ChatGPT Pro kullanıcıları için araştırma önizlemesi olarak kullanıma sunuluyor. Özel düşük gecikmeli donanım üzerinde çalıştığı için kullanım, araştırma önizlemesi süresince talebe bağlı olarak ayarlanabilen ayrı bir hız limitiyle yönetilecektir. Ayrıca, geliştiricilerin Codex-Spark'ı ürünlerine nasıl entegre etmek istediklerini anlamak amacıyla, sınırlı sayıda tasarım ortağı için Codex-Spark'ı API üzerinden erişime açıyoruz. Gerçek iş yükleri altında entegrasyonumuzu geliştirmeye devam ederken, önümüzdeki haftalarda erişimi genişleteceğiz.
Codex-Spark şu anda yalnızca metin desteklidir, 128 bin bağlam penceresine sahiptir ve ultra hızlı model ailesinin ilk üyesidir. Geliştirici topluluğuyla birlikte hızlı modellerin kodlama alanında nerede öne çıktığını daha iyi anladıkça, daha büyük modeller, daha uzun bağlam uzunlukları ve çok modlu giriş dahil olmak üzere ek yetenekler sunacağız.
Codex-Spark, ana model ailemizle aynı güvenlik eğitimini içerir; buna siber güvenlikle ilgili eğitimler de dahildir. Codex-Spark'ı, siber güvenlik ve diğer yeteneklere ilişkin temel değerlendirmeleri kapsayan standart dağıtım sürecimizin bir parçası olarak inceledik. Yapılan değerlendirmeler sonucunda, modelin siber güvenlik veya biyoloji alanında yüksek yetkinlik için belirlediğimiz Risklere Hazırlık Çerçevesi eşiğine ulaşmasının makul bir olasılık olmadığı sonucuna vardık.
Codex-Spark, iki tamamlayıcı moda sahip bir Codex vizyonuna doğru atılmış ilk adımdır: uzun vadeli akıl yürütme ve çalıştırma ile hızlı yineleme için gerçek zamanlı iş birliği. Zamanla bu modlar birleşecek. Codex, daha uzun süren işleri arka plandaki alt ajanlara devrederken sizi sıkı bir etkileşim döngüsünde tutabilir veya genişlik ve hız istediğinizde görevleri paralel olarak birçok modele dağıtabilir; böylece baştan tek bir mod seçmek zorunda kalmazsınız.
Modeller daha yetkin hale geldikçe, etkileşim hızı belirgin bir darboğaz haline gelir. Ultra hızlı çıkarım, etkileşim döngüsünü sıkılaştırır; bu da Codex'in kullanılmasını daha doğal hissettirir ve bir fikri çalışan bir yazılıma dönüştürmek isteyen herkes için nelerin mümkün olabileceğinin sınırını genişletir.


