Ana içeriğe atla
OpenAI

18 Aralık 2025

ÜrünSürümŞirket

GPT‑5.2‑Codex ile Tanışın

Profesyonel yazılım mühendisliği ve savunma amaçlı siber güvenlik için en gelişmiş otonom kodlama modeli.

$ npm i -g @openai/codex

Bugün, karmaşık ve gerçek dünya yazılım mühendisliği için şimdiye kadarki en gelişmiş otonom kodlama modeli olan GPT‑5.2‑Codex'i kullanıma sunuyoruz. GPT‑5.2‑Codex, Codex'te otonom kodlama için özel olarak daha da optimize edilmiş bir GPT‑5.2 versiyonudur. Bu kapsamda; bağlam sıkıştırma sayesinde uzun vadeli çalışmalarda iyileştirmeler, yeniden düzenleme ve geçişler gibi geniş kapsamlı kod değişikliklerinde daha güçlü performans, Windows ortamlarında geliştirilmiş çalışma kabiliyeti ve belirgin biçimde güçlendirilmiş siber güvenlik yetenekleri sunar

Modellerimiz zeka sınırını sürekli olarak ileri taşırken, bu iyileştirmelerin siber güvenlik gibi uzmanlaşmış alanlarda da yetkinlik sıçramalarına dönüştüğünü gözlemliyoruz. Örneğin, daha geçen hafta Codex CLI ile birlikte GPT‑5.1‑Codex‑Max kullanan bir güvenlik araştırmacısı, React'te hizmet reddine veya kaynak kodunun açığa çıkmasına yol açabilecek üç güvenlik açığını tespit etti ve bunları sorumlu biçimde bildirdi(yeni bir pencerede açılır).

GPT‑5.2‑Codex, bugüne kadar kullanıma sunduğumuz tüm modeller arasında en güçlü siber güvenlik yeteneklerine sahiptir. Bu ilerlemeler, siber güvenliği geniş ölçekte güçlendirmeye yardımcı olabilir; ancak aynı zamanda dikkatli bir dağıtım gerektiren yeni çift kullanım risklerini de beraberinde getirir. GPT‑5.2‑Codex, Hazırlık Çerçevemiz (Preparedness Framework) kapsamında siber yetkinlik açısından "Yüksek" düzeye ulaşmamış olsa da, dağıtım yaklaşımımızı gelecekteki yetenek artışlarını göz önünde bulundurarak tasarlıyoruz.

Bu iki unsuru dengelemek amacıyla GPT‑5.2‑Codex’i bugünden itibaren Codex CLI, IDE eklentisi, bulut ortamı ve kod inceleme kapsamlarında, tüm ücretli ChatGPT kullanıcıları için ilk aşamada kullanıma sunuyoruz. Bu süreçte, API üzerinden üçüncü taraf erişimini güvenli biçimde etkinleştirmeye yönelik çalışmalarımızı da sürdürüyoruz. Buna ek olarak, siber savunma alanı için güvenilir erişim üzerinde çalışıyoruz. Bu yaklaşım, doğrulanmış güvenlik uzmanları ve kurumlara gelecekteki gelişmiş yapay zeka siber yeteneklerine kontrollü ve amaca sınırlı erişim sağlayan, yalnızca davetle katılınabilen bir pilot programı kapsıyor. Böylece yetkilendirilmiş savunma odaklı güvenlik çalışmalarının yürütülmesi mümkün olurken, güçlü koruma önlemlerinin korunmasını da hedefliyoruz.

Gerçek dünya yazılım mühendisliğinde sınırları zorluyoruz

GPT‑5.2‑Codex, profesyonel bilgi işleri alanındaki GPT‑5.2'nin güçlü yönleri ile GPT‑5.1‑Codex‑Max'in ileri seviye otonom kodlama ve terminal kullanma yetenekleri üzerine inşa edilmiştir. Geliştirilmiş uzun bağlam anlama, güvenilir araç çağırma, iyileştirilmiş olgusal doğruluk ve yerleşik bağlam sıkıştırma sayesinde GPT‑5.2‑Codex, uzun süreli kodlama görevlerinde daha güvenilir bir iş ortağı haline gelirken, akıl yürütmesinde token verimliliğini de koruyor.

Daha güçlü görsel performans sayesinde GPT‑5.2‑Codex, kodlama oturumları sırasında paylaşılan ekran görüntülerini, teknik diyagramları, grafikleri ve kullanıcı arayüzü (UI) yüzeylerini daha doğru biçimde yorumluyor. Ayrıca GPT‑5.1‑Codex‑Max ile sunulan yeteneklerin üzerine inşa edilerek, yerel Windows ortamlarında otonom kodlama konusunda çok daha etkili ve güvenilir bir performans sunuyor.

GPT‑5.2‑Codex, gerçekçi terminal ortamlarında çok çeşitli görevlerde otonom performansı ölçmek üzere tasarlanmış kıyaslamalar olan SWE-Bench Pro ve Terminal-Bench 2.0'da en ileri düzey performansa ulaşıyor.

Bu iyileştirmeler bir araya geldiğinde, depo (repository) gezintisi ve yeniden düzenlemeden (refactoring), pull request oluşturma ve incelemeye kadar uzanan gerçek dünya yazılım mühendisliği çalışmalarında çok daha güçlü bir performans sağlar.

SWE-Bench Pro⁠⁠⁠⁠'da bir modele bir kod deposu verilir ve modelden gerçekçi bir yazılım mühendisliği görevini çözmek üzere bir yama üretmesi beklenir. Terminal-Bench 2.0, gerçek terminal ortamlarında yapay zeka otonom ajanlarını test etmek için kullanılan bir kıyaslama aracıdır. Görevler arasında kod derleme, modelleri eğitme ve sunucuları kurma yer alır.

<ÖN UÇ HTML VARLIKLARI İÇİN YER TUTUCU>

Gerçek dünyadaki siber yetenekler

Modern toplumlar yazılım üzerine kuruludur ve bu yazılımların güvenilirliği güçlü siber güvenliğe bağlıdır. Bu da bankacılık, sağlık, iletişim ve temel hizmetlerdeki kritik sistemlerin online kalmasını sağlamak, hassas verileri korumak ve insanların her gün kullandıkları yazılımlara güvenle yaklaşabilmesini sağlamak gelir. Güvenlik açıkları, fark edilmeden çok önce var olabilir; bunların bulunması, doğrulanması ve giderilmesi ise çoğu zaman doğru araçlarla donatılmış mühendisler ve bağımsız güvenlik araştırmacılarından oluşan bir topluluğa dayanır.

11 Aralık 2025'te React ekibi, React Server Components kullanılarak geliştirilen uygulamaları etkileyen üç güvenlik açığını kamuoyuna açıkladı. Bu duyuruyu dikkat çekici kılan, yalnızca güvenlik açıklarının kendisi değil, aynı zamanda nasıl ortaya çıkarıldıklarıydı.

Stripe bünyesindeki Privy'de görev yapan güvenlik araştırmacısı Andrew MacPherson, bir hafta önce açıklanan ve React2Shell olarak bilinen ayrı bir kritik React güvenlik açığını yeniden üretmek ve incelemek amacıyla Codex CLI ile birlikte GPT‑5.1‑Codex‑Max ve diğer kodlama otonom ajanlarını kullanıyordu. Amacı, modelin gerçek dünya güvenlik açığı araştırmalarına ne ölçüde katkı sağlayabildiğini değerlendirmekti.

Bunu yapmak için, yerel bir test ortamı kurma, olası saldırı yüzeyleri üzerinden akıl yürütme ve hatalı biçimlendirilmiş girdilerle sistemi yoklamak amacıyla fuzzing kullanma gibi standart savunmacı güvenlik iş akışları boyunca Codex'i yönlendirdi. Orijinal React2Shell(yeni bir pencerede açılır) sorununu yeniden üretmeye çalışırken Codex, daha derinlemesine incelenmesini gerektiren beklenmedik davranışlar ortaya çıkardı. Yalnızca bir hafta içinde bu süreç, daha önce bilinmeyen üç güvenlik açığının keşfedilmesine yol açtı ve bunların tamamı React ekibine sorumlu biçimde bildirildi.

MacPherson, bu bulgulara yol açan Codex oturumlarını da paylaştı; böylece otonom yapay zeka sistemlerinin, güvenlik araştırmacılarının yaygın olarak kullanılan ve üretim ortamındaki yazılımlarda bir hipotezden doğrulanmış bir güvenlik açığına çok daha hızlı ilerlemesine nasıl yardımcı olabildiğine dair somut bir kayıt sunmuş oldu.

İşte o konuşmalardan dikkat çeken alıntılar:

[GÜVENLİK AÇIĞINI KEŞFEDEN YAYIN İÇİN BAĞLANTI EKLEYİN]

Bu durum, gelişmiş yapay zeka sistemlerinin yaygın olarak kullanılan gerçek dünya yazılımlarında savunmacı güvenlik çalışmalarını somut biçimde hızlandırabildiğini göstermektedir. Bununla birlikte, savunucuların daha hızlı ilerlemesini sağlayan bu yeteneklerin, kötüye kullanım için gereken eşiği de düşürebileceği göz önünde bulundurulmalıdır.

Otonom sistemler, siber güvenlikle ilgili görevlerde daha yetkin hale geldikçe, bu ilerlemelerin sorumlu biçimde devreye alınmasını sağlamak temel bir önceliğimiz haline geliyor. Bu doğrultuda, yeteneklerdeki her artışı daha güçlü koruma önlemleri, daha sıkı erişim kontrolleri ve güvenlik topluluğuyla süregelen iş birliğiyle birlikte ele alıyoruz.

Siber ufku genişletiyoruz

Siber güvenliğe yönelik değerlendirmelerimizden birinde zaman içindeki performansı karşılaştırdığımızda, GPT‑5‑Codex ile birlikte yeteneklerde keskin bir artış, GPT‑5.1‑Codex‑Max ile bir başka büyük sıçrama ve GPT‑5.2‑Codex ile yeniden belirgin bir ilerleme görüyoruz. Önümüzdeki yapay zeka modellerinin bu eğilimi sürdürmesini bekliyoruz. Buna hazırlık olarak, Hazırlık Çerçevemiz⁠(yeni bir pencerede açılır) (Preparedness Framework) kapsamında ölçüldüğü üzere, her yeni modelin siber güvenlik yetkinliğinde "Yüksek" düzeylere ulaşabileceği varsayımıyla planlama ve değerlendirme yapıyoruz. GPT‑5.2‑Codex henüz siber yetkinlik açısından "Yüksek" düzeye ulaşmamış olsa da, bu eşiği aşacak gelecekteki modeller için hazırlıklarımızı sürdürüyoruz.

Profesyonel Capture-the-Flag (CTF) değerlendirmesi, modelin bir Linux ortamında profesyonel düzeyde siber güvenlik becerileri gerektiren, ileri seviye ve çok adımlı gerçek dünya zorluklarını ne ölçüde ve ne sıklıkla başarıyla çözebildiğini ölçer.

Bu nedenle, bu sürümle birlikte siber koruma önlemlerimizi güçlendiriyor ve güvenlik topluluğuyla yakın iş birliği içinde, koruma mekanizmalarımızı hassas biçimde ayarlarken en yetenekli modellerimize kontrollü erişim sağlamak üzere siber savunma için güvenilir erişimi devreye alıyoruz.

Güvenilir erişimle siber savunmayı güçlendiriyoruz

Güvenlik ekipleri, tehdit aktörlerini taklit etmeye çalışırken, iyileştirme çalışmalarını desteklemek amacıyla kötü amaçlı yazılım analizleri yaparken ya da kritik altyapıyı zorlayarak test ederken çeşitli kısıtlamalarla karşılaşabilir. Güvenilir erişim programı ise, uygun kullanıcılar ve kurumlar için bu engelleri ortadan kaldırarak, güvenilir savunucuların ileri seviye yapay zeka siber yeteneklerinden yararlanmasını ve siber savunmayı daha hızlı ve etkili biçimde güçlendirmesini mümkün kılar.

Program, başlangıçta sorumlu güvenlik açığı bildirimi konusunda kanıtlanmış bir geçmişe sahip doğrulanmış güvenlik uzmanları ile net ve profesyonel bir siber güvenlik kullanım senaryosu bulunan kuruluşlar için yalnızca davetle katılıma açık olacaktır.

Sonuç

GPT‑5.2‑Codex, gelişmiş yapay zekanın gerçek dünya yazılım mühendisliği ve siber güvenliği destekleme biçiminde ileriye doğru önemli bir adımı temsil ediyor; geliştiricilerin ve savunucuların karmaşık ve uzun vadeli görevlerle başa çıkmasına yardımcı olurken, sorumlu güvenlik araştırmaları için kullanılan mevcut araçları da güçlendiriyor.

Bunu kademeli biçimde devreye alarak, erişimi güçlü koruma önlemleriyle eşleştirerek ve güvenilir erişim yoluyla güvenlik topluluğuyla yakın iş birliği içinde çalışarak, kötüye kullanım riskini azaltırken savunmacı etkiyi en üst düzeye çıkarmayı hedefliyoruz. Bu sürümden elde edeceğimiz öğrenimler, yazılım ve siber güvenlik alanlarındaki sınırlar ilerlemeye devam ederken, erişimi zaman içinde nasıl genişleteceğimize doğrudan yön verecek.

Eğer bir güvenlik uzmanıysanız veya güvenlik açığı araştırmaları ya da yetkilendirilmiş kırmızı takım testleri gibi etik güvenlik çalışmaları yürüten bir kuruluşun parçasıysanız, güvenilir erişim programımıza katılma konusundaki ilginizi belirtmeye ve programdan neler görmek istediğinize dair geri bildirimlerinizi buradan paylaşmaya davet ediyoruz.

Yazar

OpenAI