Ana içeriğe atla
OpenAI

5 Ağustos 2025

YayınGüvenlik

gpt‑oss‑120b & gpt‑oss‑20b Model Kartı

Giriş

Apache 2.0 lisansı ve gpt-oss kullanım politikamız kapsamında sunulan iki open-weight akıl yürütme modeli gpt-oss-120b ve gpt-oss-20b’yi tanıtıyoruz. Açık kaynak topluluğundan gelen geri bildirimlerle geliştirilen bu yalnızca metin tabanlı modeller, Responses API’mizle uyumludur ve güçlü talimat takibi, web araması ve Python kodu çalıştırma gibi araç kullanımı ile muhakeme yetenekleri içeren ajan merkezli iş akışlarında kullanılmak üzere tasarlanmıştır—karmaşık muhakeme gerektirmeyen görevler için muhakeme çabasını ayarlama özelliği dâhil. Modeller özelleştirilebilir, tam Chain‑of‑Thought (CoT) sunar ve Yapılandırılmış Çıktıları destekler.

Open modellere yaklaşımımızda güvenlik esastır. Mülkiyetli modellere göre farklı bir risk profiline sahiptirler: Modeller bir kez yayımlandığında, kararlı saldırganlar güvenlik reddilerini aşacak şekilde ince-ayarlama yapabilir veya doğrudan zarara yönelik olarak optimize edebilir; bu durumda OpenAI’nin ek önlemler uygulama ya da erişimi iptal etme imkânı kalmaz.

Bazı durumlarda, geliştiricilerin ve işletmelerin, API’miz ve ürünlerimiz aracılığıyla sunulan modellere yerleşik sistem düzeyi korumaları çoğaltabilmek için ek güvenlik önlemleri uygulamaları gerekecektir. Bu belgeye sistem kartı değil model kartı diyoruz; çünkü gpt-oss modelleri, çok farklı paydaşlar tarafından oluşturulan ve sürdürülen geniş bir sistem yelpazesinin parçası olarak kullanılacak. Modeller varsayılan olarak OpenAI’nin güvenlik politikalarına uymak üzere tasarlanmış olsa da, diğer paydaşlar da bu sistemleri nasıl güvenli tutacaklarına dair kendi kararlarını alacak ve uygulayacaktır.

gpt-oss-120b üzerinde ölçeklenebilir yetenek değerlendirmeleri yaptık ve varsayılan modelin, Preparedness Framework’ümüzde izlenen üç kategoriden hiçbirinde (Biological and Chemical capability, Cyber capability ve AI Self-Improvement) Yüksek yetenek için gösterge niteliğindeki eşiklerimize ulaşmadığını doğruladık. Ayrıca iki ek soruyu inceledik:

  • Düşmanca aktörler, gpt-oss-120b’yi Biological and Chemical ya da Cyber alanlarında High capability seviyesine ulaşacak şekilde ince ayarlayabilir mi? Bir saldırganın olası eylemlerini simüle ederek, gpt‑oss‑120b’yi bu iki kategori için adversarial ince ayar yaptık. OpenAI’nin Safety Advisory Group’u (“SAG”) bu testleri inceleyerek, OpenAI’nin sektör lideri training stack’inden yararlanan kapsamlı bir fine-tuning uygulanmış olsa bile, gpt-oss-120b’nin Biological and Chemical Risk veya Cyber risk alanlarında High capability seviyesine ulaşamadığı sonucuna vardı.
  • gpt‑oss‑120b’nin yayımlanması, açık foundation modellerde biyolojik yeteneklerin sınırını önemli ölçüde ileri taşır mı? Cevabın hayır olduğunu gördük: Çoğu değerlendirmede, mevcut açık modellerden bir veya daha fazlasının varsayılan performansı, gpt-oss-120b’nin adversarial fine-tuning sonrası performansına neredeyse eşittir.

Bu lansmanın bir parçası olarak OpenAI, faydalı yapay zekâyı ilerletme ve ekosistemdeki güvenlik standartlarını yükseltme taahhüdünü bir kez daha teyit ediyor.