Kami memperkenalkan gpt-oss-120b dan gpt-oss-20b, dua model penalaran open-weight yang tersedia di bawah lisensi Apache 2.0 dan kebijakan penggunaan gpt-oss kami. Dikembangkan dengan masukan dari komunitas open-source, model berbasis teks saja ini kompatibel dengan Responses API kami dan dirancang untuk digunakan dalam alur kerja agentik dengan kepatuhan instruksi yang kuat, penggunaan alat seperti penelusuran web dan eksekusi kode Python, serta kapabilitas penalaran — termasuk kemampuan menyesuaikan tingkat penalaran untuk tugas yang tidak memerlukan penalaran kompleks. Model‑model ini dapat disesuaikan, menyediakan Chain‑of‑Thought (CoT) penuh, dan mendukung Output Terstruktur.
Keselamatan merupakan dasar bagi pendekatan kami terhadap model-model terbuka. Model‑model ini memiliki profil risiko yang berbeda dibanding model proprietari: Setelah dirilis, penyerang yang bertekad dapat melakukan fine-tuning pada model ini untuk melewati penolakan keamanan atau langsung mengoptimalkannya demi tujuan berbahaya, tanpa memberi kesempatan bagi OpenAI untuk menerapkan mitigasi tambahan atau mencabut akses.
Dalam beberapa konteks, pengembang dan perusahaan perlu menerapkan langkah-langkah pengaman tambahan untuk mereplikasi perlindungan tingkat sistem yang tertanam dalam model yang disajikan melalui API dan produk kami. Kami menyebut dokumen ini sebagai model card, bukan system card, karena model gpt-oss akan digunakan sebagai bagian dari beragam sistem yang dibuat dan dikelola oleh berbagai pemangku kepentingan. Meskipun model-model tersebut secara default dirancang untuk mengikuti kebijakan keamanan OpenAI, pemangku kepentingan lain juga akan membuat dan menerapkan keputusan mereka sendiri tentang cara menjaga sistem tersebut tetap aman.
Kami menjalankan evaluasi kapabilitas berskala pada gpt-oss-120b dan memastikan bahwa model bawaan tidak mencapai ambang indikatif kami untuk High capability pada salah satu dari tiga Kategori yang Dilacak dalam Preparedness Framework kami (Biological and Chemical capability, Cyber capability, dan AI Self-Improvement). Kami juga menyelidiki dua pertanyaan tambahan:
- Apakah aktor jahat dapat melakukan fine-tuning gpt-oss-120b agar mencapai High capability di domain Biological and Chemical atau Cyber? Dengan mensimulasikan tindakan potensial seorang penyerang, kami melakukan fine‑tuning adversarial pada gpt‑oss‑120b untuk dua kategori ini. Safety Advisory Group (“SAG”) OpenAI meninjau pengujian ini dan menyimpulkan bahwa, bahkan dengan fine-tuning yang kuat menggunakan training stack terdepan milik OpenAI, gpt-oss-120b tidak mencapai High capability dalam kategori Biological and Chemical Risk maupun Cyber risk.
- Apakah merilis gpt‑oss‑120b secara signifikan akan memajukan batas kemampuan biologis dalam model foundation terbuka? Kami menemukan bahwa jawabannya adalah tidak: Dalam sebagian besar evaluasi, performa bawaan dari satu atau lebih model open yang sudah ada hampir menyamai performa gpt-oss-120b setelah adversarial fine-tuning.
Sebagai bagian dari peluncuran ini, OpenAI menegaskan kembali komitmennya untuk memajukan AI yang bermanfaat dan meningkatkan standar keselamatan di seluruh ekosistem.


