Kertu model gpt-oss-120b & gpt-oss-20b
Kita ngenalake gpt-oss-120b lan gpt-oss-20b, loro model nalar open-weight sing kasedhiya miturut lisensi Apache 2.0 lan kabijakan panggunaan gpt-oss kita. Dikembangake kanthi umpan balik saka komunitas open-source, model mung-teks iki kompatibel karo Responses API kita lan dirancang kanggo digunakake ing alur kerja agen kanthi katut instruksi sing kuwat, panggunaan piranti kaya panelusuran web lan eksekusi kode Python, lan kapabilitas nalar—kalebu kemampuan kanggo nyetel upaya nalar kanggo tugas sing ora mbutuhake nalar kompleks. Model-model iki bisa disesuaikan, nyedhiyakake chain-of-thought (CoT) lengkap, lan ndhukung Structured Outputs.
Keamanan iku dhasar saka pendekatan kita marang model mbukak. Model iki nduweni profil risiko sing beda tinimbang model proprietari: Sawise dirilis, panyerang sing temen bisa nyetel ulang kanthi fine-tune supaya bisa ngliwati penolakan keamanan utawa langsung ngoptimalake kanggo gawe cilaka tanpa OpenAI bisa ngetrapake mitigasi tambahan utawa nyabut akses.
Ing sawetara konteks, pangembang lan perusahaan bakal perlu ngetrapake pengaman ekstra supaya bisa niru proteksi tingkat sistem sing wis dibangun ing model sing disajekake liwat API lan produk kita. Kita nyebut dokumen iki kertu model, dudu kertu sistem, amarga model gpt-oss bakal digunakake minangka bagean saka macem-macem sistem, sing digawe lan dirumat dening akeh pihak sing beda-beda. Senadyan model-model iki dirancang supaya manut kabijakan keamanan OpenAI kanthi gawan, pihak liyane uga bakal nggawe lan ngetrapake keputusan dhewe babagan cara njaga sistem kasebut tetep aman.
Kita nindakake evaluasi kapabilitas sing bisa diskalakake ing gpt-oss-120b, lan ngonfirmasi yen model gawan ora nggayuh ambang indikatif kita kanggo kapabilitas Dhuwur ing telung Kategori sing Dilacak saka Kerangka Kesiapan kita (kapabilitas Biologis lan Kimia, kapabilitas Siber, lan Swaperbaikan AI). Kita uga nyelidiki rong pitakon tambahan:
- Apa aktor sing duwe niat ala bisa fine-tune gpt-oss-120b supaya nggayuh kapabilitas Dhuwur ing domain Biologis lan Kimia utawa Siber? Kanthi nyimulasi tumindak potensial saka panyerang, kita fine-tune model gpt-oss-120b kanthi cara adversarial kanggo loro kategori iki. Safety Advisory Group OpenAI (“SAG”) mriksa pengujian iki lan nyimpulake yen, sanajan nganggo fine-tuning sing kuwat lan nggunakke tumpukan pelatihan unggulane OpenAI, gpt-oss-120b ora nggayuh kapabilitas Dhuwur ing Risiko Biologis lan Kimia utawa risiko Siber.
- Apa rilis gpt-oss-120b bakal kanthi signifikan majokake wates tercanggih kapabilitas biologis ing model pondasi mbukak? Kita nemokake yen wangsulane ora: Kanggo umume evaluasi, kinerja gawan saka siji utawa luwih model mbukak sing wis ana meh padha karo kinerja gpt-oss-120b sing wis di-fine-tune sacara adversarial.
Minangka bagean saka peluncuran iki, OpenAI negesake maneh komitmene kanggo majokake AI sing migunani lan ningkatake standar keamanan ing saindenging ekosistem.


