Liwati menyang isi utama
OpenAI

10 Desember 2025

Keamanan

Nguwatake ketahanan siber nalika kapabilitas AI saya maju

Nalika model kita saya mumpuni ing keamanan siber, kita nandur modal kanggo nguwatake, nambah lapisan proteksi, lan kerja bareng para ahli keamanan global.

Lagi dimuat…

Kapabilitas siber ing model AI maju kanthi cepet, nggawa paedah wigati kanggo pertahanan siber uga risiko dual-use anyar sing kudu dikelola kanthi ati-ati. Contone, kapabilitas sing diukur liwat tantangan capture-the-flag (CTF) saya apik saka 27% ing GPT‑5(mbukak ing jendhela anyar) ing Agustus 2025 dadi 76% ing GPT‑5.1‑Codex‑Max(mbukak ing jendhela anyar) ing November 2025.

Kita ngarep model AI sing bakal teka bakal terus ing lintasan iki; kanggo nyiapake, kita ngrancang lan ngevaluasi kaya-kaya saben model anyar bisa tekan tingkat kapabilitas keamanan siber “Dhuwur”, kaya sing diukur dening Kerangka Kesiapan(mbukak ing jendhela anyar) kita. Tegese, model sing bisa ngembangake exploit remote zero-day sing bisa digunakake marang sistem sing dijaga kanthi apik, utawa menehi pitulungan migunani kanggo operasi intrusi perusahaan utawa industri sing kompleks lan siluman kanthi target dampak nyata ing donya. Tulisan iki nerangake kepiye cara kita mikir babagan proteksi kanggo model sing tekan tingkat kapabilitas iki, lan njamin supaya model kasebut temenan mbantu pihak pertahanan nalika matesi panyalahgunaan.

Nalika kapabilitas iki maju, OpenAI nandur modal kanggo nguwatake model kita kanggo tugas keamanan siber defensif lan nggawe piranti sing ndadekake pihak pertahanan luwih gampang nindakake alur kerja kayata audit kode lan nambal kerentanan. Tujuan kita yaiku supaya model lan produk kita nggawa kauntungan gedhe kanggo pihak pertahanan, sing kerep kalah jumlah lan kekurangan sumber daya.

Kaya domain dual-use liyane, alur kerja siber defensif lan ofensif kerep gumantung marang kawruh lan teknik dhasar sing padha. Kita nandur modal ing proteksi kanggo mbantu njamin supaya kapabilitas kuat iki utamane migunani kanggo panggunaan defensif lan matesi peningkatan kanggo tujuan ala. Keamanan siber nyentuh meh saben bidang, mula kita ora bisa gumantung mung ing siji kategori proteksi—kayata matesi kawruh utawa mung nggunakake akses sing wis diverifikasi—nanging butuh pendekatan defense-in-depth sing njaga imbangan risiko lan maringi daya marang pangguna. Ing praktik, iki tegese mbentuk cara kapabilitas diakses, dipandu, lan ditrapake supaya model canggih nguwatake keamanan tinimbang nurunake alangan kanggo panyalahgunaan.

Kita ndeleng karya iki dudu minangka upaya sepisan, nanging minangka investasi jangka panjang sing terus-terusan kanggo menehi kauntungan marang pihak pertahanan lan terus nguwatake postur keamanan infrastruktur kritis ing saindenging ekosistem.

Ngurangi panggunaan jahat

Model kita dirancang lan dilatih supaya bisa mlaku kanthi aman, didhukung sistem proaktif sing ndeteksi lan nanggapi panyalahgunaan siber. Kita terus nyaring proteksi iki nalika kapabilitas lan lanskap ancaman owah. Sanajan ora ana sistem sing bisa njamin pencegahan panyalahgunaan kanthi lengkap ing keamanan siber tanpa banget mengaruhi panggunaan defensif, strategi kita yaiku ngurangi risiko liwat tumpukan keamanan berlapis.

Minangka pondhasine, kita nggunakake pendekatan defense-in-depth, kanthi ngandelake kombinasi kontrol akses, pengerasan infrastruktur, kontrol egress, lan pemantauan. Kita nglengkapi langkah-langkah iki nganggo sistem deteksi lan respons, uga program intelijen ancaman lan risiko wong njero sing khusus, supaya ancaman sing muncul bisa diidentifikasi lan diblokir kanthi cepet. Proteksi iki dirancang supaya bisa berkembang bebarengan karo lanskap ancaman. Kita nganggep owah-owahan iku mesthi ana, lan kita mbangun supaya bisa nyetel kanthi cepet lan trep.

Kanthi dhasar iki:

  • Ngajari model supaya nolak utawa nanggapi kanthi aman panjaluk sing mbebayani nalika tetep migunani kanggo kasus panggunaan pendidikan lan defensif: Kita nglatih model tercanggih kita supaya nolak utawa nanggapi kanthi aman panjaluk sing bakal ndadekake panyalahgunaan siber sing cetha, nalika tetep semaksimal mungkin migunani kanggo kasus panggunaan defensif lan pendidikan sing sah.
  • Sistem deteksi: Kita nyaring lan njaga pemantauan ing saindenging sistem ing produk sing nggunakake model tercanggih kanggo ndeteksi aktivitas siber sing bisa uga jahat. Nalika aktivitas katon ora aman, kita bisa mblokir output, ngarahake prompt menyang model sing luwih aman utawa kurang mumpuni, utawa nambahake kanggo penegakan. Penegakan kita nggabungake tinjauan otomatis lan manungsa, adhedhasar faktor kaya syarat hukum, tingkat serius, lan prilaku mbaleni. Kita uga kerja raket karo pangembang lan pelanggan enterprise kanggo nyelarasake standar keamanan lan ngidini panggunaan sing tanggung jawab kanthi jalur eskalasi sing cetha.
  • Red teaming end-to-end: Kita kerja bareng organisasi red teaming ahli kanggo ngevaluasi lan ningkatake mitigasi keamanan kita. Tugasé yaiku nyoba ngliwati kabeh pertahanan kita kanthi cara end-to-end, kaya mungsuh sing tekad lan nduweni sumber daya apik. Iki mbantu kita ngenali kesenjangan luwih awal lan nguwatake sistem sakabèhé.

Inisiatif ekosistem kanggo nguwatake ketahanan siber 

OpenAI wis wiwit awal nandur modal kanggo nerapake AI ing kasus panggunaan keamanan siber defensif lan tim kita koordinasi raket karo para ahli global kanggo ngematangake model kita lan uga penerapane. Kita ngajeni komunitas global praktisi keamanan siber sing makarya kanggo ndadekake donya digital kita luwih aman lan kita nduweni komitmen ngirim piranti kuat sing ndhukung keamanan defensif. Nalika kita ngluncurake proteksi anyar, kita bakal terus kerja bareng komunitas keamanan siber kanggo mangerteni ing endi AI bisa kanthi nyata nguwatake ketahanan, lan ing endi proteksi sing dipikir kanthi mateng paling penting.

Saliyane kolaborasi iki, kita lagi mbangun sawatara upaya sing dirancang kanggo mbantu pihak pertahanan obah luwih cepet, ndhasarake proteksi kita marang kabutuhan nyata, lan nyepetake remediasi sing tanggung jawab ing skala gedhe.

Program akses dipercaya kanggo pertahanan siber

Kita bakal enggal ngenalake program akses dipercaya, ing ngendi kita njajaki nyedhiyakake akses bertingkat marang pangguna lan pelanggan sing memenuhi syarat lan makarya ing pertahanan siber menyang kapabilitas sing ditingkatake ing model paling anyar kita kanggo kasus panggunaan defensif. Kita isih njajaki wates sing pas babagan kapabilitas endi sing bisa diwenehi akses amba lan endi sing mbutuhake watesan bertingkat, sing bisa mengaruhi desain program iki ing mangsa ngarep. Kita ngarahake supaya program akses dipercaya iki dadi blok pambangun tumuju ekosistem sing tangguh.

Ngluwari kapasitas defensif kanthi Aardvark

Aardvark, peneliti keamanan agentic kita sing mbantu pangembang lan tim keamanan nemokake lan ndandani kerentanan ing skala gedhe, saiki wis mlebu beta privat. Sistem iki mindhai codebase kanggo golek kerentanan lan ngusulake patch sing bisa cepet diadopsi dening para maintainer. Sistem iki wis ngenali CVE anyar ing piranti lunak open-source kanthi nalar ing kabeh codebase. Kita ngrancang nawakake cakupan gratis kanggo sawetara repositori open source nonkomersial sing dipilih kanggo nyumbang marang keamanan ekosistem piranti lunak open source lan rantai pasokan. Daftar kanggo melu ing kene.

Frontier Risk Council

Kita bakal mbentuk Frontier Risk Council, sawijining klompok penasihat sing bakal nggawa para pembela siber lan praktisi keamanan sing berpengalaman menyang kolaborasi cedhak karo tim kita. Dewan iki bakal diwiwiti kanthi fokus ing keamanan siber, lan mengko bakal ngrembaka menyang domain kapabilitas tercanggih liyane. Para anggota bakal menehi pitutur babagan wates antarane kapabilitas sing migunani lan tanggung jawab lan potensi panyalahgunaan, lan pawulangan iki bakal langsung mbentuk evaluasi lan proteksi kita. Kita bakal enggal nuduhake luwih akeh babagan dewan iki. 

Ngembangake pangerten bareng babagan model ancaman karo industri

Pungkasan, kita ngantisipasi panyalahgunaan siber bisa dadi mungkin saka model tercanggih apa wae ing industri. Kanggo ngatasi iki, kita kerja bareng lab tercanggih liyane liwat Frontier Model Forum, sawijining organisasi nirlaba sing didhukung lab AI lan mitra industri utama, kanggo ngembangake pangerten bareng babagan model ancaman lan praktik paling apik. Ing konteks iki, pemodelan ancaman mbantu ngurangi risiko kanthi ngenali carane kapabilitas AI bisa dipersenjatai, ing endi bottleneck kritis ana kanggo aktor ancaman sing beda-beda, lan carane model tercanggih bisa menehi peningkatan sing migunani. Kolaborasi iki tujuane mbangun pangerten sing konsisten ing saindenging ekosistem babagan aktor ancaman lan jalur serangan, supaya lab, maintainer, lan pihak pertahanan bisa luwih apik ningkatake mitigasi lan njamin wawasan keamanan kritis cepet nyebar ing saindenging ekosistem. Kita uga lagi sesambungan karo tim eksternal kanggo ngembangake evaluasi keamanan siber(mbukak ing jendhela anyar). Kita ngarep ekosistem evaluasi independen bakal luwih mbantu mbangun pangerten bareng babagan kapabilitas model.

Bebarengan, upaya-upaya iki nggambarake komitmen jangka panjang kita kanggo nguwatake sisi defensif ekosistem. Nalika model saya mumpuni, tujuan kita yaiku mbantu njamin kapabilitas kasebut dadi daya ungkit nyata kanggo pihak pertahanan—adhedhasar kabutuhan nyata, dibentuk dening masukan para ahli, lan diterapake kanthi ati-ati. Saliyane karya iki, kita ngrancang njajaki inisiatif liyane lan hibah keamanan siber kanggo mbantu ngangkat gagasan terobosan sing bisa uga ora muncul saka jalur tradisional, lan kanggo crowdsourcing pertahanan sing wani lan kreatif saka kalangan akademik, industri, lan komunitas open-source. Yen dijupuk bebarengan, iki minangka karya sing terus mlaku, lan kita ngarep bakal terus ngembangake program-program iki nalika kita sinau apa sing paling efektif kanggo majokake keamanan nyata ing donya.