Disyembre 10, 2025

Pagpapatibay sa katatagan sa cyber habang sumusulong ang mga kakayahan ng AI

Habang lalo pang nagiging mas may kakayahan sa cybersecurity ang aming mga modelo, namumuhunan kami sa pagpapatibay ng mga ito, pagdaragdag ng mga pananggalang, at pakikipagtulungan sa mga pandaigdigang eksperto sa seguridad.

Naglo-load…

Ang mga kakayahang cyber ng mga modelo ng AI ay mabilis na umuunlad at nagdudulot ng makabuluhang mga benepisyo para sa depensa sa cyber, pati na rin ng mga bagong panganib na may dalawahang gamit na kailangang maingat na pamahalaan. Halimbawa, ang mga kakayahang sinusuri sa pamamagitan ng mga hamon sa capture-the-flag (CTF) ay umayos mula 27% sa GPT‑5⁠(magbubukas sa bagong window) noong 08/2025 hanggang 76% sa GPT‑5.1‑Codex‑Max⁠(magbubukas sa bagong window) noong 11/2025.

Inaasahan namin na magpapatuloy sa landas na ito ang mga paparating na modelo ng AI; bilang paghahanda, nagpaplano at sinusuri namin na tila ang bawat bagong modelo ay maaaring umabot sa 'Mataas' na antas ng kakayahan sa cybersecurity, gaya ng sinusukat ng aming Preparedness Framework⁠(magbubukas sa bagong window). Ang ibig naming sabihin dito, ang mga modelo na maaaring bumuo ng gumaganang zero-day remote exploit laban sa mga sistemang mahusay ang depensa, o makabuluhang makatulong sa kumplikadong pagpapatakbo ng lihim na negosyo o industriyal na paglusob na nakatuon sa mga epekto sa totoong mundo. Ipinapaliwanag ng post na ito kung paano namin iniisip ang tungkol sa mga pananggalang para sa mga modelo na umaabot sa mga antas ng kakayahang ito, at tinitiyak na makabuluhang nakakatulong ang mga ito sa mga tagapagtanggol habang nililimitahan ang maling paggamit.

Habang umuunlad ang mga kakayahang ito, namumuhunan ang OpenAI sa pagpapatibay ng aming mga modelo para sa mga gawaing depensibong cybersecurity at sa paglikha ng mga tool na nagbibigay-daan sa mga tagapagtanggol na mas madaling maisagawa ang mga daloy ng trabaho tulad ng pag-audit ng code at pag-aayos ng mga kahinaan. Ang aming layunin ay makapagdulot ng makabuluhang bentaha ang mga modelo at produkto namin para sa mga tagapagtanggol, na kadalasang mas kakaunti at kulang sa mapagkukunan.

Tulad ng ibang mga domain na may dalawahang gamit, ang mga depensibo at opensibong daloy ng trabaho sa cyber ay kadalasang umaasa sa iisang batayang kaalaman at mga pamamaraan. Namumuhunan kami sa mga pananggalang upang matiyak na ang mga makapangyarihang kakayahang ito ay pangunahing mapakinabangan sa mga pangdepensang paggamit at malimitahan ang tagumpay ng mapaminsalang layunin. Ang cybersecurity ay sumasaklaw sa halos bawat larangan, na nangangahulugang hindi tayo maaaring umasa sa iisang kategorya ng mga pananggalang—gaya ng paghihigpit sa kaalaman o paggamit lamang ng naberipikang pag-access—kundi, nangangailangan tayo ng diskarte sa malalimang pagdepensa na bumabalanse sa panganib at nagbibigay-kapangyarihan sa mga user. Sa praktika, ang ibig sabihin ay paghubog sa kung paano ina-access, ginagabayan, at inilalapat ang mga kakayahan upang magpatibay ng seguridad sa halip na magpababa ng mga hadlang sa maling paggamit ang mga advanced na modelo.

Hindi namin tinitingnan ang gawaing ito bilang minsanang pagsisikap, kundi bilang tuloy-tuloy at pangmatagalang pamumuhunan upang bigyan ng kalamangan ang mga tagapagtanggol at patuloy na patatagin ang katayuan sa seguridad ng kritikal na imprastraktura sa mas malawak na ecosystem.

Pagbawas sa mapaminsalang paggamit

Ang aming mga modelo ay dinisenyo at sinanay upang ligtas na gumana, na sinusuportahan ng mga proactive na sistema na nakakatukoy at tumutugon sa pang-aabuso sa cyber. Patuloy naming pinapahusay ang mga pananggalang na ito habang nagbabago ang aming mga kakayahan at ang kalagayan ng mga banta. Bagama't walang sistemang makagagarantiya ng ganap na pagpigil sa maling paggamit sa cybersecurity nang hindi lubhang naaapektuhan ang mga depensibong paggamit, ang aming estratehiya ay bawasan ang panganib sa pamamagitan ng maraming antas ng stack na pangkaligtasan.

Sa pundasyon nito, gumagamit kami ng diskarte sa malalimang depense, na umaasa sa kumbinasyon ng mga kontrol sa pag-access, pagpapatibay ng imprastraktura, mga kontrol sa egress, at pagsubaybay. Dinadagdagan namin ang mga hakbang na ito ng mga sistema ng pagtukoy at pagtugon, at mga nakatuong programa para sa banta sa katalinuhan at panganib ng insider, upang ang mga lumilitaw na banta ay mabilis na matukoy at mahadlangan. Ang mga pananggalang na ito ay dinisenyo upang umangkop sa kalagayan ng banta. Ipinagpapalagay namin na may pagbabago, at bumubuo kami upang makaangkop nang mabilis at nararapat.

Pagbuo sa pundasyong ito:

Pagsasanay sa modelo na tumanggi o ligtas na tumugon sa mga mapaminsalang kahilingan habang nananatiling kapaki-pakinabang para sa mga lehitimong kaso ng paggamit na pang-edukasyon at pangdepensa: Sinasanay namin ang aming mga frontier na modelo na tumanggi o ligtas na tumugon sa mga kahilingang magbibigay-daan sa malinaw na pang-aabuso sa cyber, habang nananatiling lubos na kapaki-pakinabang para sa mga lehitimong kaso ng paggamit na pangdepensa at pang-edukasyon.
Mga sistema ng pagtukoy: Pinapahusay at pinapanatili namin ang pangkalahatang pagsubaybay sa mga produktong gumagamit ng mga frontier na modelo upang matukoy ang potensyal na mapaminsalang aktibidad sa cyber. Kapag mukhang hindi ligtas ang aktibidad, maaari naming i-block ang output, idirekta ang mga prompt sa mas ligtas o hindi gaanong may kakayahang mga modelo, o i-escalate para sa pagpapatupad. Pinagsasama ng aming pagpapatupad ang naka-automate at pagsusuri ng tao, na isinasaalang-alang ang mga salik gaya ng mga legal na kinakailangan, tindi, at paulit-ulit na pag-uugali. Nakikipagtulungan din kami nang husto sa mga developer at mga negosyong customer upang magkaisa sa mga pamantayan sa kaligtasan at maisulong ang responsableng paggamit sa pamamagitan ng malinaw na mga landas ng pag-escalate.
End-to-end red teaming: Nakikipagtulungan kami sa mga ekspertong organisasyon sa red teaming upang suriin at pahusayin ang aming mga pagpapagaan para sa kaligtasan. Ang trabaho nila ay subukang iwasan ang lahat ng aming depensa sa pamamagitan ng pagtatrabaho nang end-to-end, gaya ng maaaring gawin ng isang determinado at may sapat na mapagkukunang kalaban. Nakakatulong ito upang maagang matukoy ang mga puwang at mapatatag ang buong sistema.

Mga inisyatibo ng ecosystem upang patibayin ang katatagan sa larangan ng teknolohiya

Maagang namuhunan ang OpenAI sa paglalapat ng AI sa mga kaso ng paggamit para sa depensang cybersecurity at ang aming koponan ay malapit na nakikipag-ugnayan sa mga pandaigdigang eksperto upang patuloy na paghusayin ang aming mga modelo at ang kanilang aplikasyon. Pinahahalagahan namin ang pandaigdigang komunidad ng mga propesyonal sa cybersecurity na walang kapagurang nagsisikap upang gawing mas ligtas ang ating digital na mundo, at nakatuon kami sa paghahatid ng makapangyarihang mga tool na sumusuporta sa seguridad na pang-depensa. Habang nagpapatupad kami ng mga bagong pananggalang, patuloy kaming makikipagtulungan sa komunidad ng cybersecurity upang maunawaan kung saan makabuluhang mapatibay ng AI ang katatagan, at kung saan pinakamahalaga ang maingat na mga pananggalang.

Kasabay ng mga pakikipagtulungang ito, nagtatatag kami ng pangkat ng mga pagsisikap na dinisenyo upang tulungan ang mga tagapagtanggol na mas mabilis na kumilos, iangkla ang aming mga pananggalang sa mga pangangailangan sa totoong mundo, at pabilisin ang responsableng pagwawasto sa malawakang saklaw.

Mga programang pinagkakatiwalaan para sa depensa sa cyber

Malapit na naming ipakilala ang isang pinagkakatiwalaang program sa pag-access kung saan sinusuri namin ang pagbibigay sa mga kwalipikadong user at customer na nagtatrabaho sa cyberdefense ng naka-tier na access sa mga pinahusay na kakayahan sa aming mga pinakabagong modelo para sa mga kaso ng paggamit na pang-depensa. Sinusuri pa rin namin ang tamang hangganan kung aling mga kakayahan ang maaari naming bigyan ng malawak na access at kung alin ang nangangailangan ng mga paghihigpit ayon sa antas, na maaaring makaapekto sa magiging disenyo ng programang ito sa hinaharap. Layunin naming maging pundasyon ang programang ito sa mapagkakatiwalaang pag-access tungo sa isang matatag na ecosystem.

Pagpapalawak ng kapasidad sa depensa gamit ang Aardvark

Ang Aardvark, ang aming agentic na mananaliksik sa seguridad na tumutulong sa mga developer at mga team sa seguridad na tumukoy at ayusin ang mga kahinaan sa malakihang saklaw, ngayon ay nasa pribadong Beta na. Ini-scan nito ang mga codebase para sa mga kahinaan at nagmumungkahi ng mga patch na mabilis na magagamit ng mga maintainer. Nakatukoy na ito ng mga bagong natuklasang CVE sa open-source na software sa pamamagitan ng pangangatuwiran sa buong codebase. Plano naming mag-alok ng libreng coverage/serbisyo para sa iilang hindi pang-komersyal na Open Source na repository upang makapag-ambag sa seguridad ng Open Source software ecosystem at supply chain. Mag-apply upang makalahok dito.

Konseho ng Panganib sa Frontier

Itatatag namin ang Konseho sa Panganib sa Frontier, isang grupo ng tagapayo na magdadala ng mga may karanasang tagapagtanggol sa cyber at mga nagtatrabaho sa seguridad upang makipagtulungan sa aming mga team. Magsisimula ang konsehong ito sa pagtutok sa cybersecurity at sa hinaharap ay lalawak sa iba pang mga larangan ng kakayahan sa frontier. Magbibigay ng payo ang mga miyembro tungkol sa hangganan sa pagitan ng kapaki-pakinabang at responsableng kakayahan at ng posibleng maling paggamit. Ang mga natutuhang ito ay direktang magbibigay-kaalaman sa aming mga pagsusuri at mga pananggalang. Magbabahagi kami ng higit pang impormasyon tungkol sa konseho sa lalong madaling panahon.

Pagbuo ng magkakaparehong pag-unawa sa mga modelo ng banta kasama ang industriya

Sa huli, inaasahan namin na ang maling paggamit sa cyber ay maaaring maging posible mula sa alinmang frontier na modelo sa industriya. Upang matugunan ito, nakikipagtulungan kami sa iba pang mga frontier lab sa pamamagitan ng Forum ng Frontier na Modelo, isang nonprofit na sinusuportahan ng mga nangungunang AI lab at mga katuwang sa industriya, upang bumuo ng magkakaparehong pag-unawa sa mga modelo ng banta at pinakamahuhusay na kasanayan. Sa kontekstong ito, nakatutulong ang pagmomodelo ng banta na mabawasan ang panganib sa pamamagitan ng pagtukoy sa kung paano maaaring gawing sandata ang mga kakayahan ng AI, kung saan umiiral ang mga kritikal na hadlang para sa iba't ibang mga nagbabanta, at kung paano maaaring magbigay ang mga frontier na modelo ng makabuluhang pagpapahusay. Layunin ng pakikipagtulungang ito na bumuo ng magkakapare-parehong pag-unawa sa buong ecosystem tungkol sa mga aktor ng banta at mga landas ng pag-atake, upang mabigyang-kakayahan ang mga lab, tagamentina, at tagapagtanggol na higit pang mapabuti ang kanilang mga hakbang sa pagpapagaan at matiyak na ang mahahalagang pananaw sa seguridad ay mabilis na kumalat sa buong ecosystem. Nakikipagtulungan din kami sa mga panlabas na team upang bumuo ng mga pagsusuri sa cybersecurity⁠(magbubukas sa bagong window). Umaasa kami na ang ecosystem ng mga independiyenteng pagsusuri ay lalo pang makakatulong sa pagbuo ng magkakaparehong pag-unawa sa mga kakayahan ng modelo.

Sama-sama, sumasalamin ang mga pagsisikap na ito sa aming pangmatagalang pangako sa pagpapalakas ng depensibong aspeto ng ecosystem. Habang nagiging mas may kakayahan ang mga modelo, layunin naming tumulong na matiyak na ang mga kakayahang iyon ay maisalin sa tunay na bentaha para sa mga tagapagtanggol—nakabatay sa mga pangangailangan sa tunay na mundo, hinubog ng mga eksperto, at maingat na ipinatutupad. Kasabay ng gawaing ito, plano naming tuklasin ang iba pang mga inisyatibo at mga gawad para sa cybersecurity upang makatulong na matukoy ang mga pambihirang ideya na maaaring hindi lumitaw mula sa mga tradisyonal na daluyan, at mangalap ng matatapang at malikhaing depensa mula sa iba’t ibang panig ng akademya, industriya, at komunidad ng open-source. Sa kabuuan, ito ay patuloy na gawain, at umaasa kaming patuloy na pauunlarin ang mga programang ito habang natututuhan namin kung ano ang pinakamabisang paraan upang maisulong ang seguridad sa tunay na mundo.