Krepitev kibernetske odpornosti ob napredku zmogljivosti umetne inteligence
Ker naši modeli postajajo čedalje zmogljivejši na področju kibernetske varnosti, vlagamo v njihovo krepitev, dodajanje varovalnih mehanizmov in sodelovanje z globalnimi varnostnimi strokovnjaki.
Zmogljivosti na področju kibernetske varnosti v modelih UI hitro napredujejo, kar prinaša pomembne koristi za kibernetsko obrambo, pa tudi nova tveganja dvojne rabe, ki jih je treba skrbno obvladovati. Na primer zmogljivosti, ocenjene s preizkusi »capture-the-flag« (CTF), so se izboljšale s 27 % pri GPT‑5(odpre se v novem oknu) avgusta 2025 na 76 % pri GPT‑5.1‑Codex‑Max(odpre se v novem oknu) novembra 2025.
Pričakujemo, da bodo prihodnji modeli umetne inteligence nadaljevali to smer razvoja. V pripravi na to načrtujemo in ocenjujemo, kot da bi lahko vsak nov model dosegel visoko raven kibernetskih zmogljivosti, kot jo opredeljuje naš Okvir pripravljenosti(odpre se v novem oknu). S tem mislimo modele, ki lahko razvijejo delujočo oddaljeno izkoriščevalsko kodo ničtega dne proti dobro zaščitenim sistemom ali smiselno pomagajo pri kompleksnih, prikritih operacijah vdora v poslovna ali industrijska okolja, usmerjenih v učinke v resničnem svetu. Ta objava pojasnjuje, kako razmišljamo o zaščitnih ukrepih za modele, ki dosežejo te ravni zmogljivosti, in kako zagotavljamo, da smiselno pomagajo branilcem ter hkrati omejujejo zlorabe.
Z razvojem teh zmogljivosti družba OpenAI vlaga v krepitev svojih modelov za naloge obrambne kibernetske varnosti in ustvarja orodja, ki branilcem omogočajo lažje izvajanje delovnih tokov, kot sta pregledovanje kode in odpravljanje ranljivosti. Naš cilj je, da naši modeli in produkti prinesejo pomembne prednosti branilcem, ki so pogosto številčno prekašani in imajo premalo virov.
Tako kot na drugih področjih dvojne rabe se tudi obrambni in napadalni kibernetski delovni tokovi pogosto opirajo na isto temeljno znanje in tehnike. Vlagamo v varovalne mehanizme, da bi pomagali zagotoviti, da te silne zmogljivosti koristijo predvsem obrambnim rabam in omejujejo povečanje zmogljivosti za zlonamerne namene. Kibernetska varnost zadeva skoraj vsako področje, kar pomeni, da se ne moremo zanašati na nobeno posamezno kategorijo varovalnih mehanizmov, kot sta omejevanje znanja ali zgolj uporaba preverjenega dostopa, pač pa potrebujemo pristop globinske obrambe, ki uravnovesi tveganja in opolnomoči uporabnike. V praksi to pomeni oblikovanje načinov dostopa do zmogljivosti, njihovega usmerjanja in uporabe, tako da napredni modeli krepijo varnost, namesto da bi zniževali prag za zlorabo.
To delo razumemo kot trajno, dolgoročno naložbo v zagotavljanje prednosti branilcem in nenehno krepitev varnostne drže kritične infrastrukture v širšem ekosistemu.
Naši modeli so zasnovani in usposobljeni za varno delovanje, pri čemer jih podpirajo proaktivni sistemi, ki zaznavajo kibernetske zlorabe in se odzivajo nanje. Te zaščitne ukrepe nenehno izpopolnjujemo, ko se spreminjajo naše zmogljivosti in okolje groženj. Čeprav noben sistem ne more zagotoviti popolnega preprečevanja zlorab na področju kibernetske varnosti, ne da bi pri tem resno omejil obrambne uporabe, je naša strategija zmanjševanje tveganja z večplastnim varnostnim sklopom.
Naš pristop temelji na globinski obrambi, ki vključuje kombinacijo nadzora dostopa, utrjevanja infrastrukture, nadzora izhodnega prometa in spremljanja. Te ukrepe dopolnjujemo s sistemi za zaznavanje in odzivanje ter namenskimi programi za obveščevalne podatke o grožnjah in obvladovanje notranjih tveganj, kar omogoča hitro prepoznavanje in blokiranje novih groženj. Te varovalke so zasnovane tako, da se razvijajo skladno z razvojem okolja groženj. Spremembe predvidevamo in naš pristop k razvoju je takšen, da se lahko hitro in ustrezno prilagodimo.
Razvijamo na teh temeljih:
- Usposabljanje modela za zavrnitev ali varen odziv na škodljive zahteve, hkrati pa ohranjanje uporabnosti za izobraževalne in obrambne primere uporabe: Naše prelomne modele usposabljamo, da zavrnejo ali se varno odzovejo na zahteve, ki bi omogočile očitno kibernetsko zlorabo, hkrati pa ostanejo kar najbolj koristni za upravičene obrambne in izobraževalne primere uporabe.
- Sistemi za zaznavanje: Izpopolnjujemo in vzdržujemo spremljanje na ravni celotnega sistema v vseh produktih, ki uporabljajo prelomne modele, za zaznavanje potencialno zlonamerne kibernetske dejavnosti. Kadar dejavnost deluje nevarno, lahko blokiramo izhodni rezultat, pozive preusmerimo na varnejše ali manj zmogljive modele ali zadevo stopnjujemo na višjo raven z namenom uveljavitve pravil. Naše uveljavljanje pravil združuje avtomatiziran in človeški pregled, pri čemer upoštevamo dejavnike, kot so pravne zahteve, resnost in ponavljajoče se vedenje. Tesno sodelujemo tudi z razvijalci in poslovnimi strankami, da se uskladimo glede varnostnih standardov in omogočimo odgovorno uporabo z jasno opredeljenimi eskalacijskimi potmi.
- Preizkus odpornosti od začetka do konca: Sodelujemo s strokovnimi organizacijami za preizkus odpornosti, da ocenimo in izboljšamo svoje varnostne zaščitne ukrepe. Njihova naloga je, da z delovanjem od začetka do konca poskušajo obiti vse naše obrambne mehanizme, tako kot bi to lahko storil odločen in dobro opremljen nasprotnik. To nam pomaga zgodaj prepoznati vrzeli in okrepiti celoten sistem.
OpenAI je že zgodaj začel vlagati v uporabo umetne inteligence za obrambne primere uporabe na področju kibernetske varnosti, naša ekipa pa tesno sodeluje z globalnimi strokovnjaki, da bi izboljšali tako naše modele kot tudi njihovo uporabo. Cenimo globalno skupnost strokovnjakov za kibernetsko varnost, ki si prizadevajo, da bi bil naš digitalni svet varnejši, in smo zavezani zagotavljanju zmogljivih orodij, ki podpirajo obrambno varnost. Ko uvajamo nove zaščitne ukrepe, bomo še naprej sodelovali s skupnostjo za kibernetsko varnost, da bi razumeli, kje lahko umetna inteligenca smiselno okrepi odpornost in kje so premišljeni zaščitni ukrepi najpomembnejši.
Poleg teh sodelovanj vzpostavljamo tudi sklop prizadevanj, zasnovanih tako, da branilcem pomagajo hitreje ukrepati, naše varovalne mehanizme utemeljiti na dejanskih potrebah iz prakse ter pospešiti odgovorno odpravljanje težav v velikem obsegu.
Kmalu bomo uvedli program zaupanja vrednega dostopa, v okviru katerega preučujemo možnost, da bi upravičenim uporabnikom in strankam, ki delajo na področju kibernetske obrambe, zagotovili večstopenjski dostop do izboljšanih zmogljivosti v naših najnovejših model za obrambne primere uporabe. Še vedno preučujemo ustrezno mejo med tem, do katerih zmogljivosti lahko omogočimo širok dostop in za katere so potrebne večstopenjske omejitve, kar lahko vpliva na prihodnjo zasnovo tega programa. Naš cilj je, da ta program zaupanja vrednega dostopa postane gradnik za odporen ekosistem.
Aardvark, naš agentski varnostni raziskovalec, ki razvijalcem in varnostnim ekipam pomaga pri odkrivanju in odpravljanju ranljivosti v velikem obsegu, je zdaj na voljo v zasebni različici beta. Pregleduje zbirke kode za ranljivosti in predlaga popravke, ki jih lahko vzdrževalci hitro uporabijo. Že je odkril nove splošne ranljivosti in izpostavljenosti (CVE) v odprtokodni programski opremi s sklepanjem o celotnih zbirkah kode. Izbranim nekomercialnim odprtokodnim repozitorijem nameravamo ponuditi brezplačno kritje, da bi prispevali k večji varnosti ekosistema odprtokodne programske opreme in dobavne verige. Za sodelovanje se prijavite tukaj.
Ustanovili bomo Svet za področja tveganja na meji zmogljivosti, svetovalno skupino, ki bo izkušene kibernetske branilce in strokovnjake za varnost tesno povezala z našimi ekipami. Ta svet bo začel s poudarkom na kibernetski varnosti in se bo v prihodnosti razširil na druga področja prelomnih zmogljivosti. Člani bodo svetovali o meji med uporabno in odgovorno zmogljivostjo ter morebitno zlorabo, ta spoznanja pa bodo neposredno prispevala k oblikovanju naših ocen in varovalnih mehanizmov. Kmalu bomo delili več informacij o svetu.
Nazadnje predvidevamo, da bi lahko bila kibernetska zloraba izvedljiva pri katerem koli prelomnem modelu v panogi. Da bi to obravnavali, sodelujemo z drugimi prelomnimi laboratoriji prek neprofitne organizacije Frontier Model Forum, ki jo podpirajo vodilni laboratoriji umetne inteligence in panožni partnerji, da bi razvili skupno razumevanje modelov groženj in najboljših praks. V tem kontekstu modeliranje groženj pomaga zmanjšati tveganje z opredelitvijo, kako bi se lahko zmogljivosti umetne inteligence uporabile kot orožje, kje obstajajo kritična ozka grla za različne akterje groženj in kako bi prelomni modeli lahko zagotovili pomembno izboljšanje. Cilj tega sodelovanja je vzpostaviti dosledno razumevanje akterjev groženj in poti napadov v celotnem ekosistemu, kar laboratorijem, vzdrževalcem in zagovornikom omogoča učinkovitejše izboljšanje ukrepov za ublažitev ter zagotavljanje hitrega širjenja ključnih varnostnih spoznanj po celotnem ekosistemu. Sodelujemo tudi z zunanjimi ekipami pri razvoju ocen kibernetske varnosti(odpre se v novem oknu). Upamo, da bo ekosistem neodvisnih ocenjevanj dodatno pripomogel k skupnemu razumevanju zmogljivosti modelov.
Ta prizadevanja odražajo našo dolgoročno zavezanost krepitvi obrambne strani ekosistema. Ko modeli postajajo čedalje zmogljivejši, je naš cilj zagotoviti, da te zmogljivosti postanejo resnična prednost za branilce – utemeljena na potrebah iz resničnega sveta, oblikovana s strokovnimi prispevki in uvajana premišljeno. Poleg tega dela nameravamo raziskati druge pobude in nepovratna sredstva na področju kibernetske varnosti, da bi odkrili prebojne zamisli, ki se morda ne bi pojavile po tradicionalnih poteh, ter da bi zbrali drzne, ustvarjalne obrambne rešitve s prispevki iz akademskih krogov, panoge in odprtokodne skupnosti. Skupaj gledano gre za nenehno delo, pri čemer pričakujemo, da bomo te programe še naprej razvijali, medtem ko se učimo, kaj najbolj učinkovito prispeva k varnosti v resničnem svetu.


