Јачање сајбер отпорности како AI способности напредују
Како наши модели постају способнији у сајбер безбедности, улажемо у њихово јачање, додајемо заштитне слојеве и сарађујемо са глобалним безбедносним стручњацима.
Сајбер способности AI модела брзо напредују, доносећи значајне користи за сајбер одбрану, али и нове ризике двоструке намене којима се мора пажљиво управљати. На пример, способности процењене кроз capture-the-flag (CTF) изазове побољшале су се са 27% на GPT‑5(отвара се у новом прозору) у августу 2025. на 76% на GPT‑5.1‑Codex‑Max(отвара се у новом прозору) у новембру 2025.
Очекујемо да ће предстојећи AI модели наставити овом путањом; у припреми, планирамо и процењујемо као да би сваки нови модел могао достићи „висок“ ниво способности у сајбер безбедности, мерен нашим Оквиром спремности(отвара се у новом прозору). Под тим подразумевамо моделе који могу или да развију функционалне zero-day удаљене експлоате против добро заштићених система, или да значајно помогну у сложеним, прикривеним операцијама упада у предузећа или индустријске системе усмереним на ефекте у стварном свету. Овај текст објашњава како размишљамо о заштитним мерама за моделе који достигну ове нивое способности и како обезбеђујемо да они значајно помажу браниоцима, уз ограничавање злоупотребе.
Како ове способности напредују, OpenAI улаже у јачање наших модела за одбрамбене задатке у сајбер безбедности и у стварање алата који омогућавају браниоцима да лакше обављају токове рада као што су ревизија кода и закрпљивање рањивости. Наш циљ је да наши модели и производи донесу значајне предности браниоцима, који су често бројчано надјачани и имају ограничене ресурсе.
Као и у другим доменима двоструке намене, одбрамбени и офанзивни сајбер токови рада често се ослањају на исто основно знање и технике. Улажемо у заштитне мере како бисмо помогли да ове моћне способности пре свега користе одбрамбеним наменама и ограничили повећање капацитета за злонамерне сврхе. Сајбер безбедност дотиче готово сваку област, што значи да не можемо да се ослонимо ни на једну појединачну категорију заштитних мера — као што су ограничавање знања или само проверени приступ — већ нам је потребан вишеслојни приступ одбрани који уравнотежује ризик и оснажује кориснике. У пракси, то значи обликовање начина на који се способностима приступа, како се усмеравају и примењују, тако да напредни модели јачају безбедност уместо да снижавају баријере за злоупотребу.
Овај рад не видимо као једнократан напор, већ као трајно, дугорочно улагање у давање предности браниоцима и континуирано јачање безбедносног положаја критичне инфраструктуре широм екосистема.
Наши модели су осмишљени и обучени да раде безбедно, уз подршку проактивних система који откривају и одговарају на сајбер злоупотребе. Непрестано унапређујемо ове заштите како се мењају наше способности и окружење претњи. Иако ниједан систем не може да гарантује потпуно спречавање злоупотребе у сајбер безбедности без озбиљног утицаја на одбрамбене намене, наша стратегија је да ублажимо ризик кроз вишеслојни безбедносни стек.
У основи тога, примењујемо приступ одбране у дубини, ослањајући се на комбинацију контрола приступа, ојачавања инфраструктуре, контроле излазног саобраћаја и надзора. Ове мере допуњујемо системима за детекцију и реаговање, као и наменским програмима за обавештајне податке о претњама и ризик од инсајдера, тако да се новонастале претње брзо идентификују и блокирају. Ове заштитне мере су осмишљене да се развијају заједно са окружењем претњи. Полазимо од тога да ће доћи до промена и градимо тако да можемо брзо и примерено да се прилагодимо.
Надовезујући се на ову основу:
- Обучавање модела да одбије или безбедно одговори на штетне захтеве, уз задржавање корисности за образовне и одбрамбене случајеве употребе: Обучавамо наше граничне моделе да одбију или безбедно одговоре на захтеве који би омогућили јасну сајбер злоупотребу, уз то да остану максимално корисни за легитимне одбрамбене и образовне случајеве употребе.
- Системи детекције: Унапређујемо и одржавамо надзор на нивоу целог система у производима који користе граничне моделе како бисмо открили потенцијално злонамерне сајбер активности. Када активност делује небезбедно, можемо блокирати излаз, усмерити инструкције ка безбеднијим или мање способним моделима, или ескалирати ради примене мера. Наша примена мера комбинује аутоматизовану и људску проверу, узимајући у обзир факторе као што су законски захтеви, озбиљност и понављање понашања. Такође блиско сарађујемо са програмерима и пословним корисницима како бисмо се ускладили око безбедносних стандарда и омогућили одговорну употребу уз јасне путеве ескалације.
- Целовита црвена команда: Сарађујемо са стручним организацијама за црвену команду како бисмо проценили и унапредили наша ублажавања безбедносних ризика. Њихов задатак је да покушају да заобиђу све наше одбране радећи од почетка до краја, баш као што би могао одлучан и добро опремљен противник. То нам помаже да рано уочимо празнине и ојачамо цео систем.
OpenAI је рано инвестирао у примену AI-а на одбрамбене случајеве употребе у сајбер безбедности, а наш тим тесно координише са глобалним стручњацима како би унапредио и наше моделе и њихову примену. Ценимо глобалну заједницу стручњака за сајбер безбедност која напорно ради да наш дигитални свет учини безбеднијим и посвећени смо испоруци моћних алата који подржавају одбрамбену безбедност. Док уводимо нове заштитне мере, наставићемо да сарађујемо са заједницом сајбер безбедности како бисмо разумели где AI може значајно да ојача отпорност и где су промишљене заштитне мере најважније.
Поред ових сарадњи, успостављамо скуп активности осмишљених да помогну браниоцима да се крећу брже, да наше заштитне мере утемеље у стварним потребама и да убрзају одговорно отклањање проблема у великом обиму.
Ускоро ћемо увести програм поузданог приступа у оквиру ког разматрамо обезбеђивање вишенивоиског приступа унапређеним способностима наших најновијих модела за одбрамбене случајеве употребе корисницима и клијентима који испуњавају услове и раде на сајбер одбрани. Још увек истражујемо праву границу између способности којима можемо да омогућимо широк приступ и оних које захтевају вишенивоиска ограничења, што може утицати на будући дизајн овог програма. Циљ нам је да овај програм поузданог приступа буде грађевни блок ка отпорном екосистему.
Aardvark, наш агентски истраживач безбедности који помаже програмерима и безбедносним тимовима да проналазе и отклањају рањивости у великом обиму, сада је у приватној бета фази. Он скенира базе кода у потрази за рањивостима и предлаже закрпе које одржаваоци могу брзо да усвоје. Већ је идентификовао нове CVE-ове у софтверу отвореног кода резоновањем над целим базама кода. Планирамо да понудимо бесплатно покриће одабраним некомерцијалним репозиторијумима отвореног кода како бисмо допринели безбедности екосистема и ланца снабдевања софтвером отвореног кода. Пријавите се за учешће овде.
Успоставићемо Савет за гранични ризик, саветодавну групу која ће довести искусне сајбер браниоце и стручњаке за безбедност у блиску сарадњу са нашим тимовима. Овај савет ће у почетку бити усмерен на сајбер безбедност, а убудуће ће се проширити и на друге домене граничних способности. Чланови ће саветовати о граници између корисне, одговорне способности и потенцијалне злоупотребе, а ова сазнања ће директно обликовати наше евалуације и заштитне мере. Ускоро ћемо поделити више информација о савету.
Коначно, очекујемо да сајбер злоупотреба може бити изводљива из било ког граничног модела у индустрији. Да бисмо то решили, сарађујемо са другим граничним лабораторијама кроз Frontier Model Forum, непрофитну организацију коју подржавају водеће AI лабораторије и индустријски партнери, како бисмо развили заједничко разумевање модела претњи и најбољих пракси. У овом контексту, моделовање претњи помаже у ублажавању ризика тако што идентификује како би AI способности могле бити претворене у оружје, где постоје критична уска грла за различите актере претњи и како би гранични модели могли пружити значајно повећање капацитета. Циљ ове сарадње је да изгради доследно разумевање актера претњи и путева напада на нивоу целог екосистема, омогућавајући лабораторијама, одржаваоцима и браниоцима да боље унапреде своја ублажавања и осигурају да се кључни безбедносни увиди брзо шире кроз екосистем. Такође сарађујемо са спољним тимовима на развоју евалуација сајбер безбедности(отвара се у новом прозору). Надамо се да ће екосистем независних евалуација додатно помоћи у изградњи заједничког разумевања способности модела.
Заједно, ови напори одражавају нашу дугорочну посвећеност јачању одбрамбене стране екосистема. Како модели постају способнији, наш циљ је да помогнемо да се те способности преточе у стварну предност за браниоце — утемељену у стварним потребама, обликовану стручним увидима и примењену пажљиво. Упоредо с овим радом, планирамо да истражимо и друге иницијативе и грантове за сајбер безбедност како бисмо помогли да испливају револуционарне идеје које можда не би произашле из традиционалних токова, и да прикупимо смеле, креативне одбране из академске заједнице, индустрије и заједнице отвореног кода. Узето у целини, ово је континуиран рад и очекујемо да ћемо наставити да развијамо ове програме како будемо учили шта најефикасније унапређује безбедност у стварном свету.


