10. desember 2025

Cyberrobustheten øker etter hvert som KI-kapasitetene utvikler seg

Etter hvert som modellene våre blir mer avanserte innen cybersikkerhet, investerer vi for å styrke dem, bygge inn sikkerhetstiltak i flere lag og samarbeide med globale sikkerhetseksperter.

Laster inn …

Cyberkapasiteten i KI-modeller utvikler seg raskt, noe som gir betydelige fordeler for cyberforsvaret, men også nye risikoer for dobbeltbruk som må håndteres nøye. For eksempel har kapasiteter vurdert gjennom capture-the-flag-konkurranser (CTF) forbedret seg fra 27 % på GPT‑5⁠(åpnes i et nytt vindu) i august 2025 til 76 % på GPT‑5.1‑Codex‑Max⁠(åpnes i et nytt vindu) i november 2025.

Vi forventer⁠(åpnes i et nytt vindu) at kommende KI-modeller vil fortsette denne utviklingen. Vi forbereder oss ved å planlegge og evaluere som om hver ny modell kan nå et høyt nivå av kapasitet innen cybersikkerhet, målt etter vårt Preparedness Framework. Med dette mener vi også modeller som enten kan utvikle fungerende zero-day-angrep mot godt sikrede systemer, eller aktivt bidra med komplekse og skjulte inntrengningsoperasjoner mot bedrifter eller industrien, med mål om å forårsake reell skade. Dette innlegget forklarer hvordan vi tenker angående sikkerhetstiltak for modeller som når disse kapasitetsnivåene, og sikrer at de på en relevant måte støtter sikkerhetsteam og begrenser misbruk.

Etter hvert som disse kapasitetene utvikler seg, investerer OpenAI i styrking av modellene våre for defensive cybersikkerhetsoppgaver og i utvikling av verktøy som gjør det enklere for sikkerhetsteam å utføre arbeidsprosesser som å revidere kode og tette sårbarheter. Målet vårt er at modellene og produktene våre skal gi betydelige fordeler for sikkerhetsteam, som ofte er i mindretall og har begrensede ressurser.

Som i andre dobbeltbruksområder er defensive og offensive cyberarbeidsprosesser ofte avhengige av samme underliggende kunnskap og teknikker. Vi investerer i sikkerhetstiltak for å sikre at disse kraftige kapasitetene først og fremst hjelper defensive bruksområder og begrenser kapasitetsøkning for ondsinnede formål. Cybersikkerhet berører nesten alle områder, så vi kan ikke bare basere oss på én kategori av sikkerhetstiltak (som bare å begrense kunnskap eller bare bruke godkjent tilgang), men trenger et dyptgående forsvar som balanserer risiko og setter brukerne i stand til å benytte seg av systemet. I praksis betyr dette å forme hvordan funksjonene gjøres tilgjengelige, styres og brukes, slik at avanserte modeller styrker sikkerheten fremfor å senke terskelen for misbruk.

Vi ser ikke dette arbeidet som en engangsinnsats, men som en vedvarende, langsiktig investering i å gi sikkerhetsteamene et overtak og kontinuerlig styrke sikkerhetsstatusen til den kritiske infrastrukturen i det bredere økosystemet.

Motvirker skadelig bruk

Modellene våre er utformet og trent til å operere trygt, støttet av proaktive systemer som oppdager og reagerer på cybermisbruk. Vi finjusterer kontinuerlig disse beskyttelsene etter hvert som kapasitetene våre og trusselbildet endrer seg. Selv om ingen systemer kan helt garantere forhindring av misbruk innen cybersikkerhet uten å seriøst påvirke defensive bruksområder, er strategien vår å redusere risiko gjennom en sikkerhetsstruktur i flere lag.

Som grunnlag for dette har vi en tilnærming med dybdeforsvar, som bygger på en kombinasjon av tilgangskontroller, herding av infrastruktur, utgangskontroller og overvåking. Vi kompletterer disse tiltakene med deteksjons- og responssystemer, samt egne programmer for trusselinformasjon og innsiderrisiko, slik at nye trusler raskt blir identifisert og blokkert. Disse sikkerhetstiltakene er utformet for å utvikle seg i takt med trusselbildet. Vi tar høyde for fremtidige endringer, og vi bygger slik at vi kan tilpasse oss raskt og på en hensiktsmessig måte.

Med utgangspunkt i dette grunnlaget:

Lære opp modellen til å avvise eller svare trygt på skadelige forespørsler, samtidig som den forblir nyttig for pedagogiske og defensive bruksområder: Vi lærer opp de banebrytende modellene våre til å avvise eller svare trygt på forespørsler som kan muliggjøre tydelig cybermisbruk, samtidig som de fortsetter å være til mest mulig hjelp for legitime defensive og pedagogiske bruksområder.
Deteksjonssystemer: Vi forbedrer og vedlikeholder systemomfattende overvåking av alle produkter som bruker banebrytende modeller, for å oppdage potensielt skadelig cyberaktivitet. Når aktivitet virker utrygg, kan vi blokkere utdata, sende prompter videre til tryggere eller mindre avanserte modeller, eller eskalere for oppfølging. Oppfølgingen kombinerer automatisert og menneskelig gjennomgang, basert på faktorer som juridiske krav, alvorlighetsgrad og gjentatt atferd. Vi jobber også tett med utviklere og bedriftskunder for å bli enige om sikkerhetsstandarder og muliggjøre ansvarlig bruk med tydelige eskaleringsveier.
Helhetlig red teaming: Vi samarbeider med ekspertorganisasjoner innen red teaming for å evaluere og forbedre sikkerhetstiltakene våre. Jobben deres er å forsøke å omgå alle forsvarsmekanismene våre gjennom hele systemet, akkurat slik en målrettet og ressurssterk motstander kunne ha gjort. Dette hjelper oss med å identifisere mangler tidlig og styrke hele systemet.

Økosysteminitiativer for å styrke cyberrobusthet

OpenAI har tidlig investert i å bruke KI på defensive bruksområder innen cybersikkerhet, og teamet vårt samarbeider tett med globale eksperter for å videreutvikle både modellene våre og bruken av dem. Vi setter pris på det globale fellesskapet av cybersikkerhetsfagfolk som jobber for å gjøre den digitale verdenen vår tryggere, og vi har pålagt oss selv å levere kraftige verktøy som støtter defensivt sikkerhetsarbeid. Etter hvert som vi innfører nye sikkerhetstiltak, vil vi fortsette å samarbeide med cybersikkerhetsmiljøet for å forstå hvor KI virkelig kan styrke motstandskraften, og hvor gjennomtenkte sikkerhetstiltak er viktigst.

Samtidig som vi samarbeider med andre, setter vi i gang tiltak som hjelper sikkerhetsteam med å jobbe raskere, tilpasse sikkerhetstiltakene våre til virkelige behov og akselerere ansvarlig forbedring i stor skala.

Programmer for pålitelig tilgang til cyberforsvar

Vi kommer snart til å lansere et program for klarert tilgang der vi vil utforske muligheten for å gi kvalifiserte brukere og kunder som jobber med cyberforsvar, tilgang til avanserte funksjoner i vår nyeste modell for defensive formål. Vi utforsker fremdeles hvor grensen går for hvilke funksjoner vi kan gi bred tilgang til, og hvilke som trenger nivådelte begrensninger, noe som kan påvirke hvordan dette programmet utformes i fremtiden. Målet er at dette programmet skal være en byggestein for et robust økosystem.

Utvider forsvarskapasiteten med Aardvark

Aardvark, vår agentbaserte sikkerhetsforsker som hjelper utviklere og sikkerhetsteam med å finne og fikse sårbarheter i stor skala, er nå i privat betatest. Den skanner kodebaser etter sårbarheter og foreslår rettelser som vedlikeholdere raskt kan ta i bruk. Den har allerede identifisert nye sikkerhetssårbarheter (CVE-er) i programvare med åpen kildekode ved å bruke resonnering over hele kodebaser. Vi planlegger å tilby gratis sikkerhetsdekning til utvalgte ikke-kommersielle repositorier med åpen kildekode for å bidra til sikkerheten i økosystemet og forsyningskjeden for programvare med åpen kildekode. Søk om å delta her.

Rådet for grenserisiko

Vi skal etablere Grenserisikorådet, en rådgivende gruppe som skal føre erfarne sikkerhetsfagfolk og de som jobber med å forsvare systemer mot cyberangrep, sammen til et tett samarbeid med teamene våre. Dette rådet skal starte med fokus på cybersikkerhet og utvide til andre banebrytende kapabilitetsområder i fremtiden. Medlemmene skal gi råd om grensen mellom nyttig, ansvarlig kapasitet og potensielt misbruk, og det vi lærer av dette, skal direkte informere evalueringene og sikkerhetstiltakene våre. Vi deler snart mer om rådet.

Utvikling av en felles forståelse av trusselmodeller med bransjen

Endelig antar vi at cybermisbruk kan være mulig fra enhver banebrytende modell i bransjen. For å håndtere dette samarbeider vi med andre banebrytende laboratorier gjennom Frontier Model Forum, en ideell organisasjon støttet av ledende KI-laboratorier og bransjepartnere, for å utvikle en felles forståelse av trusselmodeller og beste praksis. I denne sammenhengen bidrar trusselmodellering til å redusere risiko ved å identifisere hvordan KI-funksjoner kan brukes som våpen, hvor det er kritiske flaskehalser for ulike trusselaktører, og hvordan banebrytende modeller kan utgjøre en betydelig forbedring. Dette samarbeidet har som mål å bygge en konsistent og bred forståelse av trusselaktører og angrepsveier, slik at laboratorier, vedlikeholdere og sikkerhetsteam kan forbedre tiltakene sine og sørge for at viktig sikkerhetsinnsikt raskt sprer seg i hele økosystemet. Vi jobber også med eksterne team for å utvikle evalueringer av cybersikkerhet⁠(åpnes i et nytt vindu). Vi håper et økosystem av uavhengige evalueringer vil bidra til å bygge en felles forståelse av modellenes kapasiteter.

Samlet sett viser dette arbeidet vårt langsiktige engasjement i å styrke den defensive delen av økosystemet. Etter hvert som modellene blir bedre, er målet å sørge for at disse kapasitetene gir reell nytte for sikkerhetsteam – basert på virkelige behov, formet av ekspertrådgivning og brukt med omhu. Samtidig planlegger vi å utforske andre initiativer og cybersikkerhetstilskudd for å løfte frem banebrytende ideer som kanskje ikke kommer gjennom tradisjonelle kanaler, og samle inn dristige, kreative forsvarsmekanismer fra akademia, industri og åpen-kildekode-miljøet. Alt i alt er dette et pågående arbeid, og vi forventer å fortsette å utvikle disse programmene mens vi lærer hva som mest effektivt styrker sikkerheten i den virkelige verden.