Vi utvider Trusted Access for Cyber-programmet (TAC) til tusenvis av verifiserte individuelle forsvarere og hundrevis av team som har ansvar for å forsvare kritisk programvare. I flere år har vi bygget opp et program for cyberforsvar basert på prinsippene om demokratisert tilgang, gradvis lansering og robusthet i økosystemet. Som forberedelse på stadig mer kapable modeller fra OpenAI de kommende månedene, finjusterer vi modellene våre spesielt for å støtte defensive brukstilfeller innen cybersikkerhet. Vi starter i dag med en variant av GPT‑5.4 som er tilpasset slike formål: GPT‑5.4‑Cyber. I dette innlegget forklarer vi hvordan vi mener at vår metode for utvidelse av cyberforsvaret i takt med økende modellkapasitet vil veilede testingen og utrullingen av fremtidige lanseringer.
En gradvist økende bruk av KI gjør forsvarerne (de som har ansvar for å holde systemer, data og brukere trygge) i stand til å finne og løse problemer raskere i den digitale infrastrukturen som alle er avhengige av. KI blir brukt på samme måte av angripere som ønsker å forårsake skade. Dette har vi forberedt oss på. Siden 2023 har vi støttet forsvarere gjennom vårt tilskuddsprogram for cybersikkerhet og styrket sikkerhetstiltakene gjennom vårt Preparedness Framework. Samme år begynte vi å evaluere cyberkapasitetene til modellene våre, og i 2025 begynte vi å inkludere cyberspesifikke sikkerhetstiltak(åpnes i et nytt vindu) i modellutrullingene. Tidligere i år forsterket vi støtten til forsvarere med lanseringen av Codex-sikkerhet for å identifisere og utbedre sårbarheter i stor skala. Tilnærmingen vår til denne kontinuerlige utviklingen av kapasiteter veiledes av tre prinsipper:
- Demokratisert tilgang: Målet vårt er å gjøre disse verktøyene så bredt tilgjengelige som mulig, samtidig som vi forhindrer misbruk. Vi utvikler mekanismer som unngår vilkårlige avgjørelser om hvem som får tilgang for legitim bruk, og hvem som ikke får det. Det betyr bruk av tydelige, objektive kriterier og metoder (som robust KYC- og identitetsverifisering) for å styre hvem som kan få tilgang til mer avanserte funksjoner og for å automatisere disse prosessene over tid. På sikt har vi som mål å gjøre avanserte forsvarskapasiteter tilgjengelige for legitime aktører, både store og små, inkludert dem som har ansvar for å beskytte kritisk infrastruktur, offentlige tjenester og de digitale systemene folk er avhengige av hver dag.
- Gradvis utrulling: Vi lærer mest ved å ta disse systemene forsiktig i bruk og forbedre dem over tid. Etter hvert som vi får en bedre forståelse av både kapasiteter og risikoer, oppdaterer vi modellene og sikkerhetssystemene deretter. Vi må blant annet forstå de ulike fordelene og risikoene ved spesifikke modeller, forbedre robustheten mot jailbreak og andre fiendtlige angrep samt styrke forsvarsevnene, samtidig som skadevirkningene reduseres.
- Investering i økosystemets robusthet: Vi støtter og hjelper forsvarere med å komme raskere i gang gjennom trygge tilgangsveier, målrettede tilskudd, bidrag til sikkerhetsinitiativer for åpen kildekode(åpnes i et nytt vindu) og teknologier som Codex Security, som hjelper forsvarere med å finne og utbedre sårbarheter raskere.
Strategien vår for robusthet innen cybersikkerhet og tempoøkning i hele forsvarslivssyklusen
I årevis har cybersikkerhetsstrategien vår vært å investere i forskning, forebygge misbruk og øke tempoet i utviklingen av forsvarerne. Etter hvert som modellkapasitetene har blitt mer avanserte, har vi utvidet programmene våre i retning av disse målene, som bygger på følgende overbevisninger:
- Cyberrisiko eksisterer allerede og øker raskt, men vi kan gjøre noe med det. Digital infrastruktur har allerede vært sårbar(åpnes i et nytt vindu) i årevis, før avansert KI i det hele tatt kom på banen. Nå kan eksisterende modeller bidra til å finne sårbarheter, resonnere på tvers av flere kodebaser og støtte viktige deler av arbeidsflyten innen cybersikkerhet. Men samtidig eksperimenterer trusselaktører med nye KI-drevne tilnærminger. Vi har sett at avanserte rammeverk kan utløse stadig sterkere kapasiteter ved å gi eksisterende modeller mer beregningskraft under bruk. Det betyr at sikkerhetstiltak ikke kan vente på én enkelt fremtidig terskel.
- Utvid tilgangen basert på hvem som bruker disse systemene og hvordan de brukes. Cyberkapasitet i seg selv kan brukes til både gode og skadelige formål, så risikoen er ikke bare begrenset av modellen. Det avhenger også av brukerne, tillitsindikatorene(åpnes i et nytt vindu) rundt dem og tilgangsnivået de blir gitt.
- Bred tilgang til generelle modeller med sikkerhetstiltak kan eksistere side om side med mer finjusterte kontroller for funksjoner med høyere risiko, støttet av strengere verifisering, tydeligere indikasjoner på hensikt og bedre innsikt i bruken.
- For å gjøre ansvarlig bruk i stor skala mulig trenger vi systemer som kan verifisere pålitelige brukere og brukstilfeller på mer automatiserte og objektive måter. Dermed kan vi utvide tilgangen basert på dokumentasjon og reelle tillitsindikasjoner, i stedet for å basere oss på manuelle beslutninger. Vi mener at det verken er praktisk eller riktig at det skal bestemmes sentralt hvem som skal få forsvare seg. I stedet har vi som mål å gi tilgang til så mange legitime forsvarere som mulig, ved hjelp av verifisering, tillitsindikasjoner og ansvarlighet.
- Forsvar bør kontinuerlig skaleres i takt med kapasiteten. Etter hvert som modellenes kapasiteter øker, må forsvaret skaleres i takt med dem. Vi har sett stadige forbedringer i agentisk koding, noe som har direkte konsekvenser for cybersikkerhet, og vi har tilpasset vår tilnærming deretter.
- Vi begynte med cyberspesifikk sikkerhetstrening med GPT‑5.2, og utvidet den deretter med ytterligere sikkerhetstiltak gjennom GPT‑5.3‑Codex og GPT‑5.4, der vi også klassifiserte modellen som «høy» cyberkapasitet i henhold til vårt Preparedness Framework. Parallelt med dette økte vi støtten til forsvarere: Vi lanserte et cybersikkerhetsstipendprogram på 10 millioner dollar, nådde over 1000 åpen kildekode-prosjekter med Codex for åpen kildekode(åpnes i et nytt vindu), som tilbyr gratis sikkerhetsskanning, og fortsatte å forbedre Codex Security.
- Codex Security, som ble lansert i privat beta for seks måneder siden og tidligere i år som en eksperimentell forhåndsversjon, overvåker kodebaser automatisk, validerer problemer og foreslår utbedringer. Etter hvert som modellene har blitt bedre, har også systemets presisjon og nytteverdi økt. Siden den nylige lanseringen har Codex Security bidratt til å utbedre over 3000 kritiske og alvorlige sårbarheter, samt mange flere funn med lavere alvorlighetsgrad gjennom hele økosystemet.
- I alle disse lanseringene har vi også forbedret hvordan modeller håndterer sensitive forespørsler, justert grensene for avslag og samtidig utvidet trygg tilgang gjennom programmer som TAC.
- Selve programvareutviklingen må gjøres sikrere. Det sterkeste økosystemet er et som kontinuerlig identifiserer, validerer og løser sikkerhetsproblemer mens programvaren skrives. Ved å integrere avanserte kodemodeller og agentiske funksjoner i utviklernes arbeidsflyter kan vi gi utviklerne umiddelbare, konkrete tilbakemeldinger mens de bygger, og flytte grunnlaget for sikkerhet fra sporadiske revisjoner og statiske feiloversikter til kontinuerlig, konkret risikoreduksjon.
Vi ønsker å styrke forsvarerne ved å gi bred tilgang til banebrytende funksjoner, inkludert modeller som er skreddersydd for cybersikkerhet. I februar lanserte vi Trusted Access for Cyber (TAC). Ordningen omfatter både automatisert identitetsverifisering for enkeltpersoner, for å redusere friksjon i sikkerhetstiltak knyttet til cybersikkerhetsoppgaver, og samarbeid med et begrenset utvalg organisasjoner om modeller med større handlingsrom innen cybersikkerhet.
I dag utvider vi dette programmet ved å innføre flere tilgangsnivåer for brukere som er villige til å samarbeide med OpenAI om å verifisere at de er sikkerhetsfagfolk som arbeider med å beskytte systemer. Kunder på de høyeste nivåene vil få tilgang til GPT‑5.4‑Cyber, en modell som er spesielt finjustert for ytterligere cyberkapasiteter og med færre kapasitetsbegrensninger. Dette er en versjon av GPT‑5.4 som senker terskelen for å gi svar i legitimt cybersikkerhetsarbeid, og som muliggjør nye kapasiteter for avanserte defensive arbeidsflyter. Dette inkluderer blant annet støtte for binær reversering, som gjør det mulig for sikkerhetsfagfolk å analysere kompilert programvare for mulig skadevare, sårbarheter og sikkerhetsrobusthet, selv om de ikke har tilgang til kildekoden.
Fordi denne modellen gir større handlingsrom, starter vi med en begrenset og gradvis utrulling til forhåndsgodkjente sikkerhetsleverandører, organisasjoner og forskere. Tilgang til mer fleksible og cyberspesifikke modeller kan være underlagt begrensninger, særlig i bruksscenarioer der det ikke er innsyn i datahåndtering, som ved ingen oppbevaring av data(åpnes i et nytt vindu) (ZDR). Dette gjelder særlig for utviklere og organisasjoner som benytter modellene via tredjepartsplattformer, hvor OpenAI har redusert innsikt i hvem brukeren er, hvilket miljø modellen kjøres i, og formålet med forespørselen.
Det er enkelt å få tilgang til TAC:
- Enkeltpersoner kan bekrefte identiteten sin på chatgpt.com/cyber(åpnes i et nytt vindu).
- Bedrifter kan be om pålitelig tilgang for teamet sitt gjennom OpenAI-representanten sin.
Alle kunder som godkjennes gjennom denne prosessen, får tilgang til versjoner av eksisterende modeller med færre hindringer fra sikkerhetstiltak som ellers kan bli utløst av cyberaktivitet med dobbel bruk. Dette gjør det mulig for dem å fortsette å støtte sikkerhetsopplæring, defensiv programmering og ansvarlig sårbarhetsforskning. Kunder som allerede er i TAC og er villige til å autentisere seg ytterligere som legitime cyberforsvarere, kan melde sin interesse(åpnes i et nytt vindu) for ytterligere tilgangsnivåer, inkludert GPT‑5.4‑Cyber.
Cybersikkerhetsforsvaret vårt er resultatet av mange måneders gradvise forbedringer. Vi mener at typen sikkerhetstiltak som brukes i dag, reduserer cyberrisiko tilstrekkelig til å støtte bred utrulling av dagens modell. Vi forventer at versjoner av disse sikkerhetstiltakene vil være gode nok for kommende, mer kraftfulle modeller. Men modeller som er spesielt trent for å være mer åpne med hensyn til cybersikkerhetsarbeid, må derimot brukes med mer begrenset tilgang og ekstra sikkerhetskontroller.
For å sikre at sikkerhetsmekanismene rundt bruk av KI i cybersikkerhet fortsatt er tilstrekkelige på lang sikt forventer vi også behov for mer omfattende beskyttelsestiltak for fremtidige modeller, som vil få kapasiteter som raskt overgår selv dagens spesialiserte modeller.


