Vi utökar programmet Trusted Access for Cyber (TAC) till tusentals verifierade enskilda säkerhetsansvariga och hundratals team som har ansvar för att skydda kritisk programvara. Under flera år har vi byggt upp ett program för cyberförsvar som bygger på principerna om demokratiserad tillgång, gradvis införande och ett robust ekosystem. Som förberedelse inför de allt mer avancerade modellerna från OpenAI under de kommande månaderna finjusterar vi våra modeller särskilt för att stödja defensiva användningsfall inom cybersäkerhet. Vi börjar idag med en variant av GPT‑5.4 som är anpassad för sådana ändamål: GPT‑5.4‑Cyber. I det här inlägget förklarar vi hur vi förväntar oss att vårt sätt att utöka cyberförsvaret i takt med den ökande modellkapaciteten kommer att styra testningen och lanseringen av framtida versioner.
En gradvis ökad användning av AI gör det möjligt för säkerhetsansvariga (de som har ansvaret för att skydda system, data och användare) att upptäcka och lösa problem snabbare i den digitala infrastruktur som vi alla är beroende av. På samma sätt används AI av angripare som försöker orsaka skada. Vi har förberett oss för det här. Sedan 2023 har vi stöttat försvarare genom vårt Cybersecurity Grant Program och stärkt skyddsåtgärderna genom vårt Preparedness Framework. Samma år började vi utvärdera modellernas cyberkapacitet, och 2025 började vi inkludera cybersäkerhetsåtgärder(öppnas i ett nytt fönster) i modellanseringarna. Tidigare i år utökade vi vårt stöd till försvarare med lanseringen av Codex Security för att identifiera och åtgärda sårbarheter i stor skala. Vår strategi för denna kontinuerliga utveckling av kapaciteter styrs av tre principer:
- Demokratiserad tillgång: Vårt mål är att göra dessa verktyg så allmänt tillgängliga som möjligt samtidigt som vi förhindrar missbruk. Vi utvecklar mekanismer som undviker godtyckliga beslut om vem som ska få tillgång för legitim användning och vem som inte ska få det. Det innebär att man använder tydliga, objektiva kriterier och metoder (som gedigen KYC- och identitetsverifiering) för att styra vem som ska få tillgång till mer avancerade funktioner och för att automatisera dessa processer över tid. På sikt är vårt mål att göra avancerade försvarsresurser tillgängliga för legitima aktörer, både stora och små, inklusive dem som har ansvaret för att skydda kritisk infrastruktur, offentliga tjänster och de digitala system som människor är beroende av varje dag.
- Iterativ distribution: Gradvis införande: Vi lär oss mest genom att försiktigt ta dessa system i bruk och förbättra dem över tid. Allteftersom vi får en bättre förståelse för både kapaciteter och risker uppdaterar vi modellerna och säkerhetssystemen därefter. Vi måste bland annat förstå de olika fördelarna och riskerna med specifika modeller, förbättra motståndskraften mot jailbreak och andra fientliga attacker samt stärka försvarsförmågan, samtidigt som skadeverkningarna minskas.
- Investering i ekosystemets motståndskraft: Vi stöder och hjälper försvarare att komma igång snabbare genom betrodda åtkomstvägar, riktade bidrag, stöd till säkerhetsinitiativ för öppen källkod(öppnas i ett nytt fönster) och tekniker som Codex Security som hjälper försvarare att snabbare hitta och åtgärda sårbarheter.
Vår strategi för cybersäkerhetens motståndskraft och ökad takt i hela försvarslivscykeln
I flera år har vår strategi för cybersäkerhet varit att investera i forskning, förhindra missbruk och stärka försvarare. I takt med att modellkapaciteterna har blivit mer avancerade har vi utökat våra program i riktning mot dessa mål, som bygger på följande övertygelser:
- Cyberrisker är redan här och ökar ständigt, men vi kan agera. Digital infrastruktur har redan varit sårbar(öppnas i ett nytt fönster) i flera år, redan innan avancerad AI ens kom. Idag kan befintliga modeller bidra till att upptäcka sårbarheter, analysera flera kodbaser och stödja viktiga delar av arbetsflödet inom cybersäkerhet. Men samtidigt experimenterar hotaktörer med nya AI-baserade metoder. Vi har sett att avancerade ramverk kan frigöra allt större kapacitet genom att ge befintliga modeller mer beräkningskraft när de används. Det innebär att skyddsåtgärder inte kan vänta på en enda framtida tröskel.
- Utöka åtkomsten baserat på vem som använder dessa system och hur de används. Cyberkapacitet i sig kan användas både för goda och skadliga ändamål, så risken begränsas inte enbart av modellen. Det beror också på användaren, förtroendesignalerna(öppnas i ett nytt fönster) omkring dem och vilken åtkomstnivå de ges.
- En bred tillgång till generella modeller med säkerhetsåtgärder kan kombineras med mer detaljerade kontrollåtgärder för funktioner med högre risk, understödda av strängare verifiering, tydligare signaler om avsikt och bättre insyn i användningen.
- För att möjliggöra ansvarsfull användning i stor skala behöver vi system som kan verifiera trovärdiga användare och användningsscenarier på ett mer automatiserat och objektivt sätt. Detta gör det möjligt för oss att utvidga tillgången utifrån vetenskapliga rön och konkreta tecken på förtroende, istället för att förlita oss på manuella beslut. Vi anser inte att det är praktiskt eller lämpligt att fatta ett centralt beslut om vem som får försvara sig. Vårt mål är istället att ge så många legitima försvarare som möjligt tillgång, baserat på verifiering, förtroendesignaler och ansvarsskyldighet.
- Skyddsåtgärder bör kontinuerligt anpassas efter kapaciteten. I takt med att modellernas kapacitet ökar behöver skyddsåtgärderna anpassas därefter. Vi har sett ständiga förbättringar inom agentbaserad kodning, vilket har direkt betydelse för cybersäkerheten, och vi har anpassat vår strategi i takt med detta.
- Vi inledde en utbildning i cybersäkerhet med GPT‑5.2 och utökade den sedan med ytterligare säkerhetsåtgärder via GPT‑5.3‑Codex och GPT‑5.4, där vi även klassificerade modellen som uppvisande hög cyberkapacitet inom ramen för vårt Preparedness Framework. Parallellt ökade vi också stödet för försvarare: vi lanserade ett stipendieprogram på 10 miljoner dollar för cybersäkerhet, nådde över 1 000 projekt med öppen källkod med Codex for Open Source(öppnas i ett nytt fönster), som erbjuder kostnadsfria säkerhetsskanning, och fortsatte att förbättra Codex-säkerhet.
- Codex Security, som lanserades i privat beta för sex månader sedan och som en forskningsförhandsvisning tidigare i år, övervakar automatiskt kodbaser, validerar problem och föreslår lösningar. I takt med att modellerna har förbättrats har även systemets precision och användbarhet ökat. Sedan den senaste lanseringen har Codex-säkerhet bidragit till att åtgärda över 3 000 kritiska och högprioriterade sårbarheter, tillsammans med många fler åtgärdade resultat med lägre allvarlighetsgrad i hela ekosystemet.
- I dessa lanseringar har vi också förfinat hur modeller hanterar känsliga förfrågningar, kalibrerat gränserna för vägran och samtidigt utökat betrodd åtkomst genom program som TAC.
- Programvaruutvecklingen i sig måste göras säkrare. Det mest robusta ekosystemet är det som kontinuerligt identifierar, validerar och åtgärdar säkerhetsproblem under hela programvaruutvecklingen. Genom att integrera avancerade kodmodeller och agentbaserade funktioner i utvecklarnas arbetsflöden kan vi ge dem omedelbar och användbar feedback under utvecklingsarbetet, vilket innebär att säkerheten går från punktvisa granskningar och statiska felregister till en kontinuerlig och konkret riskminskning.
Vi vill ge försvarare möjlighet att agera genom att erbjuda dem bred tillgång till avancerade resurser, däribland modeller som är särskilt utformade för cybersäkerhet. I februari lanserade vi Trusted Access for Cyber (TAC) som innefattar både automatiserad identitetsverifiering för enskilda personer – i syfte att minska de hinder som säkerhetskontroller medför i cybersäkerhetsarbetet – och samarbeten med ett begränsat antal organisationer för mer flexibla cybersäkerhetsmodeller.
Idag utökar vi detta program genom att införa ytterligare åtkomstnivåer för användare som är redo att samarbeta med OpenAI för att bekräfta sin roll som förespråkare för cybersäkerhet. Kunder på de högsta nivåerna får tillgång till GPT‑5.4‑Cyber, en modell som är särskilt finjusterad för förbättrade cyberfunktioner och med färre kapacitetsbegränsningar. Det rör sig om en version av GPT‑5.4 som sänker tröskeln för avvisande av legitima användningsområden inom cybersäkerhet och öppnar upp för nya möjligheter inom avancerade defensiva arbetsflöden, särskilt inom binär reverse engineering, vilket gör det möjligt för säkerhetsexperter att analysera kompilerad programvara – för att utvärdera dess skadliga potential, sårbarheter och robusthet – utan att ha tillgång till källkoden.
Eftersom denna modell möjliggör ett bredare användningsområde inleder vi med en begränsad och stegvis utrullning riktad till noggrant granskade säkerhetsleverantörer, organisationer och forskare. Tillgången till modeller som möjliggör fler användningsområden och har cyberkapacitet kan medföra vissa begränsningar, särskilt när det gäller användningsområden utan insyn, såsom noll datalagring(öppnas i ett nytt fönster) (ZDR). Detta gäller särskilt för utvecklare och organisationer som använder våra modeller via tredjepartsplattformar, där OpenAI kan ha mer begränsad insyn i användaren, miljön eller syftet med förfrågan.
Det är enkelt att få åtkomst till TAC:
- Enskilda användare kan verifiera sin identitet på chatgpt.com/cyber(öppnas i ett nytt fönster).
- Företag kan begära betrodd åtkomst för sitt team genom sin OpenAI-representant.
Alla kunder som godkänns genom denna process kommer att få tillgång till versioner av befintliga modeller med färre begränsningar kopplade till de skyddsmekanismer som kan aktiveras i sammanhang med dubbla användningsområden inom cybersäkerhet, i syfte att fortsätta stödja säkerhetsutbildning, defensiv utveckling och ansvarsfull forskning om sårbarheter. Kunder som redan är registrerade hos TAC och som är redo att stärka sin autentisering som legitima aktörer inom cybersäkerhet kan anmäla sitt intresse(öppnas i ett nytt fönster) för ytterligare åtkomstnivåer, bland annat genom att ansöka om åtkomst till GPT‑5.4‑Cyber.
Våra cybersäkerhetsåtgärder är resultatet av flera månaders kontinuerliga förbättringar. Vi anser att de skyddsåtgärder som finns på plats idag minskar cyberriskerna i tillräcklig utsträckning för att möjliggöra en storskalig implementering av de nuvarande modellerna. Vi tror att dessa säkerhetsmekanismer kommer att förbli lämpliga även för kommande, mer kraftfulla modeller, medan de modeller som uttryckligen tränats och gjorts mer tillåtande för användning inom cybersäkerhet kommer att kräva mer kontrollerade implementeringar och lämpliga kontroller.
På längre sikt, för att säkerställa att AI-säkerheten inom cybersäkerhet förblir effektiv, förutser vi också ett behov av mer omfattande skyddsåtgärder för framtida modeller, vars kapacitet snabbt kommer att överträffa den hos de bästa nuvarande modellerna som är utformade för detta ändamål.


