Gå direkt till huvudinnehåll
OpenAI

10 december 2025

Säkerhet

Stärka cybersäkerheten i takt med att AI-förmågor utvecklas

I takt med att våra modeller blir allt mer kapabla inom cybersäkerhet satsar vi på att stärka dem, införa fler skyddsåtgärder och samarbeta med globala säkerhetsexperter.

Laddar …

Cyberkapaciteten i AI-modeller utvecklas snabbt, vilket medför betydande fördelar för cyberförsvar såväl som nya risker med dubbla användningsområden som måste hanteras noggrant. Till exempel har kapacitet som bedömts genom CTF-utmaningar (Capture the Flag) förbättrats från 27 % på GPT‑5(öppnas i ett nytt fönster) i augusti 2025 till 76 % på GPT‑5.1‑Codex‑Max(öppnas i ett nytt fönster) i november 2025.

Vi räknar med att kommande AI-modeller fortsätter på den här utvecklingsbanan. Därför planerar och utvärderar vi som om varje ny modell kan nå ”hög” cybersäkerhetsförmåga, enligt vårt Preparedness Framework(öppnas i ett nytt fönster). Med det menar vi modeller som antingen kan ta fram fungerande fjärrexploateringar av tidigare okända sårbarheter i väl skyddade system, eller som på ett meningsfullt sätt kan bistå vid komplexa, svårupptäckta intrång i företags- eller industrimiljöer med verkliga konsekvenser. I det här inlägget beskriver vi hur vi ser på skyddsåtgärder för modeller som når dessa nivåer – och hur vi säkerställer att de i praktiken stärker försvarssidan samtidigt som risken för missbruk begränsas.

I takt med att de här förmågorna utvecklas satsar OpenAI på att stärka våra modeller för defensiva cybersäkerhetsuppgifter och på att ta fram verktyg som gör det lättare för försvarssidan att utföra arbetsflöden som kodgranskning och korrigering av sårbarheter. Målet är att våra modeller och produkter ska ge tydliga fördelar för försvarare, som ofta är numerärt underlägsna och har begränsade resurser.

Precis som inom andra områden med dubbla användningsområden bygger defensiva och offensiva cyberarbetsflöden ofta på samma underliggande kunskap och tekniker. Därför investerar vi i skyddsåtgärder för att säkerställa att dessa kraftfulla förmågor i första hand kommer defensiva användningsområden till nytta och i så liten utsträckning som möjligt stärker skadliga syften. Cybersäkerhet berör nästan alla områden, vilket innebär att vi inte kan förlita oss på en enda typ av skyddsåtgärd – till exempel att begränsa kunskap eller enbart ge åtkomst till granskade användare – utan i stället behöver ett försvar på flera nivåer som balanserar risk och ger användarna handlingsutrymme. I praktiken innebär det att utforma hur dessa förmågor görs tillgängliga, vägleder användningen och tillämpas, så att avancerade modeller stärker säkerheten i stället för att sänka trösklarna för missbruk.

Vi ser inte detta arbete som en engångsinsats, utan som en långsiktig och uthållig investering för att ge försvararna ett övertag och kontinuerligt stärka säkerhetsläget för den kritiska infrastrukturen i det bredare ekosystemet.

Motverka skadlig användning

Våra modeller är utformade och tränade för att fungera säkert, med stöd av proaktiva system som upptäcker och hanterar cybermissbruk. Vi förfinar kontinuerligt dessa skyddsmekanismer i takt med att våra förmågor utvecklas och hotlandskapet förändras. Inget system kan helt garantera att missbruk inom cybersäkerhet förhindras utan att det samtidigt kraftigt begränsar defensiva användningsområden. Därför bygger vår strategi på att minska riskerna genom ett säkerhetsupplägg i flera lager.

Grunden i detta är ett försvar på flera nivåer, där vi kombinerar åtkomstkontroller, förstärkt infrastruktur, utgående trafikbegränsningar och övervakning. Dessa åtgärder kompletteras med system för upptäckt och respons samt särskilda program för hotunderrättelser och insiderrisker, så att nya hot snabbt kan identifieras och stoppas. Skyddsåtgärderna är utformade för att utvecklas i takt med hotlandskapet. Vi utgår från att förändring är konstant och bygger därför på ett sätt som gör att vi snabbt och ändamålsenligt kan anpassa oss.

Bygger vidare på denna grund:

  • Att träna modellen att vägra eller svara på ett tryggt sätt på skadliga förfrågningar samtidigt som den förblir hjälpsam för utbildnings- och defensiva användningsfall: Vi tränar våra banbrytande modeller att vägra svara eller svara på ett tryggt sätt på förfrågningar som skulle möjliggöra tydligt cybermissbruk, samtidigt som de förblir maximalt hjälpsamma för legitima defensiva och utbildningsrelaterade användningsfall.
  • Detektionssystem: Vi utvecklar och upprätthåller systemövergripande övervakning i produkter som använder banbrytande modeller för att identifiera potentiellt skadlig cyberaktivitet. När aktivitet bedöms som osäker kan vi blockera utdata, styra om förfrågningar till säkrare eller mindre kapabla modeller, eller eskalera ärendet för åtgärd. Våra åtgärder bygger på en kombination av automatiserad och manuell granskning, med hänsyn till faktorer som juridiska krav, allvarlighetsgrad och upprepade beteenden. Vi samarbetar också nära med utvecklare och företagskunder för att enas om säkerhetsstandarder och möjliggöra ansvarsfull användning med tydliga eskaleringsvägar.
  • End-to-end read teaming: Vi samarbetar med specialiserade red teaming-organisationer för att utvärdera och förbättra våra skyddsåtgärder. Deras uppdrag är att försöka kringgå hela vårt försvar, från början till slut, på samma sätt som en målmedveten och resursstark angripare skulle göra. Det hjälper oss att tidigt identifiera brister och stärka systemet i sin helhet.

Initiativ inom ekosystemet för att stärka cybersäkerhetens motståndskraft 

OpenAI har tidigt investerat i att använda AI för defensiva cybersäkerhetstillämpningar, och vårt team samarbetar nära med globala experter för att vidareutveckla både våra modeller och hur de används i praktiken. Vi värdesätter den globala gemenskap av cybersäkerhetsutövare som arbetar för att göra vår digitala värld säkrare och är fast beslutna att leverera kraftfulla verktyg som stärker det defensiva säkerhetsarbetet. I takt med att vi inför nya skyddsåtgärder fortsätter vi att samarbeta med cybersäkerhetscommunityn för att förstå var AI kan bidra till ökad motståndskraft på ett meningsfullt sätt, och var genomtänkta skydd är som viktigast.

Parallellt med dessa samarbeten etablerar vi en rad initiativ som syftar till att hjälpa försvarare att agera snabbare, förankra våra skyddsåtgärder i verkliga behov och påskynda ansvarsfulla lösningar i stor skala.

Program för betrodd åtkomst för cyberförsvar

Vi kommer inom kort att lansera ett program för betrodd åtkomst, där vi undersöker möjligheten att ge kvalificerade användare och kunder som arbetar med cyberförsvar nivåindelad åtkomst till utökade funktioner i våra senaste modeller för defensiva användningsområden. Vi utforskar fortfarande var gränsen bör dras för vilka funktioner som kan göras brett tillgängliga och vilka som kräver differentierade begränsningar, vilket kan komma att påverka programmets framtida utformning. Målet är att detta program för betrodd åtkomst ska bli en byggsten i ett robust och motståndskraftigt ekosystem.

Utöka försvarskapaciteten med Aardvark

Aardvark, vår agentiska säkerhetsforskare, som hjälper utvecklare och säkerhetsteam att identifiera och åtgärda sårbarheter i stor skala, finns nu i privat beta. Den genomsöker kodbaser efter sårbarheter och föreslår korrigeringar som snabbt kan implementeras av förvaltare. Den har redan identifierat nya CVE:er i öppen källkod genom att resonera över hela kodbaser i sitt sammanhang. Vi planerar att erbjuda kostnadsfri täckning för utvalda icke-kommersiella open source-förvar för att bidra till säkerheten i ekosystemet kring öppen källkod och dess leverantörskedjor. Ansök om att delta här.

Råd för frontlinjerisk

Vi kommer att inrätta ett råd för frontlinjerisk, en rådgivande grupp med erfarna cyberförsvarare och säkerhetsexperter i nära samarbete med våra team. Rådet kommer inledningsvis att fokusera på cybersäkerhet och därefter utvidgas till andra områden med banbrytande förmågor. Medlemmarna kommer att ge vägledning kring gränsdragningen mellan användbar, ansvarsfull kapacitet och potentiellt missbruk, och dessa insikter kommer direkt att ligga till grund för våra utvärderingar och skyddsåtgärder. Vi återkommer inom kort med mer information om rådet. 

Skapa en gemensam förståelse för hotmodeller med branschen

Slutligen räknar vi med att cyberrelaterat missbruk kan bli möjligt med vilken banbrytande modell som helst i branschen. För att hantera detta samarbetar vi med andra banbrytande AI-labb genom Frontier Model Forum, en ideell organisation som stöds av framstående AI-aktörer och branschpartners, för att utveckla en gemensam förståelse för hotmodeller och bästa praxis. I detta sammanhang innebär hotmodellering att minska risk genom att identifiera hur AI-förmågor kan utnyttjas i skadligt syfte, var kritiska flaskhalsar finns för olika typer av hotaktörer och hur banbrytande modeller kan ge ett meningsfullt kapacitetstillskott. Syftet med samarbetet är att bygga en enhetlig, ekosystemövergripande förståelse för hotaktörer och angreppsvägar, så att labb, förvaltare och försvarare bättre kan utveckla sina skyddsåtgärder och säkerställa att kritiska säkerhetsinsikter snabbt sprids i ekosystemet. Vi samarbetar också med externa team för att ta fram cybersäkerhetsutvärderingar(öppnas i ett nytt fönster). Vår förhoppning är att ett ekosystem av oberoende utvärderingar ytterligare ska bidra till en gemensam förståelse av modellernas förmågor.

Sammantaget speglar dessa insatser vårt långsiktiga åtagande att stärka den defensiva sidan av ekosystemet. I takt med att modellerna blir mer kapabla är vårt mål att säkerställa att dessa förmågor omsätts i verklig effekt för försvarare – förankrade i faktiska behov, formade av expertkunskap och införda med omsorg. Parallellt planerar vi att utforska fler initiativ och cybersäkerhetsbidrag för att lyfta fram banbrytande idéer som kanske inte fångas upp i traditionella processer, samt att samla in djärva och kreativa försvarslösningar från akademin, industrin och open source-communityn. Sammantaget är detta ett pågående arbete, och vi räknar med att fortsätta utveckla dessa program i takt med att vi lär oss vad som mest effektivt stärker den praktiska säkerheten i verkligheten.

Författare

OpenAI