10. december 2025

Styrkelse af cyberrobusthed, efterhånden som AI-kapaciteterne udvikler sig

Efterhånden som vores modeller bliver mere dygtige inden for cybersikkerhed, investerer vi i at styrke dem, udvide sikkerhedsforanstaltningerne og samarbejde med globale sikkerhedseksperter.

Indlæser ...

Cyberkapaciteterne i AI-modeller udvikler sig hurtigt, hvilket medfører betydelige fordele for cyberforsvaret, men også nye risici for dobbelt anvendelse, som skal håndteres med omhu. For eksempel er kapaciteter, der er vurderet gennem capture-the-flag-udfordringer (CTF), forbedret fra 27 % på GPT‑5⁠(åbner i et nyt vindue) i august 2025 til 76 % på GPT‑5.1‑Codex‑Max⁠(åbner i et nyt vindue) i november 2025.

Vi forventer, at kommende AI-modeller vil fortsætte på denne udviklingsvej; som forberedelse planlægger og evaluerer vi, som om hver ny model kunne nå et 'Højt' niveau af cybersikkerhedskapacitet, målt efter vores Preparedness Framework⁠(åbner i et nyt vindue). Med dette mener vi modeller, der enten kan udvikle fungerende zero-day fjernangreb mod velforsvarede systemer eller meningsfuldt hjælpe med komplekse, skjulte virksomheds- eller industrielle indtrængningsoperationer rettet mod virkelige effekter. Dette indlæg forklarer, hvordan vi tænker på sikkerhedsforanstaltninger for modeller, der når disse niveauer af kapacitet, og sikrer, at de meningsfuldt hjælper forsvarere, samtidig med at misbrug begrænses.

Efterhånden som disse funktioner udvikler sig, investerer OpenAI i at styrke vores modeller til defensive cybersikkerhedsopgaver og skabe værktøjer, der gør det muligt for forsvarere lettere at udføre arbejdsgange såsom koderevision og opdatering af sårbarheder. Vores mål er, at vores modeller og produkter skal give betydelige fordele for forsvarere, som ofte er i undertal og har for få ressourcer.

Ligesom andre domæner med dobbelt anvendelse er defensive og offensive cyberarbejdsgange ofte afhængige af den samme underliggende viden og teknikker. Vi investerer i sikkerhedsforanstaltninger for at sikre, at disse kraftfulde funktioner primært gavner defensive anvendelser og begrænser opsving til ondsindede formål. Cybersikkerhed berører næsten alle områder, hvilket betyder, at vi ikke kan stole på en enkelt kategori af sikkerhedsforanstaltninger, såsom at begrænse viden eller bruge verificeret adgang alene, men i stedet har brug for en dybdegående tilgang, der balancerer risiko og styrker brugerne. I praksis betyder det at udforme, hvordan funktioner tilgås, styres og anvendes, så avancerede modeller styrker sikkerheden i stedet for at sænke barriererne for misbrug.

Vi ser dette arbejde ikke som en engangsindsats, men som en vedvarende, langsigtet investering i at give forsvarerne en fordel og løbende styrke sikkerhedsstillingen for den kritiske infrastruktur på tværs af det bredere økosystem.

Afbødning af ondsindet brug

Vores modeller er designet og trænet til at fungere sikkert, understøttet af proaktive systemer, der opdager og reagerer på cybermisbrug. Vi forbedrer løbende disse beskyttelser, efterhånden som vores evner og trusselsbilledet ændrer sig. Selvom intet system kan garantere fuldstændig forebyggelse af misbrug inden for cybersikkerhed uden at påvirke defensiv brug alvorligt, er vores strategi at afbøde risikoen gennem en lagdelt sikkerhedsstak.

Som fundament for dette har vi en dybdegående tilgang, der er afhængig af en kombination af adgangskontrol, styrkelse af infrastruktur, udgangskontrol og overvågning. Vi supplerer disse foranstaltninger med detektions- og reaktionssystemer samt dedikerede trusselsefterretnings- og insiderrisikoprogrammer, der gør det muligt at identificere og blokere nye trusler hurtigt. Disse sikkerhedsforanstaltninger er designet til at udvikle sig i takt med trusselsbilledet. Vi forudsætter forandringer, og vi bygger, så vi kan tilpasse os hurtigt og passende.

Bygger på dette fundament:

Træning af modellen til at afvise eller sikkert reagere på skadelige anmodninger, samtidig med at den forbliver nyttig til uddannelsesmæssige og defensive anvendelsesscenarier: Vi træner vores banebrydende modeller til at afvise eller sikkert reagere på anmodninger, der muliggør klart cybermisbrug, samtidig med at de forbliver maksimalt nyttige til legitime defensive og uddannelsesmæssige anvendelsesscenarier.
Detektionssystemer: Vi forbedrer og vedligeholder systemomfattende overvågning på tværs af produkter, der bruger banebrydende modeller til at registrere potentielt ondsindet cyberaktivitet. Når aktiviteten virker usikker, kan vi blokere output, dirigere prompts til sikrere eller mindre kompatible modeller eller eskalere for håndhævelse. Vores håndhævelse kombinerer automatiseret og menneskelig gennemgang, baseret på faktorer som juridiske krav, alvorlighedsgrad og gentagen adfærd. Vi arbejder også tæt sammen med udviklere og virksomhedskunder for at afstemme sikkerhedsstandarder og muliggøre ansvarlig brug med klare eskaleringsveje.
End-to-end red teaming: Vi samarbejder med ekspertorganisationer inden for red teaming for at evaluere og forbedre vores sikkerhedsforanstaltninger. Deres opgave er at forsøge at omgå alle vores forsvarsmekanismer ved at arbejde end-to-end, ligesom en målrettet og veludstyret modstander kunne gøre. Dette hjælper os med at identificere huller tidligt og styrke hele systemet.

Initiativer i økosystemet til at styrke cybersikkerhed

OpenAI har tidligt investeret i at anvende kunstig intelligens i defensive cybersikkerhedsscenarier, og vores team koordinerer tæt med globale eksperter for at modne både vores modeller og deres anvendelse. Vi værdsætter det globale fællesskab af cybersikkerhedseksperter, der arbejder hårdt for at gøre vores digitale verden mere sikker, og vi er fast besluttede på at levere effektive værktøjer, der understøtter defensiv sikkerhed. I takt med at vi indfører nye sikkerhedsforanstaltninger, vil vi fortsat samarbejde med cybersikkerhedsmiljøet for at få indsigt i, hvor kunstig intelligens på en meningsfuld måde kan styrke modstandsdygtigheden, og hvor gennemtænkte sikkerhedsforanstaltninger er af størst betydning.

Sideløbende med disse samarbejder iværksætter vi en række tiltag, der skal hjælpe sikkerhedsaktører med at handle hurtigere, sikre, at vores sikkerhedsforanstaltninger tager udgangspunkt i virkelighedens behov, og fremskynde ansvarlig afhjælpning i stor skala.

Pålidelige adgangsprogrammer til cyberforsvar

Vi vil snart lancere et program for betroet adgang, hvor vi undersøger muligheden for at give kvalificerede brugere og kunder, der arbejder med cyberforsvar, differentieret adgang til udvidede funktioner i vores nyeste modeller til brug i forbindelse med forsvar. Vi undersøger stadig den rette grænse for, hvilke funktioner vi kan give bred adgang til, og hvilke der kræver graduerede begrænsninger, hvilket kan påvirke den fremtidige udformning af dette program. Vores mål er, at dette program for pålidelig adgang skal udgøre en byggesten i et robust økosystem.

Udvidelse af forsvarskapaciteten med Aardvark

Aardvark, vores agentbaserede sikkerhedsforskningsværktøj, der hjælper udviklere og sikkerhedsteams med at finde og rette sårbarheder i stor skala, er nu i privat betaversion. Det scanner kodebaser for sårbarheder og foreslår rettelser, som vedligeholdere hurtigt kan implementere. Det har allerede identificeret nye CVE'er i open source-software ved at analysere hele kodebaser. Vi planlægger at tilbyde gratis dækning til udvalgte ikke-kommercielle open source-arkiver for at bidrage til sikkerheden i open source-softwareøkosystemet og forsyningskæden. Ansøg om at deltage her.

Frontier Risk Council

Vi vil oprette Frontier Risk Council, en rådgivende gruppe, der skal sikre et tæt samarbejde mellem erfarne cybersikkerhedseksperter og sikkerhedsfolk og vores teams. Dette råd vil i første omgang fokusere på cybersikkerhed og fremover udvide sit virkefelt til andre banebrydende kompetenceområder. Medlemmerne vil give rådgivning om grænsen mellem nyttig og ansvarlig anvendelse og potentielt misbrug, og disse erfaringer vil indgå direkte i vores evalueringer og sikkerhedsforanstaltninger. Vi vil snart dele flere detaljer om rådet.

Udvikling af en fælles forståelse af trusselsmodeller i samarbejde med branchen

Endelig forventer vi, at cybermisbrug kan forekomme i alle forretningsmodeller inden for branchen. For at imødegå dette samarbejder vi med andre banebrydende laboratorier gennem Frontier Model Forum, en nonprofitorganisation støttet af førende AI-laboratorier og partnere i branchen, med henblik på at skabe en fælles forståelse af trusselsmodeller og bedste praksis. I denne sammenhæng bidrager trusselsmodellering til at mindske risikoen ved at kortlægge, hvordan AI-funktioner kan misbruges, hvor der findes kritiske flaskehalse for forskellige trusselsaktører, og hvordan banebrydende modeller kan give et betydeligt løft. Dette samarbejde har til formål at skabe en ensartet forståelse af trusselsaktører og angrebsveje på tværs af hele økosystemet, så laboratorier, vedligeholdere og sikkerhedsansvarlige bedre kan forbedre deres afværgetiltag og sikre, at vigtige sikkerhedsoplysninger hurtigt spredes i hele økosystemet. Vi samarbejder desuden med eksterne teams om at udarbejde cybersikkerhedsvurderinger⁠(åbner i et nyt vindue). Vi håber, at et netværk af uafhængige evalueringer vil bidrage yderligere til at skabe en fælles forståelse af modellernes muligheder.

Tilsammen afspejler disse tiltag vores langsigtede engagement i at styrke økosystemets forsvar. I takt med at modellerne bliver mere avancerede, er det vores mål at bidrage til, at disse muligheder omsættes til reelle fordele for de ansvarlige – baseret på virkelighedens behov, udformet med input fra eksperter og implementeret med omhu. Sideløbende med dette arbejde planlægger vi at undersøge andre initiativer og tilskud til cybersikkerhed for at fremme banebrydende idéer, der måske ikke opstår gennem de traditionelle kanaler, og for at indhente dristige, kreative forsvarsløsninger fra hele den akademiske verden, erhvervslivet og open source-miljøet. Alt i alt er dette et løbende arbejde, og vi forventer at fortsætte med at videreudvikle disse programmer, efterhånden som vi får indsigt i, hvad der mest effektivt fremmer sikkerheden i praksis.