Stärkung der Cyber-Resilienz angesichts zunehmender KI-Fähigkeiten
Da unsere Modelle im Bereich der Cybersicherheit immer leistungsfähiger werden, investieren wir in ihre Stärkung, ergreifen zusätzliche Schutzmaßnahmen und arbeiten mit globalen Sicherheitsexpert:innen zusammen.
Die Cyberfähigkeiten von KI-Modellen entwickeln sich rasant weiter, was erhebliche Vorteile für die Cyberabwehr mit sich bringt, aber auch neue Dual-Use-Risiken, die sorgfältig gehandhabt werden müssen. So haben sich beispielsweise die durch Capture-the-Flag-(CTF)-Challenges bewerteten Fähigkeiten von 27 % bei GPT‑5(wird in einem neuen Fenster geöffnet) im August 2025 auf 76 % bei GPT‑5.1‑Codex‑Max(wird in einem neuen Fenster geöffnet) im November 2025 verbessert.
Wir erwarten, dass die kommenden KI-Modelle diesen Kurs beibehalten werden; zur Vorbereitung darauf planen und evaluieren wir so, als ob jedes neue Modell die Fähigkeitsstufe „Hoch“ im Bereich der Cybersicherheit erreichen könnte, gemessen anhand unseres Preparedness Framework(wird in einem neuen Fenster geöffnet). Damit meinen wir Modelle, die entweder funktionsfähige Zero-Day-Remote-Exploits gegen gut geschützte Systeme entwickeln können oder komplexe, verdeckt durchgeführte Eindringungsoperationen in Unternehmens- oder Industrieumgebungen, die auf reale Auswirkungen abzielen, sinnvoll unterstützen können. In diesem Beitrag erläutern wir, wie wir über Schutzmaßnahmen für Modelle denken, die diese Fähigkeitsstufen erreichen, und wie wir sicherstellen, dass sie Verteidiger:innen sinnvoll helfen und gleichzeitig Missbrauch begrenzen.
Mit dem Fortschreiten dieser Fähigkeiten investiert OpenAI in die Stärkung unserer Modelle für defensive Cybersicherheitsaufgaben und die Entwicklung von Tools, die Verteidiger:innen erleichtern, Arbeitsabläufe wie das Überprüfen von Code und das Beheben von Schwachstellen effizienter durchzuführen. Unser Ziel ist es, dass unsere Modelle und Produkte Verteidiger:innen, die oft zahlenmäßig unterlegen und mit unzureichenden Ressourcen ausgestattet sind, erhebliche Vorteile verschaffen.
Wie in anderen Dual-Use-Bereichen beruhen defensive und offensive Cyber-Workflows oft auf denselben grundlegenden Kenntnissen und Techniken. Wir investieren in Schutzmaßnahmen, um sicherzustellen, dass diese leistungsstarken Fähigkeiten in erster Linie defensiven Zwecken dienen, und den Nutzen für böswillige Absichten einzuschränken. Cybersicherheit betrifft nahezu jeden Bereich, was bedeutet, dass wir uns nicht nur auf eine einzelne Kategorie von Schutzmaßnahmen verlassen können – wie z. B. die Beschränkung von Wissen oder ausschließlich geprüften Zugriff –, sondern einen mehrschichtigen Verteidigungsansatz benötigen, der Risiken ausgleicht und Nutzer:innen stärkt. In der Praxis bedeutet dies, zu gestalten, wie Fähigkeiten zugänglich gemacht, gesteuert und angewendet werden, sodass fortschrittliche Modelle die Sicherheit stärken, anstatt die Hürden für Missbrauch zu senken.
Wir betrachten diese Arbeit nicht als eine einmalige Maßnahme, sondern als eine dauerhafte, langfristige Investition, um Verteidiger:innen einen Vorteil zu verschaffen und die Sicherheitslage der kritischen Infrastruktur im breiteren Ökosystem kontinuierlich zu stärken.
Unsere Modelle sind so konzipiert und trainiert, dass sie sicher arbeiten. Sie werden durch proaktive Systeme unterstützt, die Cybermissbrauch erkennen und darauf reagieren. Wir entwickeln diese Schutzmaßnahmen kontinuierlich weiter, während sich unsere Fähigkeiten und die Bedrohungslandschaft verändern. Während kein System garantieren kann, Missbrauch im Bereich der Cybersicherheit vollständig zu verhindern, ohne defensive Anwendungsfälle erheblich zu beeinträchtigen, besteht unsere Strategie darin, Risiken durch einen mehrschichtigen Sicherheits-Stack zu mindern.
Grundlage hierfür ist ein mehrschichtiger Sicherheitsansatz, der auf einer Kombination aus Zugriffskontrollen, Absicherung der Infrastruktur, Ausgangskontrollen und Überwachung basiert. Wir ergänzen diese Maßnahmen durch Systeme zur Erkennung und Reaktion sowie durch spezielle Programme für Bedrohungsinformationen und Insider-Risiken, sodass neu entstehende Bedrohungen schnell erkannt und abgewehrt werden. Diese Schutzmechanismen sind darauf ausgelegt, sich mit der Bedrohungslandschaft weiterzuentwickeln. Wir gehen von Veränderungen aus und entwickeln so, dass wir uns schnell und angemessen anpassen können.
Auf diesem Fundament baut Folgendes auf:
- Training des Modells, sodass es schädliche Anfragen ablehnt oder sicher beantwortet und gleichzeitig bei legitimen defensiven und pädagogischen Anwendungsfällen so hilfreich wie möglich bleibt: Wir trainieren unsere Frontier-Modelle darauf, Anfragen abzulehnen oder sicher zu beantworten, die eindeutigen Cybermissbrauch ermöglichen würden, und gleichzeitig bei legitimen defensiven und pädagogischen Anwendungsfällen so hilfreich wie möglich zu bleiben.
- Erkennungssysteme: Wir verfeinern und pflegen die systemweite Überwachung von Produkten, die Frontier-Modelle verwenden, um potenziell bösartige Cyberaktivitäten zu erkennen. Wenn Aktivitäten unsicher erscheinen, können wir Ausgaben blockieren, Prompts an sicherere oder weniger leistungsfähige Modelle weiterleiten oder die Angelegenheit zur Durchsetzung der Richtlinien eskalieren. Unsere Durchsetzung kombiniert automatisierte und menschliche Überprüfungen, wobei Faktoren wie gesetzliche Anforderungen, die Schwere des Verstoßes und wiederholtes Verhalten berücksichtigt werden. Wir arbeiten eng mit Entwickler:innen und Unternehmenskund:innen zusammen, um Sicherheitsstandards abzustimmen und eine verantwortungsvolle Nutzung mit klaren Eskalationswegen zu ermöglichen.
- End-to-end-Red-Teaming: Wir arbeiten mit erfahrenen Red-Teaming-Organisationen zusammen, um unsere Sicherheitsmaßnahmen zu bewerten und zu verbessern. Ihre Aufgabe ist es, zu versuchen, all unsere Abwehrmaßnahmen zu umgehen, indem sie einen End-to-End-Ansatz verfolgen – genau wie es ein entschlossener und gut ausgestatteter Angreifer tun könnte. Dies hilft uns, Lücken frühzeitig zu erkennen und das Gesamtsystem zu stärken.
OpenAI hat früh in die Anwendung von KI auf Anwendungsfälle der defensiven Cybersicherheit investiert und arbeitet eng mit globalen Expert:innen zusammen, um sowohl unsere Modelle als auch deren Anwendung weiterzuentwickeln. Wir schätzen die globale Gemeinschaft von Cybersicherheitsfachleuten, die daran arbeiten, unsere digitale Welt sicherer zu machen, und setzen uns dafür ein, leistungsstarke Tools bereitzustellen, die die defensive Sicherheit unterstützen. Während wir neue Schutzmaßnahmen einführen, werden wir auch weiterhin mit der Cybersicherheits-Community zusammenarbeiten, um zu verstehen, wo KI die Resilienz substanziell stärken kann und wo durchdachte Schutzmaßnahmen am wichtigsten sind.
Zusätzlich zu diesen Kooperationen setzen wir Maßnahmen um, die darauf abzielen, Verteidiger:innen schneller agieren zu lassen, unsere Schutzmaßnahmen an realen Bedürfnissen auszurichten und verantwortungsvolle Abhilfemaßnahmen im großen Maßstab zu beschleunigen.
Wir werden in Kürze ein Trusted-Access-Programm einführen, in dessen Rahmen wir prüfen, berechtigten Nutzer:innen und Kund:innen, die im Bereich der Cyberabwehr arbeiten, gestuften Zugang zu erweiterten Fähigkeiten in unseren neuesten Modellen für defensive Anwendungsfälle zu gewähren. Wir prüfen noch die richtige Abgrenzung dessen, welche Funktionen wir in großem Umfang zugänglich machen können und für welche gestufte Zugangsbeschränkungen erforderlich sind, was die zukünftige Gestaltung dieses Programms beeinflussen könnte. Unser Ziel ist es, dieses Trusted-Access-Programm zu einem Baustein für den Aufbau eines widerstandsfähigen Ökosystems zu machen.
Aardvark, unser agentischer Sicherheitsforscher, der Entwickler:innen und Sicherheitsteams dabei hilft, Sicherheitslücken in großem Maßstab zu finden und zu beheben, ist jetzt in der privaten Beta. Es scannt Codebasen auf Schwachstellen und schlägt Patches vor, die Maintainer:innen schnell übernehmen können. Es hat bereits neuartige CVEs in Open-Source-Software durch die Anwendung von Reasoning auf komplette Codebasen identifiziert. Wir planen, ausgewählten nichtkommerziellen Open-Source-Repositorys kostenlose Abdeckung anzubieten, um zur Sicherheit des Open-Source-Software-Ökosystems und der Lieferkette beizutragen. Bewirb dich hier für die Teilnahme.
Wir werden den Rat für Frontier-Risiken (engl. Frontier Risk Council) gründen, ein Beratungsgremium, das erfahrene Cyberverteidiger:innen und Sicherheitsexpert:innen in eine enge Zusammenarbeit mit unseren Teams bringt. Dieser Rat wird sich zunächst auf Cybersicherheit konzentrieren und seinen Fokus in Zukunft auf andere Frontier-Fähigkeitsbereiche ausweiten. Die Mitglieder werden zur Grenze zwischen nützlichen, verantwortungsvollen Fähigkeiten und potenziellem Missbrauch beraten, und diese Erkenntnisse werden direkt in unsere Evaluierungen und Schutzmaßnahmen einfließen. Wir werden bald mehr über den Rat mitteilen.
Abschließend ist zu erwähnen, dass wir davon ausgehen, dass Cybermissbrauch von jedem Frontier-Modell in der Branche ausgehen könnte. Um dies anzugehen, arbeiten wir im Rahmen des Frontier Model Forum, einer gemeinnützige Organisation, die von führenden KI-Laboren und Industriepartnern unterstützt wird, mit anderen Frontier-Laboren zusammen, um ein gemeinsames Verständnis von Bedrohungsmodellen und Best Practices zu entwickeln. In diesem Kontext hilft die Bedrohungsmodellierung, Risiken zu mindern, indem sie aufzeigt, wie KI-Fähigkeiten als Waffen eingesetzt werden könnten, wo kritische Engpässe für verschiedene Bedrohungsakteuren bestehen, und wie Frontier-Modelle einen signifikanten Leistungssprung ermöglichen könnten. Diese Zusammenarbeit zielt darauf ab, ein konsistentes, ökosystemweites Verständnis von Bedrohungsakteuren und Angriffswegen zu schaffen, damit Labore, Maintainer und Verteidiger ihre Abwehrmaßnahmen verbessern und sicherstellen können, dass kritische Sicherheitserkenntnisse schnell im gesamten Ökosystem verbreitet werden. Wir arbeiten auch mit externen Teams zusammen, um Cybersicherheits-Evaluierungen(wird in einem neuen Fenster geöffnet) zu entwickeln. Wir hoffen, dass ein Ökosystem unabhängiger Evaluierungen dazu beitragen wird, ein gemeinsames Verständnis der Fähigkeiten von Modellen zu fördern.
Zusammen spiegeln diese Bemühungen unser langfristiges Engagement wider, die defensive Seite des Ökosystems zu stärken. Je leistungsfähiger die Modelle werden, desto mehr ist es unser Ziel, dazu beizutragen, dass diese Fähigkeiten für Verteidiger:innen in einen echten Vorteil münden – verankert in realen Bedürfnissen, geprägt von der Expertise von Fachleuten und mit Sorgfalt eingesetzt. Neben dieser Arbeit planen wir, weitere Initiativen und Förderprogramme im Bereich Cybersicherheit zu prüfen, um dazu beizutragen, bahnbrechende Ideen sichtbar zu machen, die aus traditionellen Prozessen möglicherweise nicht hervorgehen, und mutige, kreative Abwehransätze aus Wissenschaft, Industrie und der Open-Source-Community zu erschließen. Insgesamt handelt es sich hierbei um ein fortlaufendes Projekt, und wir gehen davon aus, dass wir diese Programme stetig weiterentwickeln werden, während wir uns darüber klar werden, was die Sicherheit in der Praxis am wirksamsten verbessert.


