Trusted Access für die nächste Ära der Cyberabwehr
Wir entwickeln Trusted Access, Schutzmaßnahmen und Unterstützung im Ökosystem kontinuierlich weiter, um Cyberverteidigenden zu helfen, uns alle zu schützen.
Wir bauen unser Programm Trusted Access for Cyber (TAC) auf Tausende verifizierte einzelne Verteidigende und Hunderte Teams aus, die für den Schutz kritischer Software verantwortlich sind. Seit Jahren entwickeln wir ein Cyberabwehrprogramm auf Basis der Prinzipien demokratisierten Zugangs, iterativer Bereitstellung und Resilienz im Ökosystem. Zur Vorbereitung auf zunehmend leistungsfähigere Modelle von OpenAI in den kommenden Monaten optimieren wir unsere Modelle gezielt für defensive Cybersicherheits-Anwendungsfälle – beginnend heute mit einer Variante von GPT‑5.4, die auf cyber-permissives Verhalten trainiert wurde: GPT‑5.4‑Cyber. In diesem Beitrag erläutern wir, wie unser Ansatz, Cyberabwehr im Gleichschritt mit steigenden Modellfähigkeiten zu skalieren, das Testen und die Bereitstellung künftiger Releases leiten soll.
Der zunehmende Einsatz von KI beschleunigt Verteidigende – also diejenigen, die dafür verantwortlich sind, Systeme, Daten und Nutzende zu schützen – und ermöglicht es ihnen, Probleme in der digitalen Infrastruktur, auf die alle angewiesen sind, schneller zu finden und zu beheben. Gleichzeitig wird KI auch von Angreifenden genutzt, die Schaden anrichten wollen. Darauf haben wir uns vorbereitet. Seit 2023 unterstützen wir Verteidigende mit unserem Cybersecurity Grant Program und stärken Schutzmaßnahmen durch unser Preparedness Framework. Im selben Jahr begannen wir, die Cyber-Fähigkeiten unserer Modelle zu evaluieren, und 2025 nahmen wir cyberspezifische Schutzmaßnahmen(wird in einem neuen Fenster geöffnet) in unsere Modellbereitstellungen auf. Anfang dieses Jahres haben wir unsere Unterstützung für Verteidigende mit dem Start von Codex Security ausgebaut, um Schwachstellen im großen Maßstab zu identifizieren und zu beheben. Unser Ansatz für diese kontinuierliche Weiterentwicklung von Fähigkeiten wird von drei Prinzipien geleitet:
- Demokratisierter Zugang: Unser Ziel ist es, diese Tools so umfassend wie möglich verfügbar zu machen und gleichzeitig Missbrauch zu verhindern. Wir entwickeln Mechanismen, die nicht willkürlich darüber entscheiden, wer für legitime Nutzung Zugang erhält und wer nicht. Das bedeutet, klare, objektive Kriterien und Methoden – etwa starke KYC- und Identitätsprüfungen – zu nutzen, um zu steuern, wer Zugang zu fortgeschritteneren Fähigkeiten erhält, und diese Prozesse im Lauf der Zeit zu automatisieren. Letztlich wollen wir fortgeschrittene defensive Fähigkeiten legitimen Akteur:innen jeder Größe zugänglich machen, einschließlich derjenigen, die kritische Infrastruktur, öffentliche Dienste und die digitalen Systeme schützen, auf die Menschen täglich angewiesen sind.
- Iterative Bereitstellung: Wir lernen am meisten, indem wir diese Systeme sorgfältig in die Welt bringen und sie im Lauf der Zeit verbessern. Je besser wir sowohl ihre Fähigkeiten als auch ihre Risiken verstehen, desto gezielter aktualisieren wir unsere Modelle und Sicherheitssysteme. Dazu gehört, die unterschiedlichen Vorteile und Risiken spezifischer Modelle zu verstehen, die Widerstandsfähigkeit gegen Jailbreaks und andere adversarielle Angriffe zu verbessern und defensive Fähigkeiten auszubauen – bei gleichzeitiger Minderung von Schäden.
- In Resilienz im Ökosystem investieren: Wir unterstützen und beschleunigen die Community der Verteidigenden durch vertrauenswürdige Zugangswege, gezielte Fördermittel, Beiträge zu Open-Source-Sicherheitsinitiativen(wird in einem neuen Fenster geöffnet) und Technologien wie Codex Security, die Verteidigenden helfen, Schwachstellen schneller zu finden und zu patchen.
Unsere Strategie für Cybersicherheits-Resilienz und die Beschleunigung der Verteidigung
Seit Jahren besteht unsere Cybersicherheitsstrategie darin, in Forschung zu investieren, Missbrauch zu verhindern und Verteidigende zu beschleunigen. Mit dem Fortschritt der Modellfähigkeiten haben wir unsere Programme im Hinblick auf diese Ziele ausgebaut, die auf folgenden Überzeugungen beruhen:
- Cyberrisiken sind bereits da und nehmen zu – aber wir können handeln. Digitale Infrastruktur ist schon seit Jahren verwundbar(wird in einem neuen Fenster geöffnet), noch bevor fortgeschrittene KI überhaupt aufkam. Jetzt können bestehende Modelle helfen, Schwachstellen zu finden, über Codebasen hinweg zu schlussfolgern und wesentliche Teile des Cyber-Workflows zu unterstützen, während Bedrohungsakteur:innen mit neuartigen KI-gestützten Ansätzen experimentieren. Wir haben gesehen, dass ausgefeilte Frameworks durch mehr Test-Time-Compute mit bestehenden Modellen immer stärkere Fähigkeiten hervorbringen. Das bedeutet, dass Schutzmaßnahmen nicht auf einen einzelnen künftigen Schwellenwert warten können.
- Zugang danach erweitern, wer diese Systeme nutzt und wie sie genutzt werden. Cyber-Fähigkeiten sind inhärent dual-use, daher wird das Risiko nicht allein durch das Modell definiert. Es hängt auch von den Nutzenden, den Vertrauenssignalen(wird in einem neuen Fenster geöffnet) in ihrem Umfeld und der Zugangsstufe ab, die ihnen gewährt wird.
- Allgemein verfügbarer Zugang zu allgemeinen Modellen mit Schutzmaßnahmen kann mit granulareren Kontrollen für Fähigkeiten mit höherem Risiko koexistieren – unterstützt durch stärkere Verifizierung, klarere Absichtssignale und bessere Transparenz über die Nutzung.
- Um verantwortungsvolle Nutzung im großen Maßstab zu ermöglichen, brauchen wir Systeme, die vertrauenswürdige Nutzende und Anwendungsfälle automatisierter und objektiver validieren können. So können wir den Zugang auf Basis von Nachweisen und realen Vertrauenssignalen erweitern, statt uns auf manuelle Entscheidungen zu verlassen. Wir halten es weder für praktikabel noch für angemessen, zentral zu entscheiden, wer sich verteidigen darf. Stattdessen wollen wir so viele legitime Verteidigende wie möglich befähigen – mit Zugang auf Grundlage von Verifizierung, Vertrauenssignalen und Verantwortlichkeit.
- Abwehrmaßnahmen sollten kontinuierlich mit den Fähigkeiten skaliert werden. Mit zunehmenden Modellfähigkeiten müssen auch die Abwehrmaßnahmen mitwachsen. Wir haben stetige Verbesserungen beim agentischen Programmieren gesehen, die direkte Auswirkungen auf die Cybersicherheit haben, und unseren Ansatz entsprechend angepasst.
- Wir begannen mit cyberspezifischem Sicherheitstraining bei GPT‑5.2 und erweiterten es dann mit zusätzlichen Schutzmaßnahmen über GPT‑5.3‑Codex und GPT‑5.4, wobei wir die Cyber-Fähigkeit des Modells auch im Rahmen unseres Preparedness Framework als „hoch“ einstuften. Parallel dazu haben wir die Unterstützung für Verteidigende ausgebaut: mit dem Start eines Cybersecurity Grant Program in Höhe von 10 Mio. USD, der Unterstützung von über 1.000 Open-Source-Projekten mit Codex für Open Source(wird in einem neuen Fenster geöffnet), das kostenlose Sicherheitsscans bietet, und der kontinuierlichen Verbesserung von Codex Security.
- Codex Security, das vor sechs Monaten in die private Beta ging und Anfang dieses Jahres als Forschungsvorschau veröffentlicht wurde, überwacht Codebasen automatisch, validiert Probleme und schlägt Korrekturen vor. Mit der Verbesserung der Modelle sind auch Präzision und Nutzen des Systems gestiegen. Seit seiner kürzlichen Einführung hat Codex Security zu über 3.000 behobenen kritischen und schwerwiegenden Schwachstellen beigetragen, zusätzlich zu vielen weiteren behobenen Funden mit geringerer Schwere im gesamten Ökosystem.
- Über diese Releases hinweg haben wir auch verfeinert, wie Modelle mit sensiblen Anfragen umgehen, indem wir die Grenzen für Ablehnungen kalibriert und gleichzeitig den vertrauenswürdigen Zugang über Programme wie TAC ausgeweitet haben.
- Die Softwareentwicklung selbst muss sicherer werden. Das stärkste Ökosystem ist eines, das Sicherheitsprobleme kontinuierlich identifiziert, validiert und behebt, während Software geschrieben wird. Durch die Integration fortgeschrittener Coding-Modelle und agentischer Fähigkeiten in Entwickler-Workflows können wir Entwickelnden sofortiges, umsetzbares Feedback geben, während sie entwickeln – und Sicherheit von episodischen Audits und statischen Bug-Inventaren hin zu fortlaufender, greifbarer Risikoreduktion verschieben.
Wir möchten Verteidigende stärken, indem wir allgemeinen Zugang zu Frontier-Fähigkeiten ermöglichen, einschließlich Modellen, die speziell für Cybersicherheit entwickelt wurden. Im Februar haben wir Trusted Access for Cyber (TAC) eingeführt – mit automatisierter Identitätsprüfung für Einzelpersonen, um Reibung durch Schutzmaßnahmen bei cybersicherheitsbezogenen Aufgaben zu verringern, und mit Partnerschaften mit einer begrenzten Zahl von Organisationen für cyber-permissivere Modelle.
Heute erweitern wir dieses Programm, indem wir zusätzliche Zugangsstufen für Nutzende einführen, die bereit sind, mit OpenAI zusammenzuarbeiten, um sich als Cybersicherheits-Verteidigende zu authentifizieren. Kund:innen in den höchsten Stufen erhalten Zugang zu GPT‑5.4‑Cyber, einem Modell, das gezielt auf zusätzliche Cyber-Fähigkeiten und mit weniger Fähigkeitsbeschränkungen feinabgestimmt wurde. Diese Version von GPT‑5.4 senkt die Ablehnungsschwelle für legitime Cybersicherheitsarbeit und ermöglicht neue Fähigkeiten für fortgeschrittene defensive Workflows, darunter Fähigkeiten zum Reverse Engineering von Binärdateien, die Sicherheitsfachleuten erlauben, kompilierte Software auf Malware-Potenzial, Schwachstellen und Sicherheitsrobustheit zu analysieren, ohne Zugriff auf den Quellcode zu benötigen.
Da dieses Modell permissiver ist, beginnen wir mit einer begrenzten, iterativen Bereitstellung für geprüfte Sicherheitsanbieter, Organisationen und Forschende. Der Zugang zu permissiven und cyberfähigen Modellen kann mit Einschränkungen verbunden sein, insbesondere bei Nutzungsszenarien ohne Transparenz wie Keine Datenaufbewahrung(wird in einem neuen Fenster geöffnet) (Zero Data Retention, ZDR). Das gilt besonders für Entwickelnde und Organisationen, die über Drittanbieter-Plattformen auf unsere Modelle zugreifen, bei denen OpenAI möglicherweise weniger direkten Einblick in die Nutzenden, die Umgebung oder den Zweck der Anfrage hat.
Der Zugang zu TAC ist unkompliziert:
- Einzelne Nutzende können ihre Identität unter chatgpt.com/cyber(wird in einem neuen Fenster geöffnet) verifizieren.
- Unternehmen können über ihre OpenAI-Ansprechperson Trusted Access anfordern.
Alle Kund:innen, die über diesen Prozess zugelassen werden, erhalten Zugang zu Versionen bestehender Modelle mit geringerer Reibung bei Schutzmaßnahmen, die bei Dual-Use-Cyberaktivitäten auslösen könnten. So können sie weiterhin Sicherheitsbildung, defensives Programmieren und verantwortungsvolle Schwachstellenforschung unterstützen. Kund:innen, die bereits in TAC sind und bereit sind, sich zusätzlich als legitime Cyberverteidigende zu authentifizieren, können Interesse an zusätzlichen Zugangsstufen bekunden(wird in einem neuen Fenster geöffnet), einschließlich des Anforderns von Zugang zu GPT‑5.4‑Cyber.
Unsere Cybersicherheits-Abwehrmaßnahmen sind das Ergebnis vieler Monate iterativer Verbesserung. Wir sind der Ansicht, dass die heute eingesetzten Schutzmaßnahmen das Cyberrisiko ausreichend reduzieren, um eine breite Bereitstellung aktueller Modelle zu unterstützen. Wir erwarten, dass Versionen dieser Schutzmaßnahmen auch für kommende leistungsfähigere Modelle ausreichen werden, während Modelle, die explizit für Cybersicherheitsarbeit trainiert und permissiver gemacht wurden, restriktivere Bereitstellungen und angemessene Kontrollen erfordern.
Um langfristig eine ausreichende KI-Sicherheit im Bereich der Cybersicherheit zu gewährleisten, rechnen wir zudem mit einem Bedarf an umfassenderen Schutzmaßnahmen für zukünftige Modelle, deren Leistungsfähigkeit selbst die besten zweckgebundenen Modelle von heute rasch übertreffen wird.


