Zum Hauptinhalt springen
OpenAI

13. Februar 2026

SicherheitProdukt

Einführung von Lockdown-Modus und konsistenter Kennzeichnungen für erhöhtes Risiko in ChatGPT

Laden …

Da KI-Systeme komplexere Aufgaben übernehmen – insbesondere solche, die das Web und verbundene Apps betreffen –, verändern sich die Sicherheitsanforderungen.

Ein neu entstehendes Risiko ist besonders wichtig geworden: Prompt Injection. Bei diesen Angriffen versucht ein Dritter, ein konversationelles KI-System zu täuschen, indem er es dazu bringt, bösartige Anweisungen zu befolgen oder sensible Informationen preiszugeben.

Heute führen wir zwei neue Schutzmaßnahmen ein, die Nutzer:innen und Organisationen helfen sollen, Prompt-Injection-Angriffe zu mindern – mit klarerer Transparenz hinsichtlich des Risikos und stärkeren Kontrollen:

  • Lockdown-Modus in ChatGPT, eine fortgeschrittene, optionale Sicherheitseinstellung für Nutzer:innen mit erhöhtem Risiko
  • „Erhöhtes Risiko“-Kennzeichnunen für bestimmte Funktionen, die in ChatGPT, ChatGPT Atlas und Codex zusätzliche Risiken mit sich bringen können

Diese Ergänzungen stützen sich auf unsere bestehenden Schutzmaßnahmen auf Modell-, Produkt- und Systemebene. Dies umfasst Sandboxing, Schutzmaßnahmen gegen URL-basierte Datenexfiltration, Überwachung und Durchsetzung sowie Unternehmenssteuerungen wie rollenbasierte Zugriffssteuerung und Audit-Protokolle.

Organisationen dabei helfen, Mitarbeitende zu schützen, die am stärksten von Cyberangriffen bedroht sind

Der Lockdown-Modus ist eine optionale, fortgeschrittene Sicherheitseinstellung, die für eine kleine Gruppe von besonders sicherheitsbewussten Nutzer:innen entwickelt wurde – wie Führungskräfte oder Sicherheitsteams in renommierten Organisationen –, die einen erhöhten Schutz vor fortgeschrittenen Bedrohungen benötigen. Für die meisten Nutzer:innen ist er nicht notwendig. Der Lockdown-Modus beschränkt streng, wie ChatGPT mit externen Systemen interagieren kann, um das Risiko einer Datenexfiltration durch Prompt Injection zu verringern.

Der Lockdown-Modus deaktiviert deterministisch bestimmte Werkzeuge und Funktionen in ChatGPT, die Angreifer:innen ausnutzen könnte, um sensible Daten aus den Unterhaltungen der Nutzer:innen oder verbundenen Apps über Angriffe wie Prompt-Injections zu exfiltrieren.

Zum Beispiel ist das Surfen im Web im Lockdown-Modus auf zwischengespeicherte Inhalte beschränkt, sodass keine Live-Netzwerkanfragen das von OpenAI kontrollierte Netzwerk verlassen. Diese Einschränkung soll verhindern, dass sensible Daten beim Browsen an Angreifer:innen exfiltriert werden. Einige Funktionen werden vollständig deaktiviert, wenn wir keine starken deterministischen Garantien für die Datensicherheit bieten können.

Diagramm mit dem Titel „Lockdown-Modus“, das ChatGPT innerhalb einer gesicherten Grenze mit Verbindungen zu einem privaten Web-Cache, beim Herunterladen von Dateien, beim Zugriff auf das Web über Canvas und beim Durchsuchen des öffentlichen Webs zeigt. Ein:e externe:r „Angreifer:in“ und das öffentliche Web werden außerhalb der Grenze dargestellt, wobei blockierte Einstiegspunkte auf eingeschränkten Zugriff im Lockdown-Modus hinweisen.

Der Lockdown-Modus ist eine neue deterministische Einstellung, die hilft, Daten vor unbeabsichtigtem Teilen mit Dritten zu schützen, indem sie streng reguliert, wie ChatGPT mit bestimmten externen Systemen interagiert.

ChatGPT‑Businesspläne bieten bereits Datensicherheit auf Unternehmensniveau. Der Lockdown-Modus baut auf diesen Schutzmaßnahmen auf und ist für ChatGPT Enterprise, ChatGPT Edu, ChatGPT für das Gesundheitswesen und ChatGPT für Lehrkräfte verfügbar. Admins können es in den Workspace-Einstellungen(wird in einem neuen Fenster geöffnet) aktivieren, indem sie eine neue Rolle(wird in einem neuen Fenster geöffnet) erstellen. Bei Aktivierung fügt der Lockdown-Modus zusätzliche Einschränkungen zu den bestehenden Admin-Einstellungen hinzu.

Erfahre mehr über den Lockdown-Modus in unserem Hilfecenter(wird in einem neuen Fenster geöffnet).

Da einige kritische Workflows auf Apps angewiesen sind, behalten Workspace-Admins umfassendere Kontrollmöglichkeiten. Sie können genau bestimmen, welche Apps – und welche spezifischen Aktionen innerhalb dieser Apps – den Nutzer:innen im Lockdown-Modus zur Verfügung stehen. Zusätzlich und unabhängig vom Lockdown-Modus bietet die Plattform für Compliance-API-Protokolle(wird in einem neuen Fenster geöffnet) detaillierte Einblicke in die Nutzung von Apps, freigegebene Daten und verbundene Quellen, was den Administrator:innen hilft, die Übersicht zu behalten.

Wir planen, den Verbraucher:innen den Lockdown-Modus in den kommenden Monaten bereitzustellen.

Den Nutzer:innen helfen, fundierte Entscheidungen über Risiken zu treffen

KI-Produkte können noch hilfreicher sein, wenn sie mit deinen Apps und dem Internet verbunden sind, und wir haben stark in die Sicherheit von verbundenen Daten investiert. Gleichzeitig führen einige netzwerkbezogene Fähigkeiten zu neuen Risiken, die von den Sicherheits- und Schutzmaßnahmen der Branche noch nicht vollständig abgedeckt werden. Einige Nutzer:innen könnten bereit sein, diese Risiken einzugehen, und wir halten es für wichtig, dass sie die Möglichkeit haben, zu entscheiden, ob und wie sie diese nutzen, insbesondere bei der Arbeit mit ihren persönlichen Daten.

Unser Ansatz war es, produktinterne Anleitungen für Funktionen bereitzustellen, die potenziell zusätzliche Risiken bergen. Um dies klarer und konsistenter zu gestalten, standardisieren wir die Kennzeichnung einer kurzen Liste bestehender Funktionen. Diese Funktionen werden nun in ChatGPT, ChatGPT Atlas und Codex einheitlich mit der Kennzeichnung „Erhöhtes Risiko“ versehen, damit Nutzer:innen überall, wo sie darauf stoßen, dieselben Anweisungen erhalten.

Zum Beispiel können Entwickler in Codex, unserem Coding-Assistenten, Codex Netzwerkzugriff gewähren, damit er im Web Aktionen wie das Nachschlagen von Dokumentationen ausführen kann. Der relevante Einstellungsbildschirm enthält die Kennzeichnung „Erhöhtes Risiko“ sowie eine klare Erklärung, was sich ändert, welche Risiken möglicherweise eingeführt werden und wann dieser Zugriff angemessen ist.

Einstellungsbereich für „Agenten-Internetzugang“ mit dem Schalter auf Ein, der Optionen für eine Domain-Zulassungsliste, zusätzliche zulässige Domains (einschließlich openai.com), zulässige HTTP-Methoden und einen hervorgehobenen Warnhinweis, der auf erhöhte Sicherheitsrisiken beim Aktivieren des Internetzugangs hinweist, anzeigt.

Ein Screenshot des Codex-Einstellungsbildschirms, auf dem Nutzer:innen konfigurieren können, welchen Netzwerkzugriff Codex hat.

Wie geht‘s weiter?

Wir investieren weiterhin in die Verstärkung unserer Sicherheits- und Schutzvorkehrungen, insbesondere bei neuartigen, aufkommenden oder zunehmenden Risiken. Während wir die Schutzmaßnahmen für diese Funktionen verstärken, werden wir die Kennzeichnung „Erhöhtes Risiko“ entfernen, sobald wir feststellen, dass Sicherheitsfortschritte diese Risiken für die allgemeine Nutzung ausreichend gemindert haben. Wir werden auch weiterhin aktualisieren, welche Funktionen diese Kennzeichnung im Laufe der Zeit tragen, um Risiken für die Nutzer:innen bestmöglich zu kommunizieren.

Autor

OpenAI