2026년 2월 13일

ChatGPT에서 락다운 모드 및 일관된 “높은 위험” 레이블 도입

로딩 중...

AI 시스템이 특히 웹 및 연결된 앱을 포함하는 더 복잡한 작업을 수행하게 되면서 보안 위험의 양상도 변화하고 있습니다.

특히 중요해진 새로운 위험은 프롬프트 인젝션⁠입니다. 이러한 공격에서는 제3자가 대화형 AI 시스템을 오도해 악의적인 지시를 따르거나 민감한 정보를 노출하도록 유도합니다.

오늘 우리는 위험에 대한 더 명확한 가시성과 더 강력한 제어를 제공함으로써 사용자와 조직이 프롬프트 인젝션 공격을 완화하도록 돕는 두 가지 새로운 보호 기능을 도입합니다.

고위험 사용자를 위한 고급 선택형 보안 설정인 ChatGPT의 락다운 모드
ChatGPT, ChatGPT Atlas 및 Codex에서 추가 위험을 초래할 수 있는 특정 기능에 대한 “높은 위험” 레이블

이러한 추가 기능은 모델, 제품 및 시스템 수준 전반의 기존 보호 기능을 기반으로 합니다. 여기에는 샌드박싱, URL 기반 데이터 유출 방지⁠, 모니터링 및 집행, 그리고 역할 기반 액세스 및 감사 로그와 같은 엔터프라이즈 제어⁠가 포함됩니다.

사이버 공격 위험이 가장 높은 직원을 보호하도록 조직 지원

락다운 모드는 고급 위협에 대한 추가 보호가 필요한 경영진이나 주요 조직의 보안 팀과 같이 보안 의식이 매우 높은 소수의 사용자를 위해 설계된 선택형 고급 보안 설정입니다. 대부분의 사용자에게는 필요하지 않습니다. 락다운 모드는 ChatGPT가 외부 시스템과 상호작용하는 방식을 엄격히 제한해 프롬프트 인젝션 기반 데이터 유출 위험을 줄입니다.

락다운 모드는 공격자가 프롬프트 인젝션과 같은 공격을 통해 사용자 대화나 연결된 앱에서 민감한 데이터를 유출하려 시도할 수 있는 특정 툴과 기능을 결정론적으로 비활성화합니다.

예를 들어 락다운 모드에서는 웹 브라우징이 캐시된 콘텐츠로 제한되며, 실시간 네트워크 요청이 OpenAI의 통제 네트워크를 벗어나지 않습니다. 이 제한은 브라우징을 통해 민감한 데이터가 공격자에게 유출되는 것을 방지하기 위한 것입니다. 데이터 안전에 대해 강력한 결정론적 보장을 제공할 수 없는 경우 일부 기능은 완전히 비활성화됩니다.

“락다운 모드”라는 제목의 다이어그램으로, 보안 경계 내부에 있는 ChatGPT가 프라이빗 웹 캐시, 파일 다운로드, Canvas를 통한 웹 액세스, 공개 웹 브라우징과 연결된 모습이 표시되어 있습니다. 경계 외부에는 “공격자”와 공개 웹이 묘사되어 있으며, 차단된 진입 지점을 통해 락다운 모드에서의 제한된 액세스가 표시되어 있습니다.

락다운 모드는 ChatGPT가 특정 외부 시스템과 상호작용하는 방식을 엄격히 제한해 데이터가 제3자와 의도치 않게 공유되는 것을 방지하도록 돕는 새로운 결정론적 설정입니다.

ChatGPT 비즈니스 플랜은 이미 엔터프라이즈급 데이터 보안⁠을 제공합니다. 락다운 모드는 이러한 보호 기능을 기반으로 하며 ChatGPT Enterprise, ChatGPT Edu, ChatGPT for Healthcare 및 ChatGPT for Teachers에서 사용할 수 있습니다. 관리자는 워크스페이스 설정⁠(새 창에서 열기)에서 새로운 역할⁠(새 창에서 열기)을 생성하여 이를 활성화할 수 있습니다. 활성화되면 락다운 모드는 기존 관리자 설정 위에 추가 제한을 적용합니다.

도움말 센터⁠(새 창에서 열기)에서 락다운 모드에 대해 자세히 알아보세요.

일부 핵심 워크플로가 앱에 의존하기 때문에 워크스페이스 관리자는 보다 세분화된 제어 권한을 유지합니다. 이들은 락다운 모드에서 사용자에게 허용할 앱과 해당 앱 내에서 허용할 특정 작업을 정확히 선택할 수 있습니다. 또한 락다운 모드와는 별도로 컴플라이언스 API 로그 플랫폼⁠(새 창에서 열기)은 앱 사용, 공유 데이터 및 연결된 소스에 대한 상세한 가시성을 제공하여 관리자가 감독을 유지하도록 돕습니다.

향후 몇 달 내에 락다운 모드를 일반 사용자에게도 제공할 계획입니다.

사용자가 위험에 대해 정보에 기반한 선택을 하도록 지원

AI 제품은 앱과 웹에 연결될 때 더욱 유용해질 수 있으며, 우리는 연결된 데이터를 안전하게 유지⁠하기 위해 많은 투자를 해왔습니다. 동시에 일부 네트워크 관련 기능은 아직 업계의 안전 및 보안 완화 조치로 완전히 해결되지 않은 새로운 위험을 수반합니다. 일부 사용자는 이러한 위험을 감수하는 데 동의할 수 있으며, 특히 개인 데이터를 다룰 때 이러한 기능을 사용할지 여부와 방법을 스스로 결정할 수 있는 능력이 중요하다고 생각합니다.

우리는 추가 위험을 초래할 수 있는 기능에 대해 제품 내 가이드를 제공하는 방식을 취해왔습니다. 이를 더 명확하고 일관되게 하기 위해 일부 기존 기능에 대한 레이블 표기를 표준화하고 있습니다. 이제 이러한 기능은 ChatGPT, ChatGPT Atlas 및 Codex 전반에서 일관된 “높은 위험” 레이블을 사용해 사용자가 어디에서 접하든 동일한 안내를 받도록 합니다.

예를 들어 코딩 어시스턴트인 Codex에서는 개발자가 Codex에 네트워크 액세스를 부여해 문서 검색과 같은 웹 작업을 수행하도록 할 수 있습니다. 해당 설정 화면에는 “높은 위험” 레이블과 함께 무엇이 변경되는지, 어떤 위험이 발생할 수 있는지, 언제 이러한 액세스가 적절한지에 대한 명확한 설명이 포함되어 있습니다.

토글이 켜짐으로 설정된 “에이전트 인터넷 액세스” 설정 패널 화면으로, 도메인 허용 목록, 추가 허용 도메인(openai.com 포함), 허용된 HTTP 메서드 옵션과 함께 인터넷 액세스를 활성화할 경우 보안 위험이 증가한다는 강조된 경고가 표시되어 있습니다.

사용자가 Codex의 네트워크 액세스 범위를 구성할 수 있는 Codex 설정 화면 스크린샷입니다.

향후 계획

우리는 특히 새롭거나 부상 중이거나 확대되는 위험에 대해 안전 및 보안 보호 조치를 강화하는 데 지속적으로 투자하고 있습니다. 이러한 기능에 대한 보호 조치를 강화함에 따라, 보안 개선이 일반 사용에 충분할 정도로 위험을 완화했다고 판단되면 “높은 위험” 레이블을 제거할 예정입니다. 또한 사용자에게 위험을 가장 잘 전달하기 위해 시간이 지남에 따라 해당 레이블이 적용되는 기능을 지속적으로 업데이트할 것입니다.

2026

작성자

OpenAI

더 읽어보기

모두 보기

Launching Health in ChatGPT

제품2026년 7월 23일

OpenAI Presence 소개

제품2026년 7월 22일

Safety and alignment in an era of long-horizon models

안전2026년 7월 20일