메인 콘텐츠로 건너뛰기
OpenAI

2026년 4월 14일

보안안전

사이버 방어의 다음 시대를 위한 신뢰할 수 있는 접근

OpenAI는 사이버 방어 주체가 우리 모두를 보호할 수 있도록 지원하기 위해 신뢰 기반 접근, 보호 장치, 생태계 지원을 지속적으로 발전시켜 나가고 있습니다.

로딩 중...

OpenAI는 Trusted Access for Cyber(TAC) 프로그램을 확대하여, 검증된 수천 명의 개별 방어자와 핵심 소프트웨어 방어를 담당하는 수백 개의 팀으로 지원 범위를 넓히고 있습니다. 우리는 수년간 접근성의 민주화, 반복적 배포, 그리고 에코시스템 회복력이라는 원칙을 기반으로 사이버 방어 프로그램을 구축해 왔습니다. 향후 몇 달 동안 더욱 강력한 모델이 출시될 것에 대비해, 우리는 방어 중심의 사이버 보안 사용 사례를 지원하도록 모델을 정밀 조정하고 있습니다. 그 시작으로, 사이버 활용에 적합하도록 학습된 GPT‑5.4 변형 모델인 GPT‑5.4‑Cyber를 오늘부터 선보입니다. 이 글에서는 모델 역량이 향상됨에 따라 사이버 방어를 함께 확장해 나가는 우리의 접근 방식이 향후 모델의 테스트와 배포에 어떻게 반영될 것인지 설명합니다.

AI를 점진적으로 활용하면 시스템, 데이터, 사용자 보호를 담당하는 보안 담당자의 업무 속도가 빨라져, 모두가 의존하는 디지털 인프라에서 문제를 더 빠르게 발견하고 해결할 수 있습니다. 마찬가지로, 해를 끼치려는 공격자들 역시 AI를 활용하고 있습니다. 우리는 이에 대비해 왔습니다. 2023년부터 사이버 보안 보조금 프로그램을 통해 보안 담당자를 지원해 왔으며, 준비성 평가 프레임워크를 통해 보호 체계를 강화해 왔습니다. 같은 해에 우리는 모델의 사이버 역량을 평가하기 시작했으며, 2025년에는 사이버 보안 전용 보호 조치(새 창에서 열기)모델 배포 과정에 포함하기 시작했습니다. 올해 초에는 대규모로 취약점을 식별하고 수정할 수 있는 Codex Security를 출시하여 보안 담당자에 대한 지원을 더욱 강화했습니다. 이러한 역량의 지속적인 발전에 대한 우리의 접근 방식은 다음 세 가지 원칙에 기반합니다.

  • 접근성의 민주화: 우리의 목표는 오남용을 방지하면서 이러한 툴을 최대한 폭넓게 제공하는 것입니다. 정당한 사용을 위해 누가 액세스 권한을 가져야 하는지를 임의로 결정하지 않도록 하는 메커니즘을 설계합니다. 이는 강화된 고객 확인 절차(KYC)와 신원 확인과 같은 명확하고 객관적인 기준과 방법을 활용하여 누가 더 고급 기능에 액세스할 수 있는지를 결정하고, 이러한 절차를 점진적으로 자동화하는 것을 의미합니다. 궁극적으로 우리는 핵심 인프라, 공공 서비스, 그리고 사람들이 일상적으로 의존하는 디지털 시스템을 보호하는 주체를 포함하여, 규모와 관계없이 정당한 사용자에게 고급 방어 역량을 제공하는 것을 목표로 합니다.
  • 반복적 배포: 우리는 이러한 시스템을 신중하게 실제 환경에 도입하고 시간이 지남에 따라 개선해 나가는 과정에서 가장 많은 것을 배웁니다. 모델의 역량과 위험을 더 잘 이해하게 됨에 따라, 이에 맞춰 모델과 안전 시스템을 지속적으로 업데이트합니다. 여기에는 특정 모델의 차별화된 이점과 위험을 이해하는 것, 탈옥 및 기타 적대적 공격에 대한 대응력을 강화하는 것, 그리고 잠재적 피해를 완화하면서 방어 역량을 향상시키는 것이 포함됩니다. 
  • 생태계 회복탄력성에 대한 투자: 우리는 신뢰 기반 액세스 경로, 대상별 보조금, 오픈소스 보안 이니셔티브(새 창에서 열기)에 대한 기여, 그리고 보안 담당자가 취약점을 더 빠르게 식별하고 패치할 수 있도록 지원하는 Codex Security와 같은 기술을 통해 방어자 커뮤니티를 지원하고 그 역량을 가속화합니다. 

사이버 보안 회복탄력성 및 방어 역량 가속화를 위한 전략

수년간 OpenAI의 사이버 보안 전략은 연구에 투자하고, 오남용을 방지하며, 보안 담당자의 역량을 강화하는 데 중점을 두어 왔습니다. 모델 역량이 발전함에 따라 우리는 이러한 목표를 달성하기 위한 프로그램을 확장해 왔으며, 이는 다음과 같은 신념에 기반합니다. 

  • 사이버 위험은 이미 존재하며 빠르게 증가하고 있지만, 우리는 이에 대응할 수 있습니다.디지털 인프라는 고도화된 AI가 등장하기 훨씬 전부터 이미 수년간 취약한 상태에 놓여 있었습니다(새 창에서 열기). 현재의 모델은 취약점을 탐지하고 코드베이스 전반을 분석하며 사이버 워크플로의 중요한 부분을 지원할 수 있으며, 위협 행위자들은 새로운 AI 기반 공격 방식을 실험하고 있습니다. 또한 우리는 정교한 테스트 환경을 활용해 기존 모델에 더 많은 테스트 시점 연산 자원을 투입함으로써 점점 더 강력한 성능을 이끌어내는 사례를 확인하고 있습니다. 이는 보호 조치를 특정 미래 시점까지 미루어서는 안 된다는 것을 의미합니다.
  • 이러한 시스템을 누가 어떻게 사용하는지에 따라 액세스를 확대합니다.사이버 역량은 본질적으로 이중 용도적 성격을 지니므로, 위험은 모델 자체만으로 결정되지 않습니다. 이는 또한 사용자, 그 사용자에 대한 신뢰 신호(새 창에서 열기), 그리고 사용자에게 부여된 액세스 수준에 따라 달라집니다.
    • 보호 조치가 적용된 일반 모델은 폭넓게 사용할 수 있도록 하면서도, 위험 수준이 높은 기능일수록 더 엄격하고 세밀하게 관리할 수 있습니다. 이러한 관리는 더 강력한 검증, 보다 명확한 사용 의도 신호, 그리고 사용에 대한 높은 가시성을 기반으로 이루어집니다.
    • 대규모 환경에서 책임 있는 사용을 가능하게 하려면, 신뢰할 수 있는 사용자와 사용 사례를 보다 자동화되고 객관적인 방식으로 검증할 수 있는 시스템이 필요합니다. 이를 통해 수동적인 판단에 의존하기보다, 실제 증거와 신뢰 신호를 기반으로 액세스를 확대할 수 있습니다. 누가 스스로를 방어할 수 있는지 중앙에서 결정하는 것은 현실적이지도, 적절하지도 않다고 봅니다. 대신 우리는 검증, 신뢰 신호, 그리고 책임성을 기반으로 가능한 한 많은 정당한 보안 담당자가 액세스할 수 있도록 하는 것을 목표로 합니다.
  • 방어 체계는 모델 역량의 향상에 맞춰 지속적으로 확대되어야 합니다. 모델의 역량이 향상됨에 따라, 방어 체계 역시 이에 맞춰 함께 강화되어야 합니다. 에이전틱 코딩 분야에서 지속적인 발전이 이루어지고 있으며, 이는 사이버 보안에 직접적인 영향을 미치고 있습니다. 이에 따라 OpenAI도 이러한 변화에 발맞춰 접근 방식을 조정해 왔습니다.
    • OpenAI는 GPT‑5.2부터 사이버 보안 전용 안전 학습을 시작했으며, 이후 GPT‑5.3‑Codex와 GPT‑5.4를 통해 추가적인 보호 조치를 적용하며 이를 확대해 왔습니다. 이 과정에서 해당 모델을 준비성 평가 프레임워크 기준에 따라 사이버 역량 '높음(high)' 수준으로 분류했습니다. 이와 동시에 OpenAI는 보안 담당자들에 대한 지원도 확대했습니다. 1,000만 달러 규모의 사이버 보안 보조금 프로그램을 출범하고, 무료 보안 스캔을 제공하는 Codex for Open Source(새 창에서 열기)를 통해 1,000개가 넘는 오픈소스 프로젝트를 지원했으며, Codex Security도 지속적으로 개선해왔습니다.
    • 6개월 전 비공개 베타로 출시되었으며, 올해 초 리서치 프리뷰로 공개된 Codex Security는 코드베이스를 자동으로 모니터링하고 문제를 검증하며 수정 방안을 제안합니다. 모델이 개선됨에 따라 시스템의 정확도와 활용도도 함께 향상되었습니다. 최근 출시 이후 Codex Security는 생태계 전반에서 치명적이거나 심각도가 높은 취약점 3,000건 이상을 수정하는 데 기여했으며, 더 낮은 심각도의 문제도 다수 해결했습니다.
    • 이번 릴리스 전반에 걸쳐 OpenAI는 민감한 요청에 대한 모델의 대응 방식을 더욱 정교하게 다듬어 왔으며, 거부 기준을 조정하는 동시에 TAC와 같은 프로그램을 통해 신뢰 기반 액세스를 확대해 왔습니다.
  • 소프트웨어 개발 자체의 보안 수준을 더욱 강화해야 합니다.가장 강력한 생태계는 소프트웨어가 개발되는 과정에서 보안 문제를 지속적으로 식별하고 검증하며 해결할 수 있는 구조를 갖춘 생태계입니다. 고급 코딩 모델과 에이전틱 기능을 개발자 워크플로에 통합하면, 개발 과정에서 즉시 실행 가능한 피드백을 받을 수 있으며, 이를 통해 보안을 일회성 감사나 정적인 버그 목록 중심에서 벗어나 지속적이고 실질적인 위험 감소 중심으로 전환할 수 있습니다.

Trusted Access for Cyber 및 GPT‑5.4‑Cyber 확장 

OpenAI는 사이버 보안에 맞춰 특별히 설계된 모델을 포함한 최첨단 기능에 대한 폭넓은 액세스를 제공함으로써 보안 담당자의 역량을 강화하고자 합니다. 지난 2월, 우리는 사이버 보안 관련 작업에서 보호 조치로 인한 불편을 줄이기 위해 개인 대상 자동 신원 확인을 도입하는 한편, 보다 폭넓은 사이버 활용이 가능한 모델을 제공하기 위해 일부 조직과 협력하는 형태로 Trusted Access for Cyber(TAC)를 출시했습니다.

오늘 우리는 OpenAI와 협력하여 자신을 사이버 보안 담당자로 인증하려는 사용자를 대상으로 추가적인 액세스 등급을 도입함으로써 이 프로그램을 확대합니다. 가장 높은 등급의 고객은 추가적인 사이버 보안 기능을 위해 특별히 정밀 조정되고 기능 제한이 완화된 모델인 GPT‑5.4‑Cyber에 액세스할 수 있습니다. 이 모델은 GPT‑5.4의 한 버전으로, 정당한 사이버 보안 작업에 대해 거부 기준을 낮추고 고급 방어 워크플로를 위한 새로운 기능을 제공합니다. 여기에는 보안 전문가가 소스 코드에 접근하지 않고도 컴파일된 소프트웨어를 분석해 악성코드 가능성, 취약점, 보안 강건성을 평가할 수 있도록 하는 바이너리 리버스 엔지니어링 기능이 포함됩니다.

이 모델은 보다 허용 범위가 넓기 때문에, 검증된 보안 업체, 조직 및 연구자를 대상으로 제한적이고 단계적인 방식으로 배포를 시작합니다. 이와 같은 허용 범위가 넓고 사이버 보안 기능을 갖춘 모델에 대한 액세스에는 제한이 따를 수 있으며, 특히 데이터 비보관(새 창에서 열기)(ZDR)과 같이 가시성이 확보되지 않는 사용 방식에서는 더욱 그렇습니다. 이는 특히 제3자 플랫폼을 통해 모델에 접근하는 개발자와 조직의 경우에 더욱 그렇습니다. 이러한 환경에서는 OpenAI가 사용자, 실행 환경, 또는 요청 목적을 직접 파악하기 어렵기 때문입니다. 

TAC에 액세스하는 방법은 간단합니다.

이 절차를 통해 승인된 고객은 이중 용도의 사이버 활동에서 불필요하게 작동하던 보호 조치로 인한 제약이 완화된 기존 모델을 사용할 수 있습니다. 이를 통해 보안 교육, 방어적 프로그래밍, 책임 있는 취약점 연구를 계속 수행할 수 있습니다. 이미 TAC에 참여 중이며 자신을 정당한 사이버 보안 담당자로 추가 인증하려는 고객은 추가 액세스 등급에 대한 관심을 표명(새 창에서 열기)할 수 있으며, 여기에는 GPT‑5.4‑Cyber에 대한 액세스 요청이 포함됩니다.

예정된 모델 릴리스와 그 이후

OpenAI의 사이버 보안 방어 체계는 수개월에 걸친 반복적인 개선의 결과입니다. 우리는 현재 적용 중인 보호 조치만으로도 사이버 위험을 충분히 낮출 수 있으며, 이를 바탕으로 현재 모델을 폭넓게 배포할 수 있다고 생각합니다. 또한 이러한 보호 조치는 앞으로 더 강력해질 모델에도 일정 부분 충분할 것으로 예상되지만, 사이버 보안 작업을 위해 별도로 학습되고 보다 허용 범위가 넓게 설계된 모델의 경우에는 보다 제한적인 배포 방식과 적절한 통제가 필요합니다.

장기적으로는 사이버 보안 분야에서 AI 안전성을 지속적으로 확보하기 위해, 향후 모델에 대해서는 보다 폭넓은 방어 체계가 필요할 것으로 보고 있습니다. 이러한 모델은 현재의 최적화된 전용 모델조차 빠르게 능가할 수준의 역량을 갖추게 될 것입니다.

작성자

OpenAI