GPT‑5.1‑Codex‑Max는 OpenAI의 새로운 최첨단 에이전트형 코딩 모델입니다. 소프트웨어 엔지니어링, 수학, 연구, 의학, 컴퓨터 사용 등 다양한 분야의 에이전트 작업으로 학습된 기본 추론 모델의 업데이트 버전입니다. 이 모델은 컴팩션 프로세스를 통해 여러 컨텍스트 윈도우를 자연스럽게 넘나들며 작동하도록 훈련된 최초의 모델로, 하나의 작업에서 수백만 개의 토큰을 일관되게 처리합니다. 이전 모델들과 마찬가지로, GPT‑5.1‑Codex‑Max는 PR 생성, 코드 리뷰, 프런트엔드 코딩, 질의응답 등 실제 소프트웨어 엔지니어링 작업을 기반으로 학습되었습니다.
이 시스템 카드에서는 GPT‑5.1‑Codex‑Max에 구현된 포괄적인 안전 조치를 설명합니다. 유해한 작업 및 프롬프트 주입에 있어 전문화된 안전 훈련 등 모델 수준의 완화 조치, 그리고 에이전트 샌드박싱 및 구성 가능한 네트워크 액세스와 같은 제품 수준의 완화 조치가 상세히 기술되어 있습니다.
GPT‑5.1‑Codex‑Max는 OpenAI의 준비성 프레임워크에 따라 평가되었습니다. 이 모델은 사이버 보안 분야에서 매우 우수한 역량을 갖추고 있지만, 아직 '높음' 수준에는 미치지 못합니다. OpenAI는 현재의 급격한 역량 향상 추세가 계속될 것으로 기대하고 있으며, 가까운 미래에 사이버 보안 영역에서 '높음' 수준을 넘어서는 모델도 등장할 것으로 예상됩니다. 다른 최근 모델들과 마찬가지로 이 모델은 생물학 분야에서 '높음' 수준의 역량을 갖춘 것으로 여겨지고 있으며, GPT‑5에 적용되는 것과 동일한 안전 조치를 갖춰 배포되고 있습니다. AI 자기 개선 분야에서는 아직 '높음' 수준의 역량에 이르지는 않습니다.


