GPT‑5.1‑Codex‑Max é o nosso novo modelo de codificação agentiva de vanguarda. Ele é construído com base em uma atualização do nosso modelo de raciocínio fundamental, treinado em tarefas agênticas que envolvem engenharia de software, matemática, pesquisa, medicina, uso de computadores e mais. É o nosso primeiro modelo treinado nativamente para operar em múltiplas janelas de contexto por meio de um processo chamado compaction, trabalhando de forma coerente em milhões de tokens em uma única tarefa. Como seus predecessores, o GPT‑5.1‑Codex‑Max foi treinado em tarefas reais de engenharia de software, como criação de PRs, revisão de código, desenvolvimento de frontend e Q&A.
Este cartão de sistema descreve as medidas abrangentes de segurança implementadas para o GPT‑5.1‑Codex‑Max. Ele detalha tanto as mitigações no nível do modelo, como treinamento especializado de segurança para tarefas prejudiciais e injeções de prompts, quanto no nível do produto, como execução de agentes em áreas restritas e acesso configurável à rede.
GPT‑5.1‑Codex‑Max foi avaliado sob o nosso Framework de Preparação. Possui grande capacidade na área de cibersegurança, mas não atinge um nível de alta capacidade em cibersegurança. Esperamos que as tendências atuais de rápido aumento de capacidade continuem e que os modelos ultrapassem o limite de alta segurança cibernética em um futuro próximo. Assim como outros modelos recentes, ele está sendo tratado como de alta capacidade em biologia e está sendo implementado com o conjunto correspondente de salvaguardas que usamos para o GPT‑5. Não atinge um nível elevado de capacidade de autoaperfeiçoamento em IA.


