19 de novembro de 2025

GPT‑5.1‑Codex‑Max System Card

Introdução

GPT‑5.1‑Codex‑Max é o nosso novo modelo de codificação agentiva de vanguarda. Ele é construído com base em uma atualização do nosso modelo de raciocínio fundamental, treinado em tarefas agênticas que envolvem engenharia de software, matemática, pesquisa, medicina, uso de computadores e mais. É o nosso primeiro modelo treinado nativamente para operar em múltiplas janelas de contexto por meio de um processo chamado compaction, trabalhando de forma coerente em milhões de tokens em uma única tarefa. Como seus predecessores, o GPT‑5.1‑Codex‑Max foi treinado em tarefas reais de engenharia de software, como criação de PRs, revisão de código, desenvolvimento de frontend e Q&A.

Este cartão de sistema descreve as medidas abrangentes de segurança implementadas para o GPT‑5.1‑Codex‑Max. Ele detalha tanto as mitigações no nível do modelo, como treinamento especializado de segurança para tarefas prejudiciais e injeções de prompts, quanto no nível do produto, como execução de agentes em áreas restritas e acesso configurável à rede.

GPT‑5.1‑Codex‑Max foi avaliado sob o nosso Framework de Preparação. Possui grande capacidade na área de cibersegurança, mas não atinge um nível de alta capacidade em cibersegurança. Esperamos que as tendências atuais de rápido aumento de capacidade continuem e que os modelos ultrapassem o limite de alta segurança cibernética em um futuro próximo. Assim como outros modelos recentes, ele está sendo tratado como de alta capacidade em biologia e está sendo implementado com o conjunto correspondente de salvaguardas que usamos para o GPT‑5. Não atinge um nível elevado de capacidade de autoaperfeiçoamento em IA.

Autoria

OpenAI

Continuar lendo

Ver tudo

Como duas configurações triplicaram nossa pontuação no benchmark ARC-AGI-3

Pesquisa29 de jul. de 2026

Scientific computing agentic AI card image (1x1)

Computação científica na era da IA agêntica

Publicação28 de jul. de 2026

Segurança e alinhamento na era dos modelos de longo horizonte

Segurança20 de jul. de 2026