Tarjeta del sistema GPT‑5.1‑Codex‑Max
GPT‑5.1‑Codex‑Max es nuestro nuevo modelo de vanguardia para codificación autónoma con agentes. Se basa en una actualización de nuestro modelo de razonamiento de base entrenado con tareas agénticas en ingeniería de software, matemáticas, investigación, medicina, uso de computadoras y más. Es nuestro primer modelo entrenado de manera nativa para operar en múltiples ventanas de contexto mediante un proceso llamado compactación, y funciona de manera coherente con millones de tokens en una sola tarea. Al igual que sus predecesores, GPT‑5.1‑Codex‑Max fue entrenado con tareas reales de ingeniería de software como creación de PR, revisión de código, codificación frontend y sesiones de preguntas y respuestas.
Esta tarjeta de sistema detalla las medidas de seguridad integrales implementadas para GPT‑5.1‑Codex‑Max. Describe en detalle las medidas de mitigación a nivel de modelo, como el entrenamiento especializado en seguridad para tareas peligrosas y las inyecciones de mensajes, además de las medidas de mitigación a nivel de producto, como el espacio controlado de pruebas de agentes y el acceso configurable a la red.
GPT‑5.1‑Codex‑Max fue evaluado según nuestro Marco de preparación. Es muy capaz en el dominio de la ciberseguridad, pero no alcanza un nivel alto de capacidad en ciberseguridad. Esperamos que las tendencias actuales de rápido aumento de capacidad continúen y que los modelos crucen el umbral alto de ciberseguridad en un futuro cercano. Al igual que otros modelos recientes, se está tratando como de alta capacidad en biología y se está desplegando con el conjunto correspondiente de salvaguardias que utilizamos para GPT‑5. No alcanza un nivel alto de capacidad en la automejora de la IA.


