Carte système GPT‑5.1‑Codex‑Max
GPT‑5.1‑Codex‑Max est notre nouveau modèle de codage agentique de pointe. Il repose sur une mise à jour de notre modèle de raisonnement fondamental, formé sur des tâches agentiques dans les domaines du génie logiciel, des mathématiques, de la recherche, de la médecine, de l'informatique et plus encore. C'est notre premier modèle nativement entraîné à fonctionner sur plusieurs fenêtres contextuelles grâce à un processus appelé compactage, travaillant de manière cohérente sur des millions de tokens dans une seule tâche. Comme ses prédécesseurs, GPT‑5.1‑Codex‑Max a été entraîné sur des tâches réelles de génie logiciel telles que la création de PR, la vérification de code, le développement frontend et les questions-réponses.
Cette fiche système présente les mesures de sécurité exhaustives mises en œuvre pour GPT‑5.1‑Codex‑Max. Elle détaille à la fois les mesures de protection au niveau du modèle, telles que la formation spécialisée en sécurité pour les tâches nuisibles et les injections d'invite, et les contre-mesures au niveau du produit, telles que l’environnement test de l’agent et la configuration de l’accès réseau.
GPT‑5.1‑Codex‑Max a été évalué dans le cadre de notre cadre de préparation. Il est très performant dans le domaine de la cybersécurité, mais n’atteint pas un niveau de capacité élevé en cybersécurité. La montée en capacité des modèles devrait se confirmer et nous pensons qu’ils atteindront d’ici peu le seuil de Haute cybersécurité. Comme d’autres modèles récents, il est considéré de Haute capacité en biologie et il est déployé avec la suite de garde-fous correspondante que nous utilisons pour GPT‑5. Il n’atteint pas le seuil de Haute capacité en amélioration autonome de l’IA.


