Présentation de Codex
Un agent d’ingénierie logicielle basé sur le nuage, capable de travailler sur de nombreuses tâches en parallèle, alimenté par codex-1. Disponible dès aujourd'hui pour les utilisateurs de ChatGPT Pro, Business et Enterprise, et bientôt pour les utilisateurs de ChatGPT Plus.

Mise à jour du 3 juin 2025 : Codex est maintenant disponible pour les utilisateurs de ChatGPT Plus. Nous permettons également aux utilisateurs d'autoriser Codex à accéder à Internet pendant l'exécution des tâches. Veuillez consulter le journal des modifications(s'ouvre dans une nouvelle fenêtre) et la documentation(s'ouvre dans une nouvelle fenêtre) pour plus de détails.
Nous lançons aujourd’hui une préversion de recherche de Codex : un agent d’ingénierie logicielle basé sur le nuage, capable de travailler sur de nombreuses tâches en parallèle. Parmi celles-ci, Codex peut rédiger des fonctionnalités, répondre à des questions sur votre base de code, corriger les bugs et proposer des requêtes de fusion à vérifier. Chaque tâche s’exécute dans un environnement sandbox cloud qui lui est propre, préchargé avec votre référentiel.
Codex est alimenté par codex-1, une version d’OpenAI o3 optimisée pour l’ingénierie logicielle. Il a été formé dans le cadre de l’apprentissage par renforcement sur des tâches de codage réelles dans des environnements divers et variés afin de générer du code qui imite de près le style humain et les préférences PR, suit les instructions à la lettre et peut exécuter des tests de manière itérative jusqu’à obtenir un résultat concluant. Nous commençons à déployer Codex aujourd'hui pour les utilisateurs de ChatGPT Pro, Enterprise et Business, avec un soutien pour Plus et Edu à venir bientôt.
Aujourd'hui, vous pouvez accéder à Codex via la barre latérale de ChatGPT et lui attribuer de nouvelles tâches de codage en saisissant une invite et en cliquant sur « Code ». Si vous souhaitez poser une question à Codex concernant votre base de code, cliquez sur « Demander ». Chaque tâche est traitée de manière indépendante dans un environnement isolé, préchargé avec votre base de code. Codex peut lire et modifier des fichiers, ainsi qu’exécuter des commandes, notamment des harnais de test, des linters et des vérificateurs de type. La réalisation d’une tâche prend généralement entre 1 et 30 minutes, selon sa complexité, et vous pouvez suivre la progression de Codex en temps réel.
Lorsque Codex accomplit une tâche, il applique les modifications dans son environnement. Codex fournit des preuves vérifiables de ses actions grâce à des citations des journaux du terminal et des résultats de test, vous permettant de retracer chaque étape effectuée lors de l’exécution de la tâche. Vous pouvez ensuite vérifier les résultats, demander des révisions supplémentaires, ouvrir une demande de fusion GitHub ou directement intégrer les modifications dans votre environnement local. Au niveau du produit, vous pouvez configurer l’environnement Codex afin qu’il corresponde autant que possible à votre environnement de développement.
Vous pouvez utiliser des fichiers AGENTS.md, placés dans votre référentiel, pour guider Codex. Ce sont des fichiers texte, similaires à README.md, où vous pouvez indiquer à Codex comment naviguer dans votre base de code, quelles commandes exécuter pour les tests, et comment respecter au mieux les pratiques standard de votre projet. À l'instar des développeurs humains, les agents Codex fonctionnent de manière optimale lorsqu'ils disposent d'environnements de développement configurés, de configurations de test fiables et d'une documentation claire.
Dans les évaluations de codage et les références internes, codex-1 affiche d’excellents résultats, même sans fichier AGENTS.md ni structure de base personnalisée.
23 échantillons vérifiés par SWE-Bench qui n'étaient pas exécutables sur notre infrastructure interne ont été exclus. codex-1 a été testé avec une longueur de contexte maximale de 192 000 tokens et un « effort de raisonnement » moyen, qui est le paramètre qui sera disponible dans le produit aujourd'hui. Pour plus de détails sur les évaluations d'o3, voir ici.
Notre référence SWE interne est constitué d’une sélection de vraies tâches SWE internes rencontrées chez OpenAI.
Nous lançons Codex en tant que préversion de recherche, en accord avec notre stratégie de déploiement itératif. Lors de sa conception, nous avons privilégié la sécurité et la transparence afin que les utilisateurs puissent vérifier les résultats. Cette mesure de protection connaît une importance croissante, car les modèles d’IA traitent de manière indépendante des tâches de codage de plus en plus complexes et que les considérations en matière de sécurité évoluent. Les utilisateurs peuvent vérifier le travail de Codex grâce aux citations, aux journaux du terminal et aux résultats de test. Lorsqu’il doute ou qu’il échoue un test, l’agent Codex communique clairement ces problèmes, permettant ainsi aux utilisateurs de prendre des décisions éclairées sur la marche à suivre. Néanmoins, il est important que les utilisateurs continuent de vérifier et valider manuellement le code généré par un agent avant de l’intégrer et l’exécuter.


Lors de la formation de codex-1, l’un des objectifs principaux était d’aligner les sorties aux préférences et conventions humaines en matière de code. Comparé à OpenAI o3, codex-1 produit systématiquement des correctifs plus propres, prêts pour une vérification humaine immédiate et une intégration dans les flux de travail standard.
La protection contre les applications malveillantes de l'ingénierie logicielle pilotée par l'IA, telles que le développement de logiciels malveillants, est de plus en plus cruciale. Parallèlement, il est important que les mesures de protection n'entravent pas indûment les applications légitimes et utiles qui peuvent impliquer des techniques parfois également utilisées pour le développement de logiciels malveillants, telles que l'ingénierie du noyau de bas niveau.
Afin de trouver un juste équilibre entre sécurité et utilité, Codex a été formé dans le but d’identifier et refuser les demandes de développement de logiciels malveillants, tout en sachant reconnaître et prendre en charge les tâches légitimes. Nous avons également renforcé nos cadres stratégiques et incorporé des évaluations de sécurité rigoureuses pour renforcer efficacement ces limites. Nous avons publié un addenda à la fiche système o3 pour refléter ces évaluations.
L'agent Codex fonctionne entièrement dans un conteneur sécurisé et isolé dans le nuage. Lors de l’exécution d’une tâche, l’accès Internet est désactivé, limitant les interactions de l’agent uniquement au code fourni explicitement via les référentiels GitHub et les dépendances pré-installées configurées par l’utilisateur à l’aide d’un script d’installation. L’agent ne peut pas accéder aux sites Web, aux API ou à d’autres services externes.
Chez OpenAI, Codex fait partie de la boîte à outils des équipes techniques. Il est majoritairement utilisé par les ingénieurs d’OpenAI pour déléguer les tâches répétitives et bien définies (refactorisation, renommage, rédaction de tests) qui, en temps normal, interrompent la concentration. Il sert à échafauder de nouvelles fonctionnalités, connecter des composants, corriger des bugs et rédiger la documentation. Les équipes développent de nouvelles habitudes autour de cela : priorisation des problèmes en astreinte, planification des tâches en début de journée et délégation des tâches secondaires pour continuer à avancer. En réduisant les allers-retours entre les différents contextes et en faisant remonter les tâches oubliées, Codex permet aux ingénieurs de gagner en productivité et en concentration.
Avant la sortie, nous avons également travaillé avec un petit groupe de testeurs externes afin de mieux comprendre comment Codex fonctionne à travers des bases de code, des processus de développement et des équipes variés.
- Cisco(s'ouvre dans une nouvelle fenêtre) explore comment Codex peut aider ses équipes d'ingénierie à concrétiser plus rapidement des idées ambitieuses. Étant l’un de nos premiers partenaires de conception, Cisco nous aide à façonner l’avenir de Codex en l’évaluant dans des cas d’utilisation réels de leur gamme de produits et en fournissant des commentaires à l’équipe OpenAI.
- Temporal(s'ouvre dans une nouvelle fenêtre) utilise Codex pour accélérer le développement de fonctionnalités, déboguer des problèmes, rédiger et exécuter des tests, et refactoriser de grandes bases de code. Cela les aide également à rester concentrés en exécutant des tâches complexes en arrière-plan — permettant aux ingénieurs de rester dans leur élan tout en accélérant l’itération.
- Superhuman(s'ouvre dans une nouvelle fenêtre) utilise Codex pour accélérer les tâches mineures mais répétitives telles que l'amélioration de la couverture des tests et la correction des échecs d'intégration. Cela les aide également à accélérer la livraison en permettant aux responsables produit de contribuer à des modifications de code légères sans faire appel à un ingénieur, sauf pour la vérification du code.
- Kodiak(s'ouvre dans une nouvelle fenêtre) utilise Codex pour l'aider à écrire des outils de débogage, à améliorer la couverture des tests et à refactoriser le code, ce qui accélère le développement du Kodiak Driver, leur technologie de conduite autonome. Codex est également devenu un outil de référence précieux, aidant les ingénieurs à comprendre des parties de la pile qu’ils ne connaissent pas en faisant remonter le contexte pertinent et les modifications passées.
D’après les enseignements des premiers testeurs, nous recommandons d’assigner des tâches bien définies à plusieurs agents en même temps, et de tester différents types de tâches et invites pour explorer au mieux les capacités du modèle.
Le mois dernier, nous avons lancé Codex CLI, un agent de codage à source ouverte léger qui s'exécute dans votre terminal. Il apporte la puissance des modèles comme o3 et o4-mini dans votre flux de travail local, ce qui facilite leur utilisation conjointe pour accomplir les tâches plus rapidement.
Aujourd’hui, nous lançons également une version allégée de codex-1, une version d’o4-mini conçue spécialement pour une utilisation dans Codex CLI. En plus d’être capable de suivre des instructions et d’imiter le style humain (ses points forts), ce nouveau modèle prend en charge des flux de travail rapides dans la CLI et est optimisé pour les questions-réponses et les modifications liées au code à faible latence. Il est disponible dès maintenant en tant que modèle par défaut dans Codex CLI et dans l’API, sous le nom de codex-mini-latest. Le cliché instantané sous-jacent sera régulièrement mis à jour à mesure que nous continuerons à améliorer le modèle Codex-mini.
De plus, la connexion de votre compte de développeur à Codex CLI est simplifiée. Au lieu de générer et configurer manuellement un token API, vous pouvez désormais vous connecter avec votre compte ChatGPT et sélectionner l’organisation API que vous souhaitez utiliser. Nous nous occuperons de générer et configurer la clé API à votre place. Les utilisateurs Plus et Pro qui se connectent à Codex CLI avec ChatGPT peuvent également profiter de 5 $ et 50 $ de crédits API gratuits, respectivement, dès aujourd’hui et durant les 30 prochains jours.
À partir d'aujourd'hui, nous déployons Codex pour les utilisateurs de ChatGPT Pro, Enterprise et Business à l'échelle mondiale, avec un soutien pour Plus et Edu à venir bientôt. Les utilisateurs bénéficieront d’un accès généreux sans frais supplémentaires pendant les prochaines semaines afin de découvrir ce que Codex peut faire, après quoi nous déploierons un accès limité et proposerons des options de tarification flexibles permettant d’acheter une utilisation supplémentaire à la demande. Par la suite, l’accès sera étendu aux utilisateurs Plus et Edu.
Pour les développeurs qui utilisent codex-mini-latest, le modèle est disponible sur l’API Responses et tarifé à 1,50 $ par million de jetons d’entrée et 6 $ par million de jetons de sortie, avec une réduction de 75 % sur la mise en cache des invites.
Codex n’est qu’au début de son développement. S’agissant d’une préversion, il ne possède pas encore toutes les fonctionnalités, comme les entrées d’images pour les tâches en front-end, et la possibilité de rectifier l’agent pendant son fonctionnement. Par ailleurs, le fait de déléguer le travail à un agent distant est plus long que le fait de réaliser des modifications interactives, ce qui demande un certain temps pour s’y habituer. À terme, l’interaction avec les agents Codex ressemblera de plus en plus à une collaboration asynchrone avec des collègues. Les capacités des modèles étant en évolution, nous prévoyons que les agents traitent des tâches plus complexes sur des périodes prolongées.
Nous imaginons un futur dans lequel les développeurs choisiront les tâches qu’ils souhaitent réaliser eux-mêmes, et délégueront le reste à des agents, afin de gagner en vitesse et en productivité grâce à l’IA. Pour y parvenir, nous développons une suite d'outils Codex qui offrent un soutien à la fois à la collaboration en temps réel et à la délégation asynchrone.
Collaborer avec des outils intelligents comme Codex CLI et d’autres est rapidement devenu la norme dans le secteur, aidant les développeurs à coder plus rapidement. Cependant, nous pensons que le flux de travail asynchrone et multi-agent introduit par Codex dans ChatGPT deviendra la nouvelle façon dont les ingénieurs produisent un code de haute qualité.
Au bout du compte, nous voyons ces deux modes d’interaction, la collaboration en temps réel et la délégation de tâches, converger. Les développeurs travailleront main dans la main avec les agents IA dans leur environnement de développement et leurs outils quotidiens pour poser des questions, obtenir des suggestions et déléguer les tâches plus longues, le tout dans un flux de travail unifié.
À plus long terme, nous prévoyons d’introduire des flux de travail avec agent encore plus interactifs et flexibles. Les développeurs pourront bientôt apporter des instructions en milieu de tâche, collaborer sur les stratégies d’implémentation et recevoir des mises à jour proactives sur leur progression. Nous imaginons également des intégrations plus poussées avec les outils que vous utilisez déjà : aujourd’hui, Codex se connecte à GitHub, et bientôt vous pourrez attribuer des tâches depuis Codex CLI, ChatGPT Desktop, ou même des outils comme votre système de suivi des problèmes ou d’intégration continue.
L’ingénierie logicielle est l’un des premiers secteurs à connaître une augmentation significative de la productivité grâce à l’IA, ouvrant de nouvelles possibilités pour les particuliers et les petites équipes. Bien que nous soyons optimistes quant à ces progrès, nous collaborons également avec des partenaires pour mieux comprendre les implications d'une adoption généralisée des agents sur les flux de travail des développeurs, le développement des compétences des individus, les niveaux de compétence et les régions géographiques.
Et ce n’est que le début. Nous sommes impatients de découvrir vos projets de développement avec Codex.
Message système
Voici le message système de codex-1 qui permet aux développeurs de comprendre le comportement par défaut du modèle et d’adapter Codex pour qu’il fonctionne efficacement dans des flux de travail personnalisés. Par exemple, le message système de codex-1 encourage Codex à exécuter tous les tests mentionnés dans le fichier AGENTS.md, mais si vous manquez de temps, vous pouvez demander à Codex de les passer.