Carte du modèle gpt‑oss‑120b & gpt‑oss‑20b
Nous présentons gpt-oss-120b et gpt-oss-20b, deux modèles de raisonnement open-weight disponibles sous la licence Apache 2.0 et conformément à notre politique d’utilisation gpt-oss. Développés avec les retours de la communauté open source, ces modèles texte uniquement sont compatibles avec notre Responses API et conçus pour être utilisés dans des workflows agentiques alliant suivi rigoureux des instructions, utilisation d’outils tels que la recherche web et l’exécution de code Python, ainsi que des capacités de raisonnement — notamment la possibilité d’ajuster l’effort de raisonnement pour les tâches ne nécessitant pas de réflexion complexe. Les modèles sont personnalisables, offrent une chaîne de pensée (CoT) complète et prennent en charge les sorties structurées.
La sécurité est à la base de nos open models. Ils présentent un profil de risque différent de celui des modèles propriétaires : Une fois publiés, des attaquants déterminés pourraient les affiner pour contourner les refus de sécurité ou les optimiser directement à des fins malveillantes, sans qu’OpenAI puisse mettre en place des mesures d’atténuation supplémentaires ou révoquer l’accès.
Dans certains contextes, les développeurs et les entreprises devront mettre en place des mesures de sécurité supplémentaires afin de reproduire les protections au niveau système intégrées aux modèles proposés via notre API et nos produits. Nous appelons ce document une « fiche modèle » plutôt qu’une « fiche système », car les modèles gpt-oss seront intégrés dans une grande variété de systèmes créés et maintenus par de nombreux acteurs. Bien que les modèles soient, par défaut, conçus pour respecter les politiques de sécurité d’OpenAI, d’autres parties prenantes prendront également leurs propres décisions et les mettront en œuvre pour assurer la sécurité de ces systèmes.
Nous avons réalisé des évaluations de capacité à grande échelle sur gpt-oss-120b et confirmé que le modèle par défaut n’atteint pas nos seuils indicatifs de Haute capacité dans aucune des trois catégories suivies de notre Preparedness Framework (Biological and Chemical capability, Cyber capability et AI Self-Improvement). Nous avons également étudié deux questions supplémentaires :
- Des acteurs malveillants pourraient-ils affiner gpt-oss-120b pour atteindre le niveau High capability dans les domaines Biological and Chemical ou Cyber ? En simulant les actions potentielles d’un attaquant, nous avons adversarialement affiné gpt‑oss‑120b pour ces deux catégories. Le Safety Advisory Group (« SAG ») d’OpenAI a examiné ces tests et conclu que, même après un fine-tuning poussé reposant sur la pile d’entraînement de pointe d’OpenAI, gpt-oss-120b n’atteignait pas le niveau High capability en matière de Biological and Chemical Risk ou de Cyber risk.
- La publication de gpt‑oss‑120b ferait‑elle progresser de manière significative le front des capacités biologiques dans les modèles fondamentaux ouverts ? Nous avons conclu que la réponse est non : Dans la majorité des évaluations, les performances par défaut d’un ou plusieurs modèles ouverts existants s’approchent de celles obtenues par gpt-oss-120b après un fine-tuning adversarial.
Dans le cadre de ce lancement, OpenAI réaffirme son engagement à faire progresser une IA bénéfique et à relever les normes de sécurité dans l’ensemble de l’écosystème.


