12 septembre 2024

Découvrez OpenAI o1‑preview

Une nouvelle série de modèles de raisonnement pour la résolution de problèmes difficiles. Disponible dès à présent.

Chargement...

Mise à jour le 17 septembre 2024 : Les limites tarifaires sont désormais de 50 requêtes par semaine pour o1‑preview et de 50 requêtes par jour pour o1‑mini.

Nous avons développé une nouvelle série de modèles d’IA conçus pour consacrer plus de temps à un processus d’analyse avant de produire une réponse. Ils sont capables de raisonner sur des tâches complexes et résoudre des problèmes plus difficiles que les modèles précédents dans les domaines des sciences, de la programmation et des mathématiques.

Nous lançons aujourd’hui le premier de cette série sur ChatGPT et notre API. Il s’agit d’un aperçu et nous prévoyons des mises à jour et des améliorations régulières. Parallèlement à cette version, nous incluons également des évaluations pour la prochaine mise à jour, actuellement en cours de développement.

Comment ça fonctionne

Nous avons formé ces modèles pour qu’ils passent plus de temps à réfléchir aux problèmes avant d'y répondre, comme le ferait une personne. Grâce à l’entraînement, ils apprennent à affiner leur processus de réflexion, à essayer différentes stratégies et à reconnaître leurs erreurs.

Lors de nos tests, la prochaine mise à jour du modèle a obtenu des résultats similaires à ceux des étudiants en doctorat sur des tâches de référence difficiles en physique, en chimie et en biologie. Nous avons également constaté qu'elle excelle en mathématiques et en programmation. Lors d'un examen de qualification pour les Olympiades internationales de mathématiques (IMO), GPT‑4o n'a résolu correctement que 13 % des problèmes, tandis que le modèle de raisonnement a obtenu un score de 83 %. Leurs capacités de codage ont été évaluées lors de concours et ont atteint le 89e percentile dans les concours Codeforces. Vous trouverez plus d'informations à ce sujet dans notre article sur la recherche technique.

En tant que modèle précoce, il ne dispose pas encore de la plupart des fonctions qui rendent le ChatGPT utile, comme la recherche d'informations sur le web et le téléchargement de fichiers et d'images. Pour de nombreux cas courants, le GPT‑4o sera plus performant à court terme.

Mais pour les tâches de raisonnement complexes, il s'agit d'une avancée significative qui représente un nouveau niveau de capacité de l'IA. Dans ces conditions, nous remettons le compteur à 1 et nommons cette série OpenAI o1.

Sécurité

Dans le cadre du développement de ces nouveaux modèles, nous avons mis au point une nouvelle approche de la formation à la sécurité qui exploite leurs capacités de raisonnement pour les faire adhérer aux lignes directrices en matière de sécurité et d'alignement. En étant capable de raisonner sur nos règles de sécurité dans leur contexte, il peut les appliquer plus efficacement.

L'une des façons de mesurer la sécurité consiste à tester dans quelle mesure notre modèle continue à respecter ses règles de sécurité si un utilisateur tente de les contourner (ce que l'on appelle le « jailbreak »). Lors de l'un de nos tests de jailbreak les plus difficiles, GPT‑4o a obtenu un score de 22 (sur une échelle de 0 à 100), tandis que notre modèle o1‑preview a obtenu un score de 84. Vous trouverez plus d'informations à ce sujet dans la carte du système et dans notre rapport de recherche.

Pour répondre aux nouvelles capacités de ces modèles, nous avons renforcé notre travail en matière de sécurité, notre gouvernance interne et notre collaboration avec le gouvernement fédéral. Cela inclut des tests et des évaluations rigoureuses à l'aide de notre cadre de préparation⁠(ouverture dans une nouvelle fenêtre), une équipe rouge de premier ordre et des processus d'examen au niveau du conseil d'administration, y compris par notre comité de sûreté et de sécurité.

Pour renforcer notre engagement en faveur de la sécurité de l'IA, nous avons récemment formalisé des accords avec les Centres pour la sécurité de l’IA américains et britanniques. Nous avons commencé à rendre ces accords opérationnels, notamment en accordant aux instituts un accès anticipé à une version de recherche de ce modèle. Il s'agit d'une première étape importante de notre partenariat, qui a permis d'établir un processus de recherche, d'évaluation et de test des futurs modèles avant et après leur diffusion publique.

À qui est-ce destiné ?

Ces capacités de raisonnement améliorées peuvent être particulièrement utiles si vous vous attaquez à des problèmes complexes dans les domaines de la science, du codage, des mathématiques et d'autres domaines similaires. Par exemple, o1 peut être utilisé par les chercheurs en santé pour annoter les données de séquençage cellulaire, par les physiciens pour générer des formules mathématiques compliquées nécessaires à l'optique quantique, et par les développeurs de tous les domaines pour construire et exécuter des flux de travail à plusieurs étapes.

OpenAI o1-mini

La série o1 excelle dans la génération et le débogage précis de codes complexes. Afin d'offrir une solution plus efficace aux développeurs, nous lançons également OpenAI o1‑mini, un modèle de raisonnement plus rapide et moins cher, particulièrement efficace pour le codage. En tant que modèle plus petit, o1‑mini est 80 % moins cher que o1‑preview, ce qui en fait un modèle puissant et rentable pour les applications qui requièrent un raisonnement mais pas une connaissance étendue du monde.

Comment utiliser OpenAI o1

Les utilisateurs de ChatGPT Plus et Team pourront accéder aux modèles o1 dans ChatGPT à partir d'aujourd'hui. o1‑preview et o1‑mini peuvent être sélectionnés manuellement dans le sélecteur de modèles, et au lancement, les limites de tarifs hebdomadaires seront de 30 messages pour o1‑preview et de 50 pour o1‑mini. Nous nous efforçons d'augmenter ces taux et de permettre à ChatGPT de choisir automatiquement le bon modèle pour une question donnée.

Une image de la nouvelle liste déroulante ChatGPT qui affiche la nouvelle option de modèle « o1-preview » sur un fond abstrait jaune et bleu vif.

Les utilisateurs de ChatGPT Enterprise et Edu auront accès aux deux modèles à partir de la semaine prochaine.

Les développeurs qui peuvent prétendre au niveau 5 d'utilisation de l'API⁠(ouverture dans une nouvelle fenêtre) peuvent commencer à réaliser des prototypes avec les deux modèles de l'API dès aujourd'hui, avec une limite de vitesse de 20 tours par minute (RPM). Nous nous efforçons d'augmenter ces limites après des tests supplémentaires. L'API pour ces modèles n'inclut pas actuellement l'appel de fonctions, la diffusion en continu, la prise en charge des messages système et d'autres fonctionnalités. Pour commencer, consultez la documentation de l'API⁠(ouverture dans une nouvelle fenêtre).

Nous prévoyons également d'offrir l'accès à o1‑mini à tous les utilisateurs de ChatGPT Free.

Évolutions prévues

Il s'agit d'un premier aperçu de ces modèles de raisonnement dans ChatGPT et l'API. Outre les mises à jour des modèles, nous prévoyons d’ajouter des fonctions de navigation, de téléchargement de fichiers et d'images, ainsi que d'autres fonctionnalités pour les rendre plus utiles à tous.

Nous prévoyons également de continuer à développer et à publier des modèles dans notre série GPT, en plus de la nouvelle série OpenAI o1.

Auteur

OpenAI