Disponibilité de notre nouveau modèle de génération d’images dans l’API
Dès son déploiement dans ChatGPT le mois dernier, la génération d’images est devenue l’une de nos fonctionnalités les plus populaires : plus de 130 millions d’utilisateurs du monde entier ont ainsi créé plus de 700 millions d’images rien que la première semaine(ouverture dans une nouvelle fenêtre).
À compter d’aujourd’hui, le modèle nativement multimodal qui est à la base de cette expérience dans ChatGPT devient aussi accessible depuis l’API, via gpt-image-1. Développeurs et entreprises ont désormais la possibilité de générer des images professionnelles de haute qualité directement dans leurs outils et plateformes Très polyvalent, ce modèle est capable de créer des images dans des styles très variés, de suivre avec précision les directives qui lui sont données, d’utiliser ses connaissances du monde et de rendre correctement le texte. Il offre ainsi de nombreuses applications très concrètes dans divers domaines.
Outils créatifs, e-commerce, solutions pour l’éducation, logiciels métier ou jeux, les plus grandes entreprises et start-up intègrent déjà la génération d’images dans leurs produits et expériences. Nous sommes très heureux de vous présenter certaines d’entre elles :
Adobe, dont l’écosystème créatif réunit certaines des applications les plus populaires du marché, comme Firefly et Express, prévoit d’intégrer les fonctionnalités de génération d’images d’OpenAI. Ses utilisateurs auront ainsi la possibilité de tester différents styles esthétiques, un atout apprécié des professionnels, consommateurs et créateurs en quête d’inspiration.
Nous continuons également de travailler avec des développeurs et entreprises pour déterminer comment l’accès à la génération d’images via l’API pourrait servir leurs cas d’usage :
Design et retouche : Canva cherche comment l’intégration du modèle gpt-image-1 d’OpenAI lui permettra de repousser les limites de la génération et la modification de designs dans ses outils Canva AI et Magic Studio. Avec les possibilités offertes par gpt-image-1, comme la transformation d’esquisses brouillonnes en éléments graphiques exceptionnels et les modifications visuelles haute fidélité, Canva aidera encore davantage ses 230 millions d’utilisateurs à donner vie à leurs idées de manière inédite.
Création et modification de logos : GoDaddy travaille activement sur l’intégration de la génération d’images pour permettre à ses clients de créer facilement des logos modifiables, de supprimer des arrière-plans et de générer des polices professionnelles. Dans le cadre de son expérience GoDaddy Airo®, son équipe veut aussi proposer à ses clients de créer à partir d’un prompt des contenus fidèles à leur image et originaux qu’ils pourront utiliser sur leurs réseaux sociaux et dans leurs campagnes marketing.
Création de ressources marketing : HubSpot étudie comment les nouvelles capacités de génération d’images d’OpenAI pourraient aider ses clients à créer des ressources marketing et commerciales. L’entreprise multiplie les outils basés sur l’IA pour aider les entreprises à se développer. Ces capacités de génération d’images pourraient transformer la création d’images haute qualité pour les réseaux sociaux, le marketing par e-mail et les pages web en permettant de se passer de graphistes spécialisés.
Création de recettes et de listes de courses : Instacart teste de nouvelles façons d’utiliser l’API, notamment dans le but de générer des images pour des recettes et listes de courses.
Montage de vidéos : invideo permet à ses millions d’utilisateurs de transformer leurs idées en vidéos avec l’IA. Avec l’intégration de gpt-image-1, la plateforme peut désormais proposer une génération de textes améliorée, des contrôles de montage fins et la prise en charge d’instructions de style pointues.
Le modèle gpt-image-1 de l’API utilise les mêmes garde-fous que la génération d’image par 4o dans ChatGPT. Il bloque notamment la création d’images dangereuses et inclut des métadonnées C2PA dans les images. Pour en savoir plus à ce sujet, reportez-vous à cet article. De plus, les développeurs peuvent ajuster la sensibilité de la modération à l’aide du paramètre « moderation », qui peut être réglé sur auto (valeur par défaut) pour un filtrage standard ou low pour un filtrage moins strict. Pour en savoir plus, consultez notre documentation(ouverture dans une nouvelle fenêtre).
Par défaut, nous n’entraînons jamais nos modèles sur les données des clients de l’API. Toutes les images en entrée et en sortie sont soumises à nos politiques d’utilisation de l’API.
L’utilisation de gpt-image-1 est facturée au jeton, avec des tarifs distincts pour les jetons de texte et d’image :
- Jetons d’entrée de texte (texte des prompts) : 5 $ par million de jetons
- Jetons d’entrée d’image (images en entrée) : 10 $ par million de jetons
- Jetons de sortie d’image (images générées) : 40 $ par million de jetons
En pratique, ces tarifs reviennent environ à respectivement 0,02 $, 0,07 $ et 0,19 $ par image carrée générée en qualité basse, intermédiaire et élevée. Pour plus de détails sur la tarification appliquée en fonction de la qualité et de la taille de l’image, consultez la documentation(ouverture dans une nouvelle fenêtre).
Le modèle gpt-image-1 est désormais accessible dans le monde entier via l’API Images. L’API Responses sera bientôt prise en charge. Certains développeurs pourront devoir authentifier(ouverture dans une nouvelle fenêtre) leur organisation avant d’utiliser le modèle. Pour savoir si vous y avez déjà accès, consultez les paramètres de l’organisation(ouverture dans une nouvelle fenêtre).
Pour vous lancer, testez les capacités du modèle dans Playground(ouverture dans une nouvelle fenêtre) et consultez notre guide sur la génération d’images(ouverture dans une nouvelle fenêtre). Nous avons hâte de découvrir ce que vous allez faire de ces nouvelles possibilités.