23. April 2025

Unser neuestes Bildgenerierungsmodell in der API ist da

Laden …

Nachdem wir letzten Monat die Bildgenerierung in ChatGPT eingeführt haben, wurde sie schnell zu einer unserer beliebtesten Funktionen: Über 130 Millionen Benutzer weltweit erstellten allein in der ersten Woche⁠(wird in einem neuen Fenster geöffnet) mehr als 700 Millionen Bilder.

Heute bringen wir das nativ multimodale Modell, das diese Erfahrung in ChatGPT ermöglicht, über gpt-image-1 in die API und ermöglichen Entwicklern und Unternehmen so, hochwertige professionelle Bildgenerierung direkt in ihre eigenen Tools und Plattformen zu integrieren. Das Modell ist vielseitig und kann Bilder in unterschiedlichen Stilen erstellen, benutzerdefinierte Richtlinien genau befolgen, weltweites Wissen nutzen und Text präzise wiedergeben – und so endlose praktische Anwendungen in zahlreichen Bereichen ermöglichen.

Führende Unternehmen und Startups aus verschiedenen Branchen, darunter Kreativ-Tools, E-Commerce, Bildung, Unternehmenssoftware und Gaming, nutzen die Bildgenerierung bereits in ihren Produkten und Erlebnissen. Wir freuen uns, dir im Folgenden einige dieser Beispiele vorzustellen.

Adobes führendes Portfolio kreativer Tools, darunter die Firefly- und Express-Apps, bietet Zugriff auf die Bildgenerierungsfunktionen von OpenAI und gibt Erstellern die Wahl und Flexibilität, mit unterschiedlichen ästhetischen Stilen zu experimentieren. Dies wird von Geschäftsleuten, Verbrauchern und Erstellern gleichermaßen bei der Entwicklung neuer kreativer Ideen geschätzt.

Wir arbeiten außerdem fortlaufend mit Entwicklern und Unternehmen zusammen, um weitere Möglichkeiten zu entdecken, wie die Bildgenerierung in der API ihren Anwendungsfällen dienen kann, darunter:

Design und Bearbeitung: Canva erkundet Möglichkeiten zur Integration von OpenAIs gpt-image-1, um die Grenzen der Designerstellung und -bearbeitung in seinen Tools Canva AI und Magic Studio zu erweitern. Durch Funktionen von gpt-image-1, wie etwa die Umwandlung grober Skizzen in beeindruckende Grafikelemente und die Ermöglichung hochauflösender visueller Bearbeitungen, wird Canva es seinen 230 Millionen Nutzern ermöglichen, ihre Ideen auf völlig neue Weise zum Leben zu erwecken.

Erstellung und Bearbeitung von Logos: GoDaddy experimentiert aktiv mit der Integration der Bildgenerierung, damit Kunden problemlos bearbeitbare Logos erstellen, Hintergründe entfernen und professionelle Typografie generieren können. Darüber hinaus arbeitet das Team als neue Erfahrung mit GoDaddy Airo^® daran, dass Kunden Social-Media-Beiträge und Marketing-Assets erstellen, die ihre einzigartige Markenidentität für originelle Produkt- und Markeninhalte widerspiegeln, die basierend auf einem Prompt erstellt wurden.

Erstellung von Marketingmaterialien: HubSpot untersucht, wie die neuen KI-Bildgenerierungsfunktionen von OpenAI Kunden beim Erstellen von Marketing- und Verkaufsmaterialien unterstützen können. Da HubSpot kontinuierlich neue KI-gestützte Tools für wachsende Unternehmen hinzufügt, haben diese Bildgenerierungsfunktionen das Potenzial, die Art und Weise zu verändern, wie Kunden hochwertige Bilder für soziale Medien, E-Mail-Marketing und Landingpages erstellen, ohne dass dafür spezielle Designkenntnisse erforderlich sind.

Generierung von Rezepten und Einkaufslisten: Instacart testet neue Möglichkeiten, die API zur Bildgenerierung zu verwenden, einschließlich Bildern für Rezepte und Einkaufslisten.

Bearbeitung von Videos: Invideo ermöglicht es Millionen von Benutzern, ihre Ideen mithilfe von KI in Videos umzusetzen. Mit der Integration von gpt-image-1 bietet die Plattform jetzt eine verbesserte Textgenerierung, Elemente zur feinkörnigen Bearbeitung und erweiterte Stilanleitungen.

Sicherheit

Das gpt-image-1-Modell in der API nutzt dieselben Sicherheitsvorkehrungen wie die 4o-Bildgenerierung in ChatGPT, einschließlich Sicherheitsvorkehrungen, die das Modell daran hindern, schädliche Bilder zu generieren, und die Einbeziehung von C2PA-Metadaten in generierte Bilder. Weitere Informationen hierzu findest du in unserem früheren Blogbeitrag hier. Darüber hinaus können Entwickler die Empfindlichkeit der Moderation auch mit dem Parameter „Moderation“ steuern, der für die Standardfilterung auf automatisch (Standard) oder für eine weniger restriktive Filterung auf niedrig eingestellt werden kann. Erfahre mehr in unserer Dokumentation⁠(wird in einem neuen Fenster geöffnet).

Standardmäßig trainieren wir nie mit API-Daten von Kunden und alle Bildeingaben und -Outputs unterliegen weiterhin unseren API-Nutzungsrichtlinien.

Preisgestaltung

Die Nutzung von gpt-image-1 wird pro Token berechnet, wobei für Text- und Bild-Tokens separate Preise gelten:

Texteingabe-Tokens (Prompt-Text): 5 USD pro 1 Mio. Tokens
Bildeingabe-Tokens (Bildeingabe): 10 USD pro 1 Mio. Tokens
Bild-Output-Tokens (Bildgenerierung): 40 USD pro 1 Mio. Tokens

In der Praxis entspricht dies etwa 0,02 USD, 0,07 USD und 0,19 USD pro generiertem Bild für quadratische Bilder niedriger, mittlerer bzw. hoher Qualität. Detaillierte Preisangaben nach Bildqualität und -größe findest du in der Dokumentation⁠(wird in einem neuen Fenster geöffnet).

Erste Schritte

Dasgpt-image-1-Modell ist jetzt weltweit über die Images API verfügbar, die Responses API folgt in Kürze. Einige Entwickler müssen möglicherweise ihre Organisation verifizieren⁠(wird in einem neuen Fenster geöffnet), bevor sie das Modell verwenden können. Bitte überprüfe in den Organisationseinstellungen⁠(wird in einem neuen Fenster geöffnet), ob du bereits Zugriff hast.

Um loszulegen, erkunde die Funktionen des Modells in Playground⁠(wird in einem neuen Fenster geöffnet) und schau dir unseren Leitfaden zur Bildgenerierung⁠(wird in einem neuen Fenster geöffnet) an. Wir freuen uns, zu sehen, was du entwickelst.

Autoren

OpenAI