23 april 2025

Vår senaste modell för bildgenerering i API:et

Laddar …

När vi lanserade bildgenerering i ChatGPT förra månaden blev den snabbt en av våra mest populära funktioner – över 130 miljoner användare runt om i världen skapade mer än 700 miljoner bilder bara under den första veckan⁠(öppnas i ett nytt fönster).

Nu erbjuder vi den multimodala modellen som ligger bakom upplevelsen i ChatGPT i vårt API via gpt-image-1. På så sätt blir det möjligt för utvecklare och företag att enkelt integrera professionell bildgenerering av hög kvalitet direkt i de egna verktygen och plattformarna. Modellens mångsidighet gör att det är möjligt att skapa bilder i olika stilar, troget följa anpassade riktlinjer, utnyttja kunskap om världen och korrekt återge text – vilket gör att den kan användas för många olika praktiska tillämpningar inom flera domäner.

Ledande storföretag och uppstartsföretag i olika branscher, bland annat inom kreativa verktyg, e-handel, utbildning, företagsprogramvara och spel, använder redan bildgenerering i sina produkter och upplevelser. Här nedan presenterar vi några exempel på hur den används.

Adobes ledande ekosystem av kreativa verktyg – inklusive apparna Firefly och Express – kommer att ge åtkomst till OpenAI:s funktioner för bildgenerering. Skapare får valmöjligheter och flexibiliteten att experimentera med olika estetiska stilar – något som företag, konsumenter och skapare värdesätter när de tar fram nya kreativa idéer.

Vi fortsätter även att arbeta med utvecklare och företag för att hitta fler sätt som bildgenerering i API:et kan tillämpas på deras användningsfall, inklusive:

Design och redigering: Canva utforskar olika sätt att integrera OpenAI:s gpt-image-1 för att tänja på gränserna för generering av designer och redigering i sina verktyg Canva AI och Magic Studio. Med hjälp av gpt-image-1-funktioner som omvandling av skisser till vackra grafiska element och visuella redigeringar av hög kvalitet kommer Canva att ge sina 230 miljoner användare nya möjligheter att förverkliga idéer på helt nya sätt.

Skapa och redigera logotyper: GoDaddy experimenterar med att integrera bildgenerering så att kunder enkelt kan skapa redigerbara logotyper, ta bort bakgrunder och generera professionell typografi. Förutom den nya upplevelsen med GoDaddy Airo^® arbetar man även med kunderna för att skapa inlägg på sociala medier och marknadsföringsmaterial som återspeglar deras unika varumärkesidentiteter för originalinnehåll relaterat till produkter och varumärket skapat utifrån en prompt.

Skapa marknadsföringsmaterial: HubSpot undersöker hur OpenAI:s nya funktioner för bildgenerering kan hjälpa deras kunder att skapa marknadsförings- och försäljningsmaterial. Samtidigt som HubSpot fortsätter att lägga till nya AI-drivna verktyg för att skala upp företag kan dessa funktioner för bildgenerering förändra hur kunder tar fram bilder av hög kvalitet för sociala medier, e-postmarknadsföring och landningssidor utan att det krävs någon specialiserad expertis inom design.

Skapa recept och inköpslistor: Instacart testar nya sätt att använda bildgenererings-API:et, inklusive för att skapa bilder för recept och inköpslistor.

Redigering av videor: invideo gör det möjligt för miljontals användare att omvandla sina idéer till videor med hjälp av AI. Plattformen har integrerat gpt-image-1 och erbjuder nu bättre textgenerering, detaljerade redigeringskontroller och avancerad stilvägledning.

Säkerhet

Modellen gpt-image-1 i API:et använder samma säkerhetsåtgärder som bildgenerering med 4o i ChatGPT. Det omfattar skyddsåtgärder som begränsar modellen från att generera skadliga bilder och inkludering av C2PA-metadata i genererade bilder. Du kan läsa mer om detta i vårt tidigare blogginlägg här. Dessutom kan utvecklare styra modereringskänsligheten med parametern `moderation` som kan ställas in på auto (standard) för standardfiltrering eller låg för mindre restriktiv filtrering. Läs mer i vår dokumentation⁠(öppnas i ett nytt fönster).

Som standard tränar vi aldrig våra modeller på kunders API-data, och alla in- och utdata för bilder omfattas av våra användningspolicyer för API.

Priser

Användning av gpt-image-1 anges i pris per token, med separata priser för text- och bildtoken:

Indatatoken för text (prompttext): 5 $ per 1 mn token
Indatatoken för bild (indatabild): 10 $ per 1 mn token
Utdatatoken för bild (genererad bild): 40 $ per 1 mn token

Det innebär att priset uppgår till cirka 0,02 $, 0,07 $ och 0,19 $ per genererad bild för fyrkantiga bilder av låg, medelhög respektive hög kvalitet. För detaljerade priser efter bildkvalitet och storlek, se vår dokumentation⁠(öppnas i ett nytt fönster).

Kom igång

Modellen gpt-image-1 är nu tillgänglig globalt via API för bilder. Stöd för Responses API kommer snart. Vissa utvecklare kan behöva verifiera⁠(öppnas i ett nytt fönster) sin organisation innan de kan använda modellen. Kontrollera organisationens inställningar⁠(öppnas i ett nytt fönster) för att se om du redan har åtkomst.

Kom igång genom att utforska modellens funktioner i Playground⁠(öppnas i ett nytt fönster) och kolla in vår guide för bildgenerering⁠(öppnas i ett nytt fönster). Vi ser fram emot att se vad du skapar.

Författare

OpenAI