23. dubna 2025

Představujeme náš nejnovější model pro generování obrázků v API

Načítání…

Když jsme minulý měsíc představili generování obrázků v ChatGPT, rychle se stalo jednou z našich nejoblíbenějších funkcí: více než 130 milionů uživatelů po celém světě vytvořilo více než 700 milionů obrázků jen během prvního týdne⁠(otevře se v novém okně).

Dnes přinášíme nativně multimodální model, který pohání tuto zkušenost v ChatGPT, do API prostřednictvím GPT‑image‑1, což umožňuje vývojářům a firmám snadno integrovat vysoce kvalitní, profesionální generování obrázků přímo do jejich vlastních nástrojů a platforem. Univerzálnost modelu mu umožňuje vytvářet obrázky v různorodých stylech, věrně dodržovat vlastní pokyny, využívat světové znalosti a přesně vykreslovat text, čímž odemyká nespočet praktických aplikací napříč mnoha doménami.

Přední podniky a startupy napříč odvětvími, včetně kreativních nástrojů, e-commerce, vzdělávání, podnikových softwarů a herního průmyslu, již používají generování obrázků ve svých produktech a zážitcích. Jsme nadšení, že se můžeme podělit o některé z těchto příkladů níže.

Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.

Také pokračujeme ve spolupráci s vývojáři a podniky, abychom objevili další způsoby, jak může generování obrázků v API sloužit jejich případům použití, včetně:

Navrhování a úpravy: Canva prozkoumává způsoby, jak integrovat OpenAI gpt-image-1 k posunutí hranic generování a úprav návrhů ve svých nástrojích Canva AI a Magic Studio. Díky schopnostem GPT‑image‑1, jako je transformace hrubých náčrtků na úchvatné grafické prvky a umožnění vysoce věrných vizuálních úprav, Canva dále posílí svých 230 milionů uživatelů, aby mohli své nápady realizovat zcela novými způsoby.

Vytvoření a úpravy log: GoDaddy aktivně experimentuje s integrací generování obrázků, aby zákazníci mohli snadno vytvářet loga, která lze upravovat, odebrat pozadí a vytvářet profesionální typografii. Kromě toho tým v rámci nové zkušenosti s GoDaddy Airo^® pracuje na tom, aby zákazníci vytvářeli příspěvky na sociálních médiích a marketingové materiály, které odrážejí jejich jedinečnou identitu značky, a to na základě originálního obsahu produktů a značky vytvořeného na základě podnětu.

Budování marketingových materiálů: HubSpot prozkoumává, jak nové schopnosti generování obrázků od OpenAI mohou pomoci zákazníkům vytvořit marketingové a prodejní materiály. Vzhledem k tomu, že HubSpot neustále přidává nové nástroje založené na umělé inteligenci pro škálování podnikání, mají tyto funkce generování obrázků potenciál změnit způsob, jakým zákazníci vytvářejí vysoce kvalitní obrázky pro sociální média, e-mailový marketing a vstupní stránky, aniž by k tomu potřebovali specializované znalosti v oblasti designu.

Generování receptů a nákupních seznamů: Instacart testuje nové způsoby použití API pro generování obrázků, včetně obrázků pro recepty a nákupní seznamy.

Úprava videí: invideo povoluje milionům uživatelů proměnit své nápady ve videa pomocí umělé inteligence. Díky integraci gpt-image-1 platforma nyní nabízí vylepšené generování textu, jemné ovládací prvky pro úpravy a pokročilé pokyny pro styl.

Bezpečnost

GPT‑image‑1 v API využívá stejné bezpečnostní zábrany jako generování obrázků 4o v ChatGPT, včetně ochranných opatření, která brání modelu generovat škodlivé obrázky, a zahrnutí metadat C2PA do generovaných obrázků – více se o tom dočtete v našem předchozím blogovém příspěvku zde. Kromě toho mohou vývojáři také ovládat citlivost moderování pomocí parametru „moderace“, který lze nastavit na auto (výchozí) pro standardní filtrování nebo na nízké pro méně restriktivní filtrování obsahu. Zjisti více v naší dokumentaci⁠(otevře se v novém okně).

Ve výchozím nastavení nikdy netrénujeme na datech API zákazníků a všechny vstupy a výstupy obrázků podléhají našim zásadám používání API.

Stanovení cen

Použití GPT‑image‑1 je účtováno za token, s odděleným stanovením cen pro textové a obrázkové tokeny:

Vstupní tokeny text (prompt text): 5 USD za 1 milion tokenů
Vstupní tokeny obrázky (prompt obrázky): 10 USD za 1 milion tokenů
Výstupní tokeny obrázky (vygenerované obrázky): 40 USD za 1 milion tokenů

V praxi to znamená zhruba 0,02 USD, 0,07 USD a 0,19 USD na vygenerovaný obrázek pro čtvercové obrázky s nízkou, střední a vysokou kvalitou. Pro podrobné stanovení cen podle kvality a velikosti obrázku se podívej do dokumentace⁠(otevře se v novém okně).

Začít

Model gpt-image-1 je nyní globálně dostupný prostřednictvím API obrázků, s podporou v Responses API, která bude brzy k dispozici. Někteří vývojáři možná budou muset ověřit⁠(otevře se v novém okně) svou organizaci, než budou moci model používat. Zkontroluj nastavení organizace⁠(otevře se v novém okně), jestli už máš přístup.

Abys mohl začít, prozkoumej schopnosti modelu v Playgroundu⁠(otevře se v novém okně) a podívej se na našeho průvodce generováním obrázků⁠(otevře se v novém okně). Těšíme se na to, co vytvoříš.

Autoři

OpenAI