23 kwietnia 2025

Przedstawiamy najnowszy model generowania obrazów dostępny przez interfejs API

Ładowanie…

Generowanie obrazów w ChatGPT udostępnione w zeszłym miesiącu szybko stało się jedną z najpopularniejszych funkcji: w ciągu zaledwie pierwszego tygodnia⁠⁠(otwiera nowe okno) ponad 130 milionów użytkowników na całym świecie stworzyło ponad 700 milionów obrazów.

Dzisiaj ten natywny model multimodalny w ChatGPT udostępniamy także przez interfejs API (gpt-image-1). Dzięki niemu programiści i firmy mogą sprawnie zintegrować wysokiej jakości profesjonalne generowanie obrazów bezpośrednio z własnymi narzędziami i platformami. Wszechstronność modelu umożliwia mu tworzenie obrazów w różnych stylach, wierne przestrzeganie niestandardowych wytycznych, wykorzystywanie wiedzy o świecie i dokładne renderowanie tekstu. Dzięki temu ma niezliczone praktyczne zastosowania w wielu dziedzinach.

Wiodące przedsiębiorstwa i start-upy z różnych branż, w tym z branży narzędzi kreatywnych, handlu elektronicznego, edukacji, oprogramowania dla przedsiębiorstw i gier, już wykorzystują generowanie obrazów w swoich produktach i rozwiązaniach. Poniżej przedstawiamy kilka przykładów.

Wiodący ekosystem narzędzi kreatywnych firmy Adobe, w tym aplikacje Firefly i Express, udostępni zdolności generowania obrazów OpenAI. Twórcy będą mieli wybór i elastyczność w eksperymentowaniu z różnymi stylami estetycznymi. Cenią to sobie profesjonaliści, konsumenci i twórcy pełni nowych pomysłów.

Kontynuujemy również współpracę z programistami i firmami. Chcemy poznać więcej sposobów używania generowania obrazów przy użyciu interfejsu API w ich zastosowaniach, w tym:

Projektowanie i edytowanie: Canva bada możliwości integracji modelu gpt-image-1 OpenAI w celu przesunięcia granic tworzenia i edycji projektów w swoich narzędziach Canva AI i Magic Studio. Dzięki zdolnościom modelu gpt-image-1, takim jak przekształcanie szkiców w zachwycające elementy graficzne i edycja wizualna z zachowaniem wysokiej jakości, Canva zapewni swoim 230 milionom użytkowników jeszcze większe możliwości realizacji ich pomysłów na zupełnie nowe sposoby.

Tworzenie i edytowanie logo: GoDaddy aktywnie eksperymentuje z integracją funkcji generowania obrazów umożliwiających klientom łatwe tworzenie edytowalnych logo, usuwanie tła i generowanie profesjonalnej typografii. Ponadto, jest to nowość w GoDaddy Airo^®, zespół pracuje nad umożliwieniem klientom tworzenia wpisów w mediach społecznościowych i materiałów marketingowych odzwierciedlających ich unikalną tożsamość marki dla oryginalnych treści dotyczących produktów i marki tworzonych na podstawie polecenia.

Tworzenie materiałów marketingowych: HubSpot bada, w jaki sposób nowe zdolności generowania obrazów przez AI firmy OpenAI mogą pomóc klientom w tworzeniu materiałów marketingowych i sprzedażowych. W miarę jak HubSpot dodaje nowe narzędzia AI wspierające rozwój firm, zdolności generowania obrazów mogą zmienić sposób, w jaki klienci tworzą wysokiej jakości obrazy do mediów społecznościowych, marketingu przy użyciu wiadomości e-mail i stron docelowych bez konieczności posiadania specjalistycznej wiedzy z zakresu projektowania.

Generowanie przepisów i list zakupów: Instacart testuje nowe sposoby używania API do generowania obrazów, w tym obrazów dla przepisów kulinarnych i list zakupów.

Edytowanie filmów: invideo umożliwia milionom użytkowników przekształcanie swoich pomysłów w filmy wideo przy użyciu AI. Dzięki integracji modelu gpt-image-1 platforma oferuje teraz ulepszone generowanie tekstu, precyzyjne opcje edycji oraz zaawansowane wskazówki dotyczące stylu.

Bezpieczeństwo

Model gpt-image-1 udostępniany przy użyciu interfejsu API korzysta z tych samych zabezpieczeń, co generowanie obrazów 4o w ChatGPT, w tym z zabezpieczeń ograniczających generowanie szkodliwych obrazów i dołączanie metadanych C2PA do generowanych obrazów. Więcej informacji na ten temat można znaleźć w naszym poprzednim wpisie na blogu tutaj. Ponadto programiści mogą również kontrolować czułość moderacji przy użyciu parametru `moderation`, który można ustawić na wartość auto (domyślnie) w celu używania standardowego filtrowania lub low w celu uzyskania mniej restrykcyjnego filtrowania. Więcej informacji zawiera nasza dokumentacja⁠(otwiera nowe okno).

Domyślnie dane API klienta nigdy nie są używane do trenowania. Wszystkie dane wejściowe i wyjściowe w postaci obrazu podlegają naszym zasadom użytkowania API.

Cennik

Korzystanie z modelu gpt-image-1 jest rozliczane według tokenów. Ceny tokenów w postaci tekstu i tokenów w postaci obrazu są różne:

Tokeny wejściowe w postaci tekstu (tekst polecenia): 5 USD za 1M tokenów
Tokeny wejściowe w postaci obrazu (obrazy wejściowe): 10 USD za 1M tokenów
Tokeny wyjściowe w postaci obrazu (wygenerowane obrazy): 40 USD za 1M tokenów

W praktyce przekłada się to na około 0,02, 0,07 i 0,19 USD za wygenerowany obraz kwadratowy o niskiej, średniej i wysokiej jakości. Szczegółowe informacje na temat użycia tokenów zależnie od jakości i rozmiaru obrazu znajdziesz w dokumentacji⁠(otwiera nowe okno).

Rozpoczynanie korzystania

Model gpt-image-1 jest teraz dostępny globalnie przy użyciu interfejsu Images API. Wkrótce udostępnimy obsługę przy użyciu interfejsu Responses API. Niektórzy programiści będą musieli zweryfikować⁠(otwiera nowe okno) swoją organizację, zanim będą mogli zacząć korzystanie z modelu. Aby sprawdzić, czy masz już dostęp, przejdź do ustawień organizacji⁠(otwiera nowe okno).

Aby rozpocząć, wypróbuj zdolności modelu w playground⁠(otwiera nowe okno) i zapoznaj się z naszym podręcznikiem generowania obrazów⁠(otwiera nowe okno). Ciekawi nas, co stworzysz.

Autorzy

OpenAI