Przedstawiamy najnowszy model generowania obrazów dostępny przez interfejs API
Generowanie obrazów w ChatGPT udostępnione w zeszłym miesiącu szybko stało się jedną z najpopularniejszych funkcji: w ciągu zaledwie pierwszego tygodnia(otwiera nowe okno) ponad 130 milionów użytkowników na całym świecie stworzyło ponad 700 milionów obrazów.
Dzisiaj ten natywny model multimodalny w ChatGPT udostępniamy także przez interfejs API (gpt-image-1). Dzięki niemu programiści i firmy mogą sprawnie zintegrować wysokiej jakości profesjonalne generowanie obrazów bezpośrednio z własnymi narzędziami i platformami. Wszechstronność modelu umożliwia mu tworzenie obrazów w różnych stylach, wierne przestrzeganie niestandardowych wytycznych, wykorzystywanie wiedzy o świecie i dokładne renderowanie tekstu. Dzięki temu ma niezliczone praktyczne zastosowania w wielu dziedzinach.
Wiodące przedsiębiorstwa i start-upy z różnych branż, w tym z branży narzędzi kreatywnych, handlu elektronicznego, edukacji, oprogramowania dla przedsiębiorstw i gier, już wykorzystują generowanie obrazów w swoich produktach i rozwiązaniach. Poniżej przedstawiamy kilka przykładów.
Wiodący ekosystem narzędzi kreatywnych firmy Adobe, w tym aplikacje Firefly i Express, udostępni zdolności generowania obrazów OpenAI. Twórcy będą mieli wybór i elastyczność w eksperymentowaniu z różnymi stylami estetycznymi. Cenią to sobie profesjonaliści, konsumenci i twórcy pełni nowych pomysłów.
Kontynuujemy również współpracę z programistami i firmami. Chcemy poznać więcej sposobów używania generowania obrazów przy użyciu interfejsu API w ich zastosowaniach, w tym:
Projektowanie i edytowanie: Canva bada możliwości integracji modelu gpt-image-1 OpenAI w celu przesunięcia granic tworzenia i edycji projektów w swoich narzędziach Canva AI i Magic Studio. Dzięki zdolnościom modelu gpt-image-1, takim jak przekształcanie szkiców w zachwycające elementy graficzne i edycja wizualna z zachowaniem wysokiej jakości, Canva zapewni swoim 230 milionom użytkowników jeszcze większe możliwości realizacji ich pomysłów na zupełnie nowe sposoby.
Tworzenie i edytowanie logo: GoDaddy aktywnie eksperymentuje z integracją funkcji generowania obrazów umożliwiających klientom łatwe tworzenie edytowalnych logo, usuwanie tła i generowanie profesjonalnej typografii. Ponadto, jest to nowość w GoDaddy Airo®, zespół pracuje nad umożliwieniem klientom tworzenia wpisów w mediach społecznościowych i materiałów marketingowych odzwierciedlających ich unikalną tożsamość marki dla oryginalnych treści dotyczących produktów i marki tworzonych na podstawie polecenia.
Tworzenie materiałów marketingowych: HubSpot bada, w jaki sposób nowe zdolności generowania obrazów przez AI firmy OpenAI mogą pomóc klientom w tworzeniu materiałów marketingowych i sprzedażowych. W miarę jak HubSpot dodaje nowe narzędzia AI wspierające rozwój firm, zdolności generowania obrazów mogą zmienić sposób, w jaki klienci tworzą wysokiej jakości obrazy do mediów społecznościowych, marketingu przy użyciu wiadomości e-mail i stron docelowych bez konieczności posiadania specjalistycznej wiedzy z zakresu projektowania.
Generowanie przepisów i list zakupów: Instacart testuje nowe sposoby używania API do generowania obrazów, w tym obrazów dla przepisów kulinarnych i list zakupów.
Edytowanie filmów: invideo umożliwia milionom użytkowników przekształcanie swoich pomysłów w filmy wideo przy użyciu AI. Dzięki integracji modelu gpt-image-1 platforma oferuje teraz ulepszone generowanie tekstu, precyzyjne opcje edycji oraz zaawansowane wskazówki dotyczące stylu.
Model gpt-image-1 udostępniany przy użyciu interfejsu API korzysta z tych samych zabezpieczeń, co generowanie obrazów 4o w ChatGPT, w tym z zabezpieczeń ograniczających generowanie szkodliwych obrazów i dołączanie metadanych C2PA do generowanych obrazów. Więcej informacji na ten temat można znaleźć w naszym poprzednim wpisie na blogu tutaj. Ponadto programiści mogą również kontrolować czułość moderacji przy użyciu parametru `moderation`, który można ustawić na wartość auto (domyślnie) w celu używania standardowego filtrowania lub low w celu uzyskania mniej restrykcyjnego filtrowania. Więcej informacji zawiera nasza dokumentacja(otwiera nowe okno).
Domyślnie dane API klienta nigdy nie są używane do trenowania. Wszystkie dane wejściowe i wyjściowe w postaci obrazu podlegają naszym zasadom użytkowania API.
Korzystanie z modelu gpt-image-1 jest rozliczane według tokenów. Ceny tokenów w postaci tekstu i tokenów w postaci obrazu są różne:
- Tokeny wejściowe w postaci tekstu (tekst polecenia): 5 USD za 1M tokenów
- Tokeny wejściowe w postaci obrazu (obrazy wejściowe): 10 USD za 1M tokenów
- Tokeny wyjściowe w postaci obrazu (wygenerowane obrazy): 40 USD za 1M tokenów
W praktyce przekłada się to na około 0,02, 0,07 i 0,19 USD za wygenerowany obraz kwadratowy o niskiej, średniej i wysokiej jakości. Szczegółowe informacje na temat użycia tokenów zależnie od jakości i rozmiaru obrazu znajdziesz w dokumentacji(otwiera nowe okno).
Model gpt-image-1 jest teraz dostępny globalnie przy użyciu interfejsu Images API. Wkrótce udostępnimy obsługę przy użyciu interfejsu Responses API. Niektórzy programiści będą musieli zweryfikować(otwiera nowe okno) swoją organizację, zanim będą mogli zacząć korzystanie z modelu. Aby sprawdzić, czy masz już dostęp, przejdź do ustawień organizacji(otwiera nowe okno).
Aby rozpocząć, wypróbuj zdolności modelu w playground(otwiera nowe okno) i zapoznaj się z naszym podręcznikiem generowania obrazów(otwiera nowe okno). Ciekawi nas, co stworzysz.