2025. április 23.

Bemutatjuk a legújabb képgeneráló modellünket az API-ban

Betöltés…

Amikor múlt hónapban bevezettük a képgenerálást a ChatGPT‑ben, az egyik legnépszerűbb funkciónkká vált igen gyorsan: világszerte több mint 130 millió felhasználó több mint 700 millió képet hozott létre csupán az első héten⁠(új ablakban nyílik meg).

Ma a ChatGPT‑ben ezt az élményt biztosító, natívan multimodális modellt a GPT‑image‑1 révén az API-hoz is elérhetővé tesszük, lehetővé téve a fejlesztők és vállalatok számára, hogy a magas minőségű, profi szintű képalkotást könnyedén integrálják saját eszközeikbe és platformjaikba. A modell sokoldalúsága lehetővé teszi a különböző stílusokban történő képgenerálást, hűen követi az egyedi irányelveket, kihasználja a világ tudását, és pontosan jeleníti meg a szöveget—számtalan gyakorlati alkalmazást nyitva meg több domainon.

Vezető vállalatok és startupok a kreatív eszközök, e-kereskedelem, oktatás, vállalati szoftverek és játékfejlesztés területéről már most alkalmazzák a képalkotást termékeikben és felhasználói élményeikben. Izgatottan várjuk, hogy megoszthassunk néhány példát.

Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.

Továbbra is együttműködünk a fejlesztőkkel és a vállalkozásokkal, hogy feltárjuk, hogyan szolgálhatja az API képgenerálása a használati eseteket, beleértve a következőket:

Tervezés és szerkesztés: A Canva új módszereket keres az OpenAI GPT‑image‑1 integrálására, hogy kibővítse a tervezés generálásának és szerkesztésének határait a Canva AI és a Magic Studio eszközeiben. A GPT‑image‑1 képességei, mint például a vázlatos rajzok lenyűgöző grafikai elemekké alakítása és a nagy hűségű vizuális szerkesztések lehetővé tétele révén a Canva tovább fogja erősíteni 230 millió felhasználóját, hogy teljesen új módon kelthessék életre ötleteiket.

Logók létrehozása és szerkesztése: A GoDaddy aktívan kísérletezik a kép generálás integrálásával, hogy az ügyfelek könnyedén készíthessenek szerkeszthető logókat, távolíthassák el a háttereket, és hozzanak létre professzionális tipográfiát. Emellett, a GoDaddy Airo^® új élményében a csapat azon fáradozik, hogy az ügyfelek képesek legyenek olyan közösségi média posztokat és marketinganyagokat készíteni, amelyek tükrözik egyedi márkaidentitásukat, az eredeti termék- és márkatartalmakat pedig egyetlen utasítás alapján hozzák létre.

Marketinganyagok készítése: a HubSpot azt vizsgálja, hogy az OpenAI új AI képgenerálási képességei miként segíthetik az ügyfeleket marketing és értékesítési anyagok létrehozásában. Ahogy a HubSpot tovább bővíti az AI-alapú eszköztárát a vállalkozások skálázására, ezek a képgenerálási képességek átalakíthatják azt, ahogyan az ügyfelek magas minőségű képeket készítenek közösségi média céljára, e-mail marketinghez és landing oldalakhoz, anélkül, hogy speciális tervezői szakértelemre lenne szükségük.

Receptek és bevásárlólisták generálása: az Instacart új módszereket tesztel az API használatára képgenerálás céljából, beleértve a receptekhez és bevásárlólistákhoz tartozó képeket.

Videók szerkesztése: az invideo lehetővé teszi, hogy felhasználók milliói az ötleteket videókká alakítsák az AI segítségével. A GPT‑image‑1 integrációjával a platform mostantól fejlettebb szövegalkotást, finomhangolási szerkesztési vezérlőket és fejlett stílusirányítást kínál.

Biztonság

Az API-ban található GPT‑image‑1 modell ugyanazokat a biztonsági korlátokat alkalmazza, mint a 4o kép generálás a ChatGPT‑ben, beleértve azokat a védelmi intézkedéseket, amelyek megakadályozzák, hogy a modell káros képeket generáljon, valamint a C2PA metaadatok beillesztését a generált képekbe—erről bővebben olvashatsz korábbi blogbejegyzésünkben itt. Ezenkívül a fejlesztők a `moderation` paraméterrel is szabályozhatják a moderáció érzékenységét, amely auto (alapértelmezett) értékre állítható a standard szűréshez, vagy low értékre a kevésbé szigorú szűréshez. Tudj meg többet a dokumentumainkból⁠(új ablakban nyílik meg).

Alapértelmezettként soha nem használjuk fel az ügyfél API adatait betanításra, és minden képbevitel és -kimenet továbbra is az API használati irányelvek hatálya alá tartozik.

Árképzés

A GPT‑image‑1 használata tokenenként van árazva, külön árképzés vonatkozik a szöveg- és képtokenekre:

Beviteli tokenek (utasítás szöveg): 5 USD per 1 millió token
Kép beviteli tokenek (beviteli képek): 10 USD per 1 millió token
Kép kimeneti tokenek (generált képek): 40 USD per 1 millió token

A gyakorlatban ez körülbelül 0,02, 0,07 és 0,19 USD összeget jelent alacsony, közepes és magas minőségű, négyzet alakú generált képek esetében. A kép minősége és mérete szerinti részletes árképzést lásd a dokumentumokban⁠(új ablakban nyílik meg).

Kezdés

A GPR-image-1 modell mostantól világszerte elérhető az Images API-n keresztül, és hamarosan elérhető lesz a támogatás is a Responses API-ban. Néhány fejlesztőnek igazolnia⁠(új ablakban nyílik meg) kell a szervezetét, mielőtt használhatná a modellt. Kérlek, ellenőrizd az szervezeti beállításokat⁠(új ablakban nyílik meg), hogy megnézd, van-e már hozzáférésed.

A kezdéshez ismerd meg a modell képességeit a Playground⁠(új ablakban nyílik meg) felületen, és nézd meg a képgenerálási útmutatónkat⁠(új ablakban nyílik meg). Alig várjuk, hogy lássuk, mit építesz.

Szerzők

OpenAI