2025 m. balandžio 23 d.

Pristatome naujausią vaizdų generavimo modelį API

Įkeliama...

Kai praėjusį mėnesį pristatėme vaizdų generavimą „ChatGPT“, ši funkcija greitai tapo viena populiariausių: daugiau nei 130 mln. naudotojų visame pasaulyje sukūrė virš 700 mln. vaizdų vos per pirmąją savaitę⁠(atsidaro naujame lange).

Šiandien pristatome šią patirtį „ChatGPT“ valdantį multimodalinį modelį API aplinkoje per gpt-image-1, suteikdami galimybę programuotojams ir įmonėms lengvai integruoti aukštos kokybės, profesionalaus lygio vaizdų generavimą tiesiogiai į savo įrankius ir platformas. Dėl modelio universalumo galima kurti įvairių stilių vaizdus, tiksliai laikytis pasirinktinių gairių, pasitelkti pasaulines žinias ir tiksliai atvaizduoti tekstą – tai atveria daugybę praktinių pritaikymo galimybių įvairiose srityse.

Pirmaujančios įmonės ir startuoliai įvairiose srityse, įskaitant kūrybinius įrankius, el. prekybą, švietimą, verslo programinę įrangą ir žaidimus, jau naudoja vaizdų generavimą savo produktuose ir patirtyse. Džiaugiamės galėdami pasidalyti keliais pavyzdžiais.

Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.

Taip pat toliau dirbame su programuotojais ir įmonėmis, siekdami atrasti daugiau būdų, kaip vaizdų generavimas API gali būti naudingas jų veiklos atvejams, įskaitant toliau nurodytas sritis.

Dizaino kūrimas ir redagavimas: „Canva“ ieško būdų integruoti „OpenAI“ modelį gpt-image-1, kad praplėstų dizaino generavimo ir redagavimo ribas savo įrankiuose „Canva AI“ ir „Magic Studio“. Naudodama gpt-image-1 galimybes, pavyzdžiui, paversti paprastus eskizus įspūdingais grafiniais elementais ir atlikti itin tikslius vizualinius redagavimus, „Canva“ suteiks 230 mln. naudotojų dar platesnes galimybes įgyvendinti idėjas visiškai naujais būdais.

Logotipų kūrimas ir redagavimas: „GoDaddy“ aktyviai eksperimentuoja integruodama vaizdų generavimą, kad klientai galėtų lengvai kurti redaguojamus logotipus, šalinti fonus ir generuoti profesionalią tipografiją. Be to, kaip naują patirtį su „GoDaddy Airo^®“, komanda siekia suteikti klientams galimybę kurti socialinių tinklų įrašus ir rinkodaros išteklius, atspindinčius jų unikalų prekės ženklo identitetą, naudojant originalų produktų ir prekių ženklo turinį, sukurtą pagal raginimą.

Rinkodaros medžiagos kūrimas: „HubSpot“ tiria, kaip naujos „OpenAI“ vaizdų generavimo galimybės gali padėti klientams kurti rinkodaros ir pardavimų medžiagą. „HubSpot“ toliau plečiant DI paremtų įrankių arsenalą verslui plėsti, šios vaizdų generavimo galimybės gali pakeisti būdą, kaip klientai kuria aukštos kokybės vaizdus socialiniams tinklams, el. pašto rinkodarai ir nukreipimo puslapiams, nereikalaujant specialių dizaino žinių.

Receptų ir pirkinių sąrašų generavimas: „Instacart“ bando naujus API naudojimo būdus vaizdams generuoti, įskaitant receptų ir pirkinių sąrašų vaizdus.

Vaizdo įrašų redagavimas: „InVideo“ leidžia milijonams naudotojų paversti savo idėjas vaizdo įrašais naudojant DI. Integravus gpt-image-1, platforma dabar siūlo patobulintą teksto generavimą, tikslius redagavimo valdiklius ir pažangias stiliaus gaires.

Sauga

Modelis gpt-image-1 API aplinkoje taiko tas pačias saugumo priemones kaip ir „4o“ vaizdų generavimas „ChatGPT“ platformoje, įskaitant apsaugas, neleidžiančias modeliui generuoti žalingų vaizdų, ir C2PA metaduomenų įtraukimą į sugeneruotus vaizdus – daugiau apie tai galite paskaityti mūsų ankstesniame tinklaraščio įraše čia. Be to, programuotojai gali valdyti moderavimo jautrumą naudodami parametrą „moderation“, kurį galima nustatyti kaip auto (numatytasis) standartiniam filtravimui arb alow mažiau griežtam filtravimui. Sužinokite daugiau mūsų dokumentacijoje⁠(atsidaro naujame lange).

Pagal numatytąsias nuostatas mes niekada nenaudojame klientų API duomenų mokymui, o visiems vaizdų įvesčių ir išvesčių duomenims taikoma mūsų API naudojimo politika.

Kainodara

Už gpt-image-1 naudojimą mokama pagal prieigos raktus, taikant atskiras kainas teksto ir vaizdo prieigos raktams:

teksto įvesties prieigos raktai (raginimo tekstas): 5 USD už 1 mln. prieigos raktų;
vaizdo įvesties prieigos raktai (įvesties vaizdai): 10 USD už 1 mln. prieigos raktų;
vaizdo išvesties prieigos raktai (sugeneruoti vaizdai): 40 USD už 1 mln. prieigos raktų.

Praktikoje tai reiškia maždaug 0,02 USD, 0,07 USD ir 0,19 USD už sugeneruotą vaizdą atitinkamai mažos, vidutinės ir aukštos kokybės kvadratiniams vaizdams. Išsamią kainodarą pagal vaizdo kokybę ir dydį rasite dokumentacijoje⁠(atsidaro naujame lange).

Pradėti

Modelis gpt-image-1 dabar prieinamas visame pasaulyje per „Images API“, o palaikymas „Responses API“ bus pristatytas netrukus. Kai kuriems programuotojams gali tekti patvirtinti⁠(atsidaro naujame lange) savo organizaciją, kad galėtų naudotis modeliu. Patikrinkite organizacijos nuostatas⁠(atsidaro naujame lange) ir sužinokite, ar jau turite prieigą.

Norėdami pradėti, išbandykite modelio galimybes„Playground“ aplinkoje⁠(atsidaro naujame lange) ir peržiūrėkite mūsų vaizdų generavimo vadovą⁠(atsidaro naujame lange). Nekantriai laukiame pamatyti, ką sukursite.

Autoriai

OpenAI