23 Aprili 2025

Tunaweletea muundo wetu wa hivi karibuni wa uundaji wa picha kwenye API

Inapakia…

Tulipoanzisha uzalishaji wa picha katika ChatGPT mwezi uliopita, haraka ikawa moja ya vipengele vyetu maarufu zaidi: zaidi ya watumiaji milioni 130 kote ulimwenguni waliunda zaidi ya picha milioni 700 katika wiki ya kwanza⁠(fungua katika dirisha jipya) pekee.

Leo, tunaleta muundo wa asili wa multimodal unaoendesha uzoefu huu katika ChatGPT kwa API kupitia gpt-image-1, kuwezesha wasanidi programu na biashara kuunganisha kwa urahisi uzalishaji wa picha za ubora wa juu, wa kiwango cha kitaalamu moja kwa moja kwenye zana na majukwaa yao wenyewe. Uwezo wa muundo huuruhusu kuunda picha katika mitindo mbalimbali, kufuata miongozo maalum kwa uaminifu, kutumia maarifa ya dunia na kutoa maandishi kwa usahihi—kufungua programu nyingi za vitendo katika vikoa mbalimbali.

Mashirika makubwa na kampuni changa katika sekta mbalimbali ikiwa ni pamoja na zana za ubunifu, biashara mtandaoni, elimu, programu za biashara, michezo ya kubahatisha, tayari yanatumia uundaji wa picha katika bidhaa na uzoefu wao. Tunafurahi kushiriki baadhi ya mifano hapa chini.

Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.

Tunaendelea pia kushirikiana na wasanidi programu na biashara ili kugundua njia zaidi ambazo uundaji wa picha katika API unaweza kutumikia matumizi yao, ikiwa ni pamoja na:

Kubuni na kuhariri: Canva inagundua njia za kuunganisha gpt-image-1 ya OpenAI ili kusukuma mipaka ya uundaji wa muundo na uhariri katika zana zake za Canva AI na Magic Studio. Kupitia uwezo wa gpt-image-1 kama vile kubadilisha michoro za awali kuwa vipengele vya kuvutia vya picha na kuwezesha uShariri wa picha kwa uaminifu wa hali ya juu, Canva itaendelea kuwawezesha watumiaji wake milioni 230 kuleta mawazo yao kuwa uhalisia kwa njSia mpya kabisa.

Kuunda na kuhariri nembo: GoDaddy inajaribu kwa bidii kuunganisha uundaji wa picha ili wateja waweze kuunda nembo zinazoweza kuhaririwa kwa urahisi, kuondoa mandharinyuma na kuzalisha maandiko ya kitaalamu. Zaidi ya hayo, kama uzoefu mpya na GoDaddy Airo^®, timu hiyo inafanya kazi ili wateja waweze kuunda machapisho ya mitandao ya kijamii na mali za uuzaji zinazoakisi utambulisho wao wa kipekee wa chapa kwa maudhui asilia ya bidhaa na chapa yaliyoandaliwa kutoka kwa dokeza.

Kuunda nyenzo za masoko: HubSpot inagundua jinsi uwezo mpya wa kizazi cha picha wa AI wa OpenAI unaweza kusaidia wateja kuunda nyenzo za masoko na mauzo. HubSpot inaendelea kuongeza zana mpya zinazotumia AI kwa ajili ya kukuza biashara, uwezo huu wa kuzalisha picha una uwezo wa kubadilisha jinsi wateja wanavyotengeneza picha za ubora wa juu kwa mitandao ya kijamii, uuzaji wa barua pepe na kurasa za kutua bila kuhitaji utaalamu maalum wa usanifu.

Kuunda resipe na orodha za ununuzi: Instacart inajaribu njia mpya za kutumia API kwa uundaji wa picha, ikijumuisha picha za resipe na orodha za ununuzi.

Kuhariri video: invideo huwezesha mamilioni ya watumiaji kubadilisha mawazo yao kuwa video kwa kutumia AI. Kwa kuunganishwa kwa gpt-image-1, jukwaa hilo sasa linatoa kizazi cha maandishi kilichoboreshwa, udhibiti wa uhariri wa kina na mwongozo wa mtindo wa hali ya juu.

Usalama

Muundo wa gpt-image-1 katika API unatumia miongozo ya usalama sawa na uundaji wa picha 4o katika ChatGPT, ikijumuisha ulinzi unaozuia muundo kuzalisha picha hatarishi na ujumuishaji wa metadata ya C2PA katika picha zinazozalishwa—unaweza kupata maelezo zaidi kuhusu hili katika chapisho letu la blogu la awali hapa. Zaidi ya hayo, wasanidi programu wanaweza pia kudhibiti unyeti wa udhibiti kwa kutumia kigezo cha `moderation`, ambacho kinaweza kuwekwa kuwa auto (chaguomsingi) kwa kichujio cha kawaida, au low kwa kichujio chenye udhibiti mdogo. Pata maelezo zaidi katika docs⁠(fungua katika dirisha jipya) zetu.

Kwa chaguomsingi, hatufunzi kwa kutumia data ya API ya wateja, na picha zote za ingizo na utoaji zinabaki chini ya sera za matumizi ya API.

Bei

Matumizi ya gpt-image-1 hutozwa kwa kila tokeni na kuna uwekaji bei tofauti kwa tokeni za maandishi na za picha:

Tokeni za ingizo za maandishi (maandishi ya dokeza): $5 kwa kila tokeni milioni 1
Tokeni za ingizo za picha (Ingizo la picha): $10 kwa kila tokeni milioni 1
Tokeni ya kitolewa za picha (picha zilizoundwa): $40 kwa tokeni milioni 1

Kwa vitendo, hii inatafsiriwa kuwa takriban $0.02, $0.07 na $0.19 kwa kila picha iliyoundwa ya ubora wa chini, wa kati na wa juu, mtawalia. Kwa maelezo ya kina ya uwekaji bei kulingana na ubora na ukubwa wa picha, tazama docs⁠(fungua katika dirisha jipya).

Anza

Muundo wa gpt-image-1 sasa unapatikana kimataifa kupitia API ya Picha na usaidizi katika API ya Majibu unakuja hivi karibuni. Baadhi ya wasanidi programu wanaweza kuhitaji kuthibitisha⁠(fungua katika dirisha jipya) mashirika yao kabla ya kuweza kutumia muundo. Tafadhali angalia mipangilio ya shirika⁠(fungua katika dirisha jipya) ili kuona kama tayari una ufikiaji.

Ili kuanza, gundua uwezo wa muundo katika playground⁠(fungua katika dirisha jipya) na utazame mwongozo wetu wa uundaji wa picha⁠(fungua katika dirisha jipya). Tunatazamia kuona kile unachounda.

Waandishi

OpenAI