Îți prezentăm cel mai recent model de generare a imaginilor din API
Când am introdus generarea de imagini în ChatGPT luna trecută, a devenit rapid una dintre cele mai populare funcții ale noastre: peste 130 de milioane de utilizatori din întreaga lume au creat peste 700 de milioane de imagini doar în prima săptămână(se deschide într-o fereastră nouă).
Astăzi, aducem modelul multimodal nativ de la baza acestei experiențe din ChatGPT în API prin intermediul gpt-image-1, permițându-le dezvoltatorilor și companiilor să integreze cu ușurință generarea de imagini de înaltă calitate, la nivel profesional, direct în propriile instrumente și platforme. Versatilitatea modelului îi permite să creeze imagini în stiluri diverse, să urmeze cu fidelitate instrucțiunile personalizate, să valorifice cunoștințele despre lume și să redea text cu precizie — permițând nenumărate tipuri de utilizări practice în mai multe domenii.
Întreprinderile și start-upurile de vârf din diverse sectoare, inclusiv din domeniul instrumentelor creative, comerțului electronic, educației, software-ului pentru întreprinderi și jocurilor, utilizează deja generarea de imagini în propriile produse și experiențe. Suntem încântați să împărtășim câteva dintre aceste exemple mai jos.
Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.
De asemenea, continuăm să colaborăm cu dezvoltatori și companii pentru a descoperi mai multe moduri în care generarea de imagini în API le poate fi utilă, inclusiv:
Design și editare: Canva explorează modalități de a integra gpt-image-1 de la OpenAI pentru a extinde limitele generării și editării de design în instrumentele sale Canva AI și Magic Studio. Prin capacitățile GPT‑image‑1, cum ar fi transformarea schițelor brute în elemente grafice uimitoare și permiterea editărilor vizuale de înaltă fidelitate, Canva le va permite celor 230 de milioane de utilizatori să-și pună în practică ideile în moduri complet noi.
Crearea și editarea siglelor: GoDaddy experimentează activ integrarea generării de imagini, astfel încât clienții să poată crea cu ușurință sigle editabile, elimina fundaluri și genera tipografie profesională. În plus, ca o nouă experiență cu GoDaddy Airo®, echipa se străduiește să le ofere clienților posibilitatea de a crea postări pe rețelele sociale și materiale de marketing care să le reflecte identitatea unică a mărcii, pentru conținut original referitor la produse și mărci, creat pe baza unei solicitări.
Crearea materialelor de marketing: HubSpot explorează cum noile capacități de generare de imagini de la OpenAI pot ajuta clienții să creeze materiale de marketing și de vânzări. În contextul adăugării continue de noi instrumente bazate pe inteligență artificială pentru extinderea afacerilor la HubSpot, aceste capacități de generare a imaginilor ar putea transforma modul în care clienții produc imagini de înaltă calitate pentru rețelele sociale, marketingul prin e-mail și paginile de destinație, fără a fi necesare cunoștințe specializate de design.
Generarea de rețete și liste de cumpărături: Instacart testează noi modalități de a utiliza API-ul pentru generarea de imagini, inclusiv pentru rețete și liste de cumpărături.
Editarea de videoclipuri: invideo le permite unor milioane de utilizatori să-și transforme ideile în videoclipuri folosind inteligența artificială. Odată cu integrarea gpt-image-1, platforma oferă acum o generare îmbunătățită de text, controale de editare precise și îndrumări avansate pentru stil.
Modelul gpt-image-1 din API folosește aceleași măsuri de siguranță ca și generarea de imagini 4o din ChatGPT, inclusiv măsuri de protecție care restricționează generarea de imagini dăunătoare de către model și includerea metadatelor C2PA în imaginile generate — poți citi mai multe despre acest subiect în postarea noastră anterioară de blog aici. În plus, dezvoltatorii pot controla sensibilitatea moderării cu parametrul „moderation”, care poate fi setat la auto (implicit) pentru filtrare standard sau low pentru o filtrare mai puțin restrictivă. Află mai multe din documentația(se deschide într-o fereastră nouă) noastră.
În mod implicit, nu ne instruim niciodată modelele pe baza datelor API ale clienților, iar toate intrările și ieșirile de imagini rămân supuse politicilor noastre de utilizare a API-ului.
Utilizarea gpt-image-1 este tarifată per token, cu prețuri separate pentru tokenurile de text și de imagine:
- Tokenuri de intrare pentru text (text de solicitare): 5 USD per 1 milion de tokenuri
- Tokenuri de intrare pentru imagini (imagini de intrare): 10 USD per 1 milion de tokenuri
- Tokenuri de ieșire pentru imagini (imagini generate): 40 USD per 1 milion de tokenuri
Concret, rezultă aproximativ 0,02, 0,07 și 0,19 USD per imagine generată pentru imagini pătrate de calitate scăzută, medie și înaltă. Pentru prețuri detaliate în funcție de calitatea și dimensiunea imaginii, consultă documentația(se deschide într-o fereastră nouă).
Modelul gpt-image-1 este acum disponibil la nivel global prin API-ul Images, iar compatibilitatea cu API-ul Responses va fi disponibilă în curând. Este posibil ca unii dezvoltatori să fie nevoiți să își verifice(se deschide într-o fereastră nouă) organizația înainte de a putea utiliza modelul. Verifică setările organizației(se deschide într-o fereastră nouă) pentru a vedea dacă ai deja acces.
Pentru a începe, explorează capacitățile modelului în Playground(se deschide într-o fereastră nouă) și consultă ghidul de generare a imaginilor(se deschide într-o fereastră nouă). Așteptăm cu nerăbdare să vedem ce vei construi.