Presentiamo il nostro ultimo modello di generazione di immagini nell'API
Il mese scorso abbiamo introdotto la generazione di immagini in ChatGPT ed è diventata rapidamente una delle nostre funzioni più popolari: oltre 130 milioni di utenti in tutto il mondo hanno creato più di 700 milioni di immagini solo nella prima settimana(si apre in una nuova finestra).
Ora portiamo il modello multimodale nativo che alimenta questa esperienza in ChatGPT nell'API tramite gpt-image-1, permettendo a sviluppatori e aziende di integrare facilmente la generazione di immagini di alta qualità e di livello professionale direttamente nei loro strumenti e piattaforme. La versatilità del modello consente di creare immagini con stili diversi, di seguire fedelmente le linee guida personalizzate, di sfruttare la conoscenza del mondo e di renderizzare il testo con precisione, sbloccando innumerevoli applicazioni pratiche in diversi ambiti.
Le aziende e le startup leader nei settori degli strumenti creativi, dell'e-commerce, dell'istruzione, del software aziendale e dei giochi utilizzano già la generazione di immagini nei loro prodotti e nelle loro esperienze. Siamo entusiasti di condividere alcuni di questi esempi qui di seguito.
Il principale ecosistema di strumenti creativi di Adobe, tra cui le app Firefly ed Express, fornirà l'accesso alle capacità di generazione di immagini di OpenAI, offrendo ai creatori la scelta e la flessibilità di sperimentare diversi stili estetici, molto apprezzata da professionisti del settore, consumatori e creatori quando generano nuove idee creative.
Stiamo inoltre continuando a collaborare con sviluppatori e aziende per scoprire altri modi in cui la generazione di immagini nell'API può servire ai loro casi d'uso, tra cui:
Progettazione e editing: Canva sta esplorando il modo di integrare gpt-image-1 di OpenAI per spingere i confini della generazione e della modifica dei progetti nei suoi strumenti Canva AI e Magic Studio. Grazie a funzionalità gpt-image-1 come la trasformazione di schizzi grezzi in elementi grafici straordinari e la possibilità di effettuare modifiche visive ad alta fedeltà, i 230 milioni di utenti di Canva potranno dare vita alle loro idee in modi del tutto nuovi.
Creazione e modifica di loghi: GoDaddy sta sperimentando attivamente l'integrazione della generazione di immagini, in modo che i clienti possano creare facilmente loghi modificabili, rimuovere gli sfondi e ottenere una tipografia professionale. Inoltre, come nuova esperienza con GoDaddy Airo®, il team sta lavorando per far sì che i clienti creino post e risorse di marketing sui social media che riflettano l'identità unica del loro marchio per i contenuti originali del prodotto e del marchio creati da un prompt.
Creazione di materiale di marketing: HubSpot sta studiando come le nuove funzionalità di generazione di immagini IA di OpenAI possano aiutare i clienti a creare materiale di marketing e di vendita. HubSpot continua ad aggiungere nuovi strumenti basati sull'IA per le aziende in espansione, e queste funzionalità di generazione di immagini hanno il potenziale per trasformare il modo in cui i clienti producono immagini di alta qualità per i social media, l'email marketing e le landing page senza richiedere competenze specialistiche di design.
Creazione di ricette e liste della spesa: Instacart sta testando nuove modalità di utilizzo dell'API per la generazione di immagini, comprese quelle per le ricette e le liste della spesa.
Editing di video: invideo consente a milioni di utenti di trasformare le loro idee in video utilizzando l'intelligenza artificiale. Con l'integrazione di gpt-image-1, la piattaforma offre ora una migliore generazione del testo, controlli di editing a grana fine e una guida stilistica avanzata.
Il modello gpt-image-1 nell'API sfrutta le stesse protezioni di sicurezza della generazione di immagini 4o in ChatGPT, comprese le protezioni che limitano il modello dalla generazione di immagini dannose e l'inclusione di metadati C2PA nelle immagini generate. Puoi leggere di più su questo argomento nel post pubblicato qui. Inoltre, gli sviluppatori possono anche controllare la sensibilità della moderazione con il parametro «moderazione», che può essere impostato su auto (predefinito) per un filtraggio standard, o su basso per un filtraggio meno restrittivo. Per saperne di più, consulta la nostra documentazione(si apre in una nuova finestra).
Per impostazione predefinita, non facciamo mai addestramento sui dati API dei clienti e tutti gli input e gli output delle immagini rimangono soggetti alle nostre politiche di utilizzo delle API.
L'uso di gpt-image-1 ha un prezzo per token, con tariffe separate per i token di testo e di immagine:
- Token di input per testo (prompt di testo): $5 per 1M di token
- Token di input per immagine (input di immagini): $10 per 1M di token
- Token di output per immagine (immagini generate): $40 per 1M di token
In pratica, ciò si traduce in circa 0,02, 0,07 e 0,19 dollari per immagine generata, rispettivamente per immagini quadrate di bassa, media e alta qualità. Per le tariffe dettagliate in base alla qualità e alle dimensioni dell'immagine, consulta la documentazione(si apre in una nuova finestra).
Il modello gpt-image-1 è ora disponibile a livello globale tramite l'API Immagini, con il supporto dell'API Risposte in arrivo. Alcuni sviluppatori potrebbero dover verificare(si apre in una nuova finestra) la propria organizzazione prima di poter utilizzare il modello. Controlla le impostazioni dell'organizzazione(si apre in una nuova finestra) per verificare se disponi già dell'accesso.
Per iniziare, esplora le funzionalità del modello nel Playground(si apre in una nuova finestra) e consulta la guida alla generazione di immagini(si apre in una nuova finestra). Non vediamo l'ora di vedere cosa costruirai.