23 април 2025 г.

Представяме Ви най-новия ни модел за генериране на изображения в API.

Зареждане…

Когато миналия месец въведохме генерирането на изображения в ChatGPT, то бързо се превърна в една от най-популярните ни функции: над 130 милиона потребители по света създадоха повече от 700 милиона изображения само през първата седмица⁠(отваря се в нов прозорец).

Днес въвеждаме в API нативния мултимодален модел, който захранва това преживяване в ChatGPT чрез gpt-image-1, което позволява на разработчиците и бизнеса лесно да интегрират висококачествено, професионално генериране на изображения директно в техните собствени инструменти и платформи. Гъвкавостта на модела позволява създаването на изображения в разнообразни стилове, точно следване на персонализирани указания, използване на световни знания и точно изобразяване на текст—отключвайки безброй практически приложения в множество домейни.

Водещи предприятия и стартъпи в различни индустрии, включително креативни инструменти, електронна търговия, образование, корпоративен софтуер и игри, вече използват генериране на изображения в своите продукти и преживявания. Развълнувани сме да споделим някои от тези примери по-долу.

Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.

Също така продължаваме да работим с разработчици и бизнеси, за да открием повече начини, по които генерирането на изображения в API може да обслужва техните случаи на употреба, включително:

Дизайн и редактиране: Canva изследва начини за интегриране на gpt-image-1 на OpenAI, за да разшири границите на генерирането и редактирането на дизайн в своите инструменти Canva AI и Magic Studio. Чрез възможностите на GPT‑image‑1, като трансформиране на груби скици в зашеметяващи графични елементи и осигуряване на висококачествени визуални редакции, Canva ще даде възможност на своите 230 милиона потребители да вдъхнат живот на идеите си по напълно нови начини.

Създаване и редактиране на лога: GoDaddy активно експериментира с интегриране на генериране на изображения, за да могат клиентите лесно да създават лога, които да се редактират, да премахват фонове и да създават професионална типография. Освен това, като ново преживяване с GoDaddy Airo^®, Team работи върху това клиентите да създават публикации в социалните мрежи и маркетингови материали, които отразяват техните уникални идентичности на марката за оригинално продуктово и брандово съдържание, създадено от подкана.

Изграждане на маркетингови материали: HubSpot изследва как новите възможности на OpenAI за генериране на изображения с изкуствен интелект могат да помогнат на клиентите да създават маркетингови и търговски материали. Докато HubSpot продължава да добавя нови инструменти, задвижвани от изкуствен интелект, за мащабиране на бизнеса, тези възможности за генериране на изображения имат потенциала да трансформират начина, по който клиентите създават висококачествени изображения за социални медии, имейл маркетинг и целеви страници, без да се изисква специализирана дизайнерска експертиза.

Генериране на рецепти и списъци за пазаруване: Instacart тества нови начини за използване на API за генериране на изображения, включително изображения за рецепти и списъци за пазаруване.

Редактиране на видеа: invideo активира милиони потребители да преобразуват своите идеи във видеа, използвайки изкуствен интелект. С интеграцията на gpt-image-1, платформата вече предлага подобрено генериране на текст, прецизни контроли за редактиране и усъвършенствано ръководство за стил.

Безопасност

Моделът gpt-image-1 в API използва същите предпазни мерки за безопасност като генерирането на изображения 4 в ChatGPT, включително защити, които ограничават модела от генериране на вредни изображения и включването на C2PA метаданни в генерираните изображения—можете да прочетете повече за това в нашия предишен блог пост тук. Освен това, разработчиците могат също да контролират чувствителността на модерацията с параметъра `moderation`, който може да бъде зададен на auto (по подразбиране) за стандартно филтриране или на low за по-малко рестриктивно филтриране. Научете повече в нашата документация⁠(отваря се в нов прозорец).

По подразбиране никога не обучаваме с данни от клиентски API, а всички входни и изходни изображения остават обект на нашите политики за използване на API.

Ценообразуване

Използването на gpt-image-1 се таксува на token, с отделно ценообразуване за текстови и изображение tokenи:

Текстови входни токени (текст на подкана): $5 за 1M токена
Токени за входящи изображения (входни изображения): $10 за 1M токени
Изходящи токени за изображения (генерирани изображения): $40 на 1 млн. токена

На практика това се изразява в приблизително $0.02, $0.07 и $0.19 на генерирано изображение за нискокачествени, среднокачествени и висококачествени квадратни изображения, съответно. За подробна информация относно ценообразуването според качеството и размера на изображението, вижте документите⁠(отваря се в нов прозорец).

Започнете

Моделът gpt-image-1 вече е достъпен глобално чрез API за изображения, като поддръжка в API за отговори ще бъде налична скоро. Някои разработчици може да се наложи да проверят⁠(отваря се в нов прозорец) своята организация, преди да могат да използват модела. Моля, проверете настройките на организацията⁠(отваря се в нов прозорец), за да видите дали вече имате достъп.

За да започнете, направете изследване на възможностите на модела в Playground⁠(отваря се в нов прозорец) и разгледайте нашето ръководство за генериране на изображения⁠(отваря се в нов прозорец). Очакваме с нетърпение да видим какво ще изградите.

Автори

OpenAI