Представляем нашу новейшую модель генерации изображений в API.
Когда мы представили функцию генерации изображений в ChatGPT в прошлом месяце, она быстро стала одной из наших самых популярных: более 130 миллионов пользователей по всему миру создали более 700 миллионов изображений всего за первую неделю(открывается в новом окне).
Сегодня мы выводим в API изначально мультимодальную модель, которая обеспечивает этот опыт в ChatGPT — gpt-image-1. Она позволяет разработчикам и компаниям легко интегрировать высококачественную, профессиональную генерацию изображений прямо в свои собственные инструменты и платформы. Универсальность модели позволяет ей создавать изображения в самых разных стилях, точно следовать индивидуальным инструкциям, использовать мировые знания и аккуратно воспроизводить текст, открывая бесчисленные практические сценарии использования в разных областях.
Ведущие корпорации и стартапы в разных отраслях — от инструментов для творчества и электронной коммерции до образования, корпоративного ПО и игр — уже используют генерацию изображений в своих продукциях и пользовательских сценариях. Ниже мы с радостью приведём несколько таких примеров.
Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.
Мы также продолжаем работать с разработчиками и компаниями, чтобы находить новые способы, как генерация изображений в API может помогать в их сценариях использования, в том числе:
Создание и редактирование: Canva изучает способы интеграции gpt-image-1 от OpenAI, чтобы расширить возможности генерации и редактирования дизайна в своих инструментах Canva AI и Magic Studio. Благодаря возможностям gpt-image-1, таким как преобразование набросков в выразительные графические элементы и точное редактирование изображений — Canva ещё больше расширит возможности своих 230 миллионов пользователей воплощать идеи в жизнь принципиально новыми способами.
Создание и редактирование логотипов: GoDaddy активно экспериментирует с интеграцией генерации изображений, чтобы клиенты могли легко создавать редактируемые логотипы, удалять фон и подбирать профессиональное шрифтовое оформление Кроме того, в рамках нового опыта взаимодействия с GoDaddy Airo®, команда работает над тем, чтобы клиенты могли создавать публикации для социальных сетей и маркетинговые материалы, точно отражающие особенности их бренда — оригинальный продуктовый и брендовый контент, сформированный по промпту.
Создание маркетинговых материалов: HubSpot изучает, как новые возможности генерации изображений от OpenAI могут помочь клиентам создавать материалы для маркетинга и продаж. По мере того как HubSpot продолжает добавлять новые ИИ-инструменты для масштабирования бизнеса, эти возможности генерации изображений могут преобразовать процесс создания клиентами высококачественных изображений для социальных сетей, email-маркетинга и целевых страниц, без необходимости в специальных навыках дизайна.
Создание рецептов и списков покупок: Instacart тестирует новые способы использования API для генерации изображений, в том числе иллюстраций для рецептов и списков покупок.
Редактирование видео: invideo помогает миллионам пользователей превращать свои идеи в видео с помощью ИИ. С интеграцией gpt-image-1 платформа теперь предлагает улучшенную генерацию текста, детализированные инструменты редактирования и расширенные рекомендации по стилю.
Модель gpt-image-1 в API использует те же меры безопасности, что и генерация изображений в ChatGPT, включая защитные механизмы, которые предотвращают создание вредоносных изображений, а также добавление метаданных C2PA в сгенерированные изображения — подробнее об этом вы можете прочитать в нашем блоге здесь. Кроме того, разработчики могут контролировать чувствительность модерации с помощью параметра `moderation`, который можно установить на auto (по умолчанию) для стандартной фильтрации или low для менее строгой фильтрации. Узнайте больше в нашей документации(открывается в новом окне).
По умолчанию мы не используем данные клиентов API для обучения наших моделей, а все входные и выходные изображения подпадают под действие наших политик использования API.
Использование GPT‑image‑1 тарифицируется по числу токенов, при этом отдельно рассчитывается стоимость текстовых токенов и токенов для изображений:
- Текстовые входные токены (текст промпта): 5 долларов США за 1 миллион токенов
- Токены входных изображений (входные изображения): 10 долларов США за 1 миллион токенов
- Токены выходных изображений (сгенерированные изображения): 40 долларов США за 1 миллион токенов
На практике это переводится в примерно 0,02 долларов США , 0,07 долларов США и 0,19 долларов США за каждое сгенерированное квадратное изображение низкого, среднего и высокого качества соответственно. Для получения подробной информации о ценах в зависимости от качества и размера изображения, см. документы(открывается в новом окне).
Модель gpt-image-1 теперь доступна по всему миру через API изображений, поддержка в Responses API появится в ближайшее время. Некоторым разработчикам, возможно, потребуется подтвердить(открывается в новом окне) свою организацию, прежде чем они смогут использовать модель. Пожалуйста, проверьте настройки организации(открывается в новом окне), чтобы узнать, есть ли у вас доступ.
Чтобы начать, изучите возможности модели в Playground(открывается в новом окне) и ознакомьтесь с нашим руководством по генерации изображений(открывается в новом окне). Мы с нетерпением ждем, что вы создадите.