Presentamos nuestro último modelo de generación de imágenes en la API
Desde que presentamos la generación de imágenes en ChatGPT el mes pasado, rápidamente se convirtió en una de nuestras funciones más utilizadas: más de 130 millones de usuarios de todo el mundo crearon más de 700 millones de imágenes solo en la primera semana(se abre en una ventana nueva).
Hoy, incorporamos el modelo multimodal nativo que impulsa esta experiencia en ChatGPT a la API a través de gpt-image-1, para permitir a los desarrolladores y a las empresas integrar fácilmente la generación de imágenes de alta calidad y nivel profesional directamente en sus propias herramientas y plataformas. La versatilidad del modelo permite crear imágenes en diversos estilos, seguir fielmente las directrices personalizadas, aprovechar el conocimiento del mundo y renderizar texto con precisión, lo que abre innumerables aplicaciones prácticas en múltiples ámbitos.
Empresas líderes y emergentes de sectores como el de las herramientas creativas, comercio electrónico, educación, software empresarial y videojuegos ya están utilizando la generación de imágenes en sus productos y experiencias. Nos complace compartir algunos de estos ejemplos a continuación.
El ecosistema líder de herramientas creativas de Adobe, que incluye las aplicaciones Firefly y Express, proporcionará acceso a las capacidades de generación de imágenes de OpenAI, lo que ofrecerá a los creadores la posibilidad y la flexibilidad de experimentar con diferentes estilos estéticos, algo que valoran tanto los profesionales de los negocios como los consumidores y los creadores a la hora de generar nuevas ideas creativas.
También seguimos trabajando con desarrolladores y empresas para descubrir más formas en que la generación de imágenes en la API puede ayudar a sus casos de uso, que incluyen:
Diseño y edición: Canva explora formas de integrar gpt-image-1 de OpenAI para ampliar los límites de la generación y edición de diseños en sus herramientas Canva AI y Magic Studio. Gracias a las capacidades de gpt-image-1, como la transformación de dibujos preliminares en impresionantes elementos gráficos y la posibilidad de realizar ediciones visuales de alta fidelidad, Canva permitirá a sus 230 millones de usuarios dar vida a sus ideas de formas totalmente innovadoras.
Creación y edición de logotipos: GoDaddy está experimentando activamente para integrar la generación de imágenes, de modo que los clientes puedan crear fácilmente logotipos editables, eliminar fondos y generar tipografías profesionales. Además, como nueva experiencia con GoDaddy Airo®, el equipo está trabajando para que los clientes puedan crear publicaciones en redes sociales y recursos de marketing que reflejen la identidad única de sus marcas para contenido original sobre productos y marcas creado a partir de una indicación.
Creación de material de marketing: HubSpot está explorando la forma en que las nuevas capacidades de generación de imágenes con IA de OpenAI pueden ayudar a los clientes a crear material de marketing y ventas. A medida que HubSpot sigue añadiendo nuevas herramientas basadas en inteligencia artificial para ayudar a las empresas a crecer, estas capacidades de generación de imágenes tienen el potencial de transformar la forma en que los clientes producen imágenes de alta calidad para redes sociales, marketing por correo electrónico y páginas web de inicio sin necesidad de conocimientos especializados en diseño.
Creación de recetas y listas de la compra: Instacart está probando nuevas formas de utilizar la API para la generación de imágenes, incluidas imágenes para recetas y listas de la compra.
Edición de vídeos: invideo permite a millones de usuarios transformar sus ideas en vídeos utilizando IA. Gracias a la integración de gpt-image-1, la plataforma ahora ofrece una generación de texto mejorada, controles de edición precisos y orientación avanzada sobre el estilo.
El modelo gpt-image-1 de la API utiliza las mismas medidas de seguridad que la generación de imágenes 4o en ChatGPT, incluyendo medidas de seguridad que impiden que el modelo genere imágenes perjudiciales y la inclusión de metadatos C2PA en las imágenes generadas. Puedes obtener más información al respecto en nuestra entrada de blog anterior aquí. Además, los desarrolladores también pueden controlar la sensibilidad de la moderación con el parámetro «moderation», que se puede establecer en auto (predeterminado) para un filtrado estándar, o en low para un filtrado menos restrictivo. Consulta más información en nuestra documentación(se abre en una ventana nueva).
Por defecto, nunca entrenamos con datos de la API de los clientes, y todas las entradas y salidas de imágenes siguen estando supeditadas a nuestraspolíticas de uso de la API.
El uso de gpt-image-1 se cobra por token, con precios separados según sean tókenes de texto e imagen:
- Tókenes de entrada de texto (texto de indicación): 5 USD por cada millón de tókenes.
- Tókenes de entrada de imagen (imágenes de indicación): 10 USD por cada millón de tókenes.
- Tókenes de salida de imágenes (imágenes generadas): 40 USD por cada millón de tókenes.
En la práctica, esto se traduce en aproximadamente 0,02, 0,07 y 0,19 USD por imagen generada para imágenes cuadradas de baja, media y alta calidad, respectivamente. Para obtener información detallada sobre los precios según la calidad y el tamaño de las imágenes, consulta los documentos(se abre en una ventana nueva).
El modelo gpt-image-1 ya está disponible en todo el mundo a través de la API de imágenes, y pronto será compatible con la Responses API. Es posible que algunos desarrolladores deban verificar(se abre en una ventana nueva) su organización antes de poder utilizar el modelo. Comprueba la configuración de la organización(se abre en una ventana nueva) para ver si ya tienes acceso.
Para empezar, explora las capacidades del modelo en Playground(se abre en una ventana nueva) y consulta nuestra guía de generación de imágenes(se abre en una ventana nueva). Estamos deseando ver lo que eres capaz de crear.