Presentamos nuestro último modelo de generación de imágenes en la API
Tras su presentación en ChatGPT el mes pasado, la generación de imágenes se convirtió rápidamente en una de nuestras características más populares: más de 130 millones de usuarios de todo el mundo crearon más de 700 millones de imágenes tan solo en la primera semana(se abre en una nueva ventana).
Hoy, llevamos el modelo nativo multimodal que potencia esta experiencia en ChatGPT a la API mediante gpt-image-1, lo que permite a los desarrolladores y a las empresas integrar con facilidad la generación de imágenes de alta calidad y nivel profesional directamente en sus propias herramientas y plataformas. La versatilidad de este modelo le permite crear imágenes en diversos estilos, seguir instrucciones personalizadas con exactitud, aprovechar el conocimiento mundial y generar textos precisos, lo que abre un sinfín de aplicaciones prácticas en múltiples ámbitos.
Las empresas líderes y las startups de todo tipo de de sectores como herramientas creativas, comercio electrónico, educación, software empresarial y videojuegos, ya están usando la generación de imágenes en sus productos y en sus experiencias. Nos entusiasma compartir algunos de estos ejemplos a continuación.
El ecosistema líder de herramientas creativas de Adobe, que incluye aplicaciones como Firefly y Express, ofrecerá acceso a las funcionalidades de generación de imágenes de OpenAI, brindando a los creadores la opción y la flexibilidad de experimentar con diferentes estilos estéticos, algo que los profesionales de negocios, los consumidores y los creadores valoran por igual al generar nuevas ideas creativas.
También seguimos colaborando con desarrolladores y empresas para descubrir nuevas formas en que la generación de imágenes mediante la API puede responder a sus casos de uso, entre ellas:
Diseño y edición: Canva explora cómo integrar gpt-image-1 de OpenAI para ampliar los límites de la creación y edición de diseños en sus herramientas Canva AI y Magic Studio. Gracias a funciones como transformar bocetos en impresionantes elementos gráficos y permitir ediciones visuales de alta fidelidad, gpt-image-1 ayudará a que los 230 millones de usuarios de Canva den vida a sus ideas de formas completamente nuevas.
Creación y edición de logotipos: GoDaddy está experimentando activamente con la integración de generación de imágenes para que los clientes puedan crear logotipos editables, eliminar fondos y generar tipografías profesionales con facilidad. Además, como parte de una nueva experiencia en GoDaddy Airo®, el equipo trabaja para que los clientes generen publicaciones para redes sociales y materiales de marketing que reflejen su identidad de marca, creando contenido original de producto y marca a partir de una indicación.
Creación de material de marketing: HubSpot está explorando cómo las nuevas capacidades de generación de imágenes con IA de OpenAI pueden ayudar a los clientes a crear material de marketing y ventas. A medida que HubSpot sigue incorporando herramientas con IA para empresas en expansión, estas capacidades tienen el potencial de transformar la manera en que los clientes producen imágenes de alta calidad para redes sociales, campañas de correo electrónico y páginas de destino, sin necesidad de tener conocimientos especializados en diseño.
Generación de recetas y listas de compras: Instacart prueba nuevas formas de utilizar la API para crear imágenes de recetas y listas de compras.
Edición de vídeos: invideo permite a millones de usuarios transformar sus ideas en videos mediante IA. Con la integración de gpt-image-1, la plataforma ofrece generación de texto mejorada, controles de edición de precisión y guía avanzada de estilos.
El modelo gpt-image-1 en la API cuenta con las mismas medidas de seguridad que la generación de imágenes de 4o en ChatGPT, incluyendo protecciones que impiden la creación de imágenes dañinas y la inclusión de metadatos C2PA en las imágenes generadas (puedes leer más sobre esto en nuestra entrada de blog aquí). Además, los desarrolladores pueden ajustar la sensibilidad de la moderación con el parámetro “moderation”, que se puede configurar en auto (predeterminado) para un filtrado estándar o en “low” para un filtrado menos restrictivo. Obtén más información en nuestros documentos(se abre en una nueva ventana).
Por defecto, no entrenamos nuestros modelos con datos de los clientes de la API y todas las entradas y salidas de imágenes se rigen por nuestras políticas de uso.
El uso de gpt-image-1 se cobra por token, con tarifas diferenciadas para tokens de texto e imagen:
- Tokens de entrada de texto (indicaciones o prompts): $5 por 1 millón de tokens
- Tokens de entrada de imagen (imágenes de referencia): $10 por 1 millón de tokens
- Tokens de salida de imagen (imágenes generadas): $40 por 1 millón de tokens
En la práctica, esto equivale aproximadamente a $0,02, $0,07 y $0,19 por imagen generada, para imágenes cuadradas de baja, media y alta calidad, respectivamente. Para conocer de forma detallada el uso de tokens en función de la calidad y el tamaño de la imagen, consulta la documentación(se abre en una nueva ventana).
El modelo gpt-image-1 ya está disponible a nivel mundial a través de la API de imágenes, y próximamente también en la API de Respuestas. Algunos desarrolladores deberán verificar(se abre en una nueva ventana) su organización antes de poder usar el modelo. Consulta la configuración de tu organización(se abre en una nueva ventana) para confirmar si ya tienes acceso.
Para empezar, explora las capacidades del modelo en el espacio creativo(se abre en una nueva ventana) y revisa nuestra guía de generación de imágenes(se abre en una nueva ventana). Estamos deseando ver qué construyes.