Impulsar la procedencia del contenido para un ecosistema de IA más seguro y transparente
Ayudar a la gente a entender el origen del contenido generado con IA mediante Content Credentials, SynthID y una herramienta pública inicial de verificación.
La gente usa las herramientas de OpenAI a diario para crear y editar imágenes y audio de formas que hacen la comunicación más expresiva, útil y accesible. A medida que estas herramientas pasan a formar parte de cómo la gente crea, imagina y comparte, es importante que las personas puedan entender y verificar de dónde procede el contenido para interpretarlo con más confianza. Las señales de procedencia pueden ayudar al dar a la gente contexto sobre de dónde procede el contenido, cómo se creó o editó y si es lo que afirma ser.
Hoy reforzamos nuestro enfoque sobre la procedencia del contenido con un modelo multicapa, impulsado por el ecosistema, para generar confianza en internet. Estamos haciendo que nuestras señales de procedencia sean más fáciles de reconocer para otras herramientas y plataformas mediante la conformidad con C2PA, añadiendo marcas de agua duraderas de SynthID entre plataformas a las imágenes gracias a una colaboración con Google, y compartiendo un avance de una herramienta que el público puede usar para verificar si las imágenes proceden de OpenAI.
En conjunto, estas actualizaciones amplían nuestro trabajo anterior para apoyar estándares abiertos, hacer que el contenido generado por OpenAI sea más fácil de identificar y colaborar en todo el sector para respaldar un ecosistema de información más fiable.
OpenAI ha participado en el desarrollo y la adopción de estándares de procedencia desde 2024, cuando empezamos a añadir Content Credentials a las imágenes generadas por DALL·E 3(se abre en una ventana nueva) y más tarde a ImageGen(se abre en una ventana nueva) y Sora(se abre en una ventana nueva). También nos unimos al Comité Directivo de la Coalition for Content Provenance and Authenticity (C2PA), el grupo intersectorial responsable del estándar técnico abierto para la procedencia del contenido. El enfoque técnico de C2PA usa metadatos y firmas criptográficas para ayudar a que la información sobre una pieza multimedia viaje de forma segura con el propio contenido. Esta información incluye contexto que ayuda a periodistas que evalúan una fuente, a plataformas que toman decisiones de integridad y a personas que intentan entender lo que ven en internet.
Recientemente dimos el paso de convertir a OpenAI en un producto generador conforme con C2PA(se abre en una ventana nueva). Al pasar a ser conformes con C2PA, estamos dando a las plataformas una forma fiable de leer, conservar y transmitir la información de procedencia que adjuntamos a nuestro contenido. Esto importa porque la procedencia solo funciona si sobrevive más allá de la primera plataforma donde se crea el contenido, y la conformidad hace eso posible.
Los metadatos de C2PA son una base importante para la procedencia. Ayudan a que el contenido lleve información sobre de dónde procede, cómo se creó o editó y quién firmó esa información. Pero los metadatos no son infalibles. Pueden eliminarse, perderse durante subidas y descargas o romperse por transformaciones como cambios de formato de archivo, redimensionado o capturas de pantalla.
Para hacer que la procedencia sea más resistente, estamos adoptando un enfoque multicapa e incorporando marcas de agua mediante SynthID de Google DeepMind(se abre en una ventana nueva), empezando por las imágenes generadas con ChatGPT, Codex o la API de OpenAI. SynthID inserta una capa invisible de marca de agua que complementa los enfoques basados en metadatos de C2PA.
Llevamos tiempo avanzando hacia esto. Hemos usado marcas de agua visibles en Sora y una marca de agua de audio en Voice Engine, y hemos seguido probando e investigando su precisión y fiabilidad con el tiempo. mediante el despliegue.
Estos dos sistemas se refuerzan mutuamente. C2PA ayuda a que el contenido lleve contexto detallado; SynthID ayuda a preservar una señal cuando los metadatos no sobreviven. Las marcas de agua pueden ser más duraderas ante transformaciones como las capturas de pantalla, mientras que los metadatos pueden aportar más información que una marca de agua por sí sola. Juntos, hacen que la procedencia sea más resistente de lo que sería cualquiera de las dos capas por separado.
Los metadatos fiables y las marcas de agua que resisten la mayoría de las modificaciones pueden hacer que las señales de procedencia sean más duraderas. Pero la gente necesita una forma de detectar estas señales. Ahora estamos mostrando un avance de una herramienta pública de verificación que ayudará a la gente a verificar si una imagen subida se generó en ChatGPT, la API de OpenAI o Codex, comprobando si contiene señales de procedencia, incluidas Content Credentials y SynthID.
Creemos que la procedencia debería ser más fácil de verificar e interpretar para la gente, y que, al integrar múltiples señales, nuestra herramienta puede ayudar a las personas a desempeñar un papel a la hora de responder a la pregunta: «¿Se generó esto con IA?». Esto se basa en los aprendizajes de la vista previa inicial de investigación de nuestro clasificador de detección de imágenes en 2024 y permite a la gente detectar de forma fiable si hay presente en el contenido una marca de agua SynthID originada en OpenAI, además de mostrar metadatos de C2PA cuando se encuentran.

Ningún método de detección es infalible, así que adoptamos un enfoque prudente en los casos en que la detección falla. Si no se detectan metadatos ni marcas de agua, por ejemplo, la herramienta no sacará una conclusión definitiva sobre si la imagen se generó con herramientas de OpenAI, ya que en algunos casos las señales de procedencia pueden eliminarse.
En el lanzamiento, la herramienta se limita al contenido generado por OpenAI. En los próximos meses, nuestro objetivo es apoyar esfuerzos intersectoriales para hacer posible la verificación entre plataformas. Con el tiempo, también esperamos admitir más tipos de contenido que la gente pueda encontrar en internet.
Ninguna técnica de procedencia basta por sí sola. Creemos que un enfoque sólido combina estándares compartidos, señales de marca de agua duraderas y verificación pública. Al apoyarnos en nuestro respaldo de larga data a Content Credentials, volvernos conformes con C2PA, adoptar SynthID y mostrar herramientas públicas de verificación, esperamos contribuir a largo plazo a un ecosistema de procedencia más interoperable.


