Pasar al contenido principal
OpenAI

18 de julio de 2022

Producto

Reducción del sesgo y mejora de la seguridad en DALL·E 2

Hoy estamos implementando una nueva técnica para que DALL·E genere imágenes de personas que reflejen de forma más precisa la diversidad de la población mundial.

Una pintura al óleo abstracta de diversas personas reunidas, generada por DALL·E 2
Cargando...

Hoy estamos implementando una nueva técnica para que DALL·E genere imágenes de personas que reflejen de forma más precisa la diversidad de la población mundial. Esta técnica se aplica a nivel del sistema cuando se da una orden a DALL·E para que describa a una persona que no especifica raza o género, como «brigadista de incendios».

Según nuestra evaluación interna, los usuarios fueron 12 veces más propensos a decir que las imágenes de DALL·E incluyeron personas de diversos orígenes después de aplicar la técnica. Planeamos mejorar esta técnica con el tiempo mientras recopilamos más datos y comentarios.

En abril, comenzamos a anticipar la búsqueda de DALL·E 2 a una cantidad limitada de personas, lo que nos permitió comprender mejor las capacidades y limitaciones del sistema así como también mejorar nuestros sistemas de seguridad.

Durante la fase previa, los primeros usuarios alertaron sobre imágenes sensibles y sesgadas, lo que nos ayudó a informar y evaluar esta nueva mitigación.

Continuamos investigando cómo los sistemas de IA, como DALL·E, podrían reflejar sesgos en sus datos de entrenamiento y diferentes formas en las que podemos abordarlos.

Durante el avance de la investigación, implementamos otros pasos para mejorar nuestros sistemas de seguridad, incluidos:

  • Minimizar el riesgo de que DALL·E se use incorrectamente para crear contenido engañoso al rechazar cargas de imágenes con rostros realistas e intentos de crear similitudes de figuras públicas, incluidas celebridades y figuras políticas famosas.
  • Hacer nuestros filtros de contenido más precisos de modo que sean más efectivos al bloquear instrucciones y cargas de imágenes que infrinjan nuestra política de contenido(se abre en una nueva ventana) mientras aún permita la expresión creativa.
  • Refinar los sistemas automatizados y con supervisión humana para protegerlos contra el uso indebido.

Estas mejoras nos han ayudado a ganar confianza en la capacidad de invitar a más usuarios a probar DALL·E.

Expandir el acceso es una parte importante de nuestra implementación de sistemas IA de forma responsable porque nos permite aprender más sobre el uso en el mundo real y continuar con el proceso de iteración en nuestros sistemas de seguridad.

Autor

OpenAI