Reducción del sesgo y mejora de la seguridad en DALL·E 2

En abril, comenzamos a anticipar la búsqueda de DALL·E 2 a una cantidad limitada de personas, lo que nos permitió comprender mejor las capacidades y limitaciones del sistema así como también mejorar nuestros sistemas de seguridad.

Durante la fase previa, los primeros usuarios alertaron sobre imágenes sensibles y sesgadas, lo que nos ayudó a informar y evaluar esta nueva mitigación.

Continuamos investigando cómo los sistemas de IA, como DALL·E, podrían reflejar sesgos en sus datos de entrenamiento y diferentes formas en las que podemos abordarlos.

Durante el avance de la investigación, implementamos otros pasos para mejorar nuestros sistemas de seguridad, incluidos:

Minimizar el riesgo de que DALL·E se use incorrectamente para crear contenido engañoso al rechazar cargas de imágenes con rostros realistas e intentos de crear similitudes de figuras públicas, incluidas celebridades y figuras políticas famosas.
Hacer nuestros filtros de contenido más precisos de modo que sean más efectivos al bloquear instrucciones y cargas de imágenes que infrinjan nuestra política de contenido⁠(se abre en una nueva ventana) mientras aún permita la expresión creativa.
Refinar los sistemas automatizados y con supervisión humana para protegerlos contra el uso indebido.

Estas mejoras nos han ayudado a ganar confianza en la capacidad de invitar a más usuarios a probar DALL·E.

Expandir el acceso es una parte importante de nuestra implementación de sistemas IA de forma responsable⁠ porque nos permite aprender más sobre el uso en el mundo real y continuar con el proceso de iteración en nuestros sistemas de seguridad.

Reducción del sesgo y mejora de la seguridad en DALL·E 2

Autor

Artículos relacionados