Salta al contingut principal
OpenAI

18 de juliol del 2022

Producte

Reduir els biaixos i millorar la seguretat a DALL·E 2

Avui implementem una nova tècnica perquè DALL·E generi imatges de persones que reflecteixin amb més precisió la diversitat de la població mundial.

Una pintura abstracta a l’oli de persones diverses reunides, generada per DALL·E 2
S'està carregant…

Avui implementem una nova tècnica perquè DALL·E generi imatges de persones que reflecteixin amb més precisió la diversitat de la població mundial. Aquesta tècnica s’aplica a nivell de sistema quan DALL·E rep una indicació que descriu una persona sense especificar-ne la raça o el gènere, com ara «bomber».

Segons la nostra avaluació interna, els usuaris tenien 12 vegades més probabilitats de dir que les imatges de DALL·E incloïen persones d’orígens diversos després d’aplicar la tècnica. Tenim previst millorar aquesta tècnica amb el temps a mesura que recopilem més dades i comentaris.

A l’abril, vam començar a oferir una vista prèvia de la recerca de DALL·E 2 a un nombre limitat de persones, cosa que ens ha permès entendre millor les capacitats i limitacions del sistema i millorar els nostres sistemes de seguretat.

Durant aquesta fase de vista prèvia, els primers usuaris han assenyalat imatges sensibles i esbiaixades que han ajudat a orientar i avaluar aquesta nova mitigació.

Continuem investigant com els sistemes d’IA, com DALL·E, poden reflectir biaixos en les seves dades d’entrenament i diferents maneres d’abordar-los.

Durant la vista prèvia de recerca, també hem pres altres mesures per millorar els nostres sistemes de seguretat, com ara:

  • Minimitzar el risc que DALL·E s’utilitzi indegudament per crear contingut enganyós rebutjant càrregues d’imatges que continguin cares realistes i intents de crear la semblança de figures públiques, incloses celebritats i figures polítiques destacades.
  • Fer que els nostres filtres de contingut siguin més precisos perquè siguin més eficaços a l’hora de bloquejar indicacions i càrregues d’imatges que infringeixin la nostra política de contingut(s'obre en una finestra nova) mentre continuen permetent l’expressió creativa.
  • Perfeccionar els sistemes de supervisió automatitzada i humana per protegir-nos contra l’ús indegut.

Aquestes millores ens han ajudat a guanyar confiança en la capacitat d’invitar més usuaris a experimentar DALL·E.

Ampliar-hi l’accés és una part important del nostre enfocament de desplegament responsable dels sistemes d’IA perquè ens permet aprendre més sobre l’ús en el món real i continuar iterant els nostres sistemes de seguretat.

Autor

OpenAI