Reduir els biaixos i millorar la seguretat a DALL·E 2

A l’abril, vam començar a oferir una vista prèvia de la recerca de DALL·E 2 a un nombre limitat de persones, cosa que ens ha permès entendre millor les capacitats i limitacions del sistema i millorar els nostres sistemes de seguretat.

Durant aquesta fase de vista prèvia, els primers usuaris han assenyalat imatges sensibles i esbiaixades que han ajudat a orientar i avaluar aquesta nova mitigació.

Continuem investigant com els sistemes d’IA, com DALL·E, poden reflectir biaixos en les seves dades d’entrenament i diferents maneres d’abordar-los.

Durant la vista prèvia de recerca, també hem pres altres mesures per millorar els nostres sistemes de seguretat, com ara:

Minimitzar el risc que DALL·E s’utilitzi indegudament per crear contingut enganyós rebutjant càrregues d’imatges que continguin cares realistes i intents de crear la semblança de figures públiques, incloses celebritats i figures polítiques destacades.
Fer que els nostres filtres de contingut siguin més precisos perquè siguin més eficaços a l’hora de bloquejar indicacions i càrregues d’imatges que infringeixin la nostra política de contingut⁠(s'obre en una finestra nova) mentre continuen permetent l’expressió creativa.
Perfeccionar els sistemes de supervisió automatitzada i humana per protegir-nos contra l’ús indegut.

Aquestes millores ens han ajudat a guanyar confiança en la capacitat d’invitar més usuaris a experimentar DALL·E.

Ampliar-hi l’accés és una part important del nostre enfocament de desplegament responsable dels sistemes d’IA⁠ perquè ens permet aprendre més sobre l’ús en el món real i continuar iterant els nostres sistemes de seguretat.

Reduir els biaixos i millorar la seguretat a DALL·E 2

Autor

Articles relacionats