Пређите на главни садржај
OpenAI

18. јул 2022.

Производ

Smanjenje pristrasnosti i poboljšanje bezbednosti u DALL·E 2

Danas uvodimo novu tehniku kako bi DALL·E generisao slike ljudi koje vernije odražavaju raznolikost svetske populacije.

Apstraktna uljana slika raznolikih ljudi na okupljanju, generisana pomoću DALL·E 2
Учитавање…

Danas uvodimo novu tehniku kako bi DALL·E generisao slike ljudi koje vernije odražavaju raznolikost svetske populacije. Ova tehnika se primenjuje na nivou sistema kada DALL·E dobije instrukciju koja opisuje osobu, ali ne navodi rasu ili pol, kao što je „vatrogasac“.

Na osnovu naše interne procene, korisnici su 12 puta češće govorili da slike koje generiše DALL·E uključuju ljude različitog porekla nakon primene ove tehnike. Planiramo da ovu tehniku vremenom unapređujemo kako budemo prikupljali više podataka i povratnih informacija.

U aprilu smo započeli prikazivanje istraživanja DALL·E 2 ograničenom broju ljudi, što nam je omogućilo da bolje razumemo mogućnosti i ograničenja sistema i unapredimo naše bezbednosne sisteme.

Tokom ove faze pregleda, rani korisnici su prijavili osetljive i pristrasne slike, što je pomoglo u oblikovanju i proceni ove nove mere ublažavanja.

Nastavljamo da istražujemo kako sistemi veštačke inteligencije, kao što je DALL·E, mogu odražavati pristrasnosti u podacima za obuku i različite načine na koje ih možemo rešiti.

Tokom istraživačkog pregleda preduzeli smo i druge korake za unapređenje naših bezbednosnih sistema, uključujući:

  • Smanjenje rizika da DALL·E bude zloupotrebljen za pravljenje obmanjujućeg sadržaja odbijanjem otpremanja slika koje sadrže realistična lica i pokušaja da se napravi lik javnih ličnosti, uključujući poznate osobe i istaknute političke figure.
  • Povećanje preciznosti naših filtera sadržaja kako bi efikasnije blokirali instrukcije i otpremanja slika koji krše našu politiku sadržaja(отвара се у новом прозору), a da se i dalje omogući kreativno izražavanje.
  • Unapređenje automatizovanih sistema i sistema ljudskog nadzora radi zaštite od zloupotrebe.

Ova poboljšanja su nam pomogla da steknemo više poverenja u mogućnost da pozovemo više korisnika da isprobaju DALL·E.

Proširivanje pristupa važan je deo našeg odgovornog uvođenja AI sistema, jer nam omogućava da saznamo više o upotrebi u stvarnom svetu i nastavimo da unapređujemo naše bezbednosne sisteme.

Autor

OpenAI