Smanjenje pristrasnosti i poboljšanje bezbednosti u DALL·E 2

U aprilu smo započeli prikazivanje istraživanja DALL·E 2 ograničenom broju ljudi, što nam je omogućilo da bolje razumemo mogućnosti i ograničenja sistema i unapredimo naše bezbednosne sisteme.

Tokom ove faze pregleda, rani korisnici su prijavili osetljive i pristrasne slike, što je pomoglo u oblikovanju i proceni ove nove mere ublažavanja.

Nastavljamo da istražujemo kako sistemi veštačke inteligencije, kao što je DALL·E, mogu odražavati pristrasnosti u podacima za obuku i različite načine na koje ih možemo rešiti.

Tokom istraživačkog pregleda preduzeli smo i druge korake za unapređenje naših bezbednosnih sistema, uključujući:

Smanjenje rizika da DALL·E bude zloupotrebljen za pravljenje obmanjujućeg sadržaja odbijanjem otpremanja slika koje sadrže realistična lica i pokušaja da se napravi lik javnih ličnosti, uključujući poznate osobe i istaknute političke figure.
Povećanje preciznosti naših filtera sadržaja kako bi efikasnije blokirali instrukcije i otpremanja slika koji krše našu politiku sadržaja⁠(отвара се у новом прозору), a da se i dalje omogući kreativno izražavanje.
Unapređenje automatizovanih sistema i sistema ljudskog nadzora radi zaštite od zloupotrebe.

Ova poboljšanja su nam pomogla da steknemo više poverenja u mogućnost da pozovemo više korisnika da isprobaju DALL·E.

Proširivanje pristupa važan je deo našeg odgovornog uvođenja AI sistema⁠, jer nam omogućava da saznamo više o upotrebi u stvarnom svetu i nastavimo da unapređujemo naše bezbednosne sisteme.

Smanjenje pristrasnosti i poboljšanje bezbednosti u DALL·E 2

Autor

Povezani članci