Пређите на главни садржај
OpenAI

20. јун 2024.

Публикација

Holistički pristup otkrivanju nepoželjnog sadržaja u stvarnom svetu

Учитавање…

Predstavljamo holistički pristup izgradnji robusnog i korisnog sistema za klasifikaciju prirodnog jezika za moderaciju sadržaja u stvarnom svetu. Uspeh takvog sistema oslanja se na niz pažljivo osmišljenih i sprovedenih koraka, uključujući dizajn taksonomija sadržaja i uputstava za označavanje, kontrolu kvaliteta podataka, aktivni tok učenja za hvatanje retkih događaja i različite metode da se model učini robusnim i izbegne preprilagođavanje. Naš sistem za moderaciju je obučen da otkriva širok skup kategorija nepoželjnog sadržaja, uključujući seksualni sadržaj, sadržaj mržnje, nasilje, samopovređivanje i uznemiravanje. Ovaj pristup se može generalizovati na širok opseg različitih taksonomija sadržaja i može se koristiti za pravljenje visokokvalitetnih klasifikatora sadržaja koji nadmašuju gotove modele.

Autori

Todor Markov, Chong Zhang, Sandhini Agarwal, Tyna Eloundou, Teddy Lee, Steven Adler, Angela Jiang и Lilian Weng