Негізгі мазмұнға өту
OpenAI

2024 ж. 20 маусым

Жарияланым

Нақты әлемде қалаусыз контентті анықтауға арналған тұтас тәсіл

Жүктелуде…

Біз нақты әлемдегі контентті модерациялау үшін берік әрі пайдалы табиғи тілді жіктеу жүйесін құруға арналған тұтас тәсілді ұсынамыз. Мұндай жүйенің табысы мұқият әзірленіп, іске асырылған қадамдар тізбегіне сүйенеді, соның ішінде контент таксономиялары мен таңбалау нұсқаулықтарын әзірлеу, дерек сапасын бақылау, сирек оқиғаларды қамтуға арналған белсенді оқыту конвейері, сондай-ақ модельді берік ету және шамадан тыс бейімделуді болдырмау үшін әртүрлі әдістер бар. Біздің модерация жүйеміз қалаусыз контенттің кең ауқымды санаттарын, соның ішінде сексуалдық контентті, жеккөрушілік мазмұнды, зорлық-зомбылықты, өзіне зиян келтіруді және қудалауды анықтауға үйретілген. Бұл тәсіл әртүрлі контент таксономияларының кең ауқымына жалпыланады және дайын модельдерден асып түсетін жоғары сапалы контент жіктеуіштерін жасау үшін пайдаланылуы мүмкін.

Авторлар

Todor Markov, Chong Zhang, Sandhini Agarwal, Tyna Eloundou, Teddy Lee, Steven Adler, Angela Jiang, Lilian Weng