20 de juny del 2024

Un enfocament holístic per a la detecció de contingut no desitjat en el món real

S'està carregant…

Presentem un enfocament holístic per construir un sistema de classificació del llenguatge natural robust i útil per a la moderació de contingut en el món real. L'èxit d'un sistema així depèn d'una cadena de passos dissenyats i executats amb cura, incloent-hi el disseny de taxonomies de contingut i instruccions d'etiquetatge, el control de qualitat de les dades, un procés d'aprenentatge actiu per capturar esdeveniments infreqüents i una varietat de mètodes per fer el model robust i evitar el sobreajustament. El nostre sistema de moderació està entrenat per detectar un ampli conjunt de categories de contingut no desitjat, incloent-hi contingut sexual, contingut d'odi, violència, autolesió i assetjament. Aquest enfocament es generalitza a una àmplia gamma de taxonomies de contingut diferents i es pot utilitzar per crear classificadors de contingut d'alta qualitat que superen els models estàndard.

Autors

Todor Markov, Chong Zhang, Sandhini Agarwal, Tyna Eloundou, Teddy Lee, Steven Adler, Angela Jiang i Lilian Weng