Un enfocament holístic per a la detecció de contingut no desitjat en el món real
Presentem un enfocament holístic per construir un sistema de classificació del llenguatge natural robust i útil per a la moderació de contingut en el món real. L'èxit d'un sistema així depèn d'una cadena de passos dissenyats i executats amb cura, incloent-hi el disseny de taxonomies de contingut i instruccions d'etiquetatge, el control de qualitat de les dades, un procés d'aprenentatge actiu per capturar esdeveniments infreqüents i una varietat de mètodes per fer el model robust i evitar el sobreajustament. El nostre sistema de moderació està entrenat per detectar un ampli conjunt de categories de contingut no desitjat, incloent-hi contingut sexual, contingut d'odi, violència, autolesió i assetjament. Aquest enfocament es generalitza a una àmplia gamma de taxonomies de contingut diferents i es pot utilitzar per crear classificadors de contingut d'alta qualitat que superen els models estàndard.