Үндсэн агуулга руу алгасах
OpenAI

2024 оны зургаадугаар сарын 20

Нийтлэл

Бодит ертөнц дэх хүсээгүй контентыг илрүүлэх цогц хандлага

Ачаалж байна…

Бодит ертөнцийн контентын модерацид зориулсан бат бөх, хэрэгцээтэй байгалийн хэлний ангиллын систем бүтээх цогц хандлагыг бид танилцуулж байна. Ийм системийн амжилт нь контентын таксономи ба шошголох зааврын загварчлал, өгөгдлийн чанарын хяналт, ховор тохиолдлыг барих идэвхтэй сургалтын шугам, мөн загварыг бат бөх болгож хэт тааруулалтаас зайлсхийх олон төрлийн аргууд зэрэг нямбай төлөвлөж хэрэгжүүлсэн алхмуудын гинжин холбоонд тулгуурладаг. Манай модерацийн систем нь бэлгийн агуулга, үзэн ядсан агуулга, хүчирхийлэл, өөртөө хор хүргэх, дарамт зэрэг хүсээгүй контентын өргөн хүрээний ангиллыг илрүүлэхээр сургагдсан. Энэ хандлага нь олон янзын контентын таксономид ерөнхийлөн хэрэглэгдэх боломжтой бөгөөд бэлэн загваруудаас илүү гүйцэтгэлтэй, өндөр чанартай контент ангилагч бүтээхэд ашиглаж болно.

Зохиогчид

Todor Markov, Chong Zhang, Sandhini Agarwal, Tyna Eloundou, Teddy Lee, Steven Adler, Angela Jiang, Lilian Weng