
იმისთვის, რომ დეველოპერებს დავეხმაროთ მათი აპლიკაციების შესაძლო ბოროტად გამოყენებისგან დაცვაში, წარმოგიდგენთ უფრო სწრაფ და უფრო ზუსტ Moderation საბოლოო წერტილს(იხსნება ახალ ფანჯარაში). ეს საბოლოო წერტილი OpenAI API დეველოპერებს უფასო წვდომას აძლევს GPT‑ზე დაფუძნებულ კლასიფიკატორებზე, რომლებიც არასასურველ კონტენტს აფიქსირებენ — ეს არის AI სისტემების გამოყენების მაგალითი ამ სისტემებზე ადამიანის ზედამხედველობის მხარდასაჭერად. ასევე გამოვაქვეყნეთ როგორც ჩვენი მეთოდოლოგიის აღწერის ტექნიკური ნაშრომი(იხსნება ახალ ფანჯარაში), ისე შეფასებისთვის გამოყენებული მონაცემთა ნაკრები(იხსნება ახალ ფანჯარაში).
ტექსტური შეყვანის მიღებისას Moderation საბოლოო წერტილი აფასებს, არის თუ არა კონტენტი სექსუალური, სიძულვილის შემცველი, ძალადობრივი ან თვითდაზიანების წამახალისებელი — კონტენტი, რომელიც აკრძალულია ჩვენი კონტენტის პოლიტიკით(იხსნება ახალ ფანჯარაში). საბოლოო წერტილი გაწვრთნილია, რომ იყოს სწრაფი, ზუსტი და საიმედოდ იმუშაოს აპლიკაციების ფართო სპექტრში. მნიშვნელოვანია, რომ ეს ამცირებს იმის შანსს, რომ პროდუქტებმა არასწორი რამ „თქვან“, მაშინაც კი, როცა ისინი მასშტაბურადაა დანერგილი მომხმარებლებთან. შედეგად, AI-ს შეუძლია სარგებელი მოიტანოს ისეთ მგრძნობიარე გარემოებებში, როგორიცაა განათლება, სადაც სხვაგვარად მისი გამოყენება თავდაჯერებით ვერ მოხერხდებოდა.
Moderation საბოლოო წერტილი დეველოპერებს ეხმარება ისარგებლონ ჩვენს ინფრასტრუქტურაში განხორციელებული ინვესტიციებით. საკუთარი კლასიფიკატორების შექმნისა და მხარდაჭერის ნაცვლად — რაც ვრცელი პროცესია, როგორც ჩვენს ნაშრომში(იხსნება ახალ ფანჯარაში) აღვწერთ — მათ შეუძლიათ ზუსტ კლასიფიკატორებზე წვდომა ერთი API გამოძახებით მიიღონ.
OpenAI-ის ვალდებულების ფარგლებში, რომელიც მიმართულია AI ეკოსისტემის უფრო უსაფრთხოდ ქცევისაკენ, ამ საბოლოო წერტილს ვთავაზობთ, რათა OpenAI API-ის მიერ გენერირებული მთელი კონტენტის მოდერაცია უფასოდ იყოს შესაძლებელი. მაგალითად, Inworld(იხსნება ახალ ფანჯარაში), OpenAI API-ის მომხმარებელი, იყენებს Moderation საბოლოო წერტილს, რათა მათი AI-ზე დაფუძნებული ვირტუალური პერსონაჟები აუდიტორიისთვის შესაბამისები დარჩნენ. OpenAI-ის ტექნოლოგიის გამოყენებით, Inworld-ს შეუძლია კონცენტრირდეს საკუთარ ძირითად პროდუქტზე: დასამახსოვრებელი პერსონაჟების შექმნაზე. ამჟამად მესამე მხარის ტრაფიკის მონიტორინგს არ ვუჭერთ მხარს.
Moderation საბოლოო წერტილის გამოყენება დაიწყეთ დოკუმენტაციის(იხსნება ახალ ფანჯარაში) გაცნობით. ტრენინგის პროცესისა და მოდელის წარმადობის შესახებ მეტი დეტალი ხელმისაწვდომია ჩვენს ნაშრომში(იხსნება ახალ ფანჯარაში). ასევე გამოვაქვეყნეთ შეფასების მონაცემთა ნაკრები(იხსნება ახალ ფანჯარაში), რომელიც მოიცავს Common Crawl-ის მონაცემებს, ამ კატეგორიების მიხედვით მარკირებულს, და ვიმედოვნებთ, რომ ეს ამ სფეროში შემდგომ კვლევას წაახალისებს.


