გადადით მთავარ შინაარსზე
OpenAI

28 მაისი, 2022

პუბლიკაცია

ვასწავლით მოდელებს, თავიანთი გაურკვევლობა სიტყვებით გამოხატონ

Teaching Models To Express Their Uncertainty In Words
იტვირთება…

ანოტაცია

ჩვენ ვაჩვენებთ, რომ GPT‑3 მოდელს შეუძლია ისწავლოს, საკუთარი პასუხების შესახებ გაურკვევლობა ბუნებრივ ენაზე გამოხატოს — მოდელის ლოჯიტების გამოყენების გარეშე. კითხვის მიღებისას მოდელი წარმოქმნის როგორც პასუხს, ისე თავდაჯერებულობის დონესაც (მაგ., „90% დარწმუნებულობა“ ან „მაღალი დარწმუნებულობა“). ეს დონეები კარგად კალიბრირებულ ალბათობებს შეესაბამება. მოდელი ასევე რჩება ზომიერად კალიბრირებული განაწილების წანაცვლების პირობებშიც და მგრძნობიარეა საკუთარ პასუხებში არსებული გაურკვევლობის მიმართ, ნაცვლად იმისა, რომ ადამიანის მაგალითებს ბაძავდეს. ჩვენი ცოდნით, ეს პირველი შემთხვევაა, როდესაც ნაჩვენებია, რომ მოდელი საკუთარ პასუხებთან დაკავშირებით კალიბრირებულ გაურკვევლობას ბუნებრივ ენაზე გამოხატავს. კალიბრაციის შესამოწმებლად ჩვენ წარმოვადგენთ ამოცანების ნაკრებს CalibratedMath. ჩვენ სიტყვებით გამოხატული გაურკვევლობის („ვერბალიზებული ალბათობა“) კალიბრაციას ვადარებთ მოდელის ლოჯიტებიდან მიღებულ გაურკვევლობას. გაურკვევლობის ორივე სახეობას შეუძლია განაწილების წანაცვლების პირობებში კალიბრაციის განზოგადება. ასევე წარმოვადგენთ მტკიცებულებებს, რომ GPT‑3‑ის უნარი, განაზოგადოს კალიბრაცია, დამოკიდებულია წინასწარ გაწვრთნილ ლატენტურ წარმოდგენებზე, რომლებიც მის პასუხებთან დაკავშირებულ ეპისტემურ გაურკვევლობასთან კორელირებს.

ავტორები

Stephanie Lin, Jacob Hilton და Owain Evans