DALL·E 2 дахь өрөөсгөлийг бууруулж, аюулгүй байдлыг сайжруулах нь

Өнөөдөр бид DALL·E-ээс дэлхийн хүн амын олон янз байдлыг илүү зөв тусгасан хүмүүсийн дүрс үүсгэх шинэ аргыг нэвтрүүлж байна. Энэ аргыг DALL·E-д арьс өнгө эсвэл хүйсийг заагаагүй, жишээлбэл “гал сөнөөгч” гэх мэт хүнийг дүрсэлсэн өгөгдөл өгөх үед системийн түвшинд хэрэглэдэг.

Манай дотоод үнэлгээнд үндэслэхэд, энэ аргыг хэрэглэсний дараа DALL·E-ийн зургууд янз бүрийн гарал үүсэлтэй хүмүүсийг багтаасан гэж хэлэх магадлал хэрэглэгчдийн дунд 12 дахин өндөр байсан. Бид илүү их өгөгдөл, санал хүсэлт цуглуулахын хэрээр энэ аргыг цаашид сайжруулахаар төлөвлөж байна.

Дөрөвдүгээр сард бид DALL·E 2 судалгааны урьдчилсан хувилбарыг цөөн тооны хүнд танилцуулж эхэлсэн бөгөөд энэ нь системийн чадвар, хязгаарлалтыг илүү сайн ойлгож, аюулгүй байдлын системээ сайжруулах боломж олгосон.

Энэ урьдчилсан шатанд эхний хэрэглэгчид эмзэг, өрөөсгөл дүрслэлүүдийг тэмдэглэн мэдээлсэн нь энэхүү шинэ бууруулах аргыг боловсруулах, үнэлэхэд тус болсон.

Бид DALL·E шиг AI системүүд сургалтын өгөгдөл дэх өрөөсгөл байдлыг хэрхэн тусгаж болох, мөн тэдгээрийг шийдвэрлэх өөр өөр аргуудын талаар судалсаар байна.

Судалгааны урьдчилсан хугацаанд бид аюулгүй байдлын системээ сайжруулах өөр алхмууд ч авсан, үүнд:

Бодит нүүр царай агуулсан зураг оруулахыг болон олны танил хүмүүс, тэр дундаа алдартнууд, нэр хүндтэй улс төрийн зүтгэлтнүүдтэй адил дүр төрх үүсгэх оролдлогуудыг татгалзсанаар DALL·E-ийг төөрөгдүүлэх агуулга бүтээхэд буруугаар ашиглах эрсдэлийг багасгах.
Манай агуулгын бодлого⁠(шинэ цонхонд нээгдэнэ)-ыг зөрчсөн өгөгдөл болон зураг оруулалтыг хаахад илүү үр дүнтэй байлгахын зэрэгцээ бүтээлч илэрхийллийг боломжтой хэвээр үлдээхийн тулд агуулгын шүүлтүүрүүдээ илүү нарийвчлалтай болгох.
Буруугаар ашиглахаас сэргийлэхийн тулд автомат болон хүний хяналтын системүүдийг боловсронгуй болгох.

Эдгээр сайжруулалтууд нь DALL·E-г илүү олон хэрэглэгчид туршиж үзэхээр урих боломжид бидний итгэлийг нэмэгдүүлсэн.

Хандалтыг өргөжүүлэх нь AI системийг хариуцлагатай нэвтрүүлэх⁠ ажлын маань чухал хэсэг бөгөөд энэ нь бодит хэрэглээнээс илүү ихийг суралцаж, аюулгүй байдлын системээ үргэлжлүүлэн сайжруулах боломж олгодог.

DALL·E 2 дахь өрөөсгөлийг бууруулж, аюулгүй байдлыг сайжруулах нь

Зохиогч

Холбоотой нийтлэлүүд