AI alignment-ийн бие даасан судалгааг ахиулах нь
Бид тохироогүй AI-ээс үүдэх аюулгүй байдал, хамгаалалтын эрсдэлийг бууруулах арга зам боловсруулж буй бие даасан судалгааг санхүүжүүлэхээр The Alignment Project-д 7.5 сая ам.доллар олгож байна.
AI системүүд улам чадвартай, улам бие даасан болохын хэрээр alignment судалгаа нь хурдаа гүйцэхийн зэрэгцээ олон талт байдлаа тэлэх шаардлагатай байна. OpenAI-д бид хил хязгаар alignment болон аюулгүй байдлын судалгаанд ихээхэн хөрөнгө оруулдаг, учир нь энэ нь манай эрхэм зорилгод нэн чухал. Мөн AGI-г хүн бүрт аюулгүй, өгөөжтэй байлгахыг нэг ч байгууллага дангаараа хэрэгжүүлж чадахгүй гэж бид үздэг бөгөөд хил хязгаар лабораториос гадуур хэрэгжүүлж болох бие даасан судалгаа, үзэл баримтлалын хандлагыг дэмжихийг хүсдэг.
Өнөөдөр бид Их Британийн AI Security Institute (UK AISI)-аас байгуулсан бие даасан alignment судалгааны дэлхийн сан болох The Alignment Project(шинэ цонхонд нээгдэнэ)-д 7.5 сая ам.долларын буцалтгүй тусламж зарлаж байна. Renaissance Philanthropy нь уг тэтгэлгийн удирдлагыг дэмжиж байна. Энэхүү хувь нэмэр нь The Alignment Project-ийг өнөөг хүртэлх бие даасан alignment судалгаанд зориулсан хамгийн том санхүүжилтийн санаачилгуудын нэг болгоход тусалж, өргөн хүрээний бие даасан экосистемийг бэхжүүлж байна.
OpenAI шиг хил хязгаар лабораториуд нь хил хязгаар загвар болон их хэмжээний тооцооллын нөөцөд хандах боломж шаарддаг alignment судалгааг хийх онцгой байр суурьтай байдаг—ийм ажлыг бие даасан судлаачид судлахад ихэвчлэн бэрх байдаг. Бид alignment дахь ахиц нь чадварын ахицтай хөл нийлүүлэхийн тулд өргөтгөх боломжтой аргуудыг боловсруулахад дотоод alignment хүчин чармайлтынхаа ихэнхийг зориулдаг. Итератив нэвтрүүлэлтэд бид итгэдэг—чадварыг аажмаар нэмэгдүүлэхийн зэрэгцээ хамгаалалтыг бэхжүүлэх нь—асуудлыг эрт ил гаргахад тусалж, практикт юу үр дүнтэйг харуулах бодит нотолгоо өгдөг, мөн хариуцлагатай хөгжүүлэлт нь загвар бүтээх, нэвтрүүлэх үйл явцтай нягт уялдсан ихээхэн alignment болон аюулгүй байдлын ажлыг шаарддаг гэж бид үздэг.
Үүний зэрэгцээ, энэ салбар нь санааны хүрээг тэлж, шинэ чиглэлүүдийг нээж чадах бие даасан, хайгуулын шинжтэй судалгаанд тогтвортой хөрөнгө оруулалт хийхээс ашиг хүртдэг. Бие даасан судалгаа зайлшгүй чухал хэвээр байна; олон төрлийн өгөөжтэй судалгаанд лабораториуд харьцангуй давуу талаа хадгалдаггүй. Эрүүл alignment экосистем нь бие даасан багууд янз бүрийн таамгийг шалгаж, өөр хүрээнүүд боловсруулж, нэг байгууллагын замын зурагтай яг таг нийцэхгүй байж болох үзэл баримтлалын, онолын, мөн алсын хараатай санаануудыг судлахаас хамаардаг.
Мөн AGI руу чиглэсэн ахиц нь эцэстээ alignment асуудлын хэлбэрийг өөрчилж, аль хандлага хамгийн ашигтайг өөрчлөх суурь нээлтүүдээс хамаарч болох учраас өнөөдрийн давамгайлж буй аргууд бидний төсөөлснөөр өргөжихгүй байсан ч ач холбогдолтой хэвээр байх судалгааг дэмжих нь чухал юм. Тийм нөхцөлд суурь, үзэл баримтлалын, харилцан хамаарал багатай ажил хийж буй хүчирхэг гадаад экосистемтэй байх нь бүр ч чухал болно. AI alignment болон аюулгүй байдлын асуудал урьд өмнө байгаагүй чухал ач холбогдолтой бөгөөд чадамжууд үргэлжлэн ахихын хэрээр аль хандлага хамгийн тогтвортой нь болохыг бид одоогоор мэдэхгүй байгаа тул бидэнд бүгдийн оролцоо хэрэгтэй байна.
Манай буцалтгүй тусламж—одоогийн ханшаар ойролцоогоор 5.6 сая фунт стерлинг—нь бусад төрийн, буяны болон салбарын дэмжигчдийн хамт The Alignment Project-ийг хамтран санхүүжүүлнэ(шинэ цонхонд нээгдэнэ). Нийт сан 27 сая фунт стерлингээс давсан бөгөөд дэлхий даяарх alignment судалгааны өргөн багцыг дэмжихээр зориулагдсан. Үүнд тооцооллын төвөгшлийн онол, эдийн засгийн онол ба тоглоомын онол, танин мэдэхүйн шинжлэх ухаан, мэдээллийн онол ба криптограф зэрэг олон янзын сэдэв багтана. Тус тусын төслүүдийг ихэвчлэн 50,000-аас 1 сая фунт стерлингээр санхүүжүүлдэг бөгөөд нэмэлтээр тооцооллын нөөц, мэргэжилтний дэмжлэг авах боломжтой.
Манай санхүүжилт шинэ хөтөлбөр эсвэл шалгаруулалтын процесс бий болгохгүй, мөн одоо байгаа процесст нөлөөлөхгүй; харин одоогийн шатанд санхүүжүүлж болох аль хэдийн шалгагдсан, өндөр чанартай төслүүдийн(шинэ цонхонд нээгдэнэ) тоог нэмэгдүүлж байна.
UK AISI нь ийм цар хүрээ, өргөн хүрээнд alignment санхүүжилтийг чиглүүлэхэд сайн байр суурьтай. Тус байгууллага нь төр, академи, буяны салбар, аж үйлдвэрийг хамарсан тогтсон салбар хоорондын эвслийг, мөн аль хэдийн явж буй буцалтгүй тусламжийн сувгийг, шинжээчдийн үнэлгээнд орсон олон тооны саналын сантай нь хамт авчирдаг. Шинжлэх ухаан, инноваци ба технологийн яам (DSIT)-ны харьяа Их Британийн төрийн судалгааны байгууллагын хувьд энэ нь мөн AI-ийн ноцтой эрсдэлд төвлөрсөн бүрэн эрхтэй бөгөөд судалгааны санхүүжилтийн хөтөлбөр хэрэгжүүлэх туршлагатай.
AI-ийн ирээдүй хэний ч таамагласнаар яг таг өрнөхгүй—мөн маш хурдтай ахиж магадгүй—учраас ардчилсан хүртээмж, “AI resilience,” болон итератив нэвтрүүлэлт нь зайлшгүй гэж бид үздэг. OpenAI-д бид хил хязгаар alignment болон аюулгүй байдлын судалгаагаа үргэлжлүүлэн ахиулж байгаа ч чадамж ахихын хэрээр харилцан нөхөх хандлагуудыг баримталж буй бат бөх, олон талт, бие даасан экосистемээс ахиц дэвшил ашиг хүртэнэ. Энэхүү буцалтгүй тусламж бол тэр зорилгын зүг хийж буй нэг алхам юм. Салбар хөгжихийн хэрээр өргөн хүрээний судалгааны хамтын нийгэмлэгтэй үргэлжлүүлэн хамтран ажиллахыг бид тэсэн ядан хүлээж байна.


