Илгээсэн: 2023 оны 6-р сарын 12

NTIA AI Accountability Policy-д өгсөн тайлбар

National Telecommunications and Information Administration (NTIA)-ийн AI Accountability Policy-ийн талаар санал авах хүсэлт.

OpenAI нь National Telecommunications and Information Administration (NTIA)-ийн 2023 оны 4-р сарын 13-ны өдөр гаргасан AI Accountability Policy-ийн талаар санал авах хүсэлтэд (RFC) хариу өгч байгаадаа таатай байна.

Энэ саналд бид өнөөдөр үзүүлж буй үйлчилгээндээ хэрэгжүүлдэг аюулгүй байдлын практик, мөн ирээдүйд санал болгохоор төлөвлөж буй үйлчилгээнд хэрэгжүүлэхээр төлөвлөж буй практикт үндэслэн AI хариуцлагын талаарх өөрсдийн үзэл бодлыг тайлбарлаж байна. NTIA энэ хэлэлцүүлгийг AI хариуцлагын “экосистем” гэсэн хүрээнд авч үзэхээр шийдсэнийг бид сайшааж байна. RFC-д дурдсанаар бодлого боловсруулагч оролцогч талууд “итгэл төрүүлэх AI системийн зорилгууд болон нэвтрүүлэлтийн нөхцөл байдлын хүрээ”-г судалж байна.¹ Хариуцлагыг хэрэгжүүлэхэд зориулагдсан бодлого ба практик нь үүний дагуу ялгаатай байна. Үүний зэрэгцээ тодорхой хариуцлагын арга хэмжээнүүд нь хоорондоо зэрэгцэн орших шаардлагатай бөгөөд хамгийн чухал нь тэдгээрийн хамтын нөлөө юм.

AI хариуцлагын төлөвшсөн экосистем нь хэвтээ болон босоо аль аль элементийг агуулна гэж бид үздэг. Өөрөөр хэлбэл, зарим элемент нь хэрэглээний салбаруудын даяар тодорхой AI системүүдэд үйлчлэхийн зэрэгцээ, зарим элемент нь тодорхой салбаруудад тохируулсан байна гэж бид үзэж байна. Бид өндөр чадамжтай суурь загваруудыг хөгжүүлэх, нэвтрүүлэх ажилд оролцдог—эдгээр нь их хэмжээний өгөгдлөөс суралцаж, улмаар доод түвшний өргөн хүрээний даалгаврыг гүйцэтгэх чадвартай болдог загварууд юм. Бидний үзэж байгаагаар бидэн шиг AI хөгжүүлэгчид хамгийн дэвшилтэт чадамжийг хөгжүүлэх, нэвтрүүлэхдээ хариуцлагатай байж, нягт нямбай, аюулгүй байдалд төвлөрсөн хандлага баримтлах ёстой. Ийм загваруудыг ямар салбарт ашиглаж байгаагаас үл хамааран энэ нь үнэн юм.

Одоо хүчин төгөлдөр байгаа олон хууль AI-д, үүнд манай бүтээгдэхүүнүүдэд ч хамаардаг бөгөөд Конгресс дахь хууль тогтоох санаачилгууд, Европт боловсруулагдаж буй AI Act, дэлхий даяар өрнөж буй хууль тогтоох болон бодлогын санаачилгуудын улмаас эрх зүйн орчин хурдтай өөрчлөгдөж байна. Үүний зэрэгцээ анагаах ухаан, боловсрол, хөдөлмөр эрхлэлт зэрэг салбар дахь олон жилийн турш тогтсон хууль, зохицуулалт болон бусад хүлээлтүүдийг аль хэдийн тайлбарлаж, дасан зохицуулж байгаа нь AI эдгээр салбарт гүйцэтгэх үүргийг тодорхойлно. Гүнзгий салбарын мэдлэгээр дэмжигдсэн эдгээр салбар-онцлог хүчин чармайлтыг бид AI хариуцлагын орчны чухал хэсэг гэж үздэг.

Бид AI-д зориулсан шинээр үүсэж буй хариуцлагын хүлээлтүүдийг уялдуулах хүчин чармайлтыг, үүнд NIST AI Risk Management Framework, U.S.-E.U. Trade and Technology Council, мөн бусад олон улсын санаачилгын хүчин чармайлтыг хүчтэй дэмждэг. Эдгээр хүчин чармайлт урагшилсаар байгаа энэ үед, мөн шинэ хуулиуд бүрэн хэрэгжихээс өмнө ч бид болон бусад компаниуд нэвтрүүлэлтийн өмнөх туршилт, контентийн гарал үүсэл, итгэлцэл ба аюулгүй байдал зэрэг асуудлаар сайн дурын амлалт өгөх үүрэгтэй гэж үзэж байна.

Манай одоогийн инженерчлэлийн хандлага нь тооцооллын нөөцийн өвөрмөц хэмжээ шаарддаг бөгөөд бид үүнийг бидэнтэй адил оролцогчдод хамаарах нэмэлт, онцгой хариуцлагын хүлээлтийг тодорхойлох ирээдүйтэй суурь гэж үздэг. Бүх оролцогчид шударгаар өрсөлдөж, инноваци хийх чадварыг хадгалахын тулд өндөр чадамжтай суурь загваруудад зориулсан аливаа шинэ зохицуулалтын хүрээг нягт нямбай тогтоохыг бид дэмждэг.

Хариуцлага нь технологийн мөчлөгийн туршид үүрэг гүйцэтгэдэг. Манай загваруудыг аюулгүй, найдвартай болгох хүчин чармайлт хөгжүүлэлт эхлэхээс өмнө эхэлж, загваруудыг нэвтрүүлэх болон ажиллагааны туршид үргэлжилж, өндөр чадамжтай суурь загваруудын бүтээгчид болон хэрэглэгчдийг хоёуланг нь хамардаг. Бид хөгжүүлэгчдэд өөрсдийн аппликейшнд зориулсан дэлхийд тэргүүлэх чадамжуудыг олгодог бөгөөд ChatGPT болон манай бусад үйлчилгээг өдөр бүр ашигладаг сая сая хүнд шууд хүчирхэг чадамжуудыг хүргэдэг. Манай ашиглалтын бодлого нь манай загвар, хэрэгсэл, үйлчилгээний бүх хэрэглэгчдэд хамаарна.² Бид одоо хүчин төгөлдөр хуулийг мөрддөг бөгөөд хөгжүүлэгчид болон хэрэглэгчдээ манай үйлчилгээг ашиглахдаа эдгээрийг дагаж мөрдөхийг шаарддаг.

Энэ саналын үлдсэн хэсэгт бид AI хариуцлагын талаарх одоогийн хандлагуудаа төвлөрүүлж, экосистемийг бэхжүүлэхийн тулд бид болон бусад талуудын ажиллаж буй чухал салбаруудыг тайлбарлаж байна. АНУ болон дэлхий даяарх бодлого боловсруулагчид AI хариуцлагыг хэрэгжүүлэх зорилготой өргөн хүрээний бодлого, арга хэмжээнүүдийг, үүнд хууль тогтоомж, зохицуулалт, олон улсын хэлэлцээр, өөрийн зохицуулалтын хөтөлбөрүүд, мөрдөгдөх техникийн болон бусад стандартуудыг авч үзэж байгааг бид тэмдэглэж байна. Бид эдгээр хүчин чармайлтыг өндрөөр үнэлж, AI хариуцлагын үр дүнтэй хандлагыг боловсруулж, хэрэгжүүлэхэд бусад оролцогч талуудтай хамтран ажиллахад бэлэн байна.

OpenAI-ийн одоогийн хандлагууд

Бид олон нийтийн өргөн хүрээний яриа хэлэлцээ хувьсан өөрчлөгдөхтэй зэрэгцэн өөрсдийн практикийг боловсронгуй болгож байна. Энд бид хандлагынхаа хэд хэдэн талын талаар дэлгэрэнгүй мэдээлэл өгч байна.

Системийн картууд

Ил тод байдал нь хариуцлагатай AI системүүдийг бүтээх чухал бүрэлдэхүүн юм. Хариуцлагын талаарх манай хандлагын гол хэсэг нь бидний нэвтрүүлдэг шинэ AI системүүдэд зориулан одоогоор Системийн карт гэж нэрлэж буй баримт бичгийг нийтлэх явдал юм. Манай хандлага нь загварын карт болон системийн картын өмнөх судалгааны ажлуудаас санаа авсан.³ Өнөөдрийн байдлаар OpenAI хоёр системийн карт нийтэлсэн: GPT‑4 системийн карт болон DALL-E 2 системийн карт.⁴

Ихэнх тохиолдолд эдгээр баримт бичиг нь зөвхөн загвар өөрт нь төвлөрөхөөс илүүтэйгээр системийн нөлөөллийг шинжилж, тайлбарлах нь чухал гэж бид үздэг. Учир нь системийн нөлөөлөл нь загвараас бусад хүчин зүйлсээс, тухайлбал хэрэглээний тохиолдол, нөхцөл байдал, бодит ертөнцийн харилцан үйлчлэлээс хэсэгчлэн хамаардаг. Үүнтэй адил AI системийн нөлөөлөл нь хэрэглээний бодлого, хандалтын хяналт, зүй бус хэрэглээний мониторинг зэрэг эрсдэл бууруулах арга хэмжээнээс хамаарна. Эдгээр сэдвээр мэдээлэл хүлээх, мөн манай хандлагыг ойлгох боломжтой байх нь гаднын оролцогч талуудад зүй ёсны зүйл гэж бид үздэг.

Манай Системийн картууд нь системийн зан төлөвт нөлөөлдөг гол хүчин зүйлсийн талаар, ялангуяа хариуцлагатай хэрэглээнд хамаарах салбаруудад уншигчдад мэдээлэл өгөх зорилготой. Системийн карт болон төстэй баримт бичгийн үнэ цэнэ нь зөвхөн тэдгээрийн өгдөг загварын гүйцэтгэлийн асуудлын тоймоос бус, мөн санал болгодог жишээнүүдээс үүдэлтэй болохыг бид олж мэдсэн. Ийм жишээнүүд нь хэрэглэгчид болон хөгжүүлэгчдэд тайлбарласан системийн гүйцэтгэл, эрсдэл, мөн тэдгээр эрсдэлийг бууруулахын тулд бидний авдаг алхмуудын талаар илүү бодитой ойлголт өгч чадна. Эдгээр баримт бичгийг бэлтгэх нь манай дотоод практикийг хэлбэржүүлэхэд тусалдаг бөгөөд AI-д хариуцлагатай хандлагыг хэрэгжүүлэх арга зам хайж буй бусдад эдгээр практикийг харуулдаг.

Улаан багаар хийсэн загварын чанарын үнэлгээ

Улаан баг нь манай загварууд болон системүүдийн аюулгүй байдлын дүр төрхийг илүү цогцоор нь ойлгохын тулд олон төрлийн салбарт чанарын аргаар турших үйл явц юм. Бид улаан багийн туршилтыг загвар хөгжүүлэлтийн нэг хэсэг болгон өөрсдийн ажилтнуудаар дотооддоо явуулдаг бөгөөд мөн туршиж буй системийг бүтээдэг багаас хараат бусаар ажилладаг хүмүүсээр хийлгэдэг. Манай байгууллагын чадамж, халдлагад тэсвэрлэх чадварыг шалгахаас гадна улаан багууд стресс тест болон хязгаарын тестийн аргуудыг ашигладаг бөгөөд эдгээр нь хохирол учруулах боломжтой захын тохиолдлууд болон бусад боломжит алдааны горимуудыг илрүүлэхэд төвлөрдөг.

Улаан баг нь бидний мөн хийдэг загварын чадамж, эрсдэлийн автоматжуулсан, тоон үнэлгээг нөхдөг бөгөөд үүнийг дараагийн хэсэгт тайлбарлана. Энэ нь одоогоор тоон хэмжүүрээр илэрхийлэх боломжгүй эрсдэлүүд, эсвэл илүү стандартчилсан үнэлгээ хараахан боловсруулагдаагүй байгаа эрсдэлүүдийг тодруулж чадна. Манай өмнөх улаан багийн ажлыг DALL-E 2 системийн карт болон GPT‑4 системийн карт дээр тайлбарласан.

Манай улаан багийн ажил болон туршилт ерөнхийдөө шинэ загвар эсвэл системийн хөгжүүлэлтийн үе шатанд явагддаг. Өөрсдийн дотоод туршилтаас тусад нь бид OpenAI-гаас гадуурх туршигчдыг элсүүлж, хөгжүүлэлт явагдаж буй системд эрт хандалт олгодог. Туршигчдыг OpenAI нь сонирхож буй салбар дахь өмнөх ажлын туршлагаар нь (судалгааны эсвэл практик мэдлэг) сонгодог бөгөөд ихэвчлэн академик судлаачид болон салбарын мэргэжилтнүүдийн хослол байдаг (жиш., Итгэлцэл ба Аюулгүй байдлын орчинд ажиллаж байсан хүмүүс). Бид эдгээр туршилтын үр дүнг үнэлж, баталгаажуулан, шаардлагатай үед тохируулга хийх болон сааруулах арга хэмжээг нэвтрүүлэх алхмуудыг авдаг.

OpenAI нь одоогийн болон ирээдүйн үнэлгээнд зориулан гаднын туршигчдын чанар, олон талт байдал, туршлагыг сайжруулах алхмуудыг үргэлжлүүлэн авч байна.

Загварын тоон үнэлгээ

Дээр тайлбарласан чанарын улаан багаас гадна бид янз бүрийн чадамж болон аюулгүй байдалд чиглэсэн эрсдэлийн автоматжуулсан, тоон үнэлгээг бий болгодог бөгөөд үүнд улаан баг зэрэг аргаар олж илрүүлсэн эрсдэлүүд ч орно. Эдгээр үнэлгээ нь манай загваруудын өөр өөр хувилбаруудыг хооронд нь харьцуулах, аюулгүй байдлыг сайжруулах судалгааны арга зүйг давтан хөгжүүлэх, улмаар ямар загварын хувилбарыг нэвтрүүлэхээ шийдэх шийдвэр гаргалтад оролт болдог. Одоогийн үнэлгээнүүд нь эротик контент, үзэн ядсан контент, амиа хорлохтой холбоотой контент зэрэг сэдвүүдийг хамарч, загварууд ийм төрлийн контент үүсгэх хандлагыг хэмждэг.

Ашиглалтын бодлого

OpenAI нь манай ашиглалтын бодлогод заасны дагуу тодорхой үйл ажиллагаа, контентод зориулан манай загвар болон хэрэгслүүдийг ашиглахыг хориглодог.⁵ Эдгээр бодлого нь манай загвар, хэрэгслийг хувь хүн эсвэл нийгэмд хохирол учруулахуйц байдлаар ашиглахыг хориглохоор бүтээгдсэн. Бид шинэ эрсдэлүүд болон манай загварууд хэрхэн ашиглагдаж байгаа талаарх шинэчлэгдсэн мэдээлэлд хариу болгон эдгээр бодлогыг шинэчилдэг. Манай загваруудад хандах болон ашиглах нь OpenAI-ийн Ашиглалтын Нөхцөл-д мөн захирагддаг бөгөөд үүнд бусад зүйлсийн хамт хүмүүсийн эрхэд хохирол учруулах зорилгоор манай үйлчилгээг ашиглахыг хориглож, мөн тийм биш байхад манай үйлчилгээний гаралтыг хүний үүсгэсэн мэтээр танилцуулахыг хориглодог.⁶

Бид зарим төрлийн хүсэлтэд хариу өгөхөөс татгалзаж сурах байдлаар загваруудыг сургаж, улмаар болзошгүй хор хөнөөлтэй хариулт руу хүргэж болзошгүй хүсэлтүүдэд хариулахгүй байлгах замаар загваруудаа хортой үйл ажиллагаанд ашиглахыг хязгаарлах алхмуудыг авдаг. Нэмж хэлэхэд, бид манай загваруудын зүй бус хэрэглээг илрүүлэх, арга хэмжээ авахын тулд шүүмжлэгчид болон автоматжуулсан системүүдийн холимгийг ашигладаг. Манай автоматжуулсан системүүдэд манай бодлогыг зөрчиж болзошгүй контентыг илрүүлэхээр бүтээгдсэн машин сургалт болон дүрэмд суурилсан ангилагч илрүүлгүүдийн иж бүрдэл багтдаг. Хэрэглэгч манай загваруудад бодлого зөрчсөн контентоор дахин дахин өгөгдөл өгөх үед бид анхааруулга өгөх, хэрэглэгчийг түр хугацаагаар түдгэлзүүлэх, эсвэл ноцтой тохиолдолд хэрэглэгчийг хориглох зэрэг арга хэмжээ авдаг.

AI хариуцлагын нээлттэй сорилтууд

RFC-д хэлэлцсэний дагуу AI хариуцлагатай холбоотой хараахан шийдэгдээгүй олон чухал асуулт бий. Дараах хэсгүүдэд бид эдгээр асуултын хэд хэдэн дээр нэмэлт өнцөг, байр суурь өгч байна.

Болзошгүй аюултай чадамжийг үнэлэх

Өндөр чадамжтай суурь загварууд нь ашиг тустай чадамжуудтай байхын зэрэгцээ хор хөнөөл учруулах боломжтой. Эдгээр загваруудын чадамж илүү дэвшилтэт болохын хэрээр тэдгээрийн учруулж болох эрсдэлийн цар хүрээ, ноцтой байдал мөн өсдөг, ялангуяа хорлонтой этгээдийн удирдлага дор ашиглагдсан эсвэл загвар хүний үнэт зүйлстэй зохих ёсоор нийцээгүй тохиолдолд.

Болзошгүй аюултай чадамжийн ахицыг чанд хэмжих нь эрсдэлийг үр дүнтэй үнэлж, удирдахад зайлшгүй шаардлагатай. Бид үүнийг энгийн, өргөтгөх боломжтой, автоматжуулсан хэрэгслээс эхлээд хүний шинжээчдийн хийдэг тусгай, нягт үнэлгээ хүртэлх болзошгүй аюултай чадамжийн үнэлгээг судалж, бүтээх замаар хэрэгжүүлж байна. Бид академик болон салбарын шинжээчидтэй хамтран ажиллаж байгаа бөгөөд эцэст нь өндөр чадамжтай суурь загваруудад шинээр үүсэж буй эрсдэлийг үнэлэх шилдэг практикийг бүрдүүлэхэд хувь нэмэр оруулах олон талт үнэлгээний багцыг хөгжүүлэхэд дэмжлэг үзүүлэхийг зорьж байна. Аюултай чадамжийн үнэлгээ нь хил хязгаар AI хөгжүүлэлтийн хариуцлага болон засаглалын улам бүр чухал суурь бүрэлдэхүүн болж байна гэж бид үздэг.

Хараат бус үнэлгээний талаарх нээлттэй асуултууд

Гуравдагч талуудыг оролцуулсан загвар болон системийн хараат бус үнэлгээ нь загварын чадамжууд улам өсөхийн хэрээр улам үнэ цэнтэй болж магадгүй. Ийм үнэлгээ нь AI системийн зан төлөв, эрсдэлийн талаархи хариуцлага ба ил тод байдлыг бэхжүүлж чадна.

Үнэлгээний зарим хэлбэр нь нэг байгууллагын дотор явагдаж болно. Жишээлбэл, баг өөрийн ажлыг өөрөө үнэлэх, эсвэл нэг баг эсвэл байгууллагын нэг хэсэг загвар бүтээж, нөгөө баг эсвэл хэсэг нь хараат бусаар уг загварыг турших зэрэг. Өөр нэг хандлага нь гаднын гуравдагч талаар үнэлгээ хийлгэх явдал юм. Дээр тайлбарласны дагуу бид одоогоор загваруудынхаа дотоод болон гаднын үнэлгээний холимогт тулгуурлаж байна.

Гуравдагч талын үнэлгээ нь тодорхой нэвтрүүлэлтүүд, тодорхой цаг үе дэх загвар эсвэл систем, байгууллагын засаглал ба эрсдэлийн удирдлагын практик, загвар эсвэл системийн тодорхой хэрэглээнүүд, эсвэл эдгээрийн хослолд төвлөрч болно. Ийм үнэлгээнд ашиглах сэтгэлгээ болон боломжит хүрээнүүд хурдацтай өөрчлөгдсөөр байгаа бөгөөд бид үнэлгээний талаарх өөрсдийн хандлагыг ажиглаж, авч үзсээр байна.

Аливаа гуравдагч талын үнэлгээнд зохих мэдлэг чадвар, урамшууллын бүтэцтэй аудитор/үнэлэгчдийг сонгох үйл явц илүү тодорхой болох нь ашигтай байх болно. Үүнээс гадна байгууллага эсвэл загваруудыг ямар хүлээлтийн эсрэг үнэлэхийг зөв сонгох нь өөр өөр оролцогч талуудын оролцоог шаардах, одоогоор нээлттэй судлагдаж буй талбар юм. Эцэст нь үнэлгээ / аудитын явцад системүүд цаг хугацааны явцад хэрхэн өөрчлөгдөж болохыг харгалзан үзэж, үүнийг үнэлгээний үйл явцад тусгах нь чухал юм.

Өндөр чадамжтай суурь загварын бүртгэл ба лиценз

Ирээдүйн үеийн хамгийн өндөр чадамжтай суурь загваруудад зориулсан бүртгэл, лицензийн шаардлагыг боловсруулахыг бид дэмждэг. Ийм загварууд нь олон нийтийн аюулгүй байдалд мэдэгдэхүйц эрсдэл учруулж болохуйц хангалттай аюултай чадамжтай байж болно; хэрэв тийм бол тэдгээрт түүнд нийцэхүйц хариуцлагын шаардлага тавигдах ёстой гэж бид үздэг.

Өндөр чадамжтай суурь загвар гаргаж ирэхээр хүлээгдэж буй сургалтын үйл явцуудад зориулсан ил тод тайлагнал ба бүртгэлийн хүлээлтийг авч үзэх нь зүйтэй байж болох юм. Ийм мэдээлэл ил тод болох нь бодлого боловсруулагчдад үр дүнтэй зохицуулалтын шийдэл боловсруулахад шаардлагатай харагдац өгч, AI дэвшлийн хил хязгаар дахь чиг хандлагаас түрүүлж ажиллах боломж олгоход тусална. Ийм аливаа дэглэм нь ил болсон мэдээллийн аюулгүй байдлыг нэн тэргүүнд тавих нь маш чухал.

AI хөгжүүлэгчдээс өмнө нь аюулгүй гэж тогтоогдсон загваруудаас илүү чадвартай болох магадлалтай өндөр чадамжтай суурь загвар бүтээх лиценз авахыг шаардаж болно. Лицензжүүлэлт нь агаарын тээвэр, эрчим хүч үйлдвэрлэл, эмийн үйлдвэрлэл, банк зэрэг аюулгүй байдалд чухал болон бусад өндөр эрсдэлтэй нөхцөлд түгээмэл байдаг. Лиценз эзэмшигчдээс нэвтрүүлэлтийн өмнөх эрсдэлийн үнэлгээ хийх, хамгийн сүүлийн үеийн аюулгүй байдал ба нэвтрүүлэлтийн хамгаалалтыг нэвтрүүлэхийг шаардаж болно; үнэндээ NTIA-ийн авч үзэх олон хариуцлагын практик нь лицензийн шаардлага болоход тохиромжтой байж болох юм. Тооцооллын үйлчилгээ үзүүлэгчийн түвшинд лицензийн шаардлага нэвтрүүлэх нь хэрэгжилтийг хангах хүчтэй нэмэлт хэрэгсэл байж болно.

AI хөгжүүлэлтийн хил хязгаарт хариуцлагыг хэрэгжүүлэх бүртгэл, лицензийн механизмын загварт олон нээлттэй асуулт байсаар байна. Эдгээр асуултыг шийдвэрлэхэд бодлого боловсруулагчидтай хамтран ажиллахыг бид тэсэн ядан хүлээж байна.