Нийтэлсэн: 2024 оны 3-р сарын 27

Нээлттэй загварын жингийн талаар NTIA-д өгсөн OpenAI-ийн тайлбар

Энэхүү тайлбарыг 2024 оны 3-р сард NTIA-аас нийтэд өргөн хүртээмжтэй жинтэй, давхар хэрэглээтэй суурь загваруудын талаар мэдээлэл хүссэн хүсэлтэд хариу болгон OpenAI хүргүүлсэн.

Аюулгүй, өгөөжтэй AI-д хүрэх олон зам бий.

OpenAI нь AI-г бүтээх, өргөнөөр нэвтрүүлэх, ашиглах нь хүмүүсийн амьдралыг сайжруулж, илүү сайн ирээдүйг нээж чадна гэж үздэг⁠(шинэ цонхонд нээгдэнэ). Ахиц дэвшил нь инновац болон чөлөөт зах зээлийн өрсөлдөөнд тулгуурладаг. Эдгээр өргөн хүрээний чиглэл дотор хүмүүс AI-ийн амлалтыг урагшлуулах олон янзын зам бий. Урьд өмнө байгаагүй чадвартай суурь загваруудын өгөөжийг хэрхэн түгээх вэ гэсэн асуудалтай хамгийн түрүүнд тэмцсэн AI хөгжүүлэгчдийн нэг нь OpenAI байсан бөгөөд NTIA-ийн хэлэлцүүлэгт тус нэмэр болохын тулд бид энэ түүхэн нөхцөл байдлыг эхлээд танилцуулж байна.

2019 онд бид GPT‑2‑ыг бүтээсэн бөгөөд энэ нь уялдаа холбоотой текстийн догол мөр үүсгэх шинэ чадвартай байсан. Ингээд түүнийг хэрхэн нэвтрүүлэх вэ гэсэн асуулттай тулгарсан. Нэг талаас, загвар маш ашигтай мэт санагдаж байсан; нөгөө талаас, бид сайн мэдэхгүй байсан⁠ нь фишинг имэйл үүсгэх зэрэг хортой зорилгод ашиглагдаж болох эсэх байв. Бид “үе шаттай гаргалт”-аар туршихаар шийдсэн. Тухайн үед бидний бичсэнээр⁠, “үе шаттай гаргалт гэдэг нь загваруудын бүлгийг хугацааны явцад аажмаар гаргахыг хэлнэ. GPT‑2‑ын үе шаттай гаргалтын зорилго нь хүмүүст эдгээр загварын шинж чанарыг үнэлэх, нийгэмд үзүүлэх нөлөөллийн талаар хэлэлцэх, үе шат бүрийн дараа гаргалтын нөлөөг үнэлэх цаг өгөх явдал юм.” Бид мэдэгдэхүйц буруугаар ашиглалтын үр нөлөө ажиглаагүй үед энэ нь бидэнд бүрэн загварын⁠ жинг нээлттэй гаргах итгэл өгсөн.

2020 онд бид GPT‑3‑ыг бүтээсэн бөгөөд энэ нь бүх шалгуур дээр өмнөх ямар ч хэлний загвараас хавьгүй чадвартай байсан. Дахин бид түүнийг хэрхэн гаргах вэ гэсэн асуулттай нүүр тулсан. Энэ удаа бид анхны бүтээгдэхүүн болох OpenAI API-аар дамжуулан гаргахаар шийдсэн (энэ нь хөгжүүлэгчдэд манай технологи дээр апп бүтээх боломж олгодог Application Programming Interface юм). Тухайн үед бидний бичсэнээр⁠, энэ шинэ гаргалтын стратегид бидэнд хэд хэдэн шалтгаан байсан: “технологийг арилжаалах нь манай үргэлжилж буй AI судалгаа, аюулгүй байдал, бодлогын хүчин чармайлтыг санхүүжүүлэхэд тусалдаг” мөн “API загвар нь технологийг буруугаар ашиглахад илүү амархан хариу үзүүлэх боломж олгодог. Манай загваруудын доод шатны хэрэглээний тохиолдлуудыг урьдчилан таамаглах хэцүү тул, хортой хэрэглээтэй нь тогтоогдвол хандалтыг өөрчлөх боломжгүй нээлттэй эхийн загвар гаргахаас илүүтэйгээр API-аар гаргаж, хугацааны явцад хандалтыг өргөжүүлэх нь угтаа илүү аюулгүй санагддаг.” Хэдэн жилийн турш энэ API гаргалт нь бидэнд болон нийгэмлэгт GPT‑3 түвшний загваруудын аюулгүй байдал болон буруугаар ашиглалтын хэв маягийн талаар сургамж⁠ өгсөн.

Түүнээс хойших жилүүдэд бид нээлттэй эхийн AI экосистемийн амлалтыг үргэлжлүүлэн дэмжиж, түүнд итгэсээр ирсэн. Үүнд манай хамгийн дэвшилтэт зарим загварын жинг нээлттэй гаргах (жишээ нь CLIP болон Whisper), мөн бусад AI хөгжүүлэгчдэд зориулсан нээлттэй эхийн дэд бүтцийг хөгжүүлэх (жишээ нь Triton GPU програмчлалын хэл) багтана. Нээлттэй гаргасан жин нь олон төрлийн томоохон ашиг тус авчирдгийг бид харсан. Үүнд AI загваруудын дотоод бүтцийн талаарх академик судалгааг хөнгөвчлөх, хэрэглэгчид болон байгууллагуудад загваруудыг өөрсдийн захын төхөөрөмж дээр локалоор ажиллуулах боломж олгох, мөн хэрэглэгчдийн зорилгод нийцүүлэн загварыг бүтээлчээр өөрчлөхөд туслах зэрэг орно. Олон AI компани брэнд, ажилд авах, мөн компанийн технологийн дотоод талыг түшин бүтээж, хурдасгах хөгжүүлэгчдийн экосистемийг татах зэрэг олон шалтгаанаар нээлттэй загварын жингийн гаргалтад ихээхэн хөрөнгө оруулалт хийхийг сонгосон.

Үүний зэрэгцээ, ChatGPT зэрэг API болон арилжааны бүтээгдэхүүнээр манай гол AI загваруудыг гаргах хандлага маань эхний гаргалтын дараа илэрсэн эрсдэлийг үргэлжлүүлэн судалж, бууруулах боломж олгосон бөгөөд жинг нь өөрсдийг нь гаргасан бол үүний олонх нь боломжгүй байх байлаа. Жишээлбэл, бид саяхан Microsoft-той хамтран манай GPT‑3.5‑Turbo болон GPT‑4 загваруудыг кибер довтолгооны ажиллагаанд туслуулахын тулд буруугаар ашиглаж байсан хэд хэдэн улсын ивээлтэй кибер аюулын этгээдийн ажиллагааг илрүүлж, судалж, таслан зогсоосон⁠. Тухайн үеийн эдгээр хил хязгаар загваруудын жинг өргөнөөр гаргасан бол ижил кибер аюулын этгээдүүд загварыг өөрсдийн техник дээр байршуулж, анхны хөгжүүлэгчтэй хэзээ ч харилцахгүй байх боломжтой тул тэднийг таслан зогсоох боломжгүй байх байв. Энэ хандлага нь AI-ийн өгөөжийг өргөнөөр түгээсээр байх боломжийг бидэнд олгосон бөгөөд үүнд өргөнөөр хүртээмжтэй үнэгүй болон хямд үйлчилгээ ч багтана.

Эдгээр туршлага нь нээлттэй жингийн гаргалт, мөн API болон бүтээгдэхүүнд суурилсан гаргалт аль аль нь өгөөжтэй AI-д хүрэх хэрэгсэл мөн гэдэгт биднийг итгүүлсэн бөгөөд хамгийн сайн Америкийн AI экосистемд энэ хоёрын аль аль нь багтана гэж бид үздэг.

Итератив нэвтрүүлэлтийг Preparedness Framework-тэй хослуулах нь

Бүтээгдэхүүний гаргалт ч бай, жингийн гаргалт ч бай, бид “итератив нэвтрүүлэлт”-ийн гайхалтай өгөөжийг дахин дахин харсан: улам бүр чадвартай AI-г аажмаар хүмүүсийн гарт өгч, тэдэнд амьдралаа сайжруулахад нь ашиглуулах, мөн нийгэмд эдгээр шинэ технологид дасан зохицоход нь туслах. Бид 2023 онд бичсэнээр⁠: “Бид нэвтрүүлэхээс өмнө урьдчилан харагдах эрсдэлийг сэргийлэхийн тулд шаргуу ажилладаг, гэвч лабораторид сурч мэдэж болох зүйлд хязгаар бий. Өргөн хүрээний судалгаа, туршилт хийсэн ч хүмүүс манай технологийг ямар бүх өгөөжтэй аргаар ашиглахыг, мөн ямар бүх аргаар буруугаар ашиглахыг бид бүрэн таамаглаж чаддаггүй. Тиймээс бодит хэрэглээнээс суралцах нь улам аюулгүй AI системийг хугацааны явцад бүтээж, гаргахын маш чухал хэсэг гэж бид үздэг.”

AI загварууд бүр илүү хүчирхэг болохын хэрээр, тэдгээрийг нэвтрүүлэх эсвэл гаргахын өгөөж, эрсдэл улам өсөх тул загварыг нэвтрүүлэх эсэх, хэрхэн нэвтрүүлэхээ шийдэхдээ улам нарийн, боловсронгуй байх нь чухал. Энэ нь ялангуяа AI чадвар олон нийтийн аюулгүй байдал эсвэл үндэсний аюулгүй байдалд мэдэгдэхүйц нөлөөтэй болох үед үнэн. Илүү дэвшилтэт AI системүүдээс ийм “сүйрлийн” эрсдэл ирээдүйд үүсэх эсэх нь угаасаа тодорхой бус бөгөөд ийм эрсдэл хэр магадлалтай, хэр хурдан үүсэх талаар эрдэм шинжилгээний хүрээнд санал зөрөлдөөнтэй байдаг. Одоогоор хангалттай нотолгоо байхгүй гэж бид үздэг; бид үүнийг үгүйсгэж чадахгүй, мөн ойрхон байгаа гэдэгт итгэлтэй байж чадахгүй. AI чадварын хил хязгаарыг урагшлуулж, өгөөжийг нь дээдлэхээр ажилладаг хөгжүүлэгчдийн хувьд энэ технологийн эрсдэлийн шинжлэх ухааныг бий болгохыг (үүнд тэдгээр эрсдэлтэй холбоотой нотолгоо цуглуулахыг оролцуулан) ажлынхаа салшгүй хэсэг гэж бид үздэг.

Эдгээр тодорхой бус байдлыг эмпирик үндэслэлтэйгээр удирдахын тулд OpenAI өөрсдийн Preparedness Framework⁠(шинэ цонхонд нээгдэнэ)-ийг олон нийтэд танилцуулсан. Энэ нь манай AI загваруудаас үүсч болзошгүй аливаа сүйрлийн эрсдэлийг тасралтгүй үнэлж, бууруулах шинжлэх ухаанд суурилсан хандлага юм. Preparedness Framework нь кибер аюулгүй байдал, автономит ажиллагаа, хувь хүнд чиглэсэн ятгалга, мөн CBRN (Chemical, Biological, Radiological, and Nuclear) аюул зэрэг өндөр эрсдэлтэй хэд хэдэн салбарт манай AI загваруудын чадварын түвшинг хэрхэн үнэлэхийг тодорхойлдог. Энэ хүрээ бодит байдал дээр хэрхэн ажилладгийн жишээг харахыг хүсвэл GPT‑4 биологийн аюул үүсгэхэд туслах чадварыг туршсан манай сүүлийн үеийн судалгааг⁠ үзнэ үү. Тус судалгаа нь нэмэлт мэдэгдэхүйц эрсдэл үүсгэхгүй гэж дүгнэсэн.

Эдгээр үнэлгээнд үндэслэн бид загваруудын эрсдэлийн түвшинг ангилал тус бүрээр Бага, Дунд, Өндөр, эсвэл Ноцтой гэж үнэлдэг. Хамгийн чухал нь, манай Preparedness Framework-ийн дагуу, хэрэв бууруулах арга хэмжээ маань эдгээр системийн эрсдэлийг хамгийн ихдээ “Дунд” түвшинд хүргэж чадахгүй бол бид өөрсдийн ангиллаар “Өндөр” эсвэл “Ноцтой” эрсдэлийн түвшинтэй AI системийг нэвтрүүлэхгүй (мөн эрсдэлийн түвшинг нь харгалзан “Ноцтой” системийг бүр сургахгүй). Preparedness Framework чухал байдаг нь улам бүр чадвартай AI-ийн өгөөжийг бүтээж, өргөнөөр хуваалцах боломж олгохын зэрэгцээ, хэрэв сүйрлийн эрсдэл бодитоор үүсвэл түүнийг аль болох эрт илрүүлж, хамгаалахад биднийг бэлтгэдэгт оршино.

Өндөр чадвартай AI хөгжүүлэгчдэд зориулсан практикууд

Хүмүүс, компаниуд өөрсдийн сонголтоор AI-д оролцох ёстой гэж бид үздэг — үүнд тэдний үнэт зүйл, алсын харааг тусгасан AI-г хөгжүүлэх эсвэл ашиглах ч багтана — ингэснээр AI-ийн өгөөжийг хүртэх боломжтой. Үүний зэрэгцээ, өндөр чадвартай AI системүүдийг аюулгүйгээр бүтээж, ашиглах ёстой бөгөөд илэрсэн сүйрлийн шинжтэй эрсдэлийг зохих ёсоор бууруулах хэрэгтэй. Эдгээр ашиг сонирхол заримдаа зөрчилдөж болох тул нийгэмд хамгийн сайн үр дүн авчрахын тулд тохиолдол тус бүрт нь нухацтай удирдах шаардлагатай.

Бүтээхэд ихээхэн нөөц шаарддаг (хэдэн зуун сая ам.доллар болон түүнээс дээш хэмжээний) өндөр чадвартай суурь загваруудын хувьд, AI хөгжүүлэгчид өөрсдийн загвар сүйрлийн шинжтэй эрсдэл үүсгэх боломжтой эсэхийг үнэлж, хэрэв загварын эрсдэлийн түвшин өндөр гэж тогтоогдвол түүнийг нэвтрүүлэх эсвэл гаргахаас өмнө зохих бууруулах арга хэмжээг авах ёстой гэж бид үздэг. Энэ нь эрсдэлийн удирдлага ба инновацын хооронд зөв тэнцвэр тогтоож байна: эдгээр загварууд хамгийн өндөр чадвартай байх төлөвтэй⁠(шинэ цонхонд нээгдэнэ), харин үнэлгээний өртөг нь хөгжүүлэлтийн өртгийнх нь хамгийн ихдээ багахан хэсэг байна. Ийм үнэлгээ нь загварын жинг өргөн хүрээнд эсвэл API-аар гаргахаар төлөвлөсөн эсэхээс үл хамааран утга учиртай.

Нөгөө талд нь, бага нөөц шаарддаг суурь загваруудын хувьд ашиг сонирхлын тэнцвэр өөр байдаг. Одоогийн нотолгоонд үндэслэвэл, ийм загварууд нь нарийн тааруулалт болон загвар өөрчлөх аргуудын ахиц гарсан ч сүйрлийн шинжтэй эрсдэл үүсгэх магадлал хавьгүй бага харагдаж байна. Үүний зэрэгцээ, сүйрлийн эрсдэлийн үнэлгээ нь жижиг сургалтын явцуудын төсвийн томоохон хэсгийг эзэлж болзошгүй бөгөөд энэ нь инновац, өрсөлдөөнийг сааруулах нөлөө үзүүлж мэднэ. Шинэ, сонирхолтой AI чадварууд дээр хөгжүүлэгчдийн олон янз байдлаар инновац хийх чадварыг хамгаалах, санаа ба бүтээгдэхүүний зах зээлийг цэцэглүүлэх нь асар их үнэ цэнтэй бөгөөд шинжлэх ухааны баримт эдгээр загварын эрсдэл харьцангуй бага гэдгийг харуулж байгаа тул ийм загваруудаас сүйрлийн эрсдэлийн ийм үнэлгээ хүлээх ёсгүй гэж бид үздэг.

Preparedness Framework зэрэг үнэлгээний протоколууд нь нээлттэй загварын жингийн гаргалтыг оролцуулан ямар ч төрлийн загвар гаргалтаас үүсэх ex ante эрсдэлийг үнэлэхэд хэрэгтэй хэрэгсэл юм. Эдгээрийг нээлттэй жингийн гаргалтад хэрхэн хэрэглэхтэй холбоотой хэд хэдэн онцгой зүйл бий.

Ийм нэг зүйл нь туршилтын нөхцөл нь доод шатны оролцогчид загварыг өөрчилж болох олон янзын аргыг аль болох тусгах ёстой явдал юм. Нээлттэй загваруудын хамгийн ашигтай шинжийн нэг нь доод шатны оролцогчид загварыг өөрчилж, анхны чадварыг нь өргөжүүлэн, хөгжүүлэгчийн тодорхой хэрэглээнд тааруулж чаддагт оршино. Гэвч энэ нь мөн хортой талууд загварын хор хөнөөлтэй чадварыг нэмэгдүүлэх боломжтой гэсэн үг. Тиймээс нээлттэй жингийн гаргалтын эрсдэлийг нягт үнэлэхдээ хортой тал загварыг бодитоор өөрчилж болох боломжийн хүрээний аргуудыг, үүнд нарийн тааруулалтыг багтаан, турших хэрэгтэй. OpenAI аль хэдийн Preparedness Framework-ийнхаа хүрээнд тодорхой хэмжээний өөрчлөлтийн туршилт хийдэг (манай биоэрсдэлийн үнэлгээнд⁠ хийсэнтэй адил).

Өөр нэг чухал зүйл бол нээлттэй загвар хөгжүүлэгчид өөрсдийн загварыг буруугаар ашиглах эрсдэлийг бууруулахын тулд системийн түвшний хамгаалалтад найдах боломжгүй байж магадгүй, учир нь загварын жинг эзэмшиж буй хортой доод шатны хэрэглэгч ийм хамгаалалтыг ихэвчлэн арилгаж чадна. Өнөөдөр, манай хамгийн чадвартай одоогийн загварууд ч онцгой эрсдэлтэй гэж үнэлэгдээгүй байгаа тул бууруулах чадварын энэ ялгаа хязгаарлагдмал үр дагавартай байна. Гэвч хэрэв ирээдүйн загварыг гаргавал ноцтой эрсдэл үүсгэнэ гэж шинжлэх ухааны үндэслэлтэйгээр тогтоогдвол, нээлттэй жингийн гаргалтын эрсдэлийг бууруулах зам нь загварыг гаргаж буй гадаад орчны тэсвэрлэх чадварыг нэмэгдүүлэхэд тулгуурлаж магадгүй.

AI-г буруугаар ашиглахаас хамгаалах нийгмийн тэсвэрлэх чадварын хэрэгцээ нь аль нэг байгууллагын гаргалтын шийдвэрээс хавьгүй өргөн хүрээтэй. AI алгоритмуудын тасралтгүй ахиц, тархалт болон тооцоололд хандах боломж улам өргөжиж буйг харгалзан үзвэл (АНУ-ын анхаарал татаж буй улс орнуудад ч багтана), өнөөдрийн хил хязгаар AI чадварууд — бүтээх үедээ цөөн хэдэн оролцогчид л хандах боломжтой байдаг — эцэст нь өргөн тархана. АНУ болон дэлхийн бусад орнуудад мөн буруугаар ашиглалтын үр дагаврыг хязгаарлах бууруулах арга хэмжээнд хөрөнгө оруулж, манлайлах боломж бий бөгөөд ингэснээр үр дүнгийн тэнцвэр хамгийн эерэг болно.

Жишээлбэл, AI-ээр хурдассан кибер халдлагын эрсдэлийн эсрэг тэсвэрлэх чадварыг бэхжүүлэхийн тулд чухал дэд бүтцийн үйлчилгээ үзүүлэгчдэд ижил AI загваруудад эрт хандах эрх олгож болох юм. Ингэснээр тэдгээрийг кибер хамгаалалтыг сайжруулахад ашиглаж чадна (бидний OpenAI Cybersecurity Grant Program⁠-ын хүрээнд санхүүжүүлсэн эхний төслүүдийн адил). AI-ээр хурдассан биологийн аюул үүсгэх эрсдэлийн эсрэг тэсвэрлэх чадварыг бэхжүүлэхэд AI-тай огт холбоогүй шийдлүүд, тухайлбал нуклейн хүчлийн нийлэгжүүлэлтийн скринингийн механизмыг сайжруулах (Executive Order 14110-д уриалсанчлан), эсвэл нийгмийн эрүүл мэндийн системүүдийн шинэ эмгэг төрүүлэгчийн дэгдэлтийг илрүүлэх, таних чадварыг сайжруулах зэрэг багтаж болно. Хэрэв AI загвар олон нийтийн аюулгүй байдал эсвэл үндэсний аюулгүй байдалд ноцтой эрсдэл учруулж байгааг нягт нотолбол, хөгжүүлэгч нь мөн өргөнөөр гаргахаас өмнө шинэ чадваруудын талаар ойлголт, сэрэмжийг бий болгоход чухал үүрэгтэй байж болно (жишээлбэл дэд бүтцийн үйлчилгээ үзүүлэгчдэд мэдэгдэх эсвэл API нэвтрүүлэлтийг хязгаарлах замаар). Ингэснээр нэн шаардлагатай тэсвэрлэх чадварын хүчин чармайлтад цаг хугацаа, сэдэл хоёрыг бүрдүүлнэ. Энэ нь кибер салбарын “хариуцлагатай ил болголт” гэсэн хэм хэмжээг санагдуулдаг бөгөөд аюулгүй байдлын судлаачид олсон эмзэг байдлаа хамгаалагчдад системээ нөхөх хугацаа өгөхийн тулд түр хугацаанд нийтлэхгүй барьдаг ч цаашдын аюулгүй байдлын судалгааг сааруулдаггүй.

Бидэнд AI эрсдэлийн илүү сайн шинжлэх ухаан хэрэгтэй

Хамгийн чадвартай загваруудын эрсдэлийг үнэлэх нь чухал гэж бид үздэг ч AI эрсдэлийн үнэлгээний шинжлэх ухаан дөнгөж бүрэлдэж байна. OpenAI болон өргөн хүрээний AI нийгэмлэг AI эрсдэлийг хэрхэн үнэлэх суурийг бүрдүүлсээр байгаа бөгөөд Preparedness Framework-ийн үйл ажиллагааны олон нарийн ширийнийг бид байнга сайжруулсаар байна. Засгийн газрууд AI экосистемийн эрсдэл болон чадварын үнэлгээний практикийг боловсронгуй болгоход чухал үүрэгтэй. Жишээлбэл, довтолгооны кибер аюулгүй байдал, чухал дэд бүтэц, AI-ийн салбарын мэргэжилтнүүдийг цуглуулж, тэргүүлэх ач холбогдолтой AI кибер аюулын загваруудын талаар зөвшилцөн, тэдгээрийг үнэлэх нягт, эмпирик туршилтын орчныг бий болгоход дэмжлэг үзүүлж болно. USAISI-ийн хэрэгжүүлж буй сайн дурын, инновацид ээлтэй, шинжлэх ухааныг тэргүүнд тавьсан хандлагыг бид хүчтэй дэмждэг.

2019 онд OpenAI GPT‑2‑ыг гаргахдаа — эхлээд загварын зөвхөн жижиг хувилбарыг гаргахаар сонгосноос хойш — суурь загварын жинг нээлттэй гаргахтай холбоотой асуудлуудын хүрээнд шинэ олдвор, үйл явдлууд тасралтгүй өөрчлөлт авчирсаар ирсэн, заримдаа хэдхэн сар тутамд ч өөрчлөгдөж байв. Энэ чиг хандлага цаашид үргэлжилнэ гэж бид үзэж байна. Төрийн бодлогын аливаа хандлага ирээдүйн өөрчлөлтөд уян хатан, дасан зохицох чадвартай байх ёстой.