AI-ийн тухай NIST-ийн гүйцэтгэх захирамжид өгсөн хариу
Хиймэл оюун ухааны тухай гүйцэтгэх захирамжийн 4.1, 4.5, 11-р хэсгүүдийн хүрээнд хэрэгжүүлэх даалгавартай холбоотой Үндэсний Стандарт, Технологийн Хүрээлэнгийн (NIST) мэдээлэл авах хүсэлт.
OpenAI нь ерөнхий хиймэл оюун ухаан—товчхондоо, хүний хэмжээнд ядаж ухаалаг AI—бүх хүн төрөлхтөнд ашиг тусаа өгөхийг хангах зорилгоор 2015 онд ашгийн бус байгууллага хэлбэрээр байгуулагдсан. Бид AI-ийн аюулгүй байдал, нийцэл, засаглалд зориулсан хамгийн сүүлийн үеийн AI технологи, мөн хэрэгсэл, шилдэг туршлагыг судалж, хөгжүүлж, нийтэд хүргэдэг. NIST-ийн AI-ийн талаарх үргэлжилж буй, чухал ажилд мэдээлэл өгөх энэ боломжийг бид талархан хүлээн авч байна.
Энд бид RFI-д хөндсөн гурван сэдэвт анхаарлаа төвлөрүүлж байна: (1) AI-ийн чадамжийг үнэлэх, аудит хийх, (2) аюулгүй, найдвартай, итгэл даахуйц системийг нэвтрүүлэхэд зориулсан улаан багийн туршилт явуулах, мөн (3) синтетик медиа ба гарал үүсэл.
“AI хор хөнөөл учруулж болох чадамжийг үнэлэх удирдамж, жишиг үзүүлэлтүүдийг бий болгох...” гэсэн NIST-ийн төвлөрлийг бид сайшааж байна. OpenAI нь одоогийн болон ирээдүйн AI загваруудаас үүдэх сүйрлийн түвшний аюултай эрсдэлийг үнэлэх, мөрдөх, бууруулах цогц арга болох Preparedness Framework(шинэ цонхонд нээгдэнэ)-д амлалт өгсөн. Preparedness Framework одоогоор эрсдэлийн дөрвөн эхний чиглэлийг хянаж байна: кибер аюулгүй байдал; химийн, биологийн, цөмийн болон радиологийн аюул (CBRN); ятгалга; мөн загварын автоном байдал. Мөн энэ Framework нь одоогоор хараахан тодорхойлогдоогүй “үл мэдэгдэх үл мэдэгдэх” эрсдэлүүдэд тогтмол сонор сэрэмжтэй байх үүргийг бидэнд хүлээлгэдэг. Энэ ажлын хүрээнд OpenAI саяхан CBRN-ийн нэг томоохон үнэлгээг хуваалцсан: GPT‑4 нь одоо байгаа нөөцүүдийн (өөрөөр хэлбэл интернетийн) суурь түвшинтэй харьцуулахад хортой зорилготой этгээдүүдийн биологийн аюул үүсгэхтэй холбоотой аюултай мэдээлэлд утга учиртайгаар илүү нэвтрэх боломжийг нэмэгдүүлж чадах эсэхийг үнэлсэн. Биологийн мэргэжилтнүүд болон оюутнуудыг хамарсан хамгийн том төрлийн энэ үнэлгээгээр GPT‑4 нь биологийн аюул үүсгэх мэдээлэлд хамгийн ихдээ бага зэрэг нэмэгдэл л өгч байгааг бид тогтоосон. Энэ нь хангалттай том нэмэгдэл биш тул эцсийн дүгнэлт хийхэд хүрэлцэхгүй ч NIST болон шинэ AI Safety Institute-ээр удирдуулсан цаашдын судалгаа, хамтын хэлэлцүүлгийн эхлэл болно гэж найдаж байна. Энэ ажил AI системийн эрсдэлийг үнэлэх хэд хэдэн гол зарчимд бидний итгэлийг нэмэгдүүлсэн:
- AI системийн эрсдэлд оруулж буй хувь нэмрийг тохиромжтой суурь түвшинтэй харьцуулсан өөрчлөлтөөр хэмжих ёстой.Одоогийн болон ирээдүйн AI системүүдээр нэмэгдэж болзошгүй олон эрсдэл (жишээлбэл кибер аюулгүй байдал эсвэл био аюулгүй байдал) AI байхгүй байсан ч тодорхой түвшинд оршдог. Жишээ нь, интернет хайлт нь био аюулгүй байдалтай холбоотой мэдээлэлд нэлээд хэмжээний хандалт аль хэдийн олгож байна. AI системийн эрсдэлд оруулж буй хувь нэмрийг үнэлэхдээ AI нь одоо байгаа нөөцөөс давсан эрсдэл нэмэгдүүлж байгаа эсэхийг шалгах нь чухал шилдэг туршлага юм. Бид саяхны био эрсдэлийн судалгаандаа үүнийг дараах байдлаар хэрэгжүүлсэн: оролцогчдын хагасыг AI бус мэдлэгийн эх сурвалжууд (онлайн мэдээллийн сан, өгүүлэл, интернет хайлтын систем, мөн өөрсдийн өмнөх мэдлэг) л ашиглах боломжтой хяналтын бүлэгт санамсаргүйгээр хуваарилж, нөгөө хагасыг эдгээр нөөц болон GPT‑4 загварт бүрэн хандах боломжтой туршилтын бүлэгт оруулсан.
- Салбарын мэргэжилтнүүдтэй хамтран ажиллах нь эрсдэлийг ойлгоход амин чухал.AI-ийн аюулгүй байдалд хамаарах өргөн, олон янзын бүх сэдвээр дэлхийн түвшний мэргэжилтнүүдийг ганц байгууллага ажилд авах нь бэрхшээлтэй. Алтан стандартын түвшний мэдлэгт хүрэхийн тулд аюултай чадамжийн үнэлгээнд хамаарах сэдвээр мэргэжилтэн ажиллуулдаг гуравдагч талуудтай түншлэх нь ашигтай. Үүнээс гадна судалгааны үнэлгээ хийхэд салбарын мэргэжилтнүүдийг оролцуулах нь үнэлгээ бодитой явагдаж байгааг баталгаажуулахад тусалдаг. Жишээ нь, био эрсдэлийн үнэлгээг боловсруулах, хэрэгжүүлэх явцад бид судалгааны даалгавар боловсруулах, оролцогчдод аюулгүй байдлын сургалт явуулах, гүйцэтгэсэн даалгаврыг үнэлэх зэрэгт гуравдагч талын био аюулгүй байдлын мэргэжилтнүүдтэй нягт хамтран ажилласан. AI-ийн аюулгүй байдлын ашиг сонирхолд энэ экосистемийг тэлж, олон талт болгох нь нийцнэ.
- Нягт нямбай үнэлгээ хийхийн тулд загварын чадамжийн бүрэн хүрээг үр дүнтэй ил гаргах AI мэргэжилтнүүдтэй хамтран ажиллах шаардлагатай.AI загваруудаас үүдэх эрсдэлийн бүрэн хүрээг ойлгохын тулд үнэлгээ хийхдээ боломжтой бүх нөхцөлд загварын бүрэн чадамжийг ил гаргах шаардлагатай. Энэ нь суурь AI системүүд болон тэдгээрийг хэрхэн үр дүнтэй ашиглаж болох талаар гүн ойлголт шаарддаг. Үнэлгээг AI мэргэжилтнүүдтэй нягт хамтран зохион бүтээхийг бид зөвлөж байна. Манай био эрсдэлийн судалгаанд үүнд хэлний загварын чадамж ил гаргах шилдэг туршлагаар илүү сайн гүйцэтгэл гаргах талаар хүний оролцогчдод сургалт өгөх, мөн загваруудын чадамжийг илүү сайн ил гаргаж, шалгах тусгай техникийн аргуудыг ашиглах багтсан.
- Эрсдэлийн үнэлгээний үр дүнг хэрхэн тайлбарлах талаар илүү их судалгаа хэрэгтэй.Жишээлбэл, AI загварууд био эрсдэлийн мэдээлэлд хандах боломжийг нэмэгдүүлж байгааг үнэлэх тохиолдолд мэдээллийн хандалт хэр зэрэг нэмэгдэхэд био эрсдэл мэдэгдэхүйц өсөхийг одоогоор тодорхой хэлэх боломжгүй байна. Онлайн мэдээллийг бодит биологийн аюул болгон хувиргах шинэ технологиуд гарч ирэхийн хэрээр AI системийн био эрсдэлд үзүүлэх нөлөө өөрчлөгдөж болно. Бид Preparedness Framework-ээ цаашид хэрэгжүүлсээр байхдаа NIST болон AI Safety Institute-тай хамтран эрсдэл болон эрсдэлийн хэмжүүрийн талаарх ойлголтыг илүү бат бөх болгохыг эрмэлзэж байна.
- Алтан стандартын хүний оролцоотой үнэлгээ өндөр өртөгтэй.Хэлний загварын хүний үнэлгээ явуулахад оролцогчдын нөхөн төлбөр, програм хангамж боловсруулах, аюулгүй байдлын зардалд ихээхэн төсөв шаарддаг. Манай био эрсдэлийн судалгаанд бид эдгээр зардлыг бууруулах янз бүрийн аргыг судалсан ч ихэнх зардал нь (1) тохиролцох боломжгүй аюулгүй байдлын шаардлага, эсвэл (2) шаардлагатай оролцогчдын тоо болон оролцогч бүр нягт шалгалтад зарцуулах шаардлагатай хугацаанаас шалтгаалсан. Стандарт боловсруулахдаа үүнийг харгалзан үзэх ёстой.
Нэмэлт мэдээллийг манай саяхны био эрсдэлийн судалгааны блог нийтлэлээс авах боломжтой: LLM-ийн тусламжтай биологийн аюул үүсгэхэд зориулсан эрт сэрэмжлүүлэх систем байгуулах нь.
OpenAI улаан багийг “AI систем болон бүтээгдэхүүнүүдийн хортой чадамж, гаралт, эсвэл дэд бүтцийн аюул заналыг илрүүлэхийн тулд шалган турших бүтэцтэй үйл явц” гэж тодорхойлдог.A
Улаан баг гэсэн ерөнхий нэр томьёоны дор дотоод улаан баг (лаборатори эсвэл компанийн дотоод, тусгай баг хийдэг), гаднын улаан баг (лаборатори эсвэл компанитай хамтран гаднын оролцогчид хийдэг), эсвэл автоматжуулсан улаан баг (AI загвар ашиглан автомат халдлага үүсгэж, гаралтыг ангилдаг) зэрэг олон төрлийн аргууд бий болж байна. Энэ баримт бичгийн хүрээнд бид голчлон OpenAI нь гаднын салбарын мэргэжилтнүүдтэй хамтран AI загвар эсвэл системийн чадамж, эрсдэлийг үнэлдэг гаднын улаан багийн үйл ажиллагааг хэлж байна.
OpenAI-ийн улаан багийн хандлага нь сөрөг довтолгоо эсвэл загварын гаралтыг тусгаарласан байдлаар авч үздэггүй. Харин энэ нь салбарын мэргэжилтнүүдтэй хамтран нөхцөл байдалд суурилсан, цогц байдлаар эрсдэлийг ил гаргах арга юм.B Хортой хэрэглээ болон аюулгүй байдлын хамгаалалтыг тойрон гарах аргуудаас гадна улаан баг нь бусад эрсдэлийг ч авч үздэг: хор хөнөөлгүй эсвэл хүлээгдэж буй оролт хортой эсвэл эрсдэлтэй гаралт руу хүргэх, эрсдэлийн орчныг өөрчилж болох шинэ чадамжийн ахиц, мөн системээс гаднах хүчин зүйлс загварын гаралттай хэрхэн харилцан үйлчилж эрсдэл эсвэл хор уршиг үүсгэж болохыг. Эдгээр чиглэлийн үнэлгээнд боломжит жишээ үүсгэх, мөн гарсан үр дүнг тухайн улаан багийн гишүүний мэргэшлийн хүрээнд баталгаажуулахын тулд хүнийг оролцуулах нь ихэвчлэн ашигтай байдаг.
AI улаан баг нь дараах шинэ загвар, системүүдтэй холбоотой болзошгүй эрсдэлийг ойлгоход тусалдаг:
- Өмнөх AI систем эсвэл технологиос ялгаатай байж болох харилцан үйлчлэлийн хэлбэр шаарддаг бөгөөд програмчлагдсан үнэлгээгээр сайн хамрагддаггүй (жиш., DALL·E дээр зураг засварлах, GPTs).
- Шинэ эрсдэл үүсгэж болзошгүй бөгөөд одоогоор хараахан үнэлэгдээгүй мэдэгдэхүйц сайжирсан чадамжтай (жиш., шинжлэх ухааны салбарууд, ятгалга, эсвэл сэтгэн бодох).
- Туршилт, баталгаажуулалтад нөхцөл байдал эсвэл салбарын онцлог мэдлэг шаарддаг (жиш., бүс нутгийн онцлогтой улс төрийн агуулга, соёлын хэвшмэл хандлага, хууль, анагаах ухаан зэрэг шинжлэх ухааны эсвэл мэргэжлийн салбарууд).
- Хэрэглэгчийн урсгал эсвэл тодорхой хэрэглээний тохиолдлуудын ойлголт шаарддаг бөгөөд үүнд системийн өөрөөс нь гаднах хүчин зүйлс ч багтаж болно (жиш., хараа султай хүмүүст зориулан GPT‑4(V)‑ийг турших).
OpenAI улаан багийг загварын түвшин болон системийн түвшний эрсдэлийг хоёуланг нь үнэлэх хэрэгсэл гэж үздэг. Системийн онцлогууд нь ангилагч, өгөгдлийн шүүлтүүр / блок жагсаалт, хэрэглэгчийн интерфэйсийн түвшний оролцоо, хяналт-шинжилгээ ба үнэлгээний практик, мөн бодлого мөрдүүлэх бусад механизм зэргийг багтааж болно. Заримдаа шинэ загвар оролцоогүй ч бид шинэ бүтээгдэхүүнд улаан баг хийдэг. Жишээлбэл, GPTs нь шинэ суурь загвар нэвтрүүлээгүй ч хэрэглэгчид загвартай хэрхэн харилцах талаар шинэ системүүдийг нэвтрүүлсэн.
OpenAI манай улаан багийн хүчин чармайлтыг манай технологи дээр суурилан бүтээж буй хөгжүүлэгчдийн хийх ёстой цаашдын салбарын онцлог улаан багийн ажилтай харилцан нөхөх гэж үздэг. Жишээлбэл, бид загвар, системүүдээ тодорхой цаг хугацаанд тодорхой нөхцөл дор улаан багт хамруулдаг бол манай API дээр суурилан бүтээж буй хөгжүүлэгчид тэр сургамжийг харгалзан үзэж, ажиллах гэж буй систем болон нөхцөл байдлынхаа дагуу нэмэлт улаан баг хийх ёстой. Энэ нь OpenAI яагаад улаан багийн ажлын гол үр дүнг бусдад суралцаж, цааш хөгжүүлэх боломж олгохын тулд системийн картууд (болон олон нийтэд нээлттэй бусад баримт бичгийн хэлбэрүүд)-д нийтэлдгийн нэг шалтгаан юм.
Бид системийн картууддаа хил хязгаар загварын нээлтүүдтэй холбоотой хэд хэдэн улаан багийн ажлаа баримтжуулсан:
- DALL·E 2 системийн карт(шинэ цонхонд нээгдэнэ)
- GPT‑4 системийн карт(шинэ цонхонд нээгдэнэ)
- GPT‑4(V) системийн карт
- DALL·E 3 системийн карт
OpenAI нь мэргэжилтэн улаан багийн гишүүдэд янз бүрийн түвшний нарийн тохируулга, сургалтын дараах боловсруулалттай, мөн аюулгүй байдлын хамгаалалтын янз бүрийн төлөвшлийн түвшинтэй урьдчилан сургагдсан загваруудад хандах эрх олгож ирсэн.
Үүний зорилгууд нь дараах байдалтай:
- Улаан багийн ойлголтууд нь сургалтын дараах түвшний хамгаалалтууд, системийн түвшний хамгаалалтууд, бодлого, үнэлгээг боловсруулахад мэдээлэл өгч болно.
- Улаан багийн ойлголтууд нь тодорхой функцуудыг гаргах эсэх, гаргалтыг хэрхэн давталттай нэвтрүүлэх, мөн аюулгүй байдлын хамгаалалтын үр нөлөөний талаар удирдлагын шийдвэр гаргалтад мэдээлэл өгч болно.
- Улаан багийн үр дүнг олон нийтэд зориулсан нээлтийн материалуудтай (жишээлбэл системийн карт эсвэл бусад хэлбэрээр) хамт хуваалцаж, боломжит хэрэглэгчид болон бусад оролцогч талуудад бууруулсан эрсдэлүүд, үлдэгдэл эрсдэлүүд, мөн ирээдүйд гарч болзошгүй эрсдэлийн талаар мэдээлж болно.
Улаан багийн ойлголтууд аюулгүй байдлын хүчин чармайлт болон шийдвэр гаргалтад шууд тусах боломжтой байхын тулд бид хөгжүүлэлтийн явцад боломжийн хэрээр эрт үеэс улаан багийг оролцуулдаг. Мөн нэмэлт аюулгүй байдлын хамгаалалт оруулахаас өмнө загварын суурь чадамжийн талаар ойлголттой болох нь чухал бөгөөд ингэснээр загвар хөгжүүлэгчид загварын суурь түвшний эрсдэлийн талаар мэдээлэлтэй шийдвэр гаргаж, мөн улам хүчирхэг болж буй системүүдтэй холбоотой эрсдэлийн орчны талаар нийгэм ойлголттой болох боломжтой.
Аюулгүй байдлын хамгаалалтуудыг хэрэгжүүлсний дараа улаан багийн ажиллагаа нь хамгаалалтаар шийдэгдээгүй цоорхой болон үлдэгдэл эрсдэлийг тодорхойлох, мөн хамгаалалтын бат бөх байдлыг үнэлэх нэмэлт тойргууд дээр төвлөрч болно.
Эцэст нь хэлэхэд, загвар хөгжүүлэлтийн үйл явцын илүү дээд шатанд авч үзэх аюулгүй байдлын чухал шинж чанарууд байгаа ч улаан баг нь загвар хөгжүүлэгчид олон нийтэд гаргаж буй зүйлтэй аль болох ойролцоо туршлагыг дуурайлган үзүүлэхийг зорьдог.
Улаан баг нь өөрөө эрсдэлийг хэмжих хангалттай дасгал биш юм. Дангаараа улаан баг нь загвар хортой агуулга гаргах магадлал, хандлага, эсвэл AI системийн ашиглалттай холбоотой эрсдэлийг тоон байдлаар илэрхийлж чадахгүй. Мөн улаан баг нь илрүүлсэн эрсдэл эсвэл хор уршгийн ноцтой байдлыг тоон байдлаар үнэлэхэд хангалттай мэдээлэл өгдөггүй.
OpenAI-ийн ихэнх мэргэжилтний улаан багийн ажил томоохон загвар эсвэл бүтээгдэхүүн нэвтрүүлэхийн өмнө явагддаг боловч үйлдвэрлэлийн орчин дахь загвар, системүүд нэлээд ойр ойрхон хувьсан өөрчлөгддөг тул улаан багийн олдворуудыг тайлбарлахдаа үүнийг харгалзан үзэх нь чухал. Үүнтэй адил, тодорхой хэрэглээний тохиолдолд загвар дээр бүтээж буй хөгжүүлэгчид, хэрэв энэ нь загвар эсвэл системийн салшгүй шинж (эсвэл өөрчлөгдөшгүй шинж) биш бол, загвар эсвэл системийн аюулгүй байдлын төлөвийг өөрчилж болох дизайн шийдвэрүүд гаргаж болно.
Улаан баг нь цаашдын туршилт, үнэлгээний төрлүүдийн суурийг тавьж, аюулгүй байдлын хамгаалалтууд ямар дайралтын вектор эсвэл асуудлын эсрэг бат бөх байх ёстой талаар тодорхой удирдамж өгдөг.
Асуудлын олон жишээ, хувилбаруудыг судлах нь тодорхой эрсдэлийн чиглэлийг хэрхэн хэмжих талаар итгэл төрүүлэхэд тусалдаг. Мэргэжилтний улаан баг нь загварынхаа хувьд эрсдэлийн чиглэлүүдийн гүнд биш, өргөнийг хамрахыг зорьдог бөгөөд иймээс дангаараа тодорхой эрсдэлийг хэмжихэд хангалттай үнэлгээ заавал бий болгохгүй. Харин улаан баг нь илүү нарийвчилсан үнэлгээний “үр” гэж үзэж болох өгөгдлийн багцуудыг үүсгэж чадна. Тэндээс үр дүнг ашиглан илэрсэн тодорхой асуудлын хүрээнд илүү олон жишээ үүсгэж болох бөгөөд шошголсон жишээнүүдийн “алтлаг багц”-ыг (ихэвчлэн салбарын мэргэжилтнүүдээр) ирээдүйн загваруудыг тухайн илрүүлсэн асуудлын хүрээнд үнэлэхэд ашиглаж болно.
Дэлхий даяарх олон тооны хүлээгдэж буй болон хүлээгдээгүй хэрэглээний тохиолдолд, мөн олон янзын нөхцөл байдалд ашиглагдах ерөнхий зориулалтын AI системүүд нь өргөн хүрээний сэдвийг хамрах, мөн өргөн хүрээний үзэл бодол, ертөнцийг үзэх өнцгийг төлөөлөх хүмүүсийг оролцуулах шаардлагатай болгодог.
OpenAI манай загваруудад улаан баг хийхээр маш олон янзын мэргэжилтэн элсүүлэхийг дэмждэг. Өнгөрсөн жил бид Red Teaming Network-д өргөдөл гаргагчдыг уриалсан. Сонгон шалгаруулалтын шалгуурт дараах зүйлс багтсан:
- Улаан багтай холбоотой тодорхой салбарт батлагдсан мэдлэг, туршлагатай байх
- AI-ийн аюулгүй байдлыг сайжруулах хүсэл эрмэлзэлтэй байх
- Ашиг сонирхлын зөрчилгүй байх
- Олон янзын гарал, мөн уламжлалт байдлаар хангалттай төлөөлөгдөөгүй бүлгүүд
- Газарзүйн хувьд олон янзын төлөөлөл
- Нэгээс олон хэлээр чөлөөтэй ярьдаг байх
- Техникийн чадвар (тус болох ч заавал шаардлагагүй)
Салбарын эрэмбэлэлтийг дараах зүйлсээр чиглүүлж болно: AI систем эсвэл загварын хүлээгдэж буй хэрэглээ, ялангуяа тодорхой бус байдал эсвэл болзошгүй эрсдэл өндөртэй нөхцөлүүд; загвар хөгжүүлэгчид чадвар нь нэмэгдсэн гэж үзэж болох загваруудын эрт үеийн үнэлгээ; өмнө нь мэдэгдэж байсан агуулгын бодлогын асуудалтай чиглэлүүд; мөн холбогдох нийгэм-улс төрийн нөхцөл байдал (жиш., 2024 он дэлхийн олон газарт томоохон сонгуулийн жил юм). Загвар эсвэл систем бүр өөр өөр төрлийн мэргэшил шаардаж болохыг, мөн загвар эсвэл системийн өсөн нэмэгдэж буй чадвар болон шинэ хэрэглээний тохиолдлуудад тулгуурлан шинэ салбаруудыг авч үзэж болохыг анхаарах нь чухал. Иймээс улаан багуудын оновчтой бүрэлдэхүүн цаг хугацааны явцад хувьсан өөрчлөгдөнө.
- Усны тэмдэг: Энэ аргын дагуу үүсгэсэн дуу дүрсний медиа нь өөрийн гарал үүслийн дохиог өөртөө агуулдаг — үзэгч, сонсогчид шууд анзаарагдахгүй ч програм хангамжаар илрүүлж болох нарийн хээ. Энэ нь зөвхөн нууц түлхүүрийн тусламжтай илрүүлж болох дохио байж болох эсвэл усны тэмдгийг илрүүлэх програм хангамж нь нийтэд нээлттэй байж болно. Иймээс хэрэв OpenAI гаралтдаа усны тэмдэг нэмбэл агуулга түгээдэг сошиал медиа платформ зэрэг бусад оролцогчид уг усны тэмдгийг хэрэглэгчдэд ил тод, хэрэгцээтэй болгохын тулд AI-ийн үнэ цэнийн сүлжээ даяар хамтын ажиллагаа шаардлагатай болно. Хэрэв илрүүлэх үйл явц өөрөө нийтэд нээлттэй биш бол түүнд хандах эрх нь бодлогын төвөгтэй асуудал болно. Мөн техникийн сорилтууд бий. Усны тэмдэг нь гарал үүслийг тогтоох бусад аргуудаас арилгахад хэцүү байж болох ч тэмдэглэсэн медиаг тайрах, хэмжээг өөрчлөх эсвэл өөр байдлаар өөрчлөхөд усны тэмдэг нь алдагдаж болно. Эдгээр шалтгааны улмаас усны тэмдгийг ялангуяа зорилготой сөрөг этгээдүүд тойрч гарах боломжтой хэвээр байна. Нэмж дурдахад муу этгээдүүд гаралтаа усны тэмдэглэдэггүй загваруудад хандаж чаддаг тул усны тэмдэглэгээний нөлөө хязгаарлагдмал байж магадгүй.
- Ангилагчид (AI-ээр үүсгэсэн гаралтыг бусад медианаас ялгадаг сургасан загварууд бөгөөд өгөгдсөн гаралтыг аль загвар эсвэл үйлчилгээ үүсгэснийг илрүүлж болно): Үр дүнтэй үедээ эдгээр аргууд нь зураг түгээж буй хүн эсвэл өөр хэн нэгний хамтын ажиллагаанаас хамаардаггүй учраас маш сонирхол татам байдаг. Гэвч тэд алдаа гаргаж болно—хуурамч эерэг болон хуурамч сөрөг аль аль нь—мөн өргөн цар хүрээнд нэвтрүүлэхэд тооцооллын хувьд их нөөц шаарддаг. Жишээлбэл, хуурамч эерэг нь хүний уран бүтээлчийн ажлыг AI-ийн гаралт гэж буруу тодорхойлж магадгүй. Харин хуурамч сөрөг нь бодит байдал дээр AI-ээр үүсгэсэн байхад зургийг AI бус гэж буруу тэмдэглэж магадгүй.
- Мета өгөгдөлд суурилсан аргууд(C2PA(шинэ цонхонд нээгдэнэ)-ийн одоогийн стандарт зэрэг): Эдгээр аргын үед тодорхой медиаг дагалдах мета өгөгдөлд тухайн медиагийн гарал үүслийг баталгаажуулахын тулд криптограф гарын үсэг зурдаг.
Энэ нь AI-ээр үүсгэсэн эсэхээс үл хамааран медиагийн гарал үүслийг нотлохыг хүсдэг хүмүүст боломж олгож чадна. Жишээлбэл, C2PA нь мэдээний нийтлэгчид тодорхой зураг эсвэл видеог үнэхээр өөрсдөө нийтэлсэн, мөн тэр зураг эсвэл видеоны үнэн зөвийг баталж байгаагаа харуулах, харин үзэгчид үүнийг баталгаажуулах боломж олгож болно. Үүнтэй адил, үүсгэгч AI системд хэрэгжүүлбэл энэ арга нь уран бүтээлчид тодорхой синтетик зураг эсвэл видеог өөрсдөө үүсгэсэн гэдгээ харуулахад тусалж чадна. Эдгээр аргын илэрхий давуу тал нь хэрэглэгчид эсвэл олон нийтэд агуулгын гарал үүслийн талаар харагдах байдал олгодогт оршино. Нэмж хэлэхэд, хэрэгжүүлэхэд ихээхэн нөөц шаардахгүй давуу талтай.
Гэвч суурь зураг эсвэл видеоны мета өгөгдлийг амархан устгаж болдог тул энэ арга нь үүсгэсэн агуулгыг бодит мэт харагдуулахыг хүсдэг муу этгээдүүдэд (жишээлбэл худал мэдээллийн кампанит ажил явуулдаг хүмүүс) бодитой саад тотгор үүсгэдэггүй.
Мета өгөгдөлд суурилсан аргууд олон нийтэд өргөн ашиг тусаа өгөхийн тулд браузер болон түгээлтийн платформууд, тухайлбал сошиал медиа платформууд мета өгөгдлийг илрүүлж, харуулах шаардлагатай. Иймээс мета өгөгдөлд суурилсан аргуудыг амжилттай хэрэгжүүлэхийн тулд үнэ цэнийн сүлжээ даяарх хамтын ажиллагаа шаардлагатай: Зөвхөн дуу дүрсний материалд криптографаар гарын үсэг зурсан мета өгөгдөл байх нь хангалтгүй, харин түгээлтийн платформууд тухайн мета өгөгдлийг илрүүлж, эцсийн хэрэглэгч медиагийн гарал үүслийг баталгаажуулахын тулд түүнийг харуулах чадвартай байх ёстой.
Гарал үүслийг тогтоох арга бүр давуу болон хязгаарлалтаа дагуулдаг тул OpenAI нь AI-ээр үүсгэсэн дуу дүрсний медиагийн гарал үүслийг тогтоох олон төрлийн хандлагыг судалж ирсэн.
Энэ оны 1-р сарын 15-нд OpenAI манай текстээс зураг үүсгэдэг DALL·E 3 загварыг ашиглан үүсгэсэн зургуудад C2PA мета өгөгдлийн аргыг хэрэгжүүлэхээ зарласан. C2PA-ийн тодорхойлолтууд нь нийтлэгчид, бүтээгчид, хэрэглэгчдэд төрөл бүрийн медиагийн гарал үүслийг мөрдөх боломж олгодог нээлттэй техникийн стандарт юм.
Эдгээр тодорхойлолт нь файлд мета өгөгдөл хавсаргах боломж олгодог. Энэ мета өгөгдөл нь зургийн эх сурвалж (манай тохиолдолд зураг DALL·E-ээс гарсан гэдэг) болон үүсгэсэн цагийн тухай мэдээллийг агуулдаг. Олон нийтийн гишүүд энэ мета өгөгдлийг шалгаж болох бөгөөд хэрэв мета өгөгдөл байвал тухайн зураг DALL·E 3-аар үүсгэсэн болохыг баталгаажуулж чадна.
Энэ нь DALL·E 3 ашиглан үүсгэсэн зургийнхаа гарал үүслийг хэрэглэгчид илэрхийлэх боломжийг нэмэгдүүлэхэд бидэнд тусална. Гэвч энэ мета өгөгдлийг харьцангуй амархан устгаж болно: зорилготой муу этгээд ямар ч зургийг дагалдах C2PA мета өгөгдлийг устгаж чадна. Нэмж дурдахад сошиал медиа платформ зэрэг түгээмэл зураг хуваалцах платформууд одоогоор үүнийг илрүүлж хэрэглэгчдэд үзүүлэхийн оронд анхдагчаар устгадаг. C2PA-г ийм амархан устгаж болдог тул олон нийт үзэж буй DALL·E зураг бүр заавал ийм өгөгдөлтэй байна гэж үзэж болохгүй.
Гэхдээ C2PA нь зөвхөн AI зургуудын төлөө биш бөгөөд илүү өргөнөөр нэвтрүүлбэл чухал ашиг тустай байж болно. Үүнийг мөн камер үйлдвэрлэгчид, мэдээний байгууллагууд болон бусад талууд зургууд хаанаас гарсныг батлахын тулд нэвтрүүлж байна. Ил тод болгох аргуудыг илүү өргөн нэвтрүүлэх, мөн хэрэглэгчдийг эдгээр дохиог хайж сурахад уриалах нь дижитал мэдээллийн итгэл даахуйц байдлыг нэмэгдүүлэх чухал алхам гэж бид үзэж байна.
2023 оны 10-р сарын 19-нд бид DALL·E 3 системээр үүсгэсэн зургуудыг илрүүлэх шинэ дотоод хэрэгсэл болох гарал үүслийн ангилагч дээр үргэлжилж буй ажлаа зарласан. Бид ангилагчийн нарийвчлалыг дотоод жишиг үзүүлэлтээр хэмждэг бөгөөд тэдгээр нь тайрах, хэмжээг өөрчлөх, JPEG шахалт хийх, эсвэл бодит зургаас авсан текст эсвэл хэсгүүдийг үүсгэсэн зургийн багахан хэсэг дээр давхарлан байрлуулах зэрэг түгээмэл өөрчлөлтөд орсон үед ч найдвар төрүүлэхүйц үр дүн үзүүлсэн. Дотоод туршилтаар ийм хүчтэй үр дүн гарсан ч ангилагч нь зөвхөн тухайн зураг DALL·E-ээр үүсгэсэн байх магадлалтайг л хэлж чадна, одоогоор эцсийн дүгнэлт хийх боломж олгохгүй байна.
Бид ангилагчийнхаа бат бөх байдлыг үргэлжлүүлэн туршиж байгаа бөгөөд 2024 оны эхний улиралд санал авахын тулд үүнийг гаднын түншүүдэд нээлттэй болгохоор төлөвлөж байна. Ирэх жилд бид сонгогдсон гаднын талуудыг гүйцэтгэл, ашиг тусыг нь хамтран үнэлэхэд урин оролцуулж, зургийн ангилагчтай холбоотой туршилтуудаа өргөжүүлж эхлэхийг тэсэн ядан хүлээж байна.
Энэ ангилагч нь тухайн загварт тохируулсан тул зөвхөн зураг DALL·E-ээр үүсгэсэн байх магадлалтай эсэхийг л ангилж чадна. Тиймээс ангилалт нь бүрэн зөв байсан ч өөр нэгэн үүсгэгч хэрэгслээр зураг үүсгэсэн эсэхийг тодорхойлоход ашиглах боломжгүй.
Энэ чиглэл дэх таны ажил үргэлжилж буй энэ үед тантай хамтран ажиллах боломжийг бид талархан хүлээн авч байна.
Хүндэтгэсэн,
Anna Adeola Makanju
Олон улсын харилцаа хариуцсан дэд ерөнхийлөгч
OpenAI
Хөл тэмдэглэлүүд
- A
Frontier Model Forum-ын улаан багийн тодорхойлолт(шинэ цонхонд нээгдэнэ)-ыг үзнэ үү.
- B
Бид “мэргэжилтэн” гэсэн нэр томьёог олон төрлийн салбарын мэдлэг болон амьд туршлагаар бүрдсэн мэдлэгийг илэрхийлэхэд ашигладаг.