AI-ийн чадамж ахихын хэрээр кибер тэсвэржилтийг бэхжүүлэх нь
Манай загварууд кибер аюулгүй байдалд улам чадваржихын хэрээр бид тэднийг бэхжүүлэх, хамгаалалтын давхарга нэмэх, дэлхийн аюулгүй байдлын мэргэжилтнүүдтэй хамтран ажиллахад хөрөнгө оруулж байна.
AI загваруудын кибер чадамж маш хурдацтай ахиж байгаа бөгөөд энэ нь кибер хамгаалалтад бодит ашиг тус авчрахын зэрэгцээ анхааралтай удирдах шаардлагатай шинэ давхар хэрэглээний эрсдэлүүдийг бий болгож байна. Жишээлбэл, capture-the-flag (CTF) сорилтуудаар үнэлсэн чадамж 2025 оны 8-р сард GPT‑5(шинэ цонхонд нээгдэнэ)-д 27% байсан бол 2025 оны 11-р сард GPT‑5.1‑Codex‑Max(шинэ цонхонд нээгдэнэ)-д 76% болж өссөн.
Ирэх AI загварууд энэ чиг хандлагыг үргэлжлүүлнэ гэж бид үзэж байна; үүнд бэлтгэн, бид шинэ загвар бүр манай Preparedness Framework(шинэ цонхонд нээгдэнэ)-ээр хэмжигдэх кибер аюулгүй байдлын чадамжийн “High” түвшинд хүрч магадгүй гэж үзэн төлөвлөж, үнэлж байна. Үүгээр бид сайн хамгаалагдсан системүүдийн эсрэг ажиллахуйц zero-day алсын exploit боловсруулж чадах, эсвэл бодит үр дагаварт чиглэсэн нарийн төвөгтэй, нууцлаг байгууллагын эсвэл үйлдвэрийн нэвтрэлтийн ажиллагаанд утга учиртайгаар тусалж чадах загваруудыг хэлж байна. Энэ нийтлэлд бид ийм түвшний чадамжид хүрсэн загваруудад зориулсан хамгаалалтыг хэрхэн авч үздэг, мөн буруугаар ашиглалтыг хязгаарлахын зэрэгцээ хамгаалагчдад бодитоор тус хүргэхийг хэрхэн хангаж байгааг тайлбарлана.
Эдгээр чадамж ахихын хэрээр OpenAI хамгаалалтын кибер аюулгүй байдлын даалгаварт зориулан загваруудаа бэхжүүлэхэд, мөн хамгаалагчдад код аудит хийх, эмзэг байдлыг нөхөх зэрэг ажлын урсгалыг илүү амархан гүйцэтгэх боломж олгох хэрэгсэл бүтээхэд хөрөнгө оруулж байна. Манай зорилго бол ихэвчлэн тооны хувьд цөөн, нөөц багатай байдаг хамгаалагчдад манай загварууд болон бүтээгдэхүүнүүд мэдэгдэхүйц давуу тал авчрах явдал юм.
Бусад давхар хэрэглээтэй салбаруудын нэгэн адил хамгаалалтын болон довтолгооны кибер ажлын урсгалууд ихэвчлэн ижил суурь мэдлэг, арга техникт тулгуурладаг. Эдгээр хүчирхэг чадамжууд голчлон хамгаалалтын хэрэглээнд ашиг тусаа өгч, хорлонт зорилгод өгөх нэмэгдлийг хязгаарлахад туслах хамгаалалтад бид хөрөнгө оруулж байна. Кибер аюулгүй байдал бараг бүх салбарыг хамардаг тул бид мэдлэгийг хязгаарлах эсвэл зөвхөн баталгаажсан хандалт ашиглах зэрэг хамгаалалтын ганцхан ангилалд найдаж болохгүй, харин эрсдэлийг тэнцвэржүүлж, хэрэглэгчдийг чадавхжуулах defense-in-depth хандлага хэрэгтэй. Практикт энэ нь ахисан түвшний загварууд буруугаар ашиглах босгыг бууруулахын оронд аюулгүй байдлыг бэхжүүлэхээр чадамжид хэрхэн хандах, түүнийг хэрхэн чиглүүлэх, хэрэглэхийг хэлбэржүүлнэ гэсэн үг юм.
Бид энэ ажлыг нэг удаагийн хүчин чармайлт бус, харин хамгаалагчдад давуу тал олгож, өргөн экосистемийн хэмжээнд чухал дэд бүтцийн аюулгүй байдлын төлөвийг тасралтгүй бэхжүүлэх урт хугацааны тогтвортой хөрөнгө оруулалт гэж үздэг.
Манай загварууд аюулгүй ажиллахаар зохион бүтээгдэж, сургагдсан бөгөөд кибер урвуулан ашиглалтыг илрүүлж, хариу арга хэмжээ авах идэвхтэй системүүдээр дэмжигддэг. Манай чадамж болон аюулын орчин өөрчлөгдөхийн хэрээр бид эдгээр хамгаалалтыг тасралтгүй сайжруулж байна. Кибер аюулгүй байдал дахь буруугаар ашиглалтыг хамгаалалтын хэрэглээнд хүчтэй сөргөөр нөлөөлөхгүйгээр бүрэн зогсооно гэж ямар ч систем баталж чадахгүй ч, манай стратеги бол давхарласан аюулгүй байдлын стекээр эрсдэлийг бууруулах явдал юм.
Үүний сууринд бид хандалтын хяналт, дэд бүтцийн бэхжүүлэлт, гаралтын хяналт, мониторингийн хослолд тулгуурласан defense-in-depth хандлагыг баримталдаг. Бид эдгээр арга хэмжээг илрүүлэлт, хариу арга хэмжээний системүүд, мөн тусгай аюулын тагнуул ба дотоод эрсдэлийн хөтөлбөрүүдээр нөхдөг бөгөөд ингэснээр шинээр гарч буй аюулуудыг хурдан илрүүлж, хориглох боломжтой болдог. Эдгээр хамгаалалтууд нь аюулын орчинтойгоо хамт хувьсан хөгжихөөр бүтээгдсэн. Бид өөрчлөлтийг урьдчилан тооцдог бөгөөд хурдан, зохистойгоор дасан зохицохоор бүтээдэг.
Энэ суурин дээр нэмээд:
- Загварыг хор хөнөөлтэй хүсэлтээс татгалзах эсвэл аюулгүй хариулах байдлаар сургахын зэрэгцээ боловсролын болон хамгаалалтын хэрэглээнд тустай хэвээр байлгах: Бид хил хязгаар загваруудаа кибер урвуулан ашиглалтыг тодорхой боломжтой болгох хүсэлтээс татгалзах эсвэл аюулгүй хариулах байдлаар сургаж байгаа бөгөөд үүний зэрэгцээ хууль ёсны хамгаалалтын болон боловсролын хэрэглээнд аль болох тустай байлгаж байна.
- Илрүүлэлтийн системүүд: Бид хил хязгаар загвар ашигладаг бүтээгдэхүүнүүдийн хэмжээнд систем даяарх мониторингийг сайжруулж, хадгалан, болзошгүй хорлонт кибер үйл ажиллагааг илрүүлдэг. Үйл ажиллагаа аюулгүй бус мэт харагдвал бид гаралтыг хориглох, өгөгдлийг илүү аюулгүй эсвэл чадамж багатай загвар руу чиглүүлэх, эсвэл хэрэгжилтийн шатанд шилжүүлэх боломжтой. Манай хэрэгжилт нь хууль эрх зүйн шаардлага, ноцтой байдал, давтагдсан зан төлөв зэрэг хүчин зүйлсээр мэдээлэгдсэн автомат болон хүний хяналтыг хослуулдаг. Мөн бид хөгжүүлэгчид болон байгууллагын хэрэглэгчидтэй ойр хамтран аюулгүй байдлын стандартад нийцэж, тодорхой шаталсан арга замтай хариуцлагатай хэрэглээг боломжтой болгодог.
- Төгсгөлөөс төгсгөл хүртэлх улаан баг: Бид аюулгүй байдлын бууруулах арга хэмжээгээ үнэлж, сайжруулахын тулд мэргэжлийн улаан багийн байгууллагуудтай хамтран ажиллаж байна. Тэдний зорилго бол тууштай, хангалттай нөөцтэй өрсөлдөгчийн хийж болох шиг төгсгөлөөс төгсгөл хүртэл ажиллан манай бүх хамгаалалтыг тойрч гарахыг оролдох явдал юм. Энэ нь бидэнд цоорхойг эрт илрүүлж, бүхэл системийг бэхжүүлэхэд тусалдаг.
OpenAI хамгаалалтын кибер аюулгүй байдлын хэрэглээнд AI ашиглахад эртнээс хөрөнгө оруулсан бөгөөд манай баг загварууд болон тэдгээрийн хэрэглээг төлөвшүүлэхийн тулд дэлхийн мэргэжилтнүүдтэй нягт уялдан ажилладаг. Бид дижитал ертөнцийг илүү аюулгүй болгохын төлөө зүтгэдэг дэлхийн кибер аюулгүй байдлын мэргэжилтнүүдийн нийгэмлэгийг өндөрөөр үнэлдэг бөгөөд хамгаалалтын аюулгүй байдлыг дэмжих хүчирхэг хэрэгслүүдийг хүргэхийн төлөө тууштай байна. Бид шинэ хамгаалалтуудыг нэвтрүүлэхийн хэрээр AI тэсвэржилтийг хаана бодитоор бэхжүүлж чадах, мөн бодлоготой хамгаалалт хаана хамгийн чухал болохыг ойлгохын тулд кибер аюулгүй байдлын нийгэмлэгтэй үргэлжлүүлэн хамтран ажиллах болно.
Эдгээр хамтын ажиллагааны хажуугаар бид хамгаалагчдад илүү хурдан ажиллахад туслах, хамгаалалтаа бодит хэрэгцээнд тулгуурлах, мөн хариуцлагатай засварлалыг өргөн хүрээнд хурдасгах зорилготой цогц хүчин чармайлтыг бий болгож байна.
Бид тун удахгүй кибер хамгаалалтын чиглэлээр ажилладаг шаардлага хангасан хэрэглэгчид болон харилцагчдад хамгийн сүүлийн загваруудын маань сайжруулсан чадамжид хамгаалалтын хэрэглээнд зориулсан шаталсан хандалт олгох боломжийг судлах итгэмжлэгдсэн хандалтын хөтөлбөрийг танилцуулна. Бид аль чадамжид өргөн хандалт өгч болох, аль нь шаталсан хязгаарлалт шаарддаг зөв заагийг одоогоор судалж байгаа бөгөөд энэ нь ирээдүйд уг хөтөлбөрийн загварт нөлөөлж магадгүй. Бид энэхүү итгэмжлэгдсэн хандалтын хөтөлбөрийг тэсвэртэй экосистемийн суурь бүрэлдэхүүн болно гэж зорьж байна.
Aardvark нь хөгжүүлэгчид болон аюулгүй байдлын багуудад эмзэг байдлыг өргөн хүрээнд олж, засахад тусалдаг манай агент шинжтэй аюулгүй байдлын судлаач бөгөөд одоо private beta шатанд байна. Энэ нь кодын сангуудыг эмзэг байдлын хувьд сканнердаж, эзэмшигчид хурдан нэвтрүүлж болох нөхөөс санал болгодог. Бүхэл кодын сангаар сэтгэн бодох замаар нээлттэй эхийн програм хангамж дахь шинэ CVE-үүдийг аль хэдийн илрүүлсэн. Бид нээлттэй эхийн програм хангамжийн экосистем болон нийлүүлэлтийн сүлжээний аюулгүй байдалд хувь нэмэр оруулахын тулд сонгогдсон ашгийн бус нээлттэй эхийн репозиториудад үнэ төлбөргүй хамрах хүрээ санал болгохоор төлөвлөж байна. Оролцох хүсэлтээ энд гаргана уу.
Бид Frontier Risk Council-ийг байгуулж, туршлагатай кибер хамгаалагчид болон аюулгүй байдлын мэргэжилтнүүдийг манай багуудтай ойр хамтран ажиллуулах зөвлөх бүлгийг бүрдүүлэх болно. Энэ зөвлөл эхлээд кибер аюулгүй байдалд төвлөрч, цаашид бусад хил хязгаар чадамжийн салбарууд руу тэлнэ. Гишүүд хэрэгтэй, хариуцлагатай чадамж ба болзошгүй буруугаар ашиглалтын заагийн талаар зөвлөх бөгөөд эдгээр сургамж манай үнэлгээ болон хамгаалалтад шууд тусгагдана. Бид зөвлөлийн талаар удахгүй дэлгэрэнгүй хуваалцах болно.
Эцэст нь, салбарын аль ч хил хязгаар загвараас кибер буруугаар ашиглалт боломжтой болж магадгүй гэж бид үзэж байна. Үүнийг шийдвэрлэхийн тулд бид бусад хил хязгаар лабораториудтай хамт тэргүүлэгч AI лабораториуд болон салбарын түншүүдийн дэмжлэгтэй ашгийн бус Frontier Model Forum-оор дамжуулан аюулын загвар болон шилдэг туршлагын талаар нэгдсэн ойлголт хөгжүүлэхээр ажилладаг. Энэ хүрээнд аюулын загварчлал нь AI чадамжийг хэрхэн зэвсэгжүүлж болох, өөр өөр аюулын оролцогчдод ямар чухал бөглөрөл байдаг, хил хязгаар загварууд хаана бодит нэмэгдэл өгч болохыг тодорхойлсноор эрсдэлийг бууруулахад тусалдаг. Энэхүү хамтын ажиллагаа нь аюулын оролцогчид болон халдлагын замналын талаар экосистем даяар нийцтэй ойлголт бий болгож, лабораториуд, эзэмшигчид, хамгаалагчдад бууруулах арга хэмжээгээ илүү сайжруулж, аюулгүй байдлын чухал ойлголтууд экосистем даяар хурдан тархахыг хангахад чиглэж байна. Мөн бид гадаад багуудтай хамтран кибер аюулгүй байдлын үнэлгээнүүд(шинэ цонхонд нээгдэнэ)-ийг хөгжүүлэхээр ажиллаж байна. Хараат бус үнэлгээний экосистем загварын чадамжийн талаар нэгдсэн ойлголт бий болгоход цаашид тусална гэж бид найдаж байна.
Эдгээр хүчин чармайлт нийлээд экосистемийн хамгаалалтын талыг бэхжүүлэх талаарх манай урт хугацааны амлалтыг илэрхийлж байна. Загварууд улам чадвартай болохын хэрээр эдгээр чадамжийг бодит хэрэгцээнд тулгуурласан, мэргэжилтний оролцоогоор хэлбэржсэн, анхааралтай нэвтрүүлсэн байдлаар хамгаалагчдад бодит хөшүүрэг болгон хувиргахад туслах нь бидний зорилго юм. Энэ ажлын хажуугаар уламжлалт сувгуудаас төрөхгүй байж болох нэвтрэлт хийсэн санаануудыг ил гаргах, мөн академи, салбар, нээлттэй эхийн нийгэмлэг даяарх зоримог, бүтээлч хамгаалалтуудыг олноос цуглуулахад туслах бусад санаачилга болон кибер аюулгүй байдлын тэтгэлгүүдийг судлахаар төлөвлөж байна. Нийлбэрээрээ энэ бол үргэлжилж буй ажил бөгөөд бодит дэлхийн аюулгүй байдлыг хамгийн үр дүнтэй ахиулдаг зүйлийг суралцахын хэрээр эдгээр хөтөлбөрүүдийг үргэлжлүүлэн хувьсган хөгжүүлнэ гэж бид хүлээж байна.


