Үндсэн агуулга руу алгасах
OpenAI

2025 оны наймдугаар сарын 5

НийтлэлАюулгүй байдал

gpt-oss-120b ба gpt-oss-20b загварын карт

Танилцуулга

Бид Apache 2.0 лиценз болон манай gpt-oss хэрэглээний бодлогын хүрээнд ашиглах боломжтой, нээлттэй жинтэй сэтгэн бодох хоёр загвар болох gpt-oss-120b болон gpt-oss-20b-ийг танилцуулж байна. Нээлттэй эхийн хамтын нийгэмлэгийн санал хүсэлтэд тулгуурлан хөгжүүлсэн эдгээр зөвхөн текстэн загварууд нь манай Responses API-тай нийцдэг бөгөөд зааврыг өндөр түвшинд дагах, вэб хайлт болон Python код ажиллуулах зэрэг хэрэгсэл ашиглах, мөн нарийн төвөгтэй сэтгэн бодох шаардлагагүй даалгаварт сэтгэн бодох хүчин чармайлтын түвшинг тохируулах чадвар зэрэг сэтгэн бодох боломжуудтай агент ажлын урсгалд ашиглагдахаар бүтээгдсэн. Эдгээр загварууд нь өөрчлөн тохируулах боломжтой, бүрэн бодлын хэлхээ (CoT)-г өгдөг бөгөөд Бүтцийн гаралтыг дэмждэг.

Аюулгүй байдал бол нээлттэй загварт хандах манай арга барилын суурь юм. Эдгээр нь өмчийн загваруудаас өөр эрсдэлийн төлөвтэй: Нэгэнт гарсны дараа шийдэмгий халдагчид аюулгүй байдлын татгалзлыг тойрон гарахаар тэдгээрийг нарийн тааруулах, эсвэл OpenAI нэмэлт бууруулах арга хэмжээ хэрэгжүүлэх, эсвэл хандалтыг цуцлах боломжгүй нөхцөлд шууд хор нөлөөг оновчлох боломжтой.

Зарим нөхцөлд хөгжүүлэгчид болон байгууллагууд манай API болон бүтээгдэхүүнээр дамжуулан хүргэгддэг загваруудад суурилуулсан системийн түвшний хамгаалалтыг дахин бүрдүүлэхийн тулд нэмэлт хамгаалалт хэрэгжүүлэх шаардлагатай болно. Бид энэ баримт бичгийг системийн карт гэхээсээ илүү загварын карт гэж нэрлэж байна. Учир нь gpt-oss загварууд нь олон төрлийн оролцогчдын бүтээж, хадгалдаг маш өргөн хүрээний системийн нэг хэсэг болгон ашиглагдана. Загварууд нь анхдагчаар OpenAI-ийн аюулгүй байдлын бодлогыг дагахаар бүтээгдсэн ч бусад оролцогч талууд эдгээр системийг хэрхэн аюулгүй байлгах талаар өөрсдийн шийдвэрийг мөн гаргаж, хэрэгжүүлэх болно.

Бид gpt-oss-120b дээр өргөтгөх боломжтой чадамжийн үнэлгээ хийж, анхдагч загвар нь манай Preparedness Framework-ийн хянадаг гурван ангиллын алинд нь ч Өндөр чадамжийн зааг түвшинд хүрэхгүй гэдгийг баталсан (Биологи ба химийн чадамж, Кибер чадамж, мөн AI өөрийгөө сайжруулах). Бид мөн хоёр нэмэлт асуултыг судалсан:

  • Сөрөг санаатай этгээдүүд gpt-oss-120b-ийг нарийн тааруулж, Биологи ба химийн эсвэл Кибер хүрээнд Өндөр чадамжид хүргэж чадах уу? Халдагчийн болзошгүй үйлдлийг дуурайлган, бид эдгээр хоёр ангиллын хувьд gpt-oss-120b загварыг сөрөг зорилготойгоор нарийн тааруулсан. OpenAI-ийн Safety Advisory Group (“SAG”) энэ туршилтыг хянаж үзээд, OpenAI-ийн салбартаа тэргүүлэх сургалтын стек ашигласан бат бөх нарийн тааруулалт хийсэн ч gpt-oss-120b нь Биологи ба химийн эрсдэл эсвэл Кибер эрсдэлд Өндөр чадамжид хүрээгүй гэж дүгнэсэн.
  • gpt-oss-120b-ийг гаргах нь нээлттэй суурь загварууд дахь биологийн чадамжийн хил хязгаарыг мэдэгдэхүйц урагшлуулах уу? Бид хариулт нь үгүй гэдгийг тогтоосон: Ихэнх үнэлгээн дээр одоо байгаа нэг буюу хэд хэдэн нээлттэй загварын анхдагч гүйцэтгэл нь gpt-oss-120b-ийн сөрөг зорилготойгоор нарийн тааруулсан гүйцэтгэлтэй бараг дөхөж очиж байна.

Энэхүү нээлтийн хүрээнд OpenAI нь үр өгөөжтэй AI-ийг хөгжүүлэх, мөн экосистем даяарх аюулгүй байдлын стандартыг дээшлүүлэх амлалтаа дахин нотолж байна.