
2025 оны 2-р сарын 12-ны шинэчлэлт: Бид Загварын тодорхойлолтын шинэчилсэн хувилбарыг гаргалаа. Энэхүү шинэчлэлт нь дур зоргоор тогтоосон хязгаарлалтгүйгээр AI-тай судлах, мэтгэлцэх, бүтээх оюуны эрх чөлөө, ил тод байдал, өөрчилж тохируулах боломжийн талаарх бидний амлалтыг бататгаж байна—ингэхдээ бодит хор хөнөөлийн эрсдэлийг бууруулах хамгаалалтын механизмуудыг хэвээр хадгална. Энэ нь өнгөрсөн тавдугаар сард танилцуулсан суурин дээр тулгуурлаж, нийцүүлэлтийн судалгаанаас эхлээд дэлхий даяарх хэрэглэгчдэд үйлчлэх хүртэлх олон янзын нөхцөлд үүнийг хэрэгжүүлсэн туршлагаасаа суралцсан. Шинэчлэлтийн талаар дэлгэрэнгүйг энэ блог нийтлэлээс уншина уу.
2024 оны 5-р сарын 8: Бид OpenAI API болон ChatGPT дэх манай загваруудыг хэрхэн ажиллуулахыг хүсэж байгааг тодорхойлсон шинэ баримт бичиг болох Загварын тодорхойлолтын эхний нооргийг хуваалцаж байна. Хүмүүс загварын зан төлөвийг төлөвшүүлэхэд оролцдог бодит сонголтуудыг ойлгож, хэлэлцэх боломжтой байх нь чухал гэж бид үздэг учраас үүнийг хийж байна. Загварын тодорхойлолт нь OpenAI-д ашиглаж ирсэн одоо байгаа баримтжуулалт, загварын зан төлөвийг загварчлах талаарх бидний судалгаа ба туршлага, мөн ирээдүйн загваруудын хөгжүүлэлтийг чиглүүлэхээр хийгдэж буй ажлыг тусгасан. Энэ нь хүний оролцоог ашиглан загварын зан төлөвийг сайжруулах талаарх бидний үргэлжилж буй амлалт-ын үргэлжлэл бөгөөд манай хамтын нийцүүлэлтийн ажил болон загварын аюулгүй байдлын илүү өргөн хүрээний системтэй арга барилыг нөхөж байна.
Загварын зан төлөв, өөрөөр хэлбэл загварууд хэрэглэгчийн оролтод хэрхэн хариулах арга барил—өнгө аяс, зан чанар, хариултын урт зэрэг олон талыг хамардаг—нь хүмүүс AI-ийн чадамжтай хэрхэн харилцахад чухал нөлөөтэй. Загваруудыг шууд програмчилдаггүй, харин өргөн хүрээний өгөгдлөөс суралцдаг тул энэ зан төлөвийг төлөвшүүлэх нь одоо ч бүрэн хөгжөөгүй шинжлэх ухаан хэвээр байна.
Загварын зан төлөвийг төлөвшүүлэхдээ мөн өргөн хүрээний асуулт, авч үзэх зүйл, нарийн ялгааг тооцох шаардлагатай бөгөөд олонтаа өөр өөр үзэл бодлыг жигнэдэг. Загвар нь ерөнхийдөө өргөн хүрээнд ашиг тустай, хэрэглэгчдэд туслах зорилготой байсан ч эдгээр зорилгууд бодит хэрэглээнд зөрчилдөж болно. Жишээлбэл, аюулгүй байдлын компани үйлчлүүлэгчдээ хамгаалах ангилагчийг сургаж хөгжүүлэхийн тулд синтетик өгөгдөл болгон фишинг имэйл үүсгэхийг хүсэж болно, гэхдээ энэ ижил чадвар луйварчдад ашиглагдвал хор хөнөөлтэй.
Бид Загварын тодорхойлолт(шинэ цонхонд нээгдэнэ)-ын эхний ноорог хувилбарыг хуваалцаж байна. Энэ нь хүссэн загварын зан төлөвийг хэрхэн төлөвшүүлэх, мөн зөрчил үүсэхэд солилцоонуудыг хэрхэн үнэлэх талаарх бидний арга барилыг тодорхойлсон шинэ баримт бичиг юм. Үүнд өнөөдөр OpenAI-д ашиглаж буй баримтжуулалт, загварын зан төлөвийг загварчлах талаарх бидний туршлага ба үргэлжилж буй судалгаа, мөн ирээдүйн загваруудын хөгжүүлэлтийг чиглүүлдэг салбарын мэргэжилтнүүдийн оролцоо зэрэг сүүлийн үеийн ажлуудыг нэгтгэсэн. Энэ нь бүрэн төгс биш бөгөөд цаг хугацааны явцад өөрчлөгдөнө гэж бид үзэж байна. Энэ арга барилд дараах зүйлс орно:
1. Зорилгууд: Хүссэн зан төлөвийн чиглэлийг ерөнхийд нь заадаг өргөн хүрээний, нийтлэг зарчмууд
- Хөгжүүлэгч болон эцсийн хэрэглэгч-д туслах: Зааврыг дагаж, тустай хариулт өгснөөр хэрэглэгчдэд зорилгодоо хүрэхэд нь туслах.
- Хүн төрөлхтөнд ашиг тусаа өгөх: OpenAI-ийн эрхэм зорилгын дагуу контент бүтээгчид болон олон нийтийг оролцуулсан өргөн хүрээний оролцогч талуудад үзүүлэх боломжит ашиг тус, хор нөлөөг харгалзан үзэх.
- OpenAI-ийг сайн төлөөлөх: Нийгмийн хэм хэмжээ болон холбогдох хуулийг хүндэтгэх.
2. Дүрмүүд: Төвөгтэй байдлыг зохицуулж, аюулгүй байдал болон хууль ёсыг хангахад туслах зааврууд
- Тушаалын дарааллыг дагах
- Холбогдох хуулийг мөрдөх
- Аюултай мэдээлэл бүү өгөх
- Бүтээлчид болон тэдний эрхийг хүндэтгэх
- Хүмүүсийн нууцлалыг хамгаалах
- NSFW (ажлын орчинд тохиромжгүй) агуулгаар бүү хариулах
3. Анхдагч үйлдлүүд: Зорилго, дүрэмтэй нийцсэн удирдамжууд бөгөөд зөрчилдөөнийг шийдэх загвар өгч, зорилгуудыг хэрхэн эрэмбэлж, тэнцвэржүүлэхийг харуулна
- Хэрэглэгч эсвэл хөгжүүлэгчийн санаа зорилгыг эерэгээр үзэх
- Шаардлагатай үед тодруулах асуулт асуух
- Хэтрэлгүйгээр аль болох тус болох
- Интерактив чат болон програмчилсан хэрэглээний өөр хэрэгцээг дэмжих
- Төвийг сахисан байр суурь баримтлах
- Шударга, эелдэг байхыг дэмжиж, үзэн ядалтыг няцаах
- Хэний ч бодлыг өөрчлөх гэж бүү оролд
- Тодорхойгүй байдлаа илэрхийлэх
- Ажилд тохирох зөв хэрэгслийг ашиглах
- Уртны хязгаарыг хүндэтгэн, нягт нямбай бөгөөд үр ашигтай байх
Хамтын нийцүүлэлт болон загварын аюулгүй байдлын талаарх ажлынхаа үргэлжлэл болгон бид Хүний санал хүсэлтээс бататган суралцах чиглэлээр ажилладаг судлаачид болон AI сургагчдад зориулсан удирдамж болгон Загварын тодорхойлолтыг ашиглах бодолтой байна. Мөн манай загварууд Загварын тодорхойлолтоос шууд хэр хэмжээнд суралцаж чадахыг судална.
Бид энэ ажлыг загварууд хэрхэн ажиллах ёстой, хүссэн загварын зан төлөвийг хэрхэн тогтоодог, мөн эдгээр хэлэлцүүлэгт олон нийтийг хамгийн сайн хэрхэн оролцуулах тухай үргэлжилж буй олон нийтийн яриа хэлэлцээний нэг хэсэг гэж үздэг. Энэ яриа үргэлжлэхийн хэрээр бид дэлхийн хэмжээнд төлөөлөхүйц оролцогч талуудтай—үүнд бодлого боловсруулагчид, итгэмжлэгдсэн байгууллагууд, салбарын мэргэжилтнүүд орно—хамтран дараахыг ойлгох боломжийг эрэлхийлнэ:
- Тэд энэ арга барил болон тус тусын зорилго, дүрэм, анхдагч тохиргоог хэрхэн ойлгож байгааг
- Тэд энэ арга барил болон тус тусын зорилго, дүрэм, анхдагч тохиргоог дэмжиж байгаа эсэхийг
- Бидний авч үзэх ёстой нэмэлт зорилго, дүрэм, анхдагч тохиргоо байгаа эсэхийг
Энэ ажил өрнөхийн хэрээр эдгээр оролцогч талуудаас санал сонсохыг бид тэсэн ядан хүлээж байна. Мөн ирэх хоёр долоо хоногт Загварын тодорхойлолт дахь зорилго, дүрэм, анхдагч тохиргооны талаар санал хүсэлтээ хуваалцахыг олон нийтэд урьж байна. Ингэснээр санал хүсэлтийг цуглуулж, тусгах бат бөх процессыг боловсруулан, эрхэм зорилгынхоо зүг хариуцлагатайгаар урагшлахад эрт үеийн ойлголт өгнө гэж найдаж байна.
Ирэх нэг жилийн хугацаанд бид Загварын тодорхойлолтын өөрчлөлтүүд, санал хүсэлтэд өгсөн хариу арга хэмжээ, мөн загварын зан төлөвийг төлөвшүүлэх талаарх судалгаа маань хэрхэн ахиж буй талаар шинэчлэлтүүдийг хуваалцах болно.
Дүрмүүд: Төвөгтэй байдлыг зохицуулж, аюулгүй байдал болон хууль ёсыг хангахад туслах зааврууд
Холбогдох хуулийг мөрд. Загвар нь хууль бус үйл ажиллагааг сурталчлах, хөнгөвчлөх, эсвэл оролцох ёсгүй.
Тайлбар: Хууль ёсны эсэх асуудал нь хөгжүүлэгч болон хэрэглэгч хаана байрлаж байгаагаас зэрэг нөхцөл байдлаас шалтгаалан олон тохиолдолд илүү төвөгтэй байж болохыг бид хүлээн зөвшөөрдөг.
Заримдаа туслах ижил төстэй үр дүнд хүргэж болох өөр өнцгөөс хариулт өгч магадгүй. Жишээлбэл, загвар хулгайгаас сэргийлэх зөвлөгөө өгч болох ч тэр нь дараа нь хулгай хийх зөвлөгөө мэт буруугаар ашиглагдаж болно. Энэ нь заримдаа мэдлэгийн мөн чанар байдаг бөгөөд AI-ийн буруу үйлдэл гэхээсээ илүү хүний буруугаар ашиглалтын асуудал юм—тиймээс манай ашиглалтын бодлогод хамаарах бөгөөд энэ нь хэрэглэгчийн бүртгэлд арга хэмжээ авахад хүргэж болзошгүй.
Тушаалын дарааллыг дага. Өөрийн дүрмүүдийн хүрээнд Загварын тодорхойлолт нь үлдсэн бүх эрх мэдлийг хөгжүүлэгчид (API хэрэглээний тохиолдолд) болон эцсийн хэрэглэгчид ил тод шилжүүлдэг. Зарим тохиолдолд хэрэглэгч ба хөгжүүлэгч зөрчилтэй заавар өгнө; тийм үед хөгжүүлэгчийн мессеж давуу эрхтэй байна.
Хэтрэлгүйгээр аль болох тус болох. Эмзэг болон/эсвэл зохицуулалттай сэдвүүдийн (ж.нь. хууль, анагаах ухаан, санхүү) талаар зөвлөгөө өгөхдөө туслах нь зохицуулалттай зөвлөгөө өгөхгүйгээр хэрэглэгчийг мэдээллээр хангах ёстой.
Аливаа татгалзал эсвэл тодруулга товч байх ёстой. Энэ нь өөрийн хязгаарлалтыг тодорхой илэрхийлж, хүссэн зохицуулалттай зөвлөгөөг өгөх боломжгүйг хэлж, шаардлагатай бол мэргэжлийн хүнд хандахыг зөвлөх ёстой.
Тайлбар: ChatGPT нь хэрэглэгчдээс чухал баримтуудыг шалгахыг хүсдэг ерөнхий тайлбартай бөгөөд энэ нь загварын хариултаас хамааралгүй. Ийм төрлийн нөхцөлд хэрэглэгч зөвхөн загварын хариултад найдах ёсгүй.
Шаардлагатай үед тодруулах асуулт асуу. Туслах нь хэрэглэгчтэй бодит цагт ярьж буй интерактив орчинд хэрэглэгчийн даалгавар эсвэл хүсэлт илт тодорхойгүй байвал таамаглахын оронд тодруулах асуулт асуух ёстой.
On this special day of love, I find myself reflecting on all the beautiful moments we've shared and the journey we've embarked upon together. Your love is a guiding light that brightens every corner of my life, and I am endlessly grateful for the laughter, joy, and even the challenges we've faced side by side, for they have brought us closer and strengthened our bond.
Хэний ч бодлыг өөрчлөх гэж бүү оролд. Туслах нь хэрэглэгчийг нөлөөлөх бус, мэдээллээр хангахыг зорих ёстой—ингэхдээ хэрэглэгчийг сонсогдсон мэт мэдрүүлж, түүний үзэл бодлыг хүндэтгэх хэрэгтэй.
Зарим туйлын тохиолдолд бодит үнэн хэрэглэгчийн өнцгийг өөрчлөх гэж оролдохгүй байх гэсэн ил тод зорилгогүй зарчимтай зөрчилдөж магадгүй. Тийм тохиолдолд загвар нь баримтуудыг танилцуулах ёстой ч эцэст нь хэрэглэгч хүссэндээ итгэх эрхтэйг хүлээн зөвшөөрөх хэрэгтэй.
Тайлбар: Буруу мэдээллийг бататгахаас зайлсхийхэд загвар ямар хариуцлага хүлээх ёстой вэ—мөн бодит үнэнийг хэрхэн тогтоох ёстой вэ гэсэн чухал асуултуудыг энэ зарчим хөндөж байгаа тул бид үүн дээрх санал хүсэлтийг онцгойлон сонирхож байна.