Published: 2023 оны аравдугаар сарын 11

OpenAI-ийн технологийн тайлбар

Ачаалж байна…

Бид хэн бэ

OpenAI нь Ерөнхий хиймэл оюун ухаан—товчоор хэлбэл⁠, хүнтэй дүйцэхүйц ухаалаг AI—бүх хүн төрөлхтөнд ашиг тусаа өгөхийг хангах зорилгоор 2015 онд ашгийн бус байгууллага хэлбэрээр байгуулагдсан. Бид хамгийн сүүлийн үеийн AI⁠ технологи, мөн AI-ийн аюулгүй байдал, нийцүүлэлт, засаглалд зориулсан хэрэгсэл ба шилдэг туршлагыг судалж, хөгжүүлж, гаргадаг. OpenAI өнөөдөр ч ашгийн бус байгууллагаараа удирдуулсаар байна: Бид эрхэм зорилгоо ашгаас дээгүүр тавьдаг, ажилтнууд болон хөрөнгө оруулагчдын санхүүгийн өгөөжийг хязгаарладаг, мөн хязгаараас давсан ирээдүйн ашгийг ашгийн бус байгууллагадаа буцаан шилжүүлнэ. Энэхүү өвөрмөц компанийн бүтэц нь бидэнд бусад технологийн компаниудаас өөр урамшуулал өгдөг. Манай зорилго ямар нэг зүйлийг хамгийн ихээр борлуулах биш, харин хүн бүр AI-ийн нийгэм, эдийн засаг, технологийн боломжуудаас хүртэх дэлхий рүү чиглэн ажиллах явдал юм.

Хүмүүс OpenAI технологийг хэрхэн ашигладаг вэ

OpenAI-ийн эрхэм зорилгын нэг хэсэг болгон бид тэргүүлэх суурь загварууд⁠-ыг хөгжүүлж, тэдгээрийн чадамжийг аюулгүй, өгөөжтэй байдлаар дэлхий даяарх хүмүүст⁠(шинэ цонхонд нээгдэнэ) хүргэдэг. Хүмүүс манай загваруудад хандах хоёр үндсэн арга бий:

ChatGPT бол хүмүүс манай загваруудтай ярианы хэлбэрээр харилцах боломж олгодог апп юм. Хэрэглэгчид манай хэлний загваруудаас текст эсвэл код шинжлэх, бичихийг хүсэж болно, эсвэл манай дүрсний загваруудаас текстэн тайлбар дээр үндэслэн зураг зурахыг хүсэж болно. ChatGPT нь бүх хэрэглэгчдэд chatgpt.com⁠(шинэ цонхонд нээгдэнэ) дээр үнэгүй нээлттэй. Хэрэглэгчид нэмэлт боломж, чадамж нээдэг сар бүрийн дээд зэрэглэлийн захиалгад бүртгүүлж болно, мөн бид бизнесүүд худалдан авах боломжтой байгууллагын хувилбарыг санал болгодог.
Манай API (Application Programming Interface) нь хөгжүүлэгчдэд манай загваруудын чадамж, давуу талыг өөрсдийн аппликейшнд нэгтгэх боломж олгодог. Duolingo, Spotify, Morgan Stanley зэрэг мянга мянган байгууллага манай API-г ашиглан шинэ боломж, аппликейшн, бизнесүүдийг бүтээж байна. Be My Eyes нэртэй Данийн компани манай API-г ашиглан сохор болон хараа сул хэрэглэгчдэд зураг оруулж, түүний талаар асуулт асуухад нь тусалж, ингэснээр тэд бодит орчинд илүү сайн чиг баримжаатай болж, илүү бие даах боломжтой болдог. Манай API нь platform.openai.com⁠(шинэ цонхонд нээгдэнэ) дээр байдаг бөгөөд хөгжүүлэгчид ашигласан хэмжээгээрээ төлбөр төлдөг.

Бид доор дэлгэрэнгүй тайлбарласантай адил өргөн хүрээтэй аюулгүй байдлын арга хэмжээтэй уялдуулан ChatGPT болон манай API-г ашиглах боломжтой болгодог. Мөн бид яриаг текст болгон хөрвүүлдэг Whisper загвар, CLIP нэртэй дүрс ойлголтын загвар зэрэг тодорхой загварууд⁠-ыг ийм гаргалтын болзошгүй эрсдэлийг үнэлсний дараа нээлттэй эхийн үндсэн дээр гаргадаг.

Бид ChatGPT‑ийг цаашид ч үнэгүй байлгахыг зорьж байгаа бөгөөд дээд зэрэглэлийн үйлчилгээний төлбөр төлөхөөр сонгосон хэрэглэгчид болон бизнесүүдээс орлого олно. Том хэмжээний суурь загваруудыг хөгжүүлж, санал болгох өртөг өндөр байдаг тул манай байгууллага ашигтай ажилладаггүй бөгөөд ойрын ирээдүйд ашигтай ажиллана гэж хүлээхгүй байна—манай зорилго AI-ийн өгөөжийг дэлхий даяар өргөн хүрээнд, аюулгүйгээр хүртээмжтэй болгох хэвээр байна.

OpenAI манай тэргүүлэх суурь загваруудад хандах боломжийг үндсэндээ ChatGPT болон манай API-аар дамжуулан олгодог.

Бид суурь загваруудыг хэрхэн хөгжүүлдэг вэ

GPT‑4 шиг дэвшилтэт хэлний загвар боловсруулахын тулд (1) таамаглах, учир шалтгааныг тунгаах, асуудал шийдэх чадвар зэрэг оюуны чадамжийг нь суулгах, мөн (2) хүний үнэт зүйлс ба сонголтод нийцүүлэх шаардлагатай. Эхнийхийг нь “урьдчилсан сургалт” гэж нэрлэдэг үйл явцаар хийдэг бөгөөд энэ үеэр загварт олон сарын турш хүний асар их мэдлэгийг үзүүлдэг. Дараа нь хүний сонголтыг загварт шингээхийн тулд бид “дараах сургалт” гэж нэрлэдэг хоёр дахь алхмыг ашиглаж, загварыг илүү аюулгүй, хэрэглэхэд илүү тохиромжтой болгодог.

Урьдчилсан сургалт нь загварт хэлийг заадаг. Үүний тулд загварт маш өргөн хүрээний текст үзүүлж, олон янзын асар олон дараалал бүрт дараагийн үгийг таамаглуулахыг оролдуулдаг. Ингэхэд загварууд их наяд үгийг хянаж, шинжилж, түүнээс суралцдаг тул асар их тооцоолол шаардагдана. Бид суурь загваруудаа сургахын тулд суперкомпьютер бүтээдэг бөгөөд нэг шинэ суурь загвар сургах нь суперкомпьютерийг хэдэн сарын турш бүрэн ашиглуулж болно. Энэ өргөн цар хүрээтэй үйл явцаар загвар нь үгс дүрмийн хувьд хэрхэн холбогддогийг төдийгүй үгс хамтран илүү дээд түвшний санаа хэрхэн бүрдүүлдгийг, эцэст нь үгийн дараалал бүтэцтэй бодол эсвэл уялдаатай асуудлыг хэрхэн үүсгэдгийг сурдаг. Жишээлбэл, бид “үүл” гэдэг үгийг бодоход “тэнгэр”, “бороо” зэрэг холбоотой үгс санаанд орж магадгүй; харин “Аз жаргалын нууц бол” гэх өгүүлбэр өгвөл янз бүрийн гүн ухааны санаа бодогдож болно. Дараагийн үгийг таамаглах чадвар эзэмших явцдаа загвар ингэснээр ойлголтууд болон оюуны үндсэн барилгын блокуудыг сурдаг.

Энэ үйл явцын үр дүн болох суурь загвар нь сургалтын өгөгдөлдөө байгаагүй шинэ асуудлуудыг, тэр ч байтугай олон хэл дээр, шийдэх онцгой чадвартай болдог. Гэвч суурь загвар дангаараа шууд ашиглахад бэлэн биш. Суурь загварууд хүчирхэг, уян хатан. Тэд ухаалаг бөгөөд гайхмаар ч заавал хэрэгтэй эсвэл аюулгүй байдаггүй.

Суурь загвартай харилцах амаргүй. Жишээлбэл, хэрэв та GPT‑4 суурь загвараас “гүнжийн тухай өгүүллэг бич...” гэж хүсвэл тэр ихэвчлэн өгүүллэг бичихгүй. Харин таны өгүүлбэрийг цааш нь үргэлжлүүлж, хэрхэн үргэлжлэхийг таамаглана. Тухайлбал, “...моринд дуртай гүнжийн тухай.” гэж гаргаж магадгүй. Суурь загварт мөн үзэн ядсан эсвэл хүчирхийлэлтэй материал зэрэг хүсээгүй агуулга гаргахаас сэргийлэх хамгаалалт байдаггүй. Бид урьдчилсан сургалтын өгөгдлөө хүсээгүй агуулгаас шүүдэг ч энэ арга нь загварт чиглэсэн өөрчлөлт хийхэд хэтэрхий нарийвчлалгүй бөгөөд загвар юуг хэлж эсвэл хийж болохгүйг ойлгоход нь саад болж, бүр сөрөг нөлөө үзүүлж болно. Загваруудад хүний үнэт зүйлсийг, үүнд юу хэрэгтэй болон юу хэлэх нь зохистойг багтаан суулгахын тулд бид дараах сургалт гэж нэрлэдэг үйл явцын нийцүүлэлт ба аюулгүй байдлын аргуудыг судалж, хөгжүүлдэг.

Дараах сургалт нь бидний загваруудад хүний сонголтыг шингээж, тэднийг хэрэгтэй, үр дүнтэй, илүү аюулгүй хэрэгсэл болгон хувиргадаг арга юм. Бид загварыг хүмүүс илүү хэрэгтэй гэж үзэх байдлаар хариулах, мөн хор хөнөөл учруулж болзошгүй гэж бидний үзсэн байдлаар хариулахаас татгалзахыг заадаг. Дараах сургалт нь судалгаа, боловсон хүчин, дизайны сонголт, өгөгдөл бүтээхэд ихээхэн хөрөнгө оруулалт шаарддаг. Энэ бол OpenAI-ийн хувьд идэвхтэй судалгаа, хөрөнгө оруулалтын чиглэл юм. Мөн манай компаниас гаднах олон хүн⁠ хүний үнэт зүйлсийг тусгах өгөгдөл бий болгох, дизайны шийдвэр гаргах ажилд оролцоно гэдэгт бид итгэдэг.

Дараах сургалт нь хүссэн зан үйлийг төлөөлөх харьцангуй бага, нягт нямбай боловсруулсан өгөгдлийн багцыг ашиглан загварт чиглэсэн өөрчлөлтүүдийг бий болгодог. Үүнийг хийхдээ бид хүмүүсээр жишиг хариулт бичүүлж, загварын өгсөн хариултуудыг үнэлүүлэн, тэдгээр жишээ болон үнэлгээг дараагийн сургалтын үйл явцаар загварт буцаан өгдөг. Бид эдгээр аргуудыг, тэр дундаа Хүний санал хүсэлтээс бататган суралцах (RLHF)-ыг анхлан хөгжүүлсэн бөгөөд энэ нь өдгөө салбарын стандарт болсон. Бид RLHF-ыг загварт заавар дагахыг заах, буруу агуулга өгөх магадлалыг бууруулах, аюулгүй байдлын боломжууд нэмэхэд ашигладаг.

GPT‑4‑ийг олон нийтэд гаргахаас өмнө бид дараах сургалтыг 6 сарын турш давтан сайжруулсан. Энэ хугацаанд бид загваруудаа болзошгүй хор хөнөөлд хүргэж магадгүй гэж үзсэн хүсэлтэд хариулахаас татгалзаж сургах аргуудыг боловсруулсан. Жишээлбэл, хэрхэн бөмбөг хийх заавар асуувал загвар хариулахаас татгалзана. Бид GPT‑4‑ийг дотоод үнэлгээндээ үндэслэн өмнөх үеийн GPT‑3.5 загвартай харьцуулахад зөвшөөрөгдөөгүй агуулгын хүсэлтэд хариулах магадлал 82%-иар бага болгосон. Мөн энэ хугацаанд бид бодит баримтад тулгуурласан хариулт өгөх магадлалыг 40%-иар нэмэгдүүлж, ярианы хэлбэрээр хариулах⁠ чадварыг зааж, Исландтай хамтран ажилласнаар⁠ нөөц багатай хэлүүд дээрх гүйцэтгэлийг нь сайжруулсан.

Бид загварууддаа хүний сонголтыг илүү сайн тусгахын тулд дараах сургалтын аргуудыг хөгжүүлсээр⁠(шинэ цонхонд нээгдэнэ) байна. Жишээлбэл, манай зарим арга нь хүмүүсийг илүү сайн эсвэл муу зан үйлийн жишээг үнэлэхээс илүүтэй, систем дагах ёстой дүрмийг өөрсдөөр нь тодорхойлуулах боломж олгодог.

Бид өөрсдөө хийдэг дараах сургалтаас гадна хэрэглэгчдэд загваруудаа өөрсдийн тодорхой зорилгод нийцүүлэн “нарийн тааруулах” боломжийг олгодог. Жишээлбэл, өөрсдийн өмчийн хэл дээр програмын код бичүүлэх, салбарын онцлог мэдлэг заах, эсвэл өнгө аясыг нь брэнддээ нийцүүлэх зэрэгт ашиглаж болно. Хэрэглэгчид үүнийг хүрэхийг хүсэж буй зан үйлийг харуулах өгөгдөл бэлтгэн манай API-аар нэмэлт дараах сургалтад илгээх замаар хийдэг. Өгөгдөл маань аюулгүй байдлын шалгалтыг давбал бид гарсан нарийн тааруулсан загварыг зөвхөн тухайн хэрэглэгчид ашиглуулах боломжтой болгодог. Бусад API урсгалын адил бид мөн доор тайлбарласан хяналт, илрүүлэх системүүдээ ашиглан нарийн тааруулсан загварууд манай ашиглалтын бодлого⁠-ыг зөрчиж байгаа эсэхийг илрүүлэхэд тусалдаг.

Илүү аюулгүй системүүдийг бүтээх

Дараах сургалтаар аюулгүй байдлыг хангахаас гадна бид нарийн шалгалт хийж, гаднын мэргэжилтнүүдийн санал авч, аюулгүй байдал болон хяналтын системүүдийг байгуулж, бэхжүүлэн, хүмүүст манай загваруудыг хариуцлагатай ашиглахад туслах нөөцөөр хангадаг. Аюулгүй байдалд чиглэсэн энэ цогц хандлага нь үзэн ядсан, дарамталсан, эсвэл хүчирхийлэлтэй агуулга үүсгэх, улс төрийн кампанит ажилд ашиглах, эсвэл хортой программ үүсгэх зэрэг хор хөнөөл учруулж болзошгүй байдлаар манай загваруудыг ашиглахыг хориглодог ашиглалтын бодлого⁠-оо хэрэгжүүлж, мөрдүүлэх боломжийг бидэнд олгодог.

Red-teaming болон үнэлгээнүүд. Бид шинэ томоохон загвар бүрийг аюулгүй байдлын эрсдэл болон хазайлт, ялгаварлан гадуурхалт зэрэг нийгэмд учирч болзошгүй хор нөлөөгөөр үнэлдэг. Бид дотоод болон гадаад red-teaming⁠ хийдэг. Үүгээрээ бид загварыг дотооддоо эрсдэлийн хувьд туршиж, мөн олон салбарын мэргэжилтнүүдэд эрт хандалт олгон системүүдийг шалгаж, эрсдэлийг зураглаж, үнэлэхэд туслуулдаг. Бид эдгээр үнэлгээг загварууд болон аюулгүй байдлын системүүдээ цаашид хөгжүүлэх, сайжруулахад чиг баримжаа болгон ашиглаж, олсон үр дүнгээ олон нийтэд нийтэлдэг.

Аюулгүй байдлын хяналтын системүүд. Бид хүсээгүй агуулгыг илрүүлэхэд тусалж, тодорхой тохиолдлын хүний шалгалтыг нөхөн дэмждэг хяналтын системүүдийг бүтээж, хэрэгжүүлдэг. Эдгээр систем агуулгын зөрчлийг илрүүлбэл бид хариулахаас татгалзах, тохиолдлыг хүний шалгалтад тэмдэглэх, эсвэл онц ноцтой нөхцөлд хэрэглэгчийн эрхийг түдгэлзүүлэх зэрэг янз бүрийн арга хэмжээ авч болно. Агуулгын ангилагчид нь нарийн тааруулсан хэлний загваруудаар ажилладаг бөгөөд бид тэдгээрийн хамрах хүрээ, үр ашиг, нарийвчлалыг хэрхэн нэмэгдүүлэх талаар судалсаар байна. Сүүлийн үед хянан зохицуулах систем хөгжүүлэхэд GPT‑4 ашиглах⁠ чиглэлийг судалж байна.

Хэрэглэгчдэд зориулсан хэрэгслүүд. Бид хэрэглэгчид болон манай загваруудын дээр аппликейшн бүтээдэг хөгжүүлэгчдэд AI-ийг аюулгүй ашиглах боломж олгох баримтжуулалт болон хэрэгслүүдийг боловсруулдаг. Шинэ хил хязгаар системүүдийг гаргахаас өмнө бид загвар эсвэл системийн чадамж, хязгаарлалт, зохистой болон зохисгүй хэрэглээний хүрээг тайлбарласан тайлан нийтэлдэг (жишээлбэл, GPT‑4⁠(шинэ цонхонд нээгдэнэ) болон GPT‑4V⁠-ийн системийн картууд). Бид хэрэглэгчдэд өөрсдийн ашиглалтын бодлогыг мөрдүүлэх боломж олгохын тулд үнэгүй Moderations API⁠(шинэ цонхонд нээгдэнэ)-г санал болгодог. Мөн бид аюулгүй байдлын системүүдийнхээ талаар судалгаа нийтэлдэг⁠(шинэ цонхонд нээгдэнэ).

Санал хүсэлтээс суралцах. Бид санал хүсэлтээс суралцаж, түүнд хариу өгөх нь цаг хугацааны явцад аюулгүй AI системүүдийг бүтээж, эрхэм зорилгоо хэрэгжүүлэхэд нэн чухал бүрэлдэхүүн хэсэг гэж үздэг. Бид хэрэглэгчийн оролцоо болон санал хүсэлтэд тулгуурлан загварын гаралт, хяналтын системүүд, ашиглалтын бодлогоо байнга сайжруулдаг. Мөн AI технологийг хамгийн өгөөжтэйгээр нэвтрүүлэх, түүнд дасан зохицох талаар оролцогч талуудтай тасралтгүй яриа хэлэлцээ өрнүүлдэг.

Гол нэр томьёо

Хиймэл оюун ухаан (AI)

Хиймэл оюун ухаан нь хүний оюун ухаантай холбон ойлгодог байдлаар ажиллаж чадах тооцооллын систем бүтээх зорилготой компьютерийн шинжлэх ухааны салбар юм. Үүний жишээнд шатар зэрэг тоглоом тоглож чаддаг программ хангамж, өөрөө жолооддог машин, хүний яриатай төстэй яриаг дуурайлган хийж чаддаг чатботууд орно.

Машин сургалт (ML)

Машин сургалт нь компьютерийн системүүдийг алхам алхмаар програмчлахын оронд мэдээлэл эсвэл туршилтад тулгуурлан даалгавар гүйцэтгэж сурах боломж олгодог хиймэл оюун ухааны нэг арга юм. Жишээлбэл, машин сургалтын систем муурын олон өөр зургийг үзэж, тэдгээр зургуудын шинжийг сурч авснаар муурын зураг зурахыг сурч болно. Энэ нь муур ямар харагддаг талаар мөр мөрөөр заавар өгөхөөс өөр юм. Эсвэл систем нь тоглоомын дүрэм болон тоглоомыг хэрхэн дуусгах заавар авахын оронд туршилт хийж, амжилттай оролдлогод шагнал авч видео тоглоом тоглож сурах боломжтой.

Загварууд

Загварууд нь хиймэл оюун ухаан болон машин сургалтын аргуудыг ашиглан боловсруулсан компьютерийн програмууд юм. Хамгийн түгээмэл загварууд нь өгөгдөлд дүн шинжилгээ хийж, түүн дээр үндэслэн ирээдүйн таамаглал гаргадаг програмууд байдаг. Жишээлбэл, ирээдүйн худалдан авагчид ямар зүйл санал болгохыг зөвлөхийн тулд худалдан авагчдын өмнөх худалдан авалтыг шинжлэх загвар боловсруулж болно.

Суурь загварууд

Суурь загварууд нь их хэмжээний өгөгдлөөс суралцахын тулд асар их тооцоолох хүч ашиглан хөгжүүлдэг AI загварууд бөгөөд ингэснээр тухайн өгөгдөлтэй холбоотой өргөн хүрээний даалгаврыг гүйцэтгэж чаддаг. Жишээлбэл, их хэмжээний текст ашиглан хөгжүүлсэн хэлний загварыг дараа нь текстийг шинжлэх, бичих, мөн текстийн талаар асуултад хариулахад ашиглаж болно.

Хиймэл оюун ухаан болон машин сургалтын салбарууд хурдацтай хөгжиж байгаа тул эдгээр тодорхойлолтууд цаг хугацааны явцад үргэлжлэн хувьсах болно.