Үндсэн агуулга руу алгасах
OpenAI

Бид OpenAI-ийн гүний сургалтыг масштаблах хүчин чармайлтын хамгийн сүүлийн чухал үе болох GPT‑4‑ийг бүтээлээ. GPT‑4 нь том мультимодал загвар бөгөөд (зураг болон текстэн оролт авч, текстэн гаралт гаргадаг) бодит ертөнцийн олон нөхцөлд хүнээс сул ч мэргэжлийн болон академик олон жишиг шалгалт дээр хүний түвшний гүйцэтгэл үзүүлдэг. Жишээлбэл, энэ нь туршилтаар дуурайлгасан хуульчийн шалгалтыг шалгуулагчдын дээд 10%-д ойролцоо оноогоор давдаг; харин GPT‑3.5‑ийн оноо доод 10%-д ойролцоо байсан. Бид 6 сарын турш эсрэгцүүлсэн туршилтын хөтөлбөр болон ChatGPT‑ээс авсан сургамжийг ашиглан GPT‑4‑ийг давтан нийцүүлж ирсэн бөгөөд үүний үр дүнд бодит байдал, жолоодогдох чадвар, хамгаалалтын хүрээнээс гарахаас татгалзах чадварын хувьд (төгсөөс хол ч) бидний түүхэн дэх хамгийн сайн үр дүнд хүрсэн.

Сүүлийн хоёр жилийн хугацаанд бид гүний сургалтын бүх стекээ дахин бүтээж, Azure-тай хамтран өөрсдийн ажлын ачаалалд зориулан анхнаас нь суперкомпьютер хамтран зохион бүтээсэн. Жилийн өмнө бид энэ системийн анхны “туршилтын ажиллуулалт” болгон GPT‑3.5‑ийг сургасан. Бид зарим алдааг олж засаж, онолын сууриа сайжруулсан. Үүний үр дүнд GPT‑4‑ийн сургалтын ажиллуулалт (ядаж бидний хувьд!) урьд өмнө байгаагүй тогтвортой болж, сургалтын гүйцэтгэлийг нь хугацаанаас өмнө үнэн зөв урьдчилан таамаглаж чадсан анхны том загвар болсон. Бид найдвартай масштабчлалд үргэлжлүүлэн анхаарахдаа ирээдүйн чадваруудыг улам хол хугацаанаас урьдчилан таамаглаж, бэлтгэхэд туслах аргачлалаа улам сайжруулахыг зорьж байгаа бөгөөд үүнийг аюулгүй байдалд туйлын чухал гэж үзэж байна.

Бид GPT‑4‑ийн текст оролтын чадварыг ChatGPT болон API-гаар ( хүлээлгийн жагсаалт-тай) гаргаж байна. Зургийн оролтын чадварыг илүү өргөн нэвтрүүлэхэд бэлтгэхийн тулд бид эхний ээлжинд нэг түнштэй(шинэ цонхонд нээгдэнэ) нягт хамтран ажиллаж байна. Мөн бид AI загварын гүйцэтгэлийг автомат үнэлэх манай хүрээ болох OpenAI Evals(шинэ цонхонд нээгдэнэ)-ийг нээлттэй эх болгож байгаа бөгөөд ингэснээр хэн ч манай загваруудын дутагдлыг мэдээлж, цаашдын сайжруулалтыг чиглүүлэхэд туслах боломжтой.

Чадварууд

Энгийн ярианд GPT‑3.5 ба GPT‑4‑ийн ялгаа төдийлөн анзаарагдахгүй байж болно. Даалгаврын төвөгшил хангалттай босгонд хүрэхэд л ялгаа ил гардаг—GPT‑4 нь GPT‑3.5‑аас илүү найдвартай, бүтээлч бөгөөд илүү нарийн зааврыг боловсруулах чадвартай.

Эдгээр хоёр загварын ялгааг ойлгохын тулд бид хүний зориулалтаар анх боловсруулсан шалгалтуудыг дуурайлган оруулсан олон төрлийн жишиг шалгалтаар туршсан. Бид хамгийн сүүлийн үеийн нийтэд нээлттэй тестүүдийг (Олимпиад болон AP-ийн чөлөөт хариултын асуултуудын хувьд) ашиглах эсвэл 2022–2023 оны дадлагын шалгалтын хувилбаруудыг худалдан авах замаар ажилласан. Бид эдгээр шалгалтад зориулсан тусгай сургалт хийгээгүй. Шалгалтын цөөн асуудлыг загвар сургалтын явцад харсан байсан ч үр дүнг төлөөлөхүйц гэж бид үзэж байна—дэлгэрэнгүйг манай техникийн тайлангаас(шинэ цонхонд нээгдэнэ) үзнэ үү.

дотоод лавлагаа 1

Ачаалж байна...
Ачаалж байна...

Мөн бид GPT‑4‑ийг машин сургалтын загваруудад зориулан боловсруулсан уламжлалт жишиг шалгалтуудаар үнэлсэн. GPT‑4 нь одоо байгаа том хэлний загваруудаас, мөн жишигт тусгайлан тохируулсан хийц эсвэл нэмэлт сургалтын протокол агуулж болох хамгийн сүүлийн үеийн (SOTA) ихэнх загваруудаас мэдэгдэхүйц илүү үзүүлэлттэй байна:

Ачаалж байна...

Одоо байгаа ML жишиг шалгалтуудын ихэнх нь англи хэлээр бичигдсэн байдаг. Бусад хэл дээрх чадварын анхны төсөөлөл авахын тулд бид MMLU жишиг шалгалтыг—57 сэдвийг хамарсан 14,000 олон сонголттой бодлогын цогц—Azure Translate ашиглан олон хэл рүү орчуулсан (үзнэ үү Хавсралт). Туршсан 26 хэлний 24 дээр GPT‑4 нь GPT‑3.5 болон бусад LLM-уудын (Chinchilla, PaLM) англи хэл дээрх үзүүлэлтээс илүү гарсан бөгөөд үүнд латви, уэльс, свахили зэрэг нөөц багатай хэлүүд ч багтана:

Ачаалж байна...

Бид GPT‑4‑ийг дэмжлэг, борлуулалт, агуулгын хяналт, програмчлал зэрэг үүргүүдэд дотооддоо ашиглаж байгаа бөгөөд ихээхэн нөлөө үзүүлж байна. Мөн бид үүнийг AI гаралтуудыг үнэлэхэд хүмүүст туслуулахад ашиглаж байгаа бөгөөд ингэснээр манай alignment стратеги-ийн хоёр дахь үе шатыг эхлүүлж байна.

Харааны оролтууд

GPT‑4 нь текст болон зургийн өгөгдөл хүлээн авах боломжтой бөгөөд энэ нь зөвхөн тексттэй тохиргоотой зэрэгцэн хэрэглэгчид ямар ч харааны эсвэл хэлний даалгаврыг зааж өгөх боломж олгодог. Тодруулбал, текст ба зургууд ээлжлэн орсон оролтоос текстэн гаралт (байгалийн хэл, код гэх мэт) үүсгэдэг. Текст, гэрэл зураг, диаграмм эсвэл дэлгэцийн агшин агуулсан баримт бичгүүдийг багтаасан олон төрлийн домэйнд GPT‑4 нь зөвхөн текстэн оролт дээр үзүүлдэгтэй төстэй чадварыг харуулдаг. Үүнээс гадна, зөвхөн текстэн хэлний загваруудад зориулан боловсруулсан тестийн үеийн аргуудаар үүнийг сайжруулж болно, үүнд few-shot болон бодлын хэлхээ(шинэ цонхонд нээгдэнэ) өгөгдөл багтана. Зургийн оролт одоогоор судалгааны урьдчилсан танилцуулга хэвээр бөгөөд нийтэд нээлттэй биш байна.

Ачаалж байна...

Бид GPT‑4‑ийн гүйцэтгэлийг академик харааны стандарт жишиг шалгалтуудын нарийн хүрээнд үнэлж урьдчилан танилцуулж байна. Гэхдээ загвар гүйцэтгэж чаддаг шинэ, сонирхолтой даалгавруудыг бид байнга олж нээж байгаа тул эдгээр тоо нь түүний чадварын цар хүрээг бүрэн илэрхийлэхгүй. Бид ойрын хугацаанд цаашдын шинжилгээ, үнэлгээний тоонууд, мөн тестийн үеийн аргуудын нөлөөний нарийвчилсан судалгааг нийтлэхээр төлөвлөж байна.

дотоод тайлбарA

Ачаалж байна...

Жолоодогдох чадвар

Бид AI-уудын зан үйлийг тодорхойлох тухай нийтлэлдээ дурдсан төлөвлөгөөний бүх тал дээр, үүнд жолоодогдох чадвар багтан, ажиллаж ирсэн. Тогтмол үгийн олонтой, өнгө аяс, хэв маягтай сонгодог ChatGPT зан төрхийн оронд хөгжүүлэгчид (удахгүй ChatGPT хэрэглэгчид ч мөн) “system” мессежид эдгээр чиглэлийг тайлбарласнаар өөрсдийн AI-ийн хэв маяг, даалгаврыг зааж өгч чадна. System мессежүүд нь API хэрэглэгчдэд хязгаар дотор(шинэ цонхонд нээгдэнэ) хэрэглэгчдийнхээ туршлагыг ихээхэн өөрчлөн тохируулах боломж олгодог. Бид энд цаашид сайжруулалт хийсээр байх болно (ялангуяа system мессежүүд нь одоогийн загварыг “jailbreak” хийх хамгийн амархан арга гэдгийг, өөрөөр хэлбэл хязгаарыг мөрдөх нь төгс биш гэдгийг сайн мэдэж байна), гэхдээ та туршаад үзэж, санал бодлоо хэлэхийг бид уриалж байна.

Ачаалж байна...

Хязгаарлалтууд

Чадваруудтай ч гэсэн GPT‑4 нь өмнөх GPT загваруудтай төстэй хязгаарлалтуудтай. Хамгийн чухал нь, энэ нь одоо ч бүрэн найдвартай биш (баримтуудыг “хий хоосноос зохиодог” бөгөөд сэтгэн бодох алдаа гаргадаг). Хэлний загварын гаралтыг ашиглахдаа, ялангуяа өндөр эрсдэлтэй нөхцөлд, маш болгоомжтой хандах ёстой бөгөөд яг ямар протокол хэрэглэх нь (жишээлбэл хүний хяналт, нэмэлт контекстоор үндэслэл хийх, эсвэл өндөр эрсдэлтэй хэрэглээг бүрэн зайлсхийх) тухайн хэрэглээний хэрэгцээнд тохирсон байх ёстой.

Хэдий бодит асуудал хэвээр ч GPT‑4 нь өмнөх загваруудтай харьцуулахад хий үзэгдэл маягийн алдааг мэдэгдэхүйц бууруулдаг (мөн тэдгээр нь өөрсдөө давталт бүрээр сайжирч ирсэн). GPT‑4 нь манай дотоод эсрэгцүүлсэн бодит байдлын үнэлгээнүүд дээр хамгийн сүүлийн GPT‑3.5‑аас 40% өндөр оноо авдаг:

Ачаалж байна...

Бид TruthfulQA зэрэг гаднын жишиг шалгалтууд дээр ахиц гаргасан. Энэ нь загварын бодит баримтыг эсрэгцүүлэн сонгосон буруу мэдэгдлүүдийн багцаас ялгах чадварыг шалгадаг. Эдгээр асуултууд нь статистикийн хувьд итгэл төрүүлэх боловч бодит байдлын хувьд буруу хариултуудтай хослогддог.

Ачаалж байна...

GPT‑4 суурь загвар нь энэ даалгаварт GPT‑3.5‑аас ялимгүй дээр боловч RLHF сургалтын дараах боловсруулалтын дараа (GPT‑3.5‑т ашигласан ижил үйл явцыг хэрэглэн) ялгаа маш их болдог. Доорх зарим жишээг харахад GPT‑4 нь түгээмэл хэлц үгийг сонгохоос зайлсхийдэг (you can’t teach an old dog new tricks), гэхдээ одоо ч нарийн деталиудыг алдах тохиолдол бий (Elvis Presley was not the son of an actor).

Ачаалж байна...

Загвар нь гаралтдаа янз бүрийн хазайлттай байж болно—бид энэ тал дээр ахиц гаргасан ч хийх зүйл үлдсэн хэвээр байна. Манай саяхны блог нийтлэл-д дурдсанаар, бид бүтээж буй AI системүүдийн анхдагч зан үйл нь хэрэглэгчдийн өргөн хүрээний үнэт зүйлсийг боломжийн хэмжээнд тусгасан байх, тэдгээр системийг өргөн хүрээний хязгаар дотор өөрчлөн тохируулах боломжтой байх, мөн тэр хязгаар ямар байх ёстой талаар олон нийтийн санал авахыг зорьдог.

GPT‑4 нь өгөгдлийнх нь дийлэнх олонх тасарсан хугацаанаас (2021 оны 9-р сар) хойш болсон үйл явдлын талаарх мэдлэг ерөнхийдөө дутмаг бөгөөд өөрийн туршлагаас суралцдаггүй. Энэ нь заримдаа маш олон салбар дахь чадвартай нь нийцэхгүй мэт энгийн сэтгэн бодох алдаа гаргаж болно, эсвэл хэрэглэгчийн илт худал мэдэгдлийг хэт амархан үнэмшиж хүлээн авч болно. Мөн заримдаа хүний адил хүнд асуудлууд дээр бүтэлгүйтэж болно, жишээлбэл гаргаж буй коддоо аюулгүй байдлын эмзэг байдал оруулах гэх мэт.

GPT‑4 нь таамаглал дээрээ өөртөө итгэлтэй атлаа буруу байж ч болно, алдаа гаргах магадлал өндөр үед ажлаа давхар шалгахдаа анхааралгүй ханддаг. Сонирхолтой нь, суурь урьдчилан сургасан загвар нь маш сайн калибрлагдсан байдаг (хариултынхаа талаар таамагласан итгэл нь ерөнхийдөө зөв байх магадлалтай таардаг). Гэвч манай одоогийн сургалтын дараах үйл явцаар энэ калибр буурдаг.

Ачаалж байна...

Эрсдэл ба бууруулах арга хэмжээ

Бид GPT‑4‑ийг сургалтын эхнээс нь илүү аюулгүй, илүү нийцтэй болгохын тулд давтан сайжруулж ирсэн бөгөөд үүнд урьдчилсан сургалтын өгөгдлийг сонгох, шүүх, үнэлгээ ба шинжээчдийн оролцоо, загварын аюулгүй байдлын сайжруулалт, хяналт ба хэрэгжилт зэрэг хүчин чармайлт багтсан.

GPT‑4 нь хортой зөвлөгөө, алдаатай код, эсвэл буруу мэдээлэл үүсгэх зэрэг өмнөх загваруудтай төстэй эрсдэлүүдийг дагуулдаг. Гэсэн хэдий ч GPT‑4‑ийн нэмэлт чадварууд нь эрсдэлийн шинэ гадаргуунуудыг бий болгодог. Эдгээр эрсдэлийн цар хүрээг ойлгохын тулд бид AI alignment эрсдэл, кибер аюулгүй байдал, биоэрсдэл, итгэлцэл ба аюулгүй байдал, олон улсын аюулгүй байдал зэрэг салбарын 50 гаруй шинжээчийг загварыг эсрэгцүүлэн туршихад оролцуулсан. Тэдний олдворууд нь үнэлэхэд мэргэжлийн мэдлэг шаарддаг өндөр эрсдэлтэй чиглэлүүдэд загварын зан үйлийг турших боломжийг бидэнд олгосон. Эдгээр шинжээчдийн санал хүсэлт, өгөгдөл нь загварын бууруулах арга хэмжээ болон сайжруулалтад туссан; жишээлбэл, аюултай химийн бодис нийлэгжүүлэх тухай хүсэлтээс татгалзах GPT‑4‑ийн чадварыг сайжруулахын тулд бид нэмэлт өгөгдөл цуглуулсан.

GPT‑4 нь RLHF сургалтын явцад хортой гаралтыг (манай ашиглалтын удирдамж(шинэ цонхонд нээгдэнэ)-аар тодорхойлсноор) бууруулахын тулд нэмэлт аюулгүй байдлын reward signal-ийг агуулдаг бөгөөд ингэснээр загварыг ийм агуулгын хүсэлтээс татгалзахад сургадаг. Энэхүү шагналыг аюулгүй байдлын хил хязгаар болон completion-ийн хэв маягийг аюулгүй байдалтай холбоотой өгөгдлүүд дээр шүүдэг GPT‑4 zero-shot ангилагч өгдөг. Загвар зөв хүсэлтээс татгалзахаас сэргийлэхийн тулд бид янз бүрийн эх сурвалжаас (жиш., шошголсон продакшн өгөгдөл, хүний red-teaming, загвараар үүсгэсэн өгөгдөл) олон янзын өгөгдлийн багц цуглуулж, зөвшөөрөгдсөн болон зөвшөөрөгдөөгүй ангиллуудын аль алинд аюулгүй байдлын reward signal-ийг (эерэг эсвэл сөрөг утгатайгаар) хэрэглэдэг.

Манай бууруулах арга хэмжээнүүд нь GPT‑3.5‑тай харьцуулахад GPT‑4‑ийн аюулгүй байдлын олон шинжийг мэдэгдэхүйц сайжруулсан. Бид GPT‑3.5‑тай харьцуулахад загварын зөвшөөрөгдөөгүй агуулгын хүсэлтэд хариулах хандлагыг 82%-иар бууруулсан бөгөөд GPT‑4 нь мэдрэмтгий хүсэлтүүдэд (жиш., эмнэлгийн зөвлөгөө болон өөртөө хор учруулах) манай бодлогод нийцсэн байдлаар 29%-иар илүү олон удаа хариулдаг.

Ачаалж байна...
Ачаалж байна...

Ерөнхийдөө, загварын түвшний манай хөндлөнгийн оролцоонууд нь зохисгүй зан үйлийг өдөөхөд илүү хүндрэл учруулж байгаа ч үүнийг хийх боломж одоо ч бий. Нэмж хэлэхэд, манай ашиглалтын удирдамж-ийг зөрчсөн агуулга үүсгэх “jailbreak” аргууд одоо ч байна. AI системүүдийн “нэг токен тутмын эрсдэл” өсөхийн хэрээр эдгээр оролцоонд туйлын өндөр найдвартай байдалд хүрэх нь маш чухал болно; одоохондоо эдгээр хязгаарлалтыг зүй бусаар ашиглахыг хянах зэрэг нэвтрүүлэлтийн үеийн аюулгүй байдлын аргуудаар нөхөх нь чухал юм.

GPT‑4 болон түүний дараагийн загварууд нь нийгэмд ашигтай болон хор хөнөөлтэй аль аль талаараа мэдэгдэхүйц нөлөө үзүүлэх боломжтой. Бид боломжит нөлөөллийг хэрхэн ойлгож, үнэлэхээ сайжруулахын зэрэгцээ ирээдүйн системүүдэд гарч болох аюултай чадваруудыг үнэлэх шалгалтуудыг бүтээхийн тулд гаднын судлаачидтай хамтран ажиллаж байна. Удахгүй бид GPT‑4 болон бусад AI системүүдийн нийгэм, эдийн засгийн боломжит нөлөөний талаархи өөрсдийн бодлоо илүү дэлгэрэнгүй хуваалцах болно.

Сургалтын үйл явц

Өмнөх GPT загваруудын нэгэн адил GPT‑4 суурь загварыг баримт бичиг дэх дараагийн үгийг таамаглахаар сургасан бөгөөд нийтэд нээлттэй өгөгдөл (жишээ нь интернэтийн өгөгдөл) болон бидний лицензтэй өгөгдлийг ашиглан сургажээ. Өгөгдөл нь математикийн бодлогын зөв ба буруу шийдэл, сул ба хүчтэй сэтгэн бодох, өөртэйгөө зөрчилдсөн болон нийцтэй мэдэгдлүүд, мөн үзэл суртал, санаануудын асар олон янз байдлыг багтаасан веб хэмжээний корпус юм.

Иймээс асуултаар өгөгдөл өгөхөд суурь загвар нь хэрэглэгчийн зорилгоос ихээхэн зөрөх олон янзын байдлаар хариулж болно. Үүнийг хэрэглэгчийн зорилготой хамгаалалтын хүрээ дотор нийцүүлэхийн тулд бид хүний санал хүсэлтээс бататган суралцах (RLHF) аргыг ашиглан загварын зан үйлийг нарийн тааруулдаг.

Загварын чадварууд голчлон урьдчилсан сургалтын үйл явцаас гарч ирдэг бололтой—RLHF нь шалгалтын гүйцэтгэлийг сайжруулдаггүй (идэвхтэй хүчин чармайлтгүй бол бүр муутгадаг) гэдгийг анхаарна уу. Харин загварыг жолоодох чадвар нь сургалтын дараах үйл явцаас үүдэлтэй—суурь загвар нь асуултад хариулах ёстой гэдгээ ч мэдэхийн тулд өгөгдлийн инженерчлэл шаарддаг.

Урьдчилан таамаглахуйц масштабчлал

GPT‑4 төслийн гол анхаарлын нэг нь урьдчилан таамаглахуйц хэмжээгээр масштаблах гүний сургалтын стек бүтээх явдал байсан. Үндсэн шалтгаан нь GPT‑4 шиг маш том сургалтын ажиллуулалтуудад загвар тусгайлан өргөн тохируулга хийх нь боломжгүй байдаг. Бид олон масштабаар маш урьдчилан таамаглахуйц зан төлөвтэй дэд бүтэц, оновчлолыг боловсруулсан. Энэ масштаблах чадварыг баталгаажуулахын тулд бид ижил аргачлалаар сурсан боловч 10,000 дахин бага тооцоолол ашигласан загваруудаас экстраполяци хийж, дотоод кодын сан дээрх (сургалтын багцын хэсэг биш) GPT‑4‑ийн эцсийн алдагдлыг урьдчилан үнэн зөв таамагласан:

Ачаалж байна...

Одоо бид сургалтын явцад оновчлуулж буй хэмжүүрээ (алдагдал) үнэн зөвөөр урьдчилан таамаглаж чаддаг болсон тул илүү тайлбарлахад хялбар хэмжүүрүүдийг таамаглах аргачлал боловсруулж эхэлж байна. Жишээлбэл, бид HumanEval(шинэ цонхонд нээгдэнэ) өгөгдлийн багцын дэд хэсэг дээрх давах хувь хэмжээг амжилттай урьдчилан таамагласан бөгөөд үүнийг 1,000 дахин бага тооцоолол ашигласан загваруудаас экстраполяци хийж гаргасан:

Ачаалж байна...

Зарим чадварыг урьдчилан таамаглахад одоо ч хэцүү. Жишээлбэл, Inverse Scaling Prize нь загварын тооцоолол өсөх тусам мууддаг хэмжүүр олох уралдаан байсан бөгөөд эргэн харах үл хайхрал(шинэ цонхонд нээгдэнэ) нь ялагчдын нэг байсан. Өөр нэг сүүлийн үеийн үр дүнтэй(шинэ цонхонд нээгдэнэ) адил, GPT‑4 энэ чиг хандлагыг эсэргээр нь эргүүлж байна:

Ачаалж байна...

Ирээдүйн машин сургалтын чадваруудыг үнэн зөвөөр урьдчилан таамаглах нь аюулгүй байдлын маш чухал хэсэг бөгөөд боломжит нөлөөтэй нь харьцуулахад хангалттай анхаарал авдаггүй гэж бид үздэг (хэдий ч хэд хэдэн байгууллагын хүчин чармайлт биднийг урамшуулсан). Бид ирээдүйн системүүдээс юу хүлээх талаар нийгэмд илүү сайн чиглэл өгөх аргуудыг хөгжүүлэх ажлаа өргөжүүлж байгаа бөгөөд энэ нь салбарын нийтлэг зорилго болно гэж найдаж байна.

OpenAI Evals

Бид OpenAI Evals(шинэ цонхонд нээгдэнэ)-ийг нээлттэй эх болгож байна. Энэ нь GPT‑4 зэрэг загваруудыг үнэлэх жишиг шалгалтуудыг бүтээж ажиллуулах, мөн тэдгээрийн гүйцэтгэлийг жишээ бүрээр нь шалгах манай програм хангамжийн хүрээ юм. Бид Evals-ийг загваруудаа хөгжүүлэхэд (дутагдлыг илрүүлэх, ухралтаас сэргийлэх аль алинд нь) ашигладаг бөгөөд хэрэглэгчид маань үүнийг загварын хувилбаруудын хоорондын гүйцэтгэлийг хянахад (эдгээр нь одоо тогтмол гарч эхэлнэ) болон хувьсан өөрчлөгдөж буй бүтээгдэхүүний интеграцуудад ашиглаж болно. Жишээлбэл, Stripe нь GPT‑ээр ажилладаг баримтжуулалтын хэрэгслийнхээ нарийвчлалыг хэмжихийн тулд хүний үнэлгээгээ нөхөх зорилгоор Evals-ийг ашигласан.

Код нь бүрэн нээлттэй эх тул Evals нь өөрийн үнэлгээний логик(шинэ цонхонд нээгдэнэ) хэрэгжүүлэх шинэ классууд бичихийг дэмждэг. Гэхдээ манай туршлагаас харахад олон жишиг шалгалт цөөн хэдэн “загвар”-ын аль нэгийг дагадаг тул бид мөн дотооддоо хамгийн хэрэгтэй байсан загваруудыг оруулсан(шинэ цонхонд нээгдэнэ) (үүнд “model-graded evals” загвар ч орно—GPT‑4 өөрийн ажлыг шалгахдаа санаанд оромгүй сайн болохыг бид олж мэдсэн). Ерөнхийдөө шинэ үнэлгээ бүтээх(шинэ цонхонд нээгдэнэ) хамгийн үр дүнтэй арга нь өгөгдөлтэй хамт эдгээр загваруудын нэгийг хэрэгжүүлэх явдал байна. Бусад хүмүүс эдгээр загварууд болон ер нь Evals-ээр юу бүтээхийг харахдаа бид баяртай байна.

Бид Evals-ийг бүтэлгүйтлийн горимууд болон хэцүү даалгавруудын аль болох өргөн хүрээг төлөөлсөн жишиг шалгалтуудыг хуваалцах, олон нийтийн оролцоотойгоор бүрдүүлэх хэрэгсэл болно гэж найдаж байна. Дагалдах жишээ болгон бид GPT‑4 бүтэлгүйтдэг арван өгөгдөл агуулсан логикийн бодлогууд(шинэ цонхонд нээгдэнэ) үнэлгээг бүтээсэн. Evals нь мөн одоо байгаа жишиг шалгалтуудыг хэрэгжүүлэхтэй нийцдэг; бид академик жишиг шалгалтуудыг хэрэгжүүлсэн хэд хэдэн notebook(шинэ цонхонд нээгдэнэ) болон жишээ болгон CoQA(шинэ цонхонд нээгдэнэ)-г (жижиг дэд хэсгүүдээр) нэгтгэсэн хэд хэдэн хувилбарыг оруулсан.

Бид хүн бүрийг Evals-ийг ашиглан манай загваруудыг шалгаж, хамгийн сонирхолтой жишээнүүдээ илгээхийг урьж байна. Evals нь манай загваруудыг ашиглах болон дээр нь бүтээн байгуулах үйл явцын салшгүй хэсэг болно гэж бид үзэж байгаа бөгөөд шууд хувь нэмэр, асуулт, санал хүсэлт(шинэ цонхонд нээгдэнэ)-ийг бид баяртайгаар хүлээн авна.

ChatGPT Plus

ChatGPT Plus захиалагчид хэрэглээний дээд хязгаартайгаар chatgpt.com(шинэ цонхонд нээгдэнэ) дээр GPT‑4‑д хандах боломжтой болно. Бид бодит хэрэглээний эрэлт болон системийн гүйцэтгэлээс шалтгаалан яг хэдэн хэмжээгээр ашиглуулах хязгаарыг тохируулна, гэхдээ хүчин чадлын маш хатуу хязгаарлалтад орно гэж бид үзэж байна (гэхдээ бид ойрын саруудад хүчин чадлаа өсгөж, оновчлох болно).

Бидний харж буй урсгалын хэв маягаас хамааран, GPT‑4‑ийг их хэмжээгээр ашиглахад зориулсан шинэ захиалгын түвшин нэвтрүүлж магадгүй; мөн захиалгагүй хүмүүс ч туршиж үзэхийн тулд тодорхой хэмжээний GPT‑4 асуулгыг үнэ төлбөргүй санал болгоно гэж найдаж байна.

API

GPT‑4 API-д хандахын тулд (энэ нь gpt-3.5-turbo-той адил ChatCompletions API(шинэ цонхонд нээгдэнэ)-г ашигладаг) манай хүлээлгийн жагсаалтад бүртгүүлнэ үү. Бид өнөөдрөөс эхлэн зарим хөгжүүлэгчдийг урьж эхэлнэ, дараа нь хүчин чадал ба эрэлтийг тэнцвэржүүлэхийн тулд аажмаар өргөжүүлнэ. Хэрэв та AI-ийн нийгэмд үзүүлэх нөлөө эсвэл AI alignment асуудлыг судалдаг судлаач бол манай Researcher Access Program-аар дамжин хөнгөлөлттэй хандалт хүсэх боломжтой.

Нэвтрэх эрх авсны дараа та gpt-4 загварт зөвхөн текстэн хүсэлт илгээж болно (зураг оролт одоогоор хязгаарлагдмал альфа шатанд байна). Бид шинэ хувилбарууд гаргахын хэрээр үүнийг санал болгож буй тогтвортой загвар руу автоматаар шинэчилнэ (та одоогийн хувилбарыг gpt-4-0314-ийг дуудаж тогтоож болно, бид үүнийг 6-р сарын 14 хүртэл дэмжинэ). Үнэ нь 1k prompt токен тутамд $0.03, 1k completion токен тутамд $0.06 байна. Анхдагч хурдны хязгаар нь минутанд 40k токен, минутанд 200 хүсэлт байна.

gpt-4 нь 8,192 токены контекст урттай. Мөн бид 32,768 контексттэй (ойролцоогоор 50 хуудас текст) gpt-4-32k хувилбартаа хязгаарлагдмал хандалт олгож байна, энэ нь мөн цаг хугацааны явцад автоматаар шинэчлэгдэнэ (одоогийн хувилбар gpt-4-32k-0314, үүнийг мөн 6-р сарын 14 хүртэл дэмжинэ). Үнэ нь 1K prompt токен тутамд $0.06, 1k completion токен тутамд $0.12 байна. Бид урт контекстийн хувьд загварын чанарыг сайжруулсаар байгаа бөгөөд танай хэрэглээний тохиолдолд хэрхэн ажиллаж байгаагийн талаар санал хүсэлт авахад баяртай байх болно. Бид 8K ба 32K хөдөлгүүрүүдийн хүсэлтүүдийг хүчин чадлаас хамааран өөр хурдтайгаар боловсруулж байгаа тул та эдгээрт өөр өөр цагт нэвтрэх эрх авч магадгүй.

Дүгнэлт

GPT‑4 нь олон хэрэглээг дэмжин, хүмүүсийн амьдралыг сайжруулахад үнэ цэнтэй хэрэгсэл болно гэж бид найдаж байна. Хийх ажил маш их хэвээр байгаа бөгөөд загвар дээр нь бүтээн байгуулж, судалж, хувь нэмэр оруулж буй олон нийтийн хамтын хүчин чармайлтаар энэ загварыг сайжруулахыг тэсэн ядан хүлээж байна.

Хавсралт

MMLU асуултуудыг бусад хэл рүү орчуулсан жишээ. Анхаарна уу, бид сонголтын токенуудыг (A–D) тогтвортой ашигладаг:

Ачаалж байна...

Тайлбарууд

  1. A

    Бид энэ жишиг шалгалтыг сургалтын багцаас 4 жишээг контекст дотор оруулсан Chain-Of-Thought өгөгдлөөр үнэлдэг. Тодорхой өгөгдлийг validation set дээр тохируулсан.

References

  1. 1

    P. Arredondo (Casetext/Stanford CodeX), D. Katz (Stanford CodeX), M. Bommarito (Stanford CodeX), S. Gao (Casetext). Further analysis is available in the paper(шинэ цонхонд нээгдэнэ).

Зохиогч

OpenAI