
Бид шинэ загварууд гаргаж, GPT‑3.5 Turbo-ийн үнийг бууруулж, мөн хөгжүүлэгчдэд API key-үүдийг удирдах, API хэрэглээг ойлгох шинэ аргуудыг танилцуулж байна. Шинэ загваруудад:
- Хоёр шинэ embedding загвар
- Шинэчлэгдсэн GPT‑4 Turbo preview загвар
- Шинэчлэгдсэн GPT‑3.5 Turbo загвар
- Шинэчлэгдсэн текст moderation загвар
Анхдагчаар OpenAI API руу илгээсэн өгөгдлийг OpenAI загваруудыг сургах эсвэл сайжруулахад ашиглахгүй.
Бид хоёр шинэ embedding загварыг танилцуулж байна: жижиг бөгөөд өндөр үр ашигтай text-embedding-3-small загвар, мөн илүү том, илүү хүчирхэг text-embedding-3-large загвар.
embedding гэдэг нь байгалийн хэл эсвэл код зэрэг контент доторх ойлголтуудыг илэрхийлдэг тоонуудын дараалал юм. Embedding-үүд нь машин сургалтын загварууд болон бусад алгоритмуудад контентуудын хоорондын хамаарлыг ойлгож, бүлэглэх эсвэл хайж олж авах зэрэг даалгаврыг гүйцэтгэхэд хялбар болгодог. Эдгээр нь ChatGPT болон Assistants API дахь мэдлэг хайж олж авах, мөн retrieval augmented generation (RAG) хөгжүүлэгчийн олон хэрэгслийг ажиллуулдаг.
text-embedding-3-small нь манай шинэ, өндөр үр ашигтай embedding загвар бөгөөд 2022 оны 12-р сард гарсан өмнөх text-embedding-ada-002 загвараасаа мэдэгдэхүйц ахицтай.
Илүү хүчтэй гүйцэтгэл. text-embedding-ada-002-ийг text-embedding-3-small-тай харьцуулахад олон хэлт retrieval-д түгээмэл ашиглагддаг benchmark болох MIRACL(шинэ цонхонд нээгдэнэ)-ийн дундаж оноо 31.4%-аас 44.0% болж өссөн бол англи хэлний даалгаварт түгээмэл ашиглагддаг benchmark болох MTEB(шинэ цонхонд нээгдэнэ)-ийн дундаж оноо 61.0%-аас 62.3% болж өссөн.
Үнэ буурсан. text-embedding-3-small нь мөн манай өмнөх үеийн text-embedding-ada-002 загвараас хавьгүй үр ашигтай. Иймээс text-embedding-3-small-ийн үнийг text-embedding-ada-002-той харьцуулахад 5 дахин бууруулж, 1k токен тутмын үнийг $0.0001-оос $0.00002 болгосон.
Бид text-embedding-ada-002-ийг цуцлахгүй тул шинэ загварыг санал болгож байгаа ч хэрэглэгчид өмнөх үеийн загварыг үргэлжлүүлэн ашиглах боломжтой.
Шинэ том текст embedding загвар: text-embedding-3-large
text-embedding-3-large нь манай дараагийн үеийн шинэ том embedding загвар бөгөөд 3072 хүртэлх хэмжээс бүхий embedding үүсгэдэг.
Илүү хүчтэй гүйцэтгэл. text-embedding-3-large нь одоогоор манай хамгийн өндөр гүйцэтгэлтэй загвар. text-embedding-ada-002-ийг text-embedding-3-large-тай харьцуулахад: MIRACL дээр дундаж оноо 31.4%-аас 54.9% болж өссөн бол MTEB дээр дундаж оноо 61.0%-аас 64.6% болж өссөн.
Үнэлгээний benchmark | ada v2 | text-embedding-3-small | text-embedding-3-large |
MIRACL дундаж | 31.4 | 44.0 | 54.9 |
MTEB дундаж | 61.0 | 62.3 | 64.6 |
text-embedding-3-large-ийн үнэ 1k токен тутамд $0.00013 байна.
Шинэ embedding загваруудыг хэрхэн ашиглах талаар манай Embeddings guide(шинэ цонхонд нээгдэнэ)-аас дэлгэрэнгүй үзнэ үү.
Илүү том embedding ашиглах, жишээлбэл тэдгээрийг хайж олж авахын тулд вектор store-д хадгалах нь ерөнхийдөө жижиг embedding ашиглахаас илүү зардалтай бөгөөд илүү их тооцоолол, санах ой, хадгалалт шаарддаг.
Манай хоёр шинэ embedding загвар хоёулаа embedding ашиглах үеийн гүйцэтгэл ба зардлын хооронд хөгжүүлэгчид сонголт хийх боломж олгодог техникоорA сургагдсан. Тодруулбал, хөгжүүлэгчид dimensions API параметрийг дамжуулснаар embedding өөрийн ойлголт илэрхийлэх шинжийг алдалгүйгээр embedding-ийг богиносгож (өөрөөр хэлбэл, дарааллын төгсгөлөөс зарим тоог хасаж) чадна. Жишээлбэл, MTEB benchmark дээр text-embedding-3-large embedding-ийг 256 хэмжээтэй болгон богиносгосон ч 1536 хэмжээтэй богиносгоогүй text-embedding-ada-002 embedding-ээс илүү үр дүнтэй хэвээр байна.
Энэ нь маш уян хатан хэрэглээг боломжтой болгодог. Жишээлбэл, зөвхөн 1024 хүртэлх хэмжээстэй embedding дэмждэг вектор өгөгдлийн store ашиглаж байгаа үед хөгжүүлэгчид манай хамгийн сайн embedding загвар text-embedding-3-large-ийг ашигласаар байж, dimensions API параметрт 1024 гэсэн утга зааж болно. Ингэснээр embedding 3072 хэмжээсээс богиносож, бага хэмжээтэй векторын төлөө тодорхой хэмжээний нарийвчлалыг сольж өгнө.
Ирэх долоо хоногт бид шинэ GPT‑3.5 Turbo загвар gpt-3.5-turbo-0125-ийг танилцуулах бөгөөд өнгөрсөн нэг жилийн хугацаанд гурав дахь удаагаа GPT‑3.5 Turbo-ийн үнийг бууруулж, хэрэглэгчдэдээ илүү өргөжүүлэхэд нь туслах болно. Шинэ загварын оролтын үнэ 50%-иар буурч 1K токен тутамд $0.0005, гаралтын үнэ 25%-иар буурч 1K токен тутамд $0.0015 болно. Мөн энэ загварт хүссэн форматад хариулах нарийвчлал сайжрах, англиас бусад хэл дээрх function call-уудад текст кодчиллын асуудал үүсгэдэг алдааны(шинэ цонхонд нээгдэнэ) засвар зэрэг олон сайжруулалт орно.
Pin хийгдээгүй gpt-3.5-turbo загварын alias ашиглаж буй хэрэглэгчид энэ загвар гарснаас хоёр долоо хоногийн дараа gpt-3.5-turbo-0613-аас gpt-3.5-turbo-0125 руу автоматаар шинэчлэгдэнэ.
GPT‑4 API хэрэглэгчдийн илгээлтийн 70%-иас илүү нь гарснаасаа хойш GPT‑4 Turbo руу шилжсэн бөгөөд хөгжүүлэгчид түүний шинэчлэгдсэн мэдлэгийн таслах хугацаа, 128k-ийн илүү том контекст цонх, хямд үнийг ашиглаж байна.
Өнөөдөр бид шинэчлэгдсэн GPT‑4 Turbo preview загвар gpt-4-0125-preview-г гаргаж байна. Энэ загвар нь өмнөх preview загвараас код үүсгэх зэрэг даалгаврыг илүү бүрэн гүйцэтгэдэг бөгөөд загвар даалгаврыг гүйцээж дуусгадаггүй “залхуурал”-ын тохиолдлыг бууруулах зорилготой. Мөн шинэ загварт англиас бусад UTF-8 үүсгэлтэд нөлөөлж байсан алдааны засвар орсон.
GPT‑4 Turbo preview-ийн шинэ хувилбарууд руу автоматаар шинэчлэгдэхийг хүсдэг хүмүүст зориулан бид gpt-4-turbo-preview гэсэн шинэ загварын нэрийн alias-ийг мөн танилцуулж байна. Энэ нь үргэлж бидний хамгийн сүүлийн GPT‑4 Turbo preview загвар руу заана.
Ирэх саруудад бид хараатай GPT‑4 Turbo-г нийтэд өргөнөөр ашиглах хувилбараар гаргахаар төлөвлөж байна.
Үнэгүй Moderation API нь хөгжүүлэгчдэд хор хөнөөлтэй байж болзошгүй текстийг илрүүлэх боломж олгодог. Бидний аюулгүй байдлын тасралтгүй ажлын хүрээнд өнөөг хүртэлх хамгийн найдвартай moderation загвар болох text-moderation-007-г гаргаж байна. text-moderation-latest болон text-moderation-stable alias-уудыг түүн рүү заахаар шинэчилсэн. Аюулгүй AI систем бүтээх талаар манай safety best practices guide(шинэ цонхонд нээгдэнэ)-аас илүү ихийг мэдэж болно.
Хөгжүүлэгчдэд хэрэглээгээ илүү сайн харах боломж, API key-үүд дээр илүү их хяналт өгөхийн тулд бид платформын хоёр сайжруулалтыг нэвтрүүлж байна.
Нэгдүгээрт, хөгжүүлэгчид одоо API keys page(шинэ цонхонд нээгдэнэ)-ээс API key-үүдэд зөвшөөрөл оноох боломжтой боллоо. Жишээлбэл, ямар нэг key-д дотоод хяналтын dashboard-ийг ажиллуулахын тулд зөвхөн унших эрх өгөх, эсвэл зөвхөн тодорхой эцсийн цэгүүдэд хандахаар хязгаарлах боломжтой.
Хоёрдугаарт, tracking-ийг асаасны(шинэ цонхонд нээгдэнэ) дараа usage dashboard болон usage export функц API key түвшний хэмжүүрүүдийг одоо харуулдаг болсон. Ингэснээр feature, баг, бүтээгдэхүүн, эсвэл төсөл тус бүрээр хэрэглээг харах нь маш энгийн болсон бөгөөд үүнд тус бүрт нь салангид API key ашиглахад л хангалттай.

Ирэх саруудад бид ялангуяа том байгууллагуудад хөгжүүлэгчид API хэрэглээгээ харах, API key-үүдийг удирдах боломжийг улам сайжруулахаар төлөвлөж байна.
OpenAI-ийн API-уудын хамгийн сүүлийн үеийн шинэчлэлтүүдийг авахын тулд X дээрх @OpenAIDevs(шинэ цонхонд нээгдэнэ) хаягийг дагаарай.
Зохиогч
Талархал
Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore


