GPT‑4 API general availability and deprecation of older models in the Completions API

2024 оны 4-р сарын 24-ний шинэчлэлт: ChatGPT API нэрийг зогсоосон. Энэ блог дахь ChatGPT API-ийн дурдлагууд нь GPT‑3.5 Turbo API-г хэлж байна.
Өнөөдрөөс эхлэн төлбөртэй бүх API хэрэглэгч GPT‑4‑д хандах эрхтэй боллоо. Гуравдугаар сард бид OpenAI API-г танилцуулсан, мөн энэ сарын эхээр анхны шинэчлэлтүүдээ гаргасан чатад суурилсан загваруудад. Бид чатад суурилсан загварууд ямар ч хэрэглээний тохиолдлыг дэмжих ирээдүйг төсөөлж байна. Өнөөдөр бид Completions API-ийн хуучин загваруудын хэрэглээнээс хасах төлөвлөгөөг зарлаж, хэрэглэгчдэд чат боловсруулах API-г хэрэглэхийг зөвлөж байна.
GPT‑4 бол манай хамгийн чадвартай загвар. Гуравдугаар сараас хойш сая сая хөгжүүлэгч GPT‑4 API-д нэвтрэх хүсэлт гаргасан бөгөөд GPT‑4‑ийг ашигласан шинэлэг бүтээгдэхүүнүүдийн хүрээ өдөр бүр тэлж байна. Өнөөдөр амжилттай төлбөрийн түүхтэй бүх одоогийн API хөгжүүлэгч 8K контексттэй GPT‑4 API-д хандах боломжтой боллоо. Энэ сарын эцэс гэхэд шинэ хөгжүүлэгчдэд хандалтыг нээж, дараа нь тооцооллын нөөцөөс хамааран rate limit-ийг нэмэгдүүлж эхлэхээр төлөвлөж байна.
Эдгээр загварууд үйлдвэрлэлийн хэмжээний хэрэглээнд тогтвортой, бэлэн болсон тул бид GPT‑3.5 Turbo, DALL·E болон Whisper API-уудыг мөн ерөнхий хүртээмжтэй болгож байна. Бид GPT‑4 болон GPT‑3.5 Turbo-д зориулсан fine-tuning-ийг аюулгүйгээр нэвтрүүлэхээр ажиллаж байгаа бөгөөд энэ боломжийг энэ оны сүүлээр гарна гэж найдаж байна.
Бид гуравдугаар сард чат боловсруулах API(шинэ цонхонд нээгдэнэ)-г танилцуулсан бөгөөд одоо энэ нь манай API дахь GPT ашиглалтын 97%-ийг бүрдүүлж байна.
Анхны Completions API нь манай хэлний загваруудтай харилцах чөлөөт хэлбэрийн текст өгөгдөл өгөхөөр 2020 оны 6-р сард танилцуулагдсан. Түүнээс хойш илүү бүтэцтэй өгөгдлийн интерфэйсээр бид илүү сайн үр дүн гаргаж чаддагийг ойлгосон. Чатад суурилсан парадигм нь хүчирхэг болохоо баталж, өмнөх хэрэглээний ихэнх тохиолдол болон шинэ ярианы хэрэгцээг хангахын зэрэгцээ илүү уян хатан, тодорхой байдлыг өгч байна. Ялангуяа чат боловсруулах API-ийн бүтэцтэй интерфэйс (жиш., system message, функц дуудах) болон олон ээлжтэй ярианы боломжууд нь хөгжүүлэгчдэд ярианы туршлага болон completion төрлийн өргөн хүрээний даалгавруудыг бүтээх боломж олгодог. Мөн хэрэглэгчийн өгсөн агуулгыг заавраас бүтцийн хувьд тусгаарлаж болдог тул зааварт халдлагын эрсдэлийг бууруулахад тусалдаг.
Бид хөгжүүлэгчдэд улам чадвартай, хэрэглэхэд хялбар туршлага санал болгоно гэж үзэж байгаа тул платформынхаа хүчин чармайлтын ихэнхийг энэ чиглэлд үргэлжлүүлэн хөрөнгө оруулахаар төлөвлөж байна. Бид хариултын “яриасаг” байдлыг бууруулахын тулд completion токенуудын log probability болон удирдах чадварыг нэмэгдүүлэх зэрэг чат боловсруулах API-н сүүлийн хэдэн үлдсэн цоорхойг хурдан нөхөхөөр ажиллаж байна.
чат боловсруулах API-д оруулж буй хөрөнгө оруулалтаа нэмэгдүүлэхийн зэрэгцээ тооцооллын хүчин чадлаа оновчлох ажлын хүрээнд бид 6 сарын дараа Completions API ашигладаг зарим хуучин загваруудаа зогсооно. Энэ API нээлттэй хэвээр байх боловч өнөөдрөөс эхлэн хөгжүүлэгчийн баримт бичигт “legacy” гэж тэмдэглэнэ. Цаашдын загвар болон бүтээгдэхүүний сайжруулалтууд чат боловсруулах API дээр төвлөрнө гэж бид төлөвлөж байгаа бөгөөд Completions API ашигладаг шинэ загваруудыг олон нийтэд гаргах төлөвлөгөө одоогоор байхгүй.
2024 оны 1-р сарын 4-нөөс эхлэн хуучин completion загварууд(шинэ цонхонд нээгдэнэ) ашиглах боломжгүй болж, дараах загваруудаар солигдоно:
Хуучин загвар | Шинэ загвар |
|---|---|
ada | babbage-002 |
babbage | babbage-002 |
curie | davinci-002 |
davinci | davinci-002 |
davinci-instruct-beta | gpt-3.5-turbo-instruct |
curie-instruct-beta | gpt-3.5-turbo-instruct |
text-ada-001 | gpt-3.5-turbo-instruct |
text-babbage-001 | gpt-3.5-turbo-instruct |
text-curie-001 | gpt-3.5-turbo-instruct |
text-davinci-001 | gpt-3.5-turbo-instruct |
text-davinci-002 | gpt-3.5-turbo-instruct |
text-davinci-003 | gpt-3.5-turbo-instruct |
Суурь GPT‑3 загваруудын тогтвортой загварын нэрийг (ada, babbage, curie, davinci) ашиглаж буй аппликейшнууд 2024 оны 1-р сарын 4-нд дээр жагсаасан шинэ загварууд руу автоматаар шинэчлэгдэнэ. Мөн дараах загварын нэрсийг API дуудлагад зааснаар ойрын хэдэн долоо хоногт эрт туршилтад шинэ загваруудыг ашиглах боломжтой болно: babbage-002, davinci-002.
Бусад хуучин completion загваруудыг (жишээ нь text-davinci-003) ашиглаж буй хөгжүүлэгчид 2024 оны 1-р сарын 4-нөөс өмнө API хүсэлтийнхээ “model” параметрт gpt-3.5-turbo-instruct-ийг зааж, интеграциа гараар шинэчлэх шаардлагатай. gpt-3.5-turbo-instruct нь text-davinci-003-тай төстэйгээр сургагдсан InstructGPT хэв маягийн загвар юм. Энэ шинэ загвар нь Completions API дотор шууд орлуулах хувилбар бөгөөд ойрын хэдэн долоо хоногт эрт туршилтад нээлттэй болно.
2024 оны 1-р сарын 4-нөөс хойш fine-tuned загваруудаа үргэлжлүүлэн ашиглахыг хүсэж буй хөгжүүлэгчид шинэ суурь GPT‑3 загварууд (babbage-002, davinci-002) эсвэл илүү шинэ загварууд (gpt-3.5-turbo, gpt-4) дээр орлуулах хувилбаруудыг дахин fine-tune хийх шаардлагатай. Энэ боломж энэ оны сүүлээр нээгдэх үед бид өмнө нь хуучин загваруудыг fine-tune хийж байсан хэрэглэгчдэд GPT‑3.5 Turbo болон GPT‑4 fine-tuning-д давуу эрхтэй хандалт олгоно. Өөрийн өгөгдлөөр fine-tune хийсэн загвараас шилжих нь хэцүү гэдгийг бид хүлээн зөвшөөрч байна. Энэ шилжилтийг аль болох жигд болгохын тулд өмнө нь загвараа fine-tune хийж байсан хэрэглэгчдэд дэмжлэг үзүүлнэ.
Ойрын хэдэн долоо хоногт бид эдгээр хуучин загваруудыг саяхан ашигласан хөгжүүлэгчидтэй холбогдож, шинэ completion загварууд эрт туршилтад бэлэн болмогц илүү дэлгэрэнгүй мэдээлэл өгнө.
Хуучин embedding загваруудын хэрэглэгчид (жиш., text-search-davinci-doc-001) 2024 оны 1-р сарын 4-нөөс өмнө text-embedding-ada-002 руу шилжих шаардлагатай. Бид text-embedding-ada-002-г 2022 оны 12-р сард гаргасан бөгөөд өмнөх загваруудаас илүү чадвартай, зардлын хувьд үр ашигтай болохыг тогтоосон. Өнөөдөр text-embedding-ada-002 нь embedding API ашиглалтын 99.9%-ийг бүрдүүлж байна.
Энэ нь тэдгээр хуучин загваруудыг ашиглаж буй хөгжүүлэгчдийн хувьд томоохон өөрчлөлт гэдгийг бид ойлгож байна. Эдгээр загваруудыг зогсоох шийдвэрийг бид хөнгөнөөр гаргаагүй. Хэрэглэгчид эдгээр шинэ загвараар контентоо дахин embedding хийх санхүүгийн зардлыг бид хариуцна. Ойрын өдрүүдэд нөлөөлөлд өртсөн хэрэглэгчидтэй холбогдох болно.
Хуучин загвар | Шинэ загвар |
|---|---|
code-search-ada-code-001 | text-embedding-ada-002 |
code-search-ada-text-001 | text-embedding-ada-002 |
code-search-babbage-code-001 | text-embedding-ada-002 |
code-search-babbage-text-001 | text-embedding-ada-002 |
text-search-ada-doc-001 | text-embedding-ada-002 |
text-search-ada-query-001 | text-embedding-ada-002 |
text-search-babbage-doc-001 | text-embedding-ada-002 |
text-search-babbage-query-001 | text-embedding-ada-002 |
text-search-curie-doc-001 | text-embedding-ada-002 |
text-search-curie-query-001 | text-embedding-ada-002 |
text-search-davinci-doc-001 | text-embedding-ada-002 |
text-search-davinci-query-001 | text-embedding-ada-002 |
text-similarity-ada-001 | text-embedding-ada-002 |
text-similarity-babbage-001 | text-embedding-ada-002 |
text-similarity-curie-001 | text-embedding-ada-002 |
text-similarity-davinci-001 | text-embedding-ada-002 |
Edits API болон түүнтэй холбоотой загваруудын хэрэглэгчид (жиш., text-davinci-edit-001 эсвэл code-davinci-edit-001) 2024 оны 1-р сарын 4-нөөс өмнө GPT‑3.5 Turbo руу шилжих шаардлагатай. Edits API beta нь зааварт үндэслэн өгөгдлийн засварласан хувилбарыг буцаах боломжийг хөгжүүлэгчдэд олгох зорилготой эрт үеийн туршилтын API байсан. Бид gpt-3.5-turbo болон чат боловсруулах API-г хөгжүүлэхдээ Edits API-аас авсан санал хүсэлтийг тусгасан бөгөөд одоо үүнийг ижил зорилгоор ашиглаж болно:


