
Біз жаңа модельдерді шығарып, GPT‑3.5 Turbo үшін бағаларды төмендетіп, әзірлеушілерге API кілттерін басқару және API қолданылуын түсінудің жаңа тәсілдерін ұсынып отырмыз. Жаңа модельдерге мыналар кіреді:
- Екі жаңа ендіру моделі
- Жаңартылған GPT‑4 Turbo алдын ала қарау моделі
- Жаңартылған GPT‑3.5 Turbo моделі
- Жаңартылған мәтінді модерациялау моделі
Әдепкі бойынша, OpenAI API-іне жіберілген деректер OpenAI модельдерін үйрету немесе жақсарту үшін пайдаланылмайды.
Біз екі жаңа ендіру моделін ұсынып отырмыз: кішірек әрі жоғары тиімді text-embedding-3-small моделі және үлкенірек әрі қуаттырақ text-embedding-3-large моделі.
Ендіру — табиғи тіл немесе код сияқты мазмұн ішіндегі ұғымдарды білдіретін сандар тізбегі. Ендірулер машиналық оқыту модельдері мен басқа алгоритмдерге мазмұн арасындағы байланыстарды түсінуді және кластерлеу не іздеп табу сияқты тапсырмаларды орындауды жеңілдетеді. Олар ChatGPT пен Assistants API ішіндегі білімді іздеп табу сияқты қолданбаларды, сондай-ақ retrieval augmented generation (RAG) әзірлеуші құралдарының көбін қамтамасыз етеді.
text-embedding-3-small — біздің жаңа жоғары тиімді ендіру моделіміз және 2022 жылғы желтоқсанда шығарылған алдыңғы text-embedding-ada-002 моделіне қарағанда елеулі жаңарту ұсынады.
Күштірек өнімділік. text-embedding-ada-002 мен text-embedding-3-small модельдерін салыстырғанда, көптілді іздеп табуға арналған кең қолданылатын бенчмарктегі (MIRACL(жаңа терезеде ашылады)) орташа ұпай 31.4%-дан 44.0%-ға дейін өсті, ал ағылшын тіліндегі тапсырмаларға арналған кең қолданылатын бенчмарктегі (MTEB(жаңа терезеде ашылады)) орташа ұпай 61.0%-дан 62.3%-ға дейін өсті.
Баға төмендеді. text-embedding-3-small моделі де алдыңғы буындағы text-embedding-ada-002 моделімізге қарағанда едәуір тиімді. Сондықтан text-embedding-3-small бағасы text-embedding-ada-002-пен салыстырғанда 5 есе төмендетілді: 1k токен бағасы $0.0001-ден $0.00002-ге түсті.
Біз text-embedding-ada-002 моделін ескірген деп жарияламаймыз, сондықтан жаңа модельді ұсынғанымызбен, тұтынушылар алдыңғы буын моделін пайдалануды жалғастыра алады.
Жаңа үлкен мәтіндік ендіру моделі: text-embedding-3-large
text-embedding-3-large — келесі буындағы жаңа үлкен ендіру моделіміз және 3072 өлшемге дейінгі ендірулер жасайды.
Күштірек өнімділік. text-embedding-3-large — өнімділігі ең жоғары жаңа моделіміз. text-embedding-ada-002 мен text-embedding-3-large модельдерін салыстырғанда: MIRACL бойынша орташа ұпай 31.4%-дан 54.9%-ға дейін өсті, ал MTEB бойынша орташа ұпай 61.0%-дан 64.6%-ға дейін өсті.
Бағалау бенчмаркі | ada v2 | text-embedding-3-small | text-embedding-3-large |
MIRACL орташа көрсеткіші | 31.4 | 44.0 | 54.9 |
MTEB орташа көрсеткіші | 61.0 | 62.3 | 64.6 |
text-embedding-3-large бағасы 1k токен үшін $0.00013 болады.
Жаңа ендіру модельдерін пайдалану туралы толығырақ біздің Embeddings нұсқаулығымыздан(жаңа терезеде ашылады) біле аласыз.
Үлкенірек ендірулерді пайдалану, мысалы оларды іздеп табу үшін векторлық қоймада сақтау, әдетте кішірек ендірулерді пайдалануға қарағанда көбірек шығынды талап етеді және көбірек есептеу ресурсын, жадты және сақтау орнын тұтынады.
Жаңа екі ендіру моделіміз де әзірлеушілерге ендірулерді пайдалануда өнімділік пен құн арасындағы тепе-теңдікті таңдауға мүмкіндік беретін techniqueA әдісімен үйретілді. Атап айтқанда, әзірлеушілер dimensions API параметрін беру арқылы ендірулерді олардың ұғымды білдіру қасиеттерін жоғалтпай қысқарта алады (яғни тізбектің соңынан кейбір сандарды алып тастай алады). Мысалы, MTEB бенчмаркі бойынша text-embedding-3-large ендіруін 256 өлшемге дейін қысқартуға болады, әрі ол 1536 өлшемді қысқартылмаған text-embedding-ada-002 ендіруінен бәрібір жақсырақ нәтиже көрсетеді.
Бұл өте икемді пайдалануға мүмкіндік береді. Мысалы, тек 1024 өлшемге дейінгі ендірулерді қолдайтын векторлық деректер қоймасын пайдаланғанда, әзірлеушілер әлі де біздің ең жақсы ендіру моделіміз text-embedding-3-large моделін пайдаланып, dimensions API параметрі үшін 1024 мәнін көрсете алады, бұл ендіруді 3072 өлшемнен қысқартады және кішірек вектор өлшемі үшін дәлдіктің бір бөлігін айырбастауға мүмкіндік береді.
Келесі аптада біз жаңа GPT‑3.5 Turbo моделін, gpt-3.5-turbo-0125, ұсынамыз және соңғы бір жылда үшінші рет тұтынушыларымызға ауқымын кеңейтуге көмектесу үшін GPT‑3.5 Turbo бағаларын төмендетеміз. Жаңа модель үшін кіріс бағалары 50%-ға төмендеп, 1K токен үшін $0.0005 болады, ал шығыс бағалары 25%-ға төмендеп, 1K токен үшін $0.0015 болады. Бұл модельде сұралған форматтарда жауап беру дәлдігінің жоғарылауы және ағылшын тілінен басқа тілдердегі функция шақыруларында мәтін кодтауы мәселесін тудырған қатенің(жаңа терезеде ашылады) түзетімі сияқты түрлі жақсартулар да болады.
Бекітілмеген gpt-3.5-turbo модель бүркеншік атын пайдаланатын тұтынушылар бұл модель іске қосылғаннан екі апта өткен соң gpt-3.5-turbo-0613 нұсқасынан gpt-3.5-turbo-0125 нұсқасына автоматты түрде жаңартылады.
GPT‑4 API тұтынушыларынан келетін сұраулардың 70%-дан астамы GPT‑4 Turbo шыққаннан бері соған ауысты, өйткені әзірлеушілер оның жаңартылған білім шегін, 128k көлеміндегі үлкенірек контекст терезелерін және төмен бағаларын пайдаланып отыр.
Бүгін біз жаңартылған GPT‑4 Turbo алдын ала қарау моделін, gpt-4-0125-preview, шығарамыз. Бұл модель код жасау сияқты тапсырмаларды алдыңғы алдын ала қарау моделіне қарағанда толығырақ орындайды және модель тапсырманы аяқтамай қоятын «жалқаулық» жағдайларын азайтуға арналған. Жаңа модельге ағылшын тілінен басқа UTF-8 генерацияларына әсер еткен қате түзетімі де енгізілген.
GPT‑4 Turbo алдын ала қарауының жаңа нұсқаларына автоматты түрде жаңартылғысы келетіндер үшін біз сондай-ақ жаңа gpt-4-turbo-preview модель атауының бүркеншік атын енгізіп отырмыз, ол әрқашан GPT‑4 Turbo алдын ала қарауының ең соңғы моделіне нұсқайды.
Алдағы айларда көру мүмкіндігі бар GPT‑4 Turbo моделін жалпы қолжетімділікке шығаруды жоспарлап отырмыз.
Тегін Moderation API әзірлеушілерге ықтимал зиянды мәтінді анықтауға мүмкіндік береді. Қауіпсіздік бойынша үздіксіз жұмысымыздың бір бөлігі ретінде біз бүгінгі күнге дейінгі ең мықты модерация моделіміз text-moderation-007 моделін шығарып отырмыз. text-moderation-latest және text-moderation-stable бүркеншік аттары енді осы модельге нұсқайтын болып жаңартылды. Қауіпсіз AI жүйелерін құру туралы толығырақ біздің қауіпсіздік бойынша үздік тәжірибелер нұсқаулығымыздан(жаңа терезеде ашылады) біле аласыз.
Біз әзірлеушілерге өз қолданылуын жақсырақ көруге және API кілттерін көбірек бақылауға мүмкіндік беретін платформаның екі жетілдіруін іске қосып отырмыз.
Біріншіден, енді әзірлеушілер API кілттері бетінен(жаңа терезеде ашылады) API кілттеріне рұқсаттар тағайындай алады. Мысалы, кілтке ішкі бақылау тақтасын қуаттандыру үшін тек оқу рұқсаты берілуі немесе тек белгілі бір соңғы нүктелерге қатынаумен шектелуі мүмкін.
Екіншіден, енді қолданылу бақылау тақтасы мен қолданылуды экспорттау функциясы бақылауды қосқаннан кейін(жаңа терезеде ашылады) API кілті деңгейіндегі метрикаларды көрсетеді. Бұл әрқайсысы үшін бөлек API кілттерін пайдалану арқылы функция, команда, өнім немесе жоба деңгейінде қолданылуды көруді оңайлатады.

Алдағы айларда біз әзірлеушілердің API қолданылуын көру және API кілттерін басқару мүмкіндігін, әсіресе ірі ұйымдарда, одан әрі жақсартуды жоспарлап отырмыз.
OpenAI API-леріне қатысты соңғы жаңартуларды білу үшін X желісінде @OpenAIDevs(жаңа терезеде ашылады) аккаунтымызға жазылыңыз.
Түсіндірме ескертпелер
Автор
Алғыс білдіру
Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore


