2024 ж. 25 қаңтар

New embedding models and API updates

Жүктелуде…

Біз жаңа модельдерді шығарып, GPT‑3.5 Turbo үшін бағаларды төмендетіп, әзірлеушілерге API кілттерін басқару және API қолданылуын түсінудің жаңа тәсілдерін ұсынып отырмыз. Жаңа модельдерге мыналар кіреді:

Екі жаңа ендіру моделі
Жаңартылған GPT‑4 Turbo алдын ала қарау моделі
Жаңартылған GPT‑3.5 Turbo моделі
Жаңартылған мәтінді модерациялау моделі

Әдепкі бойынша, OpenAI API-іне жіберілген деректер OpenAI модельдерін үйрету немесе жақсарту үшін пайдаланылмайды.

Төмен бағамен жаңа ендіру модельдері

Біз екі жаңа ендіру моделін ұсынып отырмыз: кішірек әрі жоғары тиімді text-embedding-3-small моделі және үлкенірек әрі қуаттырақ text-embedding-3-large моделі.

Ендіру⁠ — табиғи тіл немесе код сияқты мазмұн ішіндегі ұғымдарды білдіретін сандар тізбегі. Ендірулер машиналық оқыту модельдері мен басқа алгоритмдерге мазмұн арасындағы байланыстарды түсінуді және кластерлеу не іздеп табу сияқты тапсырмаларды орындауды жеңілдетеді. Олар ChatGPT пен Assistants API ішіндегі білімді іздеп табу сияқты қолданбаларды, сондай-ақ retrieval augmented generation (RAG) әзірлеуші құралдарының көбін қамтамасыз етеді.

Жүктелуде...

Жаңа шағын мәтіндік ендіру моделі

text-embedding-3-small — біздің жаңа жоғары тиімді ендіру моделіміз және 2022 жылғы желтоқсанда⁠ шығарылған алдыңғы text-embedding-ada-002 моделіне қарағанда елеулі жаңарту ұсынады.

Күштірек өнімділік. text-embedding-ada-002 мен text-embedding-3-small модельдерін салыстырғанда, көптілді іздеп табуға арналған кең қолданылатын бенчмарктегі (MIRACL⁠(жаңа терезеде ашылады)) орташа ұпай 31.4%-дан 44.0%-ға дейін өсті, ал ағылшын тіліндегі тапсырмаларға арналған кең қолданылатын бенчмарктегі (MTEB⁠(жаңа терезеде ашылады)) орташа ұпай 61.0%-дан 62.3%-ға дейін өсті.

Баға төмендеді. text-embedding-3-small моделі де алдыңғы буындағы text-embedding-ada-002 моделімізге қарағанда едәуір тиімді. Сондықтан text-embedding-3-small бағасы text-embedding-ada-002-пен салыстырғанда 5 есе төмендетілді: 1k токен бағасы $0.0001-ден $0.00002-ге түсті.

Біз text-embedding-ada-002 моделін ескірген деп жарияламаймыз, сондықтан жаңа модельді ұсынғанымызбен, тұтынушылар алдыңғы буын моделін пайдалануды жалғастыра алады.

Жаңа үлкен мәтіндік ендіру моделі: text-embedding-3-large

text-embedding-3-large — келесі буындағы жаңа үлкен ендіру моделіміз және 3072 өлшемге дейінгі ендірулер жасайды.

Күштірек өнімділік. text-embedding-3-large — өнімділігі ең жоғары жаңа моделіміз. text-embedding-ada-002 мен text-embedding-3-large модельдерін салыстырғанда: MIRACL бойынша орташа ұпай 31.4%-дан 54.9%-ға дейін өсті, ал MTEB бойынша орташа ұпай 61.0%-дан 64.6%-ға дейін өсті.

Бағалау бенчмаркі	ada v2	text-embedding-3-small	text-embedding-3-large
MIRACL орташа көрсеткіші	31.4	44.0	54.9
MTEB орташа көрсеткіші	61.0	62.3	64.6

text-embedding-3-large бағасы 1k токен үшін $0.00013 болады.

Жаңа ендіру модельдерін пайдалану туралы толығырақ біздің Embeddings нұсқаулығымыздан⁠(жаңа терезеде ашылады) біле аласыз.

Ендірулерді қысқартуға арналған жергілікті қолдау

Үлкенірек ендірулерді пайдалану, мысалы оларды іздеп табу үшін векторлық қоймада сақтау, әдетте кішірек ендірулерді пайдалануға қарағанда көбірек шығынды талап етеді және көбірек есептеу ресурсын, жадты және сақтау орнын тұтынады.

Жаңа екі ендіру моделіміз де әзірлеушілерге ендірулерді пайдалануда өнімділік пен құн арасындағы тепе-теңдікті таңдауға мүмкіндік беретін technique^A әдісімен үйретілді. Атап айтқанда, әзірлеушілер dimensions API параметрін беру арқылы ендірулерді олардың ұғымды білдіру қасиеттерін жоғалтпай қысқарта алады (яғни тізбектің соңынан кейбір сандарды алып тастай алады). Мысалы, MTEB бенчмаркі бойынша text-embedding-3-large ендіруін 256 өлшемге дейін қысқартуға болады, әрі ол 1536 өлшемді қысқартылмаған text-embedding-ada-002 ендіруінен бәрібір жақсырақ нәтиже көрсетеді.

Жүктелуде...

Бұл өте икемді пайдалануға мүмкіндік береді. Мысалы, тек 1024 өлшемге дейінгі ендірулерді қолдайтын векторлық деректер қоймасын пайдаланғанда, әзірлеушілер әлі де біздің ең жақсы ендіру моделіміз text-embedding-3-large моделін пайдаланып, dimensions API параметрі үшін 1024 мәнін көрсете алады, бұл ендіруді 3072 өлшемнен қысқартады және кішірек вектор өлшемі үшін дәлдіктің бір бөлігін айырбастауға мүмкіндік береді.

Басқа жаңа модельдер және төмен бағалар

Жаңартылған GPT-3.5 Turbo моделі және төмен бағалар

Келесі аптада біз жаңа GPT‑3.5 Turbo моделін, gpt-3.5-turbo-0125, ұсынамыз және соңғы бір жылда үшінші рет тұтынушыларымызға ауқымын кеңейтуге көмектесу үшін GPT‑3.5 Turbo бағаларын төмендетеміз. Жаңа модель үшін кіріс бағалары 50%-ға төмендеп, 1K токен үшін $0.0005 болады, ал шығыс бағалары 25%-ға төмендеп, 1K токен үшін $0.0015 болады. Бұл модельде сұралған форматтарда жауап беру дәлдігінің жоғарылауы және ағылшын тілінен басқа тілдердегі функция шақыруларында мәтін кодтауы мәселесін тудырған қатенің⁠(жаңа терезеде ашылады) түзетімі сияқты түрлі жақсартулар да болады.

Бекітілмеген gpt-3.5-turbo модель бүркеншік атын пайдаланатын тұтынушылар бұл модель іске қосылғаннан екі апта өткен соң gpt-3.5-turbo-0613 нұсқасынан gpt-3.5-turbo-0125 нұсқасына автоматты түрде жаңартылады.

Жаңартылған GPT-4 Turbo алдын ала қарауы

GPT‑4 API тұтынушыларынан келетін сұраулардың 70%-дан астамы GPT‑4 Turbo шыққаннан бері соған ауысты, өйткені әзірлеушілер оның жаңартылған білім шегін, 128k көлеміндегі үлкенірек контекст терезелерін және төмен бағаларын пайдаланып отыр.

Бүгін біз жаңартылған GPT‑4 Turbo алдын ала қарау моделін, gpt-4-0125-preview, шығарамыз. Бұл модель код жасау сияқты тапсырмаларды алдыңғы алдын ала қарау моделіне қарағанда толығырақ орындайды және модель тапсырманы аяқтамай қоятын «жалқаулық» жағдайларын азайтуға арналған. Жаңа модельге ағылшын тілінен басқа UTF-8 генерацияларына әсер еткен қате түзетімі де енгізілген.

GPT‑4 Turbo алдын ала қарауының жаңа нұсқаларына автоматты түрде жаңартылғысы келетіндер үшін біз сондай-ақ жаңа gpt-4-turbo-preview модель атауының бүркеншік атын енгізіп отырмыз, ол әрқашан GPT‑4 Turbo алдын ала қарауының ең соңғы моделіне нұсқайды.

Алдағы айларда көру мүмкіндігі бар GPT‑4 Turbo моделін жалпы қолжетімділікке шығаруды жоспарлап отырмыз.

Жаңартылған модерация моделі

Тегін Moderation API әзірлеушілерге ықтимал зиянды мәтінді анықтауға мүмкіндік береді. Қауіпсіздік бойынша үздіксіз жұмысымыздың бір бөлігі ретінде біз бүгінгі күнге дейінгі ең мықты модерация моделіміз text-moderation-007 моделін шығарып отырмыз. text-moderation-latest және text-moderation-stable бүркеншік аттары енді осы модельге нұсқайтын болып жаңартылды. Қауіпсіз AI жүйелерін құру туралы толығырақ біздің қауіпсіздік бойынша үздік тәжірибелер нұсқаулығымыздан⁠(жаңа терезеде ашылады) біле аласыз.

API қолданылуын түсінудің және API кілттерін басқарудың жаңа тәсілдері

Біз әзірлеушілерге өз қолданылуын жақсырақ көруге және API кілттерін көбірек бақылауға мүмкіндік беретін платформаның екі жетілдіруін іске қосып отырмыз.

Біріншіден, енді әзірлеушілер API кілттері бетінен⁠(жаңа терезеде ашылады) API кілттеріне рұқсаттар тағайындай алады. Мысалы, кілтке ішкі бақылау тақтасын қуаттандыру үшін тек оқу рұқсаты берілуі немесе тек белгілі бір соңғы нүктелерге қатынаумен шектелуі мүмкін.

Екіншіден, енді қолданылу бақылау тақтасы мен қолданылуды экспорттау функциясы бақылауды қосқаннан кейін⁠(жаңа терезеде ашылады) API кілті деңгейіндегі метрикаларды көрсетеді. Бұл әрқайсысы үшін бөлек API кілттерін пайдалану арқылы функция, команда, өнім немесе жоба деңгейінде қолданылуды көруді оңайлатады.

Алдағы айларда біз әзірлеушілердің API қолданылуын көру және API кілттерін басқару мүмкіндігін, әсіресе ірі ұйымдарда, одан әрі жақсартуды жоспарлап отырмыз.

OpenAI API-леріне қатысты соңғы жаңартуларды білу үшін X желісінде @OpenAIDevs⁠(жаңа терезеде ашылады) аккаунтымызға жазылыңыз.

Түсіндірме ескертпелер

A
Matryoshka Representation Learning⁠(жаңа терезеде ашылады)

Автор

OpenAI

Алғыс білдіру

Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore

Қатысты мақалалар

Барлығын қарау

Жаһандық жаңалық серіктестіктері: Le Monde және Prisa Media

Компания2024 ж. 13 нау.

News > Company carousel > Review completed > Media

Тексеру аяқталды, Altman мен Brockman OpenAI-ды басқаруды жалғастырады

Компания2024 ж. 8 нау.

OpenAI директорлар кеңесіне жаңа мүшелердің қосылғанын хабарлайды

Компания2024 ж. 8 нау.