Пређите на главни садржај
OpenAI
Учитавање…

Објављујемо нове моделе, снижавамо цене за GPT‑3.5 Turbo и уводимо нове начине да програмери управљају API кључевима и разумеју употребу API-ја. Нови модели укључују:

  • Два нова embedding модела
  • Ажурирани прегледни модел GPT‑4 Turbo
  • Ажурирани модел GPT‑3.5 Turbo
  • Ажурирани модел за модерацију текста

Подаци послати OpenAI API-ју се подразумевано неће користити за обучавање или побољшање OpenAI модела.

Нови embedding модели са нижим ценама

Уводимо два нова embedding модела: мањи и веома ефикасан модел text-embedding-3-small, и већи и моћнији модел text-embedding-3-large.

Embedding је низ бројева који представља појмове унутар садржаја као што су природни језик или код. Embeddings олакшавају моделима машинског учења и другим алгоритмима да разумеју односе између садржаја и да обављају задатке као што су груписање или проналажење. Они покрећу апликације као што су проналажење знања и у ChatGPT‑у и у Assistants API-ју, као и многе алате за програмере за retrieval augmented generation (RAG).

Учитавање...

Нови мали модел за уграђивање текста

text-embedding-3-small је наш нови веома ефикасан embedding модел и доноси значајно унапређење у односу на свог претходника, модел text-embedding-ada-002 објављен у децембру 2022.

Боље перформансе. Поређењем text-embedding-ada-002 и text-embedding-3-small, просечан резултат на често коришћеном реперу за вишејезично проналажење (MIRACL(отвара се у новом прозору)) повећан је са 31.4% на 44.0%, док је просечан резултат на често коришћеном реперу за задатке на енглеском (MTEB(отвара се у новом прозору)) повећан са 61.0% на 62.3%.

Снижена цена. text-embedding-3-small је такође знатно ефикаснији од нашег модела претходне генерације text-embedding-ada-002. Цена за text-embedding-3-small је зато снижена 5 пута у односу на text-embedding-ada-002, са цене од $0.0001 по 1k токена на $0.00002.

Не укидамо text-embedding-ada-002, тако да, иако препоручујемо новији модел, корисници могу слободно да наставе да користе модел претходне генерације.

Нови велики модел за уграђивање текста: text-embedding-3-large

text-embedding-3-large је наш нови већи embedding модел следеће генерације и креира embedding-е са до 3072 димензије.

Боље перформансе. text-embedding-3-large је наш нови модел са најбољим перформансама. У поређењу text-embedding-ada-002 и text-embedding-3-large: на MIRACL-у, просечан резултат је повећан са 31.4% на 54.9%, док је на MTEB-у просечан резултат повећан са 61.0% на 64.6%.

Репер за евалуацију

ada v2

text-embedding-3-small

text-embedding-3-large

Просек MIRACL

31.4

44.0

54.9

Просек MTEB

61.0

62.3

64.6

text-embedding-3-large ће коштати $0.00013 / 1k токена.

Више о коришћењу нових embedding модела можете сазнати у нашем водичу за Embeddings(отвара се у новом прозору).

Изворна подршка за скраћивање embedding-а

Коришћење већих embedding-а, на пример њихово чување у векторском складишту ради проналажења, генерално више кошта и троши више рачунарских ресурса, меморије и простора за складиштење него коришћење мањих embedding-а.

Оба наша нова embedding модела обучена су техникомA која омогућава програмерима да праве компромис између перформанси и цене коришћења embedding-а. Конкретно, програмери могу да скрате embedding-е (тј. да уклоне неке бројеве са краја низа) а да embedding не изгуби своја својства представљања појмова, тако што ће проследити API параметар dimensions. На пример, на MTEB реперу, embedding text-embedding-3-large може да се скрати на величину 256 и да и даље надмашује нескраћени embedding text-embedding-ada-002 величине 1536.

Учитавање...

Ово омогућава веома флексибилну употребу. На пример, када се користи векторско складиште података које подржава само embedding-е дужине до 1024 димензије, програмери сада и даље могу да користе наш најбољи embedding модел text-embedding-3-large и наведу вредност 1024 за API параметар dimensions, што ће скратити embedding са 3072 димензије, уз одређени губитак прецизности у замену за мању величину вектора.

Други нови модели и ниже цене

Ажурирани модел GPT-3.5 Turbo и ниже цене

Следеће недеље уводимо нови модел GPT‑3.5 Turbo, gpt-3.5-turbo-0125, и по трећи пут у последњих годину дана снижавамо цене за GPT‑3.5 Turbo како бисмо помогли нашим корисницима да се прошире. Улазне цене за нови модел снижене су за 50% на $0.0005 /1K токена, а излазне цене снижене су за 25% на $0.0015 /1K токена. Овај модел ће такође имати разна побољшања, укључујући већу тачност у одговарању у траженим форматима и исправку грешке(отвара се у новом прозору) која је изазивала проблем кодирања текста за позиве функција на неенглеским језицима.

Корисници који користе неприквачени алијас модела gpt-3.5-turbo биће аутоматски надограђени са gpt-3.5-turbo-0613 на gpt-3.5-turbo-0125 две недеље након покретања овог модела.

Ажурирани преглед GPT-4 Turbo

Више од 70% захтева корисника GPT‑4 API-ја прешло је на GPT‑4 Turbo од његовог објављивања, јер програмери користе предности ажурираног ограничења знања, већих контекстних прозора од 128k и нижих цена.

Данас објављујемо ажурирани прегледни модел GPT‑4 Turbo, gpt-4-0125-preview. Овај модел темељније извршава задатке као што је генерисање кода него претходни прегледни модел и намењен је смањењу случајева „лењости“ када модел не доврши задатак. Нови модел такође укључује исправку грешке која је утицала на генерисања на неенглеским UTF-8 језицима.

За оне који желе да се аутоматски надограде на нове прегледне верзије GPT‑4 Turbo, уводимо и нови алијас назива модела gpt-4-turbo-preview, који ће увек упућивати на наш најновији прегледни модел GPT‑4 Turbo.

Планирамо да у наредним месецима покренемо GPT‑4 Turbo with vision у општој доступности.

Ажурирани модел за модерацију

Бесплатни Moderation API омогућава програмерима да идентификују потенцијално штетан текст. Као део нашег континуираног рада на безбедности, објављујемо text-moderation-007, наш до сада најробуснији модел за модерацију. Алијаси text-moderation-latest и text-moderation-stable су ажурирани да упућују на њега. Више о изградњи безбедних AI система можете сазнати у нашем водичу за најбоље праксе безбедности(отвара се у новом прозору).

Нови начини за разумевање употребе API-ја и управљање API кључевима

Покрећемо два унапређења платформе како бисмо програмерима омогућили и већу видљивост њихове употребе и већу контролу над API кључевима.

Прво, програмери сада могу да додељују дозволе API кључевима са странице API keys(отвара се у новом прозору). На пример, кључу може бити додељен приступ само за читање за интерну контролну таблу праћења, или може бити ограничен на приступ само одређеним крајњим тачкама.

Друго, контролна табла употребе и функција извоза употребе сада приказују метрике на нивоу API кључа након укључивања праћења(отвара се у новом прозору). То олакшава увид у употребу по функцији, тиму, производу или пројекту, једноставно тако што ћете за сваки имати засебне API кључеве.

Image2

У наредним месецима планирамо да додатно унапредимо могућност да програмери виде употребу свог API-ја и управљају API кључевима, посебно у већим организацијама.

За најновије новости о OpenAI API-јима, пратите нас на X-у на @OpenAIDevs(отвара се у новом прозору).

Аутор

OpenAI

Захвалнице

Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore