
Estem llançant nous models, reduint els preus de GPT‑3.5 Turbo i presentant noves maneres perquè els desenvolupadors gestionin les claus de l'API i entenguin l'ús de l'API. Els nous models inclouen:
- Dos models nous d'embeddings
- Un model de vista prèvia actualitzat de GPT‑4 Turbo
- Un model actualitzat de GPT‑3.5 Turbo
- Un model actualitzat de moderació de text
Per defecte, les dades enviades a l'API d'OpenAI no s'utilitzaran per entrenar ni millorar els models d'OpenAI.
Presentem dos nous models d'embeddings: un model text-embedding-3-small més petit i molt eficient, i un model text-embedding-3-large més gran i més potent.
Un embedding és una seqüència de nombres que representa els conceptes dins de continguts com el llenguatge natural o el codi. Els embeddings faciliten que els models d'aprenentatge automàtic i altres algorismes entenguin les relacions entre continguts i duguin a terme tasques com l'agrupació o la recuperació. Impulsen aplicacions com la recuperació de coneixement tant a ChatGPT com a l'API d'Assistants, i moltes eines per a desenvolupadors de generació augmentada per recuperació (RAG).
text-embedding-3-small és el nostre nou model d'embeddings molt eficient i ofereix una millora significativa respecte al seu predecessor, el model text-embedding-ada-002 publicat el desembre de 2022.
Rendiment superior. Comparant text-embedding-ada-002 amb text-embedding-3-small, la puntuació mitjana en una referència d'ús habitual per a la recuperació multilingüe (MIRACL(s'obre en una finestra nova)) ha augmentat del 31,4 % al 44,0 %, mentre que la puntuació mitjana en una referència d'ús habitual per a tasques en anglès (MTEB(s'obre en una finestra nova)) ha augmentat del 61,0 % al 62,3 %.
Preu reduït. text-embedding-3-small també és substancialment més eficient que el nostre model de generació anterior text-embedding-ada-002. Per tant, el preu de text-embedding-3-small s'ha reduït 5 vegades en comparació amb text-embedding-ada-002, des d'un preu per 1k segments de 0,0001 $ fins a 0,00002 $.
No retirarem text-embedding-ada-002, així que, tot i que recomanem el model més nou, els clients poden continuar utilitzant el model de la generació anterior.
Un nou model gran d'embeddings de text: text-embedding-3-large
text-embedding-3-large és el nostre nou model d'embeddings més gran de nova generació i crea embeddings de fins a 3072 dimensions.
Rendiment superior. text-embedding-3-large és el nostre nou model amb millor rendiment. Comparant text-embedding-ada-002 amb text-embedding-3-large: a MIRACL, la puntuació mitjana ha augmentat del 31,4 % al 54,9 %, mentre que a MTEB, la puntuació mitjana ha augmentat del 61,0 % al 64,6 %.
Referència d'avaluació | ada v2 | text-embedding-3-small | text-embedding-3-large |
Mitjana de MIRACL | 31.4 | 44.0 | 54.9 |
Mitjana de MTEB | 61.0 | 62.3 | 64.6 |
text-embedding-3-large tindrà un preu de 0,00013 $ / 1k segments.
Pots obtenir més informació sobre com utilitzar els nous models d'embeddings a la nostra guia d'Embeddings(s'obre en una finestra nova).
L'ús d'embeddings més grans, per exemple emmagatzemant-los en un magatzem de vectors per a la recuperació, generalment costa més i consumeix més càlcul, memòria i emmagatzematge que l'ús d'embeddings més petits.
Tots dos nous models d'embeddings s'han entrenat amb una tècnicaA que permet als desenvolupadors equilibrar el rendiment i el cost d'utilitzar embeddings. En concret, els desenvolupadors poden escurçar els embeddings (és a dir, eliminar alguns nombres del final de la seqüència) sense que l'embedding perdi les seves propietats de representació de conceptes passant el paràmetre d'API dimensions. Per exemple, a la referència MTEB, un embedding text-embedding-3-large es pot escurçar fins a una mida de 256 i, tot i així, superar un embedding text-embedding-ada-002 no escurçat amb una mida de 1536.
Això permet un ús molt flexible. Per exemple, quan s'utilitza un magatzem de dades vectorials que només admet embeddings de fins a 1024 dimensions, els desenvolupadors ara poden continuar utilitzant el nostre millor model d'embeddings text-embedding-3-large i especificar un valor de 1024 per al paràmetre d'API dimensions, cosa que escurçarà l'embedding de 3072 dimensions, sacrificant una mica de precisió a canvi d'una mida de vector més petita.
La setmana vinent presentarem un nou model de GPT‑3.5 Turbo, gpt-3.5-turbo-0125, i, per tercera vegada durant l'últim any, reduirem els preus de GPT‑3.5 Turbo per ajudar els nostres clients a escalar. Els preus d'entrada del nou model es redueixen un 50 % fins a 0,0005 $ /1K segments i els preus de sortida es redueixen un 25 % fins a 0,0015 $ /1K segments. Aquest model també tindrà diverses millores, com ara una precisió més alta en respondre en els formats sol·licitats i una correcció per a un error(s'obre en una finestra nova) que provocava un problema de codificació de text en les crides de funcions en idiomes no anglesos.
Els clients que utilitzen l'àlies de model sense fixar gpt-3.5-turbo s'actualitzaran automàticament de gpt-3.5-turbo-0613 a gpt-3.5-turbo-0125 dues setmanes després del llançament d'aquest model.
Més del 70 % de les sol·licituds dels clients de l'API de GPT‑4 han passat a GPT‑4 Turbo des del seu llançament, ja que els desenvolupadors aprofiten el seu tall de coneixement actualitzat, les finestres de context més grans de 128k i els preus més baixos.
Avui llancem un model de vista prèvia actualitzat de GPT‑4 Turbo, gpt-4-0125-preview. Aquest model completa tasques com ara la generació de codi amb més exhaustivitat que el model de vista prèvia anterior i està pensat per reduir els casos de «mandra» en què el model no completa una tasca. El nou model també inclou la correcció de l'error que afectava les generacions UTF-8 no angleses.
Per als qui vulguin actualitzar-se automàticament a les noves versions de vista prèvia de GPT‑4 Turbo, també presentem un nou àlies de nom de model gpt-4-turbo-preview, que sempre apuntarà al nostre model de vista prèvia de GPT‑4 Turbo més recent.
Tenim previst llançar GPT‑4 Turbo amb visió amb disponibilitat general en els propers mesos.
L'API gratuïta de Moderation permet als desenvolupadors identificar text potencialment perjudicial. Com a part del nostre treball continu en seguretat, llancem text-moderation-007, el nostre model de moderació més robust fins avui. Els àlies text-moderation-latest i text-moderation-stable s'han actualitzat perquè hi apuntin. Pots obtenir més informació sobre com crear sistemes d'IA segurs a través de la nostra guia de bones pràctiques de seguretat(s'obre en una finestra nova).
Estem llançant dues millores de la plataforma per oferir als desenvolupadors més visibilitat sobre el seu ús i més control sobre les claus de l'API.
En primer lloc, ara els desenvolupadors poden assignar permisos a les claus de l'API des de la pàgina de claus de l'API(s'obre en una finestra nova). Per exemple, es podria assignar a una clau accés només de lectura per impulsar un tauler intern de seguiment, o restringir-la perquè només accedeixi a determinats punt finals.
En segon lloc, el tauler d'ús i la funció d'exportació d'ús ara mostren mètriques a nivell de clau d'API després d'activar el seguiment(s'obre en una finestra nova). Això facilita veure l'ús per funcionalitat, equip, producte o projecte, simplement tenint claus de l'API separades per a cadascun.

En els propers mesos, tenim previst millorar encara més la capacitat dels desenvolupadors per veure l'ús de la seva API i gestionar les claus de l'API, especialment en organitzacions més grans.
Per conèixer les últimes actualitzacions de les API d'OpenAI, segueix-nos a X a @OpenAIDevs(s'obre en una finestra nova).
Notes a peu de pàgina
Autor
Agraïments
Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore


