Nuevos modelos de integración y actualizaciones de la API

Lanzamos modelos nuevos, que reducen los precios de GPT‑3.5 Turbo, y presentamos nuevas formas en que los desarrolladores gestionen las claves de API y comprendan su uso. Los modelos nuevos incluyen lo siguiente:
- Dos modelos de integración nuevos
- Un modelo de avance de GPT‑4 Turbo actualizado
- Un modelo de GPT‑3.5 Turbo actualizado
- Un modelo de moderación de texto actualizado
Por defecto, los datos enviados a la API de OpenAI no se utilizarán para entrenar o mejorar los modelos de OpenAI.
Presentamos dos modelos de integración nuevos: uno más pequeño y eficaz, text-embedding-3-small, y otro más grande y potente, text-embedding-3-large.
Una integración es una secuencia de números que representa los conceptos dentro de un contenido como el lenguaje natural o el código. Las integraciones facilitan la comprensión de las relaciones entre contenidos y la realización de tareas como la agrupación o la recuperación para los modelos de aprendizaje automático y otros algoritmos. Impulsan aplicaciones como la recuperación de conocimiento, tanto en ChatGPT como en la API de Assistants, y muchas herramientas de desarrollo de generación aumentada por recuperación (RAG).
text-embedding-3-small es nuestro modelo de integración nuevo de alta eficacia y supone una mejora significativa con respecto a su predecesor, el modelo text-embedding-ada-002 que se lanzó en diciembre de 2022.
Rendimiento más sólido. Si se compara text-embedding-ada-002 con text-embedding-3-small, la puntuación media en una referencia de uso frecuente para la recuperación multilingüe (MIRACL(se abre en una nueva ventana)) ha aumentado del 31,4 % al 44,0 %, mientras que la puntuación media en una referencia de uso frecuente para tareas en inglés (MTEB(se abre en una nueva ventana) ) ha aumentado del 61,0 % al 62,3 %.
Menor precio. text-embedding-3-small también es mucho más eficiente que nuestro modelo text-embedding-ada-002 de la generación anterior. Por lo tanto, el precio de text-embedding-3-small se ha reducido 5 veces en comparación con text-embedding-ada-002, de un precio por 1000 tokens de 0,0001 USD a 0,00002 USD.
No retiraremos text-embedding-ada-002, por lo que, aunque recomendamos el modelo más reciente, los clientes pueden seguir utilizando el modelo de la generación anterior.
Un modelo nuevo de integración de texto extenso: text-embedding-3-large
text-embedding-3-large es nuestro modelo nuevo de integración de mayor tamaño y crea integraciones de hasta 3072 dimensiones.
Rendimiento más sólido. text-embedding-3-large es nuestro modelo nuevo con mejores resultados. Comparación de text-embedding-ada-002 con text-embedding-3-large: en MIRACL, la puntuación media ha aumentado del 31,4 % al 54,9 %, mientras que en MTEB, la puntuación media ha aumentado del 61,0 % al 64,6 %.
Referencia de evaluación | ada v2 | text-embedding-3-small | text-embedding-3-large |
Promedio de MIRACL | 31,4 | 44,0 | 54,9 |
Promedio de MTEB | 61,0 | 62,3 | 64,6 |
text-embedding-3-large tendrá un precio de 0,00013 USD cada 1000 tokens.
Puedes obtener más información sobre el uso de los modelos nuevos de integración en nuestra guía de integraciones(se abre en una nueva ventana).
Utilizar integraciones más grandes, por ejemplo almacenarlas en un almacén de vectores para su recuperación, suele costar más y consumir más recursos informáticos, memoria y almacenamiento que utilizar integraciones más pequeñas.
Nuestros dos modelos nuevos de integración se entrenaron con una técnicaA que permite a los desarrolladores compensar el rendimiento y el costo del uso de integraciones. En concreto, los desarrolladores pueden acortar las integraciones (es decir, eliminar algunos números del final de la secuencia) sin que esta pierda sus propiedades de representación de conceptos pasando el parámetro de la API dimensions. Por ejemplo, en la prueba comparativa MTEB, una integración text-embedding-3-large puede acortarse a un tamaño de 256 y seguir superando a una integración text-embedding-ada-002 sin acortar con un tamaño de 1536.
Esto permite un uso muy flexible. Por ejemplo, cuando se utiliza un almacén de datos vectoriales que solo admite integraciones de hasta 1024 dimensiones, los desarrolladores pueden seguir utilizando nuestro mejor modelo de integración text-embedding-3-large y especificar un valor de 1024 para el parámetro de la API Dimensions, lo que acortará la integración de 3072 dimensiones y sacrificará algo de precisión a cambio de un menor tamaño del vector.
La próxima semana presentaremos un nuevo modelo GPT‑3.5 Turbo, gpt-3.5-turbo-0125 y, por tercera vez en el año, bajaremos los precios de GPT‑3.5 Turbo para ayudar a nuestros clientes a escalar. Los precios de los insumos del nuevo modelo se reducen un 50 %, hasta 0,0005 USD cada 1000 tokens, y los de los productos, un 25 %, hasta 0,0015 USD cada 1000 tokens. Este modelo también tendrá varias mejoras, entre ellas una mayor precisión a la hora de responder en los formatos solicitados y la corrección de un error(se abre en una nueva ventana) que provocaba un problema de codificación de texto en las llamadas a funciones en idiomas distintos del inglés.
Los clientes que utilicen el alias de modelo gpt-3.5-turbo sin anclar se actualizarán automáticamente de gpt-3.5-turbo-0613 a gpt-3.5-turbo-0125 dos semanas después del lanzamiento de este modelo.
Más del 70 % de las solicitudes de los clientes de la API de GPT‑4 han pasado a GPT‑4 Turbo desde su lanzamiento, ya que los desarrolladores aprovechan su corte de conocimientos actualizado, ventanas de contexto de 128 000 más grandes y precios más bajos.
Hoy lanzamos un modelo de avance de GPT‑4 Turbo actualizado, gpt-4-0125-preview. Este modelo completa tareas como la generación de código de forma más exhaustiva que el modelo de avance anterior y pretende reducir los casos de “pereza” en los que el modelo no completa una tarea. El modelo nuevo también incluye la corrección del error que afectaba a las generaciones UTF-8 que no estaban en inglés.
Para aquellos que deseen actualizarse automáticamente a las nuevas versiones de avance de GPT‑4 Turbo, también estamos presentando un nuevo alias de nombre del modelo gpt-4-turbo-preview, que siempre apuntará a nuestro último modelo de avance de GPT‑4 Turbo.
Tenemos previsto lanzar GPT‑4 Turbo con visión en disponibilidad general en los próximos meses.
La API de Moderation gratuita permite a los desarrolladores identificar textos potencialmente dañinos. Como parte de nuestra tarea de seguridad en curso, lanzamos text-moderation-007, nuestro modelo de moderación más sólido hasta la fecha. Los alias text-moderation-latest y text-moderation-stable se han actualizado para destinarse a ello. Puedes obtener más información sobre la creación de sistemas de IA seguros en nuestra guía de mejores prácticas de seguridad(se abre en una nueva ventana).
Lanzamos dos mejoras de la plataforma para dar a los desarrolladores más visibilidad de su uso y control de las claves de API.
En primer lugar, ahora los desarrolladores pueden asignar permisos a las claves de API desde la página de claves de API(se abre en una nueva ventana). Por ejemplo, se podría asignar a una clave acceso de solo lectura para facultar un panel de control de seguimiento interno, o restringirla para que solo acceda a determinados extremos.
En segundo lugar, el panel de control de uso y la función de exportación de uso ahora exponen las métricas en un nivel de clave de API después de activar el seguimiento(se abre en una nueva ventana). Esto simplifica la visualización del uso según la función, el equipo, el producto o el proyecto, simplemente al tener claves de API separadas para cada uno.

En los próximos meses, tenemos previsto mejorar aún más la capacidad de los desarrolladores para ver su uso de la API y gestionar las claves de la API, especialmente en las grandes organizaciones.
Para conocer las últimas actualizaciones de las API de OpenAI, síguenos en X en @OpenAIDevs(se abre en una nueva ventana).
Autor
Agradecimientos
Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark, Owen Campbell-Moore


