25 de enero de 2024

Nuevos modelos de integración y actualizaciones de API

Cargando…

Vamos a publicar nuevos modelos, reducir los precios de GPT‑3.5 Turbo e introducir nuevos métodos para que los desarrolladores gestionen las claves de API y comprendan cómo se usan las API. Entre los nuevos modelos se incluyen:

Dos nuevos modelos de integración
Un modelo de vista previa actualizado de GPT‑4 Turbo
Un modelo actualizado de GPT‑3.5 Turbo
Un modelo de moderación de texto actualizado

De forma predeterminada, los datos enviados a la API de OpenAI no se utilizarán para entrenar o mejorar los modelos de OpenAI.

Nuevos modelos de integración a precios reducidos

Vamos a presentar dos nuevos modelos de integración: un modelo más pequeño pero altamente eficiente denominado text-embedding-3-small, y un modelo más grande y potente, text-embedding-3-large.

Una integración⁠ es una secuencia de números que representa los conceptos que hay dentro de distintos tipos de contenido, como el lenguaje natural o el código. Las integraciones facilitan que los modelos de aprendizaje automático y otros algoritmos entiendan las relaciones entre el contenido y realicen tareas de agrupación o recuperación, por ejemplo. Asimismo, impulsan aplicaciones como la recuperación de contenido tanto en ChatGPT como en la Assistants API, y en muchas herramientas de desarrolladores para la generación mejorada por recuperación (RAG).

Cargando...

Un nuevo y pequeño modelo de integración de texto

text-embedding-3-small es nuestro nuevo modelo de integración altamente eficiente, que supone una gran mejora con respecto a su predecesor, el modelo text-embedding-ada-002 presentado en diciembre de 2022⁠.

Mayor rendimiento. Al comparar text-embedding-ada-002 con text-embedding-3-small, la puntuación media en una prueba comparativa de uso común para la recuperación de varias lenguas (MIRACL⁠(se abre en una ventana nueva)) ha aumentado del 31,4 % al 44,0 %, mientras que la puntuación media en una prueba comparativa de uso común para tareas en inglés (MTEB⁠(se abre en una ventana nueva)) ha aumentado del 61,0 % al 62,3 %.

Precio reducido. text-embedding-3-small también es considerablemente más eficiente que la generación anterior, el modelo text-embedding-ada-002. El precio de text-embedding-3-small, por tanto, se ha reducido por cinco en comparación con el de text-embedding-ada-002, y va desde los 0,0001 $ hasta los 0,00002 $ por cada 1000 tókenes.

No vamos a retirar text-embedding-ada-002, por lo que, aunque recomendamos pasar al modelo más reciente, nuestros clientes pueden seguir utilizando el modelo de la generación anterior.

Un nuevo modelo de integración de texto más grande: text-embedding-3-large

text-embedding-3-large es nuestra nueva generación de modelo de integración, más grande y con mayor capacidad, con hasta 3072 dimensiones.

Mayor rendimiento. text-embedding-3-large es nuestro modelo más reciente y el que ofrece un mayor rendimiento. Al comparar text-embedding-ada-002 con text-embedding-3-large en MIRACL, la puntuación media ha aumentado del 31,4 % al 54,9 %, mientras que en MTEB, la puntuación media ha pasado del 61,0 % al 64,6 %.

Puntos de referencia de evaluación	ada v2	text-embedding-3-small	text-embedding-3-large
Media en MIRACL	31,4	44,0	54,9
Media en MTEB	61,0	62,3	64,6

text-embedding-3-large tendrá un precio de 0,00013 $ por cada 1000 tókenes.

Encontrarás más información sobre el uso de nuestros modelos de integración en la Guía de integraciones⁠(se abre en una ventana nueva).

Asistencia nativa para acortar integraciones

Al utilizar integraciones más grandes, por ejemplo, al guardarlas en un almacén de vectores para recuperarlas más tarde, también se consumen más recursos computacionales, de memoria y de espacio que con las integraciones de menor tamaño.

Nuestros dos nuevos modelos de integración han sido entrenados con una técnica^A que permite a los desarrolladores equilibrar rendimiento y costes al utilizar las integraciones. En concreto, los desarrolladores pueden acortar las integraciones (por ejemplo, eliminando algunas cifras del final de la secuencia) sin que estas pierdan sus propiedades de representación de conceptos al aprobar el parámetro API dimensions. De este modo, por ejemplo, utilizando MTEB como referencia, una integración text-embedding-3-large se puede acortar hasta un tamaño de 256 y superar aun así a la integración text-embedding-ada-002 sin acortar, con un tamaño de 1536.

Cargando...

De este modo se logra un uso altamente flexible. Por ejemplo, al utilizar un almacén de datos vectoriales que solo admita integraciones de hasta 1024 dimensiones de longitud, ahora los desarrolladores pueden usar nuestro mejor modelo de integración, text-embedding-3-large, y especificar un valor de 1024 para el parámetro API dimensions, que acortará la integración hasta 3072 dimensiones, equilibrando la precisión a cambio de un vector de menor tamaño.

Otros modelos nuevos y precios reducidos

Actualización del modelo GPT-3.5 Turbo y reducción del precio

La semana que viene presentaremos un nuevo modelo GPT‑3.5 Turbo, gpt-3.5-turbo-0125, y por tercera vez en el año reduciremos los precios de GPT‑3.5 Turbo para permitir que nuestros clientes actualicen su versión. Los precios de entrada para el nuevo modelo estarán reducidos en un 50 %, hasta 0,0005 $ por cada 1000 tókenes, mientras que los precios de salida se reducirán en un 25 %, hasta los 0,0015 $ por cada 1000 tókenes. Este modelo también incluirá varias mejoras, como una mayor precisión a la hora de responder ante formatos solicitados, y un parche para un error⁠(se abre en una ventana nueva) que causaba un problema de codificación de texto para las solicitudes de funciones en idiomas distintos al inglés.

Los clientes que utilicen el alias del modelo gpt-3.5-turbo desanclado serán actualizados automáticamente de la versión gpt-3.5-turbo-0613 a la gpt-3.5-turbo-0125 dos semanas después del lanzamiento de este modelo.

Actualización de la vista previa de GPT-4 Turbo

Más del 70 % de las solicitudes de clientes de la API de GPT‑4 han pasado a GPT‑4 Turbo desde su lanzamiento, puesto que los desarrolladores pueden aprovechar las ventajas de su base de conocimientos actualizada, mayores ventanas de contexto de 128 000 y la reducción de los precios.

Hoy presentamos la actualización del modelo de vista previa de GPT‑4 Turbo, gpt-4-0125-preview. Este modelo completa tareas como la generación de código de manera más precisa que el modelo de vista previa anterior, y está diseñado para reducir la «pereza» asociada a los casos en los que el modelo no completa una tarea. El nuevo modelo también incluye un parche para un error que afectaba a la generación en formato UTF-8 de idiomas distintos al inglés.

Para aquellos que deseen actualizar automáticamente a las nuevas versiones de vista previa de GPT‑4 Turbo, presentaremos un alias de modelo nuevo, gpt-4-turbo-preview, que siempre estará orientado hacia el modelo de vista previa de GPT‑4 Turbo más reciente.

Nuestros planes pasan por que el lanzamiento de GPT‑4 Turbo con visión esté disponible de manera generalizada en los próximos meses.

Modelo de moderación actualizado

La API de moderación gratuita permite a los desarrolladores identificar los textos potencialmente peligrosos. Como parte de nuestras tareas de seguridad continuas, vamos a lanzar text-moderation-007, nuestro modelo de moderación más sólido hasta la fecha. Los alias text-moderation-latest y text-moderation-stable se han actualizado para que estén orientados hacia dicho modelo. Encontrarás más información sobre la creación de sistemas de IA seguros en nuestra Guía de prácticas de seguridad recomendadas⁠(se abre en una ventana nueva).

Nuevas formas de entender el uso de la API y gestionar claves API

Vamos a lanzar dos mejoras de la plataforma para ofrecer a los desarrolladores un mayor grado de comprensión sobre el control y el uso que hacen de las claves API.

En primer lugar, los desarrolladores ahora podrán asignar permisos a las claves API desde la página de claves API⁠(se abre en una ventana nueva). De este modo, por ejemplo, se podrá asignar una clave con acceso de solo lectura para impulsar un panel de seguimiento interno o restringir el acceso a determinados endpoints.

Además, el panel de uso y la función de exportación de usos ahora contienen métricas a nivel de clave API una vez que se active el seguimiento⁠(se abre en una ventana nueva). Así, será mucho más sencillo ver el uso a nivel de función, equipo, producto o proyecto, solo con disponer de claves API separadas para cada elemento.

En los próximos meses, tenemos planeado mejorar las capacidades de los desarrolladores para ver el uso de su API y gestionar sus claves de API, sobre todo en las empresas más grandes.

Para mantenerte al día sobre las novedades de la API de OpenAI, síguenos en nuestra cuenta de X @OpenAIDevs⁠(se abre en una ventana nueva).

Notas al pie

A
Matryoshka Representation Learning⁠(se abre en una ventana nueva)

Autor

OpenAI

Agradecimientos

Juntang Zhuang, Paul Baltescu, Joy Jiao, Arvind Neelakantan, Andrew Braunstein, Jeff Harris, Logan Kilpatrick, Leher Pathak, Enoch Cheung, Ted Sanders, Yutian Liu, Anushree Agrawal, Andrew Peng, Ian Kivlichan, Mehmet Yatbaz, Madelaine Boyd, Anna-Luisa Brakman, Florencia Leoni Aleman, Henry Head, Molly Lin, Meghan Shah, Chelsea Carlson, Sam Toizer, Ryan Greene, Alison Harmon, Denny Jin, Karolis Kosas, Marie Inuzuka, Peter Bakkum, Barret Zoph, Luke Metz, Jiayi Weng, Randall Lin, Yash Patil, Mianna Chen, Andrew Kondrich, Brydon Eastman, Liam Fedus, John Schulman, Vlad Fomenko, Andrej Karpathy, Aidan Clark y Owen Campbell-Moore