Pasar al contenido principal
OpenAI

Actualización: 24 de abril de 2024

Producto

La disponibilidad general de la API de GPT‑4 y el desuso de los modelos anteriores en la API de Completions

Ilustración artística con motivos de hojas verdes brillantes que irradian desde un punto central, lo que da una sensación de crecimiento natural o energía.
Cargando...

Actualización del 24 de abril de 2024: Se ha eliminado el nombre de la API de ChatGPT. Las menciones a la API de ChatGPT en este blog se refieren a la API de GPT‑3.5 Turbo.

A partir de hoy, todos los clientes que pagan la API tienen acceso a GPT‑4. En marzo, presentamos la API de OpenAI y, a principios de este mes, lanzamos nuestras primeras actualizaciones de modelos basados en chats. Imaginamos un futuro en el que los modelos basados en chats sean compatibles con cualquier caso de uso. Hoy anunciamos un plan de desuso de los modelos anteriores de la API de Completions y recomendamos a los usuarios que adopten la API de Chat Completions.

La disponibilidad general de la API de GPT-4

GPT‑4 es nuestro modelo más competente. Millones de desarrolladores han solicitado acceso a la API de GPT‑4 desde marzo, y la variedad de productos innovadores que se aprovechan con GPT‑4 crece día a día. En la actualidad, todos los desarrolladores de API existentes con un historial de pagos satisfactorios pueden acceder a la API de GPT‑4 con contexto 8 k. Tenemos previsto abrir el acceso a nuevos desarrolladores a finales de este mes y, a partir de entonces, empezar a aumentar los límites de velocidad en función de la disponibilidad informática.

En función de la estabilidad y la preparación de estos modelos para su uso en producción, también estamos poniendo a disposición general las API de GPT‑3.5 Turbo, DALL·E y Whisper. Estamos trabajando para habilitar de forma segura el ajuste preciso para GPT‑4 y GPT‑3.5 Turbo y esperamos que esta función esté disponible a finales de este año.

Migración de Text Completions a Chat Completions

Presentamos la API de Chat Completions(se abre en una nueva ventana) en marzo, y ahora representa el 97 % del uso de nuestra API de GPT. 

La API de Completions inicial se presentó en junio de 2020 con el fin de proporcionar una consulta de mensaje de texto libre y así interactuar con nuestros modelos lingüísticos. Desde entonces hemos aprendido que a menudo podemos ofrecer mejores resultados con una interfaz de consulta más estructurada. El paradigma basado en chats ha demostrado su capacidad, ya que gestiona la gran mayoría de los casos de uso anteriores y las nuevas necesidades conversacionales, al tiempo que ofrece una mayor flexibilidad y especificidad. En concreto, la interfaz estructurada de la API de Chat Completions (p. ej., mensajes del sistema, llamadas de función) y las capacidades de conversación de múltiples turnos permiten a los desarrolladores crear experiencias conversacionales y una amplia variedad de tareas de respuesta. Además, ayuda a reducir el riesgo de ataques de inyección de consultas, ya que el contenido que proporciona el usuario puede separarse estructuralmente de las instrucciones.

Cargando...

Tenemos previsto seguir invirtiendo la mayor parte de nuestros esfuerzos de plataforma en esta dirección, ya que creemos que ofrecerá una experiencia cada vez más competente y fácil de usar para los desarrolladores. Estamos trabajando para resolver rápidamente los últimos problemas de la API de Chat Completions, como las probabilidades de registro para los tokens de respuesta y una mayor direccionabilidad para reducir los datos innecesarios de las respuestas.

El desuso de los modelos anteriores en la API de Completions

Como parte de nuestra mayor inversión en la API de Chat Completions y de nuestros esfuerzos por optimizar nuestra capacidad informática, en 6 meses retiraremos algunos de nuestros modelos anteriores que utilizan la API de Completions. Aunque esta API seguirá siendo accesible, a partir de hoy la etiquetaremos como “heredada” en nuestra documentación para desarrolladores. Tenemos previsto que las futuras mejoras de modelos y productos se centren en la API de Chat Completions y no tenemos previsto lanzar públicamente modelos nuevos que utilicen la API de Completions.

A partir del 4 de enero de 2024, los modelos de Completions más antiguos(se abre en una nueva ventana) dejarán de estar disponibles y serán reemplazados por los siguientes modelos:

Modelo anterior

Modelo nuevo

ada

babbage-002

babbage

babbage-002

curie

davinci-002

davinci

davinci-002

davinci-instruct-beta

gpt-3.5-turbo-instruct

curie-instruct-beta

gpt-3.5-turbo-instruct

text-ada-001

gpt-3.5-turbo-instruct

text-babbage-001

gpt-3.5-turbo-instruct

text-curie-001

gpt-3.5-turbo-instruct

text-davinci-001

gpt-3.5-turbo-instruct

text-davinci-002

gpt-3.5-turbo-instruct

text-davinci-003

gpt-3.5-turbo-instruct

Las aplicaciones que utilicen los nombres de modelos estructurados para los modelos GPT‑3 base (ada, babbage, curie, davinci) se actualizarán automáticamente a los modelos nuevos que se indican anteriormente el 4 de enero de 2024. Los modelos nuevos también se podrán acceder en las próximas semanas para pruebas preliminares al especificar los siguientes nombres de modelo en las llamadas a la API: babbage-002, davinci-002.

Los desarrolladores que utilicen otros modelos de Completions anteriores (como text-davinci-003) tendrán que actualizar manualmente su integración antes del 4 de enero de 2024 al especificar gpt-3.5-turbo-instruct en el parámetro “modelo” de sus solicitudes de API. gpt-3.5-turbo-instruct es un modelo de estilo InstructGPT, entrenado de forma similar a text-davinci-003. Este nuevo modelo es un sustituto directo de la API de Completions y estará disponible en las próximas semanas para las primeras preliminares.

Los desarrolladores que deseen seguir utilizando sus modelos con ajuste preciso más allá del 4 de enero de 2024 tendrán que optimizar el ajuste preciso de los sustitutos sobre los modelos nuevos de GPT‑3 base (babbage-002, davinci-002) o los modelos más recientes (gpt-3.5-turbo, gpt-4). Una vez que esta función esté disponible a finales de este año, daremos acceso prioritario al ajuste preciso de GPT‑3.5 Turbo y GPT‑4 a los usuarios que previamente hayan optimizado el ajuste preciso de modelos anteriores. Reconocemos que la migración a partir de modelos con ajuste preciso con datos propios es un reto. Brindaremos asistencia a los usuarios que previamente hayan optimizado el ajuste preciso de modelos para que esta transición sea lo más fluida posible.

En las próximas semanas, nos pondremos en contacto con los desarrolladores que hayan utilizado recientemente estos modelos anteriores, y proporcionaremos más información una vez que los nuevos modelos de Completions estén listos para las pruebas preliminares.

El desuso de modelos de integraciones anteriores

Los usuarios de modelos de Embeddings anteriores (p. ej., text-search-davinci-doc-001) deberán migrar a text-embedding-ada-002 antes del 4 de enero de 2024. Lanzamos text-embedding-ada-002 en diciembre de 2022 y hemos comprobado que es más competente y rentable que los modelos anteriores. En la actualidad, text-embedding-ada-002 representa el 99,9 % de todo el uso de la API de Embeddings.

Reconocemos que se trata de un cambio significativo para los desarrolladores que utilizan esos modelos anteriores. La finalización de estos modelos no es una decisión que tomemos a la ligera. Cubriremos el costo financiero de los usuarios que vuelvan a incorporar contenido con estos modelos nuevos. Nos pondremos en contacto con los usuarios afectados en los próximos días.

Modelo anterior

Modelo nuevo

code-search-ada-code-001

text-embedding-ada-002

code-search-ada-text-001

text-embedding-ada-002

code-search-babbage-code-001

text-embedding-ada-002

code-search-babbage-text-001

text-embedding-ada-002

text-search-ada-doc-001

text-embedding-ada-002

text-search-ada-query-001

text-embedding-ada-002

text-search-babbage-doc-001

text-embedding-ada-002

text-search-babbage-query-001

text-embedding-ada-002

text-search-curie-doc-001

text-embedding-ada-002

text-search-curie-query-001

text-embedding-ada-002

text-search-davinci-doc-001

text-embedding-ada-002

text-search-davinci-query-001

text-embedding-ada-002

text-similarity-ada-001

text-embedding-ada-002

text-similarity-babbage-001

text-embedding-ada-002

text-similarity-curie-001

text-embedding-ada-002

text-similarity-davinci-001

text-embedding-ada-002

El desuso de la API de Edits

Los usuarios de la API de Edits y sus modelos relacionados (p. ej., text-davinci-edit-001 o code-davinci-edit-001) deberán migrar a GPT‑3.5 Turbo antes del 4 de enero de 2024. La beta de la API de Edits era una API exploratoria preliminar, destinada a permitir a los desarrolladores devolver una versión editada de la consulta basada en instrucciones. Hemos tenido en cuenta los comentarios de la API de Edits al momento de desarrollar gpt-3.5-turbo y la API de Chat Completions, que ahora pueden utilizarse con el mismo fin:

Cargando...