4 de abril de 2024

Mejoras a la API de optimización y ampliación de nuestro programa de modelos personalizados

Hemos añadido nuevas funciones que brindarán a los desarrolladores un mayor control a la hora de optimizar los modelos, y presentamos nuevas formas de crear modelos personalizados con OpenAI.

Obra abstracta floral con tonos naranjas, amarillos y morados que se entrelazan y evocan un ramo veraniego.

Cargando…

Actualización del 8 de mayo de 2026: OpenAI está cerrando progresivamente la plataforma de ajuste fino. La plataforma ya no está disponible para nuevos usuarios, pero los usuarios actuales podrán seguir creando trabajos de entrenamiento durante los próximos meses. Todos los modelos ajustados seguirán disponibles para inferencia hasta que sus modelos base queden obsoletos⁠(se abre en una ventana nueva). El calendario completo está disponible aquí⁠(se abre en una ventana nueva).

Hay una variedad de técnicas⁠(se abre en una ventana nueva) que los desarrolladores pueden usar para mejorar el rendimiento de los modelos con el fin de reducir la latencia, mejorar la precisión y reducir los costes. Ya sea al ampliar el conocimiento del modelo con generación aumentada por recuperación (RAG), personalizar el comportamiento de un modelo mediante ajuste fino, o crear un modelo entrenado a medida con nuevos conocimientos específicos de un dominio, hemos desarrollado una amplia gama de opciones para respaldar las implementaciones de IA de nuestros clientes. Hoy lanzamos nuevas funciones que darán a los desarrolladores un mayor control sobre el ajuste fino de los modelos con la API, así como nuevas formas de trabajar con nuestro equipo de expertos e investigadores en IA para crear modelos personalizados.

Nuevas funciones de optimización con API

En agosto de 2023 lanzamos la API de optimización⁠(se abre en una ventana nueva) autoservicio para GPT‑3.5. Desde entonces, miles de organizaciones han entrenado a cientos de miles de modelos empleando nuestra API. La optimización puede ayudar a los modelos a entender mejor el contenido y aumentar el conocimiento y las capacidades de un modelo para una tarea específica. Nuestra API de optimización también puede asimilar un mayor volumen de ejemplos que puedan condensarse en un único prompt para lograr mejores resultados y a la vez reducir costes y latencia. Algunas aplicaciones habituales de esta optimización incluyen entrenar a un modelo para generar mejor código en un lenguaje de programación específico, resumir texto en un formato específico o crear contenido personalizado en base al comportamiento del usuario.

Por ejemplo, Indeed⁠(se abre en una ventana nueva), una plataforma global de emparejamiento laboral y empleo, quiere simplificar el proceso de contratación. Como este fin, Indeed lanzó una función que envía recomendaciones personalizadas a las personas que buscan trabajo, señalando oportunidades de empleo relevantes en base a sus aptitudes, experiencia y preferencias. La empresa optimizó el modelo GPT‑3.5 Turbo para generar explicaciones de mayor calidad y más precisas. Como resultado, Indeed consiguió reducir el coste y la latencia al disminuir el número de tókenes en un prompt en un 80 %. Esto les permitió pasar de menos de un millón de mensajes a las personas desempleadas al mes a aproximadamente 20 millones.

Hoy presentamos nuevas funciones⁠(se abre en una ventana nueva) que darán a los desarrolladores todavía más control sobre las tareas de optimización, como:

Creación de checkpoints por epochs: genera automáticamente un checkpoint del modelo completamente optimizado durante cada iteración de entrenamiento a fin de reducir la necesidad de volver a entrenar al modelo, especialmente en casos de sobreajuste
Comparativas en Playground: una nueva interfaz en Playground permite ver simultáneamente varios modelos para comparar su calidad y rendimiento, facilitando el proceso de evaluación humana de las respuestas de múltiples modelos o la optimización de copias en base a un único prompt
Integración con terceros: asistencia para las integraciones con plataformas de terceros (empezando por Weights & Biases⁠(se abre en una ventana nueva) esta semana) para que los desarrolladores puedan compartir datos detallados de optimización con el resto de su stack
Métricas exhaustivas para la validación: la capacidad de calcular métricas como la pérdida o la precisión del conjunto de validación completo, en lugar de trabajar con una muestra, facilita la evaluación de la calidad del modelo
Ajuste de hiperparámetros: la posibilidad de configurar los hiperparámetros disponibles desde el Panel de control⁠(se abre en una ventana nueva) (en lugar de solo desde la API o el SDK)
Optimización de mejoras del panel de control: como la posibilidad de ajustar los hiperparámetros, ver métricas del entrenamiento más detalladas y la repetición de tareas de configuraciones anteriores

Una demostración de la creación de un nuevo modelo optimizado en Playground.

Ampliamos nuestro programa de modelos personalizados

Optimización asistida

El pasado mes de noviembre en DevDay anunciamos⁠ un programa de modelos personalizados diseñado para entrenar y optimizar modelos para un dominio específico, en colaboración con un grupo especializado de investigadores de OpenAI. Desde entonces, nos hemos reunido con docenas de clientes para evaluar sus necesidades específicas y seguir desarrollando nuestro programa a fin de maximizar su rendimiento.

Hoy anunciamos el lanzamiento oficial de nuestra solución de optimización asistida, como parte del programa de modelos personalizados. La optimización asistida implica un trabajo colaborativo con nuestros equipos técnicos para emplear otras técnicas más allá de la API de optimización, como los hiperparámetros adicionales y varios métodos de ajuste eficiente en parámetros (PEFT) a mayor escala. Es especialmente útil para organizaciones que necesitan ayuda en la configuración de pipelines de datos de entrenamiento eficientes, sistemas de evaluación y parámetros y métodos personalizados para optimizar el rendimiento del modelo para sus necesidades específicas.

Por ejemplo, SK Telecom⁠(se abre en una ventana nueva), un operador de comunicaciones con más de 30 millones de suscriptores en Corea del Sur, quería personalizar un modelo para que estuviera especializado en el ámbito de las telecomunicaciones, con especial interés en la atención al cliente. Trabajaron con OpenAI para optimizar el rendimiento de GPT‑4 en conversaciones sobre telecomunicaciones en coreano. En el transcurso de varias semanas, SKT y OpenAI vieron una significativa mejora del rendimiento en las tareas de atención al cliente: un aumento del 35 % en la calidad de los resúmenes de las conversaciones, un aumento del 33 % en la precisión del reconocimiento de la intención, y una mejora de la puntuación de satisfacción del 3,6 al 4,5 (de 5), al comparar el modelo optimizado con GPT‑4.

Modelo entrenado a medida

En algunos casos, las empresas necesitan entrenar a un modelo desde cero para que tenga conocimientos específicos de un sector o dominio concreto. Los modelos entrenados a medida por completo adquieren nuevos conocimientos de un dominio específico al modificar algunos pasos del proceso de entrenamiento de modelos, empleando técnicas novedosas de optimización y posentrenamiento. Las empresas que tienen éxito con un modelo completamente entrenado a medida suelen tener grandes cantidades de datos privados (millones de ejemplos o miles de millones de tókenes) que quieren usar para enseñar al modelo nuevos conocimientos o comportamientos complejos para casos de uso muy específicos.

Un ejemplo de ello es Harvey⁠(se abre en una ventana nueva), una herramienta jurídica para abogados nativa de IA que, con ayuda de OpenAI, creó un LLM de jurisprudencia entrenado a medida⁠. Aunque nuestros modelos básicos contaban con altas capacidades de razonamiento, no tenían los conocimientos de la historia jurídica necesarios para la práctica jurídica. Tras probar técnicas como la ingeniería de prompts, la generación aumentada por recuperación (RAG) y la optimización, Harvey trabajó con nuestro equipo para aportar al modelo el contexto que necesitaba, el equivalente a diez mil millones de tókenes de datos. Nuestro equipo modificó cada paso del proceso de entrenamiento del modelo, desde entrenar al modelo con información específica sobre un tema hasta personalizar los procesos de posentrenamiento e incorporar feedback específico de expertos en jurisprudencia. El modelo resultante obtuvo un aumento del 83 % en respuestas objetivas, y los abogados prefirieron las respuestas del modelo personalizado a las de GPT‑4 en un 97 % de los casos.

Una comparativa entre GPT-4 y el modelo personalizado de GPT-4. El modelo resultante obtuvo un aumento del 83 % en respuestas objetivas, y los abogados prefirieron las respuestas del modelo personalizado a las de GPT-4 en un 97 % de los casos.

El futuro de la personalización de modelos

Estamos convencidos de que, en el futuro, la gran mayoría de las empresas desarrollará modelos personalizados especializados en su sector, negocio o aplicación. Con la gran variedad de técnicas disponibles para crear un modelo personalizado, empresas de todos los tamaños podrán desarrollar modelos a medida capaces de satisfacer sus necesidades específicas de IA. La clave está en evaluar las necesidades específicas en cada caso, diseñar e implementar sistemas de evaluación, seleccionar las técnicas adecuadas y estar dispuestos a repetir el proceso periódicamente para que el modelo ofrezca el máximo rendimiento.

Con OpenAI, la mayoría de las empresas ve resultados significativos rápidamente con la API de optimización autoservicio. Para empresas que necesiten una optimización más personalizada de sus modelos, o entrenarlos con conocimientos de un tema concreto, nuestros programas de modelos personalizados pueden ser una solución más acertada.

Consulta nuestros documentos de optimización con API⁠(se abre en una ventana nueva) para empezar a optimizar nuestros modelos.