4 d’abril del 2024

Introducing improvements to the fine-tuning API and expanding our custom models program

S'està carregant…

Actualització del 8 de maig de 2026: OpenAI està retirant progressivament la plataforma de ajust fi. La plataforma ja no és accessible per a nous usuaris, però els usuaris actuals de la plataforma d'ajust fi podran crear tasques d'entrenament durant els propers mesos. Tots els models amb ajust fi continuaran disponibles per a la inferència fins que els seus models base siguin retirats⁠(s'obre en una finestra nova). El calendari complet és aquí⁠(s'obre en una finestra nova).

Hi ha una varietat de tècniques⁠(s'obre en una finestra nova) que els desenvolupadors poden utilitzar per millorar el rendiment del model amb l’objectiu de reduir la latència, millorar la precisió i reduir costos. Tant si es tracta d’ampliar el coneixement del model amb generació augmentada per recuperació (retrieval-augmented generation, RAG), de personalitzar el comportament d’un model amb ajust precís o de crear un model entrenat a mida amb coneixement nou específic del domini, hem desenvolupat un ventall d’opcions per donar suport a les implementacions d’IA dels nostres clients. Avui llancem noves funcions per donar als desenvolupadors més control sobre l’ajust fi amb l’API i presentem més maneres de treballar amb el nostre equip d’experts en IA i investigadors per crear models personalitzats.

Noves funcions de l’API de fine-tuning

We launched the self-serve fine-tuning API⁠(s'obre en una finestra nova) for GPT‑3.5 in August 2023. Since then, thousands of organizations have trained hundreds of thousands of models using our API. Fine-tuning can help models deeply understand content and augment a model’s existing knowledge and capabilities for a specific task. Our fine-tuning API also supports a larger volume of examples than can fit in a single prompt to achieve higher quality results while reducing cost and latency. Some of the common use cases of fine-tuning include training a model to generate better code in a particular programming language, to summarize text in a specific format, or to craft personalized content based on user behavior.

For example, Indeed⁠(s'obre en una finestra nova), a global job matching and hiring platform, wants to simplify the hiring process. As part of this, Indeed launched a feature that sends personalized recommendations to job seekers, highlighting relevant jobs based on their skills, experience, and preferences. They fine-tuned GPT‑3.5 Turbo to generate higher quality and more accurate explanations. As a result, Indeed was able to improve cost and latency by reducing the number of tokens in prompt by 80%. This let them scale from less than one million messages to job seekers per month to roughly 20 million.

Today, we’re introducing new features⁠(s'obre en una finestra nova) to give developers even more control over their fine-tuning jobs, including:

Epoch-based Checkpoint Creation: Automatically produce one full fine-tuned model checkpoint during each training epoch, which reduces the need for subsequent retraining, especially in the cases of overfitting
Comparative Playground: A new side-by-side Playground UI for comparing model quality and performance, allowing human evaluation of the outputs of multiple models or fine-tune snapshots against a single prompt
Third-party Integration: Support for integrations with third-party platforms (starting with Weights and Biases⁠(s'obre en una finestra nova) this week) to let developers share detailed fine-tuning data to the rest of their stack
Comprehensive Validation Metrics: The ability to compute metrics like loss and accuracy over the entire validation dataset instead of a sampled batch, providing better insight on model quality
Hyperparameter Configuration: The ability to configure available hyperparameters from the Dashboard⁠(s'obre en una finestra nova) (rather than only through the API or SDK)
Fine-Tuning Dashboard Improvements: Including the ability to configure hyperparameters, view more detailed training metrics, and rerun jobs from previous configurations

Ampliem el nostre programa de models personalitzats

Fine-tuning assistit

A DevDay el novembre passat, vam anunciar⁠ un programa de model personalitzat dissenyat per entrenar i optimitzar models per a un domini específic, en col·laboració amb un grup dedicat d’investigadors d’OpenAI. Des d’aleshores, ens hem reunit amb desenes de clients per avaluar les seves necessitats de models personalitzats i hem fet evolucionar el nostre programa per maximitzar encara més el rendiment.

Avui anunciem formalment la nostra oferta de fine-tuning assistit com a part del programa de model personalitzat. El fine-tuning assistit és un esforç col·laboratiu amb els nostres equips tècnics per aprofitar tècniques que van més enllà de l’API de fine-tuning, com ara hiperparàmetres addicionals i diversos mètodes de fine-tuning eficient de paràmetres (PEFT) a més escala. És especialment útil per a organitzacions que necessiten suport per configurar canals de dades d’entrenament eficients, sistemes d’avaluació i paràmetres i mètodes a mida per maximitzar el rendiment del model per al seu cas d’ús o tasca.

Per exemple, SK Telecom⁠(s'obre en una finestra nova), un operador de telecomunicacions que dona servei a més de 30 milions d’abonats a Corea del Sud, volia personalitzar un model perquè fos expert en el domini de les telecomunicacions, amb un enfocament inicial en l’atenció al client. Van treballar amb OpenAI per aplicar fine-tuning a GPT‑4 i millorar-ne el rendiment en converses relacionades amb les telecomunicacions en llengua coreana. Al llarg de diverses setmanes, SKT i OpenAI van aconseguir una millora significativa del rendiment en tasques d’atenció al client de telecomunicacions: un augment del 35% en la qualitat del resum de converses, un augment del 33% en la precisió del reconeixement d’intencions i un increment de les puntuacions de satisfacció de 3,6 a 4,5 (sobre 5) en comparar el model ajustat amb GPT‑4.

Model entrenat a mida

In some cases, organizations need to train a purpose-built model from scratch that understands their business, industry, or domain. Fully custom-trained models imbue new knowledge from a specific domain by modifying key steps of the model training process using novel mid-training and post-training techniques. Organizations that see success with a fully custom-trained model often have large quantities of proprietary data—millions of examples or billions of tokens—that they want to use to teach the model new knowledge or complex, unique behaviors for highly specific use cases.

For example, Harvey⁠(s'obre en una finestra nova), an AI-native legal tool for attorneys, partnered with OpenAI to create a custom-trained large language model for case law⁠. While foundation models were strong at reasoning, they lacked the extensive knowledge of legal case history and other knowledge required for legal work. After testing out prompt engineering, RAG, and fine-tuning, Harvey worked with our team to add the depth of context needed to the model—the equivalent of 10 billion tokens worth of data. Our team modified every step of the model training process, from domain-specific mid-training to customizing post-training processes and incorporating expert attorney feedback. The resulting model achieved an 83% increase in factual responses and attorneys preferred the customized model’s outputs 97% of the time over GPT‑4.

Index > Introducing Improvements > Media Item > Gif 2

Què ve després en la personalització de models

Creiem que, en el futur, la gran majoria d’organitzacions desenvoluparan models personalitzats adaptats al seu sector, negoci o cas d’ús. Amb diverses tècniques disponibles per crear un model personalitzat, organitzacions de totes les mides poden desenvolupar models personalitzats per aconseguir un impacte més significatiu i específic de les seves implementacions d’IA. La clau és delimitar clarament el cas d’ús, dissenyar i implementar sistemes d’avaluació, triar les tècniques adequades i estar preparats per iterar al llarg del temps perquè el model arribi a un rendiment òptim.

Amb OpenAI, la majoria d’organitzacions poden veure resultats significatius ràpidament amb l’API de fine-tuning d’autoservei. Per a qualsevol organització que necessiti ajustar més a fons els seus models o incorporar al model coneixement nou específic del domini, els nostres programes de model personalitzat poden ajudar.

Visiteu la documentació de la nostra API de fine-tuning⁠(s'obre en una finestra nova) per començar a ajustar els nostres models.

Articles relacionats

Veure-ho tot

Video generation models as world simulators

Publicació15 de febr. del 2024

Building an early warning system for LLM-aided biological threat creation

Publicació31 de gen. del 2024

Weak-to-strong generalization

Seguretat14 de des. del 2023