4 Aibreán 2024

Introducing improvements to the fine-tuning API and expanding our custom models program

Ag lódáil…

Nuashonrú an 08/05/2026: Tá OpenAI ag scor den ardán míntiúnaithe de réir a chéile. Níl an t-ardán inrochtana d’úsáideoirí nua a thuilleadh, ach beidh úsáideoirí reatha an ardáin míntiúnaithe in ann tascanna oiliúna a chruthú sna míonna atá romhainn. Fanfaidh na samhailí míntiúnaithe uile ar fáil le haghaidh tátail go dtí go mbeidh a mbunsamhailí dímholta⁠(osclaíonn i bhfuinneog nua). Tá an t-amlíne iomlán anseo⁠(osclaíonn i bhfuinneog nua).

Tá réimse teicnící⁠(osclaíonn i bhfuinneog nua) ann ar féidir le forbróirí iad a úsáid chun feidhmíocht na samhla a fheabhsú, moill a laghdú, cruinneas a fheabhsú, agus costais a laghdú. Cibé acu atá i gceist—eolas samhla a leathnú le giniúint bhreisithe le haisghabháil (RAG), iompar samhla a shaincheapadh le mionchoigeartú, nó samhail shainoiliúnaithe a thógáil le heolas nua atá sainiúil don fhearann—tá réimse roghanna forbartha againn chun tacú le cur chun feidhme IS ár gcustaiméirí. Inniu, táimid ag seoladh gnéithe nua chun níos mó smachta a thabhairt d’fhorbróirí ar mhionchoigeartú leis an API agus ag tabhairt isteach tuilleadh bealaí chun oibriú lenár bhfoireann de shaineolaithe AI agus de thaighdeoirí chun samhailí saincheaptha a thógáil.

Gnéithe nua den API mionchoigeartaithe

We launched the self-serve fine-tuning API⁠(osclaíonn i bhfuinneog nua) for GPT‑3.5 in August 2023. Since then, thousands of organizations have trained hundreds of thousands of models using our API. Fine-tuning can help models deeply understand content and augment a model’s existing knowledge and capabilities for a specific task. Our fine-tuning API also supports a larger volume of examples than can fit in a single prompt to achieve higher quality results while reducing cost and latency. Some of the common use cases of fine-tuning include training a model to generate better code in a particular programming language, to summarize text in a specific format, or to craft personalized content based on user behavior.

For example, Indeed⁠(osclaíonn i bhfuinneog nua), a global job matching and hiring platform, wants to simplify the hiring process. As part of this, Indeed launched a feature that sends personalized recommendations to job seekers, highlighting relevant jobs based on their skills, experience, and preferences. They fine-tuned GPT‑3.5 Turbo to generate higher quality and more accurate explanations. As a result, Indeed was able to improve cost and latency by reducing the number of tokens in prompt by 80%. This let them scale from less than one million messages to job seekers per month to roughly 20 million.

Today, we’re introducing new features⁠(osclaíonn i bhfuinneog nua) to give developers even more control over their fine-tuning jobs, including:

Epoch-based Checkpoint Creation: Automatically produce one full fine-tuned model checkpoint during each training epoch, which reduces the need for subsequent retraining, especially in the cases of overfitting
Comparative Playground: A new side-by-side Playground UI for comparing model quality and performance, allowing human evaluation of the outputs of multiple models or fine-tune snapshots against a single prompt
Third-party Integration: Support for integrations with third-party platforms (starting with Weights and Biases⁠(osclaíonn i bhfuinneog nua) this week) to let developers share detailed fine-tuning data to the rest of their stack
Comprehensive Validation Metrics: The ability to compute metrics like loss and accuracy over the entire validation dataset instead of a sampled batch, providing better insight on model quality
Hyperparameter Configuration: The ability to configure available hyperparameters from the Dashboard⁠(osclaíonn i bhfuinneog nua) (rather than only through the API or SDK)
Fine-Tuning Dashboard Improvements: Including the ability to configure hyperparameters, view more detailed training metrics, and rerun jobs from previous configurations

Ár gClár Samhlacha Saincheaptha á Leathnú

Mionchoigeartú Cuidithe

Ag DevDay i mí na Samhna seo caite, d’fhógair⁠ muid clár Samhlacha Saincheaptha a dearadh chun samhlacha a oiliúint agus a bharrfheabhsú do réimse ar leith, i gcomhpháirt le grúpa tiomnaithe taighdeoirí OpenAI. Ó shin i leith, bhuail muid le mórán custaiméirí chun a gcuid riachtanas samhlacha saincheaptha a mheas agus d’fhorbraíomar ár gclár chun feidhmíocht a uasmhéadú tuilleadh.

Inniu, táimid ag fógairt go foirmiúil ár dtairiscint mionchoigeartaithe chuidithe mar chuid den chlár Samhlacha Saincheaptha. Is iarracht chomhoibríoch í an mhionchoigeartú cuidithe lenár bhfoirne teicniúla chun leas a bhaint as teicnící lasmuigh den API mionchoigeartaithe, amhail hipearpharaiméadair bhreise agus modhanna éagsúla mionchoigeartaithe éifeachtúla paraiméadar (PEFT) ar scála níos mó. Tá sé thar a bheith cabhrach d’eagraíochtaí a bhfuil tacaíocht de dhíth orthu chun píblínte sonraí oiliúna éifeachtúla, córais mheastóireachta, agus paraiméadair agus modhanna saincheaptha a chur ar bun chun feidhmíocht samhla a uasmhéadú dá gcás úsáide nó dá dtasc.

Mar shampla, bhí SK Telecom⁠(osclaíonn i bhfuinneog nua), oibreoir teileachumarsáide a fhreastalaíonn ar níos mó ná 30 milliún síntiúsóir sa Chóiré Theas, ag iarraidh samhail a shaincheapadh le bheith ina saineolaí sa réimse teileachumarsáide agus fócas tosaigh ar sheirbhís do chustaiméirí. D’oibrigh siad le OpenAI chun GPT‑4 a mhionchoigeartú agus a fheidhmíocht i gcomhráite a bhaineann le teileachumarsáid sa Chóiréis a fheabhsú. Le linn roinnt seachtainí, bhain SKT agus OpenAI feabhsú suntasach feidhmíochta amach i dtascanna seirbhíse do chustaiméirí teileachumarsáide—méadú 35% ar cháilíocht achoimrithe comhrá, méadú 33% ar chruinneas aithinte intinne, agus ardú ar scóir sástachta ó 3.6 go 4.5 (as 5) nuair a cuireadh an tsamhail mhionchoigeartaithe i gcomparáid le GPT‑4.

Samhail Shainoiliúnaithe

In some cases, organizations need to train a purpose-built model from scratch that understands their business, industry, or domain. Fully custom-trained models imbue new knowledge from a specific domain by modifying key steps of the model training process using novel mid-training and post-training techniques. Organizations that see success with a fully custom-trained model often have large quantities of proprietary data—millions of examples or billions of tokens—that they want to use to teach the model new knowledge or complex, unique behaviors for highly specific use cases.

For example, Harvey⁠(osclaíonn i bhfuinneog nua), an AI-native legal tool for attorneys, partnered with OpenAI to create a custom-trained large language model for case law⁠. While foundation models were strong at reasoning, they lacked the extensive knowledge of legal case history and other knowledge required for legal work. After testing out prompt engineering, RAG, and fine-tuning, Harvey worked with our team to add the depth of context needed to the model—the equivalent of 10 billion tokens worth of data. Our team modified every step of the model training process, from domain-specific mid-training to customizing post-training processes and incorporating expert attorney feedback. The resulting model achieved an 83% increase in factual responses and attorneys preferred the customized model’s outputs 97% of the time over GPT‑4.

Index > Introducing Improvements > Media Item > Gif 2

Cad é an chéad chéim eile do shaincheapadh samhlacha

Creidimid, amach anseo, go bhforbróidh formhór mór na n-eagraíochtaí samhlacha saincheaptha atá pearsantaithe dá dtionscal, dá ngnó, nó dá gcás úsáide. Le héagsúlacht teicnící ar fáil chun samhail shaincheaptha a thógáil, is féidir le heagraíochtaí de gach méid samhlacha pearsantaithe a fhorbairt chun tionchar níos bríomhaire agus níos sainiúla a bhaint amach óna gcur chun feidhme AI. Is í an eochair an cás úsáide a shainmhíniú go soiléir, córais mheastóireachta a dhearadh agus a chur i bhfeidhm, na teicnící cearta a roghnú, agus a bheith ullamh chun atriall a dhéanamh le himeacht ama chun go sroichfidh an tsamhail an fheidhmíocht is fearr.

Le OpenAI, is féidir le formhór na n-eagraíochtaí torthaí suntasacha a fheiceáil go tapa leis an API mionchoigeartaithe féinseirbhíse. D’aon eagraíochtaí a bhfuil gá acu a samhlacha a mhionchoigeartú níos doimhne nó eolas nua atá sonrach don réimse a chur isteach sa tsamhail, is féidir lenár gcláir Samhlacha Saincheaptha cabhrú.

Tabhair cuairt ar ár ndoiciméid API mionchoigeartaithe⁠(osclaíonn i bhfuinneog nua) chun tús a chur lenár samhlacha a mhionchoigeartú.

Ailt ghaolmhara

Féach gach rud

Video generation models as world simulators

Foilsiú15 Feabh 2024

Building an early warning system for LLM-aided biological threat creation

Foilsiú31 Ean 2024

Weak-to-strong generalization

Sábháilteacht14 Noll 2023