4 april 2024

Nieuwe verbeteringen in de fijnafstemmings-API en uitbreiding van het programma voor aangepaste modellen

We voegen nieuwe functies toe om ontwikkelaars meer controle te geven over de fijnafstemming en we kondigen nieuwe manieren aan om eigen modellen te bouwen met OpenAI.

Abstract bloemenkunstwerk met wervelende oranje, gele en paarse tinten die het beeld van een zomers boeket oproepen.

Bezig met laden...

Update van 8-5-2026: OpenAI bouwt het fine-tuning-platform af. Het platform is niet langer toegankelijk voor nieuwe gebruikers, maar bestaande gebruikers van het platform kunnen de komende maanden nog trainingstaken aanmaken. Alle gefine-tunede modellen blijven beschikbaar voor inferentie totdat hun basismodellen worden uitgefaseerd⁠(opent in een nieuw venster). De volledige tijdlijn staat hier⁠(opent in een nieuw venster).

Er zijn verschillende technieken⁠(opent in een nieuw venster) die ontwikkelaars kunnen gebruiken om de prestaties van modellen te verbeteren, met als doel de latentie te verminderen, de nauwkeurigheid te verhogen en de kosten te verlagen. Of het nu gaat om het uitbreiden van modelkennis met retrieval-augmented generation (RAG), het aanpassen van het gedrag van een model met fine-tuning, of het bouwen van een op maat getraind model met nieuwe domeinspecifieke kennis: we hebben een reeks opties ontwikkeld om de AI-implementaties van onze klanten te ondersteunen. Vandaag lanceren we nieuwe functies om ontwikkelaars meer controle te geven over de fine-tuning met de API, en introduceren we meer manieren om samen te werken met ons team van AI-experts en onderzoekers om aangepaste modellen te bouwen.

Nieuwe API-functies voor fijnafstemming

We hebben de zelfbedienings-API voor fijnafstemming⁠(opent in een nieuw venster) voor GPT‑3.5 in augustus 2023 gelanceerd. Sindsdien hebben duizenden organisaties honderdduizenden modellen getraind met behulp van onze API. Met fijnafstemming kunnen modellen diepgaand inzicht verkrijgen in de inhoud en voor een specifieke taak de bestaande kennis en mogelijkheden van een model vergroten. Onze API voor fijnafstemming ondersteunt ook een groter aantal voorbeelden dan in één prompt past, zodat je resultaten van hogere kwaliteit krijgt, terwijl de kosten en latentie worden verminderd. Een paar veelvoorkomende toepassingen van fijnafstemming zijn het trainen van een model om betere code te genereren in een bepaalde programmeertaal, het samenvatten van tekst in een specifieke vorm of het maken van gepersonaliseerde content op basis van gebruikersgedrag.

Indeed⁠(opent in een nieuw venster), een wereldwijd platform voor vacatures en het werven van personeel, wil bijvoorbeeld het wervingsproces vereenvoudigen. Als onderdeel hiervan heeft Indeed een functie gelanceerd die gepersonaliseerde aanbevelingen stuurt naar werkzoekenden, waarbij relevante vacatures worden uitgelicht op basis van hun vaardigheden, ervaring en voorkeuren. Ze hebben GPT‑3.5 Turbo verfijnd om kwalitatief betere en nauwkeurigere verklaringen te genereren. Als gevolg hiervan was Indeed in staat om door het aantal tokens in prompt met 80% te verminderen de kosten en latentie te verbeteren. Hierdoor konden ze opschalen van minder dan een miljoen berichten aan werkzoekenden per maand naar ongeveer 20 miljoen.

Vandaag introduceren we nieuwe functies⁠(opent in een nieuw venster) om ontwikkelaars nog meer controle te geven over hun fijnafstemmingstaken, waaronder:

Op Epoch gebaseerde Checkpoint-creatie: Automatisch één volledig verfijnd modelcontrolepunt produceren tijdens elke trainingsepoch, wat de noodzaak voor hertraining vermindert, vooral in gevallen van overfitting
Vergelijkende Playground: Een nieuwe Playground-gebruikersinterface om de kwaliteit en prestaties van modellen naast elkaar te vergelijken, waardoor mensen de resultaten van meerdere modellen kunnen controleren of momentopnames kunnen fijnafstemmen op basis van één prompt.
Integratie met derde partijen: Ondersteuning voor integratie met platforms van derden (met deze week als eerste Weights and Biases⁠(opent in een nieuw venster)) zodat ontwikkelaars gedetailleerde afstemmingsgegevens kunnen delen met de rest van hun stack
Uitgebreide validatiecijfers: De mogelijkheid om kengetallen zoals verlies en nauwkeurigheid te berekenen over de gehele validatiegegevensset in plaats van een steekproef, wat een beter inzicht geeft in de kwaliteit van het model
Hyperparameterconfiguratie: De mogelijkheid om beschikbare hyperparameters te configureren vanuit het dashboard⁠(opent in een nieuw venster) (in plaats van alleen via de API of SDK)
Verbeteringen aan het dashboard voor fijnafstemming: Inclusief de mogelijkheid om hyperparameters te configureren, meer gedetailleerde trainingsgegevens te bekijken en taken uit eerdere configuraties opnieuw uit te voeren

Een demonstratie van het maken van een nieuw fijnafstemmingsmodel in Playground.

Uitbreiding van ons programma voor eigen modellen

Hulp bij fijnafstemming

Op DevDay in november vorig jaar hebben we een Custom Model-programma aangekondigd⁠ om modellen voor een specifiek domein te trainen en te optimaliseren, samen met een speciale groep onderzoekers van OpenAI. Sindsdien hebben we met tientallen klanten gesproken om hun behoeften aan aangepaste modellen te beoordelen en hebben we ons programma verder ontwikkeld om de prestaties verder te optimaliseren.

Vandaag kondigen we officieel ons aanbod voor hulp bij fijnafstemming aan als onderdeel van het Custom Model-programma. Hulp bij fijnafstemming is een gezamenlijke inspanning samen met onze technische teams om technieken te gebruiken die verder gaan dan de API voor fijnafstemming, zoals extra hyperparameters en verschillende methoden voor parameter-efficiënte fijnafstemming (PEFT) op grotere schaal. Het is vooral handig voor organisaties die hulp nodig hebben bij het opzetten van efficiënte pijplijnen voor trainingsgegevens, evaluatiesystemen en op maat gemaakte parameters en methoden om de prestaties van modellen voor hun specifieke toepassing of taak te optimaliseren.

Zo wilde SK Telecom⁠(opent in een nieuw venster), een telecommunicatiebedrijf met meer dan 30 miljoen abonnees in Zuid-Korea, een eigen model maken om een expert te worden in het telecommunicatiedomein met een initiële focus op klantenservice. Ze werkten samen met OpenAI voor de fijnafstemming van GPT‑4, om de prestaties daarvan in telecom-gerelateerde gesprekken in de Koreaanse taal te verbeteren. In de loop van een aantal weken hebben SKT en OpenAI een flinke verbetering in de prestaties van de klantenservice in de telecomsector gerealiseerd: een verbetering van 35% in de kwaliteit van gesprekssamenvattingen, een verbetering van 33% in de nauwkeurigheid van intentieherkenning en een stijging van de tevredenheidsscores van 3,6 naar 4,5 (op een schaal van 5) als het model met fijnafstemming werd vergeleken met GPT‑4.

Op maat getraind model

In sommige gevallen moeten organisaties een speciaal model van de grond af aan ontwikkelen dat hun bedrijf, branche of domein begrijpt. Volledig op maat getrainde modellen voegen nieuwe kennis toe van een specifiek domein door belangrijke stappen van het modeltrainingsproces aan te passen met behulp van nieuwe technieken tijdens en na de training. Organisaties die succes hebben met een volledig op maat getraind model, hebben vaak grote hoeveelheden eigen gegevens (miljoenen voorbeelden of miljarden tokens), die ze willen gebruiken om het model nieuwe kennis of complex, uniek gedrag aan te leren voor zeer specifieke gebruikssituaties.

Zo werkteHarvey⁠(opent in een nieuw venster), een met AI gecreëerd juridisch hulpmiddel voor advocaten, met OpenAI samen om met eigen training een groot taalmodel voor jurisprudentie te maken⁠. Hoewel foundation-modellen sterk waren in redeneren, misten ze de uitgebreide kennis van de geschiedenis van rechtszaken en andere kennis die nodig is voor juridisch werk. Na het testen van prompt engineering, RAG, en fijnafstemming, werkte Harvey samen met ons team om de diepgaande context die nodig was toe te voegen aan het model. Het gaat hier om het equivalent van 10 miljard tokens aan gegevens. Ons team heeft elke stap van het modeltrainingsproces aangepast, van domeinspecifieke mid-training tot het aanpassen van processen van de training achteraf en het opnemen van feedback van deskundige advocaten. Het resulterende model behaalde een toename van 83% in feitelijke antwoorden en advocaten gaven 97% van de tijd de voorkeur aan de uitvoer van het eigen model boven GPT‑4.

Een vergelijking van GPT-4 en het eigen GPT-4-model. Het resulterende model behaalde een toename van 83% in feitelijke antwoorden en advocaten gaven 97% van de tijd de voorkeur aan de uitvoer van het eigen model boven GPT-4.

Wat is de volgende stap voor modelaanpassing?

Wij geloven dat de overgrote meerderheid van organisaties in de toekomst eigen modellen zal ontwikkelen die zijn afgestemd op hun branche, bedrijf of gebruikssituatie. Met de uiteenlopende technieken die beschikbaar zijn om een eigen model te bouwen, kunnen organisaties van elke omvang gepersonaliseerde modellen ontwikkelen om met hun AI-toepassingen zinvollere en specifiekere impact te realiseren. De sleutel is om de gegevenssituatie duidelijk af te bakenen, evaluatiesystemen te ontwerpen en te implementeren, de juiste technieken te kiezen en bereid te zijn om in opeenvolgende rondes aan het model te sleutelen om optimale prestaties te bereiken.

Met OpenAI kunnen de meeste organisaties snel zinvolle resultaten zien met de doe-het-zelf fijnafstemming-API. Voor organisaties die hun modellen verder willen verfijnen of nieuwe domeinspecifieke kennis in het model willen opnemen, kunnen onze programma's voor eigen modellen uitkomst bieden.

Bekijk de documentatie over de fijnafstemming-API⁠(opent in een nieuw venster) om aan de slag te gaan met de fijnafstemming van de modellen.

Gerelateerde artikelen

Alles weergeven

Video generation models as world simulators

Publicatie15 feb 2024

Building an early warning system for LLM-aided biological threat creation

Publicatie31 jan 2024

Weak-to-strong generalization

Veiligheid14 dec 2023