2024 оны дөрөвдүгээр сарын 4

Introducing improvements to the fine-tuning API and expanding our custom models program

Ачаалж байна…

2026 оны 5-р сарын 8-ны шинэчлэлт: OpenAI нь нарийн тохируулгын платформыг хааж байна. Платформ нь шинэ хэрэглэгчдэд нээлттэй байхаа больсон боловч одоо байгаа хэрэглэгчид ирэх саруудад сургалтын ажлын байр үүсгэх боломжтой хэвээр байна. Бүх нарийн тохируулсан загварууд нь үндсэн загварууд нь хуучирсан⁠(шинэ цонхонд нээгдэнэ)хүртэл таамаглалд ашиглах боломжтой хэвээр байна. Бүрэн цагийн хуваарь энд⁠(шинэ цонхонд нээгдэнэ)байна.

Хөгжүүлэгчид хоцрогдлыг бууруулах, нарийвчлалыг сайжруулах, зардлыг багасгах зорилгоор загварын гүйцэтгэлийг нэмэгдүүлэхэд ашиглаж болох олон төрлийн арга техникүүд⁠(шинэ цонхонд нээгдэнэ) байдаг. Мэдээлэл хайлтаар баяжуулсан үүсгэл (RAG)-ээр загварын мэдлэгийг өргөжүүлэх, нарийвчилсан тохируулгаар загварын ажиллах зан төлөвийг тохируулах эсвэл шинэ домэйнд суурилсан мэдлэгтэй тусгайлан сургасан загвар бүтээх зэрэг аль ч тохиолдолд бид хэрэглэгчдийнхээ хиймэл оюун ухааны хэрэгжүүлэлтийг дэмжих олон төрлийн сонголтыг боловсруулсан. Өнөөдөр бид хөгжүүлэгчдэд API ашиглан нарийвчлан тохируулахад илүү их хяналт олгох шинэ боломжуудыг нэвтрүүлж, хиймэл оюун ухааны мэргэжилтнүүд болон судлаачдын багтай хамтран тусгай загвар бүтээх илүү олон арга замыг нэвтрүүлж байна.

Fine-tuning API-н шинэ боломжууд

We launched the self-serve fine-tuning API⁠(шинэ цонхонд нээгдэнэ) for GPT‑3.5 in August 2023. Since then, thousands of organizations have trained hundreds of thousands of models using our API. Fine-tuning can help models deeply understand content and augment a model’s existing knowledge and capabilities for a specific task. Our fine-tuning API also supports a larger volume of examples than can fit in a single prompt to achieve higher quality results while reducing cost and latency. Some of the common use cases of fine-tuning include training a model to generate better code in a particular programming language, to summarize text in a specific format, or to craft personalized content based on user behavior.

For example, Indeed⁠(шинэ цонхонд нээгдэнэ), a global job matching and hiring platform, wants to simplify the hiring process. As part of this, Indeed launched a feature that sends personalized recommendations to job seekers, highlighting relevant jobs based on their skills, experience, and preferences. They fine-tuned GPT‑3.5 Turbo to generate higher quality and more accurate explanations. As a result, Indeed was able to improve cost and latency by reducing the number of tokens in prompt by 80%. This let them scale from less than one million messages to job seekers per month to roughly 20 million.

Today, we’re introducing new features⁠(шинэ цонхонд нээгдэнэ) to give developers even more control over their fine-tuning jobs, including:

Epoch-based Checkpoint Creation: Automatically produce one full fine-tuned model checkpoint during each training epoch, which reduces the need for subsequent retraining, especially in the cases of overfitting
Comparative Playground: A new side-by-side Playground UI for comparing model quality and performance, allowing human evaluation of the outputs of multiple models or fine-tune snapshots against a single prompt
Third-party Integration: Support for integrations with third-party platforms (starting with Weights and Biases⁠(шинэ цонхонд нээгдэнэ) this week) to let developers share detailed fine-tuning data to the rest of their stack
Comprehensive Validation Metrics: The ability to compute metrics like loss and accuracy over the entire validation dataset instead of a sampled batch, providing better insight on model quality
Hyperparameter Configuration: The ability to configure available hyperparameters from the Dashboard⁠(шинэ цонхонд нээгдэнэ) (rather than only through the API or SDK)
Fine-Tuning Dashboard Improvements: Including the ability to configure hyperparameters, view more detailed training metrics, and rerun jobs from previous configurations

Манай Custom Models Program-ыг өргөжүүлж байна

Тусламжтай Fine-Tuning

Өнгөрсөн арваннэгдүгээр сард болсон DevDay дээр бид тодорхой домэйнд зориулан загвар сургаж, оновчлох зорилготой, OpenAI-ийн судлаачдын тусгай багтай хамтран хэрэгжүүлэх Custom Model хөтөлбөрийг зарласан⁠. Түүнээс хойш бид custom загварын хэрэгцээг нь үнэлэхээр олон арван хэрэглэгчтэй уулзаж, гүйцэтгэлийг улам дээд хэмжээнд хүргэхийн тулд хөтөлбөрөө хөгжүүлсээр ирсэн.

Өнөөдөр бид Custom Model хөтөлбөрийн нэг хэсэг болгон assisted fine-tuning саналаа албан ёсоор зарлаж байна. Assisted fine-tuning нь fine-tuning API-аас давсан аргуудыг, тухайлбал нэмэлт hyperparameter болон төрөл бүрийн parameter efficient fine-tuning (PEFT) аргуудыг илүү өргөн хүрээнд ашиглахын тулд манай техникийн багуудтай хамтран ажиллах хэлбэр юм. Энэ нь ялангуяа өөрсдийн хэрэглээ эсвэл даалгаварт загварын гүйцэтгэлийг хамгийн дээд түвшинд хүргэхийн тулд үр ашигтай сургалтын өгөгдлийн pipeline, үнэлгээний систем, тусгай параметр ба аргуудыг тохируулахад дэмжлэг хэрэгтэй байгууллагуудад тустай.

Жишээлбэл, Өмнөд Солонгост 30 сая гаруй хэрэглэгчид үйлчилдэг харилцаа холбооны оператор SK Telecom⁠(шинэ цонхонд нээгдэнэ) нь эхний ээлжид хэрэглэгчийн үйлчилгээнд төвлөрөн, харилцаа холбооны салбарт мэргэшсэн загвар тохируулахыг хүссэн. Тэд OpenAI-тай хамтран GPT‑4‑ийг fine-tuning хийж, солонгос хэл дээрх харилцаа холбоотой яриан дахь гүйцэтгэлийг нь сайжруулсан. Хэдэн долоо хоногийн турш SKT ба OpenAI харилцаа холбооны хэрэглэгчийн үйлчилгээний даалгавруудад мэдэгдэхүйц ахиц гаргасан—ярианы хураангуйн чанар 35%-иар, зорилго таних нарийвчлал 33%-иар өсөж, fine-tuning хийсэн загварыг GPT‑4‑тэй харьцуулахад сэтгэл ханамжийн үнэлгээ 3.6-аас 4.5 (5-аас) болж өссөн.

Custom сургалттай загвар

In some cases, organizations need to train a purpose-built model from scratch that understands their business, industry, or domain. Fully custom-trained models imbue new knowledge from a specific domain by modifying key steps of the model training process using novel mid-training and post-training techniques. Organizations that see success with a fully custom-trained model often have large quantities of proprietary data—millions of examples or billions of tokens—that they want to use to teach the model new knowledge or complex, unique behaviors for highly specific use cases.

For example, Harvey⁠(шинэ цонхонд нээгдэнэ), an AI-native legal tool for attorneys, partnered with OpenAI to create a custom-trained large language model for case law⁠. While foundation models were strong at reasoning, they lacked the extensive knowledge of legal case history and other knowledge required for legal work. After testing out prompt engineering, RAG, and fine-tuning, Harvey worked with our team to add the depth of context needed to the model—the equivalent of 10 billion tokens worth of data. Our team modified every step of the model training process, from domain-specific mid-training to customizing post-training processes and incorporating expert attorney feedback. The resulting model achieved an 83% increase in factual responses and attorneys preferred the customized model’s outputs 97% of the time over GPT‑4.

Index > Introducing Improvements > Media Item > Gif 2

Загварын тохируулгын дараагийн алхам

Ирээдүйд байгууллагуудын дийлэнх нь өөрсдийн салбар, бизнес эсвэл хэрэглээнд тохируулан хувьчилсан загваруудыг хөгжүүлнэ гэдэгт бид итгэдэг. Custom загвар бүтээх олон төрлийн арга боломжтой болсон энэ үед бүх хэмжээний байгууллагууд AI хэрэгжилтээсээ илүү утга учиртай, тодорхой үр нөлөө гаргахын тулд хувьчилсан загварууд хөгжүүлэх боломжтой. Үүний түлхүүр нь хэрэглээг тодорхой хүрээнд тогтоох, үнэлгээний системүүдийг зохион бүтээж хэрэгжүүлэх, зөв аргуудыг сонгох, мөн загвар хамгийн сайн гүйцэтгэлд хүрэхийн тулд цаг хугацааны явцад давтан сайжруулахад бэлэн байх явдал юм.

OpenAI-тай бол ихэнх байгууллага self-serve fine-tuning API-аар хурдан хугацаанд мэдэгдэхүйц үр дүн харж чадна. Загвараа илүү гүн fine-tuning хийх эсвэл загварт домэйнд хамаарах шинэ мэдлэг шингээх шаардлагатай байгууллагуудад манай Custom Model хөтөлбөрүүд тусална.

Манай загваруудыг fine-tuning хийж эхлэхийн тулд fine-tuning API⁠(шинэ цонхонд нээгдэнэ)-ийн баримтжуулалтыг үзнэ үү.

Холбоотой нийтлэлүүд

Бүгдийг үзэх

Video generation models as world simulators

Нийтлэл2024 оны 2-р сарын 15

Building an early warning system for LLM-aided biological threat creation

Нийтлэл2024 оны 1-р сарын 31

Weak-to-strong generalization

Аюулгүй байдал2023 оны 12-р сарын 14