4 de abril de 2024

Apresentamos melhorias na API de ajuste fino e ampliamos o programa de modelos personalizados

Adicionamos novos recursos para ajudar os desenvolvedores a ter mais controle sobre o ajuste fino e anunciamos novas maneiras de criar modelos personalizados com a OpenAI.

Obra de arte floral abstrata, com nuances vibrantes de laranja e amarelo que se entrelaçam em espirais e sutis toques de púrpura, evocando a essência de um buquê de verão.

Carregando…

Atualização de 8 de maio de 2026: A OpenAI está descontinuando gradualmente a plataforma de fine-tuning. A plataforma não está mais acessível para novos usuários, mas usuários existentes da plataforma de fine-tuning poderão criar jobs de treinamento pelos próximos meses. Todos os modelos com fine-tuning continuarão disponíveis para inferência até que seus modelos base sejam descontinuados⁠(abre em uma nova janela). O cronograma completo está aqui⁠(abre em uma nova janela).

Há diversas técnicas⁠(abre em uma nova janela) que desenvolvedores podem usar para melhorar o desempenho dos modelos, em um esforço para reduzir a latência, aumentar a precisão e diminuir custos. Seja ampliando o conhecimento do modelo com geração aumentada por recuperação (RAG), personalizando o comportamento de um modelo com fine-tuning ou criando um modelo treinado sob medida com novos conhecimentos específicos de domínio, desenvolvemos uma variedade de opções para apoiar as implementações de IA dos nossos clientes. Hoje, estamos lançando novos recursos para dar aos desenvolvedores mais controle sobre o fine-tuning com a API e apresentando mais formas de trabalhar com nossa equipe de especialistas e pesquisadores em IA para criar modelos personalizados.

Novos recursos da API de ajuste fino

Lançamos a API de ajuste fino⁠(abre em uma nova janela) por autoatendimento para o GPT‑3.5 em agosto de 2023. Desde então, milhares de organizações treinaram centenas de milhares de modelos usando nossa API. O ajuste fino pode ajudar os modelos a entender profundamente o conteúdo, aumentando o conhecimento e as capacidades dele para tarefas específicas. Além disso, nossa API de ajuste fino aceita uma quantidade maior de exemplos do que a capacidade de um prompt individual, alcançando resultados de maior qualidade com menor custo e latência. Entre os casos de uso comuns de ajuste fino, estão treinar um modelo para gerar código melhor em uma determinada linguagem de programação, resumir texto em um formato específico ou criar conteúdo personalizado com base no comportamento do usuário.

Como exemplo, a Indeed⁠(abre em uma nova janela), plataforma global que conecta candidatos a oportunidades de emprego, pretende simplificar o processo de contratação. Como parte dessa iniciativa, a Indeed lançou um recurso que envia recomendações personalizadas para candidatos a emprego, destacando vagas relevantes com base em suas habilidades, experiência e preferências. Eles realizaram o ajuste fino do GPT‑3.5 Turbo para gerar explicações com mais qualidade e maior precisão. Como resultado, a Indeed conseguiu melhorar o custo e a latência, reduzindo em 80% o número de tokens no prompt. Com esse aprimoramento, a empresa conseguiu aumentar o número de mensagens mensais para candidatos a emprego de um milhão para cerca de 20 milhões.

Hoje, apresentamos novos recursos⁠(abre em uma nova janela) para dar aos desenvolvedores ainda mais controle sobre o trabalho de ajuste fino, incluindo:

Criação de pontos de verificação com base em época: gera automaticamente um ponto de verificação completo do modelo com ajuste fino durante cada época de treinamento, reduzindo a necessidade de retreinamento subsequente, principalmente em casos de sobreajuste
Playground comparativo: uma nova IU lado a lado do Playground para comparar a qualidade e o desempenho de modelos, permitindo a avaliação humana dos resultados de vários modelos ou instantâneos de ajuste fino em relação a um único prompt
Integração de terceiros: suporte a integrações com plataformas de terceiros (começando esta semana com Weights & Biases⁠(abre em uma nova janela)) para permitir que desenvolvedores compartilhem dados detalhados de ajuste fino com o resto da pilha
Métricas de validação abrangentes: a capacidade de calcular métricas como perda e precisão para todo o conjunto de dados de validação, em vez de um lote de amostra, proporcionando melhores insights sobre a qualidade do modelo
Configuração de hiperparâmetros: a capacidade de configurar hiperparâmetros disponíveis no painel de controle⁠(abre em uma nova janela) (em vez de apenas pela API ou SDK)
Melhorias de ajuste fino no painel de controle: incluindo a capacidade de configurar hiperparâmetros, visualizar métricas de treinamento mais detalhadas e executar novamente trabalhos usando configurações anteriores

Uma demonstração da criação de um novo modelo de ajuste fino no Playground.

Expansão do programa de modelos personalizados

Ajuste fino assistido

No DevDay de novembro passado, anunciamos⁠ um programa de modelos personalizados projetado para treinar e otimizar modelos para um domínio específico, em parceria com um grupo dedicado de investigadores da OpenAI. Desde então, conversamos com dezenas de clientes para avaliar suas necessidades de modelos personalizados e aperfeiçoamos nosso programa para maximizar ainda mais o desempenho.

Hoje, anunciamos formalmente nossa oferta de ajuste fino assistido como parte do programa de modelos personalizados. O ajuste fino assistido é um esforço colaborativo com nossas equipes técnicas para utilizar recursos além da API de ajuste fino, como hiperparâmetros adicionais e vários métodos de ajuste fino eficiente de parâmetros (PEFT) em maior escala. Ele é particularmente útil para organizações que precisam de suporte para configurar pipelines de dados de treinamento, sistemas de avaliação e parâmetros e métodos personalizados eficientes, maximizando o desempenho de modelos em casos de uso ou tarefas específicos.

Por exemplo, a SK Telecom⁠(abre em uma nova janela), uma operadora de telecomunicações que atende mais de 30 milhões de assinantes na Coreia do Sul, queria personalizar um modelo para ser especialista no domínio de telecomunicações, com foco inicial no atendimento aos clientes. A empresa trabalhou com a OpenAI para fazer um ajuste fino do GPT‑4 a fim de melhorar seu desempenho em conversas relacionadas a telecomunicações no idioma coreano. Ao longo de várias semanas, a SKT e a OpenAI promoveram melhorias significativas no desempenho em tarefas de atendimento ao cliente de telecomunicações: 35% de aumento na qualidade de resumos de conversas, 33% de aumento na precisão do reconhecimento de intenção e um aumento nas pontuações de satisfação de 3,6 para 4,5 (de 5) no modelo com o ajuste fino em comparação ao GPT‑4.

Modelo com treinamento personalizado

Em alguns casos, as organizações precisam treinar um modelo com propósito específico que entenda seu negócio, setor ou domínio. Os modelos treinados de forma totalmente personalizada incorporam um novo conhecimento de um domínio específico por meio da modificação de etapas importantes do processo de treinamento, utilizando técnicas inovadoras de treinamento intermediário e pós-treinamento. Geralmente, as organizações que obtêm bons resultados com modelos treinados de forma totalmente personalizada contam com grandes quantidades de dados proprietários, como milhões de exemplos ou bilhões de tokens, e querem usá-los para ensinar aos modelos um novo conhecimento ou comportamentos complexos e únicos para casos de uso altamente específicos.

A Harvey⁠(abre em uma nova janela), por exemplo, oferece uma ferramenta jurídica nativa de IA para advogados. Em parceria com a OpenAI, a empresa criou um grande modelo de linguagem com treinamento personalizado para jurisprudência⁠. Os modelos básicos tinham um bom desempenho em raciocínio, mas não contavam com o extenso conhecimento de casos jurídicos e outros conhecimentos necessários para o trabalho jurídico. Depois de testar engenharia de prompts, RAG e ajustes finos, a Harvey trabalhou com nossa equipe para adicionar a profundidade de contexto necessária ao modelo, o equivalente a 10 bilhões de tokens de dados. Nossa equipe modificou cada etapa do processo de treinamento do modelo, desde o treinamento intermediário específico do domínio até a personalização dos processos de pós-treinamento e incorporação do feedback de advogados especialistas. Comparado ao GPT‑4, o modelo resultante obteve 83% mais respostas factuais e foi o preferido pelos advogados em 97% dos casos.

Uma comparação entre o GPT-4 e o modelo personalizado do GPT-4. Comparado ao GPT-4, o modelo resultante obteve 83% mais respostas factuais e foi o preferido pelos advogados em 97% dos casos.

Os próximos passos da personalização de modelos

Acreditamos que, no futuro, a grande maioria das organizações desenvolverá modelos personalizados para seu próprio setor, negócio ou caso de uso. Com diversas técnicas disponíveis para criar um modelo personalizado, organizações de todos os portes podem desenvolver modelos personalizados para obter impactos mais significativos e específicos com a implementação de IA. Para que o modelo alcance o desempenho ideal, é essencial definir claramente o escopo do caso de uso, projetar e implementar sistemas de avaliação, escolher as técnicas adequadas e estar preparado para fazer ajustes ao longo do tempo.

Com a OpenAI, a maioria das organizações pode obter rapidamente resultados significativos com a API de ajuste fino por meio do autoatendimento. Nossos programas de modelos personalizados são úteis para organizações que necessitam aprimorar seus modelos com ajustes finos mais aprofundados ou incorporar conhecimento novo e específico de um domínio.

Acesse a documentação da API de ajuste fino⁠(abre em uma nova janela) para começar a utilizá-la em nossos modelos.