3 de outubro de 2024

Apresentamos a lousa

Uma nova maneira de usar o ChatGPT para escrever e programar

A imagem mostra uma barra de ferramentas vertical com cinco ícones dispostos em uma coluna, sobre um fundo em tons pastéis suaves. O terceiro ícone a partir do topo, representando um livro aberto, está destacado com uma etiqueta e ao lado dele vem a indicação “Nível de leitura”.

Carregando…

Queremos apresentar a lousa, uma nova interface para trabalhar com o ChatGPT em projetos de escrita e programação. É muito mais do que um simples chat. A lousa fica aberta em uma janela separada, permitindo que você e o ChatGPT colaborem em um projeto. A versão beta inicial simboliza uma nova maneira de trabalhar em conjunto — não apenas por meio de conversas, mas criando e refinando ideias lado a lado.

A lousa foi criada com o GPT‑4o e, enquanto estiver em fase beta, pode ser selecionada manualmente no seletor de modelos. A partir de hoje, vamos lançar a lousa para usuários do ChatGPT Plus e do ChatGPT Team em todo o mundo. Os usuários dos planos Enterprise e Edu terão acesso na próxima semana. Também temos planos de disponibilizar a lousa para todos os usuários do ChatGPT Free quando ela sair da versão beta.

Melhor colaboração com o ChatGPT

As pessoas utilizam o ChatGPT diariamente para obter ajuda com redação e programação. Embora a interface do chat seja fácil de usar e funcione bem em muitas tarefas, ela tem algumas limitações — principalmente se você deseja trabalhar em projetos que exigem edição e revisões. A lousa oferece uma nova interface para esse tipo de trabalho.

Com ela, o ChatGPT pode entender melhor o contexto do que você está tentando realizar. Você pode, por exemplo, destacar algumas seções específicas para indicar exatamente em quais áreas você quer que o ChatGPT se concentre. A lousa, por sua vez, age como um editor de texto ou revisor de código e pode fornecer feedback e sugestões em linha, tendo em mente o contexto inteiro do projeto.

Vale lembrar que você controla o projeto na lousa. Ou seja, você pode editar diretamente o texto ou o código. Há um menu de atalhos que você pode usar na hora de pedir ao ChatGPT para ajustar o comprimento da escrita, depurar o código ou então realizar outras ações úteis. Além disso, você também pode restaurar versões anteriores do trabalho usando o botão Voltar na lousa.

A lousa abre automaticamente quando o ChatGPT detectar um cenário em que ela pode ser útil. Existe também a opção de incluir “usar a lousa” no prompt, pois isso vai abrir a ferramenta e você vai poder usá-la em um projeto existente.

Os atalhos de redação incluem:

Sugerir edições: o ChatGPT oferece sugestões e feedback em linha.
Ajustar o tamanho: edita o comprimento do documento para torná-lo mais curto ou mais longo.
Alterar nível de leitura: ajusta o nível de leitura, do jardim de infância à pós-graduação.
Adicionar os últimos ajustes: verifica a gramática, clareza e consistência.
Adicionar emojis: adiciona emojis relevantes para dar ênfase e cor.

Programação na lousa

A programação é um processo iterativo, e pode ser difícil acompanhar todas as revisões do código apenas no chat. Com a lousa, fica mais fácil acompanhar e avaliar as alterações feitas pelo ChatGPT. De nossa parte, pretendemos continuar melhorando a transparência nesse tipo de edição.

Os atalhos de programação incluem:

Revisar código: o ChatGPT fornece sugestões em linha para melhorar seu código.
Adicionar logs: insere instruções de impressão para ajudar a depurar e compreender o código.
Adicionar comentários: adiciona comentários ao código para facilitar a compreensão.
Corrigir bugs: detecta e reescreve códigos problemáticos para resolver erros.
Portar para uma linguagem: traduz o código para JavaScript, TypeScript, Python, Java, C++ ou PHP.

Treinar o modelo para se tornar um colaborador

Treinamos o GPT‑4o para que ele possa colaborar como um parceiro criativo. O modelo sabe quando abrir uma lousa, fazer edições direcionadas e reescrever algum trecho por completo. Ele também compreende o contexto mais amplo para fornecer feedback e sugestões precisas.

Para apoiar essas iniciativas, nossa equipe de investigação desenvolveu os seguintes comportamentos essenciais:

Acionar a lousa para escrever e programar
Gerar diversos tipos de conteúdo
Fazer edições direcionadas
Reescrever documentos
Fornecer críticas em linha

Medimos o progresso com mais de 20 avaliações internas automatizadas. Utilizamos novas técnicas de geração de dados sintéticos, como a destilação de resultados do OpenAI o1‑preview, para pós-treinar o modelo em seus comportamentos principais. Essa abordagem nos permitiu abordar, com rapidez, a qualidade da redação e as novas interações dos usuários — tudo sem depender de dados gerados por humanos.

Um desafio importante foi definir o momento em que a lousa deveria ser acionada. Ensinamos o modelo a abrir uma lousa para prompts como “Escreva uma postagem no blog sobre a história dos grãos de café”, evitando acionar excessivamente tarefas gerais de perguntas e respostas, como “Ajude-me a preparar uma receita nova para o jantar”. Para tarefas de escrita, priorizamos a melhoria dos “gatilhos corretos” (em detrimento dos “não gatilhos corretos”) e alcançamos 83% de sucesso em comparação com uma linha de base zero-shot GPT‑4o, que seguiu instruções de prompts.

Vale ressaltar que a qualidade dessas linhas de base é altamente sensível ao prompt específico utilizado. Com prompts diferentes, a linha de base ainda pode apresentar um desempenho ruim, mas de maneira diferente — por exemplo, sendo igualmente imprecisa nas tarefas de programação e redação, o que resulta em uma distribuição diferente de erros e formas alternativas de desempenho abaixo do ideal. Para a codificação, criamos de maneira intencional um viés no modelo contra o acionamento. O objetivo era evitar perturbar nossos usuários avançados. Continuaremos aprimorando isso com base no feedback dos usuários.

Lousa com acionamento de decisão - Redação e programação

Para tarefas de escrita e codificação, melhoramos o acionamento correto do limite de decisão da lousa, atingindo 83% e 94%, respectivamente, em comparação com uma linha de base zero-shot GPT‑4o que seguiu instruções de prompts.

Um segundo desafio envolveu ajustar o comportamento de edição do modelo assim que a lousa fosse acionada — especificamente, decidir quando fazer uma edição direcionada em vez de reescrever o conteúdo inteiro. Treinamos o modelo para realizar edições direcionadas quando os usuários selecionam explicitamente o texto por meio da interface, dando preferência à reescrita nos demais casos. Esse comportamento continua a evoluir à medida que aperfeiçoamos o modelo.

Limite de edições na lousa - Redação e programação

Para tarefas de escrita e codificação, priorizamos a melhoria das edições direcionadas à lousa. O GPT‑4o com lousa tem um desempenho 18% melhor do que um GPT‑4o com prompt de linha de base.

Por fim, treinar o modelo para gerar comentários de alta qualidade exigiu uma iteração cuidadosa. Ao contrário dos dois primeiros casos, que são facilmente adaptáveis à avaliação automatizada com revisões manuais minuciosas, medir a qualidade de forma automatizada é particularmente desafiador. Portanto, utilizamos avaliações humanas para avaliar a qualidade e a precisão dos comentários. Nosso modelo de lousa integrado supera o GPT‑4o zero-shot com instruções de prompts em 30% de precisão e 16% de qualidade, mostrando que o treinamento sintético melhora significativamente a qualidade da resposta e o comportamento em comparação com o prompt zero-shot que recebeu instruções detalhadas.

Canvas Suggested Comments

As avaliações humanas mediram a qualidade dos comentários na lousa e a funcionalidade da precisão. Nosso modelo de lousa supera o GPT‑4o zero-shot com instruções de prompts em 30% de precisão e 16% de qualidade.

Próximos passos

Tornar a IA mais útil e acessível significa repensar a forma como interagimos com ela. A lousa é uma nova abordagem para essa questão, e representa a primeira grande atualização da interface visual do ChatGPT desde que lançamos o serviço, há dois anos.

Ela está em fase beta inicial e planejamos melhorar rapidamente seus recursos.

Autoria

OpenAI

Líder de investigações

Karina Nguyen

Investigação de base

Kai Chen, Michael Wu e Tarun Gogineni

Engenharia básica, produto e design

Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver e Thomas Dimson

Colaboradores

Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao e Yilei Qian

Liderança de suporte

Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman e Sulman Choudhry