A impulsionar a ciência e a matemática com o GPT‑5.2
O GPT‑5.2 é o nosso modelo mais avançado até agora para trabalho em matemática e ciência.
Um dos nossos desejos para uma IA avançada é que esta acelere a investigação científica em benefício de todos, ajudando os investigadores a explorar mais ideias, a testá-las mais depressa e a transformar descobertas em impacto.
Ao longo do último ano, temos trabalhado em estreita colaboração com cientistas de matemática, física, biologia e informática para entender onde a IA pode ajudar — e onde ainda não está à altura. No mês passado, publicámos um artigo que reúne estudos de caso iniciais em matemática, física, biologia, informática, astronomia e ciência dos materiais, em que o GPT‑5 ajudou investigadores, mostrando como o GPT‑5 já começou a contribuir para trabalho científico real. Com o GPT‑5.2, estamos a começar a ver esses ganhos tornarem-se mais consistentes e fiáveis.
O GPT‑5.2 Pro e o GPT‑5.2 Thinking são os nossos modelos mais avançados até agora para trabalho científico e matemático.
Um raciocínio matemático robusto é a base da fiabilidade em trabalho científico e técnico. Permite que os modelos sigam lógica com vários passos, mantenham as quantidades consistentes e evitem erros subtis que se podem acumular em análises reais — desde simulações e estatísticas até previsão e modelação. As melhorias em benchmarks como o FrontierMath refletem não uma competência estreita, mas um raciocínio geral e uma abstração mais fortes, capacidades que se traduzem diretamente em fluxos de trabalho científicos como programação, análise de dados e conceção de experiências.
Estas capacidades estão também intimamente ligadas ao progresso em direção a uma inteligência geral. Um sistema que consegue raciocinar de forma fiável por abstração, manter a consistência ao longo de cadeias longas de pensamento e generalizar entre domínios está a exibir características que são fundacionais para a AGI — não truques específicos de tarefas, mas competências de raciocínio amplas e transferíveis que importam em ciência, engenharia e tomada de decisão no mundo real.
Acreditamos que o GPT‑5.2 Pro e o GPT‑5.2 Thinking são os melhores modelos do mundo para apoiar e acelerar o trabalho de cientistas. No GPQA Diamond, um benchmark de perguntas e respostas ao nível de pós-graduação, resistente à pesquisa no Google, o GPT‑5.2 Pro atinge 93,2%, seguido de perto pelo GPT‑5.2 Thinking, com 92,4%.
No GPQA Diamond(abre numa nova janela), os modelos respondem a perguntas de escolha múltipla sobre física, química e biologia. Não foram ativadas ferramentas e o esforço de raciocínio foi definido para o máximo.
No FrontierMath (Níveis 1–3), uma avaliação de matemática de nível avançado, o GPT‑5.2 Thinking estabeleceu um novo estado da arte, resolvendo 40,3% dos problemas.
No FrontierMath(abre numa nova janela), os modelos resolvem problemas de matemática de nível avançado. Uma ferramenta em Python foi ativada e o esforço de raciocínio foi definido para o máximo.
Estudo de caso
Este resultado sugere uma direção útil para a forma como os sistemas de IA podem suportar a investigação científica, sobretudo em domínios com fundamentos teóricos axiomáticos, como a matemática e a informática teórica. Em contextos como estes, modelos de fronteira podem ajudar a explorar provas, testar hipóteses e identificar ligações que, de outro modo, exigiriam um esforço humano substancial para serem descobertas.
Ao mesmo tempo, estes sistemas não são investigadores independentes. O juízo especializado, a verificação e o conhecimento do domínio continuam a ser essenciais. Mesmo modelos muito capazes podem cometer erros ou assentar em pressupostos não declarados. Mas também podem produzir argumentos detalhados e estruturados que merecem estudo e refinamento cuidadosos por parte de humanos. Fazer progressos fiáveis com IA depende, por isso, de fluxos de trabalho que mantenham a validação, a transparência e a colaboração firmemente «no circuito».
Visto como estudo de caso, este resultado ilustra um modo emergente de prática de investigação. Modelos como o GPT‑5.2 podem servir como ferramentas para apoiar o raciocínio matemático e acelerar a exploração em fases iniciais, enquanto a responsabilidade pela exatidão, interpretação e contexto permanece com os investigadores humanos. Usados com cuidado, estes sistemas podem ajudar a simplificar aspetos significativos do trabalho teórico sem substituir o papel central do juízo humano na investigação científica.


