17 de março de 2026

Apresentamos o GPT‑5.4 mini e o GPT‑5.4 nano

Modelos rápidos e eficientes otimizados para programação e subagentes

A carregar…

Hoje lançamos o GPT‑5.4 mini e o GPT‑5.4 nano, os nossos modelos pequenos mais capazes até agora. Levam muitas das vantagens do GPT‑5.4 para modelos mais rápidos e mais eficientes, concebidos para cargas de trabalho de grande volume.

O GPT‑5.4 mini melhora significativamente face ao GPT‑5 mini em programação, raciocínio, compreensão multimodal e uso de ferramentas, ao mesmo tempo que corre mais de 2x mais rápido. Também se aproxima do desempenho do modelo maior GPT‑5.4 em várias avaliações, incluindo o SWE-Bench Pro e o OSWorld-Verified.

O GPT‑5.4 nano é a versão mais pequena e mais barata do GPT‑5.4 para tarefas em que a velocidade e o custo contam mais. Também representa uma melhoria significativa face ao GPT‑5 nano. Recomendamo-lo para classificação, extração de dados, ranking e subagentes de programação que tratem de tarefas de suporte mais simples.

Estes modelos foram desenvolvidos para cargas de trabalho em que a latência molda diretamente a experiência do produto: assistentes de programação que têm de ser responsivos, subagentes que concluem rapidamente tarefas de suporte, sistemas que usam um computador e capturam e interpretam capturas de ecrã, e aplicações multimodais que conseguem raciocinar sobre imagens em tempo real. Nestes cenários, o melhor modelo muitas vezes não é o maior — é aquele que responde rapidamente, usa ferramentas de forma fiável e continua a ter um bom desempenho em tarefas profissionais complexas.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 O reasoning_effort mais elevado disponível para o GPT‑5 mini é 'high'.}

Eis o que os nossos clientes acharam depois de testarem o GPT‑5.4 mini e o GPT‑5.4 nano nos seus fluxos de trabalho:

«O GPT-5.4 mini oferece um desempenho ponta a ponta robusto para um modelo desta classe. Nas nossas avaliações, igualou ou superou modelos concorrentes em várias tarefas de output e na recuperação de citações, a um custo muito mais baixo. Também alcançou taxas de sucesso ponta a ponta mais elevadas e uma atribuição de fontes mais forte do que o modelo GPT-5.4 maior.»

— Aabhas Sharma, CTO na Hebbia

Programação

O GPT‑5.4 mini e o nano são especialmente eficazes em fluxos de trabalho de programação que beneficiam de iteração rápida. Os modelos lidam com edições direcionadas, navegação na base de código, geração de front-end e ciclos de debugging com baixa latência, pelo que são uma excelente opção para tarefas de programação que precisam de ser concluídas mais depressa e a um custo menor.

Em benchmarks, o GPT‑5.4 mini supera consistentemente o GPT‑5‑mini com latências semelhantes e aproxima-se do nível do GPT‑5.4 em termos de taxas de sucesso, correndo muito mais depressa e oferecendo uma das melhores relações desempenho/latência para fluxos de trabalho de programação.

Estimamos a latência observando o comportamento dos nossos modelos em produção e simulando-o offline. A estimativa de latência tem em conta a duração das chamadas de ferramentas (tempo de execução de código), tokens amostrados e tokens de entrada. A latência no mundo real pode variar substancialmente e depende de muitos fatores que a nossa simulação não capta. Do mesmo modo, os custos são estimados com base no preço da API destes modelos à data de redação. Os custos podem mudar no futuro. Os níveis de reasoning_effort foram avaliados de low a xhigh.

Subagentes

O GPT‑5.4 mini também é uma excelente opção para sistemas que combinam modelos de tamanhos diferentes. No Codex, por exemplo, um modelo maior como o GPT‑5.4 pode tratar do planeamento, da coordenação e da decisão final e delegar para subagentes GPT‑5.4 mini que executam subtarefas mais específicas em paralelo — como pesquisar numa base de código, rever um ficheiro grande ou processar documentos de apoio. Saiba como funcionam os subagentes no Codex na documentação⁠(abre numa nova janela).

Este padrão torna-se ainda mais útil à medida que os modelos mais pequenos ficam mais rápidos e mais capazes. Em vez de usarem um único modelo para tudo, os programadores podem compor sistemas em que modelos maiores decidem o que fazer e modelos mais pequenos executam rapidamente à escala. O GPT‑5.4 mini é o nosso modelo mini mais forte até agora para esse tipo de fluxo de trabalho.

Utilização de computadores

O GPT‑5.4 mini também é forte em tarefas multimodais, sobretudo as relacionadas com o uso do computador. O modelo consegue interpretar rapidamente capturas de ecrã de interfaces de utilizador densas para concluir tarefas de uso do computador com rapidez. No OSWorld-Verified, o GPT‑5.4 mini aproxima-se do GPT‑5.4 e supera significativamente o GPT‑5 mini.

Disponibilidade e preços

O GPT‑5.4 mini está disponível hoje na API, no Codex e no ChatGPT.

Na API, o GPT‑5.4 mini suporta entradas de texto e imagem, uso de ferramentas, chamadas de função, pesquisa na Web, pesquisa de ficheiros, uso do computador e skills. Tem uma janela de contexto de 400k e custa $0,75 por 1M de tokens de entrada e $4,50 por 1M de tokens de saída.

No Codex, o GPT‑5.4 mini está disponível na app do Codex, na CLI, na extensão de IDE e na web. Consome apenas 30% da quota do GPT‑5.4, permitindo aos programadores tratar rapidamente de tarefas de programação mais simples no Codex por cerca de um terço do custo. O Codex também pode delegar para subagentes GPT‑5.4 mini, para que trabalho que exige menos raciocínio seja executado no modelo mais barato.

No ChatGPT, o GPT‑5.4 mini está disponível para utilizadores do Free e do Go através da funcionalidade «Thinking» no menu +. Para todos os outros utilizadores, o GPT‑5.4 mini está disponível como alternativa quando o limite de utilização é atingido para o GPT‑5.4 Thinking.

O GPT‑5.4 nano só está disponível na API e custa $0,20 por 1M de tokens de entrada e $1,25 por 1M de tokens de saída.

Para mais informações sobre as salvaguardas destes modelos, consulte a adenda do System Card no nosso Deployment Safety Hub⁠(abre numa nova janela).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 O reasoning_effort mais elevado disponível para o GPT‑5 mini é 'high'.}

^{2 Distância de edição global. O OmniDocBench foi executado com o reasoning_effort definido como 'none', para refletir um desempenho de baixo custo e baixa latência.}

2026

Autor

OpenAI

Continuar a ler

Ver tudo

A scorecard for the AI age

Empresa17/07/2026

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

O GPT-5.6 é agora o modelo preferido no Microsoft 365 Copilot

Produto9/07/2026

GPT-5.6: inteligência de fronteira que acompanha a sua ambição

Produto9/07/2026