17 de marzo de 2026

Presentamos GPT‑5.4 mini y nano

Modelos rápidos y eficientes optimizados para programación y subagentes

Cargando…

Hoy lanzamos GPT‑5.4 mini y nano, nuestros modelos pequeños más capaces hasta la fecha. Llevan muchas de las fortalezas de GPT‑5.4 a modelos más rápidos y eficientes, diseñados para manejar grandes volúmenes de trabajo.

GPT‑5.4 mini mejora de forma significativa con respecto a GPT‑5 mini en programación, razonamiento, comprensión multimodal y uso de herramientas, y funciona a más del doble de velocidad. También se acerca al rendimiento del modelo GPT‑5.4 de mayor tamaño en varias evaluaciones, como SWE-Bench Pro y OSWorld-Verified.

GPT‑5.4 nano es la versión más pequeña y económica de GPT‑5.4 para tareas en las que la velocidad y el coste son lo más importante. También es una mejora significativa con respecto a GPT‑5 nano. Lo recomendamos para clasificación, extracción de datos, clasificación por relevancia y subagentes de programación que manejan tareas de apoyo más sencillas.

Estos modelos están diseñados para escenarios en los que la latencia influye directamente en la experiencia del producto: asistentes de programación que deben responder con rapidez, subagentes que completan tareas de apoyo en poco tiempo, sistemas que controlan un ordenador y capturan e interpretan capturas de pantalla, y aplicaciones multimodales capaces de analizar imágenes en tiempo real. En estos casos, el mejor modelo no siempre es el más grande, sino el que puede responder con rapidez, usar herramientas de forma fiable y aun así ofrecer un buen rendimiento en tareas profesionales complejas.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 El esfuerzo de razonamiento más alto disponible para GPT‑5 mini es 'alto'.}

Esto es lo que opinan nuestros clientes tras probar GPT‑5.4 mini y nano en sus flujos de trabajo:

«GPT-5.4 mini ofrece un rendimiento muy sólido para un modelo de esta categoría. En nuestras evaluaciones, igualó o superó a modelos competitivos en varias tareas de generación y en la recuperación de citas, a un coste mucho menor. También logró mayores tasas de aprobación de extremo a extremo y una atribución de fuentes más robusta que el modelo GPT-5.4 de mayor tamaño.»

— Aabhas Sharma, director de tecnología (CTO) en Hebbia

Programación

GPT‑5.4 mini y nano son especialmente eficaces en flujos de trabajo de programación que se benefician de iteraciones rápidas. Los modelos permiten realizar ediciones dirigidas, navegar por la base de código, generar interfaces de front-end y completar ciclos de depuración con baja latencia, lo que los convierte en una buena opción para tareas de programación que deben resolverse con mayor rapidez y a menor coste.

En evaluaciones de referencia, GPT‑5.4 mini supera de forma constante a GPT‑5 mini con latencias similares y se acerca a las tasas de éxito de GPT‑5.4, aunque se ejecuta mucho más rápido, lo que le permite ofrecer una de las mejores combinaciones de rendimiento y latencia para flujos de trabajo de programación.

Estimamos la latencia observando el comportamiento de nuestros modelos en producción y mediante simulaciones sin conexión. La estimación tiene en cuenta la duración de las llamadas a herramientas (tiempo de ejecución del código), así como los tokens muestreados y los tokens de entrada. La latencia en el mundo real puede variar considerablemente y depende de muchos factores que no se capturan en nuestra simulación. De manera similar, los costes se estiman en función de los precios de la API de estos modelos al momento de redactar este texto. Los costes pueden cambiar en el futuro. Los esfuerzos de razonamiento se ajustaron de bajo a muy alto.

Subagentes

GPT‑5.4 mini también es una buena opción para sistemas que combinan modelos de distintos tamaños. En Codex, por ejemplo, un modelo más grande como GPT‑5.4 puede encargarse de la planificación, la coordinación y la decisión final, mientras delega en subagentes GPT‑5.4 mini tareas más acotadas que se ejecutan en paralelo, como buscar en una base de código, revisar un archivo grande o procesar documentos de respaldo. Consulta la documentación⁠(se abre en una ventana nueva) para saber cómo funcionan los subagentes en Codex.

Este enfoque gana valor a medida que los modelos más pequeños son cada vez más rápidos y capaces. En lugar de recurrir a un único modelo para todo, los desarrolladores pueden crear sistemas en los que los modelos más grandes deciden qué hacer y los más pequeños lo ejecutan rápidamente a escala. GPT‑5.4 mini es nuestro modelo mini más potente hasta la fecha para este tipo de flujo de trabajo.

Uso del ordenador

GPT‑5.4 mini también es fuerte en tareas multimodales, en particular las relacionadas con el uso de computadoras. El modelo puede interpretar rápidamente capturas de pantalla de interfaces de usuario densas para completar tareas de uso de la computadora con rapidez. En OSWorld-Verified, GPT‑5.4 mini se acerca a GPT‑5.4, a la vez que supera ampliamente a GPT‑5 mini.

Disponibilidad y precios

GPT‑5.4 mini ya está disponible hoy en la API, Codex y ChatGPT.

En la API, GPT‑5.4 mini admite entradas de texto e imagen, uso de herramientas, llamadas a funciones, búsqueda en la web, búsqueda de archivos, control del equipo y habilidades. Tiene una ventana de contexto de 400 000 tokens y cuesta 0,75 USD por millón de tokens de entrada y 4,50 USD por millón de tokens de salida.

GPT‑5.4 mini está disponible en la aplicación de Codex, la CLI, la extensión del IDE y la web. Solo consume el 30 % de la cuota de GPT‑5.4, lo que permite a los desarrolladores resolver rápidamente tareas de programación más simples en Codex por aproximadamente un tercio del coste. Codex también puede delegar tareas en subagentes GPT‑5.4 mini para que el trabajo menos exigente en términos de razonamiento se ejecute en el modelo más económico.

En ChatGPT, GPT‑5.4 mini está disponible para los usuarios de los planes Gratis y Go a través de la opción «Thinking» en el menú +. Para los demás usuarios, GPT‑5.4 mini se ofrece como alternativa cuando se alcanza el límite de uso de GPT‑5.4 Thinking.

GPT‑5.4 nano solo está disponible en la API y cuesta 0,20 USD por millón de tokens de entrada y 1,25 USD por millón de tokens de salida.

Para obtener más información sobre las salvaguardas de los modelos, consulta el anexo a la tarjeta del sistema en nuestro Centro de seguridad de implementación⁠(se abre en una ventana nueva).

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 El esfuerzo de razonamiento más alto disponible para GPT‑5 mini es 'alto'.}

^{2 Distancia de edición total. OmniDocBench se ejecutó con el esfuerzo de razonamiento configurado en 'nulo' para reflejar un rendimiento de bajo coste y baja latencia.}

2026

Autor

OpenAI

Sigue leyendo

Ver todo

Launching Health in ChatGPT

Producto23 jul 2026

How news organizations are using AI > Card Image

Cómo usan la IA las agencias de noticias para impulsar su misión

Empresa22 jul 2026

Presentamos OpenAI Presence

Producto22 jul 2026