Ir al contenido principal
OpenAI

17 de marzo de 2026

EmpresaProducto

Presentamos GPT‑5.4 mini y nano

Modelos rápidos y eficientes optimizados para programación y subagentes

Cargando…

Hoy lanzamos GPT‑5.4 mini y nano, nuestros modelos pequeños más capaces hasta la fecha. Llevan muchas de las fortalezas de GPT‑5.4 a modelos más rápidos y eficientes, diseñados para manejar grandes volúmenes de trabajo.

GPT‑5.4 mini mejora de forma significativa con respecto a GPT‑5 mini en programación, razonamiento, comprensión multimodal y uso de herramientas, y funciona a más del doble de velocidad. También se acerca al rendimiento del modelo GPT‑5.4 de mayor tamaño en varias evaluaciones, como SWE-Bench Pro y OSWorld-Verified.

GPT‑5.4 nano es la versión más pequeña y económica de GPT‑5.4 para tareas en las que la velocidad y el coste son lo más importante. También es una mejora significativa con respecto a GPT‑5 nano. Lo recomendamos para clasificación, extracción de datos, clasificación por relevancia y subagentes de programación que manejan tareas de apoyo más sencillas.

Estos modelos están diseñados para escenarios en los que la latencia influye directamente en la experiencia del producto: asistentes de programación que deben responder con rapidez, subagentes que completan tareas de apoyo en poco tiempo, sistemas que controlan un ordenador y capturan e interpretan capturas de pantalla, y aplicaciones multimodales capaces de analizar imágenes en tiempo real. En estos casos, el mejor modelo no siempre es el más grande, sino el que puede responder con rapidez, usar herramientas de forma fiable y aun así ofrecer un buen rendimiento en tareas profesionales complejas.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 El esfuerzo de razonamiento más alto disponible para GPT‑5 mini es 'alto'.

Esto es lo que opinan nuestros clientes tras probar GPT‑5.4 mini y nano en sus flujos de trabajo:

«GPT-5.4 mini ofrece un rendimiento muy sólido para un modelo de esta categoría. En nuestras evaluaciones, igualó o superó a modelos competitivos en varias tareas de generación y en la recuperación de citas, a un coste mucho menor. También logró mayores tasas de aprobación de extremo a extremo y una atribución de fuentes más robusta que el modelo GPT-5.4 de mayor tamaño.»
— Aabhas Sharma, director de tecnología (CTO) en Hebbia

Programación

GPT‑5.4 mini y nano son especialmente eficaces en flujos de trabajo de programación que se benefician de iteraciones rápidas. Los modelos permiten realizar ediciones dirigidas, navegar por la base de código, generar interfaces de front-end y completar ciclos de depuración con baja latencia, lo que los convierte en una buena opción para tareas de programación que deben resolverse con mayor rapidez y a menor coste.

En evaluaciones de referencia, GPT‑5.4 mini supera de forma constante a GPT‑5 mini con latencias similares y se acerca a las tasas de éxito de GPT‑5.4, aunque se ejecuta mucho más rápido, lo que le permite ofrecer una de las mejores combinaciones de rendimiento y latencia para flujos de trabajo de programación.

Estimamos la latencia observando el comportamiento de nuestros modelos en producción y mediante simulaciones sin conexión. La estimación tiene en cuenta la duración de las llamadas a herramientas (tiempo de ejecución del código), así como los tokens muestreados y los tokens de entrada. La latencia en el mundo real puede variar considerablemente y depende de muchos factores que no se capturan en nuestra simulación. De manera similar, los costes se estiman en función de los precios de la API de estos modelos al momento de redactar este texto. Los costes pueden cambiar en el futuro. Los esfuerzos de razonamiento se ajustaron de bajo a muy alto.

Subagentes

GPT‑5.4 mini también es una buena opción para sistemas que combinan modelos de distintos tamaños. En Codex, por ejemplo, un modelo más grande como GPT‑5.4 puede encargarse de la planificación, la coordinación y la decisión final, mientras delega en subagentes GPT‑5.4 mini tareas más acotadas que se ejecutan en paralelo, como buscar en una base de código, revisar un archivo grande o procesar documentos de respaldo. Consulta la documentación(se abre en una ventana nueva) para saber cómo funcionan los subagentes en Codex.

Este enfoque gana valor a medida que los modelos más pequeños son cada vez más rápidos y capaces. En lugar de recurrir a un único modelo para todo, los desarrolladores pueden crear sistemas en los que los modelos más grandes deciden qué hacer y los más pequeños lo ejecutan rápidamente a escala. GPT‑5.4 mini es nuestro modelo mini más potente hasta la fecha para este tipo de flujo de trabajo.

Uso del ordenador

GPT‑5.4 mini también es fuerte en tareas multimodales, en particular las relacionadas con el uso de computadoras. El modelo puede interpretar rápidamente capturas de pantalla de interfaces de usuario densas para completar tareas de uso de la computadora con rapidez. En OSWorld-Verified, GPT‑5.4 mini se acerca a GPT‑5.4, a la vez que supera ampliamente a GPT‑5 mini.

Disponibilidad y precios

GPT‑5.4 mini ya está disponible hoy en la API, Codex y ChatGPT.

En la API, GPT‑5.4 mini admite entradas de texto e imagen, uso de herramientas, llamadas a funciones, búsqueda en la web, búsqueda de archivos, control del equipo y habilidades. Tiene una ventana de contexto de 400 000 tokens y cuesta 0,75 USD por millón de tokens de entrada y 4,50 USD por millón de tokens de salida.

GPT‑5.4 mini está disponible en la aplicación de Codex, la CLI, la extensión del IDE y la web. Solo consume el 30 % de la cuota de GPT‑5.4, lo que permite a los desarrolladores resolver rápidamente tareas de programación más simples en Codex por aproximadamente un tercio del coste. Codex también puede delegar tareas en subagentes GPT‑5.4 mini para que el trabajo menos exigente en términos de razonamiento se ejecute en el modelo más económico.

En ChatGPT, GPT‑5.4 mini está disponible para los usuarios de los planes Gratis y Go a través de la opción «Thinking» en el menú +. Para los demás usuarios, GPT‑5.4 mini se ofrece como alternativa cuando se alcanza el límite de uso de GPT‑5.4 Thinking.

GPT‑5.4 nano solo está disponible en la API y cuesta 0,20 USD por millón de tokens de entrada y 1,25 USD por millón de tokens de salida.

Para obtener más información sobre las salvaguardas de los modelos, consulta el anexo a la tarjeta del sistema en nuestro Centro de seguridad de implementación(se abre en una ventana nueva).

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 El esfuerzo de razonamiento más alto disponible para GPT‑5 mini es 'alto'.

2 Distancia de edición total. OmniDocBench se ejecutó con el esfuerzo de razonamiento configurado en 'nulo' para reflejar un rendimiento de bajo coste y baja latencia.

Autor

OpenAI