17 ਮਾਰਚ 2026

GPT‑5.4 mini ਅਤੇ nano ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ

coding ਅਤੇ subagents ਲਈ ਅਨੁਕੂਲਿਤ ਤੇਜ਼ ਅਤੇ ਦੱਖਣ ਮਾਡਲ

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਅੱਜ ਅਸੀਂ GPT‑5.4 mini ਅਤੇ nano ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ ਹੁਣ ਤੱਕ ਸਾਡੇ ਸਭ ਤੋਂ ਸਮਰੱਥ ਛੋਟੇ ਮਾਡਲ ਹਨ. ਇਹ GPT‑5.4 ਦੀਆਂ ਕਈ ਤਾਕਤਾਂ ਨੂੰ ਤੇਜ਼, ਹੋਰ ਦੱਖਣ ਮਾਡਲਾਂ ਵਿੱਚ ਲਿਆਉਂਦੇ ਹਨ, ਜੋ ਉੱਚ-ਮਾਤਰਾ ਵਰਕਲੋਡ ਲਈ ਬਣਾਏ ਗਏ ਹਨ.

GPT‑5.4 mini, coding, ਰੀਜ਼ਨਿੰਗ, multimodal ਸਮਝ ਅਤੇ tool use ਵਿੱਚ GPT‑5 mini ਨਾਲੋਂ ਮਹੱਤਵਪੂਰਣ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਅਤੇ 2x ਤੋਂ ਵੱਧ ਤੇਜ਼ ਚਲਦਾ ਹੈ. ਇਹ ਕਈ ਮੁਲਾਂਕਨਾਂ ਵਿੱਚ, ਜਿਵੇਂ SWE-Bench Pro ਅਤੇ OSWorld-Verified, ਵੱਡੇ GPT‑5.4 ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੇ ਵੀ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ.

GPT‑5.4 nano, GPT‑5.4 ਦਾ ਸਭ ਤੋਂ ਛੋਟਾ ਅਤੇ ਸਭ ਤੋਂ ਸਸਤਾ ਵਰਜਨ ਹੈ ਉਹਨਾਂ ਕੰਮਾਂ ਲਈ ਜਿੱਥੇ ਗਤੀ ਅਤੇ ਲਾਗਤ ਸਭ ਤੋਂ ਵੱਧ ਮਹੱਤਵ ਰੱਖਦੇ ਹਨ. ਇਹ GPT‑5 nano ਨਾਲੋਂ ਵੀ ਵੱਡਾ ਅੱਪਗ੍ਰੇਡ ਹੈ. ਅਸੀਂ ਇਸਨੂੰ classification, data extraction, ranking, ਅਤੇ coding subagents ਲਈ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਾਂ ਜੋ ਸਧਾਰਣ ਸਹਾਇਕ ਕੰਮ ਸੰਭਾਲਦੇ ਹਨ.

ਇਹ ਮਾਡਲ ਉਹਨਾਂ ਕਿਸਮਾਂ ਦੇ ਵਰਕਲੋਡ ਲਈ ਬਣਾਏ ਗਏ ਹਨ ਜਿੱਥੇ latency ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਉਤਪਾਦ ਅਨੁਭਵ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ: coding assistants ਜਿਨ੍ਹਾਂ ਨੂੰ ਫੁਰਤੀਲਾ ਮਹਿਸੂਸ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, subagents ਜੋ ਸਹਾਇਕ ਕੰਮ ਜਲਦੀ ਪੂਰੇ ਕਰਦੇ ਹਨ, computer-using systems ਜੋ screenshots ਨੂੰ ਕੈਪਚਰ ਅਤੇ ਸਮਝਦੇ ਹਨ, ਅਤੇ multimodal applications ਜੋ real-time ਵਿੱਚ images 'ਤੇ ਰੀਜ਼ਨਿੰਗ ਕਰ ਸਕਦੀਆਂ ਹਨ. ਇਨ੍ਹਾਂ ਸਥਿਤੀਆਂ ਵਿੱਚ, ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਅਕਸਰ ਸਭ ਤੋਂ ਵੱਡਾ ਨਹੀਂ ਹੁੰਦਾ—ਇਹ ਉਹ ਹੁੰਦਾ ਹੈ ਜੋ ਜਲਦੀ ਜਵਾਬ ਦੇ ਸਕੇ, tools ਨੂੰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਵਰਤੇ, ਅਤੇ ਫਿਰ ਵੀ ਜਟਿਲ ਪੇਸ਼ੇਵਰ ਕੰਮਾਂ 'ਤੇ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰੇ.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 GPT‑5 mini ਲਈ ਉਪਲਬਧ ਸਭ ਤੋਂ ਉੱਚਾ reasoning_effort ‘high’ ਹੈ.}

ਇਹ ਹੈ ਕਿ ਸਾਡੇ ਗਾਹਕ GPT‑5.4 mini ਅਤੇ nano ਨੂੰ ਆਪਣੇ ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਟੈਸਟ ਕਰਨ ਤੋਂ ਬਾਅਦ ਕੀ ਸੋਚਦੇ ਹਨ:

“GPT-5.4 mini ਇਸ ਵਰਗ ਦੇ ਮਾਡਲ ਲਈ ਮਜ਼ਬੂਤ end-to-end ਪ੍ਰਦਰਸ਼ਨ ਦਿੰਦਾ ਹੈ. ਸਾਡੇ ਮੁਲਾਂਕਨਾਂ ਵਿੱਚ, ਇਸਨੇ ਕਾਫ਼ੀ ਘੱਟ ਲਾਗਤ 'ਤੇ ਕਈ output tasks ਅਤੇ citation recall ਵਿੱਚ ਮੁਕਾਬਲੇ ਦੇ ਮਾਡਲਾਂ ਦੇ ਬਰਾਬਰ ਜਾਂ ਉਹਨਾਂ ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ. ਇਸਨੇ ਵੱਡੇ GPT-5.4 ਮਾਡਲ ਨਾਲੋਂ ਉੱਚੇ end-to-end pass rates ਅਤੇ ਹੋਰ ਮਜ਼ਬੂਤ source attribution ਵੀ ਹਾਸਲ ਕੀਤੀ.”

— Aabhas Sharma, Hebbia ਵਿੱਚ CTO

Coding

GPT‑5.4 mini ਅਤੇ nano ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਉਹਨਾਂ coding ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ iteration ਦਾ ਫਾਇਦਾ ਮਿਲਦਾ ਹੈ. ਮਾਡਲ targeted edits, codebase navigation, front-end generation, ਅਤੇ debugging loops ਨੂੰ ਘੱਟ latency ਨਾਲ ਸੰਭਾਲਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਇਹ ਉਹਨਾਂ coding ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਵਧੀਆ ਬਣਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ ਗਤੀ ਅਤੇ ਘੱਟ ਲਾਗਤ 'ਤੇ ਪੂਰਾ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ.

Benchmarks ਵਿੱਚ, GPT‑5.4 mini ਸਮਾਨ latency 'ਤੇ ਲਗਾਤਾਰ GPT‑5‑mini ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ਅਤੇ ਕਾਫ਼ੀ ਤੇਜ਼ ਚਲਦੇ ਹੋਏ GPT‑5.4‑ਪੱਧਰ ਦੇ pass rates ਦੇ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ, ਜਿਸ ਨਾਲ coding ਵਰਕਫਲੋਜ਼ ਲਈ performance-per-latency ਦੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਸੰਤੁਲਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਮਿਲਦਾ ਹੈ.

ਅਸੀਂ ਆਪਣੇ ਮਾਡਲਾਂ ਦੇ production ਵਿਹਾਰ ਨੂੰ ਦੇਖ ਕੇ ਅਤੇ ਇਸਨੂੰ offline simulate ਕਰਕੇ latency ਦਾ ਅਨੁਮਾਨ ਲਗਾਂਦੇ ਹਾਂ. latency ਅਨੁਮਾਨ ਵਿੱਚ tool call ਦੀ ਮਿਆਦ (code execution time), sampled tokens, ਅਤੇ input tokens ਸ਼ਾਮਲ ਹਨ. ਅਸਲ ਦੁਨੀਆ ਦੀ latency ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਵੱਖਰੀ ਹੋ ਸਕਦੀ ਹੈ, ਅਤੇ ਇਹ ਕਈ ਅਜਿਹੇ ਕਾਰਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਜੋ ਸਾਡੀ simulation ਵਿੱਚ ਕੈਪਚਰ ਨਹੀਂ ਕੀਤੇ ਗਏ. ਇਸੇ ਤਰ੍ਹਾਂ, ਲਾਗਤਾਂ ਲਿਖਣ ਦੇ ਸਮੇਂ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ API pricing ਦੇ ਆਧਾਰ 'ਤੇ ਅਨੁਮਾਨਿਤ ਹਨ. ਭਵਿੱਖ ਵਿੱਚ ਲਾਗਤਾਂ ਬਦਲ ਸਕਦੀਆਂ ਹਨ. reasoning efforts ਨੂੰ low ਤੋਂ xhigh ਤੱਕ sweep ਕੀਤਾ ਗਿਆ ਸੀ.

Subagents

GPT‑5.4 mini ਉਹਨਾਂ systems ਲਈ ਵੀ ਮਜ਼ਬੂਤ ਚੋਣ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਆਕਾਰਾਂ ਦੇ ਮਾਡਲ ਇਕੱਠੇ ਵਰਤਦੇ ਹਨ. ਉਦਾਹਰਨ ਲਈ, Codex ਵਿੱਚ GPT‑5.4 ਵਰਗਾ ਵੱਡਾ ਮਾਡਲ planning, coordination, ਅਤੇ final judgment ਸੰਭਾਲ ਸਕਦਾ ਹੈ, ਜਦਕਿ GPT‑5.4 mini subagents ਨੂੰ ਸੌਂਪ ਸਕਦਾ ਹੈ ਜੋ ਇਕੱਠੇ ਤੌਰ 'ਤੇ ਛੋਟੇ-ਛੋਟੇ ਕੰਮ ਕਰਦੇ ਹਨ—ਜਿਵੇਂ codebase ਖੋਜਣਾ, ਵੱਡੀ ਫਾਈਲ ਦੀ ਸਮੀਖਿਆ ਕਰਨਾ, ਜਾਂ ਸਹਾਇਕ ਦਸਤਾਵੇਜ਼ ਪ੍ਰਕਿਰਿਆ ਕਰਨਾ. Codex ਵਿੱਚ subagents ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਇਹ docs⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ ਜਾਣੋ.

ਇਹ ਪੈਟਰਨ ਹੋਰ ਲਾਭਕਾਰੀ ਬਣ ਜਾਂਦਾ ਹੈ ਜਿਵੇਂ ਛੋਟੇ ਮਾਡਲ ਹੋਰ ਤੇਜ਼ ਅਤੇ ਸਮਰੱਥ ਹੁੰਦੇ ਜਾਂਦੇ ਹਨ. ਹਰ ਚੀਜ਼ ਲਈ ਇੱਕ ਮਾਡਲ ਵਰਤਣ ਦੀ ਬਜਾਏ, ਡਿਵੈਲਪਰ ਅਜੇਹੇ systems ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ ਜਿੱਥੇ ਵੱਡੇ ਮਾਡਲ ਤੈਅ ਕਰਦੇ ਹਨ ਕਿ ਕੀ ਕਰਨਾ ਹੈ ਅਤੇ ਛੋਟੇ ਮਾਡਲ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਜਲਦੀ ਕਾਰਵਾਈ ਕਰਦੇ ਹਨ. GPT‑5.4 mini ਅਜਿਹੇ ਵਰਕਫਲੋ ਸ਼ੈਲੀ ਲਈ ਹੁਣ ਤੱਕ ਸਾਡਾ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ mini ਮਾਡਲ ਹੈ.

Computer use

GPT‑5.4 mini multimodal ਕੰਮਾਂ ਵਿੱਚ ਵੀ ਮਜ਼ਬੂਤ ਹੈ, ਖ਼ਾਸ ਕਰਕੇ ਉਹ ਜੋ computer use ਨਾਲ ਸੰਬੰਧਿਤ ਹਨ. ਮਾਡਲ ਗੁੰਝਲਦਾਰ user interfaces ਵਾਲੀਆਂ screenshots ਨੂੰ ਜਲਦੀ ਸਮਝ ਕੇ computer use ਕੰਮ ਤੇਜ਼ੀ ਨਾਲ ਪੂਰੇ ਕਰ ਸਕਦਾ ਹੈ. OSWorld-Verified 'ਤੇ, GPT‑5.4 mini, GPT‑5.4 ਦੇ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ ਅਤੇ GPT‑5 mini ਨਾਲੋਂ ਕਾਫ਼ੀ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ.

Availability & pricing

GPT‑5.4 mini ਅੱਜ API, Codex, ਅਤੇ ChatGPT ਵਿੱਚ ਉਪਲਬਧ ਹੈ.

API ਵਿੱਚ, GPT‑5.4 mini text ਅਤੇ image inputs, tool use, ਫੰਕਸ਼ਨ ਕਾਲਿੰਗ, web search, file search, computer use, ਅਤੇ skills ਨੂੰ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ. ਇਸਦਾ 400k context window ਹੈ ਅਤੇ ਇਸਦੀ ਕੀਮਤ 1M input tokens ਲਈ $0.75 ਅਤੇ 1M output tokens ਲਈ $4.50 ਹੈ.

Codex ਵਿੱਚ, GPT‑5.4 mini Codex app, CLI, IDE extension ਅਤੇ web ਵਿੱਚ ਉਪਲਬਧ ਹੈ. ਇਹ GPT‑5.4 quota ਦਾ ਕੇਵਲ 30% ਹੀ ਵਰਤਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਡਿਵੈਲਪਰ Codex ਵਿੱਚ ਸਧਾਰਣ coding ਕੰਮ ਲਗਭਗ ਇੱਕ-ਤਿਹਾਈ ਲਾਗਤ 'ਤੇ ਜਲਦੀ ਕਰ ਸਕਦੇ ਹਨ. Codex GPT‑5.4 mini subagents ਨੂੰ ਵੀ delegate ਕਰ ਸਕਦਾ ਹੈ ਤਾਂ ਜੋ ਘੱਟ reasoning-intensive ਕੰਮ ਸਸਤੇ ਮਾਡਲ 'ਤੇ ਚੱਲਣ.

ChatGPT ਵਿੱਚ, GPT‑5.4 mini Free ਅਤੇ Go ਵਰਤੋਂਕਾਰਾਂ ਲਈ + ਮੈਨੂ ਵਿੱਚ “Thinking” ਫੀਚਰ ਰਾਹੀਂ ਉਪਲਬਧ ਹੈ. ਹੋਰ ਸਾਰੇ ਵਰਤੋਂਕਾਰਾਂ ਲਈ, GPT‑5.4 mini GPT‑5.4 Thinking ਲਈ rate limit fallback ਵਜੋਂ ਉਪਲਬਧ ਹੈ.

GPT‑5.4 nano ਕੇਵਲ API ਵਿੱਚ ਉਪਲਬਧ ਹੈ ਅਤੇ 1M input tokens ਲਈ $0.20 ਅਤੇ 1M output tokens ਲਈ $1.25 ਦੀ ਕੀਮਤ ਰੱਖਦਾ ਹੈ.

ਮਾਡਲਾਂ ਦੇ safeguards ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, ਕਿਰਪਾ ਕਰਕੇ ਸਾਡੇ Deployment Safety Hub⁠(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) 'ਤੇ System Card addendum ਦੇਖੋ.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%