ਮੁੱਖ ਸਮੱਗਰੀ 'ਤੇ ਜਾਓ
OpenAI

17 ਮਾਰਚ 2026

ਕੰਪਨੀਉਤਪਾਦ

GPT‑5.4 mini ਅਤੇ nano ਪੇਸ਼ ਕਰ ਰਹੇ ਹਾਂ

coding ਅਤੇ subagents ਲਈ ਅਨੁਕੂਲਿਤ ਤੇਜ਼ ਅਤੇ ਦੱਖਣ ਮਾਡਲ

ਲੋਡ ਹੋ ਰਿਹਾ ਹੈ…

ਅੱਜ ਅਸੀਂ GPT‑5.4 mini ਅਤੇ nano ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ ਹੁਣ ਤੱਕ ਸਾਡੇ ਸਭ ਤੋਂ ਸਮਰੱਥ ਛੋਟੇ ਮਾਡਲ ਹਨ. ਇਹ GPT‑5.4 ਦੀਆਂ ਕਈ ਤਾਕਤਾਂ ਨੂੰ ਤੇਜ਼, ਹੋਰ ਦੱਖਣ ਮਾਡਲਾਂ ਵਿੱਚ ਲਿਆਉਂਦੇ ਹਨ, ਜੋ ਉੱਚ-ਮਾਤਰਾ ਵਰਕਲੋਡ ਲਈ ਬਣਾਏ ਗਏ ਹਨ.

GPT‑5.4 mini, coding, ਰੀਜ਼ਨਿੰਗ, multimodal ਸਮਝ ਅਤੇ tool use ਵਿੱਚ GPT‑5 mini ਨਾਲੋਂ ਮਹੱਤਵਪੂਰਣ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਅਤੇ 2x ਤੋਂ ਵੱਧ ਤੇਜ਼ ਚਲਦਾ ਹੈ. ਇਹ ਕਈ ਮੁਲਾਂਕਨਾਂ ਵਿੱਚ, ਜਿਵੇਂ SWE-Bench Pro ਅਤੇ OSWorld-Verified, ਵੱਡੇ GPT‑5.4 ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੇ ਵੀ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ.

GPT‑5.4 nano, GPT‑5.4 ਦਾ ਸਭ ਤੋਂ ਛੋਟਾ ਅਤੇ ਸਭ ਤੋਂ ਸਸਤਾ ਵਰਜਨ ਹੈ ਉਹਨਾਂ ਕੰਮਾਂ ਲਈ ਜਿੱਥੇ ਗਤੀ ਅਤੇ ਲਾਗਤ ਸਭ ਤੋਂ ਵੱਧ ਮਹੱਤਵ ਰੱਖਦੇ ਹਨ. ਇਹ GPT‑5 nano ਨਾਲੋਂ ਵੀ ਵੱਡਾ ਅੱਪਗ੍ਰੇਡ ਹੈ. ਅਸੀਂ ਇਸਨੂੰ classification, data extraction, ranking, ਅਤੇ coding subagents ਲਈ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਾਂ ਜੋ ਸਧਾਰਣ ਸਹਾਇਕ ਕੰਮ ਸੰਭਾਲਦੇ ਹਨ.

ਇਹ ਮਾਡਲ ਉਹਨਾਂ ਕਿਸਮਾਂ ਦੇ ਵਰਕਲੋਡ ਲਈ ਬਣਾਏ ਗਏ ਹਨ ਜਿੱਥੇ latency ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਉਤਪਾਦ ਅਨੁਭਵ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ: coding assistants ਜਿਨ੍ਹਾਂ ਨੂੰ ਫੁਰਤੀਲਾ ਮਹਿਸੂਸ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, subagents ਜੋ ਸਹਾਇਕ ਕੰਮ ਜਲਦੀ ਪੂਰੇ ਕਰਦੇ ਹਨ, computer-using systems ਜੋ screenshots ਨੂੰ ਕੈਪਚਰ ਅਤੇ ਸਮਝਦੇ ਹਨ, ਅਤੇ multimodal applications ਜੋ real-time ਵਿੱਚ images 'ਤੇ ਰੀਜ਼ਨਿੰਗ ਕਰ ਸਕਦੀਆਂ ਹਨ. ਇਨ੍ਹਾਂ ਸਥਿਤੀਆਂ ਵਿੱਚ, ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਅਕਸਰ ਸਭ ਤੋਂ ਵੱਡਾ ਨਹੀਂ ਹੁੰਦਾ—ਇਹ ਉਹ ਹੁੰਦਾ ਹੈ ਜੋ ਜਲਦੀ ਜਵਾਬ ਦੇ ਸਕੇ, tools ਨੂੰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਵਰਤੇ, ਅਤੇ ਫਿਰ ਵੀ ਜਟਿਲ ਪੇਸ਼ੇਵਰ ਕੰਮਾਂ 'ਤੇ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰੇ.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini ਲਈ ਉਪਲਬਧ ਸਭ ਤੋਂ ਉੱਚਾ reasoning_effort ‘high’ ਹੈ.

ਇਹ ਹੈ ਕਿ ਸਾਡੇ ਗਾਹਕ GPT‑5.4 mini ਅਤੇ nano ਨੂੰ ਆਪਣੇ ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਟੈਸਟ ਕਰਨ ਤੋਂ ਬਾਅਦ ਕੀ ਸੋਚਦੇ ਹਨ:

“GPT-5.4 mini ਇਸ ਵਰਗ ਦੇ ਮਾਡਲ ਲਈ ਮਜ਼ਬੂਤ end-to-end ਪ੍ਰਦਰਸ਼ਨ ਦਿੰਦਾ ਹੈ. ਸਾਡੇ ਮੁਲਾਂਕਨਾਂ ਵਿੱਚ, ਇਸਨੇ ਕਾਫ਼ੀ ਘੱਟ ਲਾਗਤ 'ਤੇ ਕਈ output tasks ਅਤੇ citation recall ਵਿੱਚ ਮੁਕਾਬਲੇ ਦੇ ਮਾਡਲਾਂ ਦੇ ਬਰਾਬਰ ਜਾਂ ਉਹਨਾਂ ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ. ਇਸਨੇ ਵੱਡੇ GPT-5.4 ਮਾਡਲ ਨਾਲੋਂ ਉੱਚੇ end-to-end pass rates ਅਤੇ ਹੋਰ ਮਜ਼ਬੂਤ source attribution ਵੀ ਹਾਸਲ ਕੀਤੀ.”
— Aabhas Sharma, Hebbia ਵਿੱਚ CTO

Coding

GPT‑5.4 mini ਅਤੇ nano ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਉਹਨਾਂ coding ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ iteration ਦਾ ਫਾਇਦਾ ਮਿਲਦਾ ਹੈ. ਮਾਡਲ targeted edits, codebase navigation, front-end generation, ਅਤੇ debugging loops ਨੂੰ ਘੱਟ latency ਨਾਲ ਸੰਭਾਲਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਇਹ ਉਹਨਾਂ coding ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਵਧੀਆ ਬਣਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ ਗਤੀ ਅਤੇ ਘੱਟ ਲਾਗਤ 'ਤੇ ਪੂਰਾ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ.

Benchmarks ਵਿੱਚ, GPT‑5.4 mini ਸਮਾਨ latency 'ਤੇ ਲਗਾਤਾਰ GPT‑5‑mini ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ਅਤੇ ਕਾਫ਼ੀ ਤੇਜ਼ ਚਲਦੇ ਹੋਏ GPT‑5.4‑ਪੱਧਰ ਦੇ pass rates ਦੇ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ, ਜਿਸ ਨਾਲ coding ਵਰਕਫਲੋਜ਼ ਲਈ performance-per-latency ਦੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਸੰਤੁਲਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਮਿਲਦਾ ਹੈ.

ਅਸੀਂ ਆਪਣੇ ਮਾਡਲਾਂ ਦੇ production ਵਿਹਾਰ ਨੂੰ ਦੇਖ ਕੇ ਅਤੇ ਇਸਨੂੰ offline simulate ਕਰਕੇ latency ਦਾ ਅਨੁਮਾਨ ਲਗਾਂਦੇ ਹਾਂ. latency ਅਨੁਮਾਨ ਵਿੱਚ tool call ਦੀ ਮਿਆਦ (code execution time), sampled tokens, ਅਤੇ input tokens ਸ਼ਾਮਲ ਹਨ. ਅਸਲ ਦੁਨੀਆ ਦੀ latency ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਵੱਖਰੀ ਹੋ ਸਕਦੀ ਹੈ, ਅਤੇ ਇਹ ਕਈ ਅਜਿਹੇ ਕਾਰਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਜੋ ਸਾਡੀ simulation ਵਿੱਚ ਕੈਪਚਰ ਨਹੀਂ ਕੀਤੇ ਗਏ. ਇਸੇ ਤਰ੍ਹਾਂ, ਲਾਗਤਾਂ ਲਿਖਣ ਦੇ ਸਮੇਂ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ API pricing ਦੇ ਆਧਾਰ 'ਤੇ ਅਨੁਮਾਨਿਤ ਹਨ. ਭਵਿੱਖ ਵਿੱਚ ਲਾਗਤਾਂ ਬਦਲ ਸਕਦੀਆਂ ਹਨ. reasoning efforts ਨੂੰ low ਤੋਂ xhigh ਤੱਕ sweep ਕੀਤਾ ਗਿਆ ਸੀ.

Subagents

GPT‑5.4 mini ਉਹਨਾਂ systems ਲਈ ਵੀ ਮਜ਼ਬੂਤ ਚੋਣ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਆਕਾਰਾਂ ਦੇ ਮਾਡਲ ਇਕੱਠੇ ਵਰਤਦੇ ਹਨ. ਉਦਾਹਰਨ ਲਈ, Codex ਵਿੱਚ GPT‑5.4 ਵਰਗਾ ਵੱਡਾ ਮਾਡਲ planning, coordination, ਅਤੇ final judgment ਸੰਭਾਲ ਸਕਦਾ ਹੈ, ਜਦਕਿ GPT‑5.4 mini subagents ਨੂੰ ਸੌਂਪ ਸਕਦਾ ਹੈ ਜੋ ਇਕੱਠੇ ਤੌਰ 'ਤੇ ਛੋਟੇ-ਛੋਟੇ ਕੰਮ ਕਰਦੇ ਹਨ—ਜਿਵੇਂ codebase ਖੋਜਣਾ, ਵੱਡੀ ਫਾਈਲ ਦੀ ਸਮੀਖਿਆ ਕਰਨਾ, ਜਾਂ ਸਹਾਇਕ ਦਸਤਾਵੇਜ਼ ਪ੍ਰਕਿਰਿਆ ਕਰਨਾ. Codex ਵਿੱਚ subagents ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਇਹ docs(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ ਜਾਣੋ.

ਇਹ ਪੈਟਰਨ ਹੋਰ ਲਾਭਕਾਰੀ ਬਣ ਜਾਂਦਾ ਹੈ ਜਿਵੇਂ ਛੋਟੇ ਮਾਡਲ ਹੋਰ ਤੇਜ਼ ਅਤੇ ਸਮਰੱਥ ਹੁੰਦੇ ਜਾਂਦੇ ਹਨ. ਹਰ ਚੀਜ਼ ਲਈ ਇੱਕ ਮਾਡਲ ਵਰਤਣ ਦੀ ਬਜਾਏ, ਡਿਵੈਲਪਰ ਅਜੇਹੇ systems ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ ਜਿੱਥੇ ਵੱਡੇ ਮਾਡਲ ਤੈਅ ਕਰਦੇ ਹਨ ਕਿ ਕੀ ਕਰਨਾ ਹੈ ਅਤੇ ਛੋਟੇ ਮਾਡਲ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਜਲਦੀ ਕਾਰਵਾਈ ਕਰਦੇ ਹਨ. GPT‑5.4 mini ਅਜਿਹੇ ਵਰਕਫਲੋ ਸ਼ੈਲੀ ਲਈ ਹੁਣ ਤੱਕ ਸਾਡਾ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ mini ਮਾਡਲ ਹੈ.

Computer use

GPT‑5.4 mini multimodal ਕੰਮਾਂ ਵਿੱਚ ਵੀ ਮਜ਼ਬੂਤ ਹੈ, ਖ਼ਾਸ ਕਰਕੇ ਉਹ ਜੋ computer use ਨਾਲ ਸੰਬੰਧਿਤ ਹਨ. ਮਾਡਲ ਗੁੰਝਲਦਾਰ user interfaces ਵਾਲੀਆਂ screenshots ਨੂੰ ਜਲਦੀ ਸਮਝ ਕੇ computer use ਕੰਮ ਤੇਜ਼ੀ ਨਾਲ ਪੂਰੇ ਕਰ ਸਕਦਾ ਹੈ. OSWorld-Verified 'ਤੇ, GPT‑5.4 mini, GPT‑5.4 ਦੇ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ ਅਤੇ GPT‑5 mini ਨਾਲੋਂ ਕਾਫ਼ੀ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ.

Availability & pricing

GPT‑5.4 mini ਅੱਜ API, Codex, ਅਤੇ ChatGPT ਵਿੱਚ ਉਪਲਬਧ ਹੈ.

API ਵਿੱਚ, GPT‑5.4 mini text ਅਤੇ image inputs, tool use, ਫੰਕਸ਼ਨ ਕਾਲਿੰਗ, web search, file search, computer use, ਅਤੇ skills ਨੂੰ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ. ਇਸਦਾ 400k context window ਹੈ ਅਤੇ ਇਸਦੀ ਕੀਮਤ 1M input tokens ਲਈ $0.75 ਅਤੇ 1M output tokens ਲਈ $4.50 ਹੈ.

Codex ਵਿੱਚ, GPT‑5.4 mini Codex app, CLI, IDE extension ਅਤੇ web ਵਿੱਚ ਉਪਲਬਧ ਹੈ. ਇਹ GPT‑5.4 quota ਦਾ ਕੇਵਲ 30% ਹੀ ਵਰਤਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਡਿਵੈਲਪਰ Codex ਵਿੱਚ ਸਧਾਰਣ coding ਕੰਮ ਲਗਭਗ ਇੱਕ-ਤਿਹਾਈ ਲਾਗਤ 'ਤੇ ਜਲਦੀ ਕਰ ਸਕਦੇ ਹਨ. Codex GPT‑5.4 mini subagents ਨੂੰ ਵੀ delegate ਕਰ ਸਕਦਾ ਹੈ ਤਾਂ ਜੋ ਘੱਟ reasoning-intensive ਕੰਮ ਸਸਤੇ ਮਾਡਲ 'ਤੇ ਚੱਲਣ.

ChatGPT ਵਿੱਚ, GPT‑5.4 mini Free ਅਤੇ Go ਵਰਤੋਂਕਾਰਾਂ ਲਈ + ਮੈਨੂ ਵਿੱਚ “Thinking” ਫੀਚਰ ਰਾਹੀਂ ਉਪਲਬਧ ਹੈ. ਹੋਰ ਸਾਰੇ ਵਰਤੋਂਕਾਰਾਂ ਲਈ, GPT‑5.4 mini GPT‑5.4 Thinking ਲਈ rate limit fallback ਵਜੋਂ ਉਪਲਬਧ ਹੈ.

GPT‑5.4 nano ਕੇਵਲ API ਵਿੱਚ ਉਪਲਬਧ ਹੈ ਅਤੇ 1M input tokens ਲਈ $0.20 ਅਤੇ 1M output tokens ਲਈ $1.25 ਦੀ ਕੀਮਤ ਰੱਖਦਾ ਹੈ.

ਮਾਡਲਾਂ ਦੇ safeguards ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, ਕਿਰਪਾ ਕਰਕੇ ਸਾਡੇ Deployment Safety Hub(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) 'ਤੇ System Card addendum ਦੇਖੋ.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini ਲਈ ਉਪਲਬਧ ਸਭ ਤੋਂ ਉੱਚਾ reasoning_effort ‘high’ ਹੈ.

2 Overall Edit Distance. OmniDocBench ਨੂੰ reasoning_effort ‘none’ 'ਤੇ ਚਲਾਇਆ ਗਿਆ ਸੀ ਤਾਂ ਜੋ ਘੱਟ ਲਾਗਤ, ਘੱਟ latency ਵਾਲੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਦਰਸਾਇਆ ਜਾ ਸਕੇ.

ਲੇਖਕ

OpenAI