ਅੱਜ ਅਸੀਂ GPT‑5.4 mini ਅਤੇ nano ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ, ਜੋ ਹੁਣ ਤੱਕ ਸਾਡੇ ਸਭ ਤੋਂ ਸਮਰੱਥ ਛੋਟੇ ਮਾਡਲ ਹਨ. ਇਹ GPT‑5.4 ਦੀਆਂ ਕਈ ਤਾਕਤਾਂ ਨੂੰ ਤੇਜ਼, ਹੋਰ ਦੱਖਣ ਮਾਡਲਾਂ ਵਿੱਚ ਲਿਆਉਂਦੇ ਹਨ, ਜੋ ਉੱਚ-ਮਾਤਰਾ ਵਰਕਲੋਡ ਲਈ ਬਣਾਏ ਗਏ ਹਨ.
GPT‑5.4 mini, coding, ਰੀਜ਼ਨਿੰਗ, multimodal ਸਮਝ ਅਤੇ tool use ਵਿੱਚ GPT‑5 mini ਨਾਲੋਂ ਮਹੱਤਵਪੂਰਣ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਅਤੇ 2x ਤੋਂ ਵੱਧ ਤੇਜ਼ ਚਲਦਾ ਹੈ. ਇਹ ਕਈ ਮੁਲਾਂਕਨਾਂ ਵਿੱਚ, ਜਿਵੇਂ SWE-Bench Pro ਅਤੇ OSWorld-Verified, ਵੱਡੇ GPT‑5.4 ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੇ ਵੀ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ.
GPT‑5.4 nano, GPT‑5.4 ਦਾ ਸਭ ਤੋਂ ਛੋਟਾ ਅਤੇ ਸਭ ਤੋਂ ਸਸਤਾ ਵਰਜਨ ਹੈ ਉਹਨਾਂ ਕੰਮਾਂ ਲਈ ਜਿੱਥੇ ਗਤੀ ਅਤੇ ਲਾਗਤ ਸਭ ਤੋਂ ਵੱਧ ਮਹੱਤਵ ਰੱਖਦੇ ਹਨ. ਇਹ GPT‑5 nano ਨਾਲੋਂ ਵੀ ਵੱਡਾ ਅੱਪਗ੍ਰੇਡ ਹੈ. ਅਸੀਂ ਇਸਨੂੰ classification, data extraction, ranking, ਅਤੇ coding subagents ਲਈ ਸਿਫਾਰਸ਼ ਕਰਦੇ ਹਾਂ ਜੋ ਸਧਾਰਣ ਸਹਾਇਕ ਕੰਮ ਸੰਭਾਲਦੇ ਹਨ.
ਇਹ ਮਾਡਲ ਉਹਨਾਂ ਕਿਸਮਾਂ ਦੇ ਵਰਕਲੋਡ ਲਈ ਬਣਾਏ ਗਏ ਹਨ ਜਿੱਥੇ latency ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਉਤਪਾਦ ਅਨੁਭਵ ਨੂੰ ਨਿਰਧਾਰਤ ਕਰਦੀ ਹੈ: coding assistants ਜਿਨ੍ਹਾਂ ਨੂੰ ਫੁਰਤੀਲਾ ਮਹਿਸੂਸ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, subagents ਜੋ ਸਹਾਇਕ ਕੰਮ ਜਲਦੀ ਪੂਰੇ ਕਰਦੇ ਹਨ, computer-using systems ਜੋ screenshots ਨੂੰ ਕੈਪਚਰ ਅਤੇ ਸਮਝਦੇ ਹਨ, ਅਤੇ multimodal applications ਜੋ real-time ਵਿੱਚ images 'ਤੇ ਰੀਜ਼ਨਿੰਗ ਕਰ ਸਕਦੀਆਂ ਹਨ. ਇਨ੍ਹਾਂ ਸਥਿਤੀਆਂ ਵਿੱਚ, ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਅਕਸਰ ਸਭ ਤੋਂ ਵੱਡਾ ਨਹੀਂ ਹੁੰਦਾ—ਇਹ ਉਹ ਹੁੰਦਾ ਹੈ ਜੋ ਜਲਦੀ ਜਵਾਬ ਦੇ ਸਕੇ, tools ਨੂੰ ਭਰੋਸੇਯੋਗ ਤਰੀਕੇ ਨਾਲ ਵਰਤੇ, ਅਤੇ ਫਿਰ ਵੀ ਜਟਿਲ ਪੇਸ਼ੇਵਰ ਕੰਮਾਂ 'ਤੇ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰੇ.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 GPT‑5 mini ਲਈ ਉਪਲਬਧ ਸਭ ਤੋਂ ਉੱਚਾ reasoning_effort ‘high’ ਹੈ.
ਇਹ ਹੈ ਕਿ ਸਾਡੇ ਗਾਹਕ GPT‑5.4 mini ਅਤੇ nano ਨੂੰ ਆਪਣੇ ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਟੈਸਟ ਕਰਨ ਤੋਂ ਬਾਅਦ ਕੀ ਸੋਚਦੇ ਹਨ:
“GPT-5.4 mini ਇਸ ਵਰਗ ਦੇ ਮਾਡਲ ਲਈ ਮਜ਼ਬੂਤ end-to-end ਪ੍ਰਦਰਸ਼ਨ ਦਿੰਦਾ ਹੈ. ਸਾਡੇ ਮੁਲਾਂਕਨਾਂ ਵਿੱਚ, ਇਸਨੇ ਕਾਫ਼ੀ ਘੱਟ ਲਾਗਤ 'ਤੇ ਕਈ output tasks ਅਤੇ citation recall ਵਿੱਚ ਮੁਕਾਬਲੇ ਦੇ ਮਾਡਲਾਂ ਦੇ ਬਰਾਬਰ ਜਾਂ ਉਹਨਾਂ ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕੀਤਾ. ਇਸਨੇ ਵੱਡੇ GPT-5.4 ਮਾਡਲ ਨਾਲੋਂ ਉੱਚੇ end-to-end pass rates ਅਤੇ ਹੋਰ ਮਜ਼ਬੂਤ source attribution ਵੀ ਹਾਸਲ ਕੀਤੀ.”
GPT‑5.4 mini ਅਤੇ nano ਖ਼ਾਸ ਤੌਰ 'ਤੇ ਉਹਨਾਂ coding ਵਰਕਫਲੋਜ਼ ਵਿੱਚ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ iteration ਦਾ ਫਾਇਦਾ ਮਿਲਦਾ ਹੈ. ਮਾਡਲ targeted edits, codebase navigation, front-end generation, ਅਤੇ debugging loops ਨੂੰ ਘੱਟ latency ਨਾਲ ਸੰਭਾਲਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਇਹ ਉਹਨਾਂ coding ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਵਧੀਆ ਬਣਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੇਜ਼ ਗਤੀ ਅਤੇ ਘੱਟ ਲਾਗਤ 'ਤੇ ਪੂਰਾ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ.
Benchmarks ਵਿੱਚ, GPT‑5.4 mini ਸਮਾਨ latency 'ਤੇ ਲਗਾਤਾਰ GPT‑5‑mini ਤੋਂ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ਅਤੇ ਕਾਫ਼ੀ ਤੇਜ਼ ਚਲਦੇ ਹੋਏ GPT‑5.4‑ਪੱਧਰ ਦੇ pass rates ਦੇ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ, ਜਿਸ ਨਾਲ coding ਵਰਕਫਲੋਜ਼ ਲਈ performance-per-latency ਦੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਸੰਤੁਲਨਾਂ ਵਿੱਚੋਂ ਇੱਕ ਮਿਲਦਾ ਹੈ.
ਅਸੀਂ ਆਪਣੇ ਮਾਡਲਾਂ ਦੇ production ਵਿਹਾਰ ਨੂੰ ਦੇਖ ਕੇ ਅਤੇ ਇਸਨੂੰ offline simulate ਕਰਕੇ latency ਦਾ ਅਨੁਮਾਨ ਲਗਾਂਦੇ ਹਾਂ. latency ਅਨੁਮਾਨ ਵਿੱਚ tool call ਦੀ ਮਿਆਦ (code execution time), sampled tokens, ਅਤੇ input tokens ਸ਼ਾਮਲ ਹਨ. ਅਸਲ ਦੁਨੀਆ ਦੀ latency ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਵੱਖਰੀ ਹੋ ਸਕਦੀ ਹੈ, ਅਤੇ ਇਹ ਕਈ ਅਜਿਹੇ ਕਾਰਕਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਜੋ ਸਾਡੀ simulation ਵਿੱਚ ਕੈਪਚਰ ਨਹੀਂ ਕੀਤੇ ਗਏ. ਇਸੇ ਤਰ੍ਹਾਂ, ਲਾਗਤਾਂ ਲਿਖਣ ਦੇ ਸਮੇਂ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੀ API pricing ਦੇ ਆਧਾਰ 'ਤੇ ਅਨੁਮਾਨਿਤ ਹਨ. ਭਵਿੱਖ ਵਿੱਚ ਲਾਗਤਾਂ ਬਦਲ ਸਕਦੀਆਂ ਹਨ. reasoning efforts ਨੂੰ low ਤੋਂ xhigh ਤੱਕ sweep ਕੀਤਾ ਗਿਆ ਸੀ.
GPT‑5.4 mini ਉਹਨਾਂ systems ਲਈ ਵੀ ਮਜ਼ਬੂਤ ਚੋਣ ਹੈ ਜੋ ਵੱਖ-ਵੱਖ ਆਕਾਰਾਂ ਦੇ ਮਾਡਲ ਇਕੱਠੇ ਵਰਤਦੇ ਹਨ. ਉਦਾਹਰਨ ਲਈ, Codex ਵਿੱਚ GPT‑5.4 ਵਰਗਾ ਵੱਡਾ ਮਾਡਲ planning, coordination, ਅਤੇ final judgment ਸੰਭਾਲ ਸਕਦਾ ਹੈ, ਜਦਕਿ GPT‑5.4 mini subagents ਨੂੰ ਸੌਂਪ ਸਕਦਾ ਹੈ ਜੋ ਇਕੱਠੇ ਤੌਰ 'ਤੇ ਛੋਟੇ-ਛੋਟੇ ਕੰਮ ਕਰਦੇ ਹਨ—ਜਿਵੇਂ codebase ਖੋਜਣਾ, ਵੱਡੀ ਫਾਈਲ ਦੀ ਸਮੀਖਿਆ ਕਰਨਾ, ਜਾਂ ਸਹਾਇਕ ਦਸਤਾਵੇਜ਼ ਪ੍ਰਕਿਰਿਆ ਕਰਨਾ. Codex ਵਿੱਚ subagents ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਇਹ docs(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) ਵਿੱਚ ਜਾਣੋ.
ਇਹ ਪੈਟਰਨ ਹੋਰ ਲਾਭਕਾਰੀ ਬਣ ਜਾਂਦਾ ਹੈ ਜਿਵੇਂ ਛੋਟੇ ਮਾਡਲ ਹੋਰ ਤੇਜ਼ ਅਤੇ ਸਮਰੱਥ ਹੁੰਦੇ ਜਾਂਦੇ ਹਨ. ਹਰ ਚੀਜ਼ ਲਈ ਇੱਕ ਮਾਡਲ ਵਰਤਣ ਦੀ ਬਜਾਏ, ਡਿਵੈਲਪਰ ਅਜੇਹੇ systems ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ ਜਿੱਥੇ ਵੱਡੇ ਮਾਡਲ ਤੈਅ ਕਰਦੇ ਹਨ ਕਿ ਕੀ ਕਰਨਾ ਹੈ ਅਤੇ ਛੋਟੇ ਮਾਡਲ ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਜਲਦੀ ਕਾਰਵਾਈ ਕਰਦੇ ਹਨ. GPT‑5.4 mini ਅਜਿਹੇ ਵਰਕਫਲੋ ਸ਼ੈਲੀ ਲਈ ਹੁਣ ਤੱਕ ਸਾਡਾ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ mini ਮਾਡਲ ਹੈ.
GPT‑5.4 mini multimodal ਕੰਮਾਂ ਵਿੱਚ ਵੀ ਮਜ਼ਬੂਤ ਹੈ, ਖ਼ਾਸ ਕਰਕੇ ਉਹ ਜੋ computer use ਨਾਲ ਸੰਬੰਧਿਤ ਹਨ. ਮਾਡਲ ਗੁੰਝਲਦਾਰ user interfaces ਵਾਲੀਆਂ screenshots ਨੂੰ ਜਲਦੀ ਸਮਝ ਕੇ computer use ਕੰਮ ਤੇਜ਼ੀ ਨਾਲ ਪੂਰੇ ਕਰ ਸਕਦਾ ਹੈ. OSWorld-Verified 'ਤੇ, GPT‑5.4 mini, GPT‑5.4 ਦੇ ਨੇੜੇ ਪਹੁੰਚਦਾ ਹੈ ਅਤੇ GPT‑5 mini ਨਾਲੋਂ ਕਾਫ਼ੀ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ.
GPT‑5.4 mini ਅੱਜ API, Codex, ਅਤੇ ChatGPT ਵਿੱਚ ਉਪਲਬਧ ਹੈ.
API ਵਿੱਚ, GPT‑5.4 mini text ਅਤੇ image inputs, tool use, ਫੰਕਸ਼ਨ ਕਾਲਿੰਗ, web search, file search, computer use, ਅਤੇ skills ਨੂੰ ਸਮਰਥਨ ਦਿੰਦਾ ਹੈ. ਇਸਦਾ 400k context window ਹੈ ਅਤੇ ਇਸਦੀ ਕੀਮਤ 1M input tokens ਲਈ $0.75 ਅਤੇ 1M output tokens ਲਈ $4.50 ਹੈ.
Codex ਵਿੱਚ, GPT‑5.4 mini Codex app, CLI, IDE extension ਅਤੇ web ਵਿੱਚ ਉਪਲਬਧ ਹੈ. ਇਹ GPT‑5.4 quota ਦਾ ਕੇਵਲ 30% ਹੀ ਵਰਤਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਡਿਵੈਲਪਰ Codex ਵਿੱਚ ਸਧਾਰਣ coding ਕੰਮ ਲਗਭਗ ਇੱਕ-ਤਿਹਾਈ ਲਾਗਤ 'ਤੇ ਜਲਦੀ ਕਰ ਸਕਦੇ ਹਨ. Codex GPT‑5.4 mini subagents ਨੂੰ ਵੀ delegate ਕਰ ਸਕਦਾ ਹੈ ਤਾਂ ਜੋ ਘੱਟ reasoning-intensive ਕੰਮ ਸਸਤੇ ਮਾਡਲ 'ਤੇ ਚੱਲਣ.
ChatGPT ਵਿੱਚ, GPT‑5.4 mini Free ਅਤੇ Go ਵਰਤੋਂਕਾਰਾਂ ਲਈ + ਮੈਨੂ ਵਿੱਚ “Thinking” ਫੀਚਰ ਰਾਹੀਂ ਉਪਲਬਧ ਹੈ. ਹੋਰ ਸਾਰੇ ਵਰਤੋਂਕਾਰਾਂ ਲਈ, GPT‑5.4 mini GPT‑5.4 Thinking ਲਈ rate limit fallback ਵਜੋਂ ਉਪਲਬਧ ਹੈ.
GPT‑5.4 nano ਕੇਵਲ API ਵਿੱਚ ਉਪਲਬਧ ਹੈ ਅਤੇ 1M input tokens ਲਈ $0.20 ਅਤੇ 1M output tokens ਲਈ $1.25 ਦੀ ਕੀਮਤ ਰੱਖਦਾ ਹੈ.
ਮਾਡਲਾਂ ਦੇ safeguards ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਲਈ, ਕਿਰਪਾ ਕਰਕੇ ਸਾਡੇ Deployment Safety Hub(ਨਵੀਂ ਵਿੰਡੋ ਵਿੱਚ ਖੁੱਲ੍ਹਦਾ ਹੈ) 'ਤੇ System Card addendum ਦੇਖੋ.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 GPT‑5 mini ਲਈ ਉਪਲਬਧ ਸਭ ਤੋਂ ਉੱਚਾ reasoning_effort ‘high’ ਹੈ.
2 Overall Edit Distance. OmniDocBench ਨੂੰ reasoning_effort ‘none’ 'ਤੇ ਚਲਾਇਆ ਗਿਆ ਸੀ ਤਾਂ ਜੋ ਘੱਟ ਲਾਗਤ, ਘੱਟ latency ਵਾਲੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਦਰਸਾਇਆ ਜਾ ਸਕੇ.


