આજે અમે GPT‑5.4 mini અને nano રજૂ કરી રહ્યા છીએ, અમારા અત્યાર સુધીના સૌથી સક્ષમ નાના મોડલ્સ. તેઓ GPT‑5.4 ની ઘણી શક્તિઓ ઝડપી, વધુ કાર્યક્ષમ મોડલ્સમાં લાવે છે, જે ઊંચી-માત્રાવાળા workloads માટે ડિઝાઇન કરાયેલા છે.
GPT‑5.4 mini, coding, રિઝનિંગ, multimodal સમજણ અને tool use માં GPT‑5 mini કરતાં નોંધપાત્ર સુધારો કરે છે, અને 2x કરતાં વધુ ઝડપે ચાલે છે. તે SWE-Bench Pro અને OSWorld-Verified સહિતના ઘણા મૂલ્યાંકનમાં મોટા GPT‑5.4 મોડલના પ્રદર્શનને પણ નજીક પહોંચે છે.
GPT‑5.4 nano, GPT‑5.4 નું સૌથી નાનું અને સૌથી સસ્તુ સંસ્કરણ છે, ખાસ કરીને એવા કાર્યો માટે જ્યાં ઝડપ અને ખર્ચ સૌથી મહત્વના હોય. તે GPT‑5 nano કરતાં પણ મહત્વપૂર્ણ અપગ્રેડ છે. અમે તેને classification, data extraction, ranking, અને એવા coding subagents માટે ભલામણ કરીએ છીએ, જે સરળ સહાયક કાર્યો સંભાળે છે.
આ મોડલ્સ એવા workloads માટે બનાવવામાં આવ્યા છે જ્યાં latency સીધી રીતે પ્રોડક્ટ અનુભવને આકાર આપે છે: coding assistants જેને પ્રતિસાદક્ષમ લાગવું જોઈએ, subagents જે ઝડપથી સહાયક કાર્યો પૂરા કરે, screenshots પકડી અને તેનો અર્થ સમજી શકે તેવી computer-using systems, અને એવી multimodal applications જે images પર real-time માં રિઝનિંગ કરી શકે. આ પરિસ્થિતિઓમાં, શ્રેષ્ઠ મોડલ હંમેશા સૌથી મોટું હોવું જરૂરી નથી—તે એવું મોડલ છે જે ઝડપથી પ્રતિસાદ આપી શકે, વિશ્વસનીય રીતે tools નો ઉપયોગ કરી શકે, અને છતાં જટિલ વ્યાવસાયિક કાર્યો પર સારું પ્રદર્શન કરી શકે.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 GPT‑5 mini માટે ઉપલબ્ધ સૌથી ઉચ્ચ reasoning_effort 'high' છે.
તેમના workflows માં GPT‑5.4 mini અને nano ની કસોટી કર્યા પછી અમારા ગ્રાહકો શું વિચારે છે તે અહીં છે:
“GPT-5.4 mini આ વર્ગના મોડલ માટે મજબૂત end-to-end પ્રદર્શન આપે છે. અમારા મૂલ્યાંકનમાં, બહુ ઓછી કિંમત પર તેણે ઘણા output કાર્યો અને citation recall પર સ્પર્ધાત્મક મોડલ્સને સરખામણીમાં બરાબરી કરી અથવા પાછળ મૂક્યા. તેણે મોટા GPT-5.4 મોડલ કરતાં વધુ end-to-end pass rates અને વધુ મજબૂત source attribution પણ હાંસલ કર્યું.”
GPT‑5.4 mini અને nano ખાસ કરીને એવા coding workflows માં અસરકારક છે જ્યાં ઝડપી iteration નો લાભ મળે છે. મોડલ્સ ઓછા latency સાથે targeted edits, codebase navigation, front-end generation, અને debugging loops સંભાળે છે, જે તેમને એવા coding કાર્યો માટે યોગ્ય બનાવે છે જેને વધુ ઝડપે અને ઓછા ખર્ચે પૂર્ણ કરવાના હોય.
benchmarks માં, GPT‑5.4 mini સમાન latency પર સતત GPT‑5‑mini કરતાં આગળ રહે છે અને ઘણી વધુ ઝડપે ચાલતાં GPT‑5.4‑સ્તરના pass rates ની નજીક પહોંચે છે, જેથી coding workflows માટે performance અને latency વચ્ચેના સૌથી મજબૂત સંતુલનોમાંનું એક આપે છે.
અમે અમારા મોડલ્સના production વર્તનને જોઈને અને તેને offline simulation દ્વારા અંદાજીને latency નો અંદાજ લગાવીએ છીએ. latency નો આ અંદાજ tool call duration (code execution time), sampled tokens, અને input tokens ને ધ્યાનમાં લે છે. વાસ્તવિક latency ઘણું બદલાઈ શકે છે અને અમારી simulation માં ન આવતાં ઘણા પરિબળો પર નિર્ભર છે. તેવી જ રીતે, ખર્ચો લખાણના સમયે આ મોડલ્સની API pricing ના આધારે અંદાજવામાં આવ્યા છે. ભવિષ્યમાં ખર્ચ બદલાઈ શકે છે. reasoning efforts ને low થી xhigh સુધી sweep કરવામાં આવ્યા હતા.
GPT‑5.4 mini એ એવી systems માટે પણ મજબૂત પસંદગી છે જે અલગ કદના મોડલ્સને જોડે છે. ઉદાહરણ તરીકે Codex માં, GPT‑5.4 જેવું મોટું મોડલ planning, coordination, અને final judgment સંભાળી શકે છે, જ્યારે GPT‑5.4 mini subagents ને સોંપણી કરે છે, જે સમાંતર રીતે સીમિત subtasks સંભાળે છે—જેમ કે codebase શોધવી, મોટી file ની સમીક્ષા કરવી, અથવા supporting documents પ્રોસેસ કરવાં. Codex માં subagents કેવી રીતે કામ કરે છે તે docs(નવી વિન્ડોમાં ખૂલે છે) માં જાણો.
જેમ જેમ નાના મોડલ્સ વધુ ઝડપી અને વધુ સક્ષમ બને છે, તેમ આ પેટર્ન વધુ ઉપયોગી બને છે. દરેક કામ માટે એક જ મોડલ વાપરવાના બદલે, ડેવલપર્સ એવી systems બનાવી શકે છે જેમાં મોટા મોડલ્સ શું કરવું તે નક્કી કરે અને નાના મોડલ્સ વ્યાપક સ્તરે ઝડપથી અમલ કરે. GPT‑5.4 mini આ પ્રકારના workflow માટે અત્યાર સુધીનું અમારું સૌથી મજબૂત mini મોડલ છે.
GPT‑5.4 mini multimodal કાર્યોમાં પણ મજબૂત છે, ખાસ કરીને computer use સંબંધિત કાર્યોમાં. આ મોડલ ઝડપથી ઘનિષ્ઠ user interfaces ના screenshots સમજી શકે છે જેથી computer use કાર્યો ઝડપથી પૂર્ણ કરી શકાય. OSWorld-Verified પર, GPT‑5.4 mini, GPT‑5.4 ની નજીક પહોંચે છે અને GPT‑5 mini કરતાં નોંધપાત્ર રીતે વધુ સારું પ્રદર્શન કરે છે.
GPT‑5.4 mini આજે API, Codex, અને ChatGPT માં ઉપલબ્ધ છે.
API માં, GPT‑5.4 mini text અને image inputs, tool use, ફંક્શન કોલિંગ, web search, file search, computer use, અને skills ને સપોર્ટ કરે છે. તેમાં 400k context window છે અને 1M input ટોકન દીઠ $0.75 તથા 1M output ટોકન દીઠ $4.50 ખર્ચ થાય છે.
Codex માં, GPT‑5.4 mini Codex app, CLI, IDE extension અને web પર ઉપલબ્ધ છે. તે GPT‑5.4 quota નો માત્ર 30% ઉપયોગ કરે છે, જેથી ડેવલપર્સ Codex માં સરળ coding કાર્યો લગભગ એક-તૃતિયાંશ ખર્ચે ઝડપથી સંભાળી શકે. Codex GPT‑5.4 mini subagents ને પણ સોંપણી કરી શકે છે જેથી ઓછું reasoning-intensive કામ સસ્તા મોડલ પર ચાલે.
ChatGPT માં, GPT‑5.4 mini Free અને Go users માટે + menu માં “Thinking” feature મારફતે ઉપલબ્ધ છે. બાકી બધા users માટે, GPT‑5.4 mini GPT‑5.4 Thinking માટે rate limit fallback તરીકે ઉપલબ્ધ છે.
GPT‑5.4 nano માત્ર API માં ઉપલબ્ધ છે અને 1M input ટોકન દીઠ $0.20 તથા 1M output ટોકન દીઠ $1.25 ખર્ચ થાય છે.
મોડલ્સના safeguards વિશે વધુ માહિતી માટે, કૃપા કરીને અમારા Deployment Safety Hub(નવી વિન્ડોમાં ખૂલે છે) પર System Card addendum જુઓ.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 GPT‑5 mini માટે ઉપલબ્ધ સૌથી ઉચ્ચ reasoning_effort 'high' છે.
2 Overall Edit Distance. ઓછા ખર્ચ અને ઓછી latency પ્રદર્શન દર્શાવવા OmniDocBench reasoning_effort ને 'none' પર સેટ કરીને ચલાવવામાં આવ્યું હતું.


