17 માર્ચ, 2026

GPT‑5.4 mini અને nano રજૂ કરી રહ્યા છીએ

કોડિંગ અને subagents માટે ઑપ્ટિમાઇઝ કરાયેલા ઝડપી અને કાર્યક્ષમ મોડલ્સ

લોડિંગ…

આજે અમે GPT‑5.4 mini અને nano રજૂ કરી રહ્યા છીએ, અમારા અત્યાર સુધીના સૌથી સક્ષમ નાના મોડલ્સ. તેઓ GPT‑5.4 ની ઘણી શક્તિઓ ઝડપી, વધુ કાર્યક્ષમ મોડલ્સમાં લાવે છે, જે ઊંચી-માત્રાવાળા workloads માટે ડિઝાઇન કરાયેલા છે.

GPT‑5.4 mini, coding, રિઝનિંગ, multimodal સમજણ અને tool use માં GPT‑5 mini કરતાં નોંધપાત્ર સુધારો કરે છે, અને 2x કરતાં વધુ ઝડપે ચાલે છે. તે SWE-Bench Pro અને OSWorld-Verified સહિતના ઘણા મૂલ્યાંકનમાં મોટા GPT‑5.4 મોડલના પ્રદર્શનને પણ નજીક પહોંચે છે.

GPT‑5.4 nano, GPT‑5.4 નું સૌથી નાનું અને સૌથી સસ્તુ સંસ્કરણ છે, ખાસ કરીને એવા કાર્યો માટે જ્યાં ઝડપ અને ખર્ચ સૌથી મહત્વના હોય. તે GPT‑5 nano કરતાં પણ મહત્વપૂર્ણ અપગ્રેડ છે. અમે તેને classification, data extraction, ranking, અને એવા coding subagents માટે ભલામણ કરીએ છીએ, જે સરળ સહાયક કાર્યો સંભાળે છે.

આ મોડલ્સ એવા workloads માટે બનાવવામાં આવ્યા છે જ્યાં latency સીધી રીતે પ્રોડક્ટ અનુભવને આકાર આપે છે: coding assistants જેને પ્રતિસાદક્ષમ લાગવું જોઈએ, subagents જે ઝડપથી સહાયક કાર્યો પૂરા કરે, screenshots પકડી અને તેનો અર્થ સમજી શકે તેવી computer-using systems, અને એવી multimodal applications જે images પર real-time માં રિઝનિંગ કરી શકે. આ પરિસ્થિતિઓમાં, શ્રેષ્ઠ મોડલ હંમેશા સૌથી મોટું હોવું જરૂરી નથી—તે એવું મોડલ છે જે ઝડપથી પ્રતિસાદ આપી શકે, વિશ્વસનીય રીતે tools નો ઉપયોગ કરી શકે, અને છતાં જટિલ વ્યાવસાયિક કાર્યો પર સારું પ્રદર્શન કરી શકે.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 GPT‑5 mini માટે ઉપલબ્ધ સૌથી ઉચ્ચ reasoning_effort 'high' છે.}

તેમના workflows માં GPT‑5.4 mini અને nano ની કસોટી કર્યા પછી અમારા ગ્રાહકો શું વિચારે છે તે અહીં છે:

“GPT-5.4 mini આ વર્ગના મોડલ માટે મજબૂત end-to-end પ્રદર્શન આપે છે. અમારા મૂલ્યાંકનમાં, બહુ ઓછી કિંમત પર તેણે ઘણા output કાર્યો અને citation recall પર સ્પર્ધાત્મક મોડલ્સને સરખામણીમાં બરાબરી કરી અથવા પાછળ મૂક્યા. તેણે મોટા GPT-5.4 મોડલ કરતાં વધુ end-to-end pass rates અને વધુ મજબૂત source attribution પણ હાંસલ કર્યું.”

— Aabhas Sharma, Hebbia માં CTO

કોડિંગ

GPT‑5.4 mini અને nano ખાસ કરીને એવા coding workflows માં અસરકારક છે જ્યાં ઝડપી iteration નો લાભ મળે છે. મોડલ્સ ઓછા latency સાથે targeted edits, codebase navigation, front-end generation, અને debugging loops સંભાળે છે, જે તેમને એવા coding કાર્યો માટે યોગ્ય બનાવે છે જેને વધુ ઝડપે અને ઓછા ખર્ચે પૂર્ણ કરવાના હોય.

benchmarks માં, GPT‑5.4 mini સમાન latency પર સતત GPT‑5‑mini કરતાં આગળ રહે છે અને ઘણી વધુ ઝડપે ચાલતાં GPT‑5.4‑સ્તરના pass rates ની નજીક પહોંચે છે, જેથી coding workflows માટે performance અને latency વચ્ચેના સૌથી મજબૂત સંતુલનોમાંનું એક આપે છે.

અમે અમારા મોડલ્સના production વર્તનને જોઈને અને તેને offline simulation દ્વારા અંદાજીને latency નો અંદાજ લગાવીએ છીએ. latency નો આ અંદાજ tool call duration (code execution time), sampled tokens, અને input tokens ને ધ્યાનમાં લે છે. વાસ્તવિક latency ઘણું બદલાઈ શકે છે અને અમારી simulation માં ન આવતાં ઘણા પરિબળો પર નિર્ભર છે. તેવી જ રીતે, ખર્ચો લખાણના સમયે આ મોડલ્સની API pricing ના આધારે અંદાજવામાં આવ્યા છે. ભવિષ્યમાં ખર્ચ બદલાઈ શકે છે. reasoning efforts ને low થી xhigh સુધી sweep કરવામાં આવ્યા હતા.

Subagents

GPT‑5.4 mini એ એવી systems માટે પણ મજબૂત પસંદગી છે જે અલગ કદના મોડલ્સને જોડે છે. ઉદાહરણ તરીકે Codex માં, GPT‑5.4 જેવું મોટું મોડલ planning, coordination, અને final judgment સંભાળી શકે છે, જ્યારે GPT‑5.4 mini subagents ને સોંપણી કરે છે, જે સમાંતર રીતે સીમિત subtasks સંભાળે છે—જેમ કે codebase શોધવી, મોટી file ની સમીક્ષા કરવી, અથવા supporting documents પ્રોસેસ કરવાં. Codex માં subagents કેવી રીતે કામ કરે છે તે docs⁠(નવી વિન્ડોમાં ખૂલે છે) માં જાણો.

જેમ જેમ નાના મોડલ્સ વધુ ઝડપી અને વધુ સક્ષમ બને છે, તેમ આ પેટર્ન વધુ ઉપયોગી બને છે. દરેક કામ માટે એક જ મોડલ વાપરવાના બદલે, ડેવલપર્સ એવી systems બનાવી શકે છે જેમાં મોટા મોડલ્સ શું કરવું તે નક્કી કરે અને નાના મોડલ્સ વ્યાપક સ્તરે ઝડપથી અમલ કરે. GPT‑5.4 mini આ પ્રકારના workflow માટે અત્યાર સુધીનું અમારું સૌથી મજબૂત mini મોડલ છે.

કમ્પ્યુટર ઉપયોગ

GPT‑5.4 mini multimodal કાર્યોમાં પણ મજબૂત છે, ખાસ કરીને computer use સંબંધિત કાર્યોમાં. આ મોડલ ઝડપથી ઘનિષ્ઠ user interfaces ના screenshots સમજી શકે છે જેથી computer use કાર્યો ઝડપથી પૂર્ણ કરી શકાય. OSWorld-Verified પર, GPT‑5.4 mini, GPT‑5.4 ની નજીક પહોંચે છે અને GPT‑5 mini કરતાં નોંધપાત્ર રીતે વધુ સારું પ્રદર્શન કરે છે.

ઉપલબ્ધતા અને કિંમત

GPT‑5.4 mini આજે API, Codex, અને ChatGPT માં ઉપલબ્ધ છે.

API માં, GPT‑5.4 mini text અને image inputs, tool use, ફંક્શન કોલિંગ, web search, file search, computer use, અને skills ને સપોર્ટ કરે છે. તેમાં 400k context window છે અને 1M input ટોકન દીઠ $0.75 તથા 1M output ટોકન દીઠ $4.50 ખર્ચ થાય છે.

Codex માં, GPT‑5.4 mini Codex app, CLI, IDE extension અને web પર ઉપલબ્ધ છે. તે GPT‑5.4 quota નો માત્ર 30% ઉપયોગ કરે છે, જેથી ડેવલપર્સ Codex માં સરળ coding કાર્યો લગભગ એક-તૃતિયાંશ ખર્ચે ઝડપથી સંભાળી શકે. Codex GPT‑5.4 mini subagents ને પણ સોંપણી કરી શકે છે જેથી ઓછું reasoning-intensive કામ સસ્તા મોડલ પર ચાલે.

ChatGPT માં, GPT‑5.4 mini Free અને Go users માટે + menu માં “Thinking” feature મારફતે ઉપલબ્ધ છે. બાકી બધા users માટે, GPT‑5.4 mini GPT‑5.4 Thinking માટે rate limit fallback તરીકે ઉપલબ્ધ છે.

GPT‑5.4 nano માત્ર API માં ઉપલબ્ધ છે અને 1M input ટોકન દીઠ $0.20 તથા 1M output ટોકન દીઠ $1.25 ખર્ચ થાય છે.

મોડલ્સના safeguards વિશે વધુ માહિતી માટે, કૃપા કરીને અમારા Deployment Safety Hub⁠(નવી વિન્ડોમાં ખૂલે છે) પર System Card addendum જુઓ.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%