મુખ્ય વિષય-સામગ્રી પર જાવો
OpenAI

GPT‑5.4 mini અને nano રજૂ કરી રહ્યા છીએ

કોડિંગ અને subagents માટે ઑપ્ટિમાઇઝ કરાયેલા ઝડપી અને કાર્યક્ષમ મોડલ્સ

લોડિંગ…

આજે અમે GPT‑5.4 mini અને nano રજૂ કરી રહ્યા છીએ, અમારા અત્યાર સુધીના સૌથી સક્ષમ નાના મોડલ્સ. તેઓ GPT‑5.4 ની ઘણી શક્તિઓ ઝડપી, વધુ કાર્યક્ષમ મોડલ્સમાં લાવે છે, જે ઊંચી-માત્રાવાળા workloads માટે ડિઝાઇન કરાયેલા છે.

GPT‑5.4 mini, coding, રિઝનિંગ, multimodal સમજણ અને tool use માં GPT‑5 mini કરતાં નોંધપાત્ર સુધારો કરે છે, અને 2x કરતાં વધુ ઝડપે ચાલે છે. તે SWE-Bench Pro અને OSWorld-Verified સહિતના ઘણા મૂલ્યાંકનમાં મોટા GPT‑5.4 મોડલના પ્રદર્શનને પણ નજીક પહોંચે છે.

GPT‑5.4 nano, GPT‑5.4 નું સૌથી નાનું અને સૌથી સસ્તુ સંસ્કરણ છે, ખાસ કરીને એવા કાર્યો માટે જ્યાં ઝડપ અને ખર્ચ સૌથી મહત્વના હોય. તે GPT‑5 nano કરતાં પણ મહત્વપૂર્ણ અપગ્રેડ છે. અમે તેને classification, data extraction, ranking, અને એવા coding subagents માટે ભલામણ કરીએ છીએ, જે સરળ સહાયક કાર્યો સંભાળે છે.

આ મોડલ્સ એવા workloads માટે બનાવવામાં આવ્યા છે જ્યાં latency સીધી રીતે પ્રોડક્ટ અનુભવને આકાર આપે છે: coding assistants જેને પ્રતિસાદક્ષમ લાગવું જોઈએ, subagents જે ઝડપથી સહાયક કાર્યો પૂરા કરે, screenshots પકડી અને તેનો અર્થ સમજી શકે તેવી computer-using systems, અને એવી multimodal applications જે images પર real-time માં રિઝનિંગ કરી શકે. આ પરિસ્થિતિઓમાં, શ્રેષ્ઠ મોડલ હંમેશા સૌથી મોટું હોવું જરૂરી નથી—તે એવું મોડલ છે જે ઝડપથી પ્રતિસાદ આપી શકે, વિશ્વસનીય રીતે tools નો ઉપયોગ કરી શકે, અને છતાં જટિલ વ્યાવસાયિક કાર્યો પર સારું પ્રદર્શન કરી શકે.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini માટે ઉપલબ્ધ સૌથી ઉચ્ચ reasoning_effort 'high' છે.

તેમના workflows માં GPT‑5.4 mini અને nano ની કસોટી કર્યા પછી અમારા ગ્રાહકો શું વિચારે છે તે અહીં છે:

“GPT-5.4 mini આ વર્ગના મોડલ માટે મજબૂત end-to-end પ્રદર્શન આપે છે. અમારા મૂલ્યાંકનમાં, બહુ ઓછી કિંમત પર તેણે ઘણા output કાર્યો અને citation recall પર સ્પર્ધાત્મક મોડલ્સને સરખામણીમાં બરાબરી કરી અથવા પાછળ મૂક્યા. તેણે મોટા GPT-5.4 મોડલ કરતાં વધુ end-to-end pass rates અને વધુ મજબૂત source attribution પણ હાંસલ કર્યું.”
— Aabhas Sharma, Hebbia માં CTO

કોડિંગ

GPT‑5.4 mini અને nano ખાસ કરીને એવા coding workflows માં અસરકારક છે જ્યાં ઝડપી iteration નો લાભ મળે છે. મોડલ્સ ઓછા latency સાથે targeted edits, codebase navigation, front-end generation, અને debugging loops સંભાળે છે, જે તેમને એવા coding કાર્યો માટે યોગ્ય બનાવે છે જેને વધુ ઝડપે અને ઓછા ખર્ચે પૂર્ણ કરવાના હોય.

benchmarks માં, GPT‑5.4 mini સમાન latency પર સતત GPT‑5‑mini કરતાં આગળ રહે છે અને ઘણી વધુ ઝડપે ચાલતાં GPT‑5.4‑સ્તરના pass rates ની નજીક પહોંચે છે, જેથી coding workflows માટે performance અને latency વચ્ચેના સૌથી મજબૂત સંતુલનોમાંનું એક આપે છે.

અમે અમારા મોડલ્સના production વર્તનને જોઈને અને તેને offline simulation દ્વારા અંદાજીને latency નો અંદાજ લગાવીએ છીએ. latency નો આ અંદાજ tool call duration (code execution time), sampled tokens, અને input tokens ને ધ્યાનમાં લે છે. વાસ્તવિક latency ઘણું બદલાઈ શકે છે અને અમારી simulation માં ન આવતાં ઘણા પરિબળો પર નિર્ભર છે. તેવી જ રીતે, ખર્ચો લખાણના સમયે આ મોડલ્સની API pricing ના આધારે અંદાજવામાં આવ્યા છે. ભવિષ્યમાં ખર્ચ બદલાઈ શકે છે. reasoning efforts ને low થી xhigh સુધી sweep કરવામાં આવ્યા હતા.

Subagents

GPT‑5.4 mini એ એવી systems માટે પણ મજબૂત પસંદગી છે જે અલગ કદના મોડલ્સને જોડે છે. ઉદાહરણ તરીકે Codex માં, GPT‑5.4 જેવું મોટું મોડલ planning, coordination, અને final judgment સંભાળી શકે છે, જ્યારે GPT‑5.4 mini subagents ને સોંપણી કરે છે, જે સમાંતર રીતે સીમિત subtasks સંભાળે છે—જેમ કે codebase શોધવી, મોટી file ની સમીક્ષા કરવી, અથવા supporting documents પ્રોસેસ કરવાં. Codex માં subagents કેવી રીતે કામ કરે છે તે docs(નવી વિન્ડોમાં ખૂલે છે) માં જાણો.

જેમ જેમ નાના મોડલ્સ વધુ ઝડપી અને વધુ સક્ષમ બને છે, તેમ આ પેટર્ન વધુ ઉપયોગી બને છે. દરેક કામ માટે એક જ મોડલ વાપરવાના બદલે, ડેવલપર્સ એવી systems બનાવી શકે છે જેમાં મોટા મોડલ્સ શું કરવું તે નક્કી કરે અને નાના મોડલ્સ વ્યાપક સ્તરે ઝડપથી અમલ કરે. GPT‑5.4 mini આ પ્રકારના workflow માટે અત્યાર સુધીનું અમારું સૌથી મજબૂત mini મોડલ છે.

કમ્પ્યુટર ઉપયોગ

GPT‑5.4 mini multimodal કાર્યોમાં પણ મજબૂત છે, ખાસ કરીને computer use સંબંધિત કાર્યોમાં. આ મોડલ ઝડપથી ઘનિષ્ઠ user interfaces ના screenshots સમજી શકે છે જેથી computer use કાર્યો ઝડપથી પૂર્ણ કરી શકાય. OSWorld-Verified પર, GPT‑5.4 mini, GPT‑5.4 ની નજીક પહોંચે છે અને GPT‑5 mini કરતાં નોંધપાત્ર રીતે વધુ સારું પ્રદર્શન કરે છે.

ઉપલબ્ધતા અને કિંમત

GPT‑5.4 mini આજે API, Codex, અને ChatGPT માં ઉપલબ્ધ છે.

API માં, GPT‑5.4 mini text અને image inputs, tool use, ફંક્શન કોલિંગ, web search, file search, computer use, અને skills ને સપોર્ટ કરે છે. તેમાં 400k context window છે અને 1M input ટોકન દીઠ $0.75 તથા 1M output ટોકન દીઠ $4.50 ખર્ચ થાય છે.

Codex માં, GPT‑5.4 mini Codex app, CLI, IDE extension અને web પર ઉપલબ્ધ છે. તે GPT‑5.4 quota નો માત્ર 30% ઉપયોગ કરે છે, જેથી ડેવલપર્સ Codex માં સરળ coding કાર્યો લગભગ એક-તૃતિયાંશ ખર્ચે ઝડપથી સંભાળી શકે. Codex GPT‑5.4 mini subagents ને પણ સોંપણી કરી શકે છે જેથી ઓછું reasoning-intensive કામ સસ્તા મોડલ પર ચાલે.

ChatGPT માં, GPT‑5.4 mini Free અને Go users માટે + menu માં “Thinking” feature મારફતે ઉપલબ્ધ છે. બાકી બધા users માટે, GPT‑5.4 mini GPT‑5.4 Thinking માટે rate limit fallback તરીકે ઉપલબ્ધ છે.

GPT‑5.4 nano માત્ર API માં ઉપલબ્ધ છે અને 1M input ટોકન દીઠ $0.20 તથા 1M output ટોકન દીઠ $1.25 ખર્ચ થાય છે.

મોડલ્સના safeguards વિશે વધુ માહિતી માટે, કૃપા કરીને અમારા Deployment Safety Hub(નવી વિન્ડોમાં ખૂલે છે) પર System Card addendum જુઓ.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini માટે ઉપલબ્ધ સૌથી ઉચ્ચ reasoning_effort 'high' છે.

2 Overall Edit Distance. ઓછા ખર્ચ અને ઓછી latency પ્રદર્શન દર્શાવવા OmniDocBench reasoning_effort ને 'none' પર સેટ કરીને ચલાવવામાં આવ્યું હતું.

લેખક

OpenAI