പ്രധാന ഉള്ളടക്കത്തിലേക്ക് നീങ്ങുക
OpenAI

2026 മാർച്ച് 17

കമ്പനിProduct

GPT‑5.4 mini അവതരിപ്പിക്കുന്നു

കോഡിംഗിനും സബ്‌ഏജന്റുകൾക്കും വേണ്ടി ഒപ്റ്റിമൈസ് ചെയ്ത വേഗതയുള്ളതും കാര്യക്ഷമവുമായ മോഡൽ

ലോഡിംഗ്…

ഇന്ന് ഞങ്ങൾ GPT‑5.4 mini, nano എന്നിവ പുറത്തിറക്കുന്നു, ഇതുവരെയുള്ളതിൽ ഏറ്റവും കഴിവുള്ള ഞങ്ങളുടെ ചെറിയ മോഡൽ. ഉയർന്ന വോളിയം വർക്ക്ലോഡുകൾക്കായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്ന വേഗതയേറിയതും കൂടുതൽ കാര്യക്ഷമമായതുമായ മോഡലുകളിലേക്ക് GPT‑5.4 ന്റെ പല ശക്തികളെയും അവ കൊണ്ടുവരുന്നു.

GPT‑5.4 mini കോഡിംഗ്, റീസണിംഗ്, മൾട്ടിമോഡൽ മനസ്സിലാക്കൽ, ടൂൾ ഉപയോഗം എന്നിവയിൽ GPT‑5 mini-യേക്കാൾ ശ്രദ്ധേയമായ മികവ് പുലര്‍ത്തുന്നു, അതേസമയം 2x-ൽ കൂടുതല്‍ വേഗത്തിലും പ്രവർത്തിക്കുന്നു. SWE-Bench Pro, OSWorld-Verified എന്നിവ ഉൾപ്പെടെ നിരവധി വിലയിരുത്തലുകളിൽ, ഇത് കുറേകൂടി വലിയ മോഡൽ ആയ GPT‑5.4‑ ന്‍റെ പ്രകടനത്തിന് അടുത്തെത്തുകയും ചെയ്യുന്നു.

GPT‑5.4 nano ഏറ്റവും ചെറിയതും ചെലവ് കുറഞ്ഞതുമായ പതിപ്പാണ്, വേഗതയും ചെലവും പ്രധാനമായ ടാസ്കുകൾക്കായി ഇത് അനുയോജ്യമാണ്. ഇത് GPT‑5 nano-യില്‍ നിന്നുമുള്ള വലിയ അപ്‌ഗ്രേഡ് കൂടിയാണ്. വർഗ്ഗീകരണം, ഡാറ്റ എക്സ്ട്രാക്ഷൻ, റാങ്കിംഗ്, ലളിതമായ സഹായ ടാസ്കുകൾ കൈകാര്യം ചെയ്യുന്ന കോഡിംഗ് സബ്‌ഏജന്റുകൾക്കായി ഇത് ഞങ്ങൾ ശുപാർശ ചെയ്യുന്നു.

ഈ മോഡലുകൾ ലേറ്റൻസി നേരിട്ട് ഉൽപ്പന്ന അനുഭവത്തെ സ്വാധീനിക്കുന്ന തരം വർക്ക്‌ലോഡുകൾക്കായാണ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്: പ്രതികരണക്ഷമതയുള്ള കോഡിംഗ് അസിസ്റ്റന്റുകൾ, വേഗത്തിൽ സഹായക ടാസ്കുകൾ പൂർത്തിയാക്കുന്ന സബ്-ഏജന്റുകൾ, സ്ക്രീൻഷോട്ടുകൾ എടുക്കുകയും അവ വ്യാഖ്യാനിക്കുകയും ചെയ്യുന്ന കമ്പ്യൂട്ടർ-ഉപയോഗ സിസ്റ്റങ്ങൾ, കൂടാതെ തത്സമയം ചിത്രങ്ങളെ അടിസ്ഥാനമാക്കി റീസൺ ചെയ്യാൻ കഴിയുന്ന മൾട്ടിമോഡൽ ആപ്ലിക്കേഷനുകൾ. ഈ ക്രമീകരണങ്ങളിൽ, മികച്ച മോഡൽ പലപ്പോഴും ഏറ്റവും വലുത് ആകണമെന്നില്ല—വേഗത്തിൽ പ്രതികരിക്കാനും, ഉപകരണങ്ങൾ വിശ്വസനീയമായി ഉപയോഗിക്കാനും, സങ്കീർണ്ണമായ പ്രൊഫഷണൽ ടാസ്കുകളിൽ മികച്ച പ്രകടനം കാഴ്ചവെക്കാനും കഴിയുന്ന ഒന്നാണ് മികച്ചു നില്‍ക്കുക.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini ന് ലഭ്യമായ ഏറ്റവും ഉയർന്ന reasoning_effort 'high' ആണ്.

GPT‑5.4 mini-യും nano-യും തങ്ങളുടെ വർക്ക്‌ഫ്ലോകളിൽ പരീക്ഷിച്ച ഉപഭോക്താക്കളുടെ അഭിപ്രായങ്ങൾ ഇതാണ്:

“GPT-5.4 mini ഈ ക്ലാസിലെ ഒരു മോഡൽ എന്ന നിലയില്‍ നോക്കിയാല്‍ ശക്തമായ എൻഡ്-ടു-എൻഡ് പ്രകടനം നൽകുന്നു. ഞങ്ങളുടെ മൂല്യനിർണ്ണയങ്ങളിൽ, പല ഔട്ട്പുട്ട് ടാസ്കുകളിലും സൈറ്റേഷൻ റികോളിലും വളരെ കുറഞ്ഞ ചെലവിൽ ഇത് മത്സരാത്മക മോഡൽ പ്രകടനം കാഴ്ചവച്ചു. ഇത് വലിയ GPT-5.4 മോഡലിനെക്കാൾ ഉയർന്ന end-to-end പാസ് നിരക്കുകളും കൂടുതൽ ശക്തമായ സോഴ്‌സ് അട്രിബ്യൂഷനും കൈവരിച്ചു."
— ആഭാസ് ശർമ്മ, Hebbiaയിലെ ചീഫ് ടെക്നോളജി ഓഫീസർ

കോഡിംഗ്

GPT‑5.4 mini-യും nano-യും വേഗത്തിലുള്ള ആവർത്തനങ്ങളിൽ നിന്ന് പ്രയോജനം ലഭിക്കുന്ന കോഡിംഗ് വർക്ക്‌ഫ്ലോകളിൽ പ്രത്യേകിച്ചും ഫലപ്രദമാണ്. മോഡലുകൾ ലക്ഷ്യബോധമുള്ള എഡിറ്റുകൾ, കോഡ്ബേസ് നാവിഗേഷൻ, ഫ്രണ്ട്-എൻഡ് ജനറേഷൻ, കുറഞ്ഞ ലേറ്റൻസിയോടെ ഡീബഗ്ഗിംഗ് ലൂപ്പുകൾ എന്നിവ കൈകാര്യം ചെയ്യുന്നു. അതിനാൽ കൂടുതൽ വേഗത്തിലും കുറഞ്ഞ ചെലവിലും പൂർത്തിയാക്കേണ്ട കോഡിംഗ് ടാസ്കുകൾക്ക് ഇവ ശക്തമായൊരു പരിഹാരമാണ്.

സമാനമായ ലാറ്റൻസികളിൽ ബെഞ്ച്മാർക്കുകളിൽ, GPT‑5.4 mini, GPT‑5‑mini നെ സ്ഥിരമായി മറികടക്കുകയും GPT‑5.4‑ന്‍റെ തലത്തിന് അടുത്തെത്തുകയും ചെയ്യുന്നു വളരെ വേഗത്തിൽ പ്രവർത്തിക്കുമ്പോഴും പാസ് നിരക്കുകൾ നിലനിർത്തിക്കൊണ്ട്, കോഡിംഗ് വർക്ക്‌ഫ്ലോകൾക്കായി പ്രകടനം-പ്രതി-ലാറ്റൻസി ട്രേഡ്ഓഫുകളിൽ ഏറ്റവും ശക്തമായ ഒന്നായി മാറുന്നു.

ഞങ്ങളുടെ മോഡലുകളുടെ പ്രൊഡക്ഷൻ പെരുമാറ്റം പരിശോധിച്ചും, ഇത് ഓഫ്‌ലൈനായി സിമുലേറ്റ് ചെയ്തും ഞങ്ങൾ ലേറ്റൻസി കണക്കാക്കുന്നു. ടൂൾ കോൾ ദൈർഘ്യം (കോഡ് നിർവഹണ സമയം), സാമ്പിൾ ചെയ്ത ടോക്കണുകൾ, ഇൻപുട്ട് ടോക്കണുകൾ എന്നിവ കണക്കിലെടുത്താണ് ലാറ്റൻസി കണക്കുകൂട്ടല്‍ നടത്തുന്നത് . യഥാർത്ഥ ലോക ലേറ്റൻസി ഗണ്യമായി വ്യത്യാസപ്പെടാം, മാത്രമല്ല അത് ഞങ്ങളുടെ സിമുലേഷനിൽ ഉൾക്കൊള്ളാത്ത നിരവധി ഘടകങ്ങളെ ആശ്രയിച്ചിരിക്കുന്നു. അതുപോലെ, ഇത് എഴുതുന്ന സമയത്തെ ഈ മോഡലുകളുടെ API വിലനിർണ്ണയത്തെ അടിസ്ഥാനമാക്കി ചെലവുകൾ കണക്കാക്കപ്പെടുന്നു. ചെലവുകൾ ഭാവിയിൽ മാറാം. റീസണിംഗ് ശ്രമങ്ങൾ താഴ്ന്നതിൽ നിന്ന് ഉയർന്നതിലേക്ക് ഉയർത്തി.

സബ്‌എജന്റുകൾ

വ്യത്യസ്ത വലുപ്പങ്ങളുള്ള മോഡലുകൾ സംയോജിപ്പിക്കുന്ന സിസ്റ്റങ്ങളിലേക്കും GPT‑5.4 mini മികച്ച ഒരു തിരഞ്ഞെടുപ്പായിരിക്കും. ഉദാഹരണത്തിന്, Codex-ൽ, GPT‑5.4 പോലെയുള്ള ഒരു വലിയ മോഡലിന് പ്ലാനിംഗ്, കോർഡിനേഷൻ, അന്തിമ വിധിനിർണയം എന്നിവ കൈകാര്യം ചെയ്യാൻ കഴിയും, അതേസമയം കൂടുതൽ പരിമിതമായ ഉപടാസ്കുകൾ സമാന്തരമായി കൈകാര്യം ചെയ്യുന്ന ചുമതലകൾ GPT‑5.4 mini സബ്‌ഏജന്റുകളെ ഏൽപ്പിക്കാനും കഴിയും—ഉദാഹരണത്തിന്, ഒരു കോഡ്ബേസ് തിരയുക, ഒരു വലിയ ഫയൽ റിവ്യൂ ചെയ്യുക, അല്ലെങ്കിൽ സപ്പോര്‍ട്ടിംഗ് ഡോക്യുമെന്റുകള്‍ പ്രോസസ് ചെയ്യുക തുടങ്ങിയ ചുമതലകള്‍. ഡോക്യുമെന്റുകളിൽ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) നിന്നും Codex-ൽ സബ്‌എജന്റുകൾ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് പഠിക്കുക.

ചെറിയ മോഡൽ കൂടുതൽ വേഗതയേറിയതും കൂടുതൽ കഴിവുള്ളതുമായതോടെ, ഈ മാതൃക കൂടുതൽ ഉപയോഗപ്രദമാകുന്നു. എല്ലാത്തിനും ഒരു മോഡൽ ഉപയോഗിക്കുന്നതിനുപകരം, എന്തുചെയ്യണമെന്ന് വലിയ മോഡലുകൾ തീരുമാനിക്കുകയും ചെറിയ മോഡലുകൾ അവ വലിയ തോതിലും വേഗത്തിലും നടപ്പാക്കുകയും ചെയ്യുന്ന വിധത്തില്‍ സിസ്റ്റങ്ങൾ ഡെവലപ്പർമാർക്ക് സംയോജിപ്പിക്കാൻ കഴിയും. GPT‑5.4 mini ആ സ്റ്റൈലിലുള്ള വർക്ക്‌ഫ്ലോയ്ക് വേണ്ടിയുള്ള ഞങ്ങളുടെ ഇതുവരെ ഉള്ളതിൽ ഏറ്റവും ശക്തമായ മിനി മോഡൽ ആണ്.

കമ്പ്യൂട്ടർ ഉപയോഗം

GPT‑5.4 mini മൾട്ടിമോഡൽ ടാസ്‌ക്കുകളിലും, പ്രത്യേകിച്ച് കമ്പ്യൂട്ടർ ഉപയോഗവുമായി ബന്ധപ്പെട്ടവയിലും, മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു. മോഡലിന് ആഴമുള്ള ഉപയോക്തൃ ഇന്റർഫേസുകളുടെ സ്ക്രീൻഷോട്ടുകൾ വേഗത്തിൽ വ്യാഖ്യാനിച്ച് അതിവേഗത്തിൽ കമ്പ്യൂട്ടർ ഉപയോഗ ടാസ്കുകൾ പൂർത്തിയാക്കാൻ കഴിയും. OSWorld-Verified ൽ, GPT‑5.4 mini, GPT‑5.4‑ന് അടുത്തെത്തുകയും GPT‑5 mini-യേ ഗണ്യമായ തോതില്‍ മറികടക്കുകയും ചെയ്യുന്നു.

ലഭ്യതയും വിലനിർണ്ണയം

GPT‑5.4 mini ഇപ്പോള്‍ API, Codex, ChatGPT എന്നിവയിൽ ലഭ്യമാണ്.

API യിൽ, GPT‑5.4 mini ടെക്സ്റ്റ്, ചിത്ര ഇൻപുട്ടുകൾ, ടൂൾ ഉപയോഗം, ഫംഗ്ഷൻ കോളിംഗ്, വെബ് തിരയൽ, ഫയൽ തിരയൽ, കമ്പ്യൂട്ടർ ഉപയോഗം, സ്കിൽസുകൾ എന്നിവ പിന്തുണയ്ക്കുന്നു. ഇതിന് 400k കോൺടെക്സ്റ്റ് വിൻഡോ ഉണ്ട്, കൂടാതെ 1M ഇൻപുട്ട് ടോക്കൺ-കൾക്ക് $0.75 ഉം 1M ഔട്ട്പുട്ട് ടോക്കൺ-കൾക്ക് $4.50 ഉം ചെലവാകും.

Codex പരിഗണിച്ചാല്‍, Codex ആപ്പ്, CLI, IDE വിപുലീകരണം, വെബ് എന്നിവയിലുടനീളം GPT‑5.4 mini ലഭ്യമാണ്. ഇത് GPT‑5.4‑ന്റെ 30% മാത്രം ക്വോട്ട ഉപയോഗിക്കുന്നത് ഡെവലപ്പർമാർക്ക് Codex-ൽ ലളിതമായ കോഡിംഗ് ജോലികൾ ഏകദേശം മൂന്നിലൊന്ന് മാത്രം ചെലവിൽ വേഗത്തിൽ കൈകാര്യം ചെയ്യാൻ സഹായിക്കുന്നു. Codex-ന് GPT‑5.4 mini സബ്‌ഏജന്റുകളിലേക്കും ചുമതലകൾ ഏൽപ്പിക്കാം; കുറച്ച് റീസണിംഗ് ആവശ്യമായ ജോലികൾ കുറഞ്ഞ ചെലവുള്ള മോഡലിൽ പ്രവർത്തിക്കും.

ChatGPT‑ൽ, GPT‑5.4 mini + മെനുവിലെ “Thinking” ഫീച്ചർ വഴി Free, Go ഉപയോക്താക്കൾക്ക് ലഭ്യമാണ്. മറ്റെല്ലാ ഉപയോക്താക്കൾക്കും, GPT‑5.4 ന്‍റെ റേറ്റ് ലിമിറ്റ് ഫാൾബാക്കായി GPT‑5.4 mini ലഭ്യമാണ് Thinking.

GPT‑5.4 nano API-ൽ മാത്രമേ ലഭ്യമാകൂ, കൂടാതെ 1M ഇൻപുട്ട് ടോക്കൺ-കൾക്ക് $0.20 ഉം 1M ഔട്ട്പുട്ട് ടോക്കൺ-കൾക്ക് $1.25 ഉം ചെലവാകും.

മോഡലുകളുടെ സുരക്ഷാ നടപടികളെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്കായി, ഞങ്ങളുടെ വിന്യാസ സുരക്ഷാ ഹബ്(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)-ലെ സിസ്റ്റം കാർഡ് അനുബന്ധം പരിശോധിക്കുക.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini ന് ലഭ്യമായ ഏറ്റവും ഉയർന്ന reasoning_effort 'high' ആണ്.

2 മൊത്തത്തിലുള്ള എഡിറ്റ് ഡിസ്റ്റൻസ്. കുറഞ്ഞ ചെലവും കുറഞ്ഞ ലേറ്റൻസിയും ഉള്ള പ്രകടനം പ്രതിഫലിപ്പിക്കുന്നതിനായി, `reasoning_effort` `'none'` ആയി സജ്ജീകരിച്ച് OmniDocBench പ്രവർത്തിപ്പിച്ചു.

രചയിതാവ്

OpenAI