2026 മാർച്ച് 17

GPT‑5.4 mini അവതരിപ്പിക്കുന്നു

കോഡിംഗിനും സബ്‌ഏജന്റുകൾക്കും വേണ്ടി ഒപ്റ്റിമൈസ് ചെയ്ത വേഗതയുള്ളതും കാര്യക്ഷമവുമായ മോഡൽ

ലോഡിംഗ്…

ഇന്ന് ഞങ്ങൾ GPT‑5.4 mini, nano എന്നിവ പുറത്തിറക്കുന്നു, ഇതുവരെയുള്ളതിൽ ഏറ്റവും കഴിവുള്ള ഞങ്ങളുടെ ചെറിയ മോഡൽ. ഉയർന്ന വോളിയം വർക്ക്ലോഡുകൾക്കായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്ന വേഗതയേറിയതും കൂടുതൽ കാര്യക്ഷമമായതുമായ മോഡലുകളിലേക്ക് GPT‑5.4 ന്റെ പല ശക്തികളെയും അവ കൊണ്ടുവരുന്നു.

GPT‑5.4 mini കോഡിംഗ്, റീസണിംഗ്, മൾട്ടിമോഡൽ മനസ്സിലാക്കൽ, ടൂൾ ഉപയോഗം എന്നിവയിൽ GPT‑5 mini-യേക്കാൾ ശ്രദ്ധേയമായ മികവ് പുലര്‍ത്തുന്നു, അതേസമയം 2x-ൽ കൂടുതല്‍ വേഗത്തിലും പ്രവർത്തിക്കുന്നു. SWE-Bench Pro, OSWorld-Verified എന്നിവ ഉൾപ്പെടെ നിരവധി വിലയിരുത്തലുകളിൽ, ഇത് കുറേകൂടി വലിയ മോഡൽ ആയ GPT‑5.4‑ ന്‍റെ പ്രകടനത്തിന് അടുത്തെത്തുകയും ചെയ്യുന്നു.

GPT‑5.4 nano ഏറ്റവും ചെറിയതും ചെലവ് കുറഞ്ഞതുമായ പതിപ്പാണ്, വേഗതയും ചെലവും പ്രധാനമായ ടാസ്കുകൾക്കായി ഇത് അനുയോജ്യമാണ്. ഇത് GPT‑5 nano-യില്‍ നിന്നുമുള്ള വലിയ അപ്‌ഗ്രേഡ് കൂടിയാണ്. വർഗ്ഗീകരണം, ഡാറ്റ എക്സ്ട്രാക്ഷൻ, റാങ്കിംഗ്, ലളിതമായ സഹായ ടാസ്കുകൾ കൈകാര്യം ചെയ്യുന്ന കോഡിംഗ് സബ്‌ഏജന്റുകൾക്കായി ഇത് ഞങ്ങൾ ശുപാർശ ചെയ്യുന്നു.

ഈ മോഡലുകൾ ലേറ്റൻസി നേരിട്ട് ഉൽപ്പന്ന അനുഭവത്തെ സ്വാധീനിക്കുന്ന തരം വർക്ക്‌ലോഡുകൾക്കായാണ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്: പ്രതികരണക്ഷമതയുള്ള കോഡിംഗ് അസിസ്റ്റന്റുകൾ, വേഗത്തിൽ സഹായക ടാസ്കുകൾ പൂർത്തിയാക്കുന്ന സബ്-ഏജന്റുകൾ, സ്ക്രീൻഷോട്ടുകൾ എടുക്കുകയും അവ വ്യാഖ്യാനിക്കുകയും ചെയ്യുന്ന കമ്പ്യൂട്ടർ-ഉപയോഗ സിസ്റ്റങ്ങൾ, കൂടാതെ തത്സമയം ചിത്രങ്ങളെ അടിസ്ഥാനമാക്കി റീസൺ ചെയ്യാൻ കഴിയുന്ന മൾട്ടിമോഡൽ ആപ്ലിക്കേഷനുകൾ. ഈ ക്രമീകരണങ്ങളിൽ, മികച്ച മോഡൽ പലപ്പോഴും ഏറ്റവും വലുത് ആകണമെന്നില്ല—വേഗത്തിൽ പ്രതികരിക്കാനും, ഉപകരണങ്ങൾ വിശ്വസനീയമായി ഉപയോഗിക്കാനും, സങ്കീർണ്ണമായ പ്രൊഫഷണൽ ടാസ്കുകളിൽ മികച്ച പ്രകടനം കാഴ്ചവെക്കാനും കഴിയുന്ന ഒന്നാണ് മികച്ചു നില്‍ക്കുക.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 GPT‑5 mini ന് ലഭ്യമായ ഏറ്റവും ഉയർന്ന reasoning_effort 'high' ആണ്.}

GPT‑5.4 mini-യും nano-യും തങ്ങളുടെ വർക്ക്‌ഫ്ലോകളിൽ പരീക്ഷിച്ച ഉപഭോക്താക്കളുടെ അഭിപ്രായങ്ങൾ ഇതാണ്:

“GPT-5.4 mini ഈ ക്ലാസിലെ ഒരു മോഡൽ എന്ന നിലയില്‍ നോക്കിയാല്‍ ശക്തമായ എൻഡ്-ടു-എൻഡ് പ്രകടനം നൽകുന്നു. ഞങ്ങളുടെ മൂല്യനിർണ്ണയങ്ങളിൽ, പല ഔട്ട്പുട്ട് ടാസ്കുകളിലും സൈറ്റേഷൻ റികോളിലും വളരെ കുറഞ്ഞ ചെലവിൽ ഇത് മത്സരാത്മക മോഡൽ പ്രകടനം കാഴ്ചവച്ചു. ഇത് വലിയ GPT-5.4 മോഡലിനെക്കാൾ ഉയർന്ന end-to-end പാസ് നിരക്കുകളും കൂടുതൽ ശക്തമായ സോഴ്‌സ് അട്രിബ്യൂഷനും കൈവരിച്ചു."

— ആഭാസ് ശർമ്മ, Hebbiaയിലെ ചീഫ് ടെക്നോളജി ഓഫീസർ

കോഡിംഗ്

GPT‑5.4 mini-യും nano-യും വേഗത്തിലുള്ള ആവർത്തനങ്ങളിൽ നിന്ന് പ്രയോജനം ലഭിക്കുന്ന കോഡിംഗ് വർക്ക്‌ഫ്ലോകളിൽ പ്രത്യേകിച്ചും ഫലപ്രദമാണ്. മോഡലുകൾ ലക്ഷ്യബോധമുള്ള എഡിറ്റുകൾ, കോഡ്ബേസ് നാവിഗേഷൻ, ഫ്രണ്ട്-എൻഡ് ജനറേഷൻ, കുറഞ്ഞ ലേറ്റൻസിയോടെ ഡീബഗ്ഗിംഗ് ലൂപ്പുകൾ എന്നിവ കൈകാര്യം ചെയ്യുന്നു. അതിനാൽ കൂടുതൽ വേഗത്തിലും കുറഞ്ഞ ചെലവിലും പൂർത്തിയാക്കേണ്ട കോഡിംഗ് ടാസ്കുകൾക്ക് ഇവ ശക്തമായൊരു പരിഹാരമാണ്.

സമാനമായ ലാറ്റൻസികളിൽ ബെഞ്ച്മാർക്കുകളിൽ, GPT‑5.4 mini, GPT‑5‑mini നെ സ്ഥിരമായി മറികടക്കുകയും GPT‑5.4‑ന്‍റെ തലത്തിന് അടുത്തെത്തുകയും ചെയ്യുന്നു വളരെ വേഗത്തിൽ പ്രവർത്തിക്കുമ്പോഴും പാസ് നിരക്കുകൾ നിലനിർത്തിക്കൊണ്ട്, കോഡിംഗ് വർക്ക്‌ഫ്ലോകൾക്കായി പ്രകടനം-പ്രതി-ലാറ്റൻസി ട്രേഡ്ഓഫുകളിൽ ഏറ്റവും ശക്തമായ ഒന്നായി മാറുന്നു.

ഞങ്ങളുടെ മോഡലുകളുടെ പ്രൊഡക്ഷൻ പെരുമാറ്റം പരിശോധിച്ചും, ഇത് ഓഫ്‌ലൈനായി സിമുലേറ്റ് ചെയ്തും ഞങ്ങൾ ലേറ്റൻസി കണക്കാക്കുന്നു. ടൂൾ കോൾ ദൈർഘ്യം (കോഡ് നിർവഹണ സമയം), സാമ്പിൾ ചെയ്ത ടോക്കണുകൾ, ഇൻപുട്ട് ടോക്കണുകൾ എന്നിവ കണക്കിലെടുത്താണ് ലാറ്റൻസി കണക്കുകൂട്ടല്‍ നടത്തുന്നത് . യഥാർത്ഥ ലോക ലേറ്റൻസി ഗണ്യമായി വ്യത്യാസപ്പെടാം, മാത്രമല്ല അത് ഞങ്ങളുടെ സിമുലേഷനിൽ ഉൾക്കൊള്ളാത്ത നിരവധി ഘടകങ്ങളെ ആശ്രയിച്ചിരിക്കുന്നു. അതുപോലെ, ഇത് എഴുതുന്ന സമയത്തെ ഈ മോഡലുകളുടെ API വിലനിർണ്ണയത്തെ അടിസ്ഥാനമാക്കി ചെലവുകൾ കണക്കാക്കപ്പെടുന്നു. ചെലവുകൾ ഭാവിയിൽ മാറാം. റീസണിംഗ് ശ്രമങ്ങൾ താഴ്ന്നതിൽ നിന്ന് ഉയർന്നതിലേക്ക് ഉയർത്തി.

സബ്‌എജന്റുകൾ

വ്യത്യസ്ത വലുപ്പങ്ങളുള്ള മോഡലുകൾ സംയോജിപ്പിക്കുന്ന സിസ്റ്റങ്ങളിലേക്കും GPT‑5.4 mini മികച്ച ഒരു തിരഞ്ഞെടുപ്പായിരിക്കും. ഉദാഹരണത്തിന്, Codex-ൽ, GPT‑5.4 പോലെയുള്ള ഒരു വലിയ മോഡലിന് പ്ലാനിംഗ്, കോർഡിനേഷൻ, അന്തിമ വിധിനിർണയം എന്നിവ കൈകാര്യം ചെയ്യാൻ കഴിയും, അതേസമയം കൂടുതൽ പരിമിതമായ ഉപടാസ്കുകൾ സമാന്തരമായി കൈകാര്യം ചെയ്യുന്ന ചുമതലകൾ GPT‑5.4 mini സബ്‌ഏജന്റുകളെ ഏൽപ്പിക്കാനും കഴിയും—ഉദാഹരണത്തിന്, ഒരു കോഡ്ബേസ് തിരയുക, ഒരു വലിയ ഫയൽ റിവ്യൂ ചെയ്യുക, അല്ലെങ്കിൽ സപ്പോര്‍ട്ടിംഗ് ഡോക്യുമെന്റുകള്‍ പ്രോസസ് ചെയ്യുക തുടങ്ങിയ ചുമതലകള്‍. ഡോക്യുമെന്റുകളിൽ⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) നിന്നും Codex-ൽ സബ്‌എജന്റുകൾ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് പഠിക്കുക.

ചെറിയ മോഡൽ കൂടുതൽ വേഗതയേറിയതും കൂടുതൽ കഴിവുള്ളതുമായതോടെ, ഈ മാതൃക കൂടുതൽ ഉപയോഗപ്രദമാകുന്നു. എല്ലാത്തിനും ഒരു മോഡൽ ഉപയോഗിക്കുന്നതിനുപകരം, എന്തുചെയ്യണമെന്ന് വലിയ മോഡലുകൾ തീരുമാനിക്കുകയും ചെറിയ മോഡലുകൾ അവ വലിയ തോതിലും വേഗത്തിലും നടപ്പാക്കുകയും ചെയ്യുന്ന വിധത്തില്‍ സിസ്റ്റങ്ങൾ ഡെവലപ്പർമാർക്ക് സംയോജിപ്പിക്കാൻ കഴിയും. GPT‑5.4 mini ആ സ്റ്റൈലിലുള്ള വർക്ക്‌ഫ്ലോയ്ക് വേണ്ടിയുള്ള ഞങ്ങളുടെ ഇതുവരെ ഉള്ളതിൽ ഏറ്റവും ശക്തമായ മിനി മോഡൽ ആണ്.

കമ്പ്യൂട്ടർ ഉപയോഗം

GPT‑5.4 mini മൾട്ടിമോഡൽ ടാസ്‌ക്കുകളിലും, പ്രത്യേകിച്ച് കമ്പ്യൂട്ടർ ഉപയോഗവുമായി ബന്ധപ്പെട്ടവയിലും, മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു. മോഡലിന് ആഴമുള്ള ഉപയോക്തൃ ഇന്റർഫേസുകളുടെ സ്ക്രീൻഷോട്ടുകൾ വേഗത്തിൽ വ്യാഖ്യാനിച്ച് അതിവേഗത്തിൽ കമ്പ്യൂട്ടർ ഉപയോഗ ടാസ്കുകൾ പൂർത്തിയാക്കാൻ കഴിയും. OSWorld-Verified ൽ, GPT‑5.4 mini, GPT‑5.4‑ന് അടുത്തെത്തുകയും GPT‑5 mini-യേ ഗണ്യമായ തോതില്‍ മറികടക്കുകയും ചെയ്യുന്നു.

ലഭ്യതയും വിലനിർണ്ണയം

GPT‑5.4 mini ഇപ്പോള്‍ API, Codex, ChatGPT എന്നിവയിൽ ലഭ്യമാണ്.

API യിൽ, GPT‑5.4 mini ടെക്സ്റ്റ്, ചിത്ര ഇൻപുട്ടുകൾ, ടൂൾ ഉപയോഗം, ഫംഗ്ഷൻ കോളിംഗ്, വെബ് തിരയൽ, ഫയൽ തിരയൽ, കമ്പ്യൂട്ടർ ഉപയോഗം, സ്കിൽസുകൾ എന്നിവ പിന്തുണയ്ക്കുന്നു. ഇതിന് 400k കോൺടെക്സ്റ്റ് വിൻഡോ ഉണ്ട്, കൂടാതെ 1M ഇൻപുട്ട് ടോക്കൺ-കൾക്ക് $0.75 ഉം 1M ഔട്ട്പുട്ട് ടോക്കൺ-കൾക്ക് $4.50 ഉം ചെലവാകും.

Codex പരിഗണിച്ചാല്‍, Codex ആപ്പ്, CLI, IDE വിപുലീകരണം, വെബ് എന്നിവയിലുടനീളം GPT‑5.4 mini ലഭ്യമാണ്. ഇത് GPT‑5.4‑ന്റെ 30% മാത്രം ക്വോട്ട ഉപയോഗിക്കുന്നത് ഡെവലപ്പർമാർക്ക് Codex-ൽ ലളിതമായ കോഡിംഗ് ജോലികൾ ഏകദേശം മൂന്നിലൊന്ന് മാത്രം ചെലവിൽ വേഗത്തിൽ കൈകാര്യം ചെയ്യാൻ സഹായിക്കുന്നു. Codex-ന് GPT‑5.4 mini സബ്‌ഏജന്റുകളിലേക്കും ചുമതലകൾ ഏൽപ്പിക്കാം; കുറച്ച് റീസണിംഗ് ആവശ്യമായ ജോലികൾ കുറഞ്ഞ ചെലവുള്ള മോഡലിൽ പ്രവർത്തിക്കും.

ChatGPT‑ൽ, GPT‑5.4 mini + മെനുവിലെ “Thinking” ഫീച്ചർ വഴി Free, Go ഉപയോക്താക്കൾക്ക് ലഭ്യമാണ്. മറ്റെല്ലാ ഉപയോക്താക്കൾക്കും, GPT‑5.4 ന്‍റെ റേറ്റ് ലിമിറ്റ് ഫാൾബാക്കായി GPT‑5.4 mini ലഭ്യമാണ് Thinking.

GPT‑5.4 nano API-ൽ മാത്രമേ ലഭ്യമാകൂ, കൂടാതെ 1M ഇൻപുട്ട് ടോക്കൺ-കൾക്ക് $0.20 ഉം 1M ഔട്ട്പുട്ട് ടോക്കൺ-കൾക്ക് $1.25 ഉം ചെലവാകും.

മോഡലുകളുടെ സുരക്ഷാ നടപടികളെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്കായി, ഞങ്ങളുടെ വിന്യാസ സുരക്ഷാ ഹബ്⁠(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)-ലെ സിസ്റ്റം കാർഡ് അനുബന്ധം പരിശോധിക്കുക.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%

^{1 GPT‑5 mini ന് ലഭ്യമായ ഏറ്റവും ഉയർന്ന reasoning_effort 'high' ആണ്.}

^{2 മൊത്തത്തിലുള്ള എഡിറ്റ് ഡിസ്റ്റൻസ്. കുറഞ്ഞ ചെലവും കുറഞ്ഞ ലേറ്റൻസിയും ഉള്ള പ്രകടനം പ്രതിഫലിപ്പിക്കുന്നതിനായി, `reasoning_effort` `'none'` ആയി സജ്ജീകരിച്ച് OmniDocBench പ്രവർത്തിപ്പിച്ചു.}

2026

രചയിതാവ്

OpenAI

വായന തുടരുക

എല്ലാം കാണുക

Launching Health in ChatGPT

Product2026 ജൂലൈ 23

How news organizations are using AI > Card Image

വാർത്താ സ്ഥാപനങ്ങളുടെ ദൗത്യങ്ങളിൽ AI-യുടെ പങ്ക്

കമ്പനി2026 ജൂലൈ 22

OpenAI Presence അവതരിപ്പിക്കുന്നു

Product2026 ജൂലൈ 22