ഇന്ന് ഞങ്ങൾ GPT‑5.4 mini, nano എന്നിവ പുറത്തിറക്കുന്നു, ഇതുവരെയുള്ളതിൽ ഏറ്റവും കഴിവുള്ള ഞങ്ങളുടെ ചെറിയ മോഡൽ. ഉയർന്ന വോളിയം വർക്ക്ലോഡുകൾക്കായി രൂപകൽപ്പന ചെയ്തിരിക്കുന്ന വേഗതയേറിയതും കൂടുതൽ കാര്യക്ഷമമായതുമായ മോഡലുകളിലേക്ക് GPT‑5.4 ന്റെ പല ശക്തികളെയും അവ കൊണ്ടുവരുന്നു.
GPT‑5.4 mini കോഡിംഗ്, റീസണിംഗ്, മൾട്ടിമോഡൽ മനസ്സിലാക്കൽ, ടൂൾ ഉപയോഗം എന്നിവയിൽ GPT‑5 mini-യേക്കാൾ ശ്രദ്ധേയമായ മികവ് പുലര്ത്തുന്നു, അതേസമയം 2x-ൽ കൂടുതല് വേഗത്തിലും പ്രവർത്തിക്കുന്നു. SWE-Bench Pro, OSWorld-Verified എന്നിവ ഉൾപ്പെടെ നിരവധി വിലയിരുത്തലുകളിൽ, ഇത് കുറേകൂടി വലിയ മോഡൽ ആയ GPT‑5.4‑ ന്റെ പ്രകടനത്തിന് അടുത്തെത്തുകയും ചെയ്യുന്നു.
GPT‑5.4 nano ഏറ്റവും ചെറിയതും ചെലവ് കുറഞ്ഞതുമായ പതിപ്പാണ്, വേഗതയും ചെലവും പ്രധാനമായ ടാസ്കുകൾക്കായി ഇത് അനുയോജ്യമാണ്. ഇത് GPT‑5 nano-യില് നിന്നുമുള്ള വലിയ അപ്ഗ്രേഡ് കൂടിയാണ്. വർഗ്ഗീകരണം, ഡാറ്റ എക്സ്ട്രാക്ഷൻ, റാങ്കിംഗ്, ലളിതമായ സഹായ ടാസ്കുകൾ കൈകാര്യം ചെയ്യുന്ന കോഡിംഗ് സബ്ഏജന്റുകൾക്കായി ഇത് ഞങ്ങൾ ശുപാർശ ചെയ്യുന്നു.
ഈ മോഡലുകൾ ലേറ്റൻസി നേരിട്ട് ഉൽപ്പന്ന അനുഭവത്തെ സ്വാധീനിക്കുന്ന തരം വർക്ക്ലോഡുകൾക്കായാണ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്: പ്രതികരണക്ഷമതയുള്ള കോഡിംഗ് അസിസ്റ്റന്റുകൾ, വേഗത്തിൽ സഹായക ടാസ്കുകൾ പൂർത്തിയാക്കുന്ന സബ്-ഏജന്റുകൾ, സ്ക്രീൻഷോട്ടുകൾ എടുക്കുകയും അവ വ്യാഖ്യാനിക്കുകയും ചെയ്യുന്ന കമ്പ്യൂട്ടർ-ഉപയോഗ സിസ്റ്റങ്ങൾ, കൂടാതെ തത്സമയം ചിത്രങ്ങളെ അടിസ്ഥാനമാക്കി റീസൺ ചെയ്യാൻ കഴിയുന്ന മൾട്ടിമോഡൽ ആപ്ലിക്കേഷനുകൾ. ഈ ക്രമീകരണങ്ങളിൽ, മികച്ച മോഡൽ പലപ്പോഴും ഏറ്റവും വലുത് ആകണമെന്നില്ല—വേഗത്തിൽ പ്രതികരിക്കാനും, ഉപകരണങ്ങൾ വിശ്വസനീയമായി ഉപയോഗിക്കാനും, സങ്കീർണ്ണമായ പ്രൊഫഷണൽ ടാസ്കുകളിൽ മികച്ച പ്രകടനം കാഴ്ചവെക്കാനും കഴിയുന്ന ഒന്നാണ് മികച്ചു നില്ക്കുക.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 GPT‑5 mini ന് ലഭ്യമായ ഏറ്റവും ഉയർന്ന reasoning_effort 'high' ആണ്.
GPT‑5.4 mini-യും nano-യും തങ്ങളുടെ വർക്ക്ഫ്ലോകളിൽ പരീക്ഷിച്ച ഉപഭോക്താക്കളുടെ അഭിപ്രായങ്ങൾ ഇതാണ്:
“GPT-5.4 mini ഈ ക്ലാസിലെ ഒരു മോഡൽ എന്ന നിലയില് നോക്കിയാല് ശക്തമായ എൻഡ്-ടു-എൻഡ് പ്രകടനം നൽകുന്നു. ഞങ്ങളുടെ മൂല്യനിർണ്ണയങ്ങളിൽ, പല ഔട്ട്പുട്ട് ടാസ്കുകളിലും സൈറ്റേഷൻ റികോളിലും വളരെ കുറഞ്ഞ ചെലവിൽ ഇത് മത്സരാത്മക മോഡൽ പ്രകടനം കാഴ്ചവച്ചു. ഇത് വലിയ GPT-5.4 മോഡലിനെക്കാൾ ഉയർന്ന end-to-end പാസ് നിരക്കുകളും കൂടുതൽ ശക്തമായ സോഴ്സ് അട്രിബ്യൂഷനും കൈവരിച്ചു."
GPT‑5.4 mini-യും nano-യും വേഗത്തിലുള്ള ആവർത്തനങ്ങളിൽ നിന്ന് പ്രയോജനം ലഭിക്കുന്ന കോഡിംഗ് വർക്ക്ഫ്ലോകളിൽ പ്രത്യേകിച്ചും ഫലപ്രദമാണ്. മോഡലുകൾ ലക്ഷ്യബോധമുള്ള എഡിറ്റുകൾ, കോഡ്ബേസ് നാവിഗേഷൻ, ഫ്രണ്ട്-എൻഡ് ജനറേഷൻ, കുറഞ്ഞ ലേറ്റൻസിയോടെ ഡീബഗ്ഗിംഗ് ലൂപ്പുകൾ എന്നിവ കൈകാര്യം ചെയ്യുന്നു. അതിനാൽ കൂടുതൽ വേഗത്തിലും കുറഞ്ഞ ചെലവിലും പൂർത്തിയാക്കേണ്ട കോഡിംഗ് ടാസ്കുകൾക്ക് ഇവ ശക്തമായൊരു പരിഹാരമാണ്.
സമാനമായ ലാറ്റൻസികളിൽ ബെഞ്ച്മാർക്കുകളിൽ, GPT‑5.4 mini, GPT‑5‑mini നെ സ്ഥിരമായി മറികടക്കുകയും GPT‑5.4‑ന്റെ തലത്തിന് അടുത്തെത്തുകയും ചെയ്യുന്നു വളരെ വേഗത്തിൽ പ്രവർത്തിക്കുമ്പോഴും പാസ് നിരക്കുകൾ നിലനിർത്തിക്കൊണ്ട്, കോഡിംഗ് വർക്ക്ഫ്ലോകൾക്കായി പ്രകടനം-പ്രതി-ലാറ്റൻസി ട്രേഡ്ഓഫുകളിൽ ഏറ്റവും ശക്തമായ ഒന്നായി മാറുന്നു.
ഞങ്ങളുടെ മോഡലുകളുടെ പ്രൊഡക്ഷൻ പെരുമാറ്റം പരിശോധിച്ചും, ഇത് ഓഫ്ലൈനായി സിമുലേറ്റ് ചെയ്തും ഞങ്ങൾ ലേറ്റൻസി കണക്കാക്കുന്നു. ടൂൾ കോൾ ദൈർഘ്യം (കോഡ് നിർവഹണ സമയം), സാമ്പിൾ ചെയ്ത ടോക്കണുകൾ, ഇൻപുട്ട് ടോക്കണുകൾ എന്നിവ കണക്കിലെടുത്താണ് ലാറ്റൻസി കണക്കുകൂട്ടല് നടത്തുന്നത് . യഥാർത്ഥ ലോക ലേറ്റൻസി ഗണ്യമായി വ്യത്യാസപ്പെടാം, മാത്രമല്ല അത് ഞങ്ങളുടെ സിമുലേഷനിൽ ഉൾക്കൊള്ളാത്ത നിരവധി ഘടകങ്ങളെ ആശ്രയിച്ചിരിക്കുന്നു. അതുപോലെ, ഇത് എഴുതുന്ന സമയത്തെ ഈ മോഡലുകളുടെ API വിലനിർണ്ണയത്തെ അടിസ്ഥാനമാക്കി ചെലവുകൾ കണക്കാക്കപ്പെടുന്നു. ചെലവുകൾ ഭാവിയിൽ മാറാം. റീസണിംഗ് ശ്രമങ്ങൾ താഴ്ന്നതിൽ നിന്ന് ഉയർന്നതിലേക്ക് ഉയർത്തി.
വ്യത്യസ്ത വലുപ്പങ്ങളുള്ള മോഡലുകൾ സംയോജിപ്പിക്കുന്ന സിസ്റ്റങ്ങളിലേക്കും GPT‑5.4 mini മികച്ച ഒരു തിരഞ്ഞെടുപ്പായിരിക്കും. ഉദാഹരണത്തിന്, Codex-ൽ, GPT‑5.4 പോലെയുള്ള ഒരു വലിയ മോഡലിന് പ്ലാനിംഗ്, കോർഡിനേഷൻ, അന്തിമ വിധിനിർണയം എന്നിവ കൈകാര്യം ചെയ്യാൻ കഴിയും, അതേസമയം കൂടുതൽ പരിമിതമായ ഉപടാസ്കുകൾ സമാന്തരമായി കൈകാര്യം ചെയ്യുന്ന ചുമതലകൾ GPT‑5.4 mini സബ്ഏജന്റുകളെ ഏൽപ്പിക്കാനും കഴിയും—ഉദാഹരണത്തിന്, ഒരു കോഡ്ബേസ് തിരയുക, ഒരു വലിയ ഫയൽ റിവ്യൂ ചെയ്യുക, അല്ലെങ്കിൽ സപ്പോര്ട്ടിംഗ് ഡോക്യുമെന്റുകള് പ്രോസസ് ചെയ്യുക തുടങ്ങിയ ചുമതലകള്. ഡോക്യുമെന്റുകളിൽ(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) നിന്നും Codex-ൽ സബ്എജന്റുകൾ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് പഠിക്കുക.
ചെറിയ മോഡൽ കൂടുതൽ വേഗതയേറിയതും കൂടുതൽ കഴിവുള്ളതുമായതോടെ, ഈ മാതൃക കൂടുതൽ ഉപയോഗപ്രദമാകുന്നു. എല്ലാത്തിനും ഒരു മോഡൽ ഉപയോഗിക്കുന്നതിനുപകരം, എന്തുചെയ്യണമെന്ന് വലിയ മോഡലുകൾ തീരുമാനിക്കുകയും ചെറിയ മോഡലുകൾ അവ വലിയ തോതിലും വേഗത്തിലും നടപ്പാക്കുകയും ചെയ്യുന്ന വിധത്തില് സിസ്റ്റങ്ങൾ ഡെവലപ്പർമാർക്ക് സംയോജിപ്പിക്കാൻ കഴിയും. GPT‑5.4 mini ആ സ്റ്റൈലിലുള്ള വർക്ക്ഫ്ലോയ്ക് വേണ്ടിയുള്ള ഞങ്ങളുടെ ഇതുവരെ ഉള്ളതിൽ ഏറ്റവും ശക്തമായ മിനി മോഡൽ ആണ്.
GPT‑5.4 mini മൾട്ടിമോഡൽ ടാസ്ക്കുകളിലും, പ്രത്യേകിച്ച് കമ്പ്യൂട്ടർ ഉപയോഗവുമായി ബന്ധപ്പെട്ടവയിലും, മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു. മോഡലിന് ആഴമുള്ള ഉപയോക്തൃ ഇന്റർഫേസുകളുടെ സ്ക്രീൻഷോട്ടുകൾ വേഗത്തിൽ വ്യാഖ്യാനിച്ച് അതിവേഗത്തിൽ കമ്പ്യൂട്ടർ ഉപയോഗ ടാസ്കുകൾ പൂർത്തിയാക്കാൻ കഴിയും. OSWorld-Verified ൽ, GPT‑5.4 mini, GPT‑5.4‑ന് അടുത്തെത്തുകയും GPT‑5 mini-യേ ഗണ്യമായ തോതില് മറികടക്കുകയും ചെയ്യുന്നു.
GPT‑5.4 mini ഇപ്പോള് API, Codex, ChatGPT എന്നിവയിൽ ലഭ്യമാണ്.
API യിൽ, GPT‑5.4 mini ടെക്സ്റ്റ്, ചിത്ര ഇൻപുട്ടുകൾ, ടൂൾ ഉപയോഗം, ഫംഗ്ഷൻ കോളിംഗ്, വെബ് തിരയൽ, ഫയൽ തിരയൽ, കമ്പ്യൂട്ടർ ഉപയോഗം, സ്കിൽസുകൾ എന്നിവ പിന്തുണയ്ക്കുന്നു. ഇതിന് 400k കോൺടെക്സ്റ്റ് വിൻഡോ ഉണ്ട്, കൂടാതെ 1M ഇൻപുട്ട് ടോക്കൺ-കൾക്ക് $0.75 ഉം 1M ഔട്ട്പുട്ട് ടോക്കൺ-കൾക്ക് $4.50 ഉം ചെലവാകും.
Codex പരിഗണിച്ചാല്, Codex ആപ്പ്, CLI, IDE വിപുലീകരണം, വെബ് എന്നിവയിലുടനീളം GPT‑5.4 mini ലഭ്യമാണ്. ഇത് GPT‑5.4‑ന്റെ 30% മാത്രം ക്വോട്ട ഉപയോഗിക്കുന്നത് ഡെവലപ്പർമാർക്ക് Codex-ൽ ലളിതമായ കോഡിംഗ് ജോലികൾ ഏകദേശം മൂന്നിലൊന്ന് മാത്രം ചെലവിൽ വേഗത്തിൽ കൈകാര്യം ചെയ്യാൻ സഹായിക്കുന്നു. Codex-ന് GPT‑5.4 mini സബ്ഏജന്റുകളിലേക്കും ചുമതലകൾ ഏൽപ്പിക്കാം; കുറച്ച് റീസണിംഗ് ആവശ്യമായ ജോലികൾ കുറഞ്ഞ ചെലവുള്ള മോഡലിൽ പ്രവർത്തിക്കും.
ChatGPT‑ൽ, GPT‑5.4 mini + മെനുവിലെ “Thinking” ഫീച്ചർ വഴി Free, Go ഉപയോക്താക്കൾക്ക് ലഭ്യമാണ്. മറ്റെല്ലാ ഉപയോക്താക്കൾക്കും, GPT‑5.4 ന്റെ റേറ്റ് ലിമിറ്റ് ഫാൾബാക്കായി GPT‑5.4 mini ലഭ്യമാണ് Thinking.
GPT‑5.4 nano API-ൽ മാത്രമേ ലഭ്യമാകൂ, കൂടാതെ 1M ഇൻപുട്ട് ടോക്കൺ-കൾക്ക് $0.20 ഉം 1M ഔട്ട്പുട്ട് ടോക്കൺ-കൾക്ക് $1.25 ഉം ചെലവാകും.
മോഡലുകളുടെ സുരക്ഷാ നടപടികളെക്കുറിച്ചുള്ള കൂടുതൽ വിവരങ്ങൾക്കായി, ഞങ്ങളുടെ വിന്യാസ സുരക്ഷാ ഹബ്(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു)-ലെ സിസ്റ്റം കാർഡ് അനുബന്ധം പരിശോധിക്കുക.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 GPT‑5 mini ന് ലഭ്യമായ ഏറ്റവും ഉയർന്ന reasoning_effort 'high' ആണ്.
2 മൊത്തത്തിലുള്ള എഡിറ്റ് ഡിസ്റ്റൻസ്. കുറഞ്ഞ ചെലവും കുറഞ്ഞ ലേറ്റൻസിയും ഉള്ള പ്രകടനം പ്രതിഫലിപ്പിക്കുന്നതിനായി, `reasoning_effort` `'none'` ആയി സജ്ജീകരിച്ച് OmniDocBench പ്രവർത്തിപ്പിച്ചു.


