ఈ రోజు, మేము GPT‑5.4 mini మరియు nanoలను విడుదల చేస్తున్నాము, ఇవి ఇప్పటి వరకు మా అత్యంత సామర్థ్యవంతమైన చిన్న మోడల్స్. GPT‑5.4 యొక్క అనేక బలాలను వేగవంతమైన మరియు అధిక సామర్థ్యం కలిగిన మోడల్స్కు తీసుకువస్తాయి, ఇవి అధిక వాల్యూం వర్క్లోడ్స్ కోసం రూపొందించబడ్డాయి.
GPT‑5.4 mini కోడింగ్, రిజనింగ్, మల్టీమోడల్ అవగాహన, మరియు టూల్ వినియోగంలో GPT‑5 mini కంటే గణనీయంగా మెరుగుపడుతుంది, అలాగే 2x కంటే ఎక్కువ వేగంగా నడుస్తుంది. ఇది SWE-Bench Pro మరియు OSWorld-Verified వంటి అనేక ఈవాల్యుయేషన్స్లో పెద్ద GPT‑5.4 మోడల్ పనితీరుకు కూడా దగ్గరగా చేరుతుంది.
GPT‑5.4 nano అనేది స్పీడ్ మరియు ఖర్చు అత్యంత ముఖ్యమైన టాస్క్స్ కోసం GPT‑5.4 యొక్క అత్యంత చిన్నది మరియు చవకైన వెర్షన్. ఇది GPT‑5 nano కంటే గణనీయమైన అప్గ్రేడ్ కూడా. క్లాసిఫికేషన్, డేటా ఎక్స్ట్రాక్షన్, ర్యాంకింగ్ మరియు సింపుల్ సపోర్టింగ్ టాస్క్స్ను హ్యాండిల్ చేసే కోడింగ్ సబ్ఏజెంట్స్ కోసం మేము దీన్ని సిఫారసు చేస్తాము.
ఈ మోడల్స్, లేటెన్సీ నేరుగా ప్రోడక్ట్ అనుభవాన్ని ప్రభావితం చేసే వర్క్లోడ్స్ కోసం నిర్మించబడ్డాయి: రెస్పాన్సివ్గా అనిపించాల్సిన కోడింగ్ అసిస్టెంట్స్, త్వరగా సపోర్టింగ్ టాస్క్స్ పూర్తి చేసే సబ్ఏజెంట్స్, స్క్రీన్షాట్స్ను క్యాప్చర్ చేసి అర్థం చేసుకునే కంప్యూటర్-యూజింగ్ సిస్టమ్స్, మరియు రియల్-టైమ్లో ఇమేజెస్పై రీజన్ చేయగల మల్టీమోడల్ అప్లికేషన్స్. ఈ సందర్భాల్లో, ఉత్తమ మోడల్ అనేది పెద్దదైనది కాకపోవచ్చు—త్వరగా స్పందించగల, టూల్స్ను నమ్మకంగా ఉపయోగించగల, మరియు క్లిష్టమైన ప్రొఫెషనల్ టాస్క్స్పై కూడా బాగా పనిచేసే మోడల్.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 GPT‑5 mini కోసం అందుబాటులో ఉన్న అత్యధిక reasoning_effort 'high'.
మా కస్టమర్లు తమ వర్క్ఫ్లోలలో GPT‑5.4 mini మరియు nano ను పరీక్షించిన తర్వాత ఏమనుకుంటున్నారో చూడండి:
"GPT-5.4 mini ఈ తరగతిలోని మోడల్కు బలమైన ఎండ్-టు-ఎండ్ పనితీరును అందిస్తుంది. మా ఎవాల్యుయేషన్స్లో, ఇది తక్కువ ఖర్చుతో అనేక అవుట్పుట్ టాస్క్స్ మరియు సిటేషన్ రీకాల్లో పోటీ మోడల్స్కు సమానంగా లేదా మెరుగ్గా పనిచేసింది. ఇది పెద్ద GPT-5.4 మోడల్ కంటే ఎక్కువ ఎండ్-టు-ఎండ్ పాస్ రేట్స్ మరియు బలమైన సోర్స్ అట్రిబ్యూషన్ను కూడా సాధించింది."
GPT‑5.4 mini మరియు nano ఫాస్ట్ ఇటరేషన్ వల్ల లాభపడే కోడింగ్ వర్క్ఫ్లోస్లో ప్రత్యేకంగా ప్రభావవంతంగా ఉంటాయి. ఈ మోడల్స్ టార్గెటెడ్ ఎడిట్స్, కోడ్బేస్ నావిగేషన్, ఫ్రంట్-ఎండ్ జనరేషన్, మరియు డీబగ్గింగ్ లూప్స్ను తక్కువ లేటెన్సీతో హ్యాండిల్ చేస్తాయి, దీంతో వేగంగా మరియు తక్కువ ఖర్చుతో పూర్తి చేయాల్సిన కోడింగ్ టాస్క్స్కు ఇవి బలమైన ఎంపికగా మారుతాయి.
బెంచ్మార్క్లలో, GPT‑5.4 mini సమానమైన లేటెన్సీలలో GPT‑5‑mini కంటే స్థిరంగా మెరుగ్గా పనిచేస్తుంది మరియు GPT‑5.4‑స్థాయి కి దగ్గరౌతుంది చాలా వేగంగా రన్ అవుతూనే పాస్ రేట్లను నిలుపుకుంటూ, కోడింగ్ వర్క్ఫ్లోల కోసం పెర్ఫార్మెన్స్-పర్-లేటెన్సీ ట్రేడ్ఆఫ్లలో అత్యంత బలమైన వాటిలో ఒకటిని అందిస్తోంది.
మేము మా మోడల్స్ ప్రొడక్షన్ బిహేవియర్ను పరిశీలించి, దీనిని ఆఫ్లైన్లో సిమ్యులేట్ చేసి లేటెన్సీని అంచనా వేస్తాము. లేటెన్సీ అంచనా టూల్ కాల్ డ్యూరేషన్ (కోడ్ ఎగ్జిక్యూషన్ టైమ్), సాంపిల్డ్ టోకెన్స్ మరియు ఇన్పుట్ టోకెన్స్ను పరిగణనలోకి తీసుకుంటుంది. నిజ జీవిత లేటెన్సీ గణనీయంగా మారవచ్చు, మరియు మా సిమ్యులేషన్లో పట్టుకోని అనేక అంశాలపై ఆధారపడుతుంది. అలాగే, ఈ మోడల్స్కు సంబంధించిన API ప్రైసింగ్ ఆధారంగా ఖర్చులు అంచనా వేయబడ్డాయి. భవిష్యత్తులో ఖర్చులు మారవచ్చు. రీజనింగ్ ఎఫర్ట్స్ను low నుంచి xhigh వరకు స్వీప్ చేశారు.
GPT‑5.4 mini వివిధ సైజుల మోడల్స్ను కలిపే సిస్టమ్స్కు కూడా బలమైన ఎంపిక. ఉదాహరణకు Codexలో, GPT‑5.4 వంటి పెద్ద మోడల్ ప్లానింగ్, కోఆర్డినేషన్ మరియు ఫైనల్ జడ్జ్మెంట్ను హ్యాండిల్ చేస్తుంది, అదే సమయంలో చిన్న సబ్టాస్క్స్ను ప్యారలల్గా నిర్వహించే GPT‑5.4 mini సబ్ఏజెంట్స్కు డెలిగేట్ చేస్తుంది—ఉదాహరణకు కోడ్బేస్ సెర్చ్ చేయడం, పెద్ద ఫైల్ రివ్యూ చేయడం, లేదా సపోర్టింగ్ డాక్యుమెంట్స్ ప్రాసెస్ చేయడం. Codexలో సబ్ఏజెంట్స్ ఎలా పనిచేస్తాయో తెలుసుకోవడానికి docs(కొత్త విండోలో తెరుచుకుంటుంది)ను చూడండి.
చిన్న మోడల్ మరింత వేగవంతంగా మరియు మరింత సామర్థ్యవంతంగా మారుతున్న కొద్దీ, ఈ ప్యాటర్న్ మరింత ఉపయోగకరంగా మారుతుంది. అన్నింటికీ ఒకే మోడల్ని ఉపయోగించకుండా, డెవలపర్లు పెద్ద మోడల్స్ ఏం చేయాలో నిర్ణయించేలా మరియు చిన్న మోడల్స్ స్కేల్లో త్వరగా అమలు చేసేలా సిస్టమ్లను కూర్చగలరు. GPT‑5.4 mini ఆ స్టైల్ వర్క్ఫ్లో కోసం మా దగ్గర ఇప్పటివరకు వచ్చిన అత్యంత శక్తివంతమైన mini మోడల్.
GPT‑5.4 mini మల్టీమోడల్ పనుల్లో కూడా బలంగా ఉంది, ప్రత్యేకించి కంప్యూటర్ వినియోగానికి సంబంధించిన వాటిలో. మోడల్ ఘనమైన యూజర్ ఇంటర్ఫేస్ల స్క్రీన్షాట్లను త్వరగా అర్థం చేసుకుని, వేగంగా కంప్యూటర్ వినియోగ పనులను పూర్తి చేయగలదు. OSWorld-Verifiedలో, GPT‑5.4 mini GPT‑5.4కు చేరువవుతుండగా, GPT‑5 mini కంటే గణనీయంగా మెరుగైన పనితీరును ప్రదర్శిస్తోంది.
GPT‑5.4 mini ఈరోజు API, Codex, మరియు ChatGPTలో అందుబాటులో ఉంది.
APIలో, GPT‑5.4 mini టెక్స్ట్ మరియు ఇమేజ్ ఇన్పుట్లు, టూల్ వినియోగం, ఫంక్షన్ కాలింగ్, వెబ్ శోధన, ఫైల్ శోధన, కంప్యూటర్ వినియోగం, మరియు నైపుణ్యాలను సపోర్ట్ చేస్తుంది. దీనికి 400k కాంటెక్స్ట్ విండో ఉంది మరియు 1M ఇన్పుట్ టోకెన్లకు $0.75 మరియు 1M అవుట్పుట్ టోకెన్లకు $4.50 ఖర్చు అవుతుంది.
Codexలో, GPT‑5.4 mini Codex app, CLI, IDE ఎక్స్టెన్షన్ మరియు webలో అందుబాటులో ఉంది. ఇది GPT‑5.4 యొక్క కేవలం 30% మాత్రమే ఉపయోగిస్తుంది quota వల్ల, డెవలపర్స్ Codexలో సింపుల్ కోడింగ్ టాస్క్స్ను సుమారు మూడో వంతు ఖర్చుతో వేగంగా పూర్తి చేయగలరు. తక్కువ రీజనింగ్ అవసరమైన పనులను చవకైన మోడల్పై నడిపేందుకు Codex, GPT‑5.4 mini సబ్ఏజెంట్స్కు డెలిగేట్ చేయగలదు.
ChatGPTలో, GPT‑5.4 mini + మెను లోని “Thinking” ఫీచర్ ద్వారా Free మరియు Go యూజర్లకు అందుబాటులో ఉంది. మిగతా అన్ని యూజర్ల కోసం, GPT‑5.4 కి రేట్ లిమిట్ వచ్చినప్పుడు ఉపయోగించే fallback గా GPT‑5.4 mini అందుబాటులో ఉంటుంది. Thinking.
GPT‑5.4 nano APIలో మాత్రమే అందుబాటులో ఉంటుంది మరియు ప్రతి 1M ఇన్పుట్ టోకెన్లకు $0.20 మరియు ప్రతి 1M అవుట్పుట్ టోకెన్లకు $1.25 ఖర్చవుతుంది.
మోడల్స్ యొక్క సేఫ్గార్డ్స్ గురించి మరింత సమాచారం కోసం మా డిప్లాయ్మెంట్ సేఫ్టీ హబ్(కొత్త విండోలో తెరుచుకుంటుంది)లోని సిస్టమ్ కార్డ్ అడెండమ్ను చూడండి.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 GPT‑5 mini కోసం అందుబాటులో ఉన్న అత్యధిక reasoning_effort 'high'.
2 ఓవరాల్ ఎడిట్ డిస్టెన్స్. OmniDocBench ను reasoning_effort ను 'none'గా సెట్ చేసి నడిపారు, ఇది తక్కువ ఖర్చు మరియు తక్కువ లేటెన్సీ పనితీరును ప్రతిబింబిస్తుంది.


