आज आम्ही GPT‑5.4 mini आणि nano रिलीज करत आहोत, आमची आतापर्यंतची सर्वात सक्षम लहान मॉडेल्स. ते उच्च-खंडाच्या वर्कलोड्ससाठी डिझाइन केलेल्या अधिक वेगवान, अधिक कार्यक्षम मॉडेल्समध्ये GPT‑5.4 मधील अनेक ताकदी आणतात.
GPT‑5.4 mini कोडिंग, रीझनिंग, मल्टीमोडल समज, आणि टूल वापर यांमध्ये GPT‑5 mini पेक्षा लक्षणीयरीत्या सुधारणा करते, आणि 2x पेक्षा जास्त वेगाने चालते. हे अनेक मूल्यमापनांमध्ये, SWE-Bench Pro आणि OSWorld-Verified यांसह, मोठ्या GPT‑5.4 मॉडेलच्या कामगिरीच्या जवळही जाते.
GPT‑5.4 nano ही GPT‑5.4 ची सर्वात छोटी, सर्वात स्वस्त आवृत्ती आहे, ज्या कामांमध्ये वेग आणि खर्चाला सर्वाधिक महत्त्व असते. हे GPT‑5 nanoच्या तुलनेतही एक महत्त्वपूर्ण अपग्रेड आहे. आम्ही वर्गीकरण, डेटा एक्स्ट्रॅक्शन, रँकिंग, आणि सोपी सहाय्यक कामे हाताळणाऱ्या कोडिंग सब-एजंट्ससाठी याची शिफारस करतो.
ही मॉडेल्स अशा प्रकारच्या वर्कलोड्ससाठी तयार केलेली आहेत जिथे लेटन्सी थेट उत्पादन अनुभव घडवते: प्रतिसादक्षम वाटणारे कोडिंग सहाय्यक, सहाय्यक कामे पटकन पूर्ण करणारे उप-एजंट्स, स्क्रीनशॉट्स कॅप्चर व त्यांचे अर्थ लावणारी संगणक-वापर प्रणाली, आणि रिअल-टाइममध्ये प्रतिमांवर रीझनिंग करू शकणारे मल्टिमोडल अनुप्रयोग. या सेटिंग्जमध्ये, सर्वोत्तम मॉडेल बर्याचदा सर्वात मोठे नसते—ते असे असते जे जलद प्रतिसाद देऊ शकते, साधने विश्वसनीयरीत्या वापरू शकते, आणि तरीही जटिल व्यावसायिक कामांवर चांगली कामगिरी करू शकते.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 GPT‑5 mini साठी उपलब्ध असलेला सर्वाधिक reasoning_effort 'high' आहे.
आमच्या ग्राहकांनी त्यांच्या वर्कफ्लोमध्ये GPT‑5.4 mini आणि nano चे परीक्षण केल्यानंतर त्यांना काय वाटते ते येथे आहे:
“GPT-5.4 mini या वर्गातील एका मॉडेलसाठी मजबूत एंड-टू-एंड कार्यक्षमता प्रदान करतो. आमच्या मूल्यमापनांमध्ये, अनेक आउटपुट कामांमध्ये आणि संदर्भ उद्धरणांची आठवण ठेवण्यात, त्याने स्पर्धात्मक मॉडेल्सइतकीच किंवा त्यापेक्षा चांगली कामगिरी केली आणि तीही खूपच कमी खर्चात. याने मोठ्या GPT-5.4 मॉडेलपेक्षा अधिक उच्च एंड-टू-एंड पास दर आणि अधिक मजबूत स्रोत अॅट्रिब्युशनही साध्य केले.
GPT‑5.4 mini आणि nano विशेषतः जलद पुनरावृत्तीचा फायदा होणाऱ्या कोडिंग वर्कफ्लोमध्ये प्रभावी आहेत. हे मॉडेल्स लक्षित संपादन, कोडबेस नेव्हिगेशन, फ्रंट-एंड जनरेशन आणि डिबगिंग लूप्स कमी विलंबात हाताळतात, ज्यामुळे ते जलद गतीने आणि कमी खर्चात पूर्ण करावयाच्या कोडिंग कामांसाठी उत्कृष्ट पर्याय ठरतात.
बेंचमार्कमध्ये, GPT‑5.4 mini सातत्याने समान विलंबांवर GPT‑5‑mini पेक्षा सातत्याने चांगले प्रदर्शन करते आणि GPT‑5.4 स्तराजवळ पोहोचते पास रेट्स राखत, खूप वेगाने चालत असतानाही, कोडिंग वर्कफ्लोजसाठी कामगिरी-विलंब संतुलनातील सर्वोत्तम पर्यायांपैकी एक प्रदान करते.
आम्ही आमच्या मॉडेल्सच्या प्रॉडक्शन वर्तनाकडे पाहून आणि हे ऑफलाइन सिम्युलेट करून लेटन्सीचा अंदाज लावतो. लेटन्सीचा अंदाज टूल कॉल कालावधी (कोड कार्यान्वयन वेळ), सॅम्पल केलेली टोकन, आणि इनपुट टोकन यांचा विचार करतो. वास्तविक जगातील लेटन्सीमध्ये मोठ्या प्रमाणावर फरक असू शकतो आणि आमच्या सिम्युलेशनमध्ये कॅप्चर न झालेल्या अनेक घटकांवर ते अवलंबून असते. त्याचप्रमाणे, हे लिहिताना या मॉडेल्सच्या API किंमतीच्या आधारावर खर्चाचा अंदाज लावला जातो. भविष्यात खर्च बदलू शकतात. रीझनिंग करण्याचे प्रयत्न low ते xhigh पर्यंत वाढवले गेले.
GPT‑5.4 mini हे वेगवेगळ्या आकारांची मॉडेल्स एकत्र करणाऱ्या प्रणालींसाठीही एक मजबूत पर्याय आहे. उदाहरणार्थ, Codex मध्ये GPT‑5.4 सारखे मोठे मॉडेल नियोजन, समन्वय आणि अंतिम निर्णय हाताळते, तर GPT‑5.4 mini सबएजंट्सना अधिक मर्यादित उपकार्ये समांतरपणे हाताळण्यासाठी प्रतिनिधी करते—जसे कोडबेसमध्ये शोध घेणे, मोठ्या फाइलचे पुनरावलोकन करणे किंवा सहाय्यक दस्तऐवज प्रक्रिया करणे. docs(नवीन विंडोमध्ये उघडेल) मध्ये Codex मधील सबएजंट कसे कार्य करतात ते शिका.
लहान मॉडेल अधिक जलद आणि अधिक सक्षम होत गेल्याने हा पॅटर्न अधिक उपयुक्त ठरतो. सर्व गोष्टींसाठी एकच मॉडेल वापरण्याऐवजी, विकसक अशी प्रणाली तयार करू शकतात जिथे मोठी मॉडेल्स काय करायचे ते ठरवतात आणि लहान मॉडेल्स मोठ्या प्रमाणात जलद अंमलात आणतात. GPT‑5.4 mini हे त्या प्रकारच्या वर्कफ्लो स्टाइलसाठी आमचे आतापर्यंतचे सर्वात सामर्थ्यवान मिनी मॉडेल आहे.
GPT‑5.4 mini मल्टिमोडल कार्यांमध्येही मजबूत आहे, विशेषतः कम्प्युटर वापराशी संबंधित कार्यांमध्ये. मॉडेल दाट युजर इंटरफेसचे स्क्रीनशॉट्स पटकन समजून घेऊ शकते, ज्यामुळे कम्प्युटर वापराची कार्ये वेगाने पूर्ण करता येतात. OSWorld-Verified वर, GPT‑5.4 mini हे GPT‑5.4 जवळ येते, तर GPT‑5 mini पेक्षा लक्षणीयरीत्या अधिक चांगली कामगिरी करते.
GPT‑5.4 mini आज API, Codex, आणि ChatGPT मध्ये उपलब्ध आहे.
API मध्ये, GPT‑5.4 mini टेक्स्ट आणि इमेज इनपुट्स, टूल वापर, फंक्शन कॉलिंग, वेब शोध, फाइल शोध, संगणक वापर, आणि कौशल्ये यांना समर्थन देते. यामध्ये 400k संदर्भ विंडो आहे आणि प्रति 1M इनपुट टोकन्ससाठी $0.75 (अमेरिकन डॉलर) आणि प्रति 1M आउटपुट टोकन्ससाठी $4.50 (अमेरिकन डॉलर) खर्च येतो.
Codex मध्ये, GPT‑5.4 mini हे Codex अॅप, CLI, IDE विस्तार आणि वेबवर सर्वत्र उपलब्ध आहे. ते GPT‑5.4 च्या फक्त 30% वापरते कोटा, ज्यामुळे डेव्हलपर्स Codex मध्ये सोपी कोडिंग कामे सुमारे एक-तृतीयांश खर्चात पटकन हाताळू शकतात. Codex GPT‑5.4 mini सबएजंट्सकडेही प्रतिनिधीकरण करू शकते, ज्यामुळे कमी रीझनिंग-इन्टेन्सिव्ह काम स्वस्त मॉडेलवर चालते.
ChatGPT मध्ये, GPT‑5.4 mini + मेनूमधील “विचार” वैशिष्ट्याद्वारे Free आणि Go वापरकर्त्यांसाठी उपलब्ध आहे. इतर सर्व वापरकर्त्यांसाठी, GPT‑5.4 mini हा GPT‑5.4 साठी रेट लिमिट फॉलबॅक म्हणून उपलब्ध आहे जागा घेत आहे.
GPT‑5.4 nano फक्त API मध्ये उपलब्ध आहे आणि प्रति 1M इनपुट टोकनसाठी $0.20 (16 रुपये) आणि प्रति 1M आउटपुट टोकनसाठी $1.25 (100 रुपये) खर्च येतो.
मॉडेलच्या सुरक्षात्मक उपायांबद्दल अधिक माहितीसाठी, कृपया आमच्या डिप्लॉयमेंट सेफ्टी हब(नवीन विंडोमध्ये उघडेल) वरील सिस्टम कार्ड परिशिष्ट पाहा.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 GPT‑5 mini साठी उपलब्ध असलेला सर्वाधिक reasoning_effort 'high' आहे.
2 एकूण एडिट डिस्टन्स. कमी खर्च, कमी लेटन्सी कामगिरी प्रतिबिंबित करण्यासाठी OmniDocBench `reasoning_effort` ला 'none' वर सेट करून चालवले गेले.


