१७ मार्च, २०२६

GPT‑5.4 mini आणि nano सादर करत आहोत

कोडिंग आणि उपएजंट्ससाठी अनुकूलित वेगवान आणि कार्यक्षम मॉडेल

लोड होत आहे...

आज आम्ही GPT‑5.4 mini आणि nano रिलीज करत आहोत, आमची आतापर्यंतची सर्वात सक्षम लहान मॉडेल्स. ते उच्च-खंडाच्या वर्कलोड्ससाठी डिझाइन केलेल्या अधिक वेगवान, अधिक कार्यक्षम मॉडेल्समध्ये GPT‑5.4 मधील अनेक ताकदी आणतात.

GPT‑5.4 mini कोडिंग, रीझनिंग, मल्टीमोडल समज, आणि टूल वापर यांमध्ये GPT‑5 mini पेक्षा लक्षणीयरीत्या सुधारणा करते, आणि 2x पेक्षा जास्त वेगाने चालते. हे अनेक मूल्यमापनांमध्ये, SWE-Bench Pro आणि OSWorld-Verified यांसह, मोठ्या GPT‑5.4 मॉडेलच्या कामगिरीच्या जवळही जाते.

GPT‑5.4 nano ही GPT‑5.4 ची सर्वात छोटी, सर्वात स्वस्त आवृत्ती आहे, ज्या कामांमध्ये वेग आणि खर्चाला सर्वाधिक महत्त्व असते. हे GPT‑5 nanoच्या तुलनेतही एक महत्त्वपूर्ण अपग्रेड आहे. आम्ही वर्गीकरण, डेटा एक्स्ट्रॅक्शन, रँकिंग, आणि सोपी सहाय्यक कामे हाताळणाऱ्या कोडिंग सब-एजंट्ससाठी याची शिफारस करतो.

ही मॉडेल्स अशा प्रकारच्या वर्कलोड्ससाठी तयार केलेली आहेत जिथे लेटन्सी थेट उत्पादन अनुभव घडवते: प्रतिसादक्षम वाटणारे कोडिंग सहाय्यक, सहाय्यक कामे पटकन पूर्ण करणारे उप-एजंट्स, स्क्रीनशॉट्स कॅप्चर व त्यांचे अर्थ लावणारी संगणक-वापर प्रणाली, आणि रिअल-टाइममध्ये प्रतिमांवर रीझनिंग करू शकणारे मल्टिमोडल अनुप्रयोग. या सेटिंग्जमध्ये, सर्वोत्तम मॉडेल बर्‍याचदा सर्वात मोठे नसते—ते असे असते जे जलद प्रतिसाद देऊ शकते, साधने विश्वसनीयरीत्या वापरू शकते, आणि तरीही जटिल व्यावसायिक कामांवर चांगली कामगिरी करू शकते.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 GPT‑5 mini साठी उपलब्ध असलेला सर्वाधिक reasoning_effort 'high' आहे.}

आमच्या ग्राहकांनी त्यांच्या वर्कफ्लोमध्ये GPT‑5.4 mini आणि nano चे परीक्षण केल्यानंतर त्यांना काय वाटते ते येथे आहे:

“GPT-5.4 mini या वर्गातील एका मॉडेलसाठी मजबूत एंड-टू-एंड कार्यक्षमता प्रदान करतो. आमच्या मूल्यमापनांमध्ये, अनेक आउटपुट कामांमध्ये आणि संदर्भ उद्धरणांची आठवण ठेवण्यात, त्याने स्पर्धात्मक मॉडेल्सइतकीच किंवा त्यापेक्षा चांगली कामगिरी केली आणि तीही खूपच कमी खर्चात. याने मोठ्या GPT-5.4 मॉडेलपेक्षा अधिक उच्च एंड-टू-एंड पास दर आणि अधिक मजबूत स्रोत अ‍ॅट्रिब्युशनही साध्य केले.

— आभास शर्मा, हेबिया येथील मुख्य तंत्र अधिकारी

कोडिंग

GPT‑5.4 mini आणि nano विशेषतः जलद पुनरावृत्तीचा फायदा होणाऱ्या कोडिंग वर्कफ्लोमध्ये प्रभावी आहेत. हे मॉडेल्स लक्षित संपादन, कोडबेस नेव्हिगेशन, फ्रंट-एंड जनरेशन आणि डिबगिंग लूप्स कमी विलंबात हाताळतात, ज्यामुळे ते जलद गतीने आणि कमी खर्चात पूर्ण करावयाच्या कोडिंग कामांसाठी उत्कृष्ट पर्याय ठरतात.

बेंचमार्कमध्ये, GPT‑5.4 mini सातत्याने समान विलंबांवर GPT‑5‑mini पेक्षा सातत्याने चांगले प्रदर्शन करते आणि GPT‑5.4 स्तराजवळ पोहोचते पास रेट्स राखत, खूप वेगाने चालत असतानाही, कोडिंग वर्कफ्लोजसाठी कामगिरी-विलंब संतुलनातील सर्वोत्तम पर्यायांपैकी एक प्रदान करते.

आम्ही आमच्या मॉडेल्सच्या प्रॉडक्शन वर्तनाकडे पाहून आणि हे ऑफलाइन सिम्युलेट करून लेटन्सीचा अंदाज लावतो. लेटन्सीचा अंदाज टूल कॉल कालावधी (कोड कार्यान्वयन वेळ), सॅम्पल केलेली टोकन, आणि इनपुट टोकन यांचा विचार करतो. वास्तविक जगातील लेटन्सीमध्ये मोठ्या प्रमाणावर फरक असू शकतो आणि आमच्या सिम्युलेशनमध्ये कॅप्चर न झालेल्या अनेक घटकांवर ते अवलंबून असते. त्याचप्रमाणे, हे लिहिताना या मॉडेल्सच्या API किंमतीच्या आधारावर खर्चाचा अंदाज लावला जातो. भविष्यात खर्च बदलू शकतात. रीझनिंग करण्याचे प्रयत्न low ते xhigh पर्यंत वाढवले गेले.

उप-एजंट्स

GPT‑5.4 mini हे वेगवेगळ्या आकारांची मॉडेल्स एकत्र करणाऱ्या प्रणालींसाठीही एक मजबूत पर्याय आहे. उदाहरणार्थ, Codex मध्ये GPT‑5.4 सारखे मोठे मॉडेल नियोजन, समन्वय आणि अंतिम निर्णय हाताळते, तर GPT‑5.4 mini सबएजंट्सना अधिक मर्यादित उपकार्ये समांतरपणे हाताळण्यासाठी प्रतिनिधी करते—जसे कोडबेसमध्ये शोध घेणे, मोठ्या फाइलचे पुनरावलोकन करणे किंवा सहाय्यक दस्तऐवज प्रक्रिया करणे. docs⁠(नवीन विंडोमध्ये उघडेल) मध्ये Codex मधील सबएजंट कसे कार्य करतात ते शिका.

लहान मॉडेल अधिक जलद आणि अधिक सक्षम होत गेल्याने हा पॅटर्न अधिक उपयुक्त ठरतो. सर्व गोष्टींसाठी एकच मॉडेल वापरण्याऐवजी, विकसक अशी प्रणाली तयार करू शकतात जिथे मोठी मॉडेल्स काय करायचे ते ठरवतात आणि लहान मॉडेल्स मोठ्या प्रमाणात जलद अंमलात आणतात. GPT‑5.4 mini हे त्या प्रकारच्या वर्कफ्लो स्टाइलसाठी आमचे आतापर्यंतचे सर्वात सामर्थ्यवान मिनी मॉडेल आहे.

कम्प्युटर वापर

GPT‑5.4 mini मल्टिमोडल कार्यांमध्येही मजबूत आहे, विशेषतः कम्प्युटर वापराशी संबंधित कार्यांमध्ये. मॉडेल दाट युजर इंटरफेसचे स्क्रीनशॉट्स पटकन समजून घेऊ शकते, ज्यामुळे कम्प्युटर वापराची कार्ये वेगाने पूर्ण करता येतात. OSWorld-Verified वर, GPT‑5.4 mini हे GPT‑5.4 जवळ येते, तर GPT‑5 mini पेक्षा लक्षणीयरीत्या अधिक चांगली कामगिरी करते.

उपलब्धता व किंमत

GPT‑5.4 mini आज API, Codex, आणि ChatGPT मध्ये उपलब्ध आहे.

API मध्ये, GPT‑5.4 mini टेक्स्ट आणि इमेज इनपुट्स, टूल वापर, फंक्शन कॉलिंग, वेब शोध, फाइल शोध, संगणक वापर, आणि कौशल्ये यांना समर्थन देते. यामध्ये 400k संदर्भ विंडो आहे आणि प्रति 1M इनपुट टोकन्ससाठी $0.75 (अमेरिकन डॉलर) आणि प्रति 1M आउटपुट टोकन्ससाठी $4.50 (अमेरिकन डॉलर) खर्च येतो.

Codex मध्ये, GPT‑5.4 mini हे Codex अ‍ॅप, CLI, IDE विस्तार आणि वेबवर सर्वत्र उपलब्ध आहे. ते GPT‑5.4 च्या फक्त 30% वापरते कोटा, ज्यामुळे डेव्हलपर्स Codex मध्ये सोपी कोडिंग कामे सुमारे एक-तृतीयांश खर्चात पटकन हाताळू शकतात. Codex GPT‑5.4 mini सबएजंट्सकडेही प्रतिनिधीकरण करू शकते, ज्यामुळे कमी रीझनिंग-इन्टेन्सिव्ह काम स्वस्त मॉडेलवर चालते.

ChatGPT मध्ये, GPT‑5.4 mini + मेनूमधील “विचार” वैशिष्ट्याद्वारे Free आणि Go वापरकर्त्यांसाठी उपलब्ध आहे. इतर सर्व वापरकर्त्यांसाठी, GPT‑5.4 mini हा GPT‑5.4 साठी रेट लिमिट फॉलबॅक म्हणून उपलब्ध आहे जागा घेत आहे.

GPT‑5.4 nano फक्त API मध्ये उपलब्ध आहे आणि प्रति 1M इनपुट टोकनसाठी $0.20 (16 रुपये) आणि प्रति 1M आउटपुट टोकनसाठी $1.25 (100 रुपये) खर्च येतो.

मॉडेलच्या सुरक्षात्मक उपायांबद्दल अधिक माहितीसाठी, कृपया आमच्या डिप्लॉयमेंट सेफ्टी हब⁠(नवीन विंडोमध्ये उघडेल) वरील सिस्टम कार्ड परिशिष्ट पाहा.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%