GPT‑5.3‑Codex‑Spark सादर करीत आहे
Codex मध्ये रिअल-टाइम कोडिंगसाठी एक अतिशय जलद मॉडेल.
आज, आम्ही GPT‑5.3‑Codex‑Spark चा संशोधन प्रिव्ह्यू रिलीज करत आहोत, जो GPT‑5.3‑Codex चा लहान व्हर्जन आहे आणि रिअल-टाइम कोडिंगसाठी डिझाइन केलेले आमचे पहिले मॉडेल आहे. Codex-Spark जवळजवळ त्वरित वाटण्यासाठी अनुकूलित केलेला आहे—वास्तविक जगातील कोडिंग कामांसाठी उच्च क्षमता कायम ठेवत 15x वेगवान जनरेशन गती प्रदान करतो.
Codex-Spark हे Cerebras सोबतच्या आमच्या भागीदारीतील पहिला टप्पा दर्शवते, ज्याची आम्ही जानेवारीत घोषणा केली होती. आम्ही Codex-Spark हे ChatGPT Pro वापरकर्त्यांसाठी संशोधन पूर्वावलोकन म्हणून शेअर करत आहोत, जेणेकरून विकासक लवकर प्रयोग सुरू करू शकतील. आम्ही Cerebras सोबत डेटासेंटर क्षमता वाढवण्यासाठी, एंड-टू-एंड अनुभव अधिक मजबूत करण्यासाठी, आणि आमचे मोठे अत्याधुनिक मॉडेल तैनात करण्यासाठी काम करत आहोत.
आमच्या नवीनतम अत्याधुनिक मॉडेल्सनी दीर्घकाळ चालणारी कामे करण्याच्या त्यांच्या क्षमतेत विशेष ताकद दाखवली आहे, ज्यामुळे ते तास, दिवस किंवा आठवडे हस्तक्षेपाशिवाय स्वायत्तपणे काम करू शकतात. Codex-Spark हे आमचे पहिले मॉडेल आहे, जे विशेषतः Codex सोबत रिअल-टाइममध्ये काम करण्यासाठी डिझाइन केलेले आहे—लक्ष्यित संपादने करणे, लॉजिकला नव्याने आकार देणे, किंवा इंटरफेसेस परिष्कृत करणे आणि परिणाम त्वरित पाहणे. Codex-Spark सह, Codex कुटुंब आता दीर्घकाळ चालणारी, महत्त्वाकांक्षी कामे आणि तत्काळ काम पूर्ण करणे या दोन्ही गोष्टींना समर्थन देते. विकसक ते कसे वापरतात यामधून आम्हाला शिकण्याची आशा आहे आणि आम्ही प्रवेशाचा विस्तार करत असताना अभिप्राय समाविष्ट करत राहू.
लाँचच्या वेळी, Codex-Spark कडे 128k संदर्भ विंडो आहे आणि ते फक्त मजकूर-आधारित आहे. संशोधन पूर्वावलोकनादरम्यान, Codex-Spark साठी स्वतःच्या दर मर्यादा असतील आणि वापर मानक दर मर्यादांमध्ये समाविष्ट केला जाणार नाही. तथापि, जेव्हा मागणी जास्त असते, तेव्हा वापरकर्त्यांमध्ये विश्वासार्हता संतुलित ठेवण्यासाठी तुम्हाला प्रवेश मंदावलेला किंवा तात्पुरती रांग दिसू शकते.
Codex-Spark परस्परसंवादी कामासाठी अनुकूलित केले गेले आहे, जिथे विलंब बुद्धिमत्तेइतकाच महत्त्वाचा आहे. तुम्ही रिअल-टाइम सहकाऱ्यासारखे मॉडेलसोबत काम करू शकता—ते काम करत असताना त्याला मध्येच थांबवा किंवा दुसऱ्या दिशेने वळवा, आणि रोलआउट पूर्ण होण्याची वाट न पाहता जलद पुनरावृत्ती करू शकता. वेगासाठी ट्यून केलेले असल्यामुळे, Codex-Spark त्याची डीफॉल्ट काम करण्याची शैली हलकी ठेवतो: तो किमान, लक्षित संपादने करतो आणि तुम्ही त्याला सांगितल्याशिवाय आपोआप चाचण्या चालवत नाही.
Codex-Spark हे जलद अनुमानासाठी ऑप्टिमाइझ केलेले अत्यंत सक्षम छोटे मॉडेल आहे. SWE-Bench Pro आणि Terminal-Bench 2.0 या दोन बेंचमार्कवर, जे एजंटिक सॉफ्टवेअर अभियांत्रिकी क्षमतेचे मूल्यांकन करतात, GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex पेक्षा कमी कार्यक्षमता दाखवते, पण काम कमी वेळेत पूर्ण करू शकते.
कालावधीचा अंदाज (1) आउटपुट निर्मिती वेळ (आउटपुट टोकन ÷ सॅम्पलिंग गती), (2) प्रीफिल वेळ (प्रीफिल टोकन ÷ प्रीफिल गती), (3) एकूण साधन कार्यान्वयन वेळ, आणि (4) एकूण नेटवर्क ओव्हरहेड यांच्या बेरजेप्रमाणे केला जातो.
आम्ही Codex-Spark ला प्रशिक्षित करत असताना, रिअल-टाइम सहकार्यासाठी मॉडेलचा वेग हा फक्त समीकरणाचा एक भाग असल्याचे स्पष्ट झाले—आम्हाला संपूर्ण विनंती-प्रतिसाद पाइपलाइनमध्ये लेटन्सी कमी करणे देखील आवश्यक होते. आम्ही आमच्या हार्नेसमध्ये एंड-टू-एंड लेटन्सी सुधारणा अंमलात आणल्या आहेत, ज्याचा फायदा सर्व मॉडेल्सना होतो. आतल्या पातळीवर, आम्ही क्लायंटकडून सर्व्हरकडे आणि परत प्रतिसाद कसे प्रवाहित होतात ते सुलभ केले, आमच्या अनुमान स्टॅकचे महत्त्वाचे भाग पुन्हा लिहिले, आणि सत्रे कशी प्रारंभ होतात ते पुन्हा रचले, जेणेकरून पहिला दिसणारा टोकन लवकर दिसेल आणि तुम्ही पुनरावृत्ती करत असताना Codex प्रतिसादक्षम राहील. सतत WebSocket कनेक्शनची ओळख करून देऊन आणि Responses API मधील लक्षित ऑप्टिमायझेशन्सद्वारे, आम्ही प्रति क्लायंट/सर्व्हर राउंडट्रिप ओव्हरहेड 80% ने, प्रति-टोकन ओव्हरहेड 30% ने, आणि पहिल्या टोकनपर्यंतचा वेळ 50% ने कमी केला. तुम्ही कोणतेही मॉडेल निवडले तरी, संपूर्ण Codex अनुभवात तुम्हाला अधिक घट्ट लूपचा अनुभव येईल.
Codex-Spark Cerebras’ Wafer Scale Engine 3(नवीन विंडोमध्ये उघडेल)वर चालते—उच्च-गती अनुमानासाठी खास तयार केलेला AI प्रवेगक, जो Codex ला कमी विलंबाचा सेवा स्तर प्रदान करतो. आम्ही Cerebras सोबत भागीदारी करून आमच्या उर्वरित फ्लीटप्रमाणेच त्याच प्रॉडक्शन सर्व्हिंग स्टॅकमध्ये हा कमी विलंबाचा मार्ग जोडला आहे, त्यामुळे तो Codex मध्ये अखंडपणे कार्य करतो आणि भविष्यातील मॉडेल्सना समर्थन देण्यासाठी आम्हाला तयार करतो.
"GPT-5.3-Codex-Spark विषयी आम्हाला सर्वात जास्त उत्साह वाटतो तो म्हणजे OpenAI आणि विकासक समुदायासोबत भागीदारी करून जलद इनफरन्समुळे काय शक्य होते हे शोधणे—नवीन परस्परसंवाद पॅटर्न, नवीन वापरप्रकरणे आणि मूलत: वेगळा मॉडेल अनुभव. हे पूर्वावलोकन फक्त सुरुवात आहे."
GPUs आमच्या प्रशिक्षण आणि इन्फरन्स पाइपलाइन्समध्ये मूलभूत राहतात आणि व्यापक वापरासाठी सर्वात किफायतशीर टोकन प्रदान करतात. Cerebras अत्यंत कमी विलंबता आवश्यक असलेल्या कार्यप्रवाहांमध्ये उत्कृष्ट कामगिरी करून त्या पायाला पूरक ठरते, एंड-टू-एंड लूप अधिक घट्ट करते, त्यामुळे तुम्ही पुनरावृत्ती करत असताना Codex अधिक प्रतिसादक्षम वाटतो.
Codex-Spark आज Codex app, CLI, आणि VS Code extension च्या नवीनतम आवृत्त्यांमध्ये सर्व ChatGPT Pro वापरकर्त्यांसाठी संशोधन पूर्वावलोकन म्हणून सुरू होत आहे. कारण हे विशेष कमी विलंब असलेल्या हार्डवेअरवर चालते, वापरावर स्वतंत्र दर मर्यादा लागू होते, जी संशोधन पूर्वावलोकनादरम्यान मागणीनुसार समायोजित केली जाऊ शकते. याव्यतिरिक्त, डेव्हलपर्सना Codex-Spark त्यांच्या उत्पादनांमध्ये कसे एकत्रित करायचे आहे हे समजून घेण्यासाठी, आम्ही डिझाइन पार्टनर्सच्या एका छोट्या गटासाठी API मध्ये Codex-Spark उपलब्ध करून देत आहोत. आम्ही वास्तविक वर्कलोड्सखाली आमचे एकत्रीकरण ट्यून करत राहू तसतसे, पुढील काही आठवड्यांत आम्ही प्रवेश वाढवू.
Codex-Spark सध्या 128k कॉन्टेक्स्ट विंडोमध्ये फक्त मजकूर-आधारित आहे आणि अल्ट्रा-फास्ट मॉडेल्सच्या कुटुंबातील पहिला आहे. जसे आम्ही डेव्हलपर कम्युनिटीसोबत कोडिंगसाठी फास्ट मॉडेल्स कुठे उत्कृष्ट ठरतात हे अधिक शिकतो, तसे आम्ही आणखी अधिक क्षमता सादर करू–ज्यात मोठी मॉडेल्स, अधिक लांब संदर्भ लांबी, आणि मल्टिमोडल इनपुट यांचा समावेश असेल.
Codex-Spark मध्ये आमच्या मुख्य प्रवाहातील मॉडेल्सप्रमाणेच, सायबर-संबंधित प्रशिक्षणासह तेच सुरक्षा प्रशिक्षण समाविष्ट आहे. आमच्या मानक तैनाती प्रक्रियेचा भाग म्हणून आम्ही Codex-Spark चे मूल्यांकन केले, ज्यामध्ये सायबर आणि इतर क्षमतांसाठी बेसलाइन मूल्यांकनांचा समावेश आहे. आम्ही ठरवले की सायबरसिक्युरिटीमध्ये उच्च क्षमतेसाठी आमच्या प्रिपेयर्डनेस फ्रेमवर्क थ्रेशोल्डपर्यंत पोहोचण्याची त्याला विश्वासार्ह शक्यता नाही.
Codex-Spark हा दोन परस्परपूरक मोड्ससह Codex कडे जाणारा पहिला टप्पा आहे: दीर्घकालीन रीझनिंग आणि अंमलबजावणी, आणि जलद पुनरावृत्तीसाठी रिअल-टाइम सहकार्य. कालांतराने, मोड्स एकत्र मिसळतील—Codex तुम्हाला एकसंध इंटरॅक्टिव्ह लूपमध्ये ठेवू शकतो, त्याच वेळी पार्श्वभूमीत सब-एजंट्सकडे अधिक वेळ घेणारे काम सोपवू शकतो, किंवा तुम्हाला व्यापकता आणि वेग हवा असताना अनेक मॉडेल्सकडे समांतरपणे कामे पसरवू शकतो, त्यामुळे सुरुवातीलाच तुम्हाला एकच मोड निवडण्याची गरज नाही.
जसे मॉडेल अधिक सक्षम होत जातात, तसाच परस्परसंवादाचा वेग एक स्पष्ट अडथळा बनतो. अल्ट्रा-फास्ट इन्फरन्स त्या लूपला अधिक घट्ट करते, ज्यामुळे Codex वापरणे अधिक नैसर्गिक वाटते आणि एखादी कल्पना कार्यरत सॉफ्टवेअरमध्ये रूपांतरित करणाऱ्या कोणासाठीही काय शक्य आहे याचा विस्तार होतो.


