23 अप्रैल 2026

पेश है GPT‑5.5

असली काम के लिए इंटेलिजेंस की नई श्रेणी

लोड किया जा रहा है...

24 अप्रैल, 2026 को अपडेट: GPT‑5.5 और GPT‑5.5 Pro अब API में उपलब्ध हैं. सिस्टम कार्ड को भी लागू होने वाले अतिरिक्त सुरक्षा उपायों का वर्णन करने के लिए अपडेट किया गया है.

हम GPT‑5.5 जारी कर रहे हैं, जो अब तक का हमारा सबसे स्मार्ट और इस्तेमाल में सबसे सहज मॉडल है, और कंप्यूटर पर काम करने के नए तरीके की ओर अगला कदम है.

GPT‑5.5 आप क्या करना चाहते हैं, इसे तेज़ी से समझता है और ज़्यादा काम खुद कर सकता है. यह कोड लिखने और डीबग करने, ऑनलाइन रिसर्च करने, डेटा का विश्लेषण करने, डॉक्यूमेंट्स और स्प्रेडशीट्स बनाने, सॉफ़्टवेयर चलाने, और किसी टास्क के पूरा होने तक अलग-अलग टूल्स के बीच काम करने में बेहतरीन है. हर चरण को सावधानी से मैनेज करने के बजाय, आप GPT‑5.5 को एक बेतरतीब, कई हिस्सों वाला टास्क इस भरोसे के साथ सौंप सकते/सकती हैं कि वह योजना बनाएगा, टूल्स का उपयोग करेगा, अपने काम की जांच करेगा, अस्पष्टता के बीच रास्ता निकालेगा, और आगे बढ़ता रहेगा.

इसके सुधार खास तौर पर एजेंटिक कोडिंग, कंप्यूटर उपयोग, नॉलेज वर्क और शुरुआती वैज्ञानिक रिसर्च में मजबूत हैं—ऐसे क्षेत्र जहां प्रगति कॉन्टेक्स्ट में रीजनिंग करने और समय के साथ एक्शन लेने पर निर्भर करती है. GPT‑5.5 इंटेलिजेंस में यह बढ़त स्पीड से समझौता किए बिना देता है: बड़े और ज्यादा सक्षम मॉडल अक्सर धीमे होते हैं, लेकिन GPT‑5.5 रियल-वर्ल्ड सर्विंग में GPT‑5.4 की प्रति-टोकन लेटेंसी को मैच करता है, जबकि काफी उच्च स्तर की इंटेलिजेंस पर काम करता है. यह वही Codex टास्क्स पूरा करने के लिए काफी कम टोकन्स का उपयोग करता है, जिससे यह ज्यादा एफिशिएंट और ज्यादा सक्षम बनता है.

हम GPT‑5.5 जारी कर रहे हैं, जिसमें अब तक के सबसे मजबूत सेफगार्ड्स शामिल हैं, जो मिसयूज़ को कम करने के साथ लाभकारी काम के लिए एक्सेस बनाए रखते हैं. हमने इस मॉडल का मूल्यांकन अपने सभी सेफ्टी और प्रिपेयर्डनेस फ्रेमवर्क्स पर किया, इंटरनल और एक्सटर्नल रेडटीमर्स के साथ काम किया, एडवांस्ड साइबरसिक्योरिटी और बायोलॉजी कैपेबिलिटीज़ के लिए टार्गेटेड टेस्टिंग जोड़ी, और रिलीज़ से पहले लगभग 200 विश्वसनीय अर्ली-एक्सेस पार्टनर्स से वास्तविक यूज़ केस पर फीडबैक इकट्ठा किया.

आज, GPT‑5.5 ChatGPT और Codex में Plus, Pro, Business और Enterprise यूज़र के लिए रोल आउट हो रहा है, और GPT‑5.5 Pro ChatGPT में Pro, Business और Enterprise यूज़र के लिए रोल आउट हो रहा है. API डिप्लॉयमेंट के लिए अलग-अलग सुरक्षा उपायों की आवश्यकता होती है और हम इसे बड़े पैमाने पर उपलब्ध कराने के लिए सुरक्षा और सिक्योरिटी आवश्यकताओं पर पार्टनर्स और कस्टमर्स के साथ मिलकर काम कर रहे हैं. हम बहुत जल्द GPT‑5.5 और GPT‑5.5 Pro को API में उपलब्ध कराएंगे.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.40%	68.50%
विशेषज्ञ-SWE (इंटर्नल)	73.10%	68.50%	-	-	-	-
GDPval (जीत या टाई)	84.90%	83.0%	82.3%	82.0%	80.3%	67.30%
OSWorld-Verified	78.70%	75.0%	-	-	78.0%	-
Toolathlon	55.6%	54.6%	-	-	-	48.8%
BrowseComp	84.40%	82.7%	90.10%	89.3%	79.3%	85.90%
FrontierMath टियर 1–3	51.7%	47.6%	52.40%	50.0%	43.80%	36.90%
FrontierMath टियर 4	35.40%	27.1%	39.60%	38.0%	22.9%	16.7%
CyberGym	81.80%	79.00%	-	-	73.10%	-

मॉडल क्षमताएं

OpenAI एजेंटिक AI के लिए वैश्विक इंफ्रास्ट्रक्चर बना रहा है, जिससे दुनिया भर के लोग और बिज़नेस AI के साथ काम कर सकें. पिछले एक साल में, हमने AI को सॉफ्टवेयर इंजीनियरिंग को तेजी से आगे बढ़ाते देखा है. Codex और ChatGPT में GPT‑5.5 के साथ, यही बदलाव अब वैज्ञानिक रिसर्च और कंप्यूटर पर होने वाले व्यापक काम तक फैलना शुरू हो रहा है.

इन सभी क्षेत्रों में, GPT‑5.5 सिर्फ ज्यादा बुद्धिमान ही नहीं है; यह समस्याओं को हल करने के तरीके में भी ज्यादा कुशल है, और अक्सर कम टोकन और कम बार दोहराने के साथ बेहतर गुणवत्ता के परिणाम तक पहुँच जाता है. Artificial Analysis के Coding Index पर, GPT‑5.5 प्रतिस्पर्धी अत्याधुनिक कोडिंग मॉडल की आधी लागत पर अत्याधुनिक बुद्धिमत्ता प्रदान करता है.

Artificial Analysis Intelligence Index⁠(एक नई विंडो में खुलेगा) किसी बाहरी पक्ष द्वारा चलाए गए 10 evals का भारित औसत है: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

एजेंटिक कोडिंग

GPT‑5.5 अब तक का हमारा सबसे मजबूत एजेंटिक कोडिंग मॉडल है. Terminal-Bench 2.0 पर, जो प्लानिंग, इटरेशन और टूल कोऑर्डिनेशन वाले जटिल कमांड-लाइन वर्कफ्लो को टेस्ट करता है, यह 82.7% की स्टेट-ऑफ-द-आर्ट एक्युरेसी हासिल करता है. SWE-Bench Pro पर, जो रियल-वर्ल्ड GitHub इश्यू रिज़ॉल्यूशन का मूल्यांकन करता है, यह 58.6% तक पहुंचता है और पिछले मॉडल्स की तुलना में एक ही पास में अधिक टास्क्स एंड-टू-एंड हल करता है. Expert-SWE पर, जो लंबे समय वाले कोडिंग टास्क्स के लिए हमारा इंटरनल फ्रंटियर इवैल है और जिसमें मानव द्वारा पूरा करने का अनुमानित मीडियन समय 20 घंटे है, GPT‑5.5 भी GPT‑5.4 से बेहतर प्रदर्शन करता है.

तीनों इवैल्स में, GPT‑5.5, GPT‑5.4 के प्रदर्शन में सुधार करता है कम टोकन्स का उपयोग करते हुए स्कोर्स में सुधार करता है.

मॉडल की कोडिंग ताकत खास तौर पर Codex में साफ दिखती है, जहां यह इम्प्लीमेंटेशन और रिफैक्टर्स से लेकर डिबगिंग, टेस्टिंग और वैलिडेशन तक इंजीनियरिंग काम संभाल सकता है. शुरुआती टेस्टिंग से पता चलता है कि GPT‑5.5 उन व्यवहारों में बेहतर है जिन पर असली इंजीनियरिंग काम निर्भर करता है, जैसे बड़े सिस्टम्स में कॉन्टेक्स्ट बनाए रखना, अस्पष्ट फेल्यर्स पर रीजनिंग करना, टूल्स से अनुमानों की जांच करना और आसपास के कोडबेस में बदलाव लागू करना.

दिखाया गया ट्रैजेक्टरी पाथ Orion, चंद्रमा और सूर्य के लिए NASA/JPL Horizons के वेक्टर डेटा का उपयोग करता है, जिसमें बेहतर पढ़ने योग्य बनाने के लिए डिस्प्ले स्केलिंग लागू की गई है.

Prompt: [attached image] Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.

बेंचमार्क्स से आगे, शुरुआती टेस्टर्स ने कहा कि GPT‑5.5 सिस्टम की संरचना को बेहतर समझता है: क्या फेल हो रहा है, फिक्स कहां करना है और कोडबेस में और क्या प्रभावित होगा.

“पहला कोडिंग मॉडल जिसका मैंने इस्तेमाल किया है, जिसमें वास्तव में गहरी कॉन्सेप्ट्स की समझ है.”

Dan Shipper, Every के संस्थापक और CEO, ने GPT‑5.5 को “पहला ऐसा कोडिंग मॉडल बताया जिसे मैंने इस्तेमाल किया है जिसमें गहरी कॉन्सेप्चुअल क्लैरिटी है.”

एक ऐप लॉन्च करने के बाद, उन्होंने सिस्टम के एक हिस्से को फिर से लिखने के लिए अपने सबसे अच्छे इंजीनियरों में से एक को शामिल करने से पहले कई दिनों तक एक पोस्ट-लॉन्च समस्या को डीबग करने में बिताए. GPT‑5.5 का परीक्षण करने के लिए, उसने मानो समय को पीछे घुमा दिया: क्या मॉडल खराब स्थिति को देखकर वैसी ही रीराइट तैयार कर सकता है, जैसी इंजीनियर ने आखिरकार चुनी? GPT‑5.4 नहीं कर सका। GPT‑5.5 कर सका.

“सच में ऐसा महसूस होता है जैसे मैं किसी उच्चतर बुद्धिमत्ता के साथ काम कर रहा/रही हूँ, और लगभग सम्मान का एहसास भी होता है.”

Pietro Schirano, MagicPath के CEO, ने इसी तरह का बड़ा बदलाव तब देखा, जब GPT‑5.5 ने सैकड़ों फ्रंटएंड और रिफैक्टर बदलावों वाली एक ब्रांच को एक ऐसी मेन ब्रांच में मर्ज किया, जिसमें भी काफ़ी बड़े बदलाव हो चुके थे, और इस काम को करीब 20 मिनट में वन-शॉट में पूरा कर दिया.

मॉडल को टेस्ट करने वाले सीनियर इंजीनियर्स ने कहा कि GPT‑5.5, GPT‑5.4 और Claude Opus 4.7 की तुलना में रीजनिंग और ऑटोनॉमी में काफी मजबूत है, पहले से इश्यूज़ पकड़ लेता है और बिना स्पष्ट प्रॉम्प्ट के टेस्टिंग और रिव्यू की जरूरत का अनुमान लगा लेता है. अन्य लोगों ने कहा कि उन्हें इम्प्लीमेंटेशन में बहुत कम सुधार की जरूरत पड़ी और GPT‑5.4 की तुलना में GPT‑5.5 की योजनाओं पर ज्यादा भरोसा महसूस हुआ. इस मॉडल का शुरुआती एक्सेस पाने वाले NVIDIA के एक इंजीनियर के शब्दों में, "GPT‑5.5 का एक्सेस खोना ऐसा लगता है जैसे मेरा एक अंग काट दिया गया हो.”

इस मॉडल का शुरुआती एक्सेस पाने वाले NVIDIA के एक इंजीनियर ने यहां तक कहा: "GPT‑5.5 का एक्सेस खोना ऐसा लगता है जैसे मेरा एक अंग काट दिया गया हो."

“GPT-5.5, GPT-5.4 की तुलना में काफ़ी ज़्यादा स्मार्ट और ज़्यादा दृढ़ है, और बेहतर कोडिंग परफ़ॉर्मेंस और ज़्यादा भरोसेमंद टूल इस्तेमाल के साथ. यह बीच में रुके बिना काफी लंबे time तक टास्क पर बना रहता है, जो खास तौर पर उस कॉम्प्लेक्स, लंबे समय तक चलने वाले काम के लिए सबसे ज़्यादा मायने रखता है, जिसे हमारे यूज़र्स Cursor को डेलीगेट करते हैं.”

— Michael Truell, Cursor के सह-संस्थापक और CEO

नॉलेज वर्क

वही खूबियां जो GPT‑5.5 को कोडिंग में शानदार बनाती हैं, उसे कंप्यूटर पर रोज़मर्रा के काम के लिए भी ताकतवर बनाती हैं. क्योंकि यह मॉडल इंटेंट को बेहतर समझता है, यह नॉलेज वर्क के पूरे लूप में ज्यादा सहजता से काम कर सकता है: जानकारी ढूंढना, जरूरी बात समझना, टूल्स का उपयोग करना, आउटपुट चेक करना और कच्चे डेटा को उपयोगी चीज़ में बदलना.

Codex में, GPT‑5.5 दस्तावेज़, स्प्रेडशीट्स और स्लाइड प्रेज़ेंटेशन बनाने में GPT‑5.4 से बेहतर है. अल्फा टेस्टर्स ने बताया कि यह ऑपरेशनल रिसर्च, स्प्रेडशीट मॉडलिंग और बिखरे हुए बिज़नेस इनपुट्स को योजनाओं में बदलने जैसे कामों में पिछले मॉडल्स से बेहतर प्रदर्शन करता है. जब इसे Codex की कंप्यूटर उपयोग क्षमताओं के साथ जोड़ा जाता है, तो GPT‑5.5 हमें उस अनुभव के और करीब ले आता है कि मॉडल सच में आपके साथ कंप्यूटर चला सकता है: स्क्रीन पर क्या है यह देखना, क्लिक करना, टाइप करना, इंटरफेस में नेविगेट करना और टूल्स के बीच सटीकता के साथ काम करना.

OpenAI की टीमें पहले से ही इन खूबियों का उपयोग वास्तविक वर्कफ्लो में कर रही हैं. आज, कंपनी के 85% से अधिक लोग हर हफ्ते Codex का उपयोग करते हैं, जिनमें सॉफ्टवेयर इंजीनियरिंग, फाइनेंस, कम्युनिकेशन्स, मार्केटिंग, डेटा साइंस और प्रोडक्ट मैनेजमेंट शामिल हैं. Comms में, टीम ने Codex में GPT‑5.5 का उपयोग करके छह महीने के स्पीकिंग रिक्वेस्ट डेटा का विश्लेषण किया, एक स्कोरिंग और रिस्क फ्रेमवर्क बनाया, और एक ऑटोमेटेड Slack एजेंट को वैलिडेट किया ताकि कम-जोखिम वाले रिक्वेस्ट्स अपने आप संभाले जा सकें, जबकि उच्च-जोखिम वाले रिक्वेस्ट्स अभी भी मानव समीक्षा के लिए भेजे जाएं. फाइनेंस में, टीम ने Codex का उपयोग करके 24,771 K-1 टैक्स फॉर्म्स (कुल 71,637 पेज) की समीक्षा की, एक ऐसे वर्कफ्लो के साथ जो व्यक्तिगत जानकारी को बाहर रखता है और पिछले साल की तुलना में इस काम को दो हफ्ते तेज़ करने में मदद करता है. Go-to-Market टीम में, एक कर्मचारी ने साप्ताहिक बिज़नेस रिपोर्ट्स जनरेट करने को ऑटोमेट किया, जिससे हर हफ्ते 5-10 घंटे की बचत हुई.

ChatGPT में, GPT‑5.5 Thinking कठिन समस्याओं के लिए तेज़ मदद देता है, स्मार्ट और संक्षिप्त जवाबों के साथ, जिससे आप जटिल काम को ज्यादा कुशलता से आगे बढ़ा सकें. यह कोडिंग, रिसर्च, जानकारी का संश्लेषण और विश्लेषण, और डॉक्यूमेंट-हेवी टास्क्स जैसे प्रोफेशनल काम में बेहतरीन प्रदर्शन करता है, खासकर जब plugins का उपयोग किया जाए.

GPT‑5.5 Pro में, शुरुआती टेस्टर्स काम की कठिनाई और गुणवत्ता दोनों में बड़ा सुधार देख रहे हैं, साथ ही लेटेंसी में सुधार जो इसे डिमांडिंग टास्क्स के लिए ज्यादा व्यावहारिक बनाता है. GPT‑5.4 Pro की तुलना में, टेस्टर्स ने पाया कि GPT‑5.5 Pro के जवाब अधिक व्यापक, सुव्यवस्थित, सटीक, प्रासंगिक और उपयोगी हैं, और बिज़नेस, लीगल, एजुकेशन और डेटा साइंस में खास तौर पर मजबूत प्रदर्शन करते हैं.

GPT‑5.5 कई बेंचमार्क्स पर स्टेट-ऑफ-द-आर्ट प्रदर्शन हासिल करता है जो इस तरह के काम को दर्शाते हैं. GDPval⁠ पर—जो 44 व्यवसायों में अच्छी तरह से परिभाषित नॉलेज वर्क तैयार करने की एजेंट्स की क्षमताओं का परीक्षण करता है—GPT‑5.5 84.9% स्कोर करता है. OSWorld-Verified पर, जो यह मापता है कि कोई मॉडल खुद से वास्तविक कंप्यूटर एनवायरनमेंट चला सकता है या नहीं, यह 78.7% तक पहुंचता है. और Tau2-bench Telecom पर, जो जटिल कस्टमर-सर्विस वर्कफ्लो को टेस्ट करता है, यह बिना प्रॉम्प्ट ट्यूनिंग के 98.0% तक पहुंचता है. GPT‑5.5 अन्य नॉलेज वर्क बेंचमार्क पर भी मज़बूती से परफ़ॉर्म करता है: FinanceAgent पर 60.0%, इंटर्नल इन्वेस्टमेंट-बैंकिंग मॉडलिंग टास्क पर 88.5%, और OfficeQA Pro पर 54.1%.

Tau2-बेंच टेलीकॉम को प्रॉम्प्ट ट्यूनिंग के बिना चलाया गया था (और GPT‑4.1 को यूज़र मॉडल के रूप में इस्तेमाल किया गया था). GPT‑5.5 कार्य के उद्देश्य को बेहतर समझता है और अपने पिछले संस्करणों की तुलना में अधिक टोकन-एफिशिएंट है.

“GPT-5.5 ज्यादा एक्जीक्यूशन वाले काम के लिए जरूरी लगातार परफॉर्मेंस देता है. NVIDIA GB200 NVL72 सिस्टम्स पर बना और चलाया गया यह मॉडल हमारी टीमों को नैचुरल लैंग्वेज प्रॉम्प्ट्स से एंड-टू-एंड फीचर्स शिप करने, डिबग टाइम को दिनों से घंटों तक घटाने और जटिल कोडबेस में हफ्तों के एक्सपेरिमेंटेशन को रातों-रात प्रोग्रेस में बदलने में मदद करता है. यह सिर्फ तेज़ कोडिंग से ज्यादा है—यह काम करने का एक नया तरीका है जो लोगों को एक बिल्कुल अलग गति से काम करने में मदद करता है.”

— Justin Boitano, NVIDIA में Enterprise AI के उपाध्यक्ष

वैज्ञानिक अनुसंधान

GPT‑5.5 वैज्ञानिक और तकनीकी अनुसंधान वर्कफ्लो में भी सुधार दिखाता है, जहां सिर्फ कठिन सवाल का जवाब देना पर्याप्त नहीं होता. शोधकर्ताओं को किसी विचार का अन्वेषण करना, साक्ष्य जुटाना, अनुमानों का परीक्षण करना, परिणामों की व्याख्या करना और आगे क्या करना है यह तय करना होता है. GPT‑5.5 इस पूरे चक्र में लगातार काम करने में अन्य मॉडलों से बेहतर है.

खास तौर पर, GPT‑5.5 GeneBench⁠(एक नई विंडो में खुलेगा) पर GPT‑5.4 की तुलना में स्पष्ट सुधार दिखाता है, जो जेनेटिक्स और क्वांटिटेटिव बायोलॉजी में मल्टी-स्टेज वैज्ञानिक डेटा विश्लेषण पर केंद्रित एक नया मूल्यांकन है. इन समस्याओं में मॉडल को कम सुपरवाइजरी गाइडेंस के साथ संभावित रूप से अस्पष्ट या त्रुटिपूर्ण डेटा पर रीजनिंग करनी होती है, छिपे हुए कन्फाउंडर्स या QC फेल्यर्स जैसी वास्तविक बाधाओं से निपटना होता है, और आधुनिक सांख्यिकीय तरीकों को सही तरीके से लागू और समझना होता है. यह प्रदर्शन खास तौर पर उल्लेखनीय है क्योंकि यहां के टास्क अक्सर वैज्ञानिक विशेषज्ञों के लिए कई दिनों के प्रोजेक्ट के बराबर होते हैं.

इसी तरह, BixBench⁠(एक नई विंडो में खुलेगा) पर, जो वास्तविक दुनिया के बायोइन्फॉर्मेटिक्स और डेटा विश्लेषण पर आधारित एक बेंचमार्क है, GPT‑5.5 ने प्रकाशित स्कोर वाले मॉडलों में अग्रणी प्रदर्शन किया. मॉडल की वैज्ञानिक क्षमताएं अब इतनी मज़बूत हैं कि यह बायोमेडिकल अनुसंधान के अग्रिम क्षेत्रों में एक वास्तविक सह-वैज्ञानिक के रूप में प्रगति को तेज कर सकता है.

एक अन्य उदाहरण में, GPT‑5.5 के एक आंतरिक संस्करण ने कस्टम हार्नेस के साथ कॉम्बिनेटोरिक्स के प्रमुख विषयों में से एक, Ramsey numbers के बारे में एक नया प्रमाण⁠(एक नई विंडो में खुलेगा) खोजने में मदद की. कॉम्बिनेटोरिक्स यह अध्ययन करता है कि डिस्क्रीट ऑब्जेक्ट्स—जैसे ग्राफ, नेटवर्क, सेट और पैटर्न—कैसे आपस में फिट होते हैं. Ramsey numbers यह पूछते हैं कि किसी नेटवर्क का आकार कितना बड़ा होना चाहिए ताकि किसी प्रकार का क्रम निश्चित रूप से दिखाई दे. इस क्षेत्र में परिणाम दुर्लभ होते हैं और अक्सर तकनीकी रूप से कठिन होते हैं. यहां GPT‑5.5 ने off-diagonal Ramsey numbers से जुड़े एक लंबे समय से चले आ रहे आसिम्प्टोटिक तथ्य का प्रमाण खोजा, जिसे बाद में Lean में सत्यापित किया गया. यह परिणाम इस बात का ठोस उदाहरण है कि GPT‑5.5 सिर्फ कोड या व्याख्या ही नहीं, बल्कि एक मुख्य शोध क्षेत्र में एक आश्चर्यजनक और उपयोगी गणितीय तर्क भी प्रदान करता है.

शुरुआती टेस्टर्स ने ChatGPT में GPT‑5.5 Pro का उपयोग एक बार में जवाब देने वाले इंजन की तरह कम और एक रिसर्च पार्टनर की तरह ज्यादा किया: कई चरणों में मैन्युस्क्रिप्ट की समीक्षा करना, तकनीकी तर्कों को स्ट्रेस-टेस्ट करना, विश्लेषण सुझाना, और कोड, नोट्स और PDF कॉन्टेक्स्ट के साथ काम करना. समान बात यह है कि GPT‑5.5 शोधकर्ताओं को सवाल से प्रयोग और फिर परिणाम तक पहुंचने में बेहतर मदद करता है.

Derya Unutmaz, जैक्सन लेबोरेटरी फ़ॉर जीनोमिक मेडिसिन में इम्यूनोलॉजी के प्रोफ़ेसर और शोधकर्ता, ने 62 सैंपल और लगभग 28,000 जीन वाले एक जीन-एक्सप्रेशन डेटासेट का विश्लेषण करने के लिए GPT‑5.5 Pro का उपयोग किया, जिससे एक विस्तृत शोध रिपोर्ट तैयार हुई, जिसने न केवल निष्कर्षों का सारांश दिया बल्कि मुख्य सवालों और इनसाइट्स को भी सामने लाया—ऐसा काम, जिसे करने में उनकी टीम को, उनके अनुसार, महीनों लग जाते.

Bartosz Naskręcki, पोलैंड के Poznań स्थित Adam Mickiewicz University में गणित के सहायक प्रोफेसर, ने Codex में GPT‑5.5 का उपयोग करके केवल 11 मिनट में एक ही प्रॉम्प्ट से बीजगणितीय ज्यामिति ऐप बनाया, जो द्विघात सतहों के प्रतिच्छेदन का विज़ुअलाइज़ेशन करता है और परिणामी वक्र को Weierstrass मॉडल में बदलता है.

बाद में उन्होंने ऐप को और स्थिर सिंगुलैरिटी विज़ुअलाइज़ेशन और सटीक कोएफिशिएंट्स के साथ विस्तारित किया, जिन्हें आगे के काम में दोबारा इस्तेमाल किया जा सकता है. उनके लिए बड़ा बदलाव यह है कि Codex अब कस्टम गणितीय विज़ुअलाइज़ेशन और कंप्यूटर-एल्जेब्रा वर्कफ्लो को लागू करने में मदद कर सकता है, जिनके लिए पहले अलग टूल्स की जरूरत होती थी. मिलकर, ये उदाहरण दिखाते हैं कि GPT‑5.5 एक्सपर्ट इंटेंट को काम करने वाले रिसर्च टूल्स और विश्लेषण में बदल रहा है.

क्रेडिट: Bartosz Naskręcki⁠(एक नई विंडो में खुलेगा)

Prompt: # Algebraic geometry surface intersection

Make an app which draws two quadratic surfaces and colors in red the intersection curve. Use computational Riemann-Roch theorem to convert this into Weierstrass curve.

## मुख्य विंडो

हल्की पारदर्शी छायांकन के साथ दो रंगीन सतहें, उच्च-गुणवत्ता वाला प्रतिपादन, लाल रंग की बीजगणितीय वक्र के साथ प्रतिच्छेद करती हुई

दोनों दिशाओं में माउस से रोटेशन, ज़ूम के लिए पूर्ण पिंच मैकेनिज़्म, प्रत्येक सतह के कोएफ़िशिएंट बदलने के लिए स्लाइडर वाले छोटे मेन्यू को दिखाने हेतु हैप्टिक प्रेस; Z-बफ़र स्तर के माध्यम से डिटेक्शन

## दाईं ओर की विंडो

शॉर्ट वाइयरस्ट्रास समीकरण (Q या द्विघात क्षेत्र विस्तार पर) जो प्रभावी रीमान-रॉख प्रमेय के सूत्रों के माध्यम से Go परिकलित किया गया है

## एम्बिएंट मोड, जिसमें सभी कंट्रोल छिपे रहते हैं और उपयोगकर्ता आकृतियों की सुंदरता का आनंद ले सकता है

## स्पेसिफ़िकेशन्स

ऐप ब्राउज़र में चल रहा है, हल्का-फुल्का कार्यान्वयन, नवीनतम फुल-स्टैक लाइब्रेरीज़ के साथ, पोर्टेबल और डिप्लॉय करने योग्य

## Docs

Git रिपो, जर्नल, योजना (मार्कडाउन फ़ाइलें)

“OpenAI के नए GPT-5.5 मॉडल को अपने हार्नेस में इस्तेमाल करना, इसे बड़े बायोकेमिकल डेटा सेट्स पर रीजनिंग करते हुए मानव दवा के परिणामों की भविष्यवाणी करते देखना, और फिर हमारे सबसे कठिन ड्रग डिस्कवरी मूल्यांकन में इसकी सटीकता में बड़ा सुधार देखना बेहद उत्साहजनक है.” अगर OpenAI इसी तरह कमाल करता रहा, तो साल के अंत तक ड्रग डिस्कवरी की नींव बदल जाएगी.”

— Brandon White, Axiom Bio के सह-संस्थापक एवं CEO

अगली पीढ़ी की इन्फरेंस एफिशिएंसी

GPT‑5.5 को GPT‑5.4 की लेटेंसी पर सर्व करने के लिए इन्फरेंस को एक इंटीग्रेटेड सिस्टम के रूप में फिर से सोचना पड़ा, न कि अलग-अलग ऑप्टिमाइजेशन के सेट के रूप में. GPT‑5.5 को NVIDIA GB200 और GB300 NVL72 सिस्टम्स के लिए को-डिज़ाइन किया गया, उन्हीं पर ट्रेन किया गया और उन्हीं पर सर्व किया गया. Codex और GPT‑5.5 हमारे परफॉर्मेंस टार्गेट्स हासिल करने में महत्वपूर्ण रहे. Codex ने टीम को आइडिया से बेंचमार्केबल इम्प्लीमेंटेशन तक तेजी से पहुंचने में मदद की, एप्रोचेस स्केच करने, एक्सपेरिमेंट्स सेट करने और यह पहचानने में कि कौन-से ऑप्टिमाइजेशन पर ज्यादा निवेश करना सही है. GPT‑5.5 ने खुद स्टैक में महत्वपूर्ण सुधार खोजने और लागू करने में मदद की. सरल शब्दों में, इस मॉडल ने उसी इंफ्रास्ट्रक्चर को बेहतर बनाने में मदद की जो इसे सर्व करता है.

ऐसा ही एक सुधार लोड बैलेंसिंग और पार्टिशनिंग हीयूरिस्टिक्स में था. GPT‑5.5 से पहले, हम एक्सेलेरेटर पर आने वाले अनुरोधों को एक तय संख्या के हिस्सों में बाँटते थे, ताकि कंप्यूटिंग कोर्स के बीच काम संतुलित रहे और बड़े व छोटे अनुरोध एक ही GPU पर चल सकें. हालांकि, पहले से तय किए गए स्थिर हिस्सों की संख्या हर तरह के ट्रैफिक पैटर्न के लिए सबसे बेहतर नहीं होती. GPUs का बेहतर उपयोग करने के लिए, Codex ने कई हफ्तों के प्रोडक्शन ट्रैफिक पैटर्न का विश्लेषण किया और काम को सही तरीके से बाँटने और संतुलित करने के लिए कस्टम हीयूरिस्टिक एल्गोरिदम लिखे. इस प्रयास का बड़ा असर पड़ा, जिससे टोकन जनरेशन की गति 20% से अधिक बढ़ गई.

सभी की सुरक्षा के लिए साइबरसिक्योरिटी को आगे बढ़ाना

ऐसे मॉडलों के लिए दुनिया को तैयार करना जो सुरक्षा कमजोरियों को ढूंढने और पैच करने में सक्षम हैं, एक टीम प्रयास है. इसके लिए पूरे इकोसिस्टम को मिलकर काम करना होगा, जिसमें मॉडल एक्सेस का लोकतांत्रिकरण और साइबर डिफेंस के अगले युग⁠ के लिए इटरेटिव डिप्लॉयमेंट शामिल है.

फ्रंटियर मॉडल्स साइबरसिक्योरिटी में लगातार अधिक सक्षम होते जा रहे हैं. ये क्षमताएं व्यापक रूप से उपलब्ध होंगी और हमारा मानना है कि आगे बढ़ने का सबसे अच्छा तरीका यह सुनिश्चित करना है कि इन्हें साइबर डिफेंस को तेज करने और इकोसिस्टम को मजबूत बनाने के लिए उपयोग में लाया जा सके.

GPT‑5.5 AI की ओर एक क्रमिक लेकिन महत्वपूर्ण कदम है, जो साइबरसिक्योरिटी जैसे दुनिया की सबसे कठिन चुनौतियों को हल करने में सक्षम हो सकता है. दिसंबर में GPT‑5.2 के साथ, हमने संभावित साइबर दुरुपयोग को सीमित करने के लिए हमारे मॉडल⁠ के लिए ज़रूरी साइबर सेफगार्ड्स सक्रिय रूप से लागू किए थे; अब GPT‑5.5 के साथ, हम संभावित साइबर जोखिम के लिए और भी सख़्त क्लासिफ़ायर्स तैनात कर रहे हैं, जो कुछ यूज़र्स को शुरुआत में परेशान कर सकते हैं, क्योंकि समय के साथ हम इन्हें ट्यून करते रहेंगे.

हमने वर्षों से अपने प्रिपेयर्डनेस फ़्रेमवर्क⁠(एक नई विंडो में खुलेगा) में साइबर सुरक्षा को एक श्रेणी के रूप में पहचाना है। हमारे मॉडल धीरे-धीरे बेहतर हुए हैं, और हमने मिटीगेशन को विकसित और कैलिब्रेट किया है ताकि जिम्मेदारी से मॉडल रिलीज़ किए जा सकें.

हम साइबर क्षमता के इस स्तर के लिए उद्योग-अग्रणी सुरक्षा उपाय डिप्लॉय कर रहे हैं. हमने पिछले साल GPT‑5.2⁠(एक नई विंडो में खुलेगा) के साथ पहली बार साइबर-विशिष्ट सेफगार्ड्स पेश किए थे, जिन्हें हमने बाद के डिप्लॉयमेंट्स में लगातार टेस्ट, रिफाइन और बेहतर बनाया है. GPT‑5.5 के लिए हमने उच्च-जोखिम गतिविधियों, संवेदनशील साइबर अनुरोधों के आसपास और कड़े कंट्रोल्स डिज़ाइन किए हैं, और बार-बार गलत उपयोग के खिलाफ अतिरिक्त सुरक्षा जोड़ी है. व्यापक एक्सेस हमारे मॉडल सेफ्टी, ऑथेंटिकेटेड उपयोग और अनुचित उपयोग की मॉनिटरिंग में किए गए निवेश के कारण संभव हुआ है. हम महीनों से बाहरी विशेषज्ञों के साथ काम कर रहे हैं ताकि इन सेफगार्ड्स की मजबूती को डेवलप, टेस्ट और लगातार बेहतर किया जा सके. GPT‑5.5 के साथ हम यह सुनिश्चित कर रहे हैं कि डेवलपर्स आसानी से अपने कोड को सुरक्षित कर सकें, साथ ही उन साइबर वर्कफ्लोज़ पर मजबूत कंट्रोल्स लगाए जा रहे हैं जो दुर्भावनापूर्ण एक्टर्स द्वारा नुकसान पहुंचाने की सबसे अधिक संभावना रखते हैं.
हम हर स्तर पर साइबर डिफेंस को तेज़ करने के लिए एक्सेस का विस्तार कर रहे हैं.हम अपने साइबर-परमिसिव मॉडल को साइबर के लिए ट्रस्टेड एक्सेस⁠ के माध्यम से उपलब्ध करा रहे हैं, जिसकी शुरुआत Codex से हो रही है. इसमें वेरिफाइड यूज़र्स के लिए GPT‑5.5 की उन्नत साइबरसिक्योरिटी क्षमताओं तक विस्तारित एक्सेस शामिल है, जहाँ लॉन्च के समय कुछ विश्वसनीयता संकेत⁠(एक नई विंडो में खुलेगा) पूरे करने पर कम प्रतिबंध होंगे. वे संगठन जो महत्वपूर्ण अवसंरचना की सुरक्षा⁠ के लिए जिम्मेदार हैं, वे GPT‑5.4‑Cyber जैसे साइबर-परमिसिव मॉडल के एक्सेस के लिए आवेदन कर सकते हैं, बशर्ते वे अपने आंतरिक सिस्टम्स को सुरक्षित करने के लिए सख्त सुरक्षा आवश्यकताओं को पूरा करें. इससे वेरिफाइड डिफेंडर्स के एक बड़े समूह को वैध सुरक्षा कार्य के लिए अधिक सक्षम टूल्स मिलते हैं, कम अनावश्यक बाधाओं के साथ, ताकि महत्वपूर्ण डिफेंसिव क्षमताओं तक एक्सेस को लोकतांत्रिक बनाया जा सके. उपयोगकर्ता chatgpt.com/cyber⁠(एक नई विंडो में खुलेगा) पर ट्रस्टेड एक्सेस के लिए आवेदन कर सकते हैं, ताकि सत्यापित डिफेंसिव कार्य के लिए GPT‑5.5 का उपयोग करते समय अनावश्यक अस्वीकृतियाँ कम हो सकें.
हम जनता के लिए महत्वपूर्ण इंफ्रास्ट्रक्चर की सुरक्षा में मदद करने के लिए सरकारी भागीदारों के साथ काम कर रहे हैं. मिलकर हम यह समझने की कोशिश कर रहे हैं कि उन्नत AI कैसे उन भरोसेमंद अधिकारियों के डिफेंसिव कार्य को सपोर्ट कर सकता है, जो उन सिस्टम्स के लिए जिम्मेदार हैं जिन पर लोग निर्भर करते हैं—महत्वपूर्ण टैक्सपेयर डेटा को सुरक्षित रखने वाले डिजिटल सिस्टम्स से लेकर स्थानीय समुदायों के पावर ग्रिड और जल आपूर्ति तक.

हम GPT‑5.5 की जैविक/रासायनिक और साइबरसिक्योरिटी क्षमताओं को अपने प्रिपेयर्डनेस फ़्रेमवर्क⁠(एक नई विंडो में खुलेगा) के तहत उच्च मान रहे हैं. हालांकि GPT‑5.5 साइबरसिक्योरिटी क्षमता के Critical लेवल तक नहीं पहुँचा, हमारे मूल्यांकन और परीक्षण से पता चला कि इसकी साइबरसिक्योरिटी क्षमताएँ GPT‑5.4 की तुलना में एक कदम आगे हैं.

इसके अलावा, GPT‑5.5 ने रिलीज़ से पहले हमारी पूरी सेफ्टी और गवर्नेंस प्रक्रिया पूरी की, जिसमें तैयारी मूल्यांकन, डोमेन-आधारित टेस्टिंग, उन्नत बायोलॉजी और साइबरसिक्योरिटी क्षमताओं के लिए नए टार्गेटेड मूल्यांकन, और बाहरी विशेषज्ञों के साथ मज़बूत टेस्टिंग शामिल है. हम GPT‑5.5 सिस्टम कार्ड⁠(एक नई विंडो में खुलेगा) में और अधिक जानकारी साझा करते हैं.

यह काम हमारे व्यापक AI रेज़िलिएंस अप्रोच को दर्शाता है, जो हमारी समझ में मॉडल क्षमताओं के आगे बढ़ने के साथ जरूरी है. हम चाहते हैं कि शक्तिशाली AI उन लोगों के लिए उपलब्ध हो जो इसका उपयोग सिस्टम, संस्थानों और जनता की सुरक्षा के लिए करते हैं. सही रास्ता है ट्रस्टेड एक्सेस, ऐसे मजबूत सेफगार्ड्स जो क्षमता के साथ बढ़ें, और गंभीर गलत उपयोग को पहचानने और उस पर प्रतिक्रिया देने की संचालन क्षमता.

उपलब्धता और प्राइसिंग

ChatGPT में, GPT‑5.5 Thinking Plus, Pro, Business और Enterprise यूज़र्स के लिए उपलब्ध है. GPT‑5.5 Pro, और भी कठिन सवालों और ज़्यादा सटीकता वाले काम के लिए डिज़ाइन किया गया, Pro, Business और Enterprise यूज़र्स के for उपलब्ध है.

Codex में, GPT‑5.5 Plus, Pro, Business, Enterprise, Edu और Go प्लान्स के लिए 400K कॉन्टेक्स्ट विंडो के साथ उपलब्ध है. GPT‑5.5 Fast मोड में भी उपलब्ध है, जो 2.5x लागत पर 1.5x तेज़ी से टोकन तैयार करता है.

API डेवलपर्स के लिए, gpt-5.5 जल्द ही Responses और Chat Completions APIs में उपलब्ध होगा, जहाँ 1M इनपुट टोकन के लिए $5 और 1M आउटपुट टोकन के लिए $30 लागत होगी, साथ में 1M कॉन्टेक्स्ट विंडो मिलेगा. Batch और Flex प्राइसिंग स्टैंडर्ड API दर के आधे पर उपलब्ध है, जबकि Priority प्रोसेसिंग स्टैंडर्ड दर के 2.5x पर उपलब्ध है. हम API में gpt-5.5-pro भी जारी करेंगे, जो और अधिक सटीकता के लिए होगा, जिसकी कीमत 1M इनपुट टोकन के लिए $30 और 1M आउटपुट टोकन के लिए $180 होगी. पूरी जानकारी के लिए प्राइसिंग पेज⁠ देखें.

हालांकि GPT‑5.5 की कीमत GPT‑5.4 से अधिक है, यह अधिक बुद्धिमान है और काफी ज्यादा टोकन एफिशिएंट भी है. Codex में, हमने अनुभव को सावधानी से ट्यून किया है ताकि GPT‑5.5 अधिकांश उपयोगकर्ताओं के लिए GPT‑5.4 की तुलना में कम टोकन में बेहतर परिणाम दे सके, साथ ही सभी सब्सक्रिप्शन स्तरों पर उदार उपयोग जारी रखा जाए.

इवैल्युएशन्स

कोडिंग

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (Public) *	58.60%	57.7%	-	-	64.3%	54.20%
Terminal-Bench 2.0	82.7%	75.1%	-	-	69.40%	68.5%
विशेषज्ञ-SWE (आंतरिक)	73.10%	68.5%	-	-	-	-

^*^{लैब्स ने इस मूल्यांकन पर}^{याद करने के प्रमाण}⁠(एक नई विंडो में खुलेगा)^{नोट किए हैं}

पेशेवर

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GDPval (जीत या टाई)	84.90%	83.0%	82.3%	82.0%	80.3%	67.30%
FinanceAgent v1.1	60.00%	56.0%	-	61.5%	64.40%	59.70%
इन्वेस्टमेंट बैंकिंग मॉडलिंग टास्क्स (आंतरिक)	88.5%	87.3%	88.60%	83.6%	-	-
OfficeQA Pro	54.10%	53.2%	-	-	43.6%	18.10%

कंप्यूटर यूज़ और विज़न

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
OSWorld-Verified	78.7%	75.0%	-	-	78.0%	-
MMMU Pro (कोई टूल नहीं)	81.2%	81.2%	-	-	-	80.5%
MMMU Pro (टूल्स के साथ)	83.20%	82.1%	-	-	-	-

टूल उपयोग

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84.4%	82.7%	90.10%	89.3%	79.3%	85.9%
MCP Atlas**	75.3%	70.60%	-	-	79.10%	78.20%
Toolathlon	55.6%	54.6%	-	-	-	48.80%
Tau2-बेंच टेलीकॉम*** (मूल प्रॉम्प्ट)	98.0%	92.8%	-	-	-	-

^{** MCP Atlas: अप्रैल 2026 के नवीनतम अपडेट के बाद Scale AI के परिणाम.
*** Tau2-बेंच टेलीकॉम: 5.5 और 5.4 के परिणाम, मूल प्रॉम्प्ट के साथ अर्थात प्रॉम्प्ट में कोई समायोजन नहीं. इसमें दूसरी लैब्स के वे नतीजे शामिल नहीं हैं, जिनका इवैल्यूएशन प्रॉम्प्ट एडजस्टमेंट्स के साथ किया गया था.}

शैक्षणिक

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25.0%	19.0%	33.20%	25.60%	-	-
FrontierMath टियर 1–3	51.70%	47.6%	52.40%	50.0%	43.80%	36.9%
FrontierMath टियर 4	35.40%	27.1%	39.60%	38.0%	22.9%	16.70%
BixBench	80.5%	74.0%	-	-	-	-
GPQA डायमंड	93.60%	92.8%	-	94.4%	94.20%	94.30%
Humanity's Last Exam (कोई टूल नहीं)	41.40%	39.8%	43.10%	42.7%	46.90%	44.4%
Humanity's Last Exam (टूल्स के साथ)	52.2%	52.1%	57.2%	58.7%	54.70%	51.40%

साइबरसिक्योरिटी

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
कैप्चर-द-फ्लैग्स चैलेंज टास्क्स (आंतरिक)****	88.1%	83.70%	-	-	-	-
CyberGym	81.80%	79.00%	-	-	73.10%	-

^{**** सिस्टम कार्ड्स में इस्तेमाल होने वाले सबसे कठिन CTFs का विस्तार, जिसमें अतिरिक्त कठिन चुनौतियाँ शामिल हैं.}

लंबा कॉन्टेक्स्ट

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k f1	73.7%	62.50%	-	-	76.90%	-
Graphwalks BFS 1mil f1	45.40%	9.40%	-	-	41.2% (Opus 4.6)	-
Graphwalks parents 256k f1	90.1%	82.8%	-	-	93.60%	-
Graphwalks parents 1mil f1	58.5%	44.40%	-	-	72.0% (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K-8K	98.1%	97.3%	-	-	-	-
OpenAI MRCR v2 8-needle 8K-16K	93.0%	91.4%	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96.5%	97.2%	-	-	-	-
OpenAI MRCR v2 8-needle 32K-64K	90.0%	90.5%	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83.10%	86.0%	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87.50%	79.3%	-	-	59.2%	-
OpenAI MRCR v2 8-needle 256K-512K	81.50%	57.5%	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74.0%	36.6%	-	-	32.2%	-

एब्सट्रैक्ट रीज़निंग

इवैल	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (सत्यापित)	95.0%	93.7%	-	94.5%	93.5%	98.0%
ARC-AGI-2 (Verified)	85.0%	73.3%	-	83.3%	75.8%	77.1%

GPT के मूल्यांकन को रीज़निंग xhigh पर सेट करके चलाया गया था और वे एक शोध वातावरण में किए गए थे, जो कुछ मामलों में उत्पादन ChatGPT से थोड़ा अलग आउटपुट दे सकता है.