Responses API में नए टूल और फ़ीचर
डेवलपर और एंटरप्राइज़ के लिए Responses API में रिमोट MCP सर्वर सपोर्ट, इमेज जेनरेशन, कोड इंटरप्रेटर और बहुत कुछ पेश किया जा रहा है.
आज हम Responses API में नया बिल्ट-इन टूल जोड़ रहे हैं – जो एजेंटिक ऐप्लिकेशन बनाने के लिए हमारा कोर API प्रिमिटिव है. इसमें सभी रिमोट मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) सर्वर(एक नई विंडो में खुलेगा)शामिल हैं, साथ ही इमेज जेनरेशन(एक नई विंडो में खुलेगा), कोड इंटरप्रेटर(एक नई विंडो में खुलेगा), और फ़ाइल सर्च(एक नई विंडो में खुलेगा) में बेहतरी जैसे टूल भी शामिल हैं. ये टूल हमारे GPT‑4o सीरीज़, GPT‑4.1 सीरीज़, और OpenAI o-सीरीज़ रीज़निंग मॉडल में उपलब्ध हैं. o3 और o4-mini अब Responses API में अपने Chain-of-Thought में सीधे टूल और फ़ंक्शन को कॉल कर सकते हैं, जो ज़्यादा कॉन्टेक्स्ट से जुड़े हुए और प्रासंगिक जवाब देते हैं. Responses API के साथ o3 और o4-mini के इस्तेमाल से अनुरोधों और टूल कॉल में रीजनिंग टोकन बने रहते हैं, मॉडल इंटेलिजेंस बेहतर होती है और डेवलपर के लिए ख़र्चा और लेटेंसी कम होती है.
हम Responses API में नए फ़ीचर भी पेश कर रहे हैं, जो एंटरप्राइज़ और डेवलपर के लिए भरोसा, विज़िबिलिटी और गोपनीयता को बेहतर बनाते हैं. इसमें शामिल हैं: समय और रफ़्तार में बेतरतीब तरीक़े से बहुत ही लंबे चलने वाले टास्क को संभालने और ज़्यादा भरोसे के लिए बैकग्राउंड मोड(एक नई विंडो में खुलेगा), रीज़निंग सारांश(एक नई विंडो में खुलेगा) के लिए सपोर्ट, और एन्क्रिप्टिड रीज़निंग आइटम(एक नई विंडो में खुलेगा) के लिए सपोर्ट.
मार्च 2025 में वेब सर्च, फ़ाइल सर्च और कंप्यूटर यूज़ जैसे टूल के साथ Responses API को रिलीज़ करने के बाद से, सैकड़ों-हज़ारों डेवलपर ने हमारे मॉडल में खरबों की गिनती में टोकन को प्रोसेस करने के लिए API को इस्तेमाल किया है. कस्टमर ने अलग-अलग तरह की एजेंटिक ऐप्लिकेशन बनाने के लिए API का इस्तेमाल किया, इनमें शामिल हैं: Zencoder(एक नई विंडो में खुलेगा) का कोडिंग एजेंट, Revi(एक नई विंडो में खुलेगा) का प्राइवेट इक्विटी और निवेश बैंकिंग के लिए मार्केट इंटेलिजेंस एजेंट, और MagicSchool AI(एक नई विंडो में खुलेगा) का एजूकेशन असिस्टेंट—ये सभी अपने ऐप में उपयुक्त, अप-टू-डेट जानकारी उपलब्ध कराने के लिए वेब सर्च का इस्तेमाल करते हैं. अब डेवलपर ऐसे एजेंट बना सकते हैं, जो आज रिलीज़ किए गए नए टूल और फ़ीचर के एक्सेस के साथ और भी ज़्यादा कारगर और भरोसेमंद होते हैं.
हम Responses API में रिमोट MCP सर्वर(एक नई विंडो में खुलेगा) के लिए सपोर्ट जोड़ रहे हैं, जो एजेंट SDK में MCP सपोर्ट(एक नई विंडो में खुलेगा) की रिलीज़ पर बना है. MCP एक ओपन प्रोटोकॉल है, जो ये स्टैंडर्ड बनाता है कि ऐप्लिकेशन कैसे LLM को कॉन्टेक्स्ट उपलब्ध कराएगा. Responses API में MCP सर्वर का सपोर्ट करके, डेवलपर हमारे मॉडल को किसी भी MCP सर्वर पर होस्ट किए गए टूल से सिर्फ़ कुछ कोड लाइन के साथ कनेक्ट कर सकेंगे. ये कुछ उदाहरण हैं, जिनमें बताया गया है कि आज डेवलपर Responses API के साथ रिमोर्ट MCP सर्वर को कैसे इस्तेमाल कर सकते हैं:
The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

लोकप्रिय रिमोट MCP सर्वर में शामिल हैं: Cloudflare(एक नई विंडो में खुलेगा), HubSpot(एक नई विंडो में खुलेगा), Intercom(एक नई विंडो में खुलेगा), PayPal(एक नई विंडो में खुलेगा), Plaid(एक नई विंडो में खुलेगा), Shopify(एक नई विंडो में खुलेगा), Stripe(एक नई विंडो में खुलेगा), Square(एक नई विंडो में खुलेगा), Twilio(एक नई विंडो में खुलेगा), Zapier(एक नई विंडो में खुलेगा) आदि. हमें उम्मीद है कि आने वाले महीनों में रिमोर्ट MCP सर्वर का इकोसिस्टम तेज़ी से बढ़ेगा, जिससे डेवलपर आसानी से मज़बूत एजेंट बना पाएंगे, जो उन टूल और डेटा सोर्सेस से जुड़ सकेंगे, जिन पर उनके यूज़र का पहले से ही भरोसा है. इकोसिस्टम को सबसे बेहतरीन सपोर्ट देने और इस डेवलप होते स्टैंडर्ड में योगदान देने के लिए OpenAI भी MCP की कंट्रोल कमिटी में शामिल हो गया है.
अपने ख़ुद के रिमोर्ट MCP सर्वर को चलाने के बारे में जानने के लिए Cloudflare(एक नई विंडो में खुलेगा) की इस गाइड को देखें. Responses API में MCP टूल को इस्तेमाल करने के बारे में जानने के लिए हमारी API कुकबुक में इस गाइड(एक नई विंडो में खुलेगा) को देखें.
Responses API में बिल्ट-इन टूल के साथ डेवलपर आसानी से सिर्फ़ एक API कॉल से ज़्यादा कारगर एजेंट बना सकते हैं. रीज़निंग के वक़्त कई सारे टूल को कॉल करके, मॉडल अब ह्यूमैनिटीज़ लास्ट एग्ज़ाम (सोर्स) जैसे इंडस्ट्री-स्टैंडर्ड बेंचमार्क पर काफ़ी अच्छी टूल कॉलिंग परफ़ॉर्मेंस हासिल कर सकते हैं. आज हम जो नए टूल जोड़ रहे हैं, उनमें शामिल हैं:
- इमेज जेनरेशन: इमेज API(एक नई विंडो में खुलेगा) को इस्तेमाल करने के अलावा, डेवलपर अब Responses API में एक टूल के तौर पर हमारे लेटेस्ट इमेज जेनरेशन मॉडल—
gpt-image-1—को एक्सेस कर सकते हैं. यह टूल रियल-टाइम स्ट्रीमिंग को सपोर्ट करता है – जिससे जनरेट होते समय डेवलपर इमेज के प्रीव्यू देख पाता है – और मल्टी-टर्न एडिट – डेवलपर को मॉडल को इन इमेज को क़दम-दर-क़दम बारीकी से रिफ़ाइन करने के लिए प्रॉम्प्ट करने देता है. और ज़्यादा जानें(एक नई विंडो में खुलेगा). - कोड इंटरप्रेटर: डेवलपर अब Responses API में कोड इंटरप्रेटर(एक नई विंडो में खुलेगा) टूल को इस्तेमाल कर सकते हैं. यह टूल डेटा एनालिसिस, पेचीदा मैथ और कोडिंग प्रॉब्लम को हल करने और मॉडल को इमेज को ज़्यादा बारीकी से समझने और उनमें हेरफेर में मदद करने में कारगर है (जैसे कि, इमेज के साथ सोचना). o3 और o4-mini जैसे मॉडल के लिए उनके Chain-of-Thought में कोड इंटरप्रेटर टूल का इस्तेमाल करने की क्षमता के नतीजे के तौर पर ह्यूमैनिटीज़ लास्ट एग्ज़ाम (सोर्स) समेत कई बेंचमार्क में बेहतरीन परफ़ॉर्मेंस आई है. और ज़्यादा जानें(एक नई विंडो में खुलेगा).
- फ़ाइल सर्च: डेवलपर अब हमारे रीज़निंग मॉडल में फ़ाइल सर्च(एक नई विंडो में खुलेगा) टूल को एक्सेस कर सकते हैं. फ़ाइल सर्च डेवलपर को यूज़र क्वेरी के आधार पर अपने डॉक्यूमेंट के उपयुक्त हिस्सों को मॉडल के कॉन्टेक्स्ट में निकालने में इनेबल करती है. हम फ़ाइल सर्च टूल में भी अपडेट पेश कर रहे हैं, जो डेवलपर को कई वेक्टर स्टोर में सर्च करने और बड़े से कलेक्शन के साथ ख़ास फ़िल्टरिंग का सपोर्ट करने देता है. और ज़्यादा जानें(एक नई विंडो में खुलेगा).
नए टूल के अलावा, हम Responses API में नए फ़ीचर के लिए सपोर्ट भी जोड़ रहे हैं, इनमें शामिल हैं:
- बैकग्राउंड मोड: जैसा कि Codex, डीप रिसर्च, और Operator, रीज़निंग मॉडल जैसे एजेंटिक प्रोडक्ट में देखा गया, ये पेचीदा प्रॉब्लम को हल करने के लिए कई मिनट ले सकते हैं. डेवलपर अब टाइमआउट या कनेक्टिविटी से जुड़ी अन्य दिक़्क़तों के बारे में बिना चिंता किए o3 जैसे मॉडल पर वैसे ही अनुभव लेने के लिए बैकग्राउंड मोड का इस्तेमाल कर सकते हैं – बैकग्राउंड मोड इन टास्क को समय और रफ़्तार में बेतरतीब तरीक़े से शुरू करता है. डेवलपर या तो इन ऑब्जेक्ट को पोल करके कंप्लिशन को चेक कर सकते हैं, या जब भी उनके ऐप्लिकेशन को लेटेस्ट स्टेट को लेने की ज़रूरत होती है, तो वे इवेंट्स की स्ट्रीमिंग शुरू कर सकते हैं. और ज़्यादा जानें(एक नई विंडो में खुलेगा).
- रीज़निंग के सारांश: Responses API अब मॉडल की इंटर्नल Chain-of-Thought का संक्षिप्त, नैचूरल-लैंग्वेज सारांश जनरेट कर सकता है, जैसा कि आपने ChatGPT में देखा है. इसने डेवलपर के लिए डीबग, ऑडिट और एंड-यूज़र के अनुभव बेहतर बनाने को आसान कर दिया है. रीज़निंग सारांश बिना किसी तरह के अलग से ख़र्चे के उपलब्ध हैं. और ज़्यादा जानें(एक नई विंडो में खुलेगा).
- एन्क्रिप्टेड रीज़निंग आइटम: जो कस्टमर एलिजिबल हैं ज़ीरो डेटा रिटेंशन (ZDR)(एक नई विंडो में खुलेगा) के लिए अब API अनुरोधों में रीज़निंग आइटम का फिर से इस्तेमाल कर सकेंगे – वो भी बिना किसी रीज़निंग आइटम को OpenAI के सर्वर पर स्टोर किए हुए. o3 और o4-mini जैसे मॉडल के लिए, फ़ंक्शन कॉल में रीज़निंग आइटम के फिर से इस्तेमाल से इंटेलिजेंस बढ़ती है, टोकन के इस्तेमाल में कमी आती है, और कैच हिट रेट बढ़ती है, जिससे ख़र्चा और लेटेंसी कम हो जाती है. और ज़्यादा जानें(एक नई विंडो में खुलेगा).
ये सभी टूल और फ़ीचर अब Responses API में उपलब्ध हैं, जो हमारी GPT‑4o सीरीज़, GPT‑4.1 सीरीज़, और हमारे OpenAI o-सीरीज़ के रीज़निंग मॉडल (o1, o3, o3‑mini, और o4-mini) में सपोर्ट किए जाते हैं. इमेज जेनरेशन सिर्फ़ हमारी रीज़निंग मॉडल सीरीज़ के o3 पर सपोर्ट की जाती है.
मौजूदा टूल के दाम वही रहेंगे. इमेज जेनरेशन का ख़र्चा $5.00/1M टेक्स्ट इनपुट टोकन, $10.00 / 1M इमेज इनपुट टोकन, और $40.00 / 1M इमेज आउटपुट टोकन है, साथ ही कैच किए गए इनपुट टोकन पर 75% की छूट है. कोड इंटरप्रेटर का ख़र्चा $0.03 प्रति कंटेनर है. फ़ाइल सर्च का ख़र्चा वेक्टर स्टोरेज के लिए हर रोज़ $0.10/GB और टूल कॉल के लिए $2.50/1k है. रिमोट MCP सर्वर टूल को कॉल का कोई अलग से ख़र्चा नहीं आता – आपको सिर्फ़ API से आउटपुट टोकन का बिल भेजा जाता है. हमारे डॉक्स में दाम(एक नई विंडो में खुलेगा) के बारे में और ज़्यादा जानें.
हम इसे लेकर बहुत रोमांचित हैं कि आप क्या बनाते हैं!