स्किप करके मेन कंटेंट पर जाऍं
OpenAI

Responses API में नए टूल और फ़ीचर

डेवलपर और एंटरप्राइज़ के लिए Responses API में रिमोट MCP सर्वर सपोर्ट, इमेज जेनरेशन, कोड इंटरप्रेटर और बहुत कुछ पेश किया जा रहा है.

लोड किया जा रहा है...

आज हम Responses API में नया बिल्‍ट-इन टूल जोड़ रहे हैं – जो एजेंटिक ऐप्लिकेशन बनाने के लिए हमारा कोर API प्रिमिटिव है. इसमें सभी रिमोट मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) सर्वर(एक नई विंडो में खुलेगा)शामिल हैं, साथ ही इमेज जेनरेशन(एक नई विंडो में खुलेगा), कोड इंटरप्रेटर(एक नई विंडो में खुलेगा), और फ़ाइल सर्च(एक नई विंडो में खुलेगा) में बेहतरी जैसे टूल भी शामिल हैं. ये टूल हमारे GPT‑4o सीरीज़, GPT‑4.1 सीरीज़, और OpenAI o-सीरीज़ रीज़निंग मॉडल में उपलब्‍ध हैं. o3 और o4-mini अब Responses API में अपने Chain-of-Thought में सीधे टूल और फ़ंक्शन को कॉल कर सकते हैं, जो ज़्यादा कॉन्टेक्स्ट से जुड़े हुए और प्रासंगिक जवाब देते हैं. Responses API के साथ o3 और o4-mini के इस्तेमाल से अनुरोधों और टूल कॉल में रीजनिंग टोकन बने रहते हैं, मॉडल इंटेलिजेंस बेहतर होती है और डेवलपर के लिए ख़र्चा और लेटेंसी कम होती है.

हम Responses API में नए फ़ीचर भी पेश कर रहे हैं, जो एंटरप्राइज़ और डेवलपर के लिए भरोसा, विज़ि‍बिलिटी और गोपनीयता को बेहतर बनाते हैं. इसमें शामिल हैं: समय और रफ़्तार में बेतरतीब तरीक़े से बहुत ही लंबे चलने वाले टास्‍क को संभालने और ज्‍़यादा भरोसे के लिए बैकग्राउंड मोड(एक नई विंडो में खुलेगा), रीज़निंग सारांश(एक नई विंडो में खुलेगा) के लिए सपोर्ट, और एन्क्रिप्टिड रीज़निंग आइ‍टम(एक नई विंडो में खुलेगा) के लिए सपोर्ट. 

मार्च 2025 में वेब सर्च, फ़ाइल सर्च और कंप्यूटर यूज़ जैसे टूल के साथ Responses API को रिलीज़ करने के बाद से, सैकड़ों-हज़ारों डेवलपर ने हमारे मॉडल में खरबों की गिनती में टोकन को प्रोसेस करने के लिए API को इस्तेमाल किया है. कस्‍टमर ने अलग-अलग तरह की एजेंटिक ऐप्लिकेशन बनाने के लिए API का इस्‍तेमाल किया, इनमें शामिल हैं: Zencoder(एक नई विंडो में खुलेगा) का कोडिंग एजेंट, Revi(एक नई विंडो में खुलेगा) का प्राइवेट इक्विटी और निवेश बैंकिंग के लिए मार्केट इंटेलिजेंस एजेंट, और MagicSchool AI(एक नई विंडो में खुलेगा) का एजूकेशन असिस्टेंट—ये सभी अपने ऐप में उपयुक्त, अप-टू-डेट जानकारी उपलब्ध कराने के लिए वेब सर्च का इस्तेमाल करते हैं. अब डेवलपर ऐसे एजेंट बना सकते हैं, जो आज रिलीज़ किए गए नए टूल और फ़ीचर के एक्‍सेस के साथ और भी ज़्यादा कारगर और भरोसेमंद होते हैं.

नया रिमोट MCP सर्वर सपोर्ट

हम Responses API में रिमोट MCP सर्वर(एक नई विंडो में खुलेगा) के‍ लिए सपोर्ट जोड़ रहे हैं, जो एजेंट SDK में MCP सपोर्ट(एक नई विंडो में खुलेगा) की रिलीज़ पर बना है. MCP एक ओपन प्रोटोकॉल है, जो ये स्टैंडर्ड बनाता है कि ऐ‍प्लिकेशन कैसे LLM को कॉन्टेक्स्ट उपलब्‍ध कराएगा. Responses API में MCP सर्वर का सपोर्ट करके, डेवलपर हमारे मॉडल को किसी भी MCP सर्वर पर होस्ट किए गए टूल से सिर्फ़ कुछ कोड लाइन के साथ कनेक्ट कर सकेंगे. ये कुछ उदाहरण हैं, जिनमें बताया गया है कि आज डेवलपर Responses API के साथ रिमोर्ट MCP सर्वर को कैसे इस्‍तेमाल कर सकते हैं:

Python

1
response = client.responses.create(
2
model="gpt-4.1",
3
tools=[{
4
"type": "mcp",
5
"server_label": "shopify",
6
"server_url": "https://pitchskin.com/api/mcp",
7
}],
8
input="Add the Blemish Toner Pads to my cart"
9
)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

लोकप्रिय रिमोट MCP सर्वर में शामिल हैं: Cloudflare(एक नई विंडो में खुलेगा), HubSpot(एक नई विंडो में खुलेगा), Intercom(एक नई विंडो में खुलेगा), PayPal(एक नई विंडो में खुलेगा), Plaid(एक नई विंडो में खुलेगा), Shopify(एक नई विंडो में खुलेगा), Stripe(एक नई विंडो में खुलेगा), Square(एक नई विंडो में खुलेगा), Twilio(एक नई विंडो में खुलेगा), Zapier(एक नई विंडो में खुलेगा) आदि. हमें उम्मीद है कि आने वाले महीनों में रिमोर्ट MCP सर्वर का इकोसिस्‍टम तेज़ी से बढ़ेगा, जिससे डेवलपर आसानी से मज़बूत एजेंट बना पाएंगे, जो उन टूल और डेटा सोर्सेस से जुड़ सकेंगे, जिन पर उनके यूज़र का पहले से ही भरोसा है. इकोसिस्‍टम को सबसे बेहतरीन सपोर्ट देने और इस डेवलप होते स्‍टैंडर्ड में योगदान देने के लिए OpenAI भी MCP की कंट्रोल कमिटी में शामिल हो गया है.

अपने ख़ुद के रिमोर्ट MCP सर्वर को चलाने के बारे में जानने के लिए Cloudflare(एक नई विंडो में खुलेगा) की इस गाइड को देखें. Responses API में MCP टूल को इस्‍तेमाल करने के बारे में जानने के लिए हमारी API कुकबुक में इस गाइड(एक नई विंडो में खुलेगा) को देखें.

इमेज जेनरेशन, कोड इंटरप्रेटर और फ़ाइल सर्च के लिए अपडेट

Responses API में बिल्‍ट-इन टूल के साथ डेवलपर आसानी से सिर्फ़ एक API कॉल से ज्‍़यादा कारगर एजेंट बना सकते हैं. रीज़निंग के वक्‍़त कई सारे टूल को कॉल करके, मॉडल अब ह्यूमैनिटीज़ लास्ट एग्‍ज़ाम (सोर्स) जैसे इंडस्‍ट्री-स्‍टैंडर्ड बेंचमार्क पर काफ़ी अच्‍छी टूल कॉलिंग परफ़ॉर्मेंस हासिल कर सकते हैं. आज हम जो नए टूल जोड़ रहे हैं, उनमें शामिल हैं:

  • इमेज जेनरेशन: इमेज API(एक नई विंडो में खुलेगा) को इस्‍तेमाल करने के अलावा, डेवलपर अब Responses API में एक टूल के तौर पर हमारे लेटेस्‍ट इमेज जेनरेशन मॉडलgpt-image-1—को एक्सेस कर सकते हैं. यह टूल रियल-टाइम स्ट्रीमिंग को सपोर्ट करता है – जिससे जनरेट होते समय डेवलपर इमेज के प्रीव्‍यू देख पाता है – और मल्‍टी-टर्न एडिट – डेवलपर को मॉडल को इन इमेज को क़दम-दर-क़दम बारीकी से रिफ़ाइन करने के लिए प्रॉम्प्ट करने देता है. और ज़्यादा जानें(एक नई विंडो में खुलेगा).
  • कोड इंटरप्रेटर: डेवलपर अब Responses API में कोड इंटरप्रेटर(एक नई विंडो में खुलेगा) टूल को इस्‍तेमाल कर सकते हैं. यह टूल डेटा एनालिसिस, पेचीदा मैथ और कोडिंग प्रॉब्‍लम को हल करने और मॉडल को इमेज को ज्‍़यादा बारीकी से समझने और उनमें हेरफेर में मदद करने में कारगर है (जैसे कि, इमेज के साथ सोचना). o3 और o4-mini जैसे मॉडल के लिए उनके Chain-of-Thought में कोड इंटरप्रेटर टूल का इस्‍तेमाल करने की क्षमता के नतीजे के तौर पर ह्यूमैनिटीज़ लास्ट एग्ज़ाम (सोर्स) समेत कई बेंचमार्क में बेहतरीन परफ़ॉर्मेंस आई है. और ज़्यादा जानें(एक नई विंडो में खुलेगा).
  • फ़ाइल सर्च: डेवलपर अब हमारे रीज़निंग मॉडल में फ़ाइल सर्च(एक नई विंडो में खुलेगा) टूल को एक्सेस कर सकते हैं. फ़ाइल सर्च डेवलपर को यूज़र क्वेरी के आधार पर अपने डॉक्यूमेंट के उपयुक्त हिस्सों को मॉडल के कॉन्टेक्स्ट में निकालने में इनेबल करती है. हम फ़ाइल सर्च टूल में भी अपडेट पेश कर रहे हैं, जो डेवलपर को कई वेक्टर स्टोर में सर्च करने और बड़े से कलेक्‍शन के साथ ख़ास फ़िल्टरिंग का सपोर्ट करने देता है. और ज़्यादा जानें(एक नई विंडो में खुलेगा).

Responses API में नए फ़ीचर

नए टूल के अलावा, हम Responses API में नए फ़ीचर के लिए सपोर्ट भी जोड़ रहे हैं, इनमें शामिल हैं:

  • बैकग्राउंड मोड: जैसा कि Codex, डीप रिसर्च, और Operator, रीज़निंग मॉडल जैसे एजेंटिक प्रोडक्‍ट में देखा गया, ये पेचीदा प्रॉब्‍लम को हल करने के लिए कई मिनट ले सकते हैं. डेवलपर अब टाइमआउट या कनेक्टिविटी से जुड़ी अन्‍य दिक्‍़क़तों के बारे में बिना चिंता किए o3 जैसे मॉडल पर वैसे ही अनुभव लेने के लिए बैकग्राउंड मोड का इस्‍तेमाल कर सकते हैं – बैकग्राउंड मोड इन टास्क को समय और रफ़्तार में बेतरतीब तरीक़े से शुरू करता है. डेवलपर या तो इन ऑब्जेक्ट को पोल करके कंप्लिशन को चेक कर सकते हैं, या जब भी उनके ऐप्लिकेशन को लेटेस्‍ट स्‍टेट को लेने की ज़रूरत होती है, तो वे इवेंट्स की स्ट्रीमिंग शुरू कर सकते हैं. और ज़्यादा जानें(एक नई विंडो में खुलेगा).

Python

1
response = client.responses.create(
2
model="o3",
3
input="Write me an extremely long story.",
4
reasoning={ "effort": "high" },
5
background=True
6
)
  • रीज़निंग के सारांश: Responses API अब मॉडल की इंटर्नल Chain-of-Thought का संक्षिप्त, नैचूरल-लैंग्‍वेज सारांश जनरेट कर सकता है, जैसा कि आपने ChatGPT में देखा है. इसने डेवलपर के लिए डीबग, ऑडिट और एंड-यूज़र के अनुभव बेहतर बनाने को आसान कर दिया है. रीज़निंग सारांश बिना किसी तरह के अलग से ख़र्चे के उपलब्‍ध हैं. और ज़्यादा जानें(एक नई विंडो में खुलेगा).

Python

1
response = client.responses.create(
2
model="o4-mini",
3
tools=[
4
{
5
"type": "code_interpreter",
6
"container": {"type": "auto"}
7
}
8
],
9
instructions=(
10
"You are a personal math tutor. "
11
"When asked a math question, run code to answer the question."
12
),
13
input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14
reasoning={"summary": "auto"}
15
)
  • एन्क्रिप्‍टेड रीज़निंग आइटम: जो कस्‍टमर एलिजिबल हैं ज़ीरो डेटा रिटेंशन (ZDR)(एक नई विंडो में खुलेगा) के लिए अब API अनुरोधों में रीज़निंग आइटम का फिर से इस्‍तेमाल कर सकेंगे – वो भी बिना किसी रीज़निंग आइटम को OpenAI के सर्वर पर स्‍टोर किए हुए. o3 और o4-mini जैसे मॉडल के लिए, फ़ंक्शन कॉल में रीज़निंग आइटम के फिर से इस्‍तेमाल से इंटेलिजेंस बढ़ती है, टोकन के इस्‍तेमाल में कमी आती है, और कैच हिट रेट बढ़ती है, जिससे ख़र्चा और लेटेंसी कम हो जाती है. और ज़्यादा जानें(एक नई विंडो में खुलेगा).

Python

1
response = client.responses.create(
2
model="o3",
3
input="Implement a simple web server in Rust from scratch.",
4
store=False,
5
include=["reasoning.encrypted_content"]
6
)

दाम और उपलब्‍धता

ये सभी टूल और फ़ीचर अब Responses API में उपलब्ध हैं, जो हमारी GPT‑4o सीरीज़, GPT‑4.1 सीरीज़, और हमारे OpenAI o-सीरीज़ के रीज़निंग मॉडल (o1, o3, o3‑mini, और o4-mini) में सपोर्ट किए जाते हैं. इमेज जेनरेशन सिर्फ़ हमारी रीज़निंग मॉडल सीरीज़ के o3 पर सपोर्ट की जाती है. 

मौजूदा टूल के दाम वही रहेंगे. इमेज जेनरेशन का ख़र्चा $5.00/1M टेक्‍स्‍ट इनपुट टोकन, $10.00 / 1M इमेज इनपुट टोकन, और $40.00 / 1M इमेज आउटपुट टोकन है, साथ ही कैच किए गए इनपुट टोकन पर 75% की छूट है. कोड इंटरप्रेटर का ख़र्चा $0.03 प्रति कंटेनर है. फ़ाइल सर्च का ख़र्चा वेक्‍टर स्‍टोरेज के लिए हर रोज़ $0.10/GB और टूल कॉल के लिए $2.50/1k है. रिमोट MCP सर्वर टूल को कॉल का कोई अलग से ख़र्चा नहीं आता – आपको सिर्फ़ API से आउटपुट टोकन का बिल भेजा जाता है. हमारे डॉक्‍स में दाम(एक नई विंडो में खुलेगा) के बारे में और ज़्यादा जानें. 

हम इसे लेकर बहुत रोमांचित हैं कि आप क्‍या बनाते हैं!