Agents SDK का अगला चरण
अपडेटेड Agents SDK डेवलपर्स को ऐसे एजेंट्स बनाने में मदद करता है जो फाइल्स की जांच कर सकें, कमांड्स चला सकें, कोड एडिट कर सकें और नियंत्रित सैंडबॉक्स एनवायरनमेंट में लंबे समय तक चलने वाले टास्क्स पर काम कर सकें.
हम Agents SDK में नई कैपेबिलिटीज़ ला रहे हैं जो डेवलपर्स को स्टैंडर्डाइज़्ड इंफ्रास्ट्रक्चर देती हैं, जिससे शुरुआत करना आसान हो और जो OpenAI मॉडल्स के लिए सही तरीके से बना हो: एक मॉडल-नेटिव हार्नेस जो एजेंट्स को कंप्यूटर पर फाइल्स और टूल्स के बीच काम करने देता है, साथ ही उस काम को सुरक्षित रूप से चलाने के लिए नेटिव सैंडबॉक्स एग्ज़िक्यूशन भी देता है.
उदाहरण के लिए, डेवलपर्स किसी एजेंट को एक नियंत्रित वर्कस्पेस, स्पष्ट निर्देश और एविडेंस की जांच के लिए ज़रूरी टूल्स दे सकते हैं:
उपयोगी एजेंट्स बनाने के लिए डेवलपर्स को सिर्फ बेहतरीन मॉडल्स से ज़्यादा चाहिए—उन्हें ऐसे सिस्टम्स चाहिए जो एजेंट्स को फाइल्स की जांच करने, कमांड्स चलाने, कोड लिखने और कई स्टेप्स में लगातार काम करने में सपोर्ट करें.
आज के सिस्टम्स में कुछ समझौते होते हैं, खासकर जब टीमें प्रोटोटाइप से प्रोडक्शन की ओर बढ़ती हैं. मॉडल-अग्नॉस्टिक फ्रेमवर्क्स लचीले होते हैं लेकिन फ्रंटियर मॉडल्स की क्षमताओं का पूरा उपयोग नहीं कर पाते; मॉडल-प्रोवाइडर SDKs मॉडल के करीब होते हैं लेकिन अक्सर हार्नेस में पर्याप्त विज़िबिलिटी नहीं देते; और मैनेज्ड एजेंट APIs डिप्लॉयमेंट को आसान बनाते हैं लेकिन यह सीमित कर देते हैं कि एजेंट्स कहाँ चल सकते हैं और संवेदनशील डेटा तक कैसे पहुंच सकते हैं.
हमारे साथ नए SDK को टेस्ट करने वाले कुछ कस्टमर्स ने यह कहा:
“GPT-5.4 दस्तावेज़-प्रधान कानूनी काम के लिए एक नया मानक स्थापित करता है. हमारे BigLaw Bench eval पर, इसका स्कोर 91% था. अन्य मॉडलों की तुलना में, GPT-5.4 वर्तमान में जटिल लेन-देन विश्लेषण को व्यवस्थित करने, लंबे कॉन्ट्रैक्ट्स में सटीकता बनाए रखने और लीगल पेशेवरों को आवश्यक उच्च स्तर की डिटेल प्रदान करने में बेहतर है.”
आज की रिलीज़ के साथ, Agents SDK का हार्नेस उन एजेंट्स के लिए और अधिक सक्षम हो गया है जो डॉक्यूमेंट्स, फाइल्स और सिस्टम्स के साथ काम करते हैं. इसमें अब कॉन्फ़िगरेबल मेमोरी, सैंडबॉक्स-अवेयर ऑर्केस्ट्रेशन, Codex जैसे फाइलसिस्टम टूल्स और उन प्रिमिटिव्स के साथ स्टैंडर्ड इंटीग्रेशन शामिल हैं जो फ्रंटियर एजेंट सिस्टम्स में आम होते जा रहे हैं.
इनमें MCP(एक नई विंडो में खुलेगा) के ज़रिए टूल उपयोग, skills(एक नई विंडो में खुलेगा) के ज़रिए प्रोग्रेसिव डिस्क्लोज़र, और AGENTS.md(एक नई विंडो में खुलेगा) के ज़रिए कस्टम निर्देश शामिल हैं, shell(एक नई विंडो में खुलेगा) टूल का उपयोग करके कोड एग्ज़िक्यूशन, apply patch(एक नई विंडो में खुलेगा) टूल से फाइल एडिट्स, और भी बहुत कुछ. यह हार्नेस समय के साथ नए एजेंटिक पैटर्न्स और प्रिमिटिव्स को शामिल करता रहेगा, ताकि डेवलपर्स कोर इंफ्रास्ट्रक्चर अपडेट्स पर कम समय दें और उस डोमेन-विशिष्ट लॉजिक पर ज़्यादा ध्यान दे सकें जो उनके एजेंट्स को उपयोगी बनाता है.
यह हार्नेस डेवलपर्स को फ्रंटियर मॉडल्स की क्षमताओं का बेहतर उपयोग करने में भी मदद करता है, क्योंकि यह एग्ज़िक्यूशन को उन मॉडल्स के सबसे अच्छे काम करने के तरीके के साथ संरेखित करता है. इससे एजेंट्स मॉडल के प्राकृतिक काम करने के पैटर्न के करीब रहते हैं, जिससे जटिल टास्क्स पर रिलायबिलिटी और परफॉर्मेंस बेहतर होती है—खासकर जब काम लंबा चलने वाला हो या कई तरह के टूल्स और सिस्टम्स के बीच समन्वय की ज़रूरत हो.
इसके अलावा, हम समझते हैं कि हर प्रोडक्ट अलग होता है और अक्सर किसी तय ढांचे में पूरी तरह फिट नहीं बैठता. हमने Agents SDK को इस विविधता को सपोर्ट करने के लिए डिज़ाइन किया है. डेवलपर्स को एक ऐसा हार्नेस मिलता है जो टर्नकी होने के साथ लचीला भी है—जिसे अपने स्टैक के हिसाब से आसानी से ढाला जा सकता है, जिसमें टूल उपयोग, मेमोरी और सैंडबॉक्स एनवायरनमेंट शामिल हैं.
अपडेटेड Agents SDK नेटिव रूप से सैंडबॉक्स एग्ज़िक्यूशन को सपोर्ट करता है, जिससे एजेंट्स नियंत्रित कंप्यूटर एनवायरनमेंट में अपने टास्क के लिए ज़रूरी फाइल्स, टूल्स और डिपेंडेंसीज़ के साथ काम कर सकते हैं.
कई उपयोगी एजेंट्स को ऐसे वर्कस्पेस की ज़रूरत होती है जहाँ वे फाइल्स पढ़ और लिख सकें, डिपेंडेंसीज़ इंस्टॉल कर सकें, कोड चला सकें और टूल्स का सुरक्षित उपयोग कर सकें. नेटिव सैंडबॉक्स सपोर्ट डेवलपर्स को यह एग्ज़िक्यूशन लेयर सीधे देता है, ताकि उन्हें इसे अलग-अलग हिस्सों से खुद जोड़कर बनाने की ज़रूरत न पड़े.
डेवलपर्स अपना खुद का सैंडबॉक्स ला सकते हैं या Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop और Vercel के लिए बिल्ट-इन सपोर्ट का उपयोग कर सकते हैं.
इन एनवायरनमेंट्स को अलग-अलग प्रोवाइडर्स के बीच पोर्टेबल बनाने के लिए, SDK एजेंट के वर्कस्पेस को वर्णित करने के लिए Manifest एब्स्ट्रैक्शन भी पेश करता है. डेवलपर्स लोकल फाइल्स माउंट कर सकते हैं, आउटपुट डायरेक्टरीज़ तय कर सकते हैं और AWS S3, Google Cloud Storage, Azure Blob Storage और Cloudflare R2 जैसे स्टोरेज प्रोवाइडर्स से डेटा ला सकते हैं.
इससे डेवलपर्स को लोकल प्रोटोटाइप से लेकर प्रोडक्शन डिप्लॉयमेंट तक एजेंट के एनवायरनमेंट को एक समान तरीके से सेट करने का तरीका मिलता है. यह मॉडल को एक पूर्वानुमेय वर्कस्पेस भी देता है: इनपुट कहाँ मिलेंगे, आउटपुट कहाँ लिखने हैं और लंबे समय तक चलने वाले टास्क में काम को कैसे व्यवस्थित रखना है.

एजेंट सिस्टम्स को इस मानकर डिज़ाइन किया जाना चाहिए कि प्रॉम्प्ट-इंजेक्शन और डेटा एक्सफिल्ट्रेशन के प्रयास होंगे. हार्नेस और कंप्यूट को अलग रखने से क्रेडेंशियल्स उन एनवायरनमेंट्स से बाहर रहते हैं जहाँ मॉडल द्वारा जनरेट किया गया कोड चलता है.
यह टिकाऊ एग्ज़िक्यूशन को भी संभव बनाता है. जब एजेंट की स्टेट बाहरी रूप से स्टोर होती है, तो सैंडबॉक्स कंटेनर खोने का मतलब रन खोना नहीं होता. बिल्ट-इन स्नैपशॉटिंग और रीहाइड्रेशन के साथ, Agents SDK एजेंट की स्टेट को नए कंटेनर में बहाल कर सकता है और अगर मूल एनवायरनमेंट फेल हो जाए या एक्सपायर हो जाए, तो आखिरी चेकपॉइंट से काम जारी रख सकता है.
अंत में, यह एजेंट्स को और अधिक स्केलेबल बनाता है. एजेंट रन एक या कई सैंडबॉक्स का उपयोग कर सकते हैं, ज़रूरत होने पर ही सैंडबॉक्स शुरू कर सकते हैं, सब-एजेंट्स को अलग-थलग एनवायरनमेंट्स में रूट कर सकते हैं और तेज़ एग्ज़िक्यूशन के लिए कंटेनर्स में काम को पैरेलल कर सकते हैं.
ये नई Agents SDK कैपेबिलिटीज़ API के ज़रिए सभी कस्टमर्स के लिए आम तौर पर उपलब्ध हैं और टोकन्स और टूल उपयोग के आधार पर स्टैंडर्ड API प्राइसिंग का उपयोग करती हैं.
जैसे-जैसे हम Agents SDK को आगे विकसित करते रहेंगे, हम इसके साथ डेवलपर्स क्या बना सकते हैं, इसे और बढ़ाते रहेंगे, ताकि कम कस्टम इंफ्रास्ट्रक्चर के साथ अधिक सक्षम एजेंट्स को प्रोडक्शन में लाना आसान हो, और साथ ही डेवलपर्स को अपने एनवायरनमेंट्स में एजेंट्स फिट करने के लिए ज़रूरी लचीलापन और कंट्रोल भी बना रहे.
नई हार्नेस और सैंडबॉक्स कैपेबिलिटीज़ पहले Python में लॉन्च हो रही हैं, जबकि TypeScript सपोर्ट भविष्य की रिलीज़ के लिए योजना में है. हम अतिरिक्त एजेंट कैपेबिलिटीज़, जैसे कोड मोड और सब-एजेंट्स, को Python और TypeScript दोनों में लाने पर भी काम कर रहे हैं.
इसके अलावा, हम समय के साथ व्यापक एजेंट इकोसिस्टम को साथ लाने में मदद करना चाहते हैं, जिसमें अधिक सैंडबॉक्स प्रोवाइडर्स का सपोर्ट, ज़्यादा इंटीग्रेशन्स और डेवलपर्स के लिए SDK को उनके मौजूदा टूल्स और सिस्टम्स में जोड़ने के और तरीके शामिल होंगे.


