15 अप्रैल 2026

Agents SDK का अगला चरण

अपडेटेड Agents SDK डेवलपर्स को ऐसे एजेंट्स बनाने में मदद करता है जो फाइल्स की जांच कर सकें, कमांड्स चला सकें, कोड एडिट कर सकें और नियंत्रित सैंडबॉक्स एनवायरनमेंट में लंबे समय तक चलने वाले टास्क्स पर काम कर सकें.

लोड किया जा रहा है...

हम Agents SDK में नई कैपेबिलिटीज़ ला रहे हैं जो डेवलपर्स को स्टैंडर्डाइज़्ड इंफ्रास्ट्रक्चर देती हैं, जिससे शुरुआत करना आसान हो और जो OpenAI मॉडल्स के लिए सही तरीके से बना हो: एक मॉडल-नेटिव हार्नेस जो एजेंट्स को कंप्यूटर पर फाइल्स और टूल्स के बीच काम करने देता है, साथ ही उस काम को सुरक्षित रूप से चलाने के लिए नेटिव सैंडबॉक्स एग्ज़िक्यूशन भी देता है.

उदाहरण के लिए, डेवलपर्स किसी एजेंट को एक नियंत्रित वर्कस्पेस, स्पष्ट निर्देश और एविडेंस की जांच के लिए ज़रूरी टूल्स दे सकते हैं:

Python

1# pip install "openai-agents>=0.14.0"
2
3import asyncio
4import tempfile
5from pathlib import Path
6
7from agents import Runner
8from agents.run import RunConfig
9from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10from agents.sandbox.entries import LocalDir
11from agents.sandbox.sandboxes import UnixLocalSandboxClient
12
13
14async def main() -> None:
15    with tempfile.TemporaryDirectory() as tmp:
16        dataroom = Path(tmp) / "dataroom"
17        dataroom.mkdir()
18        (dataroom / "metrics.md").write_text(
19            """# Annual metrics
20
21| Year | Revenue | Operating income | Operating cash flow |
22| --- | ---: | ---: | ---: |
23| FY2025 | $124.3M | $18.6M | $24.1M |
24| FY2024 | $98.7M | $12.4M | $17.9M |
25""",
26            encoding="utf-8",
27        )
28
29        agent = SandboxAgent(
30            name="Dataroom Analyst",
31            model="gpt-5.4",
32            instructions="Answer using only files in data/. Cite source filenames.",
33            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34        )
35
36        result = await Runner.run(
37            agent,
38            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39            run_config=RunConfig(
40                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41            ),
42        )
43        print(result.final_output)
44
45
46if __name__ == "__main__":
47    asyncio.run(main())
48

उपयोगी एजेंट्स बनाने के लिए डेवलपर्स को सिर्फ बेहतरीन मॉडल्स से ज़्यादा चाहिए—उन्हें ऐसे सिस्टम्स चाहिए जो एजेंट्स को फाइल्स की जांच करने, कमांड्स चलाने, कोड लिखने और कई स्टेप्स में लगातार काम करने में सपोर्ट करें.

आज के सिस्टम्स में कुछ समझौते होते हैं, खासकर जब टीमें प्रोटोटाइप से प्रोडक्शन की ओर बढ़ती हैं. मॉडल-अग्नॉस्टिक फ्रेमवर्क्स लचीले होते हैं लेकिन फ्रंटियर मॉडल्स की क्षमताओं का पूरा उपयोग नहीं कर पाते; मॉडल-प्रोवाइडर SDKs मॉडल के करीब होते हैं लेकिन अक्सर हार्नेस में पर्याप्त विज़िबिलिटी नहीं देते; और मैनेज्ड एजेंट APIs डिप्लॉयमेंट को आसान बनाते हैं लेकिन यह सीमित कर देते हैं कि एजेंट्स कहाँ चल सकते हैं और संवेदनशील डेटा तक कैसे पहुंच सकते हैं.

हमारे साथ नए SDK को टेस्ट करने वाले कुछ कस्टमर्स ने यह कहा:

“GPT-5.4 दस्तावेज़-प्रधान कानूनी काम के लिए एक नया मानक स्थापित करता है. हमारे BigLaw Bench eval पर, इसका स्कोर 91% था. अन्य मॉडलों की तुलना में, GPT-5.4 वर्तमान में जटिल लेन-देन विश्लेषण को व्यवस्थित करने, लंबे कॉन्ट्रैक्ट्स में सटीकता बनाए रखने और लीगल पेशेवरों को आवश्यक उच्च स्तर की डिटेल प्रदान करने में बेहतर है.”

— Niko Grupen, Harvey में एप्लाइड रिसर्च के प्रमुख

एजेंट लूप के लिए एक और अधिक सक्षम हार्नेस

आज की रिलीज़ के साथ, Agents SDK का हार्नेस उन एजेंट्स के लिए और अधिक सक्षम हो गया है जो डॉक्यूमेंट्स, फाइल्स और सिस्टम्स के साथ काम करते हैं. इसमें अब कॉन्फ़िगरेबल मेमोरी, सैंडबॉक्स-अवेयर ऑर्केस्ट्रेशन, Codex जैसे फाइलसिस्टम टूल्स और उन प्रिमिटिव्स के साथ स्टैंडर्ड इंटीग्रेशन शामिल हैं जो फ्रंटियर एजेंट सिस्टम्स में आम होते जा रहे हैं.

इनमें MCP⁠(एक नई विंडो में खुलेगा) के ज़रिए टूल उपयोग, skills⁠(एक नई विंडो में खुलेगा) के ज़रिए प्रोग्रेसिव डिस्क्लोज़र, और AGENTS.md⁠(एक नई विंडो में खुलेगा) के ज़रिए कस्टम निर्देश शामिल हैं, shell⁠(एक नई विंडो में खुलेगा) टूल का उपयोग करके कोड एग्ज़िक्यूशन, apply patch⁠(एक नई विंडो में खुलेगा) टूल से फाइल एडिट्स, और भी बहुत कुछ. यह हार्नेस समय के साथ नए एजेंटिक पैटर्न्स और प्रिमिटिव्स को शामिल करता रहेगा, ताकि डेवलपर्स कोर इंफ्रास्ट्रक्चर अपडेट्स पर कम समय दें और उस डोमेन-विशिष्ट लॉजिक पर ज़्यादा ध्यान दे सकें जो उनके एजेंट्स को उपयोगी बनाता है.

डायग्राम दिखाता है कि Agent SDK कैसे यूज़र इनपुट, मॉडल्स और टूल्स को जोड़कर AI एजेंट्स बनाता है.

डायग्राम दिखाता है कि Agent SDK का उपयोग करके मॉडल्स, टूल्स और ऑर्केस्ट्रेशन के साथ AI एजेंट्स कैसे बनाए जाते हैं.

यह हार्नेस डेवलपर्स को फ्रंटियर मॉडल्स की क्षमताओं का बेहतर उपयोग करने में भी मदद करता है, क्योंकि यह एग्ज़िक्यूशन को उन मॉडल्स के सबसे अच्छे काम करने के तरीके के साथ संरेखित करता है. इससे एजेंट्स मॉडल के प्राकृतिक काम करने के पैटर्न के करीब रहते हैं, जिससे जटिल टास्क्स पर रिलायबिलिटी और परफॉर्मेंस बेहतर होती है—खासकर जब काम लंबा चलने वाला हो या कई तरह के टूल्स और सिस्टम्स के बीच समन्वय की ज़रूरत हो.

इसके अलावा, हम समझते हैं कि हर प्रोडक्ट अलग होता है और अक्सर किसी तय ढांचे में पूरी तरह फिट नहीं बैठता. हमने Agents SDK को इस विविधता को सपोर्ट करने के लिए डिज़ाइन किया है. डेवलपर्स को एक ऐसा हार्नेस मिलता है जो टर्नकी होने के साथ लचीला भी है—जिसे अपने स्टैक के हिसाब से आसानी से ढाला जा सकता है, जिसमें टूल उपयोग, मेमोरी और सैंडबॉक्स एनवायरनमेंट शामिल हैं.

नेटिव सैंडबॉक्स एग्ज़िक्यूशन

अपडेटेड Agents SDK नेटिव रूप से सैंडबॉक्स एग्ज़िक्यूशन को सपोर्ट करता है, जिससे एजेंट्स नियंत्रित कंप्यूटर एनवायरनमेंट में अपने टास्क के लिए ज़रूरी फाइल्स, टूल्स और डिपेंडेंसीज़ के साथ काम कर सकते हैं.

कई उपयोगी एजेंट्स को ऐसे वर्कस्पेस की ज़रूरत होती है जहाँ वे फाइल्स पढ़ और लिख सकें, डिपेंडेंसीज़ इंस्टॉल कर सकें, कोड चला सकें और टूल्स का सुरक्षित उपयोग कर सकें. नेटिव सैंडबॉक्स सपोर्ट डेवलपर्स को यह एग्ज़िक्यूशन लेयर सीधे देता है, ताकि उन्हें इसे अलग-अलग हिस्सों से खुद जोड़कर बनाने की ज़रूरत न पड़े.

डेवलपर्स अपना खुद का सैंडबॉक्स ला सकते हैं या Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop और Vercel के लिए बिल्ट-इन सपोर्ट का उपयोग कर सकते हैं.

इन एनवायरनमेंट्स को अलग-अलग प्रोवाइडर्स के बीच पोर्टेबल बनाने के लिए, SDK एजेंट के वर्कस्पेस को वर्णित करने के लिए Manifest एब्स्ट्रैक्शन भी पेश करता है. डेवलपर्स लोकल फाइल्स माउंट कर सकते हैं, आउटपुट डायरेक्टरीज़ तय कर सकते हैं और AWS S3, Google Cloud Storage, Azure Blob Storage और Cloudflare R2 जैसे स्टोरेज प्रोवाइडर्स से डेटा ला सकते हैं.

इससे डेवलपर्स को लोकल प्रोटोटाइप से लेकर प्रोडक्शन डिप्लॉयमेंट तक एजेंट के एनवायरनमेंट को एक समान तरीके से सेट करने का तरीका मिलता है. यह मॉडल को एक पूर्वानुमेय वर्कस्पेस भी देता है: इनपुट कहाँ मिलेंगे, आउटपुट कहाँ लिखने हैं और लंबे समय तक चलने वाले टास्क में काम को कैसे व्यवस्थित रखना है.

Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop के लोगो

सुरक्षा, टिकाऊपन और स्केल के लिए हार्नेस को कंप्यूट से अलग करना

एजेंट सिस्टम्स को इस मानकर डिज़ाइन किया जाना चाहिए कि प्रॉम्प्ट-इंजेक्शन और डेटा एक्सफिल्ट्रेशन के प्रयास होंगे. हार्नेस और कंप्यूट को अलग रखने से क्रेडेंशियल्स उन एनवायरनमेंट्स से बाहर रहते हैं जहाँ मॉडल द्वारा जनरेट किया गया कोड चलता है.

यह टिकाऊ एग्ज़िक्यूशन को भी संभव बनाता है. जब एजेंट की स्टेट बाहरी रूप से स्टोर होती है, तो सैंडबॉक्स कंटेनर खोने का मतलब रन खोना नहीं होता. बिल्ट-इन स्नैपशॉटिंग और रीहाइड्रेशन के साथ, Agents SDK एजेंट की स्टेट को नए कंटेनर में बहाल कर सकता है और अगर मूल एनवायरनमेंट फेल हो जाए या एक्सपायर हो जाए, तो आखिरी चेकपॉइंट से काम जारी रख सकता है.

अंत में, यह एजेंट्स को और अधिक स्केलेबल बनाता है. एजेंट रन एक या कई सैंडबॉक्स का उपयोग कर सकते हैं, ज़रूरत होने पर ही सैंडबॉक्स शुरू कर सकते हैं, सब-एजेंट्स को अलग-थलग एनवायरनमेंट्स में रूट कर सकते हैं और तेज़ एग्ज़िक्यूशन के लिए कंटेनर्स में काम को पैरेलल कर सकते हैं.

फ्लो डायग्राम दिखाता है कि Agent SDK कैसे AI एजेंट्स को अधिक जटिल टास्क्स के लिए अतिरिक्त कंप्यूट संसाधनों का उपयोग करने में सक्षम बनाता है.

डायग्राम दिखाता है कि Agent SDK से बने AI एजेंट्स अलग-अलग कंप्यूट सिस्टम्स को ऑर्केस्ट्रेट कर सकते हैं, जिससे वर्कलोड्स स्वतंत्र रूप से चल पाते हैं और ज़्यादा उन्नत टास्क्स को सपोर्ट मिलता है.

प्राइसिंग और उपलब्धता

ये नई Agents SDK कैपेबिलिटीज़ API के ज़रिए सभी कस्टमर्स के लिए आम तौर पर उपलब्ध हैं और टोकन्स और टूल उपयोग के आधार पर स्टैंडर्ड API प्राइसिंग का उपयोग करती हैं.

आगे क्या है

जैसे-जैसे हम Agents SDK को आगे विकसित करते रहेंगे, हम इसके साथ डेवलपर्स क्या बना सकते हैं, इसे और बढ़ाते रहेंगे, ताकि कम कस्टम इंफ्रास्ट्रक्चर के साथ अधिक सक्षम एजेंट्स को प्रोडक्शन में लाना आसान हो, और साथ ही डेवलपर्स को अपने एनवायरनमेंट्स में एजेंट्स फिट करने के लिए ज़रूरी लचीलापन और कंट्रोल भी बना रहे.

नई हार्नेस और सैंडबॉक्स कैपेबिलिटीज़ पहले Python में लॉन्च हो रही हैं, जबकि TypeScript सपोर्ट भविष्य की रिलीज़ के लिए योजना में है. हम अतिरिक्त एजेंट कैपेबिलिटीज़, जैसे कोड मोड और सब-एजेंट्स, को Python और TypeScript दोनों में लाने पर भी काम कर रहे हैं.

इसके अलावा, हम समय के साथ व्यापक एजेंट इकोसिस्टम को साथ लाने में मदद करना चाहते हैं, जिसमें अधिक सैंडबॉक्स प्रोवाइडर्स का सपोर्ट, ज़्यादा इंटीग्रेशन्स और डेवलपर्स के लिए SDK को उनके मौजूदा टूल्स और सिस्टम्स में जोड़ने के और तरीके शामिल होंगे.

लेखक

OpenAI

पढ़ते रहें

सभी देखें

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 अब Microsoft 365 Copilot में पसंदीदा मॉडल है

प्रोडक्ट9 जुलाई 2026

ChatGPT अब आपके सबसे महत्वाकांक्षी काम का साथी है

प्रोडक्ट9 जुलाई 2026

GPT-5.6: अत्याधुनिक इंटेलिजेंस, जो आपकी महत्वाकांक्षा के साथ स्केल होती है

प्रोडक्ट9 जुलाई 2026