स्किप करके मेन कंटेंट पर जाऍं
OpenAI

15 अप्रैल 2026

प्रोडक्ट

Agents SDK का अगला चरण

अपडेटेड Agents SDK डेवलपर्स को ऐसे एजेंट्स बनाने में मदद करता है जो फाइल्स की जांच कर सकें, कमांड्स चला सकें, कोड एडिट कर सकें और नियंत्रित सैंडबॉक्स एनवायरनमेंट में लंबे समय तक चलने वाले टास्क्स पर काम कर सकें.

लोड किया जा रहा है...

हम Agents SDK में नई कैपेबिलिटीज़ ला रहे हैं जो डेवलपर्स को स्टैंडर्डाइज़्ड इंफ्रास्ट्रक्चर देती हैं, जिससे शुरुआत करना आसान हो और जो OpenAI मॉडल्स के लिए सही तरीके से बना हो: एक मॉडल-नेटिव हार्नेस जो एजेंट्स को कंप्यूटर पर फाइल्स और टूल्स के बीच काम करने देता है, साथ ही उस काम को सुरक्षित रूप से चलाने के लिए नेटिव सैंडबॉक्स एग्ज़िक्यूशन भी देता है.

उदाहरण के लिए, डेवलपर्स किसी एजेंट को एक नियंत्रित वर्कस्पेस, स्पष्ट निर्देश और एविडेंस की जांच के लिए ज़रूरी टूल्स दे सकते हैं:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

उपयोगी एजेंट्स बनाने के लिए डेवलपर्स को सिर्फ बेहतरीन मॉडल्स से ज़्यादा चाहिए—उन्हें ऐसे सिस्टम्स चाहिए जो एजेंट्स को फाइल्स की जांच करने, कमांड्स चलाने, कोड लिखने और कई स्टेप्स में लगातार काम करने में सपोर्ट करें.

आज के सिस्टम्स में कुछ समझौते होते हैं, खासकर जब टीमें प्रोटोटाइप से प्रोडक्शन की ओर बढ़ती हैं. मॉडल-अग्नॉस्टिक फ्रेमवर्क्स लचीले होते हैं लेकिन फ्रंटियर मॉडल्स की क्षमताओं का पूरा उपयोग नहीं कर पाते; मॉडल-प्रोवाइडर SDKs मॉडल के करीब होते हैं लेकिन अक्सर हार्नेस में पर्याप्त विज़िबिलिटी नहीं देते; और मैनेज्ड एजेंट APIs डिप्लॉयमेंट को आसान बनाते हैं लेकिन यह सीमित कर देते हैं कि एजेंट्स कहाँ चल सकते हैं और संवेदनशील डेटा तक कैसे पहुंच सकते हैं.

हमारे साथ नए SDK को टेस्ट करने वाले कुछ कस्टमर्स ने यह कहा:

“GPT-5.4 दस्तावेज़-प्रधान कानूनी काम के लिए एक नया मानक स्थापित करता है. हमारे BigLaw Bench eval पर, इसका स्कोर 91% था. अन्य मॉडलों की तुलना में, GPT-5.4 वर्तमान में जटिल लेन-देन विश्लेषण को व्यवस्थित करने, लंबे कॉन्ट्रैक्ट्स में सटीकता बनाए रखने और लीगल पेशेवरों को आवश्यक उच्च स्तर की डिटेल प्रदान करने में बेहतर है.”
— Niko Grupen, Harvey में एप्लाइड रिसर्च के प्रमुख

एजेंट लूप के लिए एक और अधिक सक्षम हार्नेस

आज की रिलीज़ के साथ, Agents SDK का हार्नेस उन एजेंट्स के लिए और अधिक सक्षम हो गया है जो डॉक्यूमेंट्स, फाइल्स और सिस्टम्स के साथ काम करते हैं. इसमें अब कॉन्फ़िगरेबल मेमोरी, सैंडबॉक्स-अवेयर ऑर्केस्ट्रेशन, Codex जैसे फाइलसिस्टम टूल्स और उन प्रिमिटिव्स के साथ स्टैंडर्ड इंटीग्रेशन शामिल हैं जो फ्रंटियर एजेंट सिस्टम्स में आम होते जा रहे हैं.

इनमें MCP(एक नई विंडो में खुलेगा) के ज़रिए टूल उपयोग, skills(एक नई विंडो में खुलेगा) के ज़रिए प्रोग्रेसिव डिस्क्लोज़र, और AGENTS.md(एक नई विंडो में खुलेगा) के ज़रिए कस्टम निर्देश शामिल हैं, shell(एक नई विंडो में खुलेगा) टूल का उपयोग करके कोड एग्ज़िक्यूशन, apply patch(एक नई विंडो में खुलेगा) टूल से फाइल एडिट्स, और भी बहुत कुछ. यह हार्नेस समय के साथ नए एजेंटिक पैटर्न्स और प्रिमिटिव्स को शामिल करता रहेगा, ताकि डेवलपर्स कोर इंफ्रास्ट्रक्चर अपडेट्स पर कम समय दें और उस डोमेन-विशिष्ट लॉजिक पर ज़्यादा ध्यान दे सकें जो उनके एजेंट्स को उपयोगी बनाता है.

डायग्राम दिखाता है कि Agent SDK कैसे यूज़र इनपुट, मॉडल्स और टूल्स को जोड़कर AI एजेंट्स बनाता है.
डायग्राम दिखाता है कि Agent SDK का उपयोग करके मॉडल्स, टूल्स और ऑर्केस्ट्रेशन के साथ AI एजेंट्स कैसे बनाए जाते हैं.

यह हार्नेस डेवलपर्स को फ्रंटियर मॉडल्स की क्षमताओं का बेहतर उपयोग करने में भी मदद करता है, क्योंकि यह एग्ज़िक्यूशन को उन मॉडल्स के सबसे अच्छे काम करने के तरीके के साथ संरेखित करता है. इससे एजेंट्स मॉडल के प्राकृतिक काम करने के पैटर्न के करीब रहते हैं, जिससे जटिल टास्क्स पर रिलायबिलिटी और परफॉर्मेंस बेहतर होती है—खासकर जब काम लंबा चलने वाला हो या कई तरह के टूल्स और सिस्टम्स के बीच समन्वय की ज़रूरत हो.

इसके अलावा, हम समझते हैं कि हर प्रोडक्ट अलग होता है और अक्सर किसी तय ढांचे में पूरी तरह फिट नहीं बैठता. हमने Agents SDK को इस विविधता को सपोर्ट करने के लिए डिज़ाइन किया है. डेवलपर्स को एक ऐसा हार्नेस मिलता है जो टर्नकी होने के साथ लचीला भी है—जिसे अपने स्टैक के हिसाब से आसानी से ढाला जा सकता है, जिसमें टूल उपयोग, मेमोरी और सैंडबॉक्स एनवायरनमेंट शामिल हैं.

नेटिव सैंडबॉक्स एग्ज़िक्यूशन

अपडेटेड Agents SDK नेटिव रूप से सैंडबॉक्स एग्ज़िक्यूशन को सपोर्ट करता है, जिससे एजेंट्स नियंत्रित कंप्यूटर एनवायरनमेंट में अपने टास्क के लिए ज़रूरी फाइल्स, टूल्स और डिपेंडेंसीज़ के साथ काम कर सकते हैं.

कई उपयोगी एजेंट्स को ऐसे वर्कस्पेस की ज़रूरत होती है जहाँ वे फाइल्स पढ़ और लिख सकें, डिपेंडेंसीज़ इंस्टॉल कर सकें, कोड चला सकें और टूल्स का सुरक्षित उपयोग कर सकें. नेटिव सैंडबॉक्स सपोर्ट डेवलपर्स को यह एग्ज़िक्यूशन लेयर सीधे देता है, ताकि उन्हें इसे अलग-अलग हिस्सों से खुद जोड़कर बनाने की ज़रूरत न पड़े.

डेवलपर्स अपना खुद का सैंडबॉक्स ला सकते हैं या Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop और Vercel के लिए बिल्ट-इन सपोर्ट का उपयोग कर सकते हैं.

इन एनवायरनमेंट्स को अलग-अलग प्रोवाइडर्स के बीच पोर्टेबल बनाने के लिए, SDK एजेंट के वर्कस्पेस को वर्णित करने के लिए Manifest एब्स्ट्रैक्शन भी पेश करता है. डेवलपर्स लोकल फाइल्स माउंट कर सकते हैं, आउटपुट डायरेक्टरीज़ तय कर सकते हैं और AWS S3, Google Cloud Storage, Azure Blob Storage और Cloudflare R2 जैसे स्टोरेज प्रोवाइडर्स से डेटा ला सकते हैं.

इससे डेवलपर्स को लोकल प्रोटोटाइप से लेकर प्रोडक्शन डिप्लॉयमेंट तक एजेंट के एनवायरनमेंट को एक समान तरीके से सेट करने का तरीका मिलता है. यह मॉडल को एक पूर्वानुमेय वर्कस्पेस भी देता है: इनपुट कहाँ मिलेंगे, आउटपुट कहाँ लिखने हैं और लंबे समय तक चलने वाले टास्क में काम को कैसे व्यवस्थित रखना है.

Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop के लोगो

सुरक्षा, टिकाऊपन और स्केल के लिए हार्नेस को कंप्यूट से अलग करना

एजेंट सिस्टम्स को इस मानकर डिज़ाइन किया जाना चाहिए कि प्रॉम्प्ट-इंजेक्शन और डेटा एक्सफिल्ट्रेशन के प्रयास होंगे. हार्नेस और कंप्यूट को अलग रखने से क्रेडेंशियल्स उन एनवायरनमेंट्स से बाहर रहते हैं जहाँ मॉडल द्वारा जनरेट किया गया कोड चलता है.

यह टिकाऊ एग्ज़िक्यूशन को भी संभव बनाता है. जब एजेंट की स्टेट बाहरी रूप से स्टोर होती है, तो सैंडबॉक्स कंटेनर खोने का मतलब रन खोना नहीं होता. बिल्ट-इन स्नैपशॉटिंग और रीहाइड्रेशन के साथ, Agents SDK एजेंट की स्टेट को नए कंटेनर में बहाल कर सकता है और अगर मूल एनवायरनमेंट फेल हो जाए या एक्सपायर हो जाए, तो आखिरी चेकपॉइंट से काम जारी रख सकता है.

अंत में, यह एजेंट्स को और अधिक स्केलेबल बनाता है. एजेंट रन एक या कई सैंडबॉक्स का उपयोग कर सकते हैं, ज़रूरत होने पर ही सैंडबॉक्स शुरू कर सकते हैं, सब-एजेंट्स को अलग-थलग एनवायरनमेंट्स में रूट कर सकते हैं और तेज़ एग्ज़िक्यूशन के लिए कंटेनर्स में काम को पैरेलल कर सकते हैं.

फ्लो डायग्राम दिखाता है कि Agent SDK कैसे AI एजेंट्स को अधिक जटिल टास्क्स के लिए अतिरिक्त कंप्यूट संसाधनों का उपयोग करने में सक्षम बनाता है.
डायग्राम दिखाता है कि Agent SDK से बने AI एजेंट्स अलग-अलग कंप्यूट सिस्टम्स को ऑर्केस्ट्रेट कर सकते हैं, जिससे वर्कलोड्स स्वतंत्र रूप से चल पाते हैं और ज़्यादा उन्नत टास्क्स को सपोर्ट मिलता है.

प्राइसिंग और उपलब्धता

ये नई Agents SDK कैपेबिलिटीज़ API के ज़रिए सभी कस्टमर्स के लिए आम तौर पर उपलब्ध हैं और टोकन्स और टूल उपयोग के आधार पर स्टैंडर्ड API प्राइसिंग का उपयोग करती हैं.

आगे क्या है

जैसे-जैसे हम Agents SDK को आगे विकसित करते रहेंगे, हम इसके साथ डेवलपर्स क्या बना सकते हैं, इसे और बढ़ाते रहेंगे, ताकि कम कस्टम इंफ्रास्ट्रक्चर के साथ अधिक सक्षम एजेंट्स को प्रोडक्शन में लाना आसान हो, और साथ ही डेवलपर्स को अपने एनवायरनमेंट्स में एजेंट्स फिट करने के लिए ज़रूरी लचीलापन और कंट्रोल भी बना रहे.

नई हार्नेस और सैंडबॉक्स कैपेबिलिटीज़ पहले Python में लॉन्च हो रही हैं, जबकि TypeScript सपोर्ट भविष्य की रिलीज़ के लिए योजना में है. हम अतिरिक्त एजेंट कैपेबिलिटीज़, जैसे कोड मोड और सब-एजेंट्स, को Python और TypeScript दोनों में लाने पर भी काम कर रहे हैं.

इसके अलावा, हम समय के साथ व्यापक एजेंट इकोसिस्टम को साथ लाने में मदद करना चाहते हैं, जिसमें अधिक सैंडबॉक्स प्रोवाइडर्स का सपोर्ट, ज़्यादा इंटीग्रेशन्स और डेवलपर्स के लिए SDK को उनके मौजूदा टूल्स और सिस्टम्स में जोड़ने के और तरीके शामिल होंगे.