मुख्य मजकूराकडे जा
OpenAI

१५ एप्रिल, २०२६

प्रॉडक्ट

एजंट्स SDK ची पुढील उत्क्रांती

अद्ययावत Agents SDK विकसकांना नियंत्रित सँडबॉक्स वातावरणांमध्ये फाइल्स तपासू शकणारे, कमांड्स चालवू शकणारे, कोड संपादित करू शकणारे आणि दीर्घकालीन कामांवर कार्य करू शकणारे एजंट तयार करण्यात मदत करते.

लोड होत आहे...

आम्ही Agents SDK मध्ये नवीन क्षमता सादर करत आहोत, ज्या विकसकांना प्रमाणित पायाभूत सुविधा देतात, ज्यामुळे सुरुवात करणे सोपे होते आणि जी OpenAI मॉडेल्ससाठी योग्य प्रकारे तयार केली गेली आहे: एक मॉडेल-नेटिव्ह हार्नेस (मॉडेलशी सुसंगत टूल), जे एजंट्सना संगणकावरील फाइल्स आणि टूल्समध्ये काम करण्यास सक्षम करते, तसेच ते काम सुरक्षितपणे चालवण्यासाठी नेटिव्ह सँडबॉक्स एक्झिक्युशन (सुरक्षित वातावरणात कार्यरत करण्याची सुविधा).

उदाहरणार्थ, विकसकांना एजंटला नियंत्रित वर्कस्पेस, स्पष्ट सूचना आणि पुराव्याची तपासणी करण्यासाठी आवश्यक टूल्स देऊ शकतात:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

विकसकांना उपयुक्त एजंट्स तयार करण्यासाठी सर्वोत्तम मॉडेल्सपेक्षा अधिकची गरज असते—त्यांना अशा प्रणालींची गरज असते ज्या एजंट्सना फाइल्स तपासणे, कमांड्स चालवणे, कोड लिहिणे आणि अनेक टप्प्यांमध्ये काम करत राहणे यासाठी समर्थन देतात.

आज अस्तित्वात असलेल्या प्रणालींमध्ये, संघ प्रोटोटाइपपासून प्रॉडक्शनकडे जात असताना काही तडजोडी कराव्या लागतात. मॉडेल-अ‍ॅग्नॉस्टिक फ्रेमवर्क्स लवचिक असतात, पण अत्याधुनिक मॉडेल्सच्या क्षमतांचा पूर्णपणे उपयोग करत नाहीत; मॉडेल-प्रोव्हायडर SDKs मॉडेलच्या अधिक जवळ असू शकतात, पण अनेकदा हार्नेसमध्ये पुरेशी दृश्यमानता देत नाहीत; आणि मॅनेज्ड एजंट APIs डिप्लॉयमेंट सुलभ करू शकतात, पण एजंट कुठे चालतात आणि ते संवेदनशील डेटामध्ये कसा प्रवेश करतात यावर बंधने आणतात.

आमच्यासोबत नवीन SDK ची चाचणी केलेल्या काही ग्राहकांनी काय सांगितले ते येथे आहे:

“GPT-5.4 दस्तऐवज-प्रधान कायदेशीर कामासाठी एक नवा मानदंड प्रस्थापित करते. आमच्या BigLaw Bench मूल्यमापनावर, त्याने 91% गुण मिळवले. इतर मॉडेल्सच्या तुलनेत, GPT-5.4 सध्या गुंतागुंतीच्या व्यवहार विश्लेषणाची रचना करण्यात, दीर्घ करारांमध्ये अचूकता टिकवून ठेवण्यात, आणि कायदेशीर व्यावसायिकांना आवश्यक असलेला उच्च स्तराचा तपशील देण्यात अधिक सक्षम आहे.
— निको ग्रुपेन, Harvey चे अनुप्रयुक्त संशोधन विभागाचे प्रमुख

एजंट लूपसाठी अधिक सक्षम हार्नेस

आजच्या प्रकाशनासह, दस्तऐवज, फाइल्स आणि सिस्टम्ससह काम करणाऱ्या एजंट्ससाठी Agents SDK हार्नेस अधिक सक्षम बनतो. आता यामध्ये कॉन्फिगर करण्यायोग्य मेमरी, सँडबॉक्स-जाणकार ऑर्केस्ट्रेशन, Codex-सारखी फाइलसिस्टम टूल्स आणि अत्याधुनिक एजंट प्रणालींमध्ये सामान्य होत चाललेल्या प्रिमिटिव्ह्जसह प्रमाणित एकत्रीकरणे जोडली जातात.

या प्रिमिटिव्ह्जमध्ये MCP(नवीन विंडोमध्ये उघडेल) द्वारे टूल वापर, skills(नवीन विंडोमध्ये उघडेल) द्वारे प्रोग्रेसिव्ह डिस्क्लोजर, AGENTS.md(नवीन विंडोमध्ये उघडेल) द्वारे कस्टम सूचना, शेल(नवीन विंडोमध्ये उघडेल) टूल वापरून कोड एक्झिक्युशन, apply patch(नवीन विंडोमध्ये उघडेल) टूल वापरून फाइल संपादने, आणि बरेच काही. हार्नेस कालांतराने नवीन एजंटिक पॅटर्न्स आणि प्रिमिटिव्ह्ज समाविष्ट करत राहील, जेणेकरून विकसक मुख्य इन्फ्रास्ट्रक्चर अद्यतनांवर कमी वेळ घालवू शकतील आणि त्यांच्या एजंटना उपयुक्त बनवणाऱ्या डोमेन-विशिष्ट तर्कावर अधिक वेळ देऊ शकतील.

AI एजंट तयार करण्यासाठी Agent SDK वापरकर्त्याचे इनपुट, मॉडेल आणि टूल्स कसे जोडते हे दाखवणारा आरेख.
मॉडेल, टूल्स आणि orchestration च्या मदतीने Agent SDK वापरून AI agents कसे बिल्ड करायचे हे दाखवणारी आकृती.

हा हार्नेस विकसकांना एक्झिक्युशन त्या मॉडेल्सच्या सर्वोत्तम कार्यपद्धतीशी जुळवून अत्याधुनिक मॉडेल्सच्या अधिक क्षमतांचा लाभ घेण्यास मदत करतो. यामुळे एजंट्स मॉडेलच्या नैसर्गिक कार्यपद्धतीच्या अधिक जवळ राहतात, ज्यामुळे जटिल कामांमध्ये विश्वासार्हता आणि कार्यक्षमता सुधारते, विशेषतः जेव्हा काम दीर्घकाळ चालणारे असते किंवा विविध टूल्स आणि प्रणालींमध्ये समन्वय साधलेले असते.

याशिवाय, आम्हाला हे जाणवते की प्रत्येक उत्पादन वेगळे असते आणि क्वचितच एखाद्या ठरावीक साच्यात व्यवस्थित बसते. आम्ही या विविधतेला समर्थन देण्यासाठी एजंट्स SDK डिझाइन केले. विकसकांना तयार-टू-यूज असूनही लवचिक असे फ्रेमवर्क मिळते—ज्यामुळे टूल वापर, मेमरी आणि सँडबॉक्स वातावरणासह ते त्यांच्या स्वतःच्या स्टॅकनुसार सहज अनुकूलित करता येते.

मुळ सँडबॉक्स अंमलबजावणी

अद्ययावत एजंट्स SDK सँडबॉक्स कार्यान्वयनला नेटिव्ह समर्थन देते, त्यामुळे एजंट्स एखाद्या कार्यासाठी आवश्यक असलेल्या फाइल्स, टूल्स आणि अवलंबित्वांसह नियंत्रित संगणक वातावरणांमध्ये चालू शकतात.

अनेक उपयुक्त एजंट्सना असा वर्कस्पेस आवश्यक असतो जिथे ते फाइल्स वाचू आणि लिहू शकतात, अवलंबन इन्स्टॉल करू शकतात, कोड चालवू शकतात आणि टूल्स सुरक्षितपणे वापरू शकतात. नेटिव्ह सँडबॉक्स सपोर्टमुळे विकसकांना तो कार्यान्वयन स्तर सुरुवातीपासूनच मिळतो, स्वतः ते एकत्र करण्यास भाग पाडण्याऐवजी.

विकसक स्वतःचा सँडबॉक्स आणू शकतात किंवा Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop आणि Vercel साठी अंगभूत समर्थन वापरू शकतात.

त्या वातावरणांना विविध प्रदात्यांमध्ये पोर्टेबल बनवण्यासाठी, SDK एजंटच्या वर्कस्पेसचे वर्णन करण्यासाठी मॅनिफेस्ट अ‍ॅब्स्ट्रॅक्शन देखील सादर करते. विकसकांना स्थानिक फाइल्स माउंट करू शकतात, आउटपुट डिरेक्टरी परिभाषित करू शकतात आणि AWS S3, Google Cloud Storage, Azure Blob Storage आणि Cloudflare R2 यांसारख्या स्टोरेज प्रदात्यांकडून डेटा आणू शकतात.

हे विकसकांना स्थानिक प्रोटोटाइपपासून प्रॉडक्शन डिप्लॉयमेंटपर्यंत एजंटच्या वातावरणाला आकार देण्यासाठी एक सुसंगत मार्ग प्रदान करते. हे मॉडेलला एक अंदाजे वर्कस्पेस देखील प्रदान करते: इनपुट कुठे शोधायचे, आउटपुट कुठे लिहायचे आणि दीर्घकाळ चालणाऱ्या कामात काम कसे व्यवस्थित ठेवायचे.

Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop चे लोगो

सुरक्षा, टिकाऊपणा आणि स्केलसाठी हार्नेसला संगणनापासून वेगळे करणे

एजंट प्रणालींची रचना प्रॉम्प्ट इंजेक्शन आणि एक्सफिल्ट्रेशनच्या प्रयत्नांना गृहीत धरून केली पाहिजे. हार्नेस आणि कम्प्युट वेगळे ठेवल्याने क्रेडेन्शियल्स त्या वातावरणांपासून दूर राहतात जिथे मॉडेल-निर्मित कोड कार्यान्वित होतो.

हे टिकाऊ कार्यवाही सक्षम करते. जेव्हा एजंटची स्थिती बाहेर ठेवली जाते, तेव्हा सॅंडबॉक्स कंटेनर गमावल्याचा अर्थ रन गमावणे होत नाही. अंतर्निर्मित स्नॅपशॉटिंग आणि रीहायड्रेशनसह, Agents SDK नवीन कंटेनरमध्ये एजंटची स्थिती पुनर्संचयित करू शकते आणि मूळ वातावरण अयशस्वी ठरल्यास किंवा कालबाह्य झाल्यास शेवटच्या चेकपॉइंटपासून पुढे सुरू ठेवू शकते.

शेवटी, ते एजंट्सना अधिक स्केलेबल बनवते. एजंट रन एक किंवा अनेक सँडबॉक्स वापरू शकतात, गरज असेल तेव्हाच सँडबॉक्स वापरू शकतात, सबएजंट्सना स्वतंत्र वातावरणांकडे रूट करू शकतात, आणि जलद अंमलबजावणीसाठी कंटेनर्समध्ये समांतरपणे काम विभागू शकतात.

AI एजंट्सना अधिक जटिल कार्यांसाठी अतिरिक्त कॉम्प्युट संसाधने वापरण्यास सक्षम करणारी प्रवाह आकृती.
Agent SDK सह तयार केलेले AI एजंट्स स्वतंत्र संगणकीय प्रणाली कशा ऑर्केस्ट्रेट करू शकतात हे दाखवणारा आकृतीबंध, ज्यामुळे वर्कलोड्स स्वतंत्रपणे चालू शकतात आणि अधिक प्रगत कार्यांना समर्थन मिळते.

प्राइसिंग आणि उपलब्धता

या नवीन Agents SDK क्षमता API द्वारे सर्व ग्राहकांसाठी सामान्यपणे उपलब्ध आहेत आणि टोकन व टूल वापरावर आधारित मानक API किंमत धोरण वापरतात.

पुढे काय

आम्ही Agents SDK विकसित करत राहतो, त्यामुळे विकसक त्याच्या मदतीने काय तयार करू शकतात याचा विस्तार करत राहू, ज्यामुळे कमी कस्टम इन्फ्रास्ट्रक्चरसह अधिक सक्षम एजंट्सना उत्पादनात आणणे सोपे होईल, तसेच विकसकांना एजंट्स त्यांच्या स्वतःच्या वातावरणांमध्ये बसवण्यासाठी आवश्यक असलेली लवचिकता आणि नियंत्रण कायम ठेवले जाईल.

नवीन harness आणि sandbox क्षमता सुरुवातीला Python मध्ये लॉन्च होत आहेत, आणि भविष्यातील रिलीजसाठी TypeScript समर्थनाची योजना आहे. आम्ही Python आणि TypeScript या दोन्हींसाठी code mode आणि उपएजंट्ससह एजंटच्या अतिरिक्त क्षमता आणण्यासाठी देखील काम करत आहोत.

याशिवाय, कालांतराने अधिक सँडबॉक्स प्रदाते, अधिक एकत्रीकरणे आणि विकसकांना ते आधीपासून वापरत असलेल्या टूल्स आणि सिस्टिम्समध्ये SDK जोडण्याचे अधिक मार्ग उपलब्ध करून देत, व्यापक एजंट परिसंस्थेला एकत्र आणण्यास मदत करायची आहे.