१५ एप्रिल, २०२६

एजंट्स SDK ची पुढील उत्क्रांती

अद्ययावत Agents SDK विकसकांना नियंत्रित सँडबॉक्स वातावरणांमध्ये फाइल्स तपासू शकणारे, कमांड्स चालवू शकणारे, कोड संपादित करू शकणारे आणि दीर्घकालीन कामांवर कार्य करू शकणारे एजंट तयार करण्यात मदत करते.

लोड होत आहे...

आम्ही Agents SDK मध्ये नवीन क्षमता सादर करत आहोत, ज्या विकसकांना प्रमाणित पायाभूत सुविधा देतात, ज्यामुळे सुरुवात करणे सोपे होते आणि जी OpenAI मॉडेल्ससाठी योग्य प्रकारे तयार केली गेली आहे: एक मॉडेल-नेटिव्ह हार्नेस (मॉडेलशी सुसंगत टूल), जे एजंट्सना संगणकावरील फाइल्स आणि टूल्समध्ये काम करण्यास सक्षम करते, तसेच ते काम सुरक्षितपणे चालवण्यासाठी नेटिव्ह सँडबॉक्स एक्झिक्युशन (सुरक्षित वातावरणात कार्यरत करण्याची सुविधा).

उदाहरणार्थ, विकसकांना एजंटला नियंत्रित वर्कस्पेस, स्पष्ट सूचना आणि पुराव्याची तपासणी करण्यासाठी आवश्यक टूल्स देऊ शकतात:

Python

1# pip install "openai-agents>=0.14.0"
2
3import asyncio
4import tempfile
5from pathlib import Path
6
7from agents import Runner
8from agents.run import RunConfig
9from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10from agents.sandbox.entries import LocalDir
11from agents.sandbox.sandboxes import UnixLocalSandboxClient
12
13
14async def main() -> None:
15    with tempfile.TemporaryDirectory() as tmp:
16        dataroom = Path(tmp) / "dataroom"
17        dataroom.mkdir()
18        (dataroom / "metrics.md").write_text(
19            """# Annual metrics
20
21| Year | Revenue | Operating income | Operating cash flow |
22| --- | ---: | ---: | ---: |
23| FY2025 | $124.3M | $18.6M | $24.1M |
24| FY2024 | $98.7M | $12.4M | $17.9M |
25""",
26            encoding="utf-8",
27        )
28
29        agent = SandboxAgent(
30            name="Dataroom Analyst",
31            model="gpt-5.4",
32            instructions="Answer using only files in data/. Cite source filenames.",
33            default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34        )
35
36        result = await Runner.run(
37            agent,
38            "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39            run_config=RunConfig(
40                sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41            ),
42        )
43        print(result.final_output)
44
45
46if __name__ == "__main__":
47    asyncio.run(main())
48

विकसकांना उपयुक्त एजंट्स तयार करण्यासाठी सर्वोत्तम मॉडेल्सपेक्षा अधिकची गरज असते—त्यांना अशा प्रणालींची गरज असते ज्या एजंट्सना फाइल्स तपासणे, कमांड्स चालवणे, कोड लिहिणे आणि अनेक टप्प्यांमध्ये काम करत राहणे यासाठी समर्थन देतात.

आज अस्तित्वात असलेल्या प्रणालींमध्ये, संघ प्रोटोटाइपपासून प्रॉडक्शनकडे जात असताना काही तडजोडी कराव्या लागतात. मॉडेल-अ‍ॅग्नॉस्टिक फ्रेमवर्क्स लवचिक असतात, पण अत्याधुनिक मॉडेल्सच्या क्षमतांचा पूर्णपणे उपयोग करत नाहीत; मॉडेल-प्रोव्हायडर SDKs मॉडेलच्या अधिक जवळ असू शकतात, पण अनेकदा हार्नेसमध्ये पुरेशी दृश्यमानता देत नाहीत; आणि मॅनेज्ड एजंट APIs डिप्लॉयमेंट सुलभ करू शकतात, पण एजंट कुठे चालतात आणि ते संवेदनशील डेटामध्ये कसा प्रवेश करतात यावर बंधने आणतात.

आमच्यासोबत नवीन SDK ची चाचणी केलेल्या काही ग्राहकांनी काय सांगितले ते येथे आहे:

“GPT-5.4 दस्तऐवज-प्रधान कायदेशीर कामासाठी एक नवा मानदंड प्रस्थापित करते. आमच्या BigLaw Bench मूल्यमापनावर, त्याने 91% गुण मिळवले. इतर मॉडेल्सच्या तुलनेत, GPT-5.4 सध्या गुंतागुंतीच्या व्यवहार विश्लेषणाची रचना करण्यात, दीर्घ करारांमध्ये अचूकता टिकवून ठेवण्यात, आणि कायदेशीर व्यावसायिकांना आवश्यक असलेला उच्च स्तराचा तपशील देण्यात अधिक सक्षम आहे.

— निको ग्रुपेन, Harvey चे अनुप्रयुक्त संशोधन विभागाचे प्रमुख

एजंट लूपसाठी अधिक सक्षम हार्नेस

आजच्या प्रकाशनासह, दस्तऐवज, फाइल्स आणि सिस्टम्ससह काम करणाऱ्या एजंट्ससाठी Agents SDK हार्नेस अधिक सक्षम बनतो. आता यामध्ये कॉन्फिगर करण्यायोग्य मेमरी, सँडबॉक्स-जाणकार ऑर्केस्ट्रेशन, Codex-सारखी फाइलसिस्टम टूल्स आणि अत्याधुनिक एजंट प्रणालींमध्ये सामान्य होत चाललेल्या प्रिमिटिव्ह्जसह प्रमाणित एकत्रीकरणे जोडली जातात.

या प्रिमिटिव्ह्जमध्ये MCP⁠(नवीन विंडोमध्ये उघडेल) द्वारे टूल वापर, skills⁠(नवीन विंडोमध्ये उघडेल) द्वारे प्रोग्रेसिव्ह डिस्क्लोजर, AGENTS.md⁠(नवीन विंडोमध्ये उघडेल) द्वारे कस्टम सूचना, शेल⁠(नवीन विंडोमध्ये उघडेल) टूल वापरून कोड एक्झिक्युशन, apply patch⁠(नवीन विंडोमध्ये उघडेल) टूल वापरून फाइल संपादने, आणि बरेच काही. हार्नेस कालांतराने नवीन एजंटिक पॅटर्न्स आणि प्रिमिटिव्ह्ज समाविष्ट करत राहील, जेणेकरून विकसक मुख्य इन्फ्रास्ट्रक्चर अद्यतनांवर कमी वेळ घालवू शकतील आणि त्यांच्या एजंटना उपयुक्त बनवणाऱ्या डोमेन-विशिष्ट तर्कावर अधिक वेळ देऊ शकतील.

AI एजंट तयार करण्यासाठी Agent SDK वापरकर्त्याचे इनपुट, मॉडेल आणि टूल्स कसे जोडते हे दाखवणारा आरेख.

मॉडेल, टूल्स आणि orchestration च्या मदतीने Agent SDK वापरून AI agents कसे बिल्ड करायचे हे दाखवणारी आकृती.

हा हार्नेस विकसकांना एक्झिक्युशन त्या मॉडेल्सच्या सर्वोत्तम कार्यपद्धतीशी जुळवून अत्याधुनिक मॉडेल्सच्या अधिक क्षमतांचा लाभ घेण्यास मदत करतो. यामुळे एजंट्स मॉडेलच्या नैसर्गिक कार्यपद्धतीच्या अधिक जवळ राहतात, ज्यामुळे जटिल कामांमध्ये विश्वासार्हता आणि कार्यक्षमता सुधारते, विशेषतः जेव्हा काम दीर्घकाळ चालणारे असते किंवा विविध टूल्स आणि प्रणालींमध्ये समन्वय साधलेले असते.

याशिवाय, आम्हाला हे जाणवते की प्रत्येक उत्पादन वेगळे असते आणि क्वचितच एखाद्या ठरावीक साच्यात व्यवस्थित बसते. आम्ही या विविधतेला समर्थन देण्यासाठी एजंट्स SDK डिझाइन केले. विकसकांना तयार-टू-यूज असूनही लवचिक असे फ्रेमवर्क मिळते—ज्यामुळे टूल वापर, मेमरी आणि सँडबॉक्स वातावरणासह ते त्यांच्या स्वतःच्या स्टॅकनुसार सहज अनुकूलित करता येते.

मुळ सँडबॉक्स अंमलबजावणी

अद्ययावत एजंट्स SDK सँडबॉक्स कार्यान्वयनला नेटिव्ह समर्थन देते, त्यामुळे एजंट्स एखाद्या कार्यासाठी आवश्यक असलेल्या फाइल्स, टूल्स आणि अवलंबित्वांसह नियंत्रित संगणक वातावरणांमध्ये चालू शकतात.

अनेक उपयुक्त एजंट्सना असा वर्कस्पेस आवश्यक असतो जिथे ते फाइल्स वाचू आणि लिहू शकतात, अवलंबन इन्स्टॉल करू शकतात, कोड चालवू शकतात आणि टूल्स सुरक्षितपणे वापरू शकतात. नेटिव्ह सँडबॉक्स सपोर्टमुळे विकसकांना तो कार्यान्वयन स्तर सुरुवातीपासूनच मिळतो, स्वतः ते एकत्र करण्यास भाग पाडण्याऐवजी.

विकसक स्वतःचा सँडबॉक्स आणू शकतात किंवा Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop आणि Vercel साठी अंगभूत समर्थन वापरू शकतात.

त्या वातावरणांना विविध प्रदात्यांमध्ये पोर्टेबल बनवण्यासाठी, SDK एजंटच्या वर्कस्पेसचे वर्णन करण्यासाठी मॅनिफेस्ट अ‍ॅब्स्ट्रॅक्शन देखील सादर करते. विकसकांना स्थानिक फाइल्स माउंट करू शकतात, आउटपुट डिरेक्टरी परिभाषित करू शकतात आणि AWS S3, Google Cloud Storage, Azure Blob Storage आणि Cloudflare R2 यांसारख्या स्टोरेज प्रदात्यांकडून डेटा आणू शकतात.

हे विकसकांना स्थानिक प्रोटोटाइपपासून प्रॉडक्शन डिप्लॉयमेंटपर्यंत एजंटच्या वातावरणाला आकार देण्यासाठी एक सुसंगत मार्ग प्रदान करते. हे मॉडेलला एक अंदाजे वर्कस्पेस देखील प्रदान करते: इनपुट कुठे शोधायचे, आउटपुट कुठे लिहायचे आणि दीर्घकाळ चालणाऱ्या कामात काम कसे व्यवस्थित ठेवायचे.

Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop चे लोगो

सुरक्षा, टिकाऊपणा आणि स्केलसाठी हार्नेसला संगणनापासून वेगळे करणे

एजंट प्रणालींची रचना प्रॉम्प्ट इंजेक्शन आणि एक्सफिल्ट्रेशनच्या प्रयत्नांना गृहीत धरून केली पाहिजे. हार्नेस आणि कम्प्युट वेगळे ठेवल्याने क्रेडेन्शियल्स त्या वातावरणांपासून दूर राहतात जिथे मॉडेल-निर्मित कोड कार्यान्वित होतो.

हे टिकाऊ कार्यवाही सक्षम करते. जेव्हा एजंटची स्थिती बाहेर ठेवली जाते, तेव्हा सॅंडबॉक्स कंटेनर गमावल्याचा अर्थ रन गमावणे होत नाही. अंतर्निर्मित स्नॅपशॉटिंग आणि रीहायड्रेशनसह, Agents SDK नवीन कंटेनरमध्ये एजंटची स्थिती पुनर्संचयित करू शकते आणि मूळ वातावरण अयशस्वी ठरल्यास किंवा कालबाह्य झाल्यास शेवटच्या चेकपॉइंटपासून पुढे सुरू ठेवू शकते.

शेवटी, ते एजंट्सना अधिक स्केलेबल बनवते. एजंट रन एक किंवा अनेक सँडबॉक्स वापरू शकतात, गरज असेल तेव्हाच सँडबॉक्स वापरू शकतात, सबएजंट्सना स्वतंत्र वातावरणांकडे रूट करू शकतात, आणि जलद अंमलबजावणीसाठी कंटेनर्समध्ये समांतरपणे काम विभागू शकतात.

AI एजंट्सना अधिक जटिल कार्यांसाठी अतिरिक्त कॉम्प्युट संसाधने वापरण्यास सक्षम करणारी प्रवाह आकृती.

Agent SDK सह तयार केलेले AI एजंट्स स्वतंत्र संगणकीय प्रणाली कशा ऑर्केस्ट्रेट करू शकतात हे दाखवणारा आकृतीबंध, ज्यामुळे वर्कलोड्स स्वतंत्रपणे चालू शकतात आणि अधिक प्रगत कार्यांना समर्थन मिळते.

प्राइसिंग आणि उपलब्धता

या नवीन Agents SDK क्षमता API द्वारे सर्व ग्राहकांसाठी सामान्यपणे उपलब्ध आहेत आणि टोकन व टूल वापरावर आधारित मानक API किंमत धोरण वापरतात.

पुढे काय

आम्ही Agents SDK विकसित करत राहतो, त्यामुळे विकसक त्याच्या मदतीने काय तयार करू शकतात याचा विस्तार करत राहू, ज्यामुळे कमी कस्टम इन्फ्रास्ट्रक्चरसह अधिक सक्षम एजंट्सना उत्पादनात आणणे सोपे होईल, तसेच विकसकांना एजंट्स त्यांच्या स्वतःच्या वातावरणांमध्ये बसवण्यासाठी आवश्यक असलेली लवचिकता आणि नियंत्रण कायम ठेवले जाईल.

नवीन harness आणि sandbox क्षमता सुरुवातीला Python मध्ये लॉन्च होत आहेत, आणि भविष्यातील रिलीजसाठी TypeScript समर्थनाची योजना आहे. आम्ही Python आणि TypeScript या दोन्हींसाठी code mode आणि उपएजंट्ससह एजंटच्या अतिरिक्त क्षमता आणण्यासाठी देखील काम करत आहोत.

याशिवाय, कालांतराने अधिक सँडबॉक्स प्रदाते, अधिक एकत्रीकरणे आणि विकसकांना ते आधीपासून वापरत असलेल्या टूल्स आणि सिस्टिम्समध्ये SDK जोडण्याचे अधिक मार्ग उपलब्ध करून देत, व्यापक एजंट परिसंस्थेला एकत्र आणण्यास मदत करायची आहे.

लेखक

OpenAI

वाचत राहा

सर्व पहा

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 आता Microsoft 365 Copilot मधील पसंतीचे मॉडेल आहे

प्रॉडक्ट९ जुलै, २०२६

तुमच्या सर्वात महत्त्वाकांक्षी कामासाठी ChatGPT आता भागीदार आहे

प्रॉडक्ट९ जुलै, २०२६

GPT-5.6: आपल्या महत्त्वाकांक्षेसोबत विस्तारत जाणारी अत्याधुनिक बुद्धिमत्ता

प्रॉडक्ट९ जुलै, २०२६