মূল কনটেন্টে যান
OpenAI

১৫ এপ্রিল, ২০২৬

প্রোডাক্ট

Agents SDK-এর পরবর্তী বিবর্তন

আপডেট করা Agents SDK ডেভেলপারদের এমন এজেন্ট তৈরি করতে সহায়তা করে, যা ফাইল পরিদর্শন করতে, কমান্ড চালাতে, কোড সম্পাদনা করতে এবং নিয়ন্ত্রিত স্যান্ডবক্স পরিবেশে দীর্ঘমেয়াদি কাজ সম্পাদন করতে পারে.

লোডিং…

আমরা Agents SDK-তে নতুন কিছু সক্ষমতা যুক্ত করছি যা ডেভেলপারদের একটি মানসম্মত অবকাঠামো প্রদান করবে. এটি যেমন সহজে ব্যবহারযোগ্য, তেমনি OpenAI মডেলগুলোর জন্য সঠিকভাবে তৈরি করা হয়েছে. এতে রয়েছে একটি 'মডেল-নেটিভ হারনেস', যা এজেন্টদের কম্পিউটারের বিভিন্ন ফাইল এবং টুলের সমন্বয়ে কাজ করতে সাহায্য করবে, সেইসাথে কাজগুলো নিরাপদে সম্পন্ন করার জন্য রয়েছে 'নেটিভ স্যান্ডবক্স এক্সিকিউশন' সুবিধা.

উদাহরণস্বরূপ, ডেভেলপাররা একটি এজেন্টকে একটি নিয়ন্ত্রিত ওয়ার্কস্পেস, স্পষ্ট নির্দেশনা এবং প্রমাণ পরীক্ষা করার জন্য প্রয়োজনীয় টুল দিতে পারেন:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

উপযোগী এজেন্ট তৈরি করতে ডেভেলপারদের শুধু সেরা মডেলই নয়. তাদের এমন সিস্টেমও দরকার যা এজেন্টরা কিভাবে ফাইল পরিদর্শন করে, কমান্ড চালায়, কোড লেখে এবং অনেক ধাপ ধরে কাজ চালিয়ে যেতে পারে তা সমর্থন করে.

বর্তমানে বিদ্যমান সিস্টেমগুলোতে কিছু সীমাবদ্ধতা বা আপস মেনে নিতে হয়, যখন টিমগুলো প্রোটোটাইপ পর্যায় থেকে মূল উৎপাদনে অগ্রসর হয়. মডেল-নিরপেক্ষ ফ্রেমওয়ার্কগুলো নমনীয়, কিন্তু অত্যাধুনিক মডেলগুলোর সক্ষমতাকে পুরোপুরি কাজে লাগায় না; মডেল-প্রদানকারীর SDK-গুলো মডেলের আরও কাছাকাছি হতে পারে, কিন্তু প্রায়ই হারনেসের মধ্যে যথেষ্ট দৃশ্যমানতা দেয় না; এবং ম্যানেজড এজেন্ট API-গুলো ডিপ্লয়মেন্ট সহজ করতে পারে, কিন্তু এজেন্টগুলো কোথায় চলবে এবং কিভাবে তারা সংবেদনশীল ডেটা অ্যাক্সেস করবে, তা সীমাবদ্ধ করে.

নতুন SDK আমাদের সঙ্গে পরীক্ষা করেছেন এমন কিছু গ্রাহকের মতামত এখানে দেওয়া হলো:

“GPT-5.4 নথি-নির্ভর আইনি কাজে একটি নতুন মানদণ্ড স্থাপন করে. আমাদের BigLaw Bench ইভ্যালে, এটি 91% স্কোর করেছে. অন্যান্য মডেলের তুলনায়, GPT-5.4 বর্তমানে জটিল লেনদেনভিত্তিক বিশ্লেষণকে কাঠামোবদ্ধ করতে, দীর্ঘ চুক্তিজুড়ে নির্ভুলতা বজায় রাখতে, এবং আইন পেশাজীবীদের প্রয়োজনীয় উচ্চমাত্রার বিস্তারিত তথ্য প্রদান করতে আরও ভালো.”
— নিকো গ্রুপেন, Harvey-এর ফলিত গবেষণা প্রধান

এজেন্ট লুপের জন্য আরও সক্ষম হারনেস

আজকের রিলিজের মাধ্যমে, ডকুমেন্ট, ফাইল এবং সিস্টেম নিয়ে কাজ করা এজেন্টদের জন্য Agents SDK হারনেস আরও সক্ষম হয়ে উঠেছে. এটি এখন কনফিগারযোগ্য মেমরি, স্যান্ডবক্স-সচেতন অর্কেস্ট্রেশন, Codex-এর মতো ফাইলসিস্টেম টুল এবং অত্যাধুনিক এজেন্ট সিস্টেমে ক্রমশ সাধারণ হয়ে উঠছে এমন প্রিমিটিভগুলোর সঙ্গে মানসম্মত ইন্টিগ্রেশন যোগ করে.

এই প্রিমিটিভগুলোর মধ্যে রয়েছে MCP(একটি নতুন উইন্ডোতে খোলে)-এর মাধ্যমে টুল ব্যবহার, skills(একটি নতুন উইন্ডোতে খোলে)-এর মাধ্যমে ধাপে ধাপে প্রকাশ, AGENTS.md(একটি নতুন উইন্ডোতে খোলে)-এর মাধ্যমে কাস্টম নির্দেশনা, শেল(একটি নতুন উইন্ডোতে খোলে) টুল ব্যবহার করে কোড এক্সিকিউশন, apply patch(একটি নতুন উইন্ডোতে খোলে) টুল ব্যবহার করে ফাইল সম্পাদনা এবং আরও অনেক কিছু. হারনেসটি সময়ের সাথে সাথে নতুন এজেন্টিক প্যাটার্ন এবং প্রিমিটিভ অন্তর্ভুক্ত করতে থাকবে, যাতে ডেভেলপাররা কোর ইনফ্রাস্ট্রাকচার আপডেটে কম সময় ব্যয় করতে পারেন এবং তাদের এজেন্টগুলোকে কার্যকর করে তোলে এমন ডোমেইন-নির্দিষ্ট লজিকে বেশি সময় ব্যয় করতে পারেন.

Agent SDK কিভাবে ব্যবহারকারীর ইনপুট, মডেল এবং টুলকে সংযুক্ত করে AI এজেন্ট তৈরি করে, তা দেখানো ডায়াগ্রাম.
মডেল, টুল এবং অর্কেস্ট্রেশন সহ Agent SDK ব্যবহার করে কিভাবে AI এজেন্ট তৈরি করা যায়, তা এই ডায়াগ্রামে দেখানো হয়েছে.

হারনেসটি ডেভেলপারদের অত্যাধুনিক মডেলের আরও বেশি সক্ষমতা উন্মুক্ত করতে সাহায্য করে, কারণ এটি এক্সিকিউশনকে সেইভাবে সামঞ্জস্য করে যেভাবে এই মডেলগুলো সর্বোত্তম পারফর্ম করে. এতে এজেন্টগুলো মডেলের স্বাভাবিক কাজের ধরনের আরও কাছাকাছি থাকে, ফলে জটিল কাজে নির্ভরযোগ্যতা ও কর্মদক্ষতা বাড়ে—বিশেষ করে যখন কাজ দীর্ঘসময় ধরে চলে বা নানা ধরনের টুল ও সিস্টেম জুড়ে সমন্বয় করে করতে হয়.

এছাড়াও, আমরা বুঝি প্রতিটি পণ্যই অনন্য এবং খুব কমই কোনো নির্দিষ্ট ছাঁচে পুরোপুরি খাপ খায়. আমরা এই বৈচিত্র্যকে সমর্থন করার জন্য Agents SDK ডিজাইন করেছি. ডেভেলপাররা এমন একটি ফ্রেমওয়ার্ক পান যা ব্যবহারের জন্য প্রস্তুত, তবু নমনীয়—ফলে টুল ব্যবহার, মেমোরি এবং স্যান্ডবক্স পরিবেশসহ নিজেদের স্ট্যাকের সঙ্গে এটিকে সহজেই মানিয়ে নেওয়া যায়.

নেটিভ স্যান্ডবক্স এক্সিকিউশন

আপডেট করা Agents SDK নেটিভভাবে স্যান্ডবক্স এক্সিকিউশন সমর্থন করে, ফলে এজেন্টরা কোনো টাস্কের জন্য প্রয়োজনীয় ফাইল, টুল এবং ডিপেনডেন্সিসহ নিয়ন্ত্রিত কম্পিউটার পরিবেশে চলতে পারে.

অনেক উপকারী এজেন্টের এমন একটি ওয়ার্কস্পেস দরকার যেখানে তারা ফাইল পড়তে ও লিখতে পারে, নির্ভরশীলতা ইনস্টল করতে পারে, কোড চালাতে পারে এবং নিরাপদে টুল ব্যবহার করতে পারে. নেটিভ স্যান্ডবক্স সাপোর্ট ডেভেলপারদের সেই এক্সিকিউশন লেয়ারটি সরাসরি (আউট অফ দ্য বক্স) প্রদান করে, যার ফলে তাদের নিজেদের এটি আলাদাভাবে জোড়া লাগানোর বা তৈরি করার প্রয়োজন হয় না.

ডেভেলপাররা নিজেদের স্যান্ডবক্স নিয়ে আসতে পারো অথবা Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop এবং Vercel-এর জন্য থাকা বিল্ট-ইন সাপোর্ট ব্যবহার করতে পারেন.

বিভিন্ন প্রোভাইডারের মধ্যে সেই এনভায়রনমেন্টগুলোকে পোর্টেবল করতে, SDK এজেন্টের ওয়ার্কস্পেস বর্ণনা করার জন্য একটি ম্যানিফেস্ট অ্যাবস্ট্রাকশনও প্রবর্তন করে. ডেভেলপাররা লোকাল ফাইল মাউন্ট করতে, আউটপুট ডিরেক্টরি নির্ধারণ করতে এবং AWS S3, Google Cloud Storage, Azure Blob Storage, ও Cloudflare R2-সহ স্টোরেজ প্রোভাইডারগুলো থেকে ডেটা আনতে পারেন.

এটি ডেভেলপারদের জন্য লোকাল প্রোটোটাইপ থেকে প্রোডাকশন ডিপ্লয়মেন্ট পর্যন্ত এজেন্টের পরিবেশ গঠনের একটি সঙ্গতিপূর্ণ উপায় দেয়. এটি মডেলকে একটি পূর্বানুমানযোগ্য ওয়ার্কস্পেস দেয়: ইনপুট কোথায় পাওয়া যাবে, আউটপুট কোথায় লেখা হবে এবং দীর্ঘমেয়াদী কাজের সময় কাজকে কিভাবে সংগঠিত রাখা যায়.

Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop-এর লোগো

নিরাপত্তা, স্থিতিশীলতা এবং পরিসর বৃদ্ধির জন্য হারনেসকে কম্পিউট থেকে আলাদা করা

এজেন্ট সিস্টেমগুলি এমনভাবে ডিজাইন করা উচিত যাতে প্রম্পট ইনজেকশন এবং এক্সফিলট্রেশনের চেষ্টাকে ধরে নেওয়া হয়. হারনেস এবং কম্পিউট আলাদা রাখলে মডেল-উৎপন্ন কোড যে পরিবেশে এক্সিকিউট হয় সেখানে ক্রেডেনশিয়াল না রাখতে সাহায্য করে.

এটি টেকসই বাস্তবায়নও সক্ষম করে. যখন এজেন্টের স্টেট এক্সটার্নালাইজড থাকে, তখন একটি স্যান্ডবক্স কনটেইনার হারিয়ে যাওয়া মানে রান হারিয়ে যাওয়া নয়. বিল্ট-ইন স্ন্যাপশটিং এবং রিহাইড্রেশনসহ, Agents SDK মূল পরিবেশ ব্যর্থ হলে বা তার মেয়াদ শেষ হয়ে গেলে একটি নতুন কন্টেইনারে এজেন্টের অবস্থা পুনরুদ্ধার করতে পারে এবং শেষ চেকপয়েন্ট থেকে কাজ চালিয়ে যেতে পারে.

সবশেষে, এটি এজেন্টগুলোকে আরও স্কেলযোগ্য করে তোলে. এজেন্ট রান এক বা একাধিক স্যান্ডবক্স ব্যবহার করতে পারে, শুধু প্রয়োজন হলে স্যান্ডবক্স ইনভোক করতে পারে, সাবএজেন্টগুলোকে আইসোলেটেড এনভায়রনমেন্টে রাউট করতে পারে এবং দ্রুততর এক্সিকিউশনের জন্য কনটেইনার জুড়ে কাজ প্যারালালাইজ করতে পারে.

ফ্লো ডায়াগ্রামটি চিত্রিত করে যে Agent SDK কিভাবে AI এজেন্টদের আরও জটিল কাজের জন্য অতিরিক্ত কম্পিউট রিসোর্স ব্যবহার করতে সক্ষম করে.
Agent SDK দিয়ে তৈরি AI এজেন্টগুলো কিভাবে আলাদা আলাদা কম্পিউট সিস্টেম পরিচালনা করতে পারে, তার একটি চিত্র—যা ওয়ার্কলোডগুলোকে স্বাধীনভাবে চলতে দেয় এবং আরও উন্নত কাজ সম্পাদনে সহায়তা করে.

প্রাইসিং এবং অ্যাভেইলেবিলিটি

এই নতুন Agents SDK ক্ষমতাসমূহ API-এর মাধ্যমে সকল গ্রাহকদের জন্য সাধারণভাবে উপলব্ধ এবং টোকেন ও টুল ব্যবহারের ভিত্তিতে স্ট্যান্ডার্ড API প্রাইসিং ব্যবহার করে.

পরবর্তী পদক্ষেপ

আমরা Agents SDK-এর উন্নয়ন অব্যাহত রাখার সঙ্গে সঙ্গে ডেভেলপাররা এটি দিয়ে কী তৈরি করতে পারবেন তা আরও বিস্তৃত করব, যাতে কম কাস্টম ইনফ্রাস্ট্রাকচার ব্যবহার করে আরও সক্ষম এজেন্টগুলোকে প্রোডাকশনে আনা সহজ হয়. একই সঙ্গে ডেভেলপারদের প্রয়োজনীয় নমনীয়তা এবং নিয়ন্ত্রণ বজায় থাকবে, যাতে তারা এজেন্টগুলোকে তাদের নিজস্ব পরিবেশের সঙ্গে মানিয়ে নিতে পারেন.

নতুন হারনেস এবং স্যান্ডবক্স সক্ষমতাগুলো প্রথমে Python-এ চালু হচ্ছে এবং ভবিষ্যতের একটি রিলিজে TypeScript সাপোর্ট দেওয়ার পরিকল্পনা রয়েছে. আমরা Python এবং TypeScript—উভয় ক্ষেত্রেই কোড মোড এবং সাব-এজেন্টসহ এজেন্টের অতিরিক্ত সক্ষমতা নিয়ে আসতেও কাজ করছি.

এছাড়াও, আমরা সময়ের সাথে সাথে বৃহত্তর এজেন্ট ইকোসিস্টেমকে একত্রিত করতে সাহায্য করতে চাই, যার জন্য থাকবে আরও স্যান্ডবক্স প্রোভাইডারদের জন্য সমর্থন, আরও ইন্টিগ্রেশন, এবং ডেভেলপারদের জন্য তাদের ব্যবহৃত টুল ও সিস্টেমে SDK-টি যুক্ত করার আরও উপায়.