Bỏ qua nội dung chính
OpenAI

15 tháng 4, 2026

Sản phẩm

Bước phát triển tiếp theo của Agents SDK

Agents SDK được cập nhật giúp các nhà phát triển tạo ra các tác nhân có khả năng kiểm tra tệp, chạy lệnh, chỉnh sửa mã và thực hiện các tác vụ dài hạn trong môi trường sandbox được kiểm soát.

Đang tải…

Chúng tôi đang giới thiệu các khả năng mới cho Agents SDK cung cấp cho các nhà phát triển cơ sở hạ tầng tiêu chuẩn hóa dễ dàng bắt đầu và được xây dựng chính xác cho các mô hình OpenAI: một dây nịt gốc mô hình cho phép các tác nhân làm việc trên các tệp và công cụ trên máy tính, cộng với thực thi sandbox gốc để chạy hoạt động đó một cách an toàn.

Ví dụ: các nhà phát triển có thể cung cấp cho một tác nhân một không gian làm việc được kiểm soát, hướng dẫn rõ ràng và các công cụ cần thiết để kiểm tra bằng chứng:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# Annual metrics
20

21
| Year | Revenue | Operating income | Operating cash flow |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="Answer using only files in data/. Cite source filenames.",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

Các nhà phát triển cần nhiều hơn là những mô hình tốt nhất để xây dựng các tác nhân hữu ích—họ cần các hệ thống hỗ trợ cách tác nhân kiểm tra tệp, chạy lệnh, viết mã và tiếp tục hoạt động qua nhiều bước.

Các hệ thống tồn tại ngày nay đi kèm với sự đánh đổi khi các nhóm chuyển từ nguyên mẫu sang sản xuất. Các framework không theo mô hình rất linh hoạt nhưng không sử dụng đầy đủ các khả năng mô hình biên giới; SDK của nhà cung cấp mô hình có thể gần với mô hình hơn nhưng thường thiếu khả năng hiển thị đầy đủ về việc khai thác; và API tác nhân được quản lý có thể đơn giản hóa việc triển khai nhưng hạn chế nơi các đại lý chạy và cách họ truy cập dữ liệu nhạy cảm.

Dưới đây là những gì một số khách hàng đã thử nghiệm SDK mới với chúng tôi đã nói:

“SDK Tác nhân đã được cập nhật giúp chúng tôi có đủ khả thi để triển khai trong môi trường production nhằm tự động hóa một quy trình làm việc quan trọng liên quan đến hồ sơ lâm sàng mà các phương pháp trước đây không thể xử lý đủ tin cậy. Đối với chúng tôi, sự khác biệt không chỉ nằm ở việc trích xuất đúng siêu dữ liệu, mà còn ở việc hiểu chính xác ranh giới của từng lần thăm khám trong các hồ sơ dài và phức tạp. Nhờ đó, chúng tôi có thể nhanh chóng hiểu được điều gì đang diễn ra với từng bệnh nhân trong mỗi lần thăm khám, hỗ trợ các thành viên đáp ứng nhu cầu chăm sóc của họ và cải thiện trải nghiệm của họ với chúng tôi.”
— Oscar Health

Bộ công cụ hiệu quả hơn cho vòng lặp tác nhân

Với bản phát hành hôm nay, bộ công cụ tác nhân của Agents SDK trở nên mạnh mẽ hơn cho các tác nhân làm việc với tài liệu, tệp và hệ thống. Giờ đây, bộ công cụ này bổ sung bộ nhớ có thể cấu hình, khả năng điều phối có nhận biết sandbox, các công cụ filesystem giống Codex và các tích hợp được chuẩn hóa với những primitives đang trở nên phổ biến trong các hệ thống tác nhân tiên phong.

Các thành phần nguyên thủy này bao gồm việc sử dụng công cụ thông qua MCP(mở trong cửa sổ mới), công bố dần dần thông qua skills(mở trong cửa sổ mới), chỉ dẫn tùy chỉnh thông qua AGENTS.md(mở trong cửa sổ mới), thực thi mã bằng công cụ shell(mở trong cửa sổ mới), chỉnh sửa tệp bằng công cụ apply patch(mở trong cửa sổ mới) và nhiều nội dung khác. Lớp kiểm soát này sẽ tiếp tục tích hợp các mẫu và thành phần nguyên thủy dành cho tác nhân mới theo thời gian, ताकि các nhà phát triển có thể dành ít thời gian hơn cho các bản cập nhật hạ tầng cốt lõi và nhiều thời gian hơn cho logic đặc thù theo miền giúp tác nhân của họ trở nên hữu ích.

Sơ đồ minh họa cách Agent SDK kết nối thông tin đầu vào từ người dùng, các mô hình và công cụ để xây dựng các tác nhân trí tuệ nhân tạo.
Sơ đồ cho thấy cách xây dựng các tác nhân AI bằng cách sử dụng SDK đại lý với các mô hình, công cụ và phối hợp.

Công cụ này cũng giúp các nhà phát triển khai mở thêm năng lực của một mô hình tiên phong bằng cách căn chỉnh quá trình thực thi theo cách mà các mô hình đó hoạt động hiệu quả nhất. Điều đó giúp các tác nhân bám sát hơn với mẫu vận hành tự nhiên của mô hình, từ đó cải thiện độ tin cậy và hiệu năng trong các tác vụ phức tạp—đặc biệt khi công việc kéo dài hoặc được điều phối trên nhiều công cụ và hệ thống đa dạng.

Ngoài ra, chúng tôi nhận thấy mỗi sản phẩm đều độc đáo và hiếm khi phù hợp hoàn toàn với một khuôn mẫu nhất định. Chúng tôi đã thiết kế Agents SDK để hỗ trợ sự đa dạng này. Các nhà phát triển nhận được một bộ công cụ hoàn chỉnh nhưng vẫn linh hoạt—giúp dễ dàng điều chỉnh cho phù hợp với hệ thống của riêng họ—bao gồm việc sử dụng công cụ, bộ nhớ và môi trường sandbox.

Thực thi trong môi trường sandbox gốc

SDK Agents cập nhật hỗ trợ thực thi sandbox nguyên bản, vì vậy các tác nhân có thể chạy trong môi trường máy tính được kiểm soát với các tệp, công cụ và phụ thuộc mà họ cần cho một tác vụ.

Nhiều tác nhân hữu ích cần một không gian làm việc nơi họ có thể đọc và ghi tệp, cài đặt phụ thuộc, chạy mã và sử dụng các công cụ một cách an toàn. Hỗ trợ sandbox gốc cung cấp cho các nhà phát triển lớp thực thi ngay lập tức, thay vì buộc họ phải tự ghép nó lại với nhau.

Các nhà phát triển có thể mang theo sandbox của riêng họ hoặc sử dụng hỗ trợ tích hợp cho Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop và Vercel.

Để làm cho các môi trường đó di động giữa các nhà cung cấp, SDK cũng giới thiệu trừu tượng Manifest để mô tả không gian làm việc của tác nhân. Các nhà phát triển có thể gắn kết các tệp cục bộ, xác định thư mục đầu ra và đưa dữ liệu từ các nhà cung cấp dịch vụ lưu trữ bao gồm AWS S3, Google Cloud Storage, Azure Blob Storage và Cloudflare R2.

Điều này mang đến cho các nhà phát triển một cách nhất quán để định hình môi trường của tác nhân, từ nguyên mẫu cục bộ đến triển khai sản xuất. Điều này cũng mang lại cho mô hình một không gian làm việc có thể dự đoán được: nơi tìm đầu vào, nơi ghi đầu ra và cách giữ cho công việc được tổ chức xuyên suốt một tác vụ chạy dài hạn.

Logo của Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

Tách biệt bộ khung khỏi năng lực tính toán để tăng cường bảo mật, độ bền và khả năng mở rộng

Các hệ thống tác nhân nên được thiết kế với giả định rằng sẽ có các nỗ lực chèn câu lệnh và rút trộm dữ liệu. Việc tách riêng bộ khung và tính toán giúp giữ thông tin xác thực không xuất hiện trong các môi trường nơi mã do mô hình tạo ra được thực thi.

Điều này cũng cho phép thực thi bền vững. Khi trạng thái của tác nhân được hiển thị ra bên ngoài, việc mất một vùng chứa sandbox không có nghĩa là mất toàn bộ quá trình chạy. Với tính năng chụp nhanh và tái hydrat hóa tích hợp sẵn, Agents SDK có thể khôi phục trạng thái của tác nhân trong một vùng chứa mới và tiếp tục từ điểm kiểm tra gần nhất nếu môi trường ban đầu gặp sự cố hoặc hết hạn.

Cuối cùng, điều này giúp các tác nhân có khả năng mở rộng hơn. Các lần chạy của tác nhân có thể dùng một sandbox hoặc nhiều sandbox, chỉ gọi sandbox khi cần, định tuyến các tác nhân phụ đến các môi trường biệt lập và song song hóa công việc trên nhiều vùng chứa để thực thi nhanh hơn.

Sơ đồ luồng minh họa cách SDK tác nhân cho phép các đại lý AI sử dụng tài nguyên tính toán bổ sung cho các tác vụ phức tạp hơn.
Sơ đồ mô tả cách các tác nhân AI được xây dựng bằng Agent SDK có thể sắp xếp các hệ thống tính toán riêng biệt, cho phép khối lượng công việc chạy độc lập trong khi hỗ trợ các tác vụ nâng cao hơn.

Mức giá và tình trạng sẵn có

Các khả năng mới này của SDK Agents đã được cung cấp rộng rãi cho tất cả khách hàng thông qua API và sử dụng mức giá API tiêu chuẩn, dựa trên token và việc sử dụng công cụ.

Tiếp theo là gì

Trong khi chúng tôi tiếp tục phát triển Agents SDK, chúng tôi sẽ tiếp tục mở rộng những gì các nhà phát triển có thể xây dựng với nó, giúp việc đưa các tác nhân có năng lực hơn vào môi trường sản xuất trở nên dễ dàng hơn với ít hạ tầng tùy chỉnh hơn, đồng thời vẫn duy trì tính linh hoạt và khả năng kiểm soát mà các nhà phát triển cần để điều chỉnh tác nhân cho phù hợp với môi trường riêng của họ.

Các khả năng mới về harness và sandbox trước tiên sẽ được ra mắt trên Python, với hỗ trợ cho TypeScript được lên kế hoạch trong một bản phát hành trong tương lai. Chúng tôi cũng đang làm việc để mang thêm các khả năng bổ sung cho tác nhân, bao gồm chế độ viết mã và tác nhân phụ, đến cả Python và TypeScript.

Ngoài ra, chúng tôi muốn góp phần gắn kết hệ sinh thái tác nhân rộng lớn hơn theo thời gian, bằng cách hỗ trợ thêm nhiều nhà cung cấp sandbox, nhiều tích hợp hơn và nhiều cách hơn để các nhà phát triển tích hợp SDK vào những công cụ và hệ thống mà họ đã sử dụng.

Tác giả

OpenAI