Bỏ qua nội dung chính
OpenAI

21 tháng 5, 2025

Sản phẩm

Các công cụ và tính năng mới trong API Phản hồi

Ra mắt tính năng hỗ trợ máy chủ MCP từ xa, tạo hình ảnh, trình Thông dịch mã và nhiều tính năng khác trong API Phản hồi dành cho nhà phát triển và doanh nghiệp.

Đang tải…

Hôm nay, chúng tôi bổ sung thêm các công cụ tích hợp mới vào API Phản hồi—nền tảng API cốt lõi của chúng tôi để xây dựng các ứng dụng dạng tác nhân. Trong đó bao gồm hỗ trợ cho tất cả các máy chủ Giao thức ngữ cảnh mô hình (MCP)(mở trong cửa sổ mới) từ xa, cũng như các công cụ như tạo hình ảnh(mở trong cửa sổ mới), trình Thông dịch mã(mở trong cửa sổ mới) và cải tiến chức năng tìm kiếm tệp(mở trong cửa sổ mới). Các công cụ này có sẵn trong các serie GPT‑4o, serie GPT‑4.1 và các mô hình suy luận serie OpenAI o. Hiện tại, o3 và o4-mini có thể gọi các công cụ và chức năng trực tiếp trong chuỗi tư duy trong API Phản hồi, nhờ đó tạo ra các câu trả lời phong phú và phù hợp hơn về mặt ngữ cảnh. Việc sử dụng o3 và o4-mini với API Phản hồi sẽ giúp bảo toàn token suy luận với các yêu cầu và lệnh gọi công cụ, cải thiện trí thông minh của mô hình và giảm chi phí cũng như độ trễ cho nhà phát triển.

Chúng tôi cũng ra mắt các tính năng mới trong API Phản hồi giúp cải thiện độ tin cậy, khả năng theo dõi thông tin và quyền riêng tư cho doanh nghiệp và nhà phát triển. Chúng bao gồm chế độ nền(mở trong cửa sổ mới) để xử lý các tác vụ chạy lâu dài không đồng bộ và đáng tin cậy hơn, hỗ trợ tóm tắt suy luận(mở trong cửa sổ mới) và hỗ trợ các mục suy luận được mã hóa(mở trong cửa sổ mới)

Kể từ khi phát hành API Phản hồi vào tháng 3 năm 2025 với các công cụ như tìm kiếm web, tìm kiếm tệp và sử dụng máy tính, hàng trăm nghìn nhà phát triển đã sử dụng API để xử lý hàng nghìn tỷ token trên các mô hình của chúng tôi. Khách hàng đã sử dụng API để xây dựng nhiều ứng dụng dạng tác nhân khác nhau, bao gồm tác nhân viết mã của Zencoder(mở trong cửa sổ mới), tác nhân thông tin thị trường của Revi(mở trong cửa sổ mới) cho nghiệp vụ ngân hàng đầu tư và vốn tư nhân, và trợ lý giáo dục của MagicSchool AI(mở trong cửa sổ mới)—tất cả đều sử dụng tìm kiếm web để đưa thông tin liên quan và cập nhật vào ứng dụng của họ. Giờ đây, các nhà phát triển có thể xây dựng các tác nhân hữu ích và đáng tin cậy hơn nhờ khả năng sử dụng các công cụ và tính năng mới được phát hành hôm nay.

Hỗ trợ máy chủ MCP từ xa mới

Chúng tôi đang hỗ trợ thêm cho máy chủ MCP(mở trong cửa sổ mới) từ xa trong API Phản hồi, dựa trên việc bổ sung hỗ trợ MCP trong SDK Tác nhân(mở trong cửa sổ mới). MCP là một giao thức mở chuẩn hóa cách thức các ứng dụng cung cấp ngữ cảnh cho LLM. Với khả năng hỗ trợ các máy chủ MCP trong API Phản hồi, nhà phát triển sẽ có thể kết nối mô hình của chúng tôi với các công cụ được lưu trữ trên bất kỳ máy chủ MCP nào chỉ bằng một vài dòng mã. Sau đây là một số ví dụ cho thấy cách các nhà phát triển có thể sử dụng máy chủ MCP từ xa với API Phản hồi hiện tại:

Python

1
response = client.responses.create(
2
model="gpt-4.1",
3
tools=[{
4
"type": "mcp",
5
"server_label": "shopify",
6
"server_url": "https://pitchskin.com/api/mcp",
7
}],
8
input="Add the Blemish Toner Pads to my cart"
9
)

The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Pitch. Skin checkout page showing express options (Shop Pay, PayPal, G Pay), contact and delivery form fields, and an order summary for one ‘Blemish Toner Pads 200 mL (120 pads)’ priced at AUD $49.

Các máy chủ MCP từ xa phổ biến bao gồm Cloudflare(mở trong cửa sổ mới), HubSpot(mở trong cửa sổ mới), Intercom(mở trong cửa sổ mới), PayPal(mở trong cửa sổ mới), Plaid(mở trong cửa sổ mới), Shopify(mở trong cửa sổ mới), Stripe(mở trong cửa sổ mới), Square(mở trong cửa sổ mới), Twilio(mở trong cửa sổ mới), Zapier(mở trong cửa sổ mới) và nhiều hãng khác. Chúng tôi dự kiến hệ sinh thái máy chủ MCP từ xa sẽ phát triển nhanh chóng trong những tháng tới, giúp các nhà phát triển dễ dàng xây dựng các tác nhân mạnh mẽ có thể kết nối với các công cụ và nguồn dữ liệu mà người dùng của họ tin cậy. Để hỗ trợ tốt nhất cho hệ sinh thái và góp phần xây dựng tiêu chuẩn đang phát triển này, OpenAI cũng đã tham gia vào ban chỉ đạo của MCP.

Để tìm hiểu cách thiết lập máy chủ MCP từ xa của riêng bạn, hãy xem hướng dẫn này từ Cloudflare(mở trong cửa sổ mới). Để tìm hiểu cách sử dụng công cụ MCP trong API Phản hồi, hãy xem hướng dẫn(mở trong cửa sổ mới) này trong Sách hướng dẫn API của chúng tôi.

Các điểm cập nhật đối với tính năng tạo hình ảnh, trình Thông dịch mã và tìm kiếm tệp

Với các công cụ tích hợp trong API Phản hồi, các nhà phát triển có thể dễ dàng tạo ra các tác nhân có nhiều khả năng hơn chỉ bằng một lệnh gọi API. Bằng cách gọi nhiều công cụ trong khi suy luận, các mô hình hiện đạt được hiệu suất gọi công cụ cao hơn đáng kể khi đối chiếu với các đánh giá tiêu chuẩn trong ngành như Humanity’s Last Exam (nguồn). Hôm nay, chúng tôi sẽ bổ sung thêm các công cụ mới bao gồm:

Các tính năng mới trong API Phản hồi

Ngoài các công cụ mới, chúng tôi cũng đang bổ sung hỗ trợ cho các tính năng mới trong API Phản hồi, bao gồm:

  • Chế độ nền: Như đã thấy trong các sản phẩm dạng tác nhân như Codex, nghiên cứu sâuOperator, các mô hình lý luận có thể mất vài phút để giải quyết các vấn đề phức tạp. Các nhà phát triển hiện có thể sử dụng chế độ nền để xây dựng những trải nghiệm tương tự trên các mô hình như o3 mà không phải lo lắng về thời gian chờ hoặc các vấn đề kết nối khác—chế độ nền khởi động các tác vụ này một cách không đồng bộ. Các nhà phát triển có thể thăm dò các đối tượng này để kiểm tra mức độ hoàn thành hoặc bắt đầu phát trực tuyến các sự kiện bất cứ khi nào ứng dụng của họ cần cập nhật trạng thái mới nhất. Tìm hiểu thêm(mở trong cửa sổ mới).

Python

1
response = client.responses.create(
2
model="o3",
3
input="Write me an extremely long story.",
4
reasoning={ "effort": "high" },
5
background=True
6
)
  • Tóm tắt suy luận: API Phản hồi hiện có thể tạo ra các bản tóm tắt ngắn gọn, bằng ngôn ngữ tự nhiên về chuỗi tư duy bên trong của mô hình, tương tự như những gì bạn thấy trong ChatGPT. Điều này giúp các nhà phát triển dễ dàng gỡ lỗi, kiểm tra và xây dựng trải nghiệm tốt hơn cho người dùng cuối. Bạn có thể xem tóm tắt suy luận mà không mất thêm chi phí. Tìm hiểu thêm(mở trong cửa sổ mới).

Python

1
response = client.responses.create(
2
model="o4-mini",
3
tools=[
4
{
5
"type": "code_interpreter",
6
"container": {"type": "auto"}
7
}
8
],
9
instructions=(
10
"You are a personal math tutor. "
11
"When asked a math question, run code to answer the question."
12
),
13
input="I need to solve the equation `3x + 11 = 14`. Can you help me?",
14
reasoning={"summary": "auto"}
15
)

Python

1
response = client.responses.create(
2
model="o3",
3
input="Implement a simple web server in Rust from scratch.",
4
store=False,
5
include=["reasoning.encrypted_content"]
6
)

Mức giá và tình trạng sẵn có

Tất cả các công cụ và tính năng này hiện có sẵn trong API Phản hồi, được hỗ trợ trong serie GPT‑4o, serie GPT‑4.1 và các mô hình lý luận OpenAI thuộc serie (o1, o3, o3‑mini và o4-mini). Chức năng tạo sinh ảnh chỉ được hỗ trợ trên o3 trong serie mô hình lý luận của chúng tôi. 

Mức giá cho các công cụ hiện có vẫn giữ nguyên. Chi phí tạo sinh ảnh là $5,00 cho 1 triệu token đầu vào văn bản, $10,00 cho 1 triệu token đầu vào hình ảnh và $40,00 cho 1 triệu token đầu ra hình ảnh, với mức giảm giá 75% cho token đầu vào đã lưu vào bộ nhớ tạm. Trình Thông dịch mã có giá $0,03 mỗi vùng chứa. Chi phí tìm kiếm tệp là $0,10/GB dung lượng lưu trữ vector mỗi ngày và $2,50/1.000 lần gọi công cụ. Không mất chi phí thêm cho việc gọi công cụ máy chủ MCP từ xa—bạn chỉ phải trả phí cho các token đầu ra từ API. Tìm hiểu thêm về mức giá(mở trong cửa sổ mới) trong tài liệu của chúng tôi. 

Chúng tôi rất mong chờ được xem những gì bạn xây dựng!

Tác giả

OpenAI