Các công cụ và tính năng mới trong API Phản hồi
Ra mắt tính năng hỗ trợ máy chủ MCP từ xa, tạo hình ảnh, trình Thông dịch mã và nhiều tính năng khác trong API Phản hồi dành cho nhà phát triển và doanh nghiệp.
Hôm nay, chúng tôi bổ sung thêm các công cụ tích hợp mới vào API Phản hồi—nền tảng API cốt lõi của chúng tôi để xây dựng các ứng dụng dạng tác nhân. Trong đó bao gồm hỗ trợ cho tất cả các máy chủ Giao thức ngữ cảnh mô hình (MCP)(mở trong cửa sổ mới) từ xa, cũng như các công cụ như tạo hình ảnh(mở trong cửa sổ mới), trình Thông dịch mã(mở trong cửa sổ mới) và cải tiến chức năng tìm kiếm tệp(mở trong cửa sổ mới). Các công cụ này có sẵn trong các serie GPT‑4o, serie GPT‑4.1 và các mô hình suy luận serie OpenAI o. Hiện tại, o3 và o4-mini có thể gọi các công cụ và chức năng trực tiếp trong chuỗi tư duy trong API Phản hồi, nhờ đó tạo ra các câu trả lời phong phú và phù hợp hơn về mặt ngữ cảnh. Việc sử dụng o3 và o4-mini với API Phản hồi sẽ giúp bảo toàn token suy luận với các yêu cầu và lệnh gọi công cụ, cải thiện trí thông minh của mô hình và giảm chi phí cũng như độ trễ cho nhà phát triển.
Chúng tôi cũng ra mắt các tính năng mới trong API Phản hồi giúp cải thiện độ tin cậy, khả năng theo dõi thông tin và quyền riêng tư cho doanh nghiệp và nhà phát triển. Chúng bao gồm chế độ nền(mở trong cửa sổ mới) để xử lý các tác vụ chạy lâu dài không đồng bộ và đáng tin cậy hơn, hỗ trợ tóm tắt suy luận(mở trong cửa sổ mới) và hỗ trợ các mục suy luận được mã hóa(mở trong cửa sổ mới).
Kể từ khi phát hành API Phản hồi vào tháng 3 năm 2025 với các công cụ như tìm kiếm web, tìm kiếm tệp và sử dụng máy tính, hàng trăm nghìn nhà phát triển đã sử dụng API để xử lý hàng nghìn tỷ token trên các mô hình của chúng tôi. Khách hàng đã sử dụng API để xây dựng nhiều ứng dụng dạng tác nhân khác nhau, bao gồm tác nhân viết mã của Zencoder(mở trong cửa sổ mới), tác nhân thông tin thị trường của Revi(mở trong cửa sổ mới) cho nghiệp vụ ngân hàng đầu tư và vốn tư nhân, và trợ lý giáo dục của MagicSchool AI(mở trong cửa sổ mới)—tất cả đều sử dụng tìm kiếm web để đưa thông tin liên quan và cập nhật vào ứng dụng của họ. Giờ đây, các nhà phát triển có thể xây dựng các tác nhân hữu ích và đáng tin cậy hơn nhờ khả năng sử dụng các công cụ và tính năng mới được phát hành hôm nay.
Chúng tôi đang hỗ trợ thêm cho máy chủ MCP(mở trong cửa sổ mới) từ xa trong API Phản hồi, dựa trên việc bổ sung hỗ trợ MCP trong SDK Tác nhân(mở trong cửa sổ mới). MCP là một giao thức mở chuẩn hóa cách thức các ứng dụng cung cấp ngữ cảnh cho LLM. Với khả năng hỗ trợ các máy chủ MCP trong API Phản hồi, nhà phát triển sẽ có thể kết nối mô hình của chúng tôi với các công cụ được lưu trữ trên bất kỳ máy chủ MCP nào chỉ bằng một vài dòng mã. Sau đây là một số ví dụ cho thấy cách các nhà phát triển có thể sử dụng máy chủ MCP từ xa với API Phản hồi hiện tại:
The Blemish Toner Pads have been added to your cart! You can proceed to checkout here:

Các máy chủ MCP từ xa phổ biến bao gồm Cloudflare(mở trong cửa sổ mới), HubSpot(mở trong cửa sổ mới), Intercom(mở trong cửa sổ mới), PayPal(mở trong cửa sổ mới), Plaid(mở trong cửa sổ mới), Shopify(mở trong cửa sổ mới), Stripe(mở trong cửa sổ mới), Square(mở trong cửa sổ mới), Twilio(mở trong cửa sổ mới), Zapier(mở trong cửa sổ mới) và nhiều hãng khác. Chúng tôi dự kiến hệ sinh thái máy chủ MCP từ xa sẽ phát triển nhanh chóng trong những tháng tới, giúp các nhà phát triển dễ dàng xây dựng các tác nhân mạnh mẽ có thể kết nối với các công cụ và nguồn dữ liệu mà người dùng của họ tin cậy. Để hỗ trợ tốt nhất cho hệ sinh thái và góp phần xây dựng tiêu chuẩn đang phát triển này, OpenAI cũng đã tham gia vào ban chỉ đạo của MCP.
Để tìm hiểu cách thiết lập máy chủ MCP từ xa của riêng bạn, hãy xem hướng dẫn này từ Cloudflare(mở trong cửa sổ mới). Để tìm hiểu cách sử dụng công cụ MCP trong API Phản hồi, hãy xem hướng dẫn(mở trong cửa sổ mới) này trong Sách hướng dẫn API của chúng tôi.
Với các công cụ tích hợp trong API Phản hồi, các nhà phát triển có thể dễ dàng tạo ra các tác nhân có nhiều khả năng hơn chỉ bằng một lệnh gọi API. Bằng cách gọi nhiều công cụ trong khi suy luận, các mô hình hiện đạt được hiệu suất gọi công cụ cao hơn đáng kể khi đối chiếu với các đánh giá tiêu chuẩn trong ngành như Humanity’s Last Exam (nguồn). Hôm nay, chúng tôi sẽ bổ sung thêm các công cụ mới bao gồm:
- Tạo hình ảnh: Ngoài việc sử dụng API Hình ảnh(mở trong cửa sổ mới), các nhà phát triển hiện có thể truy cập vào mô hình tạo sinh ảnh mới nhất của chúng tôi—
gpt-image-1—dưới dạng một công cụ trong API Phản hồi. Công cụ này hỗ trợ phát trực tuyến theo thời gian thực—cho phép các nhà phát triển xem trước hình ảnh ngay trong quá trình tạo—và chỉnh sửa nhiều lần—cho phép các nhà phát triển nhắc mô hình tinh chỉnh chi tiết các hình ảnh này từng bước. Tìm hiểu thêm(mở trong cửa sổ mới). - Trình thông dịch mã: Các nhà phát triển hiện có thể sử dụng công cụ trình Thông dịch mã(mở trong cửa sổ mới) trong API Phản hồi. Công cụ này hữu ích cho việc phân tích dữ liệu, giải quyết các bài toán và vấn đề viết mã phức tạp, đồng thời giúp các mô hình hiểu sâu sắc và thao tác hình ảnh (ví dụ: suy nghĩ qua hình ảnh). Khả năng sử dụng công cụ trình Thông dịch mã trong chuỗi tư duy của các mô hình như o3 và o4-mini đã cải thiện hiệu suất ở nhiều bài đánh giá, bao gồm cả Humanity’s Last Exam (nguồn). Tìm hiểu thêm(mở trong cửa sổ mới).
- Tìm kiếm tệp: Các nhà phát triển hiện có thể truy cập công cụ tìm kiếm tệp trong mô hình suy luận của chúng tôi. Tìm kiếm tệp cho phép các nhà phát triển kéo các phần có liên quan trong tài liệu của họ vào ngữ cảnh của mô hình dựa trên truy vấn của người dùng. Chúng tôi cũng ra mắt bản cập nhật cho công cụ tìm kiếm tệp cho phép các nhà phát triển thực hiện tìm kiếm trên nhiều kho vector và hỗ trợ lọc thuộc tính bằng ma trận. (mở trong cửa sổ mới)Tìm hiểu thêm(mở trong cửa sổ mới).
Ngoài các công cụ mới, chúng tôi cũng đang bổ sung hỗ trợ cho các tính năng mới trong API Phản hồi, bao gồm:
- Chế độ nền: Như đã thấy trong các sản phẩm dạng tác nhân như Codex, nghiên cứu sâu và Operator, các mô hình lý luận có thể mất vài phút để giải quyết các vấn đề phức tạp. Các nhà phát triển hiện có thể sử dụng chế độ nền để xây dựng những trải nghiệm tương tự trên các mô hình như o3 mà không phải lo lắng về thời gian chờ hoặc các vấn đề kết nối khác—chế độ nền khởi động các tác vụ này một cách không đồng bộ. Các nhà phát triển có thể thăm dò các đối tượng này để kiểm tra mức độ hoàn thành hoặc bắt đầu phát trực tuyến các sự kiện bất cứ khi nào ứng dụng của họ cần cập nhật trạng thái mới nhất. Tìm hiểu thêm(mở trong cửa sổ mới).
- Tóm tắt suy luận: API Phản hồi hiện có thể tạo ra các bản tóm tắt ngắn gọn, bằng ngôn ngữ tự nhiên về chuỗi tư duy bên trong của mô hình, tương tự như những gì bạn thấy trong ChatGPT. Điều này giúp các nhà phát triển dễ dàng gỡ lỗi, kiểm tra và xây dựng trải nghiệm tốt hơn cho người dùng cuối. Bạn có thể xem tóm tắt suy luận mà không mất thêm chi phí. Tìm hiểu thêm(mở trong cửa sổ mới).
- Các mục suy luận được mã hóa: Khách hàng đủ điều kiện hưởng chính sách Không lưu giữ dữ liệu ngoài mức cần thiết (ZDR)(mở trong cửa sổ mới) hiện có thể sử dụng lại các mục suy luận với nhiều yêu cầu API mà không cần lưu trữ bất kỳ mục suy luận nào trên máy chủ của OpenAI. Đối với các mô hình như o3 và o4-mini, việc sử dụng lại các mục suy luận giữa các lệnh gọi hàm sẽ tăng cường trí thông minh, giảm mức sử dụng token và tăng tỷ lệ truy cập bộ nhớ đệm, dẫn đến giảm chi phí và độ trễ. Tìm hiểu thêm(mở trong cửa sổ mới).
Tất cả các công cụ và tính năng này hiện có sẵn trong API Phản hồi, được hỗ trợ trong serie GPT‑4o, serie GPT‑4.1 và các mô hình lý luận OpenAI thuộc serie (o1, o3, o3‑mini và o4-mini). Chức năng tạo sinh ảnh chỉ được hỗ trợ trên o3 trong serie mô hình lý luận của chúng tôi.
Mức giá cho các công cụ hiện có vẫn giữ nguyên. Chi phí tạo sinh ảnh là $5,00 cho 1 triệu token đầu vào văn bản, $10,00 cho 1 triệu token đầu vào hình ảnh và $40,00 cho 1 triệu token đầu ra hình ảnh, với mức giảm giá 75% cho token đầu vào đã lưu vào bộ nhớ tạm. Trình Thông dịch mã có giá $0,03 mỗi vùng chứa. Chi phí tìm kiếm tệp là $0,10/GB dung lượng lưu trữ vector mỗi ngày và $2,50/1.000 lần gọi công cụ. Không mất chi phí thêm cho việc gọi công cụ máy chủ MCP từ xa—bạn chỉ phải trả phí cho các token đầu ra từ API. Tìm hiểu thêm về mức giá(mở trong cửa sổ mới) trong tài liệu của chúng tôi.
Chúng tôi rất mong chờ được xem những gì bạn xây dựng!