Bỏ qua nội dung chính
OpenAI

6 tháng 10, 2025

Sản phẩm

Giới thiệu AgentKit

Công cụ mới giúp xây dựng, triển khai, và tối ưu hóa các tác nhân.

Đang tải…

Hôm nay, chúng tôi ra mắt AgentKit, một bộ công cụ hoàn chỉnh dành cho nhà phát triển và doanh nghiệp xây dựng, triển khai và tối ưu hóa các tác nhân. Cho đến nay, xây dựng tác nhân luôn đi đôi với việc phải xử lý hàng loạt công cụ rời rạc, quy trình điều phối phức tạp và không ghi rõ phiên bản, các trình kết nối tùy chỉnh, quy trình đánh giá thủ công, tinh chỉnh lời nhắc, cùng nhiều tuần làm phần front-end trước khi phát hành. Nhờ AgentKit, giờ đây các nhà phát triển có thể thiết kế quy trình công việc một cách trực quan và tích hợp UI tác nhân nhanh hơn thông qua các phần mới như:

  • Agent Builder: khung đồ họa trực quan giúp tạo và đánh dấu phiên bản cho quy trình công việc của nhiều tác nhân
  • Kho điều phối trình kết nối: khu vực trung tâm, nơi quản trị viên điều phối cách thức kết nối dữ liệu và công cụ trên các sản phẩm của OpenAI
  • ChatKit: bộ công cụ cho phép nhúng các trải nghiệm tác nhân trong cuộc trò chuyện tùy chỉnh vào sản phẩm của bạn

Chúng tôi cũng mở rộng năng lực đánh giá bằng tính năng mới như bộ dữ liệu, chấm điểm dấu vết, tối ưu lời nhắc tự động, và hỗ trợ mô hình bên thứ ba, để đo lường và cải thiện hiệu suất của tác nhân.

Kể từ khi ra mắt API phản hồi và Agents SDKvào tháng Ba, chúng tôi thấy các nhà phát triển và doanh nghiệp đã xây dựng được các quy trình công việc do tác nhân thực thi hoàn chỉnh cho nghiên cứu sâu, hỗ trợ khách hàng, và nhiều mục đích khác. Klarna đã xây dựng một tác nhân hỗ trợ, giúp xử lý hai phần ba số vé yêu cầu trợ giúp, và Clay tăng trưởng gấp 10 lần nhờ một tác nhân trợ lý bán hàng. AgentKit sử dụng API phản hồi để hỗ trợ các nhà phát triển xây dựng tác nhân hiệu quả và đáng tin cậy hơn.

Thiết kế quy trình công việc với Agent Builder

Khi quy trình công việc của tác nhân ngày càng phức tạp, nhà phát triển cần có cái nhìn rõ ràng hơn về cơ chế vận hành. Agent Builder(mở trong cửa sổ mới) cung cấp khung đồ họa trực quan cho phép lập trình logic qua các nút kéo-thả, liên kết công cụ, và thiết lập các rào cản bảo vệ tùy chỉnh. Có hỗ trợ những tính năng lý tưởng giúp lặp lại nhanh như xem trước bản chạy thử, thiết lập đánh giá ngay trong giao diện, và phiên bản đầy đủ.

Giao diện mô tả một quy trình tự động hóa dịch vụ khách hàng trong công cụ xây dựng trực quan. Trên khung đồ họa là các nút kết nối Bắt đầu, Rào bảo vệ lỗ hổng bảo mật, Tác nhân phân loại, Nếu/khác, Tác nhân trả kết quả, Tác nhân lưu trữ, Tác nhân thông tin, Rào chống ảo giác, và Kết thúc. Danh sách bên trái có một thanh bên hiển thị các loại nút khả dụng gồm: Tác nhân, Ghi chú, Tìm tệp, Rào bảo vệ, MCP, và Người dùng phê duyệt. Các công cụ điều khiển trên cùng gồm các tùy chọn Đánh giá, Mã, Xem trước, và Xuất bản.

Các nhà xây dựng sản phẩm có thể khởi tạo từ một khung đồ họa trống hoặc chọn khung mẫu được tích hợp sẵn.

Tại Ramp, đội nhóm này chỉ mất vài giờ để biến một khung đồ họa trống thành tác nhân xử lý mua sắm.

Nhờ Agent Builder, công việc điều phối, lập trình tùy chỉnh, và tối ưu thủ công phức tạp từng cần nhiều tháng giờ đây chỉ mất vài giờ. Khung đồ họa trực quan giúp bộ phận sản phẩm, pháp lý, và kỹ thuật làm việc thống nhất, rút ngắn 70% thời gian thử nghiệm và đưa tác nhân vào hoạt động chỉ sau hai chu kỳ phát triển thay vì hai quý.”
- Ramp

Tương tự, công ty công nghệ và dịch vụ Internet hàng đầu Nhật Bản là LY Corporation đã xây dựng được một tác nhân trợ lý công việc bằng Agent Builder trong chưa đầy hai giờ.

“Nhờ Agent Builder, chúng tôi có thể quản lý tác nhân theo phương thức hoàn toàn mới, khi kỹ sư và chuyên gia lĩnh vực hợp tác làm việc trên cùng một giao diện. Chúng tôi xây dựng quy trình công việc đa tác nhân đầu tiên của mình, và vận hành trong chưa tới hai giờ, giúp đẩy nhanh đáng kể thời gian tạo và triển khai tác nhân.”
— LY Corporation

Ngoài ra, chúng tôi còn ra mắt Trung tâm điều phối trình kết nối để doanh nghiệp quản trị và bảo trì dữ liệu trong nhiều môi trường làm việc và tổ chức khác nhau. Trung tâm điều phối trình kết nối(mở trong cửa sổ mới) hợp nhất các nguồn dữ liệu vào một bảng quản trị duy nhất trên ChatGPT và API. Trung tâm này có tất cả các trình kết nối được tích hợp trước như Dropbox, Google Drive, Sharepoint, và Microsoft Teams, cũng như các MCP của bên thứ ba.

Các nhà phát triển cũng có thể bật các rào bảo vệ(mở trong cửa sổ mới) trong Agent Builder. Đây là một lớp bảo vệ an toàn mã nguồn mở và dưới dạng mô-đun, giúp bảo vệ các tác nhân khỏi hành vi không mong muốn hoặc ác ý. Rào bảo vệ có thể che chắn hoặc cảnh báo thông tin cá nhân (PII), phát hiện lỗ hổng bảo mật, và áp dụng các biện pháp an toàn khác, giúp dễ dàng xây dựng và triển khai các tác nhân đáng tin cậy, an toàn. Rào bảo vệ có thể triển khai độc lập hoặc qua thư viện rào bảo vệ dành cho Python(mở trong cửa sổ mới)JavaScript(mở trong cửa sổ mới).

Tích hợp trải nghiệm trò chuyện với tác nhân qua ChatKit

Việc triển khai giao diện trò chuyện cho các tác nhân có thể phức tạp hơn bạn nghĩ. Công việc này gồm xử lý phản hồi theo luồng, quản lý luồng hội thoại, hiển thị mô hình tư duy, và thiết kế các trải nghiệm tương tác hấp dẫn trong cuộc trò chuyện. Nhờ ChatKit, việc tích hợp các tác nhân theo cuộc trò chuyện trở nên đơn giản và phù hợp một cách tự nhiên với sản phẩm của bạn. Có thể tích hợp vào ứng dụng hoặc trang web, đồng thời tùy chỉnh cho phù hợp với chủ đề hoặc thương hiệu của bạn.

"Nhờ ChatKit, chúng tôi tiết kiệm được hơn hai tuần khi xây dựng một tác nhân hỗ trợ cộng đồng các nhà phát triển Canva, và tích hợp trong chưa đầy một giờ. Tác nhân hỗ trợ này sẽ thay đổi cách các nhà phát triển tương tác với tài liệu và biến thành một trải nghiệm trò chuyện, giúp dễ dàng xây dựng ứng dụng và tích hợp trên Canva hơn.”
- Canva

Hiện tại, ChatKit thực hiện nhiều mục đích sử dụng, bao gồm trợ lý nội bộ, hướng dẫn cho nhân viên mới, hỗ trợ khách hàng và tác nhân nghiên cứu. Tác nhân hỗ trợ khách hàng của HubSpot(mở trong cửa sổ mới) là một ví dụ:

Bảng điều khiển của nền tảng Ramp, đang hiển thị một giao diện quản lý chi tiêu. Bảng chính có dòng chữ chào người dùng Daniel, và liệt kê các yêu cầu như “Yêu cầu ChatGPT Business” (đang chờ xét duyệt) và “Yêu cầu HubSpot” (bản nháp), cùng các khoản chi gần đây cho vé máy bay, dịch vụ đi chung xe, và phần mềm. Bên phải là một biểu mẫu yêu cầu phần mềm ChatGPT Business, có thông tin chi tiết là 5 gói, giá $125/tháng, từ ngày 1 tháng 10 năm 2025 đến ngày 1 tháng 10 năm 2026, kèm nút màu vàng “Gửi yêu cầu”.

Các bộ đánh giá Evals mới giúp đo lường hiệu suất của tác nhân

Quá trình xây dựng các tác nhân ổn định, sẵn sàng sử dụng đều đòi hỏi đánh giá hiệu suất nghiêm ngặt. Vào năm ngoái, chúng tôi đã ra mắt bộ đánh giá Evals (mở trong cửa sổ mới) để hỗ trợ các nhà phát triển kiểm thử lời nhắc và đo lường hành vi mô hình. Giờ đây, chúng tôi bổ sung bốn khả năng mới giúp dễ dàng xây dựng các bộ đánh giá hơn:

  • Bộ dữ liệu: nhanh chóng xây dựng các bộ đánh giá từ đầu và mở rộng theo thời gian bằng trình chấm điểm tự động và chú thích của con người.
  • Chấm điểm truy vết: chạy các đánh giá toàn diện cho quy trình công việc của tác nhân, và tự động chấm điểm để xác định những thiếu sót.
  • Tối ưu lời nhắc tự động: tạo lời nhắc cải tiến dựa trên chú thích của con người và kết quả chấm điểm.
  • Hỗ trợ mô hình từ bên thứ ba: các nhà cung cấp khác đánh giá mô hình ngay trong nền tảng Evals của OpenAI.

Chúng tôi nhận thấy khách hàng sử dụng bộ đánh giá Evals đã cải thiện hiệu suất đáng kể.

"Nền tảng đánh giá cắt giảm hơn 50% thời gian phát triển trên khuôn khổ thẩm định đa tác nhân của chúng tôi, và tác nhân thực hiện chính xác hơn 30%."
- Carlyle
Giao diện hiển thị bảng tập dữ liệu với các cột Xếp hạng, Giọng điệu, Phản hồi, và Mức độ chính xác. Các hàng hiển thị các mục nhập với biểu tượng ngón tay cái hướng lên hoặc hướng xuống; các thẻ giọng điệu như Chuyên nghiệp, Thân thiện, Thô lỗ, và Kém; và kết quả chính xác được ghi là Đạt hoặc Trượt kèm 3,5 điểm. Thanh công cụ trên cùng với các tùy chọn Tải lên, Cột, Chấm điểm, Tạo đầu ra, và Lưu.

Nâng cao hiệu suất của tác nhân nhờ tinh chỉnh tăng cường

Tinh chỉnh tăng cường(mở trong cửa sổ mới) (RFT) giúp các nhà phát triển tùy chỉnh các mô hình lý luận của chúng tôi. Hiện RFT đã cung cấp trên OpenAI o4-mini và đang thử nghiệm riêng với GPT‑5. Chúng tôi phối hợp chặt chẽ với hàng chục khách hàng để tinh chỉnh RFT cho GPT‑5 trước khi ra mắt ở phạm vi rộng hơn.

Vào hôm nay, chúng tôi ra mắt hai tính năng mới trong bản thử nghiệm RFT để thúc đẩy hiệu suất của tác nhân xa hơn nữa:

  • Gọi công cụ tùy chỉnh: huấn luyện các mô hình gọi đúng công cụ vào đúng thời điểm để suy luận tốt hơn 
  • Trình chấm điểm tùy chỉnh: thiết lập tiêu chí đánh giá tùy chỉnh cho tiêu chí quan trọng nhất trong trường hợp bạn sử dụng

Mức giá & khả dụng

Bắt đầu từ hôm nay, ChatKit và các tính năng mới của bộ đánh giá Evals được cung cấp cho tất cả các nhà phát triển. Agent Builder đang trong giai đoạn thử nghiệm, và Trung tâm điều phối trình kết nối bắt đầu triển khai bản thử nghiệm cho một số khách hàng sử dụng API, ChatGPT Enterprise và Edu cóBảng quản trị toàn cầu (nơi các quản trị toàn cầu có thể quản lý miền, đăng nhập SSO, và nhiều tổ chức API). Bảng quản trị toàn cầu (mở trong cửa sổ mới)là điều kiện tiên quyết để có thể kích hoạt Trung tâm điều phối trình kết nối. Mọi công cụ trên đều nằm trong mức giá của mô hình API tiêu chuẩn.

Chúng tôi sẽ sớm bổ sung một API quy trình công việc độc lập và các tùy chọn triển khai tác nhân trong ChatGPT.

Chúng tôi rất mong chờ những sản phẩm mà bạn sẽ tạo ra.

Tác giả

OpenAI