Hôm nay, chúng tôi ra mắt AgentKit, một bộ công cụ hoàn chỉnh dành cho nhà phát triển và doanh nghiệp xây dựng, triển khai và tối ưu hóa các tác nhân. Cho đến nay, xây dựng tác nhân luôn đi đôi với việc phải xử lý hàng loạt công cụ rời rạc, quy trình điều phối phức tạp và không ghi rõ phiên bản, các trình kết nối tùy chỉnh, quy trình đánh giá thủ công, tinh chỉnh lời nhắc, cùng nhiều tuần làm phần front-end trước khi phát hành. Nhờ AgentKit, giờ đây các nhà phát triển có thể thiết kế quy trình công việc một cách trực quan và tích hợp UI tác nhân nhanh hơn thông qua các phần mới như:
- Agent Builder: khung đồ họa trực quan giúp tạo và đánh dấu phiên bản cho quy trình công việc của nhiều tác nhân
- Kho điều phối trình kết nối: khu vực trung tâm, nơi quản trị viên điều phối cách thức kết nối dữ liệu và công cụ trên các sản phẩm của OpenAI
- ChatKit: bộ công cụ cho phép nhúng các trải nghiệm tác nhân trong cuộc trò chuyện tùy chỉnh vào sản phẩm của bạn
Chúng tôi cũng mở rộng năng lực đánh giá bằng tính năng mới như bộ dữ liệu, chấm điểm dấu vết, tối ưu lời nhắc tự động, và hỗ trợ mô hình bên thứ ba, để đo lường và cải thiện hiệu suất của tác nhân.
Kể từ khi ra mắt API phản hồi và Agents SDKvào tháng Ba, chúng tôi thấy các nhà phát triển và doanh nghiệp đã xây dựng được các quy trình công việc do tác nhân thực thi hoàn chỉnh cho nghiên cứu sâu, hỗ trợ khách hàng, và nhiều mục đích khác. Klarna đã xây dựng một tác nhân hỗ trợ, giúp xử lý hai phần ba số vé yêu cầu trợ giúp, và Clay tăng trưởng gấp 10 lần nhờ một tác nhân trợ lý bán hàng. AgentKit sử dụng API phản hồi để hỗ trợ các nhà phát triển xây dựng tác nhân hiệu quả và đáng tin cậy hơn.
Khi quy trình công việc của tác nhân ngày càng phức tạp, nhà phát triển cần có cái nhìn rõ ràng hơn về cơ chế vận hành. Agent Builder(mở trong cửa sổ mới) cung cấp khung đồ họa trực quan cho phép lập trình logic qua các nút kéo-thả, liên kết công cụ, và thiết lập các rào cản bảo vệ tùy chỉnh. Có hỗ trợ những tính năng lý tưởng giúp lặp lại nhanh như xem trước bản chạy thử, thiết lập đánh giá ngay trong giao diện, và phiên bản đầy đủ.

Các nhà xây dựng sản phẩm có thể khởi tạo từ một khung đồ họa trống hoặc chọn khung mẫu được tích hợp sẵn.
Tại Ramp, đội nhóm này chỉ mất vài giờ để biến một khung đồ họa trống thành tác nhân xử lý mua sắm.
Nhờ Agent Builder, công việc điều phối, lập trình tùy chỉnh, và tối ưu thủ công phức tạp từng cần nhiều tháng giờ đây chỉ mất vài giờ. Khung đồ họa trực quan giúp bộ phận sản phẩm, pháp lý, và kỹ thuật làm việc thống nhất, rút ngắn 70% thời gian thử nghiệm và đưa tác nhân vào hoạt động chỉ sau hai chu kỳ phát triển thay vì hai quý.”
Tương tự, công ty công nghệ và dịch vụ Internet hàng đầu Nhật Bản là LY Corporation đã xây dựng được một tác nhân trợ lý công việc bằng Agent Builder trong chưa đầy hai giờ.
“Nhờ Agent Builder, chúng tôi có thể quản lý tác nhân theo phương thức hoàn toàn mới, khi kỹ sư và chuyên gia lĩnh vực hợp tác làm việc trên cùng một giao diện. Chúng tôi xây dựng quy trình công việc đa tác nhân đầu tiên của mình, và vận hành trong chưa tới hai giờ, giúp đẩy nhanh đáng kể thời gian tạo và triển khai tác nhân.”
Ngoài ra, chúng tôi còn ra mắt Trung tâm điều phối trình kết nối để doanh nghiệp quản trị và bảo trì dữ liệu trong nhiều môi trường làm việc và tổ chức khác nhau. Trung tâm điều phối trình kết nối(mở trong cửa sổ mới) hợp nhất các nguồn dữ liệu vào một bảng quản trị duy nhất trên ChatGPT và API. Trung tâm này có tất cả các trình kết nối được tích hợp trước như Dropbox, Google Drive, Sharepoint, và Microsoft Teams, cũng như các MCP của bên thứ ba.
Các nhà phát triển cũng có thể bật các rào bảo vệ(mở trong cửa sổ mới) trong Agent Builder. Đây là một lớp bảo vệ an toàn mã nguồn mở và dưới dạng mô-đun, giúp bảo vệ các tác nhân khỏi hành vi không mong muốn hoặc ác ý. Rào bảo vệ có thể che chắn hoặc cảnh báo thông tin cá nhân (PII), phát hiện lỗ hổng bảo mật, và áp dụng các biện pháp an toàn khác, giúp dễ dàng xây dựng và triển khai các tác nhân đáng tin cậy, an toàn. Rào bảo vệ có thể triển khai độc lập hoặc qua thư viện rào bảo vệ dành cho Python(mở trong cửa sổ mới) và JavaScript(mở trong cửa sổ mới).
Việc triển khai giao diện trò chuyện cho các tác nhân có thể phức tạp hơn bạn nghĩ. Công việc này gồm xử lý phản hồi theo luồng, quản lý luồng hội thoại, hiển thị mô hình tư duy, và thiết kế các trải nghiệm tương tác hấp dẫn trong cuộc trò chuyện. Nhờ ChatKit, việc tích hợp các tác nhân theo cuộc trò chuyện trở nên đơn giản và phù hợp một cách tự nhiên với sản phẩm của bạn. Có thể tích hợp vào ứng dụng hoặc trang web, đồng thời tùy chỉnh cho phù hợp với chủ đề hoặc thương hiệu của bạn.
"Nhờ ChatKit, chúng tôi tiết kiệm được hơn hai tuần khi xây dựng một tác nhân hỗ trợ cộng đồng các nhà phát triển Canva, và tích hợp trong chưa đầy một giờ. Tác nhân hỗ trợ này sẽ thay đổi cách các nhà phát triển tương tác với tài liệu và biến thành một trải nghiệm trò chuyện, giúp dễ dàng xây dựng ứng dụng và tích hợp trên Canva hơn.”
Hiện tại, ChatKit thực hiện nhiều mục đích sử dụng, bao gồm trợ lý nội bộ, hướng dẫn cho nhân viên mới, hỗ trợ khách hàng và tác nhân nghiên cứu. Tác nhân hỗ trợ khách hàng của HubSpot(mở trong cửa sổ mới) là một ví dụ:

Quá trình xây dựng các tác nhân ổn định, sẵn sàng sử dụng đều đòi hỏi đánh giá hiệu suất nghiêm ngặt. Vào năm ngoái, chúng tôi đã ra mắt bộ đánh giá Evals (mở trong cửa sổ mới) để hỗ trợ các nhà phát triển kiểm thử lời nhắc và đo lường hành vi mô hình. Giờ đây, chúng tôi bổ sung bốn khả năng mới giúp dễ dàng xây dựng các bộ đánh giá hơn:
- Bộ dữ liệu: nhanh chóng xây dựng các bộ đánh giá từ đầu và mở rộng theo thời gian bằng trình chấm điểm tự động và chú thích của con người.
- Chấm điểm truy vết: chạy các đánh giá toàn diện cho quy trình công việc của tác nhân, và tự động chấm điểm để xác định những thiếu sót.
- Tối ưu lời nhắc tự động: tạo lời nhắc cải tiến dựa trên chú thích của con người và kết quả chấm điểm.
- Hỗ trợ mô hình từ bên thứ ba: các nhà cung cấp khác đánh giá mô hình ngay trong nền tảng Evals của OpenAI.
Chúng tôi nhận thấy khách hàng sử dụng bộ đánh giá Evals đã cải thiện hiệu suất đáng kể.
"Nền tảng đánh giá cắt giảm hơn 50% thời gian phát triển trên khuôn khổ thẩm định đa tác nhân của chúng tôi, và tác nhân thực hiện chính xác hơn 30%."

Tinh chỉnh tăng cường(mở trong cửa sổ mới) (RFT) giúp các nhà phát triển tùy chỉnh các mô hình lý luận của chúng tôi. Hiện RFT đã cung cấp trên OpenAI o4-mini và đang thử nghiệm riêng với GPT‑5. Chúng tôi phối hợp chặt chẽ với hàng chục khách hàng để tinh chỉnh RFT cho GPT‑5 trước khi ra mắt ở phạm vi rộng hơn.
Vào hôm nay, chúng tôi ra mắt hai tính năng mới trong bản thử nghiệm RFT để thúc đẩy hiệu suất của tác nhân xa hơn nữa:
- Gọi công cụ tùy chỉnh: huấn luyện các mô hình gọi đúng công cụ vào đúng thời điểm để suy luận tốt hơn
- Trình chấm điểm tùy chỉnh: thiết lập tiêu chí đánh giá tùy chỉnh cho tiêu chí quan trọng nhất trong trường hợp bạn sử dụng
Bắt đầu từ hôm nay, ChatKit và các tính năng mới của bộ đánh giá Evals được cung cấp cho tất cả các nhà phát triển. Agent Builder đang trong giai đoạn thử nghiệm, và Trung tâm điều phối trình kết nối bắt đầu triển khai bản thử nghiệm cho một số khách hàng sử dụng API, ChatGPT Enterprise và Edu cóBảng quản trị toàn cầu (nơi các quản trị toàn cầu có thể quản lý miền, đăng nhập SSO, và nhiều tổ chức API). Bảng quản trị toàn cầu (mở trong cửa sổ mới)là điều kiện tiên quyết để có thể kích hoạt Trung tâm điều phối trình kết nối. Mọi công cụ trên đều nằm trong mức giá của mô hình API tiêu chuẩn.
Chúng tôi sẽ sớm bổ sung một API quy trình công việc độc lập và các tùy chọn triển khai tác nhân trong ChatGPT.
Chúng tôi rất mong chờ những sản phẩm mà bạn sẽ tạo ra.


