Bỏ qua nội dung chính
OpenAI

9 tháng 9, 2025

SafetyKit mở rộng khả năng quản lý rủi ro bằng mô hình của OpenAI

Từ việc tạo nguyên mẫu với các bản xem trước sớm của mô hình thị giác đến mở rộng quy mô với GPT‑5, các tác nhân đa phương thức của SafetyKit đã mở rộng sang các lĩnh vực mới và cải thiện độ chính xác.

Logo SafetyKit màu trắng tập trung trên nền tối, có kết cấu dọc với độ dốc ấm áp của ánh sáng cam, vàng và xanh mòng két.
Quy mô công ty: Công ty khởi nghiệp
Khu vực: Bắc Mỹ
Ngành: Công nghệ, Dịch vụ
Sản phẩm: API

Kết quả

95%+

Đánh giá độ chính xác trên 100% nội dung của khách hàng (các bài đánh giá SafetyKit)

Kết quả

16B

Số token được xử lý mỗi ngày, tăng từ 200 triệu vào sáu tháng trước

Kết quả

10+

Nâng cao hiệu suất trên những tác vụ thị lực máy tính khó nhất với GPT-5

Đang tải…

SafetyKit(mở trong cửa sổ mới) xây dựng các tác nhân AI đa phương thức nhằm giúp các sàn giao dịch, nền tảng thanh toán và công ty fintech phát hiện và xử lý hành vi gian lận cũng như các hoạt động bị cấm trên văn bản, hình ảnh, giao dịch tài chính, danh sách sản phẩm, v.v. Những đột phá gần đây trong khả năng suy luận của mô hình và khả năng hiểu đa phương thức hiện giúp điều này hiệu quả hơn, thiết lập một tiêu chuẩn mới cho hoạt động rủi ro, tuân thủ và an toàn.

Các tác nhân của SafetyKit tận dụng GPT‑5, GPT‑4.1, nghiên cứu sâu và tác nhân sử dụng máy tính (CUA) để xem xét 100% nội dung của khách hàng với độ chính xác trên 95% theo các bài đánh giá của SafetyKit. Chúng có thể giúp các nền tảng bảo vệ người dùng, ngăn chặn gian lận, tránh các khoản phạt theo quy định và thực thi các chính sách phức tạp mà các hệ thống cũ có thể bỏ sót, chẳng hạn như các quy tắc dành riêng cho từng khu vực, các số điện thoại được nhúng trong hình ảnh lừa đảo hoặc nội dung khiêu dâm. Tự động hóa cũng có thể bảo vệ người kiểm duyệt khỏi việc tiếp xúc với nội dung phản cảm và giúp họ tập trung xử lý những quyết định chính sách đòi hỏi sự cân nhắc tinh tế.

“OpenAI mang đến cho chúng tôi quyền truy cập vào các mô hình suy luận và đa phương thức tiên tiến nhất hiện có trên thị trường.” Điều này cho phép chúng tôi thích ứng nhanh chóng, triển khai các tác nhân mới nhanh hơn và xử lý các loại nội dung mà các giải pháp khác thậm chí còn không thể phân tích cú pháp.”
David Graunke, Nhà sáng lập kiêm Giám đốc Điều hành của SafetyKit

Thiết kế các tác nhân theo yêu cầu của tác vụ, rồi chọn mô hình phù hợp

Các tác nhân của SafetyKit đều được xây dựng để xử lý một danh mục rủi ro cụ thể, từ lừa đảo đến sản phẩm bất hợp pháp. Mỗi phần nội dung đều được chuyển đến tác nhân phù hợp nhất với loại vi phạm đó, bằng mô hình OpenAI tối ưu:

  • GPT‑5 áp dụng suy luận đa phương thức trên văn bản, hình ảnh và giao diện người dùng để phát hiện các rủi ro tiềm ẩn và hỗ trợ việc ra quyết định nhiều lớp một cách chính xác.
  • GPT‑4.1 tuân thủ một cách đáng tin cậy các hướng dẫn chi tiết về chính sách nội dung và quản lý hiệu quả các quy trình kiểm duyệt khối lượng lớn
  • Tinh chỉnh tăng cường (RFT) giúp tăng khả năng thu hồi và độ chính xác vượt ra ngoài các mô hình mặc định, đạt được hiệu suất vượt trội với các chính sách an toàn phức tạp
  • Tính năng nghiên cứu sâu kết hợp hoạt động điều tra trực tuyến theo thời gian thực vào quá trình đánh giá và xác minh người bán.
  • Tác nhân sử dụng máy tính (CUA) tự động hóa các nhiệm vụ chính sách phức tạp, giảm sự phụ thuộc vào các quy trình kiểm tra thủ công tốn kém.

Phương pháp đối sánh mô hình này cho phép SafetyKit mở rộng quy mô hoạt động rà soát nội dung trên nhiều phương thức với mức độ tinh tế và chính xác cao hơn so với các giải pháp cũ.

Ví dụ tác nhân Phát hiện Lừa đảo không chỉ quét văn bản. Tác nhân này phân tích các yếu tố trực quan như mã QR hoặc số điện thoại được nhúng trong hình ảnh sản phẩm. GPT‑4.1 giúp tác nhân này phân tích hình ảnh, hiểu bố cục và quyết định liệu đó có phải là hành vi vi phạm chính sách hay không.

Tác nhân Công bố Chính sách kiểm tra các danh sách hoặc trang đích để tìm ngôn ngữ bắt buộc, chẳng hạn như tuyên bố miễn trừ trách nhiệm pháp lý hoặc cảnh báo tuân thủ theo khu vực. GPT‑4.1 trích xuất các phần liên quan, GPT‑5 đánh giá mức độ tuân thủ và tác nhân đánh dấu các vi phạm.

“Chúng tôi xem các tác nhân của mình là những quy trình làm việc được thiết kế chuyên biệt,” Graunke nói. “Một số tác vụ đòi hỏi suy luận sâu, số khác cần ngữ cảnh đa phương thức. OpenAI là nền tảng duy nhất mang lại hiệu suất đáng tin cậy trên toàn bộ hệ thống.”

Biểu đồ đường và biểu đồ thanh có nhãn “SafetyKit” trên nền sáng, hiển thị xu hướng dữ liệu và so sánh trên nhiều danh mục.

Tận dụng GPT‑5 để điều hướng những vùng xám và những quyết định quan trọng

Các quyết định chính sách thường xoay quanh sự khác biệt tinh tế. Ví dụ như xem xét một sàn thương mại điện tử yêu cầu người bán phải đưa ra tuyên bố miễn trừ trách nhiệm đối với các sản phẩm chăm sóc sức khỏe, với các yêu cầu khác nhau tùy thuộc vào tuyên bố về sản phẩm và quy định của từng khu vực. Các nhà cung cấp truyền thống sử dụng các từ khóa kích hoạt hoặc các bộ quy tắc cứng nhắc, điều này có thể bỏ sót những quyết định quan trọng cần đưa ra, dẫn đến việc thực thi không chính xác hoặc bỏ sót.

Tác nhân Tiết lộ Chính sách của SafetyKit trước tiên tham chiếu các chính sách từ thư viện nội bộ của SafetyKit, sau đó GPT‑5 đánh giá nội dung: nội dung có đề cập đến điều trị hoặc phòng ngừa không? Sản phẩm đó có đang được bán tại khu vực nơi việc công bố thông tin là bắt buộc không? Và nếu đúng như vậy, thì ngôn ngữ bắt buộc đó có thực sự được liệt kê trong danh sách không? Nếu có bất kỳ sự cố nào xảy ra, GPT‑5 sẽ trả về một đầu ra có cấu trúc mà tác nhân sử dụng để đánh dấu vấn đề.

Graunke nhận định: “Sức mạnh của GPT‑5 nằm ở khả năng suy luận chính xác đến mức nào khi được đặt trên nền tảng chính sách thực tế.” "Điều này cho phép chúng tôi đưa ra các quyết định chính xác, có thể bảo vệ được ngay cả trong những trường hợp biên mà các hệ thống khác thất bại."

Biến mỗi lần phát hành mô hình thành một thành công sản phẩm.

SafetyKit đánh giá chuẩn từng mô hình OpenAI mới dựa trên những trường hợp khó nhất của mình và thường triển khai những mô hình có hiệu suất cao nhất ngay trong ngày. Các đánh giá nội bộ nghiêm ngặt cho phép nhóm nhanh chóng xác định cách các mô hình mới có thể cải thiện hiệu suất và tích hợp liền mạch vào cơ sở hạ tầng cốt lõi của họ.

Khi OpenAI o3 ra mắt, SafetyKit đã sử dụng nó để nâng cao hiệu suất trong các trường hợp biên trên các lĩnh vực chính sách quan trọng. GPT‑5 tiếp nối sau đó, và chỉ trong vài ngày, mô hình này đã được triển khai trên các tác nhân đòi hỏi khắt khe nhất của họ, giúp cải thiện điểm chuẩn hơn 10 điểm trong những tác vụ thị giác khó nhất.

“OpenAI phát triển nhanh chóng và chúng tôi đã thiết kế hệ thống của mình để theo kịp.” Mỗi bản phát hành mới đều mang lại cho chúng tôi một lợi thế trong vận hành—mở ra những khả năng và lĩnh vực mới mà trước đây chúng tôi chưa thể hỗ trợ, đồng thời tăng phạm vi bao quát và độ chính xác mà chúng tôi cung cấp cho khách hàng.
—David Graunke, Nhà sáng lập kiêm Giám đốc Điều hành của SafetyKit

SafetyKit cũng đóng góp các cải tiến trở lại cho hệ sinh thái, chia sẻ kết quả đánh giá, các lỗi ở trường hợp biên và những thông tin chuyên sâu theo từng chính sách trực tiếp với OpenAI để giúp định hình hiệu suất của các mô hình trong tương lai cho các khối lượng công việc quan trọng về an toàn.

Mở rộng quy mô khách hàng và tăng trưởng với bộ công cụ OpenAI tốt nhất

Kiến trúc của SafetyKit thực thi chính sách trên quy mô lớn, mang lại tốc độ, độ chính xác và khả năng bao phủ rủi ro toàn diện. Đằng sau hậu trường, nó hiện xử lý hơn 16 tỷ token mỗi ngày, tăng từ 200 triệu sáu tháng trước, phân tích nhiều nội dung hơn mà không làm mất độ chính xác.

Đồng thời, SafetyKit đã mở rộng sang rủi ro thanh toán, gian lận, chống bóc lột trẻ em, chống rửa tiền và khách hàng mới với hàng trăm triệu người dùng cuối dưới sự bảo vệ của SafetyKit. Nền tảng này cho phép khách hàng phản ứng nhanh chóng và tự tin với các rủi ro mới nổi.

Graunke nói: “Chúng tôi đã tạo ra một vòng lặp trong đó mỗi bản phát hành OpenAI trực tiếp tăng cường khả năng của chúng tôi. “Đó là lý do tại sao hệ thống liên tục cải tiến, luôn đi trước những rủi ro đang phát triển.”

Tóm tắt nhanh kết quả

  • Độ chính xác từ 95% trở lên khi xem xét 100% nội dung của khách hàng
  • 16 tỷ token được xử lý hàng ngày, tăng từ 200 triệu trong sáu tháng
  • Tăng điểm chuẩn 10+ điểm cho các nhiệm vụ tầm nhìn khó nhất

Tham gia kỷ nguyên làm việc mới

Hơn 1 triệu doanh nghiệp trên toàn thế giới đang đạt được kết quả có ý nghĩa với OpenAI.