Bỏ qua nội dung chính
OpenAI

28 tháng 10, 2025

Hệ thống phòng thủ AI của Doppel chặn tấn công trước khi lan rộng

Nhờ GPT‑5 và tinh chỉnh tăng cường (RFT), Doppel đã giảm 80% khối lượng công việc của chuyên viên phân tích, và hiện tại có thể giảm thiểu các mối đe dọa trong vài phút thay vì hàng giờ.

Logo Doppel màu trắng, căn giữa trên nền kim loại tối màu có vân, đường cong và đinh tán.
Quy mô công ty: Công ty khởi nghiệp
Khu vực: Bắc Mỹ
Ngành: Công nghệ
Sản phẩm: API

Kết quả

80%

quy trình làm việc của nhà phân tích được tinh gọn

Kết quả

3x

khả năng xử lý mối đe dọa

Đang tải…

Một trang web giả mạo đơn nhất có thể khởi động, nhắm mục tiêu đến hàng nghìn người dùng, và biến mất trong vòng chưa đầy một giờ. Thời gian đó quá đủ để kẻ tấn công gây ra thiệt hại thực sự. Và bằng các công cụ tạo sinh, chúng có thể nhanh chóng tạo ra hàng trăm trường hợp tương tự.

Doppel được xây dựng để bảo vệ các tổ chức khỏi deepfake và hành vi mạo danh trực tuyến, nhưng họ nhanh chóng nhận ra AI đồng nghĩa với việc các mối đe dọa có thể mở rộng vô hạn. Những kẻ tấn công không còn cần phải lừa đảo thủ công nữa; họ có thể tạo ra vô số biến thể của bộ dụng cụ lừa đảo, tên miền giả mạo và tài khoản mạo danh trong vài giây.

"Thiệt hại từ các cuộc tấn công lừa đảo có thể xảy đến trong vòng vài phút khi chúng lan truyền trên mạng xã hội và các kênh nhắn tin. Khả năng tạo ra sức thuyết phục vô hạn với chi phí gần như bằng không đã thay đổi mọi thứ.”
—Ông Rahul Madduluri, Đồng sáng lập kiêm Giám đốc Công nghệ, Doppel

Bên trong quá trình triển khai

Để duy trì vị thế, Doppel đã phát triển một hệ thống phòng vệ kỹ thuật xã hội mới dựa trên các mô hình OpenAI GPT‑5 và o4-mini. Nền tảng của Doppel tự động phát hiện, phân loại, và loại bỏ các mối đe dọa, giảm 80% khối lượng công việc của chuyên viên phân tích, tăng gấp ba năng lực xử lý mối đe dọa, và rút ngắn thời gian phản ứng từ hàng giờ xuống còn vài phút.

Luôn đi trước những mối đe dọa nhanh đến vô hạn

Biện pháp bảo vệ rủi ro kỹ thuật số truyền thống đều dựa vào việc con người kiểm tra thủ công các trang web mạo danh, tên miền lừa đảo, và hồ sơ và các bài đăng trên mạng xã hội. Doppel nhận thấy mô hình đó đang sụp đổ khi những kẻ tấn công bắt đầu tự động hóa, tung ra các mối đe dọa nhanh hơn, và trên nhiều phương diện hơn so với khả năng thẩm định của con người.

Ông Rahul chia sẻ: “Hệ thống chúng tôi xử lý luồng tín hiệu liên tục để xác định các mối đe dọa thực sự giữa vô vàn tạp âm. Khi phát hiện ra một mối đe dọa, chỉ có một khoảng thời gian rất ngắn để hành động trước khi thiệt hại xảy ra. Sử dụng AI để tự động ra quyết định là một trong những bước đột phá lớn nhất của công ty, cho phép chúng tôi chống lại các cuộc tấn công ở quy mô và tốc độ Internet."
—Ông Rahul Madduluri, Đồng sáng lập kiêm Giám đốc Công nghệ, Doppel

Tốc độ đó là yếu tố then chốt đối với khách hàng của Doppel, những tổ chức không thể chờ đợi hàng giờ cho việc xác nhận mối đe dọa. Hệ thống của Doppel tự động phân loại hầu hết các mối đe dọa, sử dụng các mô hình OpenAI để suy luận, và một vòng lặp phản hồi có cấu trúc được gọi là tinh chỉnh tăng cường (RFT) để cải thiện mô hình theo thời gian. Trong RFT, phản hồi của con người được sử dụng làm ví dụ được đánh giá, giúp các mô hình học cách tự ra các quyết định nhất quán và có kèm giải thích.

Điều phối hoạt động phát hiện mối đe dọa dựa trên LLM

Quy trình của Doppel dựa trên LLM và đóng vai trò trung tâm trong hệ thống phát hiện của họ. Sau khi thu thập và lọc các tín hiệu, hệ thống này thực hiện một loạt các tác vụ suy luận có mục tiêu: suy luận về các mối đe dọa tiềm ẩn, xác nhận ý định, và ra quyết định phân loại. Mỗi giai đoạn được thiết kế để cân bằng giữa tốc độ, chính xác, và nhất quán, đồng thời giúp các chuyên viên phân tích tập trung vào những trường hợp ngoại lệ cần đến phán đoán của con người.

Lưu đồ thể hiện quy trình phát hiện mối đe dọa khi sử dụng LLM, từ khâu thu thập và lọc dữ liệu, trích xuất đặc trưng và phân loại, đến hệ thống xác minh và gỡ bỏ cuối cùng. Các mô hình như GPT-5 và o4-mini được sử dụng ở các giai đoạn then chốt.

Cách thức hoạt động như sau:

  • Lọc tín hiệu và trích xuất tính năng: Hệ thống của Doppel thu nhận hàng triệu tên miền, URL và tài khoản hàng ngày. Kết hợp các phương pháp heuristic và OpenAI o4-mini giúp lọc bỏ âm nhiễu và trích xuất các đặc trưng có cấu trúc để hỗ trợ thẩm định mô hình ở giai đoạn sau.
  • Xác nhận mối đe dọa song song: Mỗi tín hiệu được truyền qua nhiều lời nhắc GPT‑5 được xây dựng nhằm mục đích phân tích mối đe dọa khác nhau. Lời nhắc này đánh giá các yếu tố như rủi ro mạo danh, lạm dụng thương hiệu, hoặc các mẫu hình kỹ thuật xã hội.
  • Phân loại mối đe dọa: Phiên bản RFT của o4-mini tổng hợp các xác nhận trước đó để gán nhãn có cấu trúc — độc hại, lành tính hoặc mơ hồ — với tính nhất quán ở cấp độ sản xuất.
  • Xác minh cuối cùng: Một lượt xử lý thứ hai của GPT‑5 xác nhận quyết định của mô hình và tạo ra một giải thích bằng ngôn ngữ tự nhiên. Nếu độ tin cậy vượt ngưỡng, thì hệ thống tự động khởi tạo quá trình thực thi.
  • Đánh giá bởi con người: Những kết quả có độ tin cậy thấp hoặc mâu thuẫn sẽ được chuyển đến các chuyên viên phân tích là con người. Các quyết định của họ được ghi lại và đưa trở lại vòng lặp RFT để liên tục cải thiện tính nhất quán của mô hình.

Huấn luyện mô hình thông qua tinh chỉnh tăng cường (RFT)

Doppel thấy được cải thiện đáng kể khi quy trình phát hiện ban đầu khi được tăng cường bằng LLM, nhưng khi gặp trường hợp một mối đe dọa lại bị đánh giá khác nhau tùy vào chuyên viên phân tích, thì tính nhất quán trở thành yếu tố hạn chế.

“Lợi ích thực sự mà RFT mang lại là bạn đang khiến các quyết định của mô hình nhất quán hơn.”
—Kiran Arimilli, Kỹ sư phần mềm, Doppel

Để xây dựng tính nhất quán đó, Doppel đã áp dụng RFT sử dụng dữ liệu phân tích của chính họ làm nguồn phản hồi. Mỗi quyết định phân loại tên miền là ‘độc hại’, ‘vô hại’, hoặc ‘không rõ ràng’ đều trở thành ví dụ được đánh giá. Những ví dụ được gán nhãn đó đã huấn luyện mô hình sao chép phán đoán của chuyên gia, ngay cả đối với những trường hợp biên mơ hồ.

Một sơ đồ hình tròn thể hiện quy trình phân loại mối đe dọa của Doppel: các mô hình ngôn ngữ lớn (LLM) ra quyết định trong quá trình thực tế → người đánh giá tiến hành chỉnh sửa → huấn luyện mô hình cập nhật các mô hình → triển khai đưa các mô hình đã cập nhật vào thực tế.

Doppel hợp tác chặt chẽ với đội ngũ kỹ thuật ứng dụng của OpenAI và thiết kế các hàm chấm điểm không chỉ thẩm định mức độ chính xác mà còn cả chất lượng giải thích, khen thưởng những mô hình lý luận rõ ràng, chứ không chỉ chính xác. Khi biến ý kiến phản hồi của chuyên viên phân tích thành dữ liệu huấn luyện có cấu trúc, Doppel đã giúp chứng minh được RFT có thể giúp tính năng tự động phát hiện trở nên nhất quán và đáng tin cậy hơn.

Xây dựng niềm tin thông qua cam kết minh bạch

Điều chỉnh siêu tham số và thẩm định lặp đi lặp lại đã giúp mô hình đạt được độ nhất quán gần với con người. Nhưng đối với Doppel, hoàn thành bước cuối cùng của tự động hóa cũng tức là các quyết định hoàn toàn có thể hiểu được ngay.

Hiện nay, mỗi quyết định tự động gỡ bỏ đều kèm theo lời giải thích do AI soạn ra, trong đó nêu rõ lý loại bỏ mối đe dọa, giúp khách hàng hiểu được ngay lý do của hành động được thực hiện. Trước đây, một quyết định như vậy đều cần sự can thiệp của chuyên viên phân tích.

Giao diện bảng điều khiển hiển thị cảnh báo gỡ bỏ nội dung đối với tên miền “d0ppel.click”. bị báo cáo vì mạo danh Doppel. Bản tóm tắt đề cập đến các vụ lừa đảo qua email và đánh cắp thông tin đăng nhập, với dòng thời gian ở bên phải hiển thị các cập nhật trạng thái từ khi tạo ra vụ việc đến khi được giải quyết vào ngày 10 tháng 10 năm 2025.

Cam kết minh bạch đó giúp tăng cường lòng tin, một yếu tố then chốt đối với người dùng của Doppel. Khi thấy rõ hành động nào đã được thực hiện và lý do của hành động đó, các đội nhóm có thể tự tin phản ứng nhanh và có bối cảnh để giải thích những quyết định đó cho nội bộ hoặc các bên liên quan.

Tóm tắt nhanh kết quả

  • Giảm 80% khối lượng công việc của nhà phân tích
  • Rút ngắn thời gian phản ứng với mối đe dọa từ hàng giờ xuống còn vài phút
  • Năng lực xử lý mối đe dọa tăng gấp ba.
  • Hầu hết các mối đe dọa được phân loại tự động

Tiếp theo là gì

Khi đã gần như hoàn toàn tự động thực hiện kiểm tra tên miền lừa đảo và mạo danh, giờ đây Doppel áp dụng khung mô hình hướng dẫn tương tự cho các kênh khác có độ biến động cao.

Ông Madduluri phát biểu: "Tên miền có lẽ là kênh khó xử lý nhất của chúng tôi. Tín hiệu thì nhiễu loạn, nội dung thay đổi liên tục, và các mối đe dọa phát triển nhanh chóng và cùng lúc trên nhiều phương diện. Nếu có thể tự động hóa toàn bộ quy trình đó, thì chúng tôi có thể làm điều tương tự cho bất cứ thứ gì: mạng xã hội, quảng cáo trả phí, và mọi điều khác.”

Các cột mốc tiếp theo sẽ là mở rộng bộ dữ liệu RFT lên gấp mười lần, thử nghiệm các chiến lược đánh giá mới, và sử dụng GPT‑5 để trích xuất đặc trưng ở giai đoạn đầu. Những thay đổi này sẽ cho phép Doppel hợp nhất các giai đoạn của quy trình, và suy luận về các dấu hiệu đe dọa phức tạp hơn, trong giai đoạn sớm hơn của quá trình.

Trong mỗi lần lặp lại, Doppel đều xây dựng một hệ thống bảo vệ những điều có thật trên mọi phương diện, nơi niềm tin đang bị tấn công.