Xin giới thiệu Aardvark: Trình nghiên cứu bảo mật tự chủ của OpenAI
Hiện đang ở giai đoạn thử nghiệm beta riêng: tác nhân AI có khả năng tư duy như một nhà nghiên cứu về bảo mật và có khả năng mở rộng để đáp ứng nhu cầu của phần mềm hiện đại.
Hôm nay, chúng tôi cho ra mắt Aardvark — trình nghiên cứu bảo mật tự chủ tích hợp GPT‑5.
Bảo mật phần mềm là một trong những mặt trận quan trọng và thách thức nhất của lĩnh vực công nghệ. Mỗi năm, hàng chục ngàn lỗ hổng bảo mật mới được phát hiện trong các cơ sở mã nguồn mở và cơ sở mã nguồn của doanh nghiệp. Đội ngũ nhân sự bảo vệ hệ thống phải đối mặt với nhiệm vụ nặng nề là phát hiện và vá các lỗ hổng trước khi những kẻ tấn công phát hiện ra chúng. Tại OpenAI, chúng tôi đang nỗ lực để thay đổi cán cân này, đưa lợi thế về phía đội ngũ bảo vệ.
Aardvark là một bước đột phá trong nghiên cứu về AI và bảo mật: một tác nhân tự chủ có thể trợ giúp các nhà phát triển và đội ngũ bảo mật phát hiện và khắc phục các lỗ hổng bảo mật ở quy mô lớn. Aardvark hiện đang trong giai đoạn thử nghiệm bản beta riêng để xác thực và hoàn thiện khả năng của nó trong môi trường thực tế.
Aardvark liên tục phân tích các kho mã nguồn để phát hiện lỗ hổng, đánh giá khả năng khai thác, xếp hạng mức độ nghiêm trọng và đề xuất các bản vá trúng đích.
Aardvark hoạt động bằng cách giám sát các yếu tố thay đổi cũng như cập nhật với mã nguồn, phát hiện các lỗ hổng, cách thức có thể khai thác chúng và đề xuất biện pháp khắc phục. Aardvark không sử dụng các kỹ thuật phân tích chương trình truyền thống như kiểm thử với dữ liệu ngẫu nhiên (fuzzing) hay phân tích thành phần phần mềm. Thay vào đó, nó áp dụng suy luận dựa trên mô hình ngôn ngữ lớn (LLM) và sử dụng công cụ để hiểu hành vi mã và phát hiện các lỗ hổng. Aardvark tìm lỗi giống như một nhà nghiên cứu bảo mật thực thụ: bằng cách đọc mã, phân tích mã, soạn và chạy các bài kiểm thử, sử dụng công cụ, v.v.
Aardvark sử dụng một quy trình nhiều bước để xác định, giải thích và khắc phục các lỗ hổng bảo mật:
- Phân tích: Aardvark bắt đầu bằng việc phân tích toàn bộ kho mã nguồn để tạo ra một mô hình mối đe dọa, phản ánh sự hiểu biết về mục tiêu bảo mật và thiết kế của dự án.
- Quét các yếu tố cập nhật trong mã nguồn: Công cụ này quét phát hiện lỗ hổng bằng cách kiểm tra các yếu tố cập nhật trong mã nguồn so với toàn bộ kho mã và mô hình mối đe dọa khi mã mới được cập nhật. Khi một kho mã được kết nối lần đầu, Aardvark sẽ quét lịch sử của nó để phát hiện các vấn đề đang tồn tại. Aardvark giải thích từng lỗ hổng mà nó phát hiện và chú thích mã để con người soát xét lại.
- Xác thực: Khi Aardvark xác định được một lỗ hổng tiềm tàng, nó sẽ tìm cách kích hoạt lỗ hổng đó ở một môi trường cách ly dạng hộp cát (sandbox) để xác minh khả năng khai thác của nó. Aardvark sẽ mô tả các bước thực hiện để đảm bảo rằng những phân tích trả về là chính xác, có chất lượng cao và có ít cảnh báo sai nhất.
- Vá lỗi: Aardvark tích hợp với OpenAI Codex để giúp sửa chữa những lỗ hổng mà nó phát hiện. Nó đính kèm một bản vá do Codex tạo và Aardvark quét vào từng vấn đề được phát hiện để con người soát xét và vá lỗi một cách nhanh chóng, chỉ với một cú nhấp chuột.
Aardvark làm việc cùng các kỹ sư, tích hợp với GitHub, Codex và các quy trình làm việc hiện tại để cho ra những thông tin rõ ràng, dễ xử lý mà không làm cản trở quá trình phát triển. Mặc dù Aardvark được thiết kế để bảo mật, nhưng trong các thử nghiệm của chúng tôi, nó cũng phát hiện ra các lỗi như lỗi logic, bản sửa lỗi chưa hoàn chỉnh và các vấn đề liên quan đến quyền riêng tư.
Aardvark đã hoạt động trong vài tháng qua, liên tục quét các kho mã nguồn nội bộ của OpenAI và các kho mã của đối tác alpha bên ngoài Trong OpenAI, nó đã phát hiện ra những lỗ hổng quan trọng và góp phần vào chiến lược phòng thủ của OpenAI. Các đối tác đã chỉ ra sự sâu sắc trong phân tích của Aardvark khi nó phát hiện ra các vấn đề chỉ xuất hiện ở những điều kiện phức tạp.
Trong các bài kiểm thử định chuẩn trên các kho mã "chuẩn", Aardvark đã xác định được 92% các lỗ hổng đã biết và các lỗ hổng giả được tạo ra, chứng tỏ khả năng nhận diện cao và tính hiệu quả trong thực tế.
Aardvark cũng đã được áp dụng vào các dự án mã nguồn mở, nơi nó đã phát hiện và chúng tôi đã công bố một cách có trách nhiệm nhiều lỗ hổng — mười trong số đó đã nhận được mã định danh Lỗ hổng và Nguy cơ bảo mật chung (CVE — Common Vulnerabilities and Exposures).
Là những người thụ hưởng thành quả từ hàng thập niên nghiên cứu mở và công bố có trách nhiệm, chúng tôi cam kết đóng góp lại — cung cấp các công cụ và kết quả nghiên cứu để giúp hệ sinh thái số trở nên an toàn hơn cho tất cả mọi người. Chúng tôi dự định cung cấp dịch vụ quét miễn phí cho một số kho mã nguồn mở phi thương mại chọn lọc để đóng góp vào an ninh của chuỗi cung ứng và hệ sinh thái phần mềm mã nguồn mở.
Gần đây, chúng tôi đã cập nhật chính sách công bố thông tin phối hợp ra ngoài theo hướng thân thiện với nhà phát triển, tập trung vào mối quan hệ hợp tác và tác động có thể mở rộng thay vì các mốc thời gian công bố cứng nhắc vốn có thể gây áp lực cho các nhà phát triển. Chúng tôi dự báo các công cụ như Aardvark sẽ dẫn đến việc phát hiện ngày càng nhiều lỗi phần mềm, và chúng tôi mong muốn hợp tác lâu dài để xây dựng được năng lực phục hồi bền vững.
Phần mềm hiện là xương sống của mọi ngành — điều này có nghĩa là các lỗ hổng phần mềm trở thành một rủi ro hệ thống đối với các doanh nghiệp, cơ sở hạ tầng và toàn xã hội. Chỉ riêng năm 2024 đã ghi nhận hơn 40.000 CVE. Các thử nghiệm của chúng tôi cho thấy khoảng 1,2% các nội dung cập nhật vào kho mã có gây ra lỗi — những thay đổi nhỏ có thể gây ra những hệ quả lớn.
Aardvark đại diện cho một mô hình mới, ưu tiên phòng thủ: một trình nghiên cứu bảo mật tự chủ, hợp tác cùng các nhóm để đảm bảo khả năng bảo vệ liên tục trong bối cảnh mã nguồn thay đổi. Bằng việc phát hiện các lỗ hổng sớm, xác thực khả năng khai thác thực tế và cung cấp các bản sửa lỗi rõ ràng, Aardvark có thể tăng cường bảo mật mà không làm chậm tiến trình đổi mới. Chúng tôi tin tưởng vào việc mở rộng khả năng tiếp cận chuyên môn bảo mật. Chúng tôi bắt đầu với giai đoạn thử nghiệm beta riêng và sẽ mở rộng dần trong suốt quá trình học hỏi.
Chúng tôi đang mời một số đối tác cụ thể tham gia giai đoạn thử nghiệm beta riêng của Aardvark. Các bên tham gia sẽ có quyền truy cập sớm và làm việc trực tiếp với đội ngũ của chúng tôi để hoàn thiện độ chính xác trong khâu phát hiện, quy trình xác minh và cải thiện trải nghiệm báo cáo.
Chúng tôi đang nỗ lực kiểm chứng hiệu suất ở nhiều môi trường khác nhau. Nếu tổ chức hoặc dự án nguồn mở của bạn mong muốn tham gia, hãy nộp hồ sơ đăng ký tại đây.
Tác giả
Người đóng góp
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight


