2025년 10월 30일

Aardvark, OpenAI의 에이전틱 보안 리서처

보안 리서처처럼 생각하고 최신 소프트웨어 요구에 맞게 확장하는 AI 에이전트가 현재 비공개 베타 버전으로 제공됩니다.

로딩 중...

오늘 OpenAI가 GPT‑5가 구동하는 에이전틱 보안 리서처 Aardvark를 소개합니다.

소프트웨어 보안은 기술 분야에서 가장 중요한 분야이자 과제입니다. 매년 수없이 많은 취약점이 새롭게 기업 및 오픈 소스 데이터 베이스에서 발견됩니다. 방어자는 공격자보다 앞서 취약점을 찾아 패치해야 하는 어려운 과제에 직면하게 됩니다. OpenAI에서는 방어자에게 유리한 이점을 제공하기 위해 노력하고 있습니다.

개발자와 보안팀이 보안 취약점을 대규모로 파악하고 수정할 수 있도록 지원하는 자동 에이전트인 Aardvark는 AI 및 보안 연구의 돌파구를 보여줍니다. Aardvark는 현재 비공개 베타 버전으로 제공되며 기능에 대한 검증 및 개선을 거치고 있습니다.

Aardvark 작동 방식

Aardvark는 지속적으로 소스 코드 저장소를 분석하여 취약점을 식별하고, 악용 가능성을 평가하고, 심각도의 우선순위를 지정하며, 표적화된 패치를 제안합니다.

Aardvark는 커밋을 모니터링함으로써 작동하며 코드 베이스로 변환하여 취약점과 악용될 방법을 파악하고 수정 방법을 제안합니다. Aardvark는 퍼징이나 소프트웨어 구성 분석과 같은 기존 프로그램 분석 기술에 의존하지 않습니다. 대신 LLM 기반 추론 및 도구 사용을 통해 코드 작동을 이해하고 취약점을 식별합니다. Aardvark는 코드를 읽고 분석하고 테스트를 작성하고 실행하고 도구를 사용하는 등 인간 보안 리서처처럼 버그를 찾습니다.

Git 저장소부터 위협 모델링, 취약점 발견, 검증 샌드박스, Codex를 통한 패치, pull 요청에 이르는 인간 검토로 이어지는 프로세스 흐름을 보여주는 “AARDVARK — 취약점 발견 에이전트 워크플로”라는 제목의 다이어그램

Aardvark 다단계 파이프라인을 통해 취약점을 식별하고 설명하고 수정합니다.

분석: 전체 저장소 분석으로 시작하여 프로젝트의 보안 객체 및 설계에 대한 이해를 반영하는 위협 모델을 생성합니다.
커밋 스캔: 새 코드가 커밋되면 전체 저장소 및 위협 모델에 대한 커밋 수준 변화를 조사함으로써 취약점을 스캔합니다. 저장소가 처음 연결되면 Aardvark는 저장소의 기록을 스캔하여 존재하는 문제점을 파악합니다. Aardvark는 발견한 취약점을 단계별로 설명하고 사람의 검토를 위한 코드 주석을 생성합니다.
검증: Aardvark가 잠재적인 취약점을 식별하면 격리된 샌드박스 환경에서 최약점을 트리거하여 악용 가능성을 확인합니다. Aardvark는 사용자에게 허위 양성 가능성이 낮은 고품질의 정확한 인사이트를 제공하기 위해 수행된 단계를 설명합니다.
패치: Aardvark는 OpenAI Codex와 결합하여 파악한 취약점을 수정하도록 지원합니다. 사람 검토와 효율적인 원클릭 패치를 위해 Codex에서 생성되고 Aardvark가 스캔한 패치를 발견 내용에 첨부합니다.

Aardvark는 엔지니어와 함께 GitHub, Codex, 기존 워크플로를 통합하여 개발 속도를 저하하지 않고도 명확하고 바로 조치할 수 있는 인사이트를 제공합니다. Aardvark는 보안을 위해 구축되었지만, 논리 결점, 불완전한 수정, 개인정보 보호 문제 등의 버그도 찾아낼 수 있다는 점을 테스트에서 확인했습니다.

오늘날의 진정한 영향력

Aardvark는 현재 몇 달에 걸쳐 서비스를 제공 중에 있으며, OpenAI 내부 코드베이스 및 외부 알파 파트너 코드베이스에서 지속적으로 구동되고 있습니다. OpenAI 내에서는 의미 있는 취약점을 밝히고 OpenAI의 방어 태세에 기여했습니다. 파트너들은 Aardvark가 복잡한 조건 하에서만 발생하는 문제를 찾은 심층 분석 능력을 강조했습니다.

“golden” 저장소에 대한 벤치마크 테스트에서 Aardvark는 잘 알려지거나 종합적으로 소개된 취약점을 92% 식별하여 높은 재현율과 실제 효과를 입증했습니다.

오픈 소스를 위한 Aardvark

오픈 소스 프로젝트에도 Aardvark가 적용되었으며, 다양한 취약점을 발견하고 책임감 있게 공개했습니다. 그중 10개는 공통 취약점 및 노출(CVE) 식별자를 받았습니다.

수십 년 동안의 공개 연구와 책임 있는 공개의 수혜자로서, OpenAI는 디지털 생태계를 모든 사람에게 더 안전하게 만드는 도구와 연구 결과에 기여하여 보답하고자 노력하고 있습니다. 오픈 소스 소프트웨어 생태계와 공급망의 보안에 기여하기 위해 선정된 비영리 오픈 소스 저장소에 무료 스캔을 제공할 계획입니다.

최근 업데이트된⁠ OpenAI의 아웃바운드 취약점 공동 공개 정책⁠은 개발자 친화적이며, 개발자에게 부담이 될 수 있는 엄격한 공개 타임라인보다는 협업 및 확산 가능한 영향력에 초점을 맞추고 있습니다. Aardvark와 같은 도구가 늘어나는 버그를 발견하는 데 좋은 성과를 내기를 예상하며 장기적인 안전성을 달성하기 위한 지속적인 협업도 기대하고 있습니다.

중요한 이유

소프트웨어는 이제 모든 산업의 중추입니다. 이는 소프트웨어 취약점이 비즈니스, 인프라, 사회에 시스템적인 위험이 된다는 것을 의미합니다. 2024년에만 40,000개 이상의 CVE가 보고되었습니다. OpenAI의 테스트에 따르면 약 1.2%의 커밋에서 버그가 발생합니다. 버그는 사소한 변화지만 엄청난 결과를 초래할 수 있습니다.

팀과 협력하는 에이전틱 보안 리서처인 Aardvark는 코드가 진화함에 따라 지속적인 보호를 제공함으로써 새로운 방어자 중심 모델을 보여줍니다. 조기에 취약점을 파악하고 실제 악용 가능성을 검증하고 명확한 수정 방법을 제공함으로써 Aardvark는 혁신 속도에 영향을 끼치지 않고 보안을 강화할 수 있습니다. 보안 전문가 여러분이 많이 활용해 주시기를 바랍니다. 비공개 베타 버전으로 시작하여 연구에 따라 가용성을 확대할 계획입니다.