Днес анонсираме Aardvark – агентен изследовател на сигурността, базиран на GPT‑5.
Софтуерната сигурност е една от най-критичните и предизвикателни граници в технологиите. Всяка година се откриват десетки хиляди нови уязвимости в корпоративни и отворени кодови бази. Защитниците се сблъскват с нелеката задача да откриват и поправят уязвимостите, преди да го направят техните противници. В OpenAI работим, за да наклоним този баланс в полза на защитниците.
Aardvark представлява пробив в изследванията на ИИ и сигурността: автономен агент, който може да помогне на разработчиците и екипите по сигурността да откриват и отстраняват уязвимости в сигурността в голям мащаб. Aardvark вече е на разположение в частна бета–версия, за да се валидират и усъвършенстват възможностите му в полеви условия.
Aardvark непрекъснато анализира хранилищата с изходен код, за да идентифицира уязвимостите, да оцени възможността за експлоатиране, да определи приоритета на сериозността и да предложи целеви пачове.
Aardvark работи, като наблюдава комитите и промените в кода, идентифицира уязвимостите, начините, по които те могат да бъдат експлоатирани, и предлага корекции. Aardvark не разчита на традиционни техники за анализ на програми като тестване с предоставяне на структуриран текст (fuzzing) или анализ на състава на софтуера. Вместо това, използва разсъждения, захранвани от голям езиков модел, и използване на инструменти, за да разбере поведението на кода и да идентифицира уязвимостите. Aardvark търси грешки така, както би го направил един изследовател по сигурността: чрез четене на код, анализиране, писане и изпълнение на тестове, използване на инструменти и др.
Aardvark разчита на многоетапен процес за идентифициране, обяснение и отстраняване на уязвимости:
- Анализ: Започва с анализ на пълното хранилище, за да изготви модел на заплахата, отразяващ разбирането му за целите на сигурността и дизайна на проекта.
- Сканиране на комити: Сканира за уязвимости чрез инспектиране на промените на ниво комит спрямо цялото хранилище и модела на заплахите, когато нов код се комитва. При първото свързване на хранилище Aardvark ще сканира историята му, за да идентифицира съществуващи проблеми. Aardvark обяснява намерените уязвимости стъпка по стъпка, като анотира кода за преглед от човек.
- Валидация: След като Aardvark идентифицира потенциална уязвимост, той ще се опита да я активира в изолирана, тестова среда, за да потвърди нейната възможност за експлоатиране. Aardvark описва стъпките, предприети, за да се гарантира, че на потребителите се предоставят точни, висококачествени и с нисък процент на фалшиви положителни прозрения.
- Пачване: Aardvark се интегрира с OpenAI Codex, за да помогне за отстраняването на уязвимостите, които открива. Той прикачва генериран от Codex и сканиран от Aardvark пач към всяко откритие за преглед от човек и ефективно прилагане на пача с едно щракване.
Aardvark работи заедно с инженерите, като се интегрира с GitHub, Codex и съществуващите работни процеси, за да предоставя ясни и приложими прозрения, без да забавя разработката. Въпреки че Aardvark е създаден за сигурност, при нашите тестове установихме, че той може да открие и грешки, като логически грешки, непълни поправки и проблеми с поверителността.
Aardvark е в експлоатация от няколко месеца, като работи непрекъснато във вътрешните кодови бази на OpenAI и тези на външни алфа-партньори. В рамките на OpenAI бяха разкрити значими уязвимости, които допринесоха за защитната позиция на OpenAI. Партньорите подчертават дълбочината на анализа, като Aardvark открива проблеми, които възникват само при сложни условия.
При еталонни тестове на „златни“ хранилища Aardvark идентифицира 92% от известните и синтетично въведени уязвимости, демонстрирайки висока степен на възстановяване и ефективност в реалния свят.
Aardvark е прилаган и в проекти с отворен код, където е открил и ние сме разкрили отговорно множество уязвимости – десет от тях са получили идентификатори за общи уязвимости и експозиции (CVE).
Като бенефициенти на десетилетия отворени изследвания и отговорно разкриване на информация, ние се ангажираме да даваме своя принос – предоставяме инструменти и открития, които правят цифровата екосистема по-безопасна за всички. Планираме да предложим безвъзмездно сканиране на избрани нетърговски хранилища с отворен код, за да допринесем за сигурността на екосистемата и веригата за доставки на софтуер с отворен код.
Наскоро актуализирахме нашата политика за изходящо координирано разкриване, която заема позиция, благоприятна за разработчиците, фокусирана върху сътрудничество и мащабируемо въздействие, вместо строги срокове за разкриване, които могат да оказват натиск върху разработчиците. Очакваме, че инструменти като Aardvark ще доведат до откриването на все повече грешки, и искаме да си сътрудничим устойчиво, за да постигнем дългосрочна устойчивост.
Софтуерът вече е гръбнакът на всяка индустрия – което означава, че софтуерните уязвимости представляват системен риск за бизнеса, инфраструктурата и обществото. Само през 2024 г. са докладвани над 40 000 CVE. Тестването ни показва, че около 1,2% комити въвеждат грешки – малки промени, които могат да имат огромни последствия.
Aardvark представлява нов модел, ориентиран към защитника: агентен изследовател на сигурността, който си партнира с екипите, като осигурява непрекъсната защита в процеса на развитие на кода. Чрез ранно откриване на уязвимости, потвърждаване на възможността за експлоатиране в реални условия и предлагане на ясни поправки Aardvark може да повиши сигурността, без да забавя иновациите. Ние вярваме в разширяването на достъпа до експертни знания в областта на сигурността. Започваме с частна бета–версия и ще разширяваме наличността, докато се учим.
Каним избрани партньори да се присъединят към частната бета-версия на Aardvark. Участниците ще получат ранен достъп и ще работят директно с нашия екип, за да усъвършенстват точността на откриване, работните процеси за валидиране и опита с докладите.
Искаме да валидираме производителността в различни среди. Ако вашата организация или проект с отворен код се интересува от присъединяване, можете да кандидатствате тук.
Автор
Сътрудници
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu и Matt Knight


