Прескокни до главната содржина
OpenAI

Претставување на Aardvark: агент за безбедносно истражување на OpenAI

Сега во приватна beta верзија: агент со вештачка интелигенција кој размислува како истражувач за безбедност и се скалира за да ги задоволи барањата на современиот софтвер.

Се вчитува...

Денес, го објавуваме Aardvark, агентски истражувач за безбедност поддржан од GPT‑5.

Безбедноста на софтверот е една од најкритичните, – и најпредизвикувачки – најсовремени во технологијата. Секоја година, се откриваат десетици илјади нови ранливости во базите на кодови на претпријатијата и отворениот изворен код. Бранителите се соочуваат со застрашувачки задачи да ги пронајдат и закрпат ранливостите пред нивните противници да го сторат тоа. Во OpenAI, работиме да ја наклониме рамнотежата во корист на бранителите.

Aardvark претставува пробив во истражувањето на вештачката интелигенција и безбедноста: автономен агент кој може да им помогне на развивачи на софтвер и безбедносните тимови да откријат и поправат безбедносни ранливости на голем обем. Aardvark сега е достапен во приватна beta верзија за да ги валидира и усоврши своите способности на теренот.

Како функционира Aardvark

Aardvark постојано ги анализира репозиториумите на изворен код за да идентификува ранливости, да ја процени експлоатабилноста, да го приоритизира нивото на сериозност и да предложи насочени закрпи.

Aardvark работи преку следење на комитите и промените во базите на кодови, идентификување на ранливости, како тие можат да бидат искористени и предлагање решенија. Aardvark не се потпира на традиционални техники за анализа на програми како што се fuzzing или анализа на составот на софтвер. Наместо тоа, користи расудување и употреба на алатки напојувани од LLM за да го разбере однесувањето на кодот и да ги идентификува ранливостите. Aardvark бара грешки како што би го правел тоа човек истражувач за безбедност: читајќи код, анализирајќи го, пишувајќи и извршувајќи тестови, користејќи алатки и друго.

Дијаграм насловен „AARDVARK – Работен тек на агент за откривање на ранливости“ прикажува процесен тек од Git репозиториум до моделирање на закани, откривање на ранливости, валидациска контролирана кутија, закрпување со Codex и човечки преглед што води до барање за повлекување.

Aardvark се потпира на повеќестепен процес за идентификување, објаснување и решавање на ранливости:

  • Анализа: Започнува со анализа на целото складиште за да се создаде модел на закани што го одразува разбирањето на безбедносните цели и дизајнот на проектот.
  • Скенирање на комити: Се скенира за ранливости преку проверка на промените на ниво на комит во однос на целото репозиториум и модел на закани додека се додава нов код. Кога репозиториумот првпат ќе се поврзе, Aardvark ќе ја скенира неговата историја за да ги идентификува постоечките проблеми. Aardvark ги објаснува ранливостите што ги наоѓа чекор-по-чекор, анотирајќи го кодот за човечка проверка.
  • Валидација: Откако Aardvark ќе идентификува потенцијална ранливост, ќе се обиде да ја активира во изолирана, контролирана средина за да потврди дека може да се искористи. Aardvark ги опишува чекорите преземени за да се осигура дека на корисниците им се враќаат точни, висококвалитетни и со ниска стапка на лажни позитиви сознанија.
  • Закрпување: Aardvark се интегрира со OpenAI Codex за да помогне во закрпување на ранливостите што ги наоѓа. На секое наоѓање се прикачува закрпа генерирана од Codex и скенирана од Aardvark за човечки преглед и ефикасно, еднократно закрпување.

Aardvark работи заедно со инженерите, интегрирајќи се со GitHub, Codex и постоечките работни процеси за да обезбеди јасни, применливи увиди без да го забави развојот. Иако Aardvark е изграден за безбедност, во нашето тестирање откривме дека може да открие и грешки како логички недостатоци, нецелосни поправки и проблеми со приватноста.

Вистинско влијание, денес

Aardvark е во служба веќе неколку месеци, работи континуирано низ внатрешните кодни бази на OpenAI и оние на надворешните алфа партнери. Во рамките на OpenAI, се појавија значајни ранливости и придонесоа кон одбранбената позиција на OpenAI. Партнерите ја истакнаа длабочината на анализата, при што Aardvark открива проблеми кои се појавуваат само под сложени услови.

Во бенчмарк тестирањето на „златните“ репозиториуми, Aardvark идентификуваше 92% од познатите и синтетички воведените ранливости, демонстрирајќи висока способност за препознавање и ефикасност во реалниот свет.

Aardvark за отворен код

Aardvark исто така е применет на проекти со отворен код, каде што откри и ние одговорно објавивме бројни ранливости – десет од кои добија идентификатори за заеднички ранливости и изложености (CVE).

Како корисници на децении отворени истражувања и одговорно објавување, ние сме посветени на враќање – придонесувајќи со алатки и наоди кои го прават дигиталниот екосистем побезбеден за сите. Планираме да понудиме бесплатно скенирање на одбрани некомерцијални репозиториуми со отворен код за да придонесеме кон безбедноста на екосистемот на софтвер со отворен код и синџирот на снабдување.

Неодамна ги ажуриравме нашите политики за координирано откривање на ранливости кои заземаат пријателски став кон развивачи на софтвер, фокусирајќи се на соработка и скалабилно влијание, наместо на строги временски рокови за откривање кои можат да вршат притисок врз развивачи на софтвер. Очекуваме дека алатки како Aardvark ќе доведат до откривање на се поголем број на грешки и сакаме одржливо да соработуваме за да постигнеме долгорочна отпорност.

Зошто е важно

Софтверот сега е 'рбетот на секоја индустрија – што значи дека софтверските ранливости се системски ризик за бизнисите, инфраструктурата и општеството. Во 2024 година беа пријавени над 40 000 CVE. Нашето тестирање покажува дека околу 1,2% од комитите воведуваат грешки – мали промени што можат да имаат големи последици.

Aardvark претставува нов модел ориентиран кон одбрана: агентски истражувач за безбедност кој соработува со тимови обезбедувајќи континуирана заштита додека кодот се развива. Со рано откривање на ранливостите, валидација на експлоатабилноста во реалниот свет и понуда на јасни решенија, Aardvark може да ја зајакне безбедноста без да ја забави иновацијата. Веруваме во проширување на пристапот до експертиза за безбедност. Започнуваме со приватна beta верзија и ќе ја прошириме достапноста како што учиме.

Приватната beta верзија сега е отворена

Ги покануваме избраните партнери да се придружат на приватната beta верзија на Aardvark. Учесниците ќе добијат ран пристап и ќе работат директно со нашиот тим за да ја усовршат точноста на детекцијата, валидирачките работни текови и искуството со известување.

Сакаме да ги потврдиме перформансите во различни средини. Ако твојата организација или отворен проект е заинтересиран да се приклучи, можеш да аплицираш тука.

Автор

OpenAI

Придонесувачи

Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu и Matt Knight