Перейти до основного вмісту
OpenAI

Представляємо Aardvark — агента-дослідника OpenAI з питань безпеки

Тепер у закритій бета-версії: ШІ-агент, що думає як дослідник безпеки та здатен масштабуватися для виконання вимог до сучасного програмного забезпечення.

Завантаження…

Сьогодні ми анонсуємо Aardvark — агентного дослідника безпеки на базі GPT‑5.

Безпека програмного забезпечення лишається однією з найважливіших і найскладніших напрямків у сфері технологій. Щороку в корпоративних та відкритих кодових базах виявляють десятки тисяч нових вразливостей. Захисники стикаються з важкими завданнями з виявлення та усунення вразливостей раніше, ніж це зроблять їхні суперники. Ми в OpenAI працюємо над тим, щоб схилити баланс на користь перших.

Aardvark — це прорив у дослідженнях штучного інтелекту та безпеки: автономний агент може допомагати розробникам та командам безпеки виявляти та виправляти вразливості в безпеці в будь-якому масштабі. Наразі з метою перевірки та вдосконалення можливостей у цій сфері Aardvark доступний у закритій бета-версії.

Як працює Aardvark

Aardvark постійно аналізує репозиторії вихідного коду для виявлення вразливостей, оцінки можливості їх експлуатації, визначення пріоритету за ступенем серйозності та пропонування точкових патчів.

Aardvark працює, відстежуючи коміти та зміни в кодових базах, виявляючи вразливості та можливості їх використання, і пропонуючи виправлення. Aardvark не покладається на традиційні методи аналізу програм, такі як фазинг або аналіз складу програмного забезпечення. Натомість він використовує міркування та інструменти на базі LLM для розуміння поведінки коду та виявлення вразливостей. Aardvark шукає помилки так, як це робить дослідник безпеки: читаючи код, аналізуючи його, пишучи та виконуючи тести, використовуючи інструменти тощо.

Діаграма під назвою «AARDVARK — Робочий процес агента з виявлення вразливостей», що показує хід процесу від Git-репозиторію до моделювання загроз, виявлення вразливостей, валідаційної пісочниці, виправлення за допомогою Codex і людського огляду з подальшою реєстрацією запиту pull request.

Aardvark використовує багатоступеневий процес виявлення, пояснення та усунення вразливостей:

  • Аналіз: Процес починається з аналізу всього репозиторію для створення моделі загроз, що відображає розуміння цілей безпеки та дизайну проєкту.
  • Сканування комітів: Агент перевіряє вразливості, аналізуючи зміни на рівні комітів у всьому репозиторії та моделі загроз при коміті нового коду. При першому підключенні репозиторію Aardvark сканує його історію, аби виявити наявні проблеми. Aardvark пояснює вразливості, які він знаходить, покроково, додаючи анотації до коду для перегляду людиною.
  • Валідація: Коли Aardvark виявляє потенційну вразливість, він намагається її активувати в ізольованому середовищі пісочниці, аби підтвердити можливість її експлуатації. Aardvark описує виконані кроки, надаючи користувачеві точну та високоякісну аналітику з низьким ризиком генерування хибнопозитивних даних.
  • Коригування: Завдяки інтеграції з Codex від OpenAI Aardvark здатен допомогти з виправленням виявлених вразливостей. Агент додає до кожної знахідки патч, згенерований Codex та перевірений самим Aardvark: далі патч надається людині для подальшої перевірки та ефективного впровадження в один клік.

Aardvark співпрацює з розробниками, інтегруючись з GitHub, Codex та існуючими робочими процесами для надання чітких та практичних інсайтів без уповільнення поточної розробки. Хоча Aardvark було створено в першу чергу з метою підтримки безпеки, під час тестування ми виявили, що він також може виявляти такі помилки, як логічні недоліки, неповні виправлення та проблеми з конфіденційністю.

Реальний вплив уже сьогодні

Aardvark уже кілька місяців безперервно працює у внутрішніх кодових базах OpenAI та кодових базах зовнішніх партнерів, що стали учасниками тестування альфа-версії. Він допоміг виявити в межах OpenAI значущі вразливості, що сприяло зміцненню захищеності компанії. Партнери відзначали глибину аналізу; при цьому Aardvark виявляв проблеми, що виникають лише в складних умовах.

Під час тестування на еталонних репозиторіях Aardvark виявив 92% відомих та штучно введених вразливостей, демонструючи суттєвий відклик та ефективність у реальних умовах.

Aardvark для відкритого програмного забезпечення

Aardvark також був застосований до проєктів із відкритим кодом, де він виявив, а ми відповідально розкрили численні вразливості, десять із яких отримали ідентифікатори Common Vulnerabilities and Exposures (CVE).

Як бенефіціари десятиліть відкритих досліджень і відповідального розкриття інформації, ми прагнемо робити свій внесок, пропонуючи інструменти та висновки, які роблять цифрову екосистему безпечнішою для всіх. Ми плануємо запропонувати безкоштовне сканування для вибраних некомерційних репозиторіїв із відкритим кодом, щоб зробити свій внесок у безпеку екосистеми та ланцюга поставок програмного забезпечення з відкритим кодом.

Нещодавно ми оновили нашу політику координованого розкриття інформації, яка орієнтована на розробників, зосереджена на співпраці та масштабованому впливі, а не на жорстких термінах розкриття, що може чинити тиск на розробників. Ми очікуємо, що такі інструменти, як Aardvark, призведуть до виявлення дедалі більшої кількості помилок, і хочемо продовжувати співпрацю на постійній основі для досягнення довгострокової стійкості.

Чому це важливо

Програмне забезпечення сьогодні є основою кожної галузі, що означає, що його вразливості становлять системний ризик для бізнесу, інфраструктури й суспільства. У 2024 році було зареєстровано понад 40 000 вразливостей типу CVE. Наші тести показують, що близько 1,2% комітів містять помилки — невеликі зміни, які можуть мати серйозні наслідки.

Aardvark представляє нову модель-захисника: агентного дослідника безпеки, який співпрацює з командами, надаючи безперервний захист у міру написання коду. Завдяки ранньому виявленню вразливостей, перевірці реальної можливості їхньої експлуатації та пропозиції чітких рішень Aardvark може зміцнити безпеку без уповільнення інновацій. Ми вважаємо, що в нього є потенціал до впровадження в сферу експертизи служб безпеки. Ми відкриваємо реєстрацію на закрите бета-тестування і плануємо надати доступ до моделі більшій кількості користувачів після того, як отримаємо більше інформації в рамках зворотнього зв'язку.

Реєстрація на закрите бета-тестування відкрита

Ми запрошуємо обраних партнерів приєднатися до закритого бета-тестування Aardvark. Учасники отримають ранній доступ і співпрацюватимуть безпосередньо з нашою командою з метою вдосконалення точності виявлення вразливостей, перевірки робочих процесів та звітування.

Ми прагнемо перевірити ефективність моделі в різних середовищах. Якщо ваша організація або відкритий проєкт зацікавлені в приєднанні до програми тестування, ви можете подати заявку тут.

Автор

OpenAI

Учасники

Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight