امروز، ما Aardvark را معرفی میکنیم؛ یک پژوهشگر امنیت عاملی که با استفاده از GPT‑5 کار میکند.
امنیت نرمافزار یکی از حیاتیترین—و چالشبرانگیزترین—مرزهای فناوری است. هر سال، دهها هزار آسیبپذیری جدید در میان کدهای سازمانی و منبعباز کشف میشود. مدافعان با وظایف دشواری روبهرو هستند: یافتن و اصلاح آسیبپذیریها پیش از آنکه مهاجمان به آنها دست پیدا کنند. در OpenAI، ما در تلاشیم تا این توازن را به نفع مدافعان تغییر دهیم.
Aardvark نمایانگر یک پیشرفت چشمگیر در پژوهشهای هوش مصنوعی و امنیت است: یک عامل خودمختار که میتواند به توسعهدهندگان و تیمهای امنیتی در کشف و رفع آسیبپذیریهای امنیتی در مقیاس وسیع کمک کند. Aardvark اکنون در نسخه بتای خصوصی در دسترس است تا قابلیتهای خود را در میدان عمل اعتبارسنجی و بهینهسازی کند.
Aardvark بهصورت مداوم مخازن کد منبع را تحلیل میکند تا آسیبپذیریها را شناسایی کند، قابلیت بهرهبرداری آنها را ارزیابی نماید، شدت آنها را اولویتبندی کند، و پچهای هدفمند پیشنهاد دهد.
Aardvark با نظارت بر کامیتها و تغییرات در پایگاههای کد عمل میکند، آسیبپذیریها را شناسایی میکند، نحوه بهرهبرداری احتمالی از آنها را بررسی میکند و راهحلهایی برای رفع آنها پیشنهاد میدهد. Aardvark به روشهای سنتی تحلیل برنامه مانند fuzzing یا تحلیل ترکیب نرمافزار متکی نیست. در عوض، از استدلال مبتنی بر مدلهای زبانی بزرگ (LLM) و استفاده از ابزارها برای درک رفتار کد و شناسایی آسیبپذیریها بهره میبرد. Aardvark مانند یک پژوهشگر امنیتی انسانی به دنبال باگها میگردد: با خواندن کد، تحلیل آن، نوشتن و اجرای نمونهها، استفاده از ابزارها و موارد دیگر.
Aardvark به مسیری چندمرحلهای متکی است تا آسیبپذیریها را شناسایی، توضیح و اصلاح کند:
- تحلیل: کار را با تحلیل کامل مخزن آغاز میکند تا یک مدل تهدید تولید کند که منعکسکننده درک آن از اهداف امنیتی و طراحی پروژه است.
- اسکن کامیت: آسیبپذیریها را از طریق بررسی تغییرات در سطح کامیت در برابر کل مخزن و مدل تهدید، همزمان با افزودن کد جدید، اسکن میکند. هنگامی که یک مخزن برای اولین بار متصل میشود، Aardvark تاریخچه آن را برای شناسایی مشکلات موجود اسکن خواهد کرد. Aardvark آسیبپذیریهایی که پیدا میکند را بهصورت گامبهگام توضیح میدهد و کد را برای بازبینی انسانی حاشیهنویسی میکند.
- اعتبارسنجی: هنگامی که Aardvark یک آسیبپذیری بالقوه را شناسایی میکند، تلاش میکند آن را در یک محیط ایزوله و سندباکسشده اجرا کند تا قابلیت بهرهبرداری از آن را تأیید کند. Aardvark مراحل انجامشده برای اطمینان از ارائهی بینشهایی دقیق، با کیفیت بالا و دارای نرخ پایین مثبت کاذب به کاربران را توصیف میکند.
- پچ کردن: Aardvark با OpenAI Codex یکپارچه میشود تا در رفع آسیبپذیریهایی که شناسایی میکند کمک کند. برای هر یافته، یک پچ تولیدشده توسط Codex و اسکنشده توسط Aardvark ضمیمه میکند تا برای بازبینی انسانی و پچ کردن سریع با یک کلیک آماده باشد.
Aardvark در کنار مهندسان کار میکند و با GitHub، Codex و جریانهای کاری موجود ادغام میشود تا بینشهایی شفاف و قابل اجرا، بدون کند کردن روند توسعه ارائه دهد. در حالی که Aardvark برای امنیت طراحی شده است، در آزمایشهای ما مشخص شد که این ابزار میتواند اشکالاتی مانند نقصهای منطقی، اصلاحات ناقص و مشکلات مربوط به حریم خصوصی را نیز کشف کند.
Aardvark برای چندین ماه در حال خدمت بوده و بهصورت پیوسته روی پایگاههای کد داخلی OpenAI و پایگاههای کد شرکای آلفای خارجی اجرا شده است. در داخل OpenAI، این ابزار آسیبپذیریهای معناداری را شناسایی کرده و به تقویت وضعیت دفاعی OpenAI کمک کرده است. شرکا به عمق تحلیلهای آن اشاره کردهاند، بهطوری که Aardvark مسائلی را پیدا کرده که فقط در شرایط پیچیده بروز میکنند.
در تستهای ارزیابی روی مخازن «طلایی»، Aardvark توانست 92٪ از آسیبپذیریهای شناختهشده و بهصورت مصنوعی واردشده را شناسایی کند که نشاندهنده بازیابی بالا و اثربخشی آن در دنیای واقعی است.
Aardvark همچنین در پروژههای منبع باز بهکار گرفته شده است، جایی که آسیبپذیریهای متعددی را شناسایی کرده و ما آنها را بهصورت مسئولانه افشا کردهایم — ده مورد از آنها شناسههای آسیبپذیریها و اکسپوژرهای رایج (CVE) دریافت کردهاند.
بهعنوان بهرهبردارانی از دههها تحقیق آزاد و افشای مسئولانه، ما متعهد به بازپرداخت هستیم — با ارائه ابزارها و یافتههایی که اکوسیستم دیجیتال را برای همه ایمنتر میسازند. ما قصد داریم اسکن رایگان را برای مخازن منبع باز غیرتجاری منتخب ارائه دهیم تا به امنیت اکوسیستم نرمافزارهای منبع باز و زنجیره تأمین کمک کنیم.
ما اخیراً سیاست افشای هماهنگشدهی خروجی خود را بهروزرسانی کردهایم که رویکردی دوستانه برای توسعهدهندگان دارد و بر همکاری و تأثیر مقیاسپذیر تمرکز میکند، نه بر جدولهای زمانی سختگیرانهای برای افشا که میتوانند به توسعهدهندگان فشار وارد کنند. ما پیشبینی میکنیم ابزارهایی مانند Aardvark منجر به کشف تعداد فزایندهای از باگها شوند و میخواهیم بهصورت پایدار همکاری کنیم تا به تابآوری بلندمدت دست یابیم.
نرمافزار اکنون ستون فقرات هر صنعتی است — به این معنا که آسیبپذیریهای نرمافزاری یک ریسک سیستماتیک برای کسبوکارها، زیرساختها و جامعه محسوب میشوند. تنها در سال 2024، بیش از 40,000 آسیبپذیری با شناسه CVE گزارش شده است. آزمایشهای ما نشان میدهد که حدود 1.2٪ از کامیتها باعث ایجاد باگ میشوند—تغییرات کوچکی که میتوانند پیامدهای بزرگی داشته باشند.
Aardvark نمایانگر یک مدل جدید با تمرکز بر دفاع است: یک محقق امنیتی عاملمحور که با ارائه حفاظت مستمر همزمان با تکامل کد، با تیمها همکاری میکند. با شناسایی زودهنگام آسیبپذیریها، تأیید قابلیت بهرهبرداری آنها در دنیای واقعی، و ارائه اصلاحات شفاف، Aardvark میتواند امنیت را تقویت کند بدون آنکه نوآوری را کند سازد. ما به گسترش دسترسی به تخصص امنیتی باور داریم. ما با یک بتای خصوصی شروع میکنیم و با یادگیری، دسترسی را گسترش خواهیم داد.
ما از شرکای منتخب دعوت میکنیم تا به نسخه بتای خصوصی Aardvark بپیوندند. شرکتکنندگان دسترسی زودهنگام خواهند داشت و مستقیماً با تیم ما همکاری خواهند کرد تا دقت شناسایی، گردشکارهای اعتبارسنجی و تجربه گزارشدهی را بهبود بخشند.
ما به دنبال اعتبارسنجی عملکرد در محیطهای مختلف هستیم. در صورتی که سازمان یا پروژه منبع باز شما مایل به همکاری است، میتوانید از اینجا درخواست دهید.
نویسنده
مشارکتکنندگان
Akshay Bhat، Andy Nguyen، Dave Aitel، Harold Nguyen، Ian Brelinsky، Tiffany Citra، Xin Hu، Matt Knight


