۸ آبان ۱۴۰۴

معرفی Aardvark: پژوهشگر امنیت عاملی OpenAI

اکنون در نسخه بتای خصوصی: یک عامل هوش مصنوعی که مانند یک پژوهشگر امنیتی فکر می‌کند و با نیازهای نرم‌افزارهای مدرن در مقیاس بالا سازگار است.

در حال بارگذاری…

امروز، ما Aardvark را معرفی می‌کنیم؛ یک پژوهشگر امنیت عاملی که با استفاده از GPT‑5 کار می‌کند.

امنیت نرم‌افزار یکی از حیاتی‌ترین—و چالش‌برانگیزترین—مرزهای فناوری است. هر سال، ده‌ها هزار آسیب‌پذیری جدید در میان کدهای سازمانی و منبع‌باز کشف می‌شود. مدافعان با وظایف دشواری روبه‌رو هستند: یافتن و اصلاح آسیب‌پذیری‌ها پیش از آن‌که مهاجمان به آن‌ها دست پیدا کنند. در OpenAI، ما در تلاشیم تا این توازن را به نفع مدافعان تغییر دهیم.

Aardvark نمایانگر یک پیشرفت چشمگیر در پژوهش‌های هوش مصنوعی و امنیت است: یک عامل خودمختار که می‌تواند به توسعه‌دهندگان و تیم‌های امنیتی در کشف و رفع آسیب‌پذیری‌های امنیتی در مقیاس وسیع کمک کند. Aardvark اکنون در نسخه بتای خصوصی در دسترس است تا قابلیت‌های خود را در میدان عمل اعتبارسنجی و بهینه‌سازی کند.

نحوه عملکرد Aardvark

Aardvark به‌صورت مداوم مخازن کد منبع را تحلیل می‌کند تا آسیب‌پذیری‌ها را شناسایی کند، قابلیت بهره‌برداری آن‌ها را ارزیابی نماید، شدت آن‌ها را اولویت‌بندی کند، و پچ‌های هدفمند پیشنهاد دهد.

Aardvark با نظارت بر کامیت‌ها و تغییرات در پایگاه‌های کد عمل می‌کند، آسیب‌پذیری‌ها را شناسایی می‌کند، نحوه بهره‌برداری احتمالی از آن‌ها را بررسی می‌کند و راه‌حل‌هایی برای رفع آن‌ها پیشنهاد می‌دهد. Aardvark به روش‌های سنتی تحلیل برنامه مانند fuzzing یا تحلیل ترکیب نرم‌افزار متکی نیست. در عوض، از استدلال مبتنی بر مدل‌های زبانی بزرگ (LLM) و استفاده از ابزارها برای درک رفتار کد و شناسایی آسیب‌پذیری‌ها بهره می‌برد. Aardvark مانند یک پژوهشگر امنیتی انسانی به دنبال باگ‌ها می‌گردد: با خواندن کد، تحلیل آن، نوشتن و اجرای نمونه‌ها، استفاده از ابزارها و موارد دیگر.

نمودار با عنوان «AARDVARK — جریان کاری عامل کشف آسیب‌پذیری» که جریان فرایند را از مخزن Git تا مدل‌سازی تهدید، کشف آسیب‌پذیری، محیط ایزوله اعتبارسنجی، پچ کردن با Codex، و بازبینی انسانی که به یک درخواست pull منتهی می‌شود، نشان می‌دهد.

Aardvark به مسیری چندمرحله‌ای متکی است تا آسیب‌پذیری‌ها را شناسایی، توضیح و اصلاح کند:

تحلیل: کار را با تحلیل کامل مخزن آغاز می‌کند تا یک مدل تهدید تولید کند که منعکس‌کننده درک آن از اهداف امنیتی و طراحی پروژه است.
اسکن کامیت: آسیب‌پذیری‌ها را از طریق بررسی تغییرات در سطح کامیت در برابر کل مخزن و مدل تهدید، هم‌زمان با افزودن کد جدید، اسکن می‌کند. هنگامی که یک مخزن برای اولین بار متصل می‌شود، Aardvark تاریخچه آن را برای شناسایی مشکلات موجود اسکن خواهد کرد. Aardvark آسیب‌پذیری‌هایی که پیدا می‌کند را به‌صورت گام‌به‌گام توضیح می‌دهد و کد را برای بازبینی انسانی حاشیه‌نویسی می‌کند.
اعتبارسنجی: هنگامی که Aardvark یک آسیب‌پذیری بالقوه را شناسایی می‌کند، تلاش می‌کند آن را در یک محیط ایزوله و سندباکس‌شده اجرا کند تا قابلیت بهره‌برداری از آن را تأیید کند. Aardvark مراحل انجام‌شده برای اطمینان از ارائه‌ی بینش‌هایی دقیق، با کیفیت بالا و دارای نرخ پایین مثبت کاذب به کاربران را توصیف می‌کند.
پچ کردن: Aardvark با OpenAI Codex یکپارچه می‌شود تا در رفع آسیب‌پذیری‌هایی که شناسایی می‌کند کمک کند. برای هر یافته، یک پچ تولیدشده توسط Codex و اسکن‌شده توسط Aardvark ضمیمه می‌کند تا برای بازبینی انسانی و پچ کردن سریع با یک کلیک آماده باشد.

Aardvark در کنار مهندسان کار می‌کند و با GitHub، Codex و جریان‌های کاری موجود ادغام می‌شود تا بینش‌هایی شفاف و قابل اجرا، بدون کند کردن روند توسعه ارائه دهد. در حالی که Aardvark برای امنیت طراحی شده است، در آزمایش‌های ما مشخص شد که این ابزار می‌تواند اشکالاتی مانند نقص‌های منطقی، اصلاحات ناقص و مشکلات مربوط به حریم خصوصی را نیز کشف کند.

تأثیر واقعی، امروز

Aardvark برای چندین ماه در حال خدمت بوده و به‌صورت پیوسته روی پایگاه‌های کد داخلی OpenAI و پایگاه‌های کد شرکای آلفای خارجی اجرا شده است. در داخل OpenAI، این ابزار آسیب‌پذیری‌های معناداری را شناسایی کرده و به تقویت وضعیت دفاعی OpenAI کمک کرده است. شرکا به عمق تحلیل‌های آن اشاره کرده‌اند، به‌طوری که Aardvark مسائلی را پیدا کرده که فقط در شرایط پیچیده بروز می‌کنند.

در تست‌های ارزیابی روی مخازن «طلایی»، Aardvark توانست 92٪ از آسیب‌پذیری‌های شناخته‌شده و به‌صورت مصنوعی واردشده را شناسایی کند که نشان‌دهنده بازیابی بالا و اثربخشی آن در دنیای واقعی است.

Aardvark برای منبع باز

Aardvark همچنین در پروژه‌های منبع باز به‌کار گرفته شده است، جایی که آسیب‌پذیری‌های متعددی را شناسایی کرده و ما آن‌ها را به‌صورت مسئولانه افشا کرده‌ایم — ده مورد از آن‌ها شناسه‌های آسیب‌پذیری‌ها و اکسپوژرهای رایج (CVE) دریافت کرده‌اند.

به‌عنوان بهره‌بردارانی از دهه‌ها تحقیق آزاد و افشای مسئولانه، ما متعهد به بازپرداخت هستیم — با ارائه ابزارها و یافته‌هایی که اکوسیستم دیجیتال را برای همه ایمن‌تر می‌سازند. ما قصد داریم اسکن رایگان را برای مخازن منبع باز غیرتجاری منتخب ارائه دهیم تا به امنیت اکوسیستم نرم‌افزارهای منبع باز و زنجیره تأمین کمک کنیم.

ما اخیراً سیاست افشای هماهنگ‌شده‌ی خروجی⁠ خود را به‌روزرسانی⁠ کرده‌ایم که رویکردی دوستانه برای توسعه‌دهندگان دارد و بر همکاری و تأثیر مقیاس‌پذیر تمرکز می‌کند، نه بر جدول‌های زمانی سخت‌گیرانه‌ای برای افشا که می‌توانند به توسعه‌دهندگان فشار وارد کنند. ما پیش‌بینی می‌کنیم ابزارهایی مانند Aardvark منجر به کشف تعداد فزاینده‌ای از باگ‌ها شوند و می‌خواهیم به‌صورت پایدار همکاری کنیم تا به تاب‌آوری بلندمدت دست یابیم.

چرا این موضوع اهمیت دارد

نرم‌افزار اکنون ستون فقرات هر صنعتی است — به این معنا که آسیب‌پذیری‌های نرم‌افزاری یک ریسک سیستماتیک برای کسب‌وکارها، زیرساخت‌ها و جامعه محسوب می‌شوند. تنها در سال 2024، بیش از 40,000 آسیب‌پذیری با شناسه CVE گزارش شده است. آزمایش‌های ما نشان می‌دهد که حدود 1.2٪ از کامیت‌ها باعث ایجاد باگ می‌شوند—تغییرات کوچکی که می‌توانند پیامدهای بزرگی داشته باشند.

Aardvark نمایانگر یک مدل جدید با تمرکز بر دفاع است: یک محقق امنیتی عامل‌محور که با ارائه حفاظت مستمر هم‌زمان با تکامل کد، با تیم‌ها همکاری می‌کند. با شناسایی زودهنگام آسیب‌پذیری‌ها، تأیید قابلیت بهره‌برداری آن‌ها در دنیای واقعی، و ارائه اصلاحات شفاف، Aardvark می‌تواند امنیت را تقویت کند بدون آن‌که نوآوری را کند سازد. ما به گسترش دسترسی به تخصص امنیتی باور داریم. ما با یک بتای خصوصی شروع می‌کنیم و با یادگیری، دسترسی را گسترش خواهیم داد.

نسخه بتای خصوصی اکنون فعال است

ما از شرکای منتخب دعوت می‌کنیم تا به نسخه بتای خصوصی Aardvark بپیوندند. شرکت‌کنندگان دسترسی زودهنگام خواهند داشت و مستقیماً با تیم ما همکاری خواهند کرد تا دقت شناسایی، گردش‌کارهای اعتبارسنجی و تجربه گزارش‌دهی را بهبود بخشند.

ما به دنبال اعتبارسنجی عملکرد در محیط‌های مختلف هستیم. در صورتی که سازمان یا پروژه منبع باز شما مایل به همکاری است، می‌توانید از اینجا درخواست دهید⁠.