Bemutatkozik az Aardvark: az OpenAI ügynöki biztonsági kutatója
Most privát bétában: egy AI ügynök, amely úgy gondolkodik, akár egy biztonsági kutató, és képes skálázódni, hogy megfeleljen a modern szoftverek igényeinek.
Ma bemutatjuk az Aardvarkot, egy ügynöki biztonsági kutatót, amelyet a GPT‑5 működtet.
A szoftverbiztonság a technológia egyik legkritikusabb és legnagyobb kihívást jelentő határterülete. Minden évben több tízezer új sebezhetőséget fedeznek fel a vállalati és nyílt forráskódú kódbázisokban. A biztonsági szakembereknek az a félelmetes feladatuk, hogy a sebezhetőségeket megtalálják és kijavítsák, mielőtt az ellenfeleik tennék meg. Az OpenAI-nál azon dolgozunk, hogy a mérleg a biztonságiak javára billenjen.
Az Aardvark áttörést jelent a mesterséges intelligencia és a biztonsági kutatások terén: egy autonóm ügynök, amely segíthet a fejlesztőknek és a biztonsági csapatoknak a biztonsági rések felfedezésében és kijavításában nagy léptékben. Az Aardvark most már elérhető privát béta verzióban, hogy érvényesítse és finomítsa képességeit a témában.
Az Aardvark folyamatosan elemzi a forráskód-tárházakat, hogy azonosítsa a sebezhetőségeket, értékelje a kihasználhatóságot, rangsorolja a súlyosságot, és célzott javításokat javasoljon.
Az Aardvark úgy működik, hogy figyeli a kódalapokhoz tartozó commitokat és változásokat, azonosítja a sebezhetőségeket, azok kihasználási lehetőségeit, és javaslatokat tesz a kijavításra. Az Aardvark nem támaszkodik a hagyományos program-elemzési technikákra, mint például a fuzzing vagy a szoftverösszetétel-elemzés. Ehelyett LLM-alapú indoklást és eszközhasználatot alkalmaz a kód viselkedésének megértésére és a sebezhetőségek azonosítására. Az Aardvark úgy keresi a hibákat, mint egy emberi biztonsági kutató: kódot olvas, elemez, teszteket ír és futtat, eszközöket használ és így tovább.
Az Aardvark egy többlépcsős folyamatra támaszkodik a sebezhetőségek azonosítására, magyarázatára és kijavítására:
- Elemzés: A teljes adattár elemzésével kezd, hogy egy fenyegetésmodellt hozzon létre, amely tükrözi a projekt biztonsági célkitűzéseinek és tervezésének megértését.
- Commit vizsgálat: A sebezhetőségek felderítését végzi azáltal, hogy a commit szintű változtatásokat vizsgálja az egész adattár és fenyegetési modell alapján, amikor új kódot commitálnak. Amikor egy repozitórium először csatlakozik, az Aardvark átvizsgálja az előzményeket, hogy azonosítsa a meglévő problémákat. Az Aardvark lépésről lépésre magyarázza el a talált sebezhetőségeket, és megjegyzésekkel látja el a kódot az ember által végzett ellenőrzéshez.
- Érvényesítés: Miután az Aardvark azonosított egy potenciális sebezhetőséget, megpróbálja azt egy elkülönített, védett környezetben élesíteni, hogy megerősítse annak használhatóságát. Az Aardvark leírja azokat a lépéseket, amelyeket annak érdekében tesz, hogy pontos, magas színvonalú és alacsony hamis pozitív arányú betekintések kerüljenek a felhasználókhoz.
- Javítás: Az Aardvark az OpenAI Codex-szel integrálva segít kijavítani az általa talált sebezhetőségeket. Minden megállapításhoz egy Codex által generált és Aardvark által szkennelt javítást csatol az emberi ellenőrzéshez és a hatékony, egykattintásos javításhoz.
Az Aardvark a mérnökökkel együttműködve integrálódik a GitHubbal, a Codexszel és a meglévő munkafolyamatokkal, hogy világos, cselekvésre ösztönző betekintéseket nyújtson anélkül, hogy lassítaná a fejlesztést. Bár az Aardvarkot a biztonság céljára tervezték, a tesztelés során azt találtuk, hogy képes feltárni olyan hibákat is, mint a logikai hibák, a nem teljeskörű javítások és az adatvédelmi problémák.
Az Aardvark már több hónapja működik, folyamatosan fut az OpenAI belső kódbázisain és külső alfa partnerek kódbázisain. Az OpenAI-n belül jelentős sebezhetőségek kerültek felszínre, amelyek hozzájárultak az OpenAI védekező helyzetéhez. A partnerek kiemelték az elemzés mélységét, és az Aardvark olyan problémákat talált, amelyek csak összetett körülmények között fordulnak elő.
Az „arany” repókon végzett benchmark tesztelés során az Aardvark a már ismert és szintetikusan bevezetett sebezhetőségek 92%-át azonosította, ami magas találati arányt és valós hatékonyságot mutat.
Az Aardvarkot nyílt forráskódú projektekben is alkalmazták, ahol számos sebezhetőséget fedezett fel, amelyeket felelősségteljesen nyilvánosságra hoztunk – ezek közül tíz kapott Common Vulnerabilities and Exposures (CVE) azonosítót.
Mivel mi is az évtizedes nyílt kutatások és felelős hibabejelentések előnyeit élvezzük, elkötelezettek vagyunk amellett, hogy viszonozzuk: eszközökkel és eredményekkel járulunk hozzá, amelyek mindenki számára biztonságosabbá teszik a digitális ökoszisztémát. Az a tervünk, hogy pro bono szkennelést kínálunk kiválasztott nem kereskedelmi nyílt forráskódú adattáraknak, hogy hozzájáruljunk a nyílt forráskódú szoftver ökoszisztéma és ellátási lánc biztonságához.
Nemrégiben frissítettük a kimenő koordinált nyilvánosságra hozatali szabályzatunkat, amely fejlesztőbarát álláspontot képvisel, az együttműködésre és a skálázható hatásra összpontosítva, a fejlesztőkre nehezedő merev közzétételi határidők helyett. Arra számítunk, hogy az olyan eszközök, mint az Aardvark, egyre több hibát fognak felfedezni, és fenntartható módon szeretnénk együttműködni a hosszú távú biztonsági stabilitás elérése érdekében.
A szoftver ma már minden iparág gerince, ami azt jelenti, hogy a szoftver sebezhetőségei rendszerszintű kockázatot jelentenek a vállalkozásokra, az infrastruktúrára és a társadalomra nézve. 2024-ben több mint 40 000 CVE-t jelentettek be. Tesztelésünk azt mutatja, hogy a commitok körülbelül 1,2%-a hibákat vezet be—apró változtatásokat, amelyek aránytalanul nagy következményekkel járhatnak.
Az Aardvark egy új, védelmező-központú modellt képvisel: egy ügynöki biztonsági kutató, aki a csapatokkal együttműködve folyamatos védelmet biztosít, ahogy a kód fejlődik. Az Aardvark azáltal, hogy korán felismeri a sebezhetőségeket, ellenőrzi azok valós kihasználhatóságát, és egyértelmű javításokat kínál, képes erősíteni a biztonságot az innováció lassítása nélkül. Hiszünk abban, hogy a biztonsági szakértelemhez való hozzáférést szélesíteni kell. Egy privát béta verzióval kezdünk, és ahogy tanulunk, szélesítjük az elérhetőséget.
Kiválasztott partnereket hívunk meg, hogy csatlakozzanak az Aardvark privát bétához. A résztvevők korai hozzáférést kapnak, és közvetlenül együttműködhetnek a csapatunkkal a detektálási pontosság, a validációs munkafolyamatok és a jelentési élmény finomítása érdekében.
Arra törekszünk, hogy a teljesítményt különböző környezetekben ellenőrizzük. Ha a szervezeted vagy nyílt forráskódú projekted érdeklődik a csatlakozás iránt, itt jelentkezhetsz.
Szerző
Közreműködők
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu és Matt Knight


