Aġġornament tas-6 ta’ Marzu 2026: Aardvark issa huwa Codex Security, u huwa disponibbli bħala preview ta’ riċerka.
Aardvark issa nbena direttament f’Codex bħala Codex Security, u qed jitqassam lill-klijenti ta’ ChatGPT Enterprise, Business, u Edu permezz tal-web ta’ Codex b’użu bla ħlas għax-xahar li ġej. Jekk jogħġbok ara l-blog tagħna hawn.
Illum, qed inħabbru Aardvark, riċerkatur tas-sigurtà aġentiku mħaddem minn GPT‑5.
Is-sigurtà tas-software hija waħda mill-aktar fruntieri kritiċi—u ta’ sfida—fit-teknoloġija. Kull sena, jinstabu għexieren ta’ eluf ta’ vulnerabbiltajiet ġodda f’codebases ta’ intrapriżi u open-source. Id-difensuri jiffaċċjaw il-kompitu diffiċli li jsibu u jagħmlu patch tal-vulnerabbiltajiet qabel ma jagħmlu hekk l-avversarji tagħhom. F’OpenAI, qed naħdmu biex inxaqilbu dak il-bilanċ favur id-difensuri.
Aardvark jirrappreżenta qabża ’l quddiem fir-riċerka tal-AI u s-sigurtà: aġent awtonomu li jista’ jgħin lill-iżviluppaturi u lit-timijiet tas-sigurtà jiskopru u jirranġaw vulnerabbiltajiet tas-sigurtà fuq skala kbira. Aardvark issa huwa disponibbli f’beta privata biex nivvalidaw u nsaħħu l-kapaċitajiet tiegħu fil-prattika.
Aardvark janalizza kontinwament repożitorji tal-kodiċi sors biex jidentifika vulnerabbiltajiet, jivvaluta l-isfruttabbiltà, jipprijoritizza s-severità, u jipproponi patches immirati.
Aardvark jaħdem billi jimmonitorja commits u bidliet fil-codebases, jidentifika vulnerabbiltajiet, kif jistgħu jiġu sfruttati, u jipproponi soluzzjonijiet. Aardvark ma jiddependix fuq tekniki tradizzjonali ta’ analiżi tal-programmi bħall-fuzzing jew l-analiżi tal-kompożizzjoni tas-software. Minflok, juża raġunament imħaddem minn LLM u użu ta’ għodod biex jifhem l-imġiba tal-kodiċi u jidentifika vulnerabbiltajiet. Aardvark ifittex bugs kif jista’ jagħmel riċerkatur uman tas-sigurtà: billi jaqra l-kodiċi, janalizzah, jikteb u jmexxi testijiet, juża għodod, u aktar.
Aardvark jiddependi fuq pipeline f’diversi stadji biex jidentifika, jispjega, u jirranġa vulnerabbiltajiet:
- Analiżi: Jibda billi janalizza r-repożitorju kollu biex jipproduċi mudell tat-theddid li jirrifletti l-fehim tiegħu tal-objettivi tas-sigurtà u d-disinn tal-proġett.
- Skennjar tal-commit: Jiskennja għal vulnerabbiltajiet billi jispezzjona bidliet fil-livell tal-commit kontra r-repożitorju kollu u l-mudell tat-theddid hekk kif jiġi committed kodiċi ġdid. Meta repożitorju jiġi konness għall-ewwel darba, Aardvark jiskennja l-istorja tiegħu biex jidentifika kwistjonijiet eżistenti. Aardvark jispjega l-vulnerabbiltajiet li jsib pass pass, b’annotazzjonijiet tal-kodiċi għar-reviżjoni umana.
- Validazzjoni: Ladarba Aardvark ikun identifika vulnerabbiltà potenzjali, jipprova jqabbadha f’ambjent iżolat u sandboxed biex jikkonferma l-isfruttabbiltà tagħha. Aardvark jiddeskrivi l-passi meħuda biex jgħin jiżgura li lill-utenti jintbagħtu tagħrif preċiż, ta’ kwalità għolja, u b’rata baxxa ta’ false positives.
- Patching: Aardvark jintegra ma’ OpenAI Codex biex jgħin jirranġa l-vulnerabbiltajiet li jsib. Jehmeż patch iġġenerat minn Codex u skennjat minn Aardvark ma’ kull sejba għar-reviżjoni umana u patching effiċjenti b’klikk waħda.
Aardvark jaħdem flimkien mal-inġiniera, jintegra ma’ GitHub, Codex, u workflows eżistenti biex iwassal tagħrif ċar u azzjonabbli mingħajr ma jnaqqas l-iżvilupp. Filwaqt li Aardvark inbena għas-sigurtà, fit-testijiet tagħna sibna li jista’ wkoll jikxef bugs bħal difetti fil-loġika, soluzzjonijiet mhux kompluti, u kwistjonijiet tal-privatezza.
Aardvark ilu fis-servizz għal diversi xhur, jaħdem kontinwament fuq il-codebases interni ta’ OpenAI u dawk ta’ sħab esterni tal-alpha. Fi ħdan OpenAI, kixef vulnerabbiltajiet sinifikanti u kkontribwixxa għall-pożizzjoni difensiva ta’ OpenAI. Is-sħab enfasizzaw il-fond tal-analiżi tiegħu, b’Aardvark isib kwistjonijiet li jseħħu biss taħt kundizzjonijiet kumplessi.
Fit-testijiet tal-benchmark fuq repożitorji “golden”, Aardvark identifika 92% tal-vulnerabbiltajiet magħrufa u introdotti sintetikament, u wera recall għoli u effettività fid-dinja reali.
Aardvark ġie applikat ukoll għal proġetti open-source, fejn skopra u aħna żvelajna b’mod responsabbli bosta vulnerabbiltajiet—għaxra minnhom irċevew identifikaturi Common Vulnerabilities and Exposures (CVE).
Bħala benefiċjarji ta’ għexieren ta’ snin ta’ riċerka miftuħa u żvelar responsabbli, aħna impenjati li nagħtu lura—billi nikkontribwixxu għodod u sejbiet li jagħmlu l-ekosistema diġitali aktar sigura għal kulħadd. Nippjanaw li noffru skennjar pro-bono lil repożitorji open source mhux kummerċjali magħżula biex nikkontribwixxu għas-sigurtà tal-ekosistema tas-software open source u tal-katina tal-provvista.
Dan l-aħħar aġġornajna il-politika tagħna ta’ żvelar koordinat outbound, li tieħu pożizzjoni favur l-iżviluppaturi, iffukata fuq kollaborazzjoni u impatt skalabbli, aktar milli skedi riġidi ta’ żvelar li jistgħu jagħmlu pressjoni fuq l-iżviluppaturi. Nantiċipaw li għodod bħal Aardvark iwasslu għall-iskoperta ta’ numri dejjem akbar ta’ bugs, u rridu nikkollaboraw b’mod sostenibbli biex niksbu reżiljenza fit-tul.
Is-software issa huwa s-sinsla ta’ kull industrija—li jfisser li l-vulnerabbiltajiet tas-software huma riskju sistemiku għan-negozji, l-infrastruttura, u s-soċjetà. Aktar minn 40,000 CVE ġew irrappurtati fl-2024 biss. It-testijiet tagħna juru li madwar 1.2% tal-commits jintroduċu bugs—bidliet żgħar li jista’ jkollhom konsegwenzi sproporzjonati.
Aardvark jirrappreżenta mudell ġdid li jqiegħed lid-difensur l-ewwel: riċerkatur tas-sigurtà aġentiku li jissieħeb mat-timijiet billi jwassal protezzjoni kontinwa hekk kif il-kodiċi jevolvi. Billi jaqbad il-vulnerabbiltajiet kmieni, jivvalida l-isfruttabbiltà fid-dinja reali, u joffri soluzzjonijiet ċari, Aardvark jista’ jsaħħaħ is-sigurtà mingħajr ma jnaqqas l-innovazzjoni. Aħna nemmnu fl-espansjoni tal-aċċess għall-kompetenza fis-sigurtà. Qed nibdew b’beta privata u se nwessgħu d-disponibbiltà hekk kif nitgħallmu.
Qed nistiednu sħab magħżula biex jingħaqdu mal-beta privata ta’ Aardvark. Il-parteċipanti se jiksbu aċċess bikri u jaħdmu direttament mat-tim tagħna biex jirfinaw l-eżattezza tas-sejbien, il-workflows tal-validazzjoni, u l-esperjenza tar-rappurtar.
Qed infittxu li nivvalidaw il-prestazzjoni f’varjetà ta’ ambjenti. Jekk l-organizzazzjoni tiegħek jew il-proġett open source tiegħek hu interessat li jingħaqad, tista’ tapplika hawn.
Awtur
Kontributuri
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, u Matt Knight


