Aardvark ని పరిచయం చేస్తున్నాం: OpenAI యొక్క ఏజెంటిక్ సెక్యూరిటీ రీసెర్చర్
ఇప్పుడు ప్రైవేట్ బీటాలో: సెక్యూరిటీ రీసెర్చర్ లాగా ఆలోచించే AI ఏజెంట్, ఆధునిక సాఫ్ట్వేర్ అవసరాలను తీరుస్తూ స్కేలబుల్ గా పనిచేస్తుంది.
ఈ రోజు, GPT‑5 శక్తితో నడిచే ఏజెంటిక్ సెక్యూరిటీ రీసెర్చర్ Aardvark ను మేము ప్రకటిస్తున్నాం.
సాఫ్ట్వేర్ సెక్యూరిటీ సాంకేతిక పరిజ్ఞానంలో అత్యంత ముఖ్యం మరియు సవాళ్లతో నిండిన విభాగాలలో ఒకటి.ప్రతి సంవత్సరం, ఎంటర్ప్రైజ్ మరియు ఓపెన్-సోర్స్ కోడ్ బేస్లలో పదే పదే వేల కొత్త లోపాలు కనుగొనబడుతున్నాయి.రక్షకులు, ప్రత్యర్థులు ముందే కనిపెట్టేముందు, లోపాలను గుర్తించి, ప్యాచ్ చేయాల్సిన భయంకరమైన పనులను ఎదుర్కొంటున్నారు.OpenAIలో, రక్షకుల పక్షంలో ఆ సమతుల్యతను మార్చే విధంగా మేము పని చేస్తున్నాం.
Aardvark అనేది AI మరియు సెక్యూరిటీ పరిశోధనలో ఒక మహత్తరమైన అభివృద్ధిని సూచిస్తుంది: పెద్ద స్థాయిలో సెక్యూరిటీ లోపాలను గుర్తించి, సరిచేయడంలో డెవలపర్లను మరియు సెక్యూరిటీ టీమ్లను సహాయం చేయగల స్వతంత్ర ఏజెంట్.Aardvark ఇప్పుడు ప్రైవేట్ బీటాలో అందుబాటులో ఉంది, మైదానంలో దాని సామర్థ్యాలను వాలిడేట్ చేసి, మెరుగుపరచడానికి.
Aardvark నిరంతరం సోర్స్ కోడ్ రిపాజిటరీలను విశ్లేషిస్తుంది, లోపాలను గుర్తించడానికి, ఎక్స్ప్లోయిట్ చేయగల సామర్థ్యాన్ని అంచనా వేయడానికి, తీవ్రత ప్రాధాన్యాన్ని నిర్ణయించడానికి, మరియు లక్ష్యిత ప్యాచ్లను ప్రతిపాదించడానికి.
Aardvark కోడ్ బేస్లలో కమిట్లు మరియు మార్పులను మానిటర్ చేస్తూ పనిచేస్తుంది, లోపాలను గుర్తిస్తుంది, అవి ఎలా ఎక్స్ప్లోయిట్ చేయబడవచ్చో అంచనా వేస్తుంది, మరియు పరిష్కారాలను ప్రతిపాదిస్తుంది.Aardvark ఫజింగ్ లేదా సాఫ్ట్వేర్ కంపోజిషన్ అనాలిసిస్ వంటి సంప్రదాయ ప్రోగ్రామ్ విశ్లేషణ సాంకేతికతలపై ఆధారపడి ఉండదు.దీని స్థానంలో, కోడ్ ప్రవర్తనను అర్థం చేసుకోవడం మరియు లోపాలను గుర్తించడానికి LLM శక్తితో పనిచేసే రీజనింగ్ మరియు టూల్-యూజ్ను ఉపయోగిస్తుంది.Aardvark, ఒక మానవ సెక్యూరిటీ రీసెర్చర్ చేసినట్లే, బగ్ ల కోసం చూస్తుంది: కోడ్ చదవడం, విశ్లేషించడం, టెస్టులు రాయడం మరియు నిర్వహించడం, టూల్స్ ఉపయోగించడం, మరియు ఇతర విధానాలు.
Aardvark లోపాలను గుర్తించడం, అవి ఎందుకు జరిగాయి అని వివరణ ఇవ్వడం, మరియు వాటిని సరిచేయడం కోసం బహుస్థాయి స్టేజ్ లతో కూడిన పనితీరు పద్ధతిని ఉపయోగిస్తుంది:
- విశ్లేషణ: ప్రాజెక్ట్ యొక్క సెక్యూరిటీ లక్ష్యాలు మరియు డిజైన్ పై దాని అవగాహనను ప్రతిబింబించే థ్రెట్ మోడల్ తయారుచేయడానికి పూర్తి రిపాజిటరీని విశ్లేషించడం ప్రారంభిస్తుంది.
- కమిట్ స్కానింగ్: కొత్త కోడ్ కమిట్ అయ్యేటప్పుడు, పూర్తి రిపాజిటరీ మరియు థ్రెట్ మోడల్ ని పరిశీలించి, కమిట్-స్థాయి మార్పుల ద్వారా లోపాలను స్కాన్ చేస్తుంది.రిపాజిటరీ మొదట కనెక్ట్ చేసినప్పుడు, Aardvark దాని హిస్టరీని స్కాన్ చేసి ఇప్పటికే ఉన్న సమస్యలను గుర్తిస్తుంది.Aardvark దానివలన కనుగొన్న లోపాలను దశలవారీగా వివరించి, మానవ సమీక్ష కోసం కోడ్ లో అనోటేషన్ చేస్తుంది.
- వాలిడేషన్: ఒకసారి Aardvark ఒక సంభావ్య లోపాన్ని గుర్తిస్తే, దాని ఎక్స్ప్లోయిట్ సాధ్యకతను నిర్ధారించడానికి అది ఒక ఒంటరి, సాండ్ బాక్స్ చేయబడిన వాతావరణంలో దాన్ని ట్రిగ్గర్ చేయాలని ప్రయత్నిస్తుంది.Aardvark, యూజర్స్ కు ఖచ్చితమైన, ఉన్నత-నాణ్యత, మరియు తక్కువ ఫాల్స్-పాజిటివ్ సూత్రాలను అందించడానికి తీసుకున్న దశలను వివరిస్తుంది.
- ప్యాచింగ్: Aardvark కనుగొన్న లోపాలను సరిచేయడానికి OpenAI Codex తో ఇంటిగ్రేట్ అవుతుంది.ఇది ప్రతీ కనుగొన్న లోపానికి Codex ఉత్పత్తి చేసిన మరియు Aardvark స్కాన్ చేసిన ప్యాచ్ ను అనుసంధానం చేస్తుంది, మానవ సమీక్ష మరియు సమర్థవంతమైన, ఒక-క్లిక్ ప్యాచింగ్ కోసం.
Aardvark ఇంజినీర్లతో పాటు పనిచేస్తుంది, GitHub, Codex, మరియు ఉన్న వర్క్ ఫ్లోలతో ఇంటిగ్రేట్ అవుతూ, అభివృద్ధిని మందగించకుండా స్పష్టమైన, అమలు చేయదగిన ఇన్సైట్లను అందిస్తుంది.Aardvark సెక్యూరిటీ కోసం నిర్మించబడినప్పటికీ, మా టెస్టింగ్ లో అది లాజిక్ లోపాలు, పూర్తికాకపోయిన ఫిక్స్లు, మరియు ప్రైవసీ సమస్యల వంటి బగ్లను కూడా కనుగొనగలదని మేము గుర్తించాము.
Aardvark ఇప్పటికే కొన్ని నెలలుగా సేవలో ఉంది, OpenAI యొక్క అంతర్గత కోడ్ బేస్లు మరియు బయటి ఆల్ఫా భాగస్వాముల కోడ్ బేస్లలో నిరంతరం నడుస్తుంది.OpenAIలో, ఇది ముఖ్యమైన లోపాలను వెలికితీసింది మరియు OpenAI యొక్క రక్షణాత్మక విధానానికి సహాయపడింది.భాగస్వాములు దాని విశ్లేషణ లోతును హైలైట్ చేశారు, Aardvark కేవలం సంక్లిష్ట పరిస్థితులలోనే సంభవించే సమస్యలను కనుగొంటుంది.
“గోల్డెన్” రిపాజిటరీలపై బెంచ్ మార్క్ పరీక్షల్లో, Aardvark తెలిసిన మరియు సింథటిక్ గా సృష్టించబడిన లోపాల్లో 92% ను గుర్తించగలిగింది, ఇది ఉన్నత రీకాల్ మరియు వాస్తవ ప్రపంచంలో దీర్ఘకాలిక ప్రభావాన్ని చూపిస్తుంది.
Aardvark ను ఓపెన్-సోర్స్ ప్రాజెక్ట్లకు కూడా వర్తింపజేశాం, అక్కడ ఇది అనేక లోపాలను కనుగొని, మేము బాధ్యతాయుతంగా వెల్లడించాము—అవిలో పది కు కామన్ వల్నరబిలిటీస్ అండ్ ఎక్స్పోజర్స్ (CVE) గుర్తింపులు లభించాయి.
దశాబ్దాలపాటు జరుగుతున్న ఓపెన్ రీసెర్చ్ మరియు బాధ్యతాయుతమైన ప్రకటనల ప్రయోజనదారులుగా, మేము తిరిగి ఇవ్వడానికి కట్టుబడ్డాము—ప్రతి ఒక్కరి కోసం డిజిటల్ ఎకోసిస్టమ్ ను సురక్షితంగా మార్చే టూల్స్ మరియు కనుగొనబడిన విషయాలను అందించడం ద్వారా.మేము కొన్ని నాన్-కామర్షియల్ ఓపెన్-సోర్స్ రిపాజిటరీలకు ప్రో-బోనో స్కానింగ్ ను అందించడానికి ప్రణాళిక వున్నాం, దీని ద్వారా ఓపెన్-సోర్స్ సాఫ్ట్వేర్ ఎకోసిస్టమ్ మరియు సప్లై చైన్ సెక్యూరిటీలో సహాయపడగలమని.
మేము ఇటీవల మా అవుట్బౌండ్ సమన్వయ బహిర్గతం విధానాన్ని నవీకరించాము, ఇది డెవలపర్-స్నేహపూర్వక విధానాన్ని అనుసరిస్తూ, డెవలపర్లపై ఒత్తిడిని సృష్టించే కఠిన బహిర్గత టైమ్లైన్ల కంటే సహకారం మరియు స్కేలబుల్ ప్రభావంపై దృష్టి పెట్టింది.Aardvark వంటి టూల్స్ ఎక్కువ సంఖ్యలో బగ్ లను కనుగొనడంలో దోహదపడతాయని మేము ఊహిస్తున్నాం, మరియు దీర్ఘకాల స్థిరత్వాన్ని సాధించడానికి స్థిరమైన సహకారాన్ని కోరుతున్నాం.
సాఫ్ట్వేర్ ఇప్పుడు ప్రతి పరిశ్రమ యొక్క వెన్నెముకగా మారింది—అంటే సాఫ్ట్వేర్ లోపాలు వ్యాపారాలు, ఇన్ఫ్రాస్ట్రక్చర్ మరియు సమాజానికి ఒక వ్యవస్థాత్మక ప్రమాదం.2024 లోనే 40,000 కంటే ఎక్కువ CVE లు నివేదించబడ్డాయి.మా టెస్టింగ్ లో, సుమారు 1.2% కమిట్లు బగ్ లను పరిచయం చేస్తాయని చూపుతుంది—చిన్న మార్పులు అయినప్పటికీ పెద్ద ప్రభావాన్ని చూపవచ్చు.
Aardvark ఒక కొత్త రక్షక-మొదటి మోడల్ ను ప్రతినిధిస్తుంది: కోడ్ అభివృద్ధి చెందుతున్నప్పుడు నిరంతర రక్షణను అందించడం ద్వారా టీమ్లతో భాగస్వామ్యం చేసుకునే ఏజెంటిక్ సెక్యూరిటీ రీసెర్చర్.లోపాలను ముందుగానే గుర్తించడం, వాస్తవ ప్రపంచంలో ఎక్స్ ప్లోయిట్ సాధ్యతను వాలిడేట్ చేయడం, మరియు స్పష్టమైన పరిష్కారాలను అందించడం ద్వారా, Aardvark ఇన్నోవేషన్ ను మందగించకుండా సెక్యూరిటీని బలపరచగలదు.మేము సెక్యూరిటీ నైపుణ్యాలకు ప్రాప్యతను విస్తరించడానికి విశ్వసిస్తున్నాము.మేము ప్రైవేట్ బీటాతో ప్రారంభించాము మరియు నేర్చుకుంటూ లభ్యతను విస్తరించబోతున్నాము.
Aardvark ప్రైవేట్ బీటాలో చేరడానికి కొన్ని ఎంపిక చేసిన భాగస్వాములను మేము ఆహ్వానిస్తున్నాము.పాల్గొనేవారికి ముందుగానే ప్రాప్యత లభించి, గుర్తింపు ఖచ్చితత్వం, వాలిడేషన్ వర్క్ ఫ్లోలు, మరియు రిపోర్టింగ్ అనుభవాన్ని మెరుగుపరచడానికి మా టీమ్ తో నేరుగా పని చేసే అవకాశం ఉంటుంది.
మేము వివిధ వాతావరణాల్లో పనితీరును వాలిడేట్ చేయాలని చూస్తున్నాము.మీ సంస్థ లేదా ఓపెన్-సోర్స్ ప్రాజెక్ట్ చేరడానికి ఆసక్తి ఉంటే, మీరు ఇక్కడ అప్లై చేయవచ్చు.
రచయిత
సహకారులు
Akshay Bhat, Andy Nguyen, Dave Aitel, Harold Nguyen, Ian Brelinsky, Tiffany Citra, Xin Hu, Matt Knight


