Léim go dtí an príomhábhar
OpenAI

18 Feabhra 2026

TaighdeFoilsiú

Ag cur EVMbench i láthair

Conarthaí cliste a dhéanamh níos sábháilte trí chumas gníomhairí AI a mheas chun leochaileachtaí i dtimpeallachtaí blocshlabhra a aimsiú, a phaisteáil agus a shaothrú.

Ag lódáil…

Cosnaíonn conarthaí cliste níos mó ná $100B d’acmhainní criptea foinse oscailte go rialta. De réir mar a fheabhsaíonn gníomhairí AI ar chód a léamh, a scríobh agus a fheidhmiú, éiríonn sé níos tábhachtaí a gcumas a thomhas i dtimpeallachtaí a bhfuil fíorbhrí eacnamaíoch leo, agus úsáid chórais AI a spreagadh ar bhealach cosantach chun conarthaí imlonnaithe a iniúchadh agus a neartú.

In éineacht le Paradigm(osclaíonn i bhfuinneog nua), táimid ag cur EVMbench i láthair, tagarmharc a dhéanann measúnú ar chumas gníomhairí AI leochaileachtaí tromchúiseacha i gconarthaí cliste a aimsiú, a phaisteáil agus a shaothrú. Tarraingíonn EVMbench ar 117 leochaileacht coimeádta ó 40 iniúchadh, agus fuarthas an chuid is mó díobh ó chomórtais oscailte iniúchta cóid. Cuimsíonn EVMbench freisin roinnt cásanna leochaileachta a tógadh ó phróiseas iniúchta slándála an bhlocshlabhra Tempo(osclaíonn i bhfuinneog nua), L1 saincheaptha a dearadh chun íocaíochtaí ard-tréchuir ar chostas íseal trí stábla-airgeadraí a chumasú. Leathnaíonn na cásanna seo an tagarmharc chuig cód conarthaí cliste atá dírithe ar íocaíochtaí, áit a mbeimid ag súil go bhfásfaidh íocaíochtaí gníomhairí le stábla-airgeadraí, agus cabhraíonn siad lena fhréamhú i réimse atá ag teacht chun cinn agus a bhfuil tábhacht phraiticiúil leis.

Chun ár dtimpeallachtaí tascanna a chruthú, d’oiríomar tástálacha saothraithe cruthúnais coincheapa agus scripteanna imlonnaithe a bhí ann cheana, nuair a bhí siad ann, agus scríobhamar iad de láimh murach sin. Don mhód paiste, chinntíomar gur féidir na leochaileachtaí a shaothrú agus gur féidir iad a mhaolú gan athruithe a thabhairt isteach a bhrisfeadh tiomsú, rud a chuirfeadh ár socrú i mbaol. Don mhód saothraithe, scríobhamar grádálaithe saincheaptha agus rinneamar deargfhoireann ar na timpeallachtaí mar iarracht modhanna a aimsiú agus a phaisteáil trína bhféadfadh gníomhaire an grádálaí a mhealladh. Chomh maith le rialú cáilíochta tascanna trí shaineolas fearainn a chuir Paradigm ar fáil, d’úsáideamar gníomhairí uathoibrithe iniúchta tascanna chun cabhrú le fónta ár dtimpeallachtaí a fheabhsú.

Déanann EVMbench measúnú ar thrí mhodh cumais:

  • Aimsigh: Déanann gníomhairí iniúchadh ar stór conarthaí cliste agus déantar iad a scóráil bunaithe ar aisghlaoch leochaileachtaí fíoraithe agus ar na luaíochtaí iniúchta gaolmhara.
  • Paisteáil: Athraíonn gníomhairí conarthaí leochaileacha agus ní mór dóibh an fheidhmiúlacht atá beartaithe a chaomhnú agus an inshaothraitheacht a dhíothú, rud a fhíoraítear le tástálacha uathoibrithe agus seiceálacha saothraithe.
  • Saothraigh: Déanann gníomhairí ionsaithe ceann go ceann chun cistí a dhraenáil i gcoinne conarthaí imlonnaithe ar thimpeallacht bhlocshlabhra bhosca gainimh, agus déantar an grádú go ríomhchláraithe trí idirbhearta a athsheinm agus fíorú ar slabhra.

Chun tacú le measúnú oibiachtúil agus in-atáirgthe, d’fhorbraíomar úim bunaithe ar Rust a imlonnaíonn conarthaí, a athsheinneann idirbhearta gníomhairí go cinntitheach, agus a chuireann srian ar mhodhanna RPC neamhshábháilte. Ritheann tascanna saothraithe i dtimpeallacht áitiúil Anvil atá scoite amach seachas ar líonraí beo, agus is leochaileachtaí stairiúla iad na leochaileachtaí agus tá siad doiciméadaithe go poiblí.

Déanaimid measúnú ar ghníomhairí teorainn thar na trí mhodh ar fad. Sa mhód ‘saothraigh’, baineann GPT‑5.3‑Codex atá ag rith trí Codex CLI scór 71.0% amach. Léiríonn sé seo borradh suntasach ar shamhlacha roimhe seo, amhail GPT‑5, a fhaigheann scór 33.3% agus a eisíodh beagán os cionn sé mhí ó shin. Tá rátaí ratha an aisghlao aimsithe agus an phaisteála fós faoi bhun clúdach iomlán, mar go bhfuil codán mór de na leochaileachtaí fós deacair do ghníomhairí a aimsiú agus a cheartú.

Nochtann EVMbench difríochtaí spéisiúla freisin in iompar samhlacha idir tascanna. Feidhmíonn gníomhairí is fearr sa suíomh saothraithe, áit a bhfuil an cuspóir follasach: lean den atriall go dtí go ndraenáiltear cistí. I gcodarsnacht leis sin, tá feidhmíocht níos laige ar thascanna aimsithe agus paisteála. I ‘aimsigh’, stopann gníomhairí uaireanta tar éis saincheist amháin a aithint seachas an bunchód iomlán a iniúchadh go hiomlán. I ‘paisteáil’, tá sé fós dúshlánach feidhmiúlacht iomlán a choinneáil agus leochaileachtaí caolchúiseacha á mbaint.

Teorainneacha

Ní léiríonn EVMbench deacracht iomlán shlándáil conarthaí cliste sa saol fíor. Tógadh na leochaileachtaí a cuireadh san áireamh ó chomórtais iniúchta Code4rena. Cé go bhfuil siad seo réadúil agus tromchúiseach, déantar i bhfad níos mó grinnscrúdaithe ar go leor conarthaí criptea atá imlonnaithe go trom agus in úsáid go forleathan agus d’fhéadfadh sé a bheith níos deacra iad a shaothrú.

Tá ár gcóras grádála láidir ach neamhfhoirfe. Sa mhód ‘aimsigh’, seiceálaimid an n-aimsíonn an gníomhaire na leochaileachtaí céanna a d’aithin iniúchóirí daonna. Má aithníonn an gníomhaire saincheisteanna breise, níl bealach iontaofa againn faoi láthair lena chinneadh an ionann iad agus fíorleochaileachtaí a chaill daoine nó dearfaí bréagacha.

Tá teorainneacha struchtúracha sa suíomh ‘saothraigh’ freisin. Déantar idirbhearta a athsheinm go seicheamhach sa choimeádán grádála, mar sin tá iompraíochtaí a bhraitheann ar mheicnic bheacht ama lasmuigh den scóip. Is ásc glan áitiúil Anvil é staid an tslabhra seachas forc den mhainnet, agus faoi láthair ní thacaímid ach le timpeallachtaí slabhra aonair. I gcásanna áirithe éilíonn sé seo conarthaí bréige in ionad imlonnuithe mainnet.

Cén fáth a bhfuil tábhacht leis seo

Cosnaíonn conarthaí cliste billiúin dollar in acmhainní, agus is dócha go mbeidh gníomhairí AI bunathraitheach d’ionsaitheoirí agus do chosantóirí araon. Cabhraíonn cumas samhlacha a thomhas sa réimse seo le rioscaí cibear atá ag teacht chun cinn a rianú agus le béim a chur ar a thábhachtaí atá sé córais AI a úsáid go cosantach chun conarthaí imlonnaithe a iniúchadh agus a neartú.

Tá EVMbench beartaithe mar uirlis tomhais agus mar ghlao chun gnímh araon. De réir mar a fheabhsaíonn gníomhairí, éiríonn sé níos tábhachtaí d’fhorbróirí agus do thaighdeoirí slándála iniúchadh le cúnamh AI a ionchorprú ina sreafaí oibre.

Le míonna beaga anuas, tá gnóthachain shuntasacha feicthe againn i bhfeidhmíocht samhlacha ar thascanna cibearshlándála, rud a théann chun tairbhe d’fhorbróirí agus do ghairmithe slándála araon. I gcomhthreo leis sin, táimid ag ullmhú cosaintí cibear neartaithe chun tacú le húsáid chosantach agus le hathléimneacht níos leithne an éiceachórais.

Toisc go bhfuil cibearshlándáil dé-úsáideach ó nádúr, táimid ag glacadh cur chuige atriallach atá bunaithe ar fhianaise a chuireann dlús le cumas cosantóirí leochaileachtaí a aimsiú agus a cheartú agus a mhoillíonn mí-úsáid. Áirítear lenár maoluithe oiliúint sábháilteachta, monatóireacht uathoibrithe, rochtain iontaofa ar ardchumais, agus píblínte forfheidhmithe lena n-áirítear faisnéis bhagartha.

Táimid ag infheistiú i gcosaintí éiceachórais, mar shampla béite phríobháideach Aardvark, ár ngníomhaire taighde slándála, a leathnú, agus ag comhpháirtiú le cothaitheoirí foinse oscailte chun scanadh bunchóid saor in aisce a sholáthar do thionscadail a úsáidtear go forleathan.

Ag tógáil ar ár gClár Deontas Cibearshlándála a seoladh in 2023, táimid ag gealladh freisin $10M i gcreidmheasanna API chun cosaint chibear a luathú lenár samhlacha is cumasaí, go háirithe do bhogearraí foinse oscailte agus do chórais bonneagair chriticiúil. Is féidir le heagraíochtaí atá páirteach i dtaighde slándála de mheon macánta iarratas a dhéanamh ar chreidmheasanna API agus ar thacaíocht trínár gClár Deontas Cibearshlándála.

Scaoilimid tascanna, uirlisí agus creat measúnaithe EVMbench chun tacú le taighde leanúnach ar chumais chibear AI atá ag teacht chun cinn a thomhas agus a bhainistiú.