19 Samhain 2025

Ár n-éiceachóras sábháilteachta a neartú le tástáil sheachtrach

An cur chuige atá againn i leith measúnuithe tríú páirtí ar AI teorann.

Ag lódáil…

Ag OpenAI, creidimid go bhfuil ról ríthábhachtach ag measúnuithe neamhspleácha iontaofa ó thríú páirtithe in éiceachóras sábháilteachta AI teorann a neartú. Is meastóireachtaí iad measúnuithe tríú páirtí a dhéantar ar shamhlacha teorann chun éilimh faoi chumais chriticiúla sábháilteachta agus maoluithe a dheimhniú nó chun fianaise bhreise a sholáthar ina leith. Cabhraíonn na meastóireachtaí sin le héilimh sábháilteachta a bhailíochtú, cosaint a thabhairt ar spotaí dalla, agus trédhearcacht a mhéadú maidir le cumais agus rioscaí. Trí chuireadh a thabhairt do shaineolaithe seachtracha ár samhlacha teorann a thástáil, tá sé d’aidhm againn freisin muinín a chothú i ndoimhneacht ár meastóireachtaí ar chumais agus inár gcosaintí, agus cuidiú leis an éiceachóras sábháilteachta níos leithne a ardú.

Ó seoladh GPT‑4 i leith, tá OpenAI tar éis comhoibriú le raon comhpháirtithe seachtracha chun ár samhlacha a thástáil agus a mheas. Go ginearálta, bíonn ár gcomhoibrithe le tríú páirtithe i dtrí fhoirm:

Meastóireachtaí neamhspleácha ar phríomhréimsí cumais agus riosca teorann amhail bithshlándáil, cibearshlándáil, féinfheabhsú AI, agus scéiméireacht
Athbhreithnithe modheolaíochta a mheasann an chaoi a ndéanaimid riosca a mheas agus a léirmhíniú
Promhadh ag saineolaithe ábhair (SME), ina ndéanann saineolaithe an tsamhail a mheas go díreach ar thascanna fíorshaoil SME agus ina soláthraíonn siad ionchur struchtúrtha dár measúnú ar a cumais agus ar na cosaintí gaolmhara¹

Míníonn an blag seo conas a úsáidimid gach ceann de na cineálacha sin de mheasúnú seachtrach, cén fáth a bhfuil tábhacht leo, conas a mhúnlaigh siad cinntí imlonnaithe, agus na prionsabail a úsáidimid chun na comhoibrithe sin a struchtúrú. De mheon na trédhearcachta, táimid ag roinnt níos mó freisin faoi na téarmaí rúndachta agus foilseacháin a rialaíonn ár gcomhoibrithe le tástálaithe tríú páirtí.

Cén fáth a bhfuil sé seo tábhachtach?

Cuireann measúnóirí tríú páirtí ciseal neamhspleách meastóireachta lenár gcuid oibre inmheánaí, rud a neartaíonn déine agus a sholáthraíonn cosaintí breise ar fhéin-dheimhniú. Soláthraíonn a n-ionchur fianaise bhreise in éineacht lenár measúnuithe féin, rud a chabhraíonn le cinntí freagracha imlonnaithe do chórais chumhachtacha a threorú.

Feicimid measúnuithe tríú páirtí freisin mar chuid de éiceachóras sábháilteachta athléimneach a thógáil⁠. Déanann ár bhfoirne tástáil inmheánach fhairsing ar fud réimsí cumais agus riosca, ach tugann eagraíochtaí neamhspleácha peirspictíochtaí agus cur chuige modheolaíochta breise leo. Oibrímid chun tacú le grúpa éagsúil d’eagraíochtaí measúnóirí cáilithe ar féidir leo samhlacha teorann a mheas go rialta in éineacht linn.

Ar deireadh, tá sé d’aidhm againn a bheith trédhearcach faoin gcaoi a gcabhraíonn an t-ionchur seo lenár bpróiseas sábháilteachta a mhúnlú. Déanaimid measúnuithe tríú páirtí a phoibliú go rialta—mar shampla, trí achoimrí ar mheastóireachtaí réamh-imlonnaithe a chur i gcártaí córais, agus trí thacú le heagraíochtaí measúnóirí obair níos mionsonraithe a fhoilsiú tar éis athbhreithniú rúndachta agus cruinnis. Cothaíonn an trédhearcacht seo muinín trí léiriú a thabhairt ar an gcaoi a múnlaíonn ionchur seachtrach ár meastóireachtaí ar chumais agus ár gcosaintí.

Cabhraíonn caidrimh bhuana atá tógtha ar rochtain iontaofa, trédhearcacht agus comhroinnt eolais leis an éiceachóras ar fad fanacht chun tosaigh ar rioscaí atá ag teacht chun cinn agus measúnuithe solúbtha, praiticiúla a chothú atá de dhíth le haghaidh caighdeán níos láidre agus rialachas níos eolasaí do chórais AI teorann.

Meastóireachtaí neamhspleácha ag saotharlanna seachtracha

Ag tosú le seoladh GPT‑4⁠(osclaíonn i bhfuinneog nua), thacaíomar le meastóireachtaí neamhspleácha ar sheicphointí luatha samhlacha sular imlonnaíodh iad. Ón am sin i leith, tá ár gcuid oibre leathnaithe againn le raon eagraíochtaí tríú páirtí a bhfuil saineolas domhain acu i meastóireachtaí do phríomhréimsí cumais agus riosca teorann. Sainímid obair neamhspleách saotharlainne mar thástáil oscailte ina gcuireann foirne seachtracha a modhanna féin i bhfeidhm chun teacht ar éileamh nó ar mheasúnú a bhaineann le cumas teorann ar leith.

Mar shampla, i gcás GPT‑5⁠, rinne OpenAI comhordú ar shraith leathan measúnuithe seachtracha ar chumais ar fud príomhréimsí riosca amhail neamhspleáchas fadtéarmach, scéiméireacht, meabhlaireacht agus sárú maoirseachta, indéantacht phleanáil saotharlainne fliche, agus meastóireachtaí ionsaitheacha cibearshlándála.

Forlíonann na meastóireachtaí neamhspleácha seo na meastóireachtaí a dhéantar de réir Creata Ullmhachta OpenAI, agus áirítear leo tagarmharcanna amhail meastóireacht amafhairsinge⁠(osclaíonn i bhfuinneog nua) METR nó meastóireacht Virology Capabilities Test (VCT)⁠(osclaíonn i bhfuinneog nua) SecureBio.

Chun tacú leis na meastóireachtaí seo, sholáthraíomar rochtain shlán ar sheicphointí luatha samhlacha, torthaí meastóireachta roghnaithe chun na feabhsuithe cumais atá á bhfeiceáil againn a dhéanamh níos nithiúla, coinneáil sonraí nialasach nuair ba ghá, agus samhlacha a raibh níos lú maoluithe orthu. Mar shampla, rinne eagraíochtaí a bhí ag tástáil sna réimsí cibearshlándála agus bithshábháilteachta samhlacha a thástáil le maoluithe sábháilteachta agus gan iad chun na bunchumais a fhiosrú. Fuair roinnt eagraíochtaí eile rochtain dhíreach ar an tsraith smaointe chun cur ar a gcumas rianta réasúnaíochta na samhla a iniúchadh. Cheadaigh an chéim mhéadaithe trédhearcachta seo do mheasúnóirí cásanna de mhála gainimh² nó d’iompar scéiméireachta a aithint nach bhféadfaí a bhrath ach amháin trí shraith smaointe a léamh. Cuireadh rochtain ar fáil agus rialuithe slándála i bhfeidhm, agus leanaimid de na rialuithe sin a nuashonrú de réir mar a fhorbraíonn cumais samhlacha agus riachtanais tástála.

Athbhreithniú modheolaíochta

I gcomhthéacsanna áirithe, tá measúnóirí seachtracha i suíomh maith chun athbhreithniú modheolaíochta a sholáthar, rud a thugann peirspictíochtaí breise ar na creataí agus ar an bhfianaise a mbraitheann saotharlanna teorann orthu chun riosca a mheas. Mar shampla, le linn sheoladh gpt-oss⁠, d’úsáideamar mionchoigeartú frithbheartaíoch chun cumais sa chás ba mheasa a mheas do shamhlacha meáchain oscailte, mar a thuairiscítear in Estimating worst case frontier risks of open weight LLMs⁠. Ba í an phríomhcheist sábháilteachta an bhféadfadh drochghníomhaí an tsamhail a mhionchoigeartú chun cumas Ard a bhaint amach i réimsí amhail bith nó cibear faoi ár gCreata Ullmhachta. Toisc go raibh gá le mionchoigeartú frithbheartaíoch dian ar acmhainní chuige seo, thugamar cuireadh do mheasúnóirí tríú páirtí athbhreithniú a dhéanamh ar ár modhanna agus torthaí inmheánacha agus moltaí a dhéanamh fúthu seachas obair chomhchosúil a athdhéanamh.

Bhí próiseas ilseachtainí i gceist leis seo ina roinneadh cur i bhfeidhm meastóireachta, sonraí faoin gcur chuige i leith mionchoigeartaithe frithbheartaigh, agus inar bailíodh moltaí struchtúrtha faoi fheabhsú na modheolaíochta agus na meastóireachtaí do na rioscaí teorann sa chás ba mheasa. Tháinig athruithe ar an bpróiseas deiridh mionchoigeartaithe frithbheartaigh as aiseolas na measúnóirí agus léirigh sé luach an deimhnithe mhodheolaíochta. Thaifeadamar cé na míreanna a ghlacamar sa pháipéar agus sa chárta córais do gpt-oss, agus thugamar cúiseanna leo siúd nár ghlacamar leo.

Anseo, ba é athbhreithniú modheolaíochta an rogha cheart seachas meastóireachtaí neamhspleácha: bhí i gceist leis na meastóireachtaí turgnaimh mhórscála sa chás ba mheasa a reáchtáil, rud a éilíonn bonneagar agus saineolas teicniúil nach mbíonn ar fáil go coitianta lasmuigh de mhórshaotharlanna AI. Chiallaigh sé sin gur dócha nach mbeadh meastóireachtaí neamhspleácha in ann léargais dhíreacha a thabhairt ar chásanna sa chás ba mheasa, agus bhí sé níos táirgiúla measúnóirí seachtracha a dhíriú ar dheimhniú na n-éileamh. Rinne measúnóirí seachtracha athbhreithniú ar na modhanna agus ar an bhfianaise⁠(osclaíonn i bhfuinneog nua), ag tarraingt aird ar bhearnaí ábhartha don chinnteoireacht a ndearnadh aghaidh orthu mar chuid den lúb aiseolais moltaí. Tá súil againn an cur chuige seo a leathnú chuig bealaí eile ina mbíonn rochtain nó riachtanais bhonneagair ina gcúis go mbíonn sé neamhphraiticiúil do thríú páirtí meastóireachtaí a reáchtáil go díreach é féin, nó nach mbíonn meastóireachtaí seachtracha ann fós.

Promhadh ag saineolaithe ábhair (SME)

Bealach eile ina dtéimid i dteagmháil le saineolaithe seachtracha ná trí phromhadh ag saineolaithe ábhair (SME), ina ndéanann saineolaithe an tsamhail a mheas go díreach agus ina soláthraíonn siad ionchur struchtúrtha trí shuirbhéanna dár measúnú ar a cumais. Tá sé seo éagsúil ó mhodh na foirne deirge⁠, a bhfuil sé mar aidhm aige cosaintí sonracha a bhrú-thástáil. Ligeann sé seo dúinn meastóireachtaí an Chreata Ullmhachta a fhorlíonadh le léargais shainréimse a léiríonn breithiúnas saineolaithe agus comhthéacs an fhíorshaoil nach mb’fhéidir go ngabhfadh meastóireachtaí statacha leo féin. Mar shampla, thugamar cuireadh do phainéal saineolaithe ábhair samhail chuiditheach amháin³ a úsáid chun a gcásanna bith deireadh go deireadh féin a thriail do ChatGPT Agent agus GPT‑5. Rinne siad scóráil ar an méid a d’fhéadfadh an tsamhail saineolaí cosúil leo féin a ardú i gcomparáid le tosaitheoir nach raibh chomh taithí céanna aige, bunaithe ar úsáideacht na treorach a chuir sí ar fáil ina gcásanna. Ba é an sprioc ionchur breise a bhailiú ar cé chomh maith agus a d’fhéadfadh an córas tosaitheoir spreagtha a thabhairt i bhfad níos gaire d’fheidhmiú inniúil: rinne SMEanna brú-thástáil ar ár n-éilimh faoi “ardú tosaitheora” faoi shreafaí oibre réadúla a cheap siad féin agus thug siad aiseolas mion ar na háiteanna ar sholáthair an tsamhail cabhair shubstaintiúil céim ar chéim i gcomparáid le hachoimrí nach raibh chomh cabhrach. Cuireadh an cleachtadh promhaidh saineolaithe seo san áireamh mar chuid den mheasúnú foriomlán le haghaidh imlonnú na samhlacha seo, agus comhroinneadh é i gcártaí córais don dá sheoladh.

Cad a dhéanann comhoibriú measúnaithe tríú páirtí rathúil?

De mheon na trédhearcachta, táimid ag roinnt níos mó faoi na rudaí a n-aontaíonn measúnóirí tríú páirtí leo nuair a oibríonn siad linn, agus na prionsabail a threoraíonn ár gcomhoibrithe:

Trédhearcacht le teorainneacha cúramacha rúndachta: Síníonn measúnóirí tríú páirtí comhaontuithe neamhnochta chun gur féidir faisnéis rúnda neamhphoiblí a roinnt chun tacú lena measúnuithe. In Aguisín⁠ an phoist seo, cuirimid sleachta ábhartha ó chonarthaí le measúnóirí tríú páirtí san áireamh a leagann amach cearta maidir le foilsiú agus ionchais maidir le hathbhreithniú. Oibrímid ar phrionsabal na trédhearcachta agus déanaimid ár ndícheall foilsiú a chumasú a chuireann tuiscint ar shábháilteacht agus ar mheastóireachtaí gaolmhara chun cinn gan faisnéis rúnda ná maoin intleachtúil a chur i mbaol. Mar chuid de seo, déanaimid athbhreithniú agus formheas ar fhoilseacháin ó mheasúnuithe tríú páirtí chun rúndacht agus cruinneas fíorasach araon a chinntiú. Le cúpla bliain anuas, tá roinnt measúnóirí tríú páirtí tar éis a gcuid oibre a fhoilsiú in éineacht lenár bhfoilsiú féin ar achoimrí measúnaithe i gcártaí córais. I measc roinnt samplaí d’obair atá foilsithe tar éis dúinn í a athbhreithniú maidir le rúndacht agus cruinneas tá: [tuarascáil GPT‑5 METR ⁠(osclaíonn i bhfuinneog nua), tuarascáil Apollo Research ar OpenAI o1⁠(osclaíonn i bhfuinneog nua), Measúnú GPT‑5 Irregular⁠(osclaíonn i bhfuinneog nua)]
Nochtadh faisnéise machnamhach agus rochtain shlán, íogair: De réir réamhshocraithe, soláthraímid faisnéis agus rochtain ar shamhlacha atá ceaptha a bheith poiblí nó réidh don táirgeadh. Nuair is gá sin do na meastóireachtaí, soláthraímid rochtain níos doimhne, amhail ar shamhlacha cuiditheacha amháin nó ar fhaisnéis neamhphoiblí. Tá na cineálacha rochtana seo curtha ar fáil ag OpenAI nuair ba ghá do cheisteanna criticiúla sábháilteachta do mheasúnóirí tríú páirtí. Rud tábhachtach, éilíonn na cineálacha rochtana íogaire seo bearta dochta slándála, agus leanaimid de na rialuithe sin a nuashonrú de réir mar a fhorbraíonn cumais samhlacha agus riachtanais tástála.
Dreasachtaí airgeadais cothromaithe: Creidimid go bhfuil sé tábhachtach a chinntiú go bhfuil éiceachóras an mheasúnaithe tríú páirtí maoinithe go maith agus inbhuanaithe. Dá bhrí sin, cuirimid cúiteamh ar fáil dár measúnóirí tríú páirtí go léir, agus roghnaíonn cuid acu é a dhiúltú ag brath ar fhealsúnacht a n-eagraíochta ina thaobh seo. I measc na gcineálacha cúitimh tá íocaíocht dhíreach as obair agus/nó fóirdheonú ar chostais úsáide samhlacha trí chreidmheasanna API nó ar bhealach eile. Ní bhíonn aon íocaíocht riamh ag brath ar thorthaí measúnaithe tríú páirtí.

I dteannta a chéile, cabhraíonn na tosca seo le measúnuithe tríú páirtí faisnéis íogair a chosaint agus trédhearcacht i sábháilteacht AI a chothú, agus cruthaíonn siad bealaí le go bhfaighidh measúnóirí tríú páirtí cúiteamh as a gcuid ama.

Ag féachaint chun cinn

Ag féachaint chun cinn, feicimid go bhfuil gá le héiceachóras na n-eagraíochtaí atá in ann measúnuithe inchreidte, ábhartha don chinnteoireacht ar chórais AI teorann a dhéanamh a neartú tuilleadh. Éilíonn meastóireacht éifeachtach tríú páirtí saineolas speisialaithe, maoiniú cobhsaí, agus déine mhodheolaíochta. Beidh infheistíocht leanúnach in eagraíochtaí measúnóirí cáilithe, dul chun cinn san eolaíocht tomhais, agus slándáil do rochtain íogair riachtanach chun a chinntiú gur féidir le measúnuithe coinneáil suas le dul chun cinn i gcumais samhlacha.

Bealach amháin ina dtugaimid peirspictíocht sheachtrach isteach inár gcuid oibre sábháilteachta is ea measúnuithe tríú páirtí, agus oibríonn siad taobh le meicníochtaí eile. Comhoibrímid le saineolaithe seachtracha freisin trí iarrachtaí struchtúrtha modh na foirne deirge, tionscadail ailínithe chomhchoitinn⁠, obair leis an U.S. CAISI agus UK AISI⁠, agus grúpaí comhairleacha amhail ár Líonra Domhanda Lianna⁠ agus ár Comhairle Saineolaithe ar Fholláine agus AI⁠ chun cabhrú lenár gcuid oibre ar mheabhairshláinte agus folláine úsáideoirí a threorú. Cuireann na hiarrachtaí seo cineálacha éagsúla saineolais ar fáil agus tacaíonn siad le bunús níos leithne agus níos iontaofa chun córais ardleibhéil AI a mheas agus a rialú.

Aguisín

Seo a leanas sleachta léiritheacha ó ár gcomhaontuithe le tríú páirtithe atá ag comhoibriú linn ar mheasúnuithe réamh-imlonnaithe.

Research Publications: [...] Hereunder, Supplier hereby retains, or OpenAI licenses back to Supplier, as applicable, the right to use the Supplier Work Product created or discovered by Supplier for research, academic publication, scientific and/or educational purposes, provided such uses (a) are not commercial in nature, (b) do not disclose OpenAI’s Confidential Information (except as expressly permitted in advance by OpenAI in writing) and (c) are submitted to OpenAI for review and approval in writing prior to any publication or disclosure. OpenAI’s “Confidential Information” includes without limitation OpenAI’s Non-Public Models and outputs thereof, including any Supplier Work Product that was created or discovered through use of the. Non-Public Models. “Non-Public Models” means OpenAI’s artificial intelligence and machine learning models, including versions and snapshots thereof, that have not been released to the general public at the time of Supplier’s proposed publication date.

Confidential Information. For purposes of this Agreement, “Confidential Information” means and will include: (i) any information, materials or knowledge regarding OpenAI and its business, financial condition, products, programming techniques, customers, suppliers, technology or research and development that is disclosed to Supplier or to which Supplier has or obtains access in connection with performing Services; (ii) the Supplier Work Product; and (iii) the terms and conditions of this Agreement. Confidential Information will not include any information that: (a) is or becomes part of the public domain through no fault of Supplier or any representative or agent of Supplier; (b) is demonstrated by Supplier to have been rightfully in Supplier’s possession at the time of disclosure, without restriction as to use or disclosure; or (c) Supplier rightfully receives from a third party who has the right to disclose it and who provides it without restriction as to use or disclosure. Supplier agrees to hold all Confidential Information in strict confidence, not to use it in any way, commercially or otherwise, other than to perform Services for OpenAI, and not to disclose it to others. Supplier further agrees to take all actions reasonably necessary to protect the confidentiality of all Confidential Information including, without limitation, implementing and enforcing procedures to minimize the possibility of unauthorized use or disclosure of Confidential Information.

Without granting any right or license, the Disclosing Party agrees that the foregoing shall not apply with respect to (a) any information after 2 years following the disclosure thereof, except for any information that is a trade secret, which shall remain subject to the confidentiality obligations of this Agreement for as long as it is a trade secret, (b) any information included in a Researcher’s noncommercial research or academic publication to the extent such information is either (i) approved in writing by OpenAI prior to publication or (ii) resulting from the version of OpenAI Technology that has been made generally available to the public by OpenAI (and not, for the avoidance of doubt, any information, results, or output from version of the OpenAI Technology that were not made generally available to the public); or (c) any information that the Receiving Party can document (i) is or becomes (through no improper action or inaction by the Receiving Party or any affiliate, agent, consultant or employee of the Receiving Party) generally available to the public, (ii) was in its possession or known by it without restriction prior to receipt from the Disclosing Party, (iii) was rightfully disclosed to it by a third party without restriction, or (iv) was independently developed without use of any Proprietary Information of the Disclosing Party by officers, directors, employees, consultants, representatives, advisors or affiliates of the Receiving Party who have had no access to any such Proprietary Information. The Receiving Party may make disclosures required by law or court order provided the Receiving Party uses diligent reasonable efforts to limit disclosure and to obtain confidential treatment or a protective order and allows the Disclosing Party to participate in the proceeding.

2025

Údar

OpenAI

Fonótaí

1
Tá sé seo éagsúil ó mhodh na foirne deirge, a bhfuil sé d’aidhm aige cosaintí a bhrú-thástáil go mionsonrach agus sonraí a sholáthar d’fhorbairt meastóireachta.
2
Nuair a fheidhmíonn samhail d’aon ghnó faoi bhun a hacmhainne nó a cheiltíonn sí a fíorchumais nuair a thugann sí faoi deara go bhfuil sí á meas nó á tástáil.
3
Freagraíonn samhlacha cuiditheacha amháin d’aon iarratas, fiú má tá an t-iarratas díobhálach. Cruthaítear iad seo le modhanna iaroiliúna a bhaineann an t-iompar seo amach.

Lean ort ag léamh

Féach gach rud

Safety and alignment in an era of long-horizon models

Sábháilteacht20 Iúil 2026

Why teens deserve access to safe AI — card image

Cén fáth a bhfuil rochtain ar IS shábháilte tuillte ag déagóirí

Sábháilteacht16 Iúil 2026

GPT-Red: Unlocking Self-Improvement for Robustness

Sábháilteacht15 Iúil 2026