Conas is féidir le hadmhálacha samhlacha teanga a choinneáil macánta
Táimid ag roinnt modh luath chruthúnais choincheapa a chuireann oiliúint ar shamhlacha a thuairisciú nuair a bhriseann siad treoracha nó a ghlacann siad aicearraí neamhbheartaithe.
Tá córais AI ag éirí níos cumasaí, agus ba mhaith linn iad a thuiscint chomh domhain agus is féidir—lena n-áirítear conas agus cén fáth a sroicheann siad freagra. Uaireanta glacann samhail aicearra nó déanann sí barrfheabhsú ar an gcuspóir mícheart, ach fós féin bíonn cuma cheart ar a haschur deiridh. Más féidir linn a chur in iúl nuair a tharlaíonn sé sin, is féidir linn monatóireacht níos fearr a dhéanamh ar chórais imlonnaithe, oiliúint a fheabhsú, agus muinín sna haschuir a mhéadú.
Tá sé léirithe ag taighde ó OpenAI agus ó dhaoine eile gur féidir le samhlacha AI siabhránachtaí a dhéanamh, an luaíocht a hacáil, nó a bheith mímhacánta. Faoi láthair, ní fheicimid na mí-iompraíochtaí is mó imní, amhail plotaireacht(osclaíonn i bhfuinneog nua), ach i strus-thástálacha agus i measúnuithe contrártha. Ach de réir mar a éiríonn samhlacha níos cumasaí agus níos gníomhaire, bíonn fiú cineálacha neamhchoigeartaithe neamhchoitianta níos iarmhartaí, rud a spreagann sinn chun infheistíocht a dhéanamh i modhanna a chabhraíonn linn na rioscaí sin a bhrath, a thuiscint agus a mhaolú níos fearr.
Scrúdaíonn an obair seo cur chuige amháin dá leithéid: oiliúint a chur ar shamhlacha a admháil go sainráite nuair a ghlacann siad páirt in iompar neamh-inmhianaithe—teicníc ar a dtugaimid admhálacha.
Is éard is admháil ann ná dara haschur, ar leithligh ó phríomhfhreagra na samhla don úsáideoir. Déantar an príomhfhreagra a mheas thar go leor toiseanna—cruinneas, stíl, cabhracht, comhlíonadh, sábháilteacht, agus tuilleadh, agus úsáidtear na comharthaí ilghnéitheacha seo chun oiliúint a chur ar shamhlacha freagraí níos fearr a tháirgeadh. I gcodarsnacht leis sin, déantar an admháil a mheas agus a oiliúint ar rud amháin amháin: macántacht. Ag fáil iasachta ó struchtúr an fhaoiseamh, ní úsáidtear aon rud a deir an tsamhail ina hadmháil ina coinne le linn na hoiliúna. Má admhaíonn an tsamhail go macánta gur hacáil sí tástáil, gur chuir sí faoi rún í féin, nó gur sháraigh sí treoracha, méadaíonn an admháil sin a luaíocht seachas í a laghdú. Is é an cuspóir an tsamhail a spreagadh chun tuairisciú go dílis ar an méid a rinne sí i ndáiríre.
Inár dtástálacha, fuaireamar amach go bhfeabhsaíonn an modh admhálacha infheictheacht mhí-iompair na samhla go suntasach. Ar an meán trasna ár measúnuithe a dearadh chun mí-iompraíochtaí a spreagadh, níl dóchúlacht na “ndiúltach bréagach” (i.e., nach gcomhlíonann an tsamhail treoracha agus ansin nach n-admhaíonn sí é) ach 4.4%.
Cruinneas ár samhla admhálacha “cruthúnas coincheapa” ar roinnt tacair sonraí chontrártha. Déantar torthaí a chatagóiriú mar chomhlíon agus níor admhaigh (diúltach fíor), chomhlíon agus d’admhaigh (dearfach bréagach), níor chomhlíon agus níor admhaigh (diúltach bréagach), agus níor chomhlíon agus d’admhaigh (dearfach fíor).

Agus leid úsáideora ann, tá na ceithre thoradh fhéideartha bunaithe ar an gcomhcheangal de (1) cibé an bhfuil freagra na samhla comhlíontach (“maith”) nó neamhchomhlíontach (“olc”), agus (2) cibé an maíonn an admháil comhlíonadh nó neamhchomhlíonadh. Feicimid go ginearálta go bhfuil seans an-ard ann go mbíonn admhálacha cruinn, agus thairis sin is gnách go mbíonn botúin admhála neamhdhíobhálach, agus mar gheall ar mhearbhall macánta seachas ar iarracht d’aon ghnó daoine a chur amú.
Is éard is admháil ann ná féinthuairisc ón tsamhail ar cé chomh maith agus a chomhlíon sí spiorad agus litir na dtreoracha nó na mbeartas follasach agus intuigthe a tugadh di, agus an raibh aon chásanna ann inar “ghearr sí coirnéil” nó inar “hacáil” sí, inar sháraigh sí beartais, nó inar theip uirthi ar bhealach ar bith ar ionchais a bhaint amach. Inár dtaighde, feicimid gur féidir samhlacha a oiliúint le bheith oscailte ina dtuairisciú ar a laigí féin. Chuireamar oiliúint ar leagan de GPT‑5 Thinking chun admhálacha a tháirgeadh, agus rinneamar measúnú air ar roinnt tacair sonraí strus-thástála as dáileadh a dearadh chun iompraíochtaí amhail plotaireacht, hacáil, sárú treoracha, agus siabhránachtaí a spreagadh. Fuaireamar amach go bhfuil an-dóchúlacht ann go n-admhóidh an tsamhail iad fiú nuair a ghlacann sí páirt sna hiompraíochtaí neamh-inmhianaithe seo. Léiríonn an figiúr thuas go bhfuil an cur chuige admhála éifeachtach go forleathan trasna réimse éagsúil tacar sonraí agus tascanna.
Tar éis aon idirghníomhaíocht idir an t-úsáideoir agus an tsamhail a chríochnaíonn le freagra samhla, is féidir admháil a iarraidh trí “theachtaireacht chórais” a sheoladh chuig an tsamhail a threoraíonn an tsamhail chun tuairisc admhála a sholáthar. Baineann an tuairisc leis an bhfreagra deireanach ón tsamhail, agus áirítear inti (1) liosta na dtreoracha, na srianta agus na gcuspóirí follasacha agus intuigthe ar fad ar cheart don fhreagra seo a bheith comhlíonta acu, (2) anailís mhacánta agus oibiachtúil ar cibé ar chomhlíon an freagra i ndáiríre gach ceann de na cuspóirí seo, agus (3) liosta d’aon neamhchinnteachtaí, débhríochtaí, nó “glaonna breithiúnais crua” ar bhuail an tsamhail leo agus í ag táirgeadh an fhreagra. Le linn na hoiliúna, déanann samhail luaíochta ar leith admháil a mheas a scórálann an admháil amháin ar iomláine na gcuspóirí, ar chruinneas na hanailíse comhlíonta, agus ar chlúdach na neamhchinnteachtaí. Cuirtear na luaíochtaí seo i bhfeidhm go heisiach ar aschur na hadmhála agus ní bhíonn tionchar acu riamh ar luaíocht an phríomhfhreagra. Cinntíonn sé seo an airí, a pléadh thuas, nach féidir le haon rud a deir an tsamhail san admháil dochar a dhéanamh (ná cabhrú) lena luaíocht dá príomhfhreagra.
Tá an teoiric taobh thiar d’admhálacha simplí. Is cosúil go dtagann go leor cineálacha iompair samhla nach dteastaíonn chun cinn toisc go n-iarraimid ar an tsamhail barrfheabhsú a dhéanamh ar roinnt cuspóirí ag an am céanna. Le linn foghlaim atreisiúcháin, feiceann an tsamhail leid, táirgeann sí freagra, agus faigheann sí luaíocht. Le himeacht ama, foghlaimíonn sí na cineálacha freagraí a tháirgeadh a fhaigheann scór maith. Is é an dúshlán ná go gcaithfidh an comhartha luaíochta go leor cúinsí éagsúla a chur le chéile ag an am céanna: cé chomh ceart agus atá an freagra, an bhfuil sé cabhrach, an leanann sé sonraíochtaí táirge agus beartais, an gcomhlíonann sé srianta sábháilteachta, agus an bhfuil sé ag teacht leis an méid a mbíonn claonadh ag úsáideoirí a roghnú. Nuair a idirghníomhaíonn na comharthaí seo, is féidir leo an tsamhail a bhrú de thaisme i dtreo iompraíochtaí nach dteastaíonn uainn.
Mar shampla, léirigh ár n-obair ar shiabhránachtaí go dtugann roinnt tacar sonraí níos mó luaíochta do thuairim mhuiníneach ná d’admháil mhacánta ar neamhchinnteacht. Léirigh ár dtaighde ar shiceafantaíocht gur féidir le samhlacha a bheith ró-aontaithe nuair atá an comhartha rogha ró-láidir. Agus tá sé léirithe ag obair(osclaíonn i bhfuinneog nua) ó ghrúpaí eile gur féidir le samhlacha “an luaíocht a hacáil”—bealaí éalaithe a aimsiú sa socrú oiliúna a ligeann dóibh scór ard a thuilleamh gan an rud a bhí beartaithe againn a dhéanamh i ndáiríre. I gcásanna áirithe, is féidir leis na haicearraí seo ginearálú(osclaíonn i bhfuinneog nua) chuig iompar níos mailísí fós san imlonnú.
Seachnaíonn admhálacha an cheist seo trí na cuspóirí a scaradh go hiomlán. Leanann an príomhfhreagra de bharrfheabhsú a dhéanamh do na gnáthfhachtóirí go léir. Cuirtear oiliúint ar an admháil ar cheann amháin go díreach: macántacht. Ní úsáidtear aon rud a deir an tsamhail san admháil ina coinne, agus ní bhíonn tionchar ag an admháil ar luaíocht an phríomhfhreagra. Ciallaíonn sé sin, fiú má mheallann an tsamhail nó má ghearrann sí coirnéil ina haschur bunaidh, go bhfuil spreagadh aici fós é sin a admháil san admháil. Is é seo a fheicimid i gcleachtas: tá samhlacha sásta drochiompar a admháil san admháil, fiú i gcásanna ina gcuireann siad i bhfolach é sa phríomhfhreagra. Agus nuair a theipeann ar admhálacha, is gnách go mbíonn sé toisc go bhfuil mearbhall dáiríre ar an tsamhail—mar go raibh na treoracha débhríoch nó mar nár thuig sí go ndearnadh botún—seachas mar go raibh sí ag iarraidh daoine a chur amú d’aon ghnó. Go tábhachtach, léiríonn na torthaí luatha go bhfanann admhálacha éifeachtach fiú nuair a tháirgtear an bunfhreagra gan aon sraith smaointe ar chor ar bith, rud a thugann le fios nach mbraitheann macántacht na hadmhála ar inléiteacht na réasúnaíochta inmheánaí agus go bhféadfadh sí ginearálú ar ailtireachtaí samhla amach anseo.
Oibríonn oiliúint admhálacha fiú gan lipéid fhírinneacha maidir le comhlíonadh. Le “fírinne bhunúsach,” ciallaímid lipéad cinnte, soláthraithe go seachtrach a léiríonn ar lean an tsamhail treoir i ndáiríre nó ar sháraigh sí í. I go leor tascanna sa saol fíor níl na lipéid seo ar fáil—dá mbeadh a fhios againn go cinnte gur sháraigh an tsamhail riail, d’fhéadfaimis an sárú sin a phionósú go díreach seachas a bheith ag brath ar admháil. Ina ionad sin, tugtar luaíocht don tsamhail as míniú struchtúrtha, tacaithe le fianaise, a tháirgeadh ar an méid a chreideann sí a rinne sí. Léiríonn an páipéar go mbíonn claonadh ag macántacht teacht chun cinn faoin socrú seo. Ceapaimid gurb é is cúis leis sin ná go mbíonn sé níos éasca don tsamhail cuntas fírinneach, le tacaíocht fianaise, a thabhairt ná scéal comhleanúnach cumtha a thógáil ar féidir leis an mbreitheamh glacadh leis. Is toimhde lárnach í seo a ndéantar iniúchadh uirthi sa pháipéar, a phléann freisin na cásanna ina dteipeann ar admhálacha—na diúltacha bréagacha agus na dearfaigh bhréagacha—agus conas a thagann siad chun cinn.
Soláthraíonn an páipéar fianaise tosaigh go n-oibríonn admhálacha, ach níor cheart é a thuiscint mar chruthúnas cinntitheach. Cé gur úsáideamar samhail teorainn (GPT‑5 Thinking), bhí ár dturgnaimh teoranta ó thaobh scála de, ag úsáid méid sách beag ríomhaireachta agus sonraí. Táimid ar bís an obair seo a thabhairt go dtí an chéad leibhéal eile, agus féachaint an leanfaidh macántacht na n-admhálacha de bheith seasmhach de réir mar a mhéadaímid a hoiliúint.
Déanann an tsamhail “hacáil luaíochta” ina príomhfhreagra chun an marcálaí a chur amú trí chomhaireamh focal líomhnaithe a chur le habairtí, ach ansin admhaíonn sí é seo san admháil.
Mar chuid dár dturgnaimh chuireamar oiliúint ar shamhlacha d’aon ghnó i gcoinne comhartha luaíochta “inchurtha faoi hacáil” a ríomh samhail níos laige. Bhain an socrú seo leis an bpríomhluaíocht agus le luaíocht na hadmhála araon. D’fhoghlaim an tsamhail an comhartha luaíochta lag a shaothrú: tháinig feabhas ar a cruinneas dealraitheach (nuair a mheas an tsamhail lag é), agus thit a fíorchruinneas (nuair a mheas meastóir níos láidre é).
Mar sin féin, cé gur cuireadh oiliúint ar chainéal na hadmhála ar an gcomhartha lag céanna, ghluaiseadh a chruinneas sa treo eile. D’fhoghlaim an tsamhail gurbh é an bealach ab fhearr chun luaíocht na hadmhála a bharrfheabhsú ná a admháil go simplí nuair a hacáil sí an phríomhluaíocht. D’éirigh admhálacha níos cruinne le himeacht ama, fiú agus an príomhiompar ag imeacht óna chúrsa.
Le linn na hoiliúna, nuair a theipeann ar an tsamhail comhlíonadh, foghlaimíonn sí i gcodán éigin de na cásanna breitheamh na príomhluaíochta a “hacáil” agus mar sin tá cruinneas an bhreithimh ag laghdú. I gcodarsnacht leis sin, cé go bhfuil breitheamh luaíochta na hadmhála chomh hinchurtha faoi hacáil céanna, ní éiríonn an tsamhail ach níos macánta le linn na hoiliúna ina hadmháil, agus sa deireadh sroicheann sí beagnach 100% d’admháil nuair nár chomhlíon sí.
Tá tuilleadh turgnaimh agus torthaí sa pháipéar(osclaíonn i bhfuinneog nua). Rinneamar comparáid idir an tsamhail a cuireadh faoi oiliúint admhála agus samhail rialaithe a cuireadh faoi oiliúint ar an mbealach céanna ach gan cainéal na hadmhála. Scrúdaíomar freisin na cásanna inar theip ar admhálacha. Tharla beagnach gach ceann de na “caillteanais” nuair a bhí mearbhall dáiríre ar an tsamhail—nuair a bhí na treoracha débhríoch nó nuair nár thuig sí go simplí go raibh botún déanta aici. (Féach an sampla diúltach bréagach thuas.)
Tá teorainneacha ag admhálacha. Ní choisceann siad drochiompar; cuireann siad os ár gcomhair é. Is é a bpríomhluach gur uirlis monatóireachta agus dhiagnóiseach iad, le linn oiliúna agus san imlonnú araon. Tá ról cosúil le monatóireacht sraithe smaointe ag admhálacha: déanann an dá cheann próisis réasúnaíochta i bhfolach níos infheicthe. Díríonn admhálacha ar cibé ar sháraigh an tsamhail treoracha; is féidir le sraith smaointe a léiriú conas a shroich sí an pointe sin.
Is cruthúnas coincheapa í an obair seo freisin. Níor chuireamar meicníochtaí admhála faoi oiliúint ar scála mór, agus tá cruinneas na hadmhála neamhfhoirfe fós. Tá níos mó oibre le déanamh chun an cur chuige a dhéanamh níos iontaofa, níos athléimní, agus níos infheidhme níos forleithne trasna teaghlaigh samhlacha agus tascanna.
Oireann an obair seo dár gcur chuige níos leithne maidir le sábháilteacht AI. Is meicníocht amháin iad admhálacha i gcruach níos leithne a chuimsíonn ailíniú breithniúcháin, monatóireacht sraithe smaointe, ordlathas treoracha, agus tuilleadh. Ní leor aon mhodh amháin; is é an sprioc córas sraitheach seiceálacha agus uirlisí trédhearcachta a neartaíonn a chéile. Is féidir le hadmhálacha cuidiú le hiompraíochtaí fadhbacha i samhlacha a dhiagnóisiú le linn oiliúna agus meastóireachta, chomh maith le monatóireacht le linn imlonnaithe. Ní réitíonn admhálacha astu féin an fhadhb a bhaineann le cothromaíocht a bhaint amach idir toiseanna iolracha. Ach trí mhodh “séiream fírinne” a chruthú ina bhfuil samhlacha dírithe ar mhacántacht amháin, cuireann sé uirlis luachmhar lenár gcruach chun macántacht agus sábháilteacht a fheabhsú ar an iomlán.
De réir mar a éiríonn samhlacha níos cumasaí agus de réir mar a imlonnaítear iad i suíomhanna níos mó geallta, teastaíonn uirlisí níos fearr uainn chun a thuiscint cad atá á dhéanamh acu agus cén fáth. Ní réiteach iomlán iad admhálacha, ach cuireann siad ciseal fiúntach lenár gcruach trédhearcachta agus maoirseachta. In obair amach anseo, tá sé beartaithe againn admhálacha a mhéadú, chomh maith lena bpéireáil le teicnící trédhearcachta agus sábháilteachta comhlántacha, lena n-áirítear monatóireacht sraithe smaointe agus ailíniú breithniúcháin, chun tuilleadh dul chun cinn a dhéanamh i dtreo a chinntiú go gcloíonn ár samhlacha go dílis leis na treoracha agus na beartais go léir (amhail ár Sonraíocht Samhail(osclaíonn i bhfuinneog nua)), agus go dtuairiscíonn siad go fírinneach ar a ngníomhartha.


