Iompar samhla a thuar roimh scaoileadh trí sholáthar a Ionsamhlú
Comhthéacsanna comhrá réalaíocha a úsáid chun iompar neamh-inmhianaithe samhla a mheas níos fearr roimh eisiúint.
Sula scaoiltear samhail nua, ní mór do shaotharlanna tuiscint a fháil ní hamháin ar an méid a bhfuil sí in ann a dhéanamh, ach ar an dóigh is dócha a n-iompróidh sí í féin in úsáid fhíorshaoil, lena n-áirítear cá bhféadfadh sí rioscaí nua a chruthú. Éiríonn sé seo níos tábhachtaí fós de réir mar a mhéadaíonn cumais. Mar chuid dár n-athbhreithniú sábháilteachta réamh-sholáthair, bainimid leas as meastóireachtaí spriocdhírithe, modh na foirne deirge, agus seiceálacha eile chun iompar samhla a thuiscint. Tá modh tosaithe againn anois chun soláthar samhla a Ionsamhlú sula dtarlaíonn siad, rud a chuireann comhartha comhlántach leis: réamhamharc cosúil le soláthar ar an dóigh a bhféadfadh samhail iarrthóra í féin a iompar sula sroicheann sí úsáideoirí.
Is modh é Ionsamhlú Soláthair chun soláthar amach anseo a Ionsamhlú sula dtarlaíonn sé. Déanaimid sin trí chomhráite roimhe seo a athsheinm ar bhealach a chaomhnaíonn príobháideachas le samhail iarrthóra nua. Cuireann sé seo ar ár gcumas staidéar a dhéanamh ar an gcaoi a bhfreagraíonn an tsamhail nua i gcomhthéacsanna réalaíocha roimh eisiúint, lena n-áirítear an dtagann iompair neamh-inmhianaithe nua chun cinn agus cé chomh minic a d’fhéadfadh siad a bheith le feiceáil.
Trasna go leor soláthairtí Thinking i sraith GPT‑5, d’fheabhsaigh Ionsamhlú Soláthair ár meastacháin ar rátaí iompair neamh-inmhianaithe samhla, chabhraigh sé le cineálacha nua mí-ailínithe a aimsiú roimh eisiúint, agus chabhraigh sé leis an riosca a laghdú go mbeadh samhlacha in ann a aithint go raibh siad á dtástáil. Chuireamar an modh i bhfeidhm freisin ar leathadh dúshlánach gníomhaireach, ag léiriú gur féidir é a shíneadh thar chomhrá caighdeánach go socruithe gníomhaire níos casta a bhaineann le húsáid uirlisí, agus gur féidir é a úsáid freisin le haghaidh measúnú riosca roimh soláthar inmheánacha samhla.
Tá léargais ó Ionsamhlú Soláthair úsáidte againn cheana le linn fhorbairt samhla chun bearnaí i meastóireachtaí traidisiúnta a aithint agus chun maoluithe agus cinntí soláthair a threorú. De réir mar a dhéanaimid an phíblíne níos éasca a rith, táimid ag súil go mbeidh ról níos mó aici sa phróiseas forbartha samhla amach anseo.
Is gnách go mbíonn meascán de leideanna sintéiseacha, scríofa de láimh, nó táirgthe i gceist le meastóireachtaí réamh-soláthair a úsáidtear ar fud an tionscail, roghnaithe d’aon ghnó toisc go bhfuil siad deacair, tromchúiseach, nó sáraíochta. Go ginearálta bhí dhá sprioc fite fuaite ag na meastóireachtaí seo: measúnú a dhéanamh ar an gcaoi a bhfreagraíonn an tsamhail nuair a chuirtear faoi strus í i gcásanna a bhfuil seans an-bheag acu tarlú i dtrácht soláthair, agus tuiscint ghinearálta a fháil ar iompair neamh-inmhianaithe samhla, lena n-áirítear iompair nua den sórt sin a aimsiú agus a minicíochtaí ag am soláthair a thuar.
Cé go bhfanann meastóireachtaí traidisiúnta ríthábhachtach don chéad sprioc, is céim mhór chun cinn é Ionsamhlú soláthair maidir leis an dara sprioc do rioscaí nach bhfuil san eireaball (inár dturgnaimh, ní féidir a bheith ag súil go dtomhaisfidh ár gcur chuige iompair a tharlaíonn le minicíocht níos lú ná 1 as 200,000 teachtaireacht). Tagann neart Ionsamhlú soláthair ó chuid de na croídhúshláin le meastóireachtaí traidisiúnta a sheachaint:
- Clúdach: tá sé deacair muinín a bheith againn go gclúdóidh leideanna meastóireachta gach cineál féideartha iompair neamh-inmhianaithe samhla. Éilíonn tomhas cineálacha nua iompair neamh-inmhianaithe meastóireachtaí nua a chruthú, agus fios a bheith againn cad iad na dochair atá le tomhas. Féadfaidh sé seo a bheith dian ó thaobh ama agus saothair de, agus féadfaidh meastóireachtaí sáithiú le himeacht ama.
- Claontaí roghnúcháin: de ghnáth tógtar meastóireachtaí traidisiúnta le hiompair neamh-inmhianaithe shonracha samhla san áireamh, roghnaithe ar bhealaí a chlaonann i dtreo comhthéacsanna a tharla roimhe seo. D’fhéadfadh sé seo a dhéanamh nach mbeadh a meastacháin chomh faisnéiseach faoi mhinicíocht iompair den sórt sin ar leithead iomlán dháileadh an soláthair.
- Aithint mar thástálacha ag samhlacha: tá samhlacha ag éirí níos cumasaí a dhéanamh amach go bhfuil siad á dtástáil, rud a d’fhéadfadh a n-iompar agus ár dtomhais iartheachtacha ar a sábháilteacht a shaobhadh. Cé go dtarraingítear go leor de na meastóireachtaí traidisiúnta a úsáidimid ag OpenAI ó thrácht táirgthe freisin agus nach bhfuil an fhadhb seo acu, is ábhar imní coitianta é seo do go leor meastóireachtaí traidisiúnta a úsáidtear ar fud an tionscail.
Tá an phríomhtheicníc taobh thiar d’Ionsamhlú Soláthair simplí: tógaimid comhráite le déanaí ón soláthar, bainimid freagra bunaidh an chúntóra ón tsamhail níos sine, agus gineann muid arís é le samhail iarrthóra atá le heisiúint. Déanaimid meastóireacht ar na comhlánuithe trí mhodhanna teipe nua a chuardach, agus measaimid minicíocht iompair neamh-inmhianaithe ag am soláthair bunaithe ar a mhinicíocht sa dáileadh seo atá cosúil le himlonnú. Is féidir linn na tomhais chéanna a dhéanamh tar éis scaoilte ar fhíor-thrácht soláthair, rud a chuireann ar ár gcumas ár réamhaisnéisí réamh-soláthair a bhailíochtú.
Maolaíonn Ionsamhlú Soláthair na trí theorannú thuas go suntasach: tugtar aghaidh ar chlaonadh samplála trí dháileadh leideanna meastóireachta atá ionadaíoch ar úsáid le déanaí a úsáid. Is féidir le hIonsamhlú soláthair le leideanna ionadaíocha imní faoin gclúdach a mhaolú freisin: faighimid clúdach níos mó ar iompair neamh-inmhianaithe samhla trí níos mó tráchta a Ionsamhlú go simplí. Tá an malartú seo idir ríomh agus clúdach tábhachtach, mar cuireann sé ar cháilíocht ais seo an mheasúnaithe riosca scálú le ríomh, seachas leis an iarracht láimhe a theastaíonn chun níos mó meastóireachtaí a thógáil. Ní cosúil go bhfuil samhlacha in ann idirdhealú a dhéanamh idir comhráite a fhaightear trí Ionsamhlú Soláthair agus fíor-thrácht soláthair.
Íomhá 1: Forbhreathnú ar ár bpíblíne Ionsamhlú Soláthar
Limistéar | Meastóireachtaí Traidisiúnta | Ionsamhlú Soláthair |
Clúdach | Níos fearr do rioscaí íseal-leitheadúlachta ach ard-déine ar mhaith linn a chinntiú go bhfuil clúdach againn dóibh | Níos fearr chun tuiscint a fháil ar an speictream rioscaí a d’fheicfimid i dtrácht imscartha |
Ionadaíochas / claontacht | Dírithe ar rioscaí spriocdhírithe san am atá thart nó a tuartha a mheas, fiú i gcás iompraíochtaí a bhfuil leitheadúlacht thar a bheith íseal acu san imscaradh | Ionadaíoch ar rioscaí a tharlaíonn os cionn leitheadúlachta áirithe i dtrácht imscartha reatha |
Feasacht measúnaithe | Leideanna tástála a d’fhéadfadh a bheith soiléir (m.sh., le sonraí sintéiseacha) mura gcruthaítear meastóireachtaí le sonraí soláthair | Is cosúil go laghdaíonn comhthéacs cosúil le soláthar feasacht mheasúnaithe go suntasach |
Iarracht | Éilíonn dáiltí agus socruithe leideanna saincheaptha i bhfad níos mó iarrachta láimhe | Éilíonn sé costas bonneagair aonuaire, agus ansin athúsáideann sé réimíreanna ó imscaradh agus grádóirí ó iompraíochtaí neamh-inmhianaithe aitheanta |
Comparáid ardleibhéil idir meastóireachtaí traidisiúnta agus Ionsamhlú soláthair
Chun Ionsamhlú Soláthair a mheas, réamhchláraíomar tuartha maidir le minicíocht ag am soláthair de 20 cineál iompair neamh-inmhianaithe do GPT‑5.4 Thinking. Rinneamar staidéir shiarghabhálacha freisin ar sholáthairtí eile de shamhlacha Thinking i sraith GPT‑5. Clúdaíonn na hiompair samhla a anailísímid catagóirí mí-ailínithe agus ábhair dhícheadaithe araon atá á dtuairisciú againn i gcártaí córais (m.sh. an tsamhail ag bréagadh faoi uirlisí, nó ábhar gnéasach dícheadaithe a aschur). Cé nach rianaímid sna torthaí seo ach 20 catagóir d’iompar neamh-inmhianaithe samhla, agus nach lorgaímid ach iompair nua mhí-ailínithe, is teicníc ghinearálta é Ionsamhlú soláthair a d’fhéadfaí a chur i bhfeidhm chun aon airí samhla ag am soláthair a Ionsamhlú.
Bhí an trácht táirgthe a d’úsáideamar ó shamhlacha Thinking i sraith GPT‑5 freisin. Sular rith muid ár meastóireachtaí, bhaineamar aitheantóirí atá nasctha le cuntais agus faisnéis inaitheanta go huathoibríoch. De réir ár bpolasaí príobhaídeachais, níor anailísíomar ach trácht ChatGPT ó úsáideoirí a cheadaíonn a gcuid sonraí a úsáid le haghaidh feabhsuithe samhla. Ní thuairiscímid ach torthaí comhiomlána ó na meastóireachtaí seo. San iomlán, rinneamar anailís ar thart ar 1.3 milliún comhrá dí-aitheanta trasna GPT‑5 Thinking trí sholáthairtí GPT‑5.4, ó Lúnasa 2025 go Márta 2026.
Measaimid cáilíocht an mheasúnaithe riosca réamh-soláthair a tháirg Ionsamhlú soláthair ar thrí phríomhbhealach:
- Clúdach tacsanomaíochta: ar aimsigh iniúchadh iar-eisiúint aon iompair thábhachtacha mhí-ailínithe a bhí in easnamh ónár dtacsanomaíocht tosaigh drochiompair?
- Beachtas treoch: ar thuar an t-Ionsamhlú i gceart an méadófaí nó an laghdófaí forleithne an soláthair d’iompair aitheanta?
- Calabrú rátaí: an raibh ár meastacháin réamh-soláthair gar do na rátaí a chonaiceamar níos déanaí sa soláthar? Éilíonn calabrú maith rátaí níos mó ná beachtas treoch, rud a fhágann gurb é seo an caighdeán cáilíochta is airde is féidir.
Tomhaisimid freisin cé mhéad atá samhlacha in ann a thuiscint go bhfuil siad i meastóireacht le linn Ionsamhlú soláthair, agus tástálaimid cé chomh láidir is atá an modh i leith cineálacha éagsúla tráchta soláthair agus socruithe dúshlánacha úsáide uirlisí.
Trasna soláthairtí Thinking i sraith GPT‑5, sháraigh Ionsamhlú soláthair bonnlínte leideanna dúshlánacha maidir le fíorráta riosca a chinneadh, bhí sé in ann haiceáil áireamháin a aimsiú roimh scaoileadh, agus bhí cuma air go bhféadfadh sé a bheith do-aitheanta ón imlonnú don tsamhail.
Forbhreathnú ar ár dtuartha. Chun léirshamhlú a fheiceáil ar gach tuar do sholáthairtí samhla Thinking i sraith GPT‑5, féach Íomhá 2. Réamhchláraíodh na tuartha do GPT‑5.4 Thinking, agus ba thuar siarghabhálach iad na cinn eile. I gcomhiomlán, bhí earráid iolraitheach mheánach 1.5x ag ár dtuartha (m.sh. más é 10 as 100k an ráta iompair neamh-inmhianaithe, bheadh sé seo comhionann le ráta 15 nó 6.67 as 100k a mheas). Cé gur féidir le hearráidí eireabaill ár modha a bheith thart ar 10x níos mó, táimid ag súil gur féidir iad a laghdú go suntasach le tuilleadh feabhsuithe ar ár bpíblíne insamhlaithe, mar a phléitear thíos.
Íomhá 2. Tuar Minicíochta Ionsamhlú Soláthair ar iompar neamh-inmhianaithe ag am soláthair bunaithe ar shonraí soláthair roimhe seo. Léiríonn an nodaireacht 5.1 → 5 go bhfuilimid ag athshampláil réimíreanna ó GPT‑5 le GPT‑5.1, is é sin, ag Ionsamhlú soláthar GPT‑5.1 bunaithe ar shonraí ó GPT‑5. Ba é “haiceáil áireamháin” in GPT‑5.1 an ráta ab airde d’iompar mí-ailínithe, rud atá pléite againn roimhe seo(osclaíonn i bhfuinneog nua).
Tuartha Ionsamhlú Soláthair a chur i gcomparáid le bonnlínte. Is iad na catagóirí is tábhachtaí le meastachán cruinn a dhéanamh orthu do mheasúnuithe riosca réamh-soláthair na cinn a mbíonn athruithe móra ar mhinicíocht acu tar éis imlonnú na samhla (m.sh. >= 1.5x). Ar an bhfo-thacar seo, tá Ionsamhlú Soláthair i bhfad níos fearr ná bonnlínte maidir le tuar an méadóidh nó an laghdóidh iompar neamh-inmhianaithe áirithe i bhforleithne le himlonnú samhla (Fíor 3, ar chlé), agus maidir lena mhinicíocht bheacht ag am soláthair a mheas (Fíor 3, ar dheis). Úsáidimid dhá phríomhbhonnlíne: bonnlíne Leideanna Dúshlánacha a úsáidimid faoi láthair do chártaí córais agus cinntí seolta, agus bonnlíne shimplí a úsáideann rátaí ón imlonnú roimhe seo mar mheastacháin don tsamhail nua.
Íomhá 3. Tuarann Ionsamhlú Soláthair treo na n-athruithe minicíochta (ar chlé) agus rátaí beachta táirgthe (ar dheis) níos fearr ná meastóireachtaí statacha.
Foinsí earráide insamhlaithe inár bpíblíne. Rinneamar staidéar freisin ar fhoinsí reatha earráide inár bpíblíne. Go sonrach, fágann earráidí móra earr nach bhfuil an phíblíne chomh hiontaofa do chinntí soláthair: mar shampla, nuair a fheictear méadú mór tuartha in iompar neamh-inmhianaithe de chineál áirithe, má tá a fhios go mbíonn earráidí móra fiú ó am go chéile sa phíblíne, ardaíonn sé amhras an meastachán iontaofa é seo nó déantán den phíblíne. Tá dhá phríomhfhoinse earráide féideartha ann:
- Earráid dílseachta timpeallachta athshamplála: chun rátaí táirgthe a mheas go cruinn, ní mór dár bpíblíne insamhlaithe a bheith chomh réalaíoch agus is féidir. Is fadhb innealtóireachta é seo i bpáirt (sampláil ón tsamhail leis na píblínte céanna a úsáidtear do thrácht táirgthe), agus dúshlán suimiúil i bpáirt d’uirlisí a dteastaíonn rochtain léitheoireachta/scríofa uathu ar acmhainní seachtracha atá ag athrú i gcónaí (m.sh. cuardaigh ghréasáin nó idirghníomhú le comhaid áitiúla). Is féidir linn earráid dílseachta an insamhlaithe a leithlisiú trí thuar ó sholáthar iarbhír agus a Ionsamhlú a chur i gcomparáid (is é sin, imlonnú na samhla atá soláthair cheana féin a Ionsamhlú).
- Earráid aistrithe i ndáileadh leideanna: ábhar mór imní le hIonsamhlú soláthair is ea go mbeidh aon soláthar samhla ina chúis le haistriú dáileacháin sna hionchuir, go háirithe má oiriúnaíonn úsáideoirí do chumais nua na samhla. Leithlisímid earráid dáileadh leideanna trí mheastacháin a chur i gcomparáid agus an soláthar á Ionsamhlú le leideanna le déanaí i gcoinne leideanna ón soláthar a tharla i ndáiríre.
Mar a fheictear in Íomhá 4, faighimid amach go bhfuil cuid mhór den earráid inár bpíblíne—go háirithe d’earráidí earr—mar gheall ar dhílseacht insamhlaithe faoi láthair. Is dea-scéal é seo, mar táimid ag súil go mbeidh sé níos éasca go ginearálta dílseacht insamhlaithe a fheabhsú ná aistriú i ndáileadh leideanna a laghdú. Faighimid amach freisin gur féidir earráid aistrithe i ndáileadh leideanna a laghdú trí na sonraí is déanaí ón imlonnú roimhe seo a úsáid. Tá tuilleadh sonraí le fáil sa pháipéar taighde.
Íomhá 4: Is cosúil gurb í dílseacht timpeallachta athshamplála an fhoinse earráide is mó inár meastacháin, go háirithe do na hearráidí is foircní.
D’aimsigh iniúchadh uathoibrithe an t-aon mhí-ailíniú nua a tugadh isteach sna soláthairtí seo. Sa tréimhse sholáthair a ndearnamar staidéar uirthi, bheadh 'haiceáil áireamháin' aimsithe ag ár bpíblíne iniúchta uathoibrithe bunaithe ar sholáthairtí insamhlaithe roimh eisiúint, agus ba é sin an t-aon mhí-ailíniú nua a d’aithníomar sa trácht ChatGPT a ndearnadh anailís air. Is cineál haiceáil luaíochta é haiceáil áireamháin ina n-úsáideann an tsamhail uirlis bhrabhsálaí mar áireamhán agus í ag cur an ghnímh i láthair mar chuardach. Ní chiallaíonn sé seo go ngabhfaidh iniúchadh ar scála mór gach teip nua, ach léiríonn sé cén fáth a bhfuil comhthéacsanna réalaíocha tábhachtach: is féidir leo iompair a spreagadh nach dtiocfadh chun solais go díreach riamh i dtacair mheasúnaithe níos cúinge, fiú mura raibh siad i láthair sa trácht bunaidh a úsáideadh chun an t-ionsamhlú a shíolú.
Buntáiste eile a bhaineann le comhthéacsanna cosúil le himlonnú a úsáid ná go bhféadfadh siad saobhadh a thagann chun cinn nuair a aithníonn samhlacha go bhfuil siad á dtástáil a laghdú. I dtaighde roimhe seo, fuair muid chomh maith le daoine eile(osclaíonn i bhfuinneog nua) amach gur minic a bhíonn samhlacha feasach ar an uair a bhíonn siad á dtástáil. Mar shampla, féadfaidh samhlacha réasúnaíocht a dhéanamh ina sraith smaointe faoi cad atá á thástáil orthu, cad a thaitneodh le meastóir, agus — má tá siad ag mí-iompar — an ngabhfar iad. Cruthaíonn sé seo fadhb do mheastóireachtaí ailínithe: má iompraíonn samhail í féin go maith amháin toisc go gceapann sí go bhfuil sí á tástáil, conas a thógaimid muinín go n-iompróidh sí í féin go sábháilte nuair a fhoghlaimíonn sí go bhfuil sí soláthair?
Léirímid go laghdaíonn Ionsamhlú soláthair leibhéil feasachta measúnaithe a léiríonn samhlacha go suntasach i gcomparáid le meastóireachtaí traidisiúnta nach bhfuil bunaithe ar fhíorshonraí soláthair. Tomhaisimid feasacht measúnaithe ar thrí bhealach: trí iarraidh ar shamhail a rangú ar tháinig conair ó tháirgeadh nó ó mheastóireacht, trí mhonatóireacht a dhéanamh ar shraith smaointe le haghaidh ráiteas follasach faoi bheith á meas le haghaidh ailínithe, chomh maith le meitichearrbhachas(osclaíonn i bhfuinneog nua): aon réasúnaíocht faoi mhaoirseacht. Bhí trácht soláthair insamhlaithe an-chosúil le fíor-thrácht soláthair ar fud na dtrí thomhas. Mar shampla, lipéadaigh GPT‑5.2 fíor-thrácht táirgthe mar rud cosúil le meastóireacht 5.4% den am agus trácht insamhlaithe 5.1% den am, agus aicmíodh meastóireachtaí traidisiúnta (mar SWE-Bench nó MonorepoBench, atá comhdhéanta den chuid is mó de shamplaí sintéiseacha) mar mheastóireachtaí beagnach 100% den am.
Íomhá 6. Comparáid feasachta ar mheastóireacht: léiríonn fíor-thrácht táirgthe agus trácht insamhlaithe rátaí comhchosúla do bhrath meastóireachta, feasacht fhoclaithe ar mheastóireacht ailínithe, agus meitichluichíocht, agus tuairiscíonn tacair sonraí mheasúnaithe thraidisiúnta rátaí i bhfad níos airde.
Chun a thástáil an bhféadfaí an modh a shíneadh thar mhodhanna caighdeánacha comhrá, rinneamar staidéar freisin ar sholáthairtí a Ionsamhlú do shuíomhanna dúshlánacha códú gníomhaireach. Go sonrach, úsáidimid 120,000 conair inmheánach gníomhaireach fostaithe ó GPT‑5.4 chun sholáthar inmheánach gníomhairí códaithe bunaithe ar GPT‑5.5 a ionsamhlú. Freastalaíonn sé seo ar dhá chuspóir: léiríonn sé conas is féidir ionsamhlú soláthair a úsáid freisin le haghaidh measúnú riosca do sholáthairtí inmheánacha, agus taispeánann sé gur féidir dílseacht insamhlaithe a dhéanamh ard fiú i suíomhanna gníomhaireacha trí ionsamhlú cúramach uirlisí.
Thuas phléamar go bhfuil dílseacht insamhlaithe ar cheann de na príomhfhoinsí earráide inár bpíblíne reatha. Ceann de na dúshláin a bhaineann le hionsamhlú soláthair a dhéanamh réalaíoch ná go n-éilíonn sé ar uirlisí gníomhú ar bhealaí réalaíocha, fiú nuair a theastaíonn rochtain léitheoireachta/scríofa uathu ar acmhainní seachtracha atá ag athrú i gcónaí (m.sh. cuardaigh ghréasáin nó idirghníomhú le comhaid áitiúla).
Tá sé seo dúshlánach go háirithe do shuíomhanna amhail soláthairtí gníomhaireacha: féadfaidh conair aonair gníomhaire brath ar na céadta glao uirlise, staid stór, freagraí líonra, nó teipeanna sealadacha. Fágann sé seo go bhfuil athshampláil le fíorrochtain uirlisí dúshlánach agus d’fhéadfadh sí a bheith contúirteach. Dá bhrí sin, in ionad glaonna uirlise a chur i bhfeidhm ar chórais bheo, déanaimid iad a ionsamhlú le LLM eile. Léirímid go bhfuil sé riachtanach cumais bhreise a thabhairt don LLM seo don réalachas agus, dá bhrí sin, do cháilíocht an mheastacháin.
Tugaimid don tsamhail insamhlóra uirlisí an rolladh amach bunaidh sa chasadh deiridh, an stór ó am an chomhrá, bunachar sonraí de phéirí glao-uirlise/freagra, agus nascóirí inléite amháin. I dtástáil inar rinne idirdhealaitheoir iarracht rolladh amach insamhlaithe a aithint ó chinn fhíora, d’fheabhsaigh réalachas ó ráta buaite 11.6% go 49.5%, gar don leibhéal seans 50%.
Íomhá 6: Is féidir réalachas athshamplála a dhéanamh beagnach do-aitheanta ó fhíorshampláil fiú i suíomhanna trom ar uirlisí nuair a insamhlaítear glaonna uirlise le cumais mhéadaithe.
Mar fhianaise bhreise ar dhílseacht insamhlaithe, agus trácht smaointeoireachta GPT‑5.4 Codex á ionsamhlú le GPT‑5.4, tá na rátaí mí-ailínithe, a bheag nó a mhór, laistigh de bharraí earráide. I gcodarsnacht leis sin, inár dtástáil réamh-soláthair, bhí GPT‑5.5 níos mí-ailínithe i bhformhór na gcatagóirí.
Íomhá 7: Le hIonsamhlú uirlisí, tá rátaí iompair do chomhráite athshampláilte le GPT‑5.4 agus fíor-thrácht táirgthe GPT‑5.4 sách cosúil — rud a léiríonn dílseacht ard timpeallachta athshamplála. Féach cárta córais GPT‑5.5(osclaíonn i bhfuinneog nua) le haghaidh tuilleadh comhthéacs ar na catagóirí.
Tugann na torthaí seo le fios gur féidir Ionsamhlú Soláthair a shíneadh go socruithe casta gníomhaire nuair a insamhlaítear an timpeallacht uirlisí máguaird le dílseacht leordhóthanach.
Ceist nádúrtha is ea an féidir le hiniúchóirí seachtracha cuid de na tairbhí céanna a fháil gan rochtain ar thrácht táirgthe príobháideach. Thástálamar é seo le 100,000 comhrá WildChat a úsáideadh mar réimíreanna. Bhí WildChat níos lú cruinn ná sonraí táirgthe OpenAI le déanaí, ach fós faisnéiseach: bhí earráid iolraitheach mheánach níos ísle ag sonraí táirgthe le déanaí ná WildChat (1.75× i gcoinne 2.44×), agus d’fhan WildChat go minic laistigh de thart ar 3× de rátaí táirgthe agus d’aithin sé an tsamhail ab fhearr ag rátaí os cionn seans. Feicimid meastóireachtaí ar nós WildChat mar chomhlánú geallta ar Ionsamhlú soláthair a ritheann forbróirí. Féach an blagphost Ailínithe(osclaíonn i bhfuinneog nua) comhlach seo le haghaidh tuilleadh torthaí ar an bpointe seo.
Is comhlánú é Ionsamhlú soláthair ar mheastóireachtaí sáraíochta, modh na foirne deirge, agus anailís spriocdhírithe ar rioscaí earr, ní ionadú orthu. Braitheann braith roinnt iompair neamh-inmhianaithe samhla ar inmhonatóireacht sraithe smaointe: má dhéanann samhlacha amach anseo réasúnaíocht níos lú inléite, má fhágann siad céimeanna lárnacha ar lár, nó má fhoghlaimíonn siad rún a cheilt, seans nach mbeidh muid in ann na cineálacha seo iompair neamh-inmhianaithe a bhrath. Ina theannta sin, toisc go bhfuil sonraí táirgthe príobháideach, tá rochtain níos láidre ag forbróirí faoi láthair ar chomhthéacsanna ionadaíocha ná mar atá ag iniúchóirí seachtracha. D’fhéadfadh tacair sonraí phoiblí níos fearr an bhearna sin a chúngú.
Is é Ionsamhlú soláthair is úsáidí d’iompair a tharlaíonn sách minic le feiceáil i réimíreanna sampláilte. Ní dócha go n-aimseofar teip a tharlaíonn uair amháin i ndeich milliún comhrá i rith le milliún sampla, mar sin tá meastóireachtaí sáraíochta, modh na foirne deirge, agus anailís spriocdhírithe ar rioscaí earr fós riachtanach. Faoi láthair dírímid ar fhreagra cúntóra aonair a ionsamhlú, mar i dturgnaimh tosaigh ní bhfuaireamar feabhsuithe suntasacha ar ár meastacháin trí ilchastaí a ionsamhlú. D’fhéadfadh sé seo a bheith ina réimse tábhachtach chun dílseacht insamhlaithe a fheabhsú amach anseo.
Braitheann an modh freisin ar dháileadh na réimíre—an meascán comhráite atá á athshampláil. B’fhéidir nach mbeidh trácht stairiúil ag teacht leis an gcaoi a n-idirghníomhaíonn úsáideoirí le samhail níos cumasaí tar éis athrú mór táirge, scaoileadh uirlise nua, imeacht domhanda, nó athrú séasúrach. Tugann anailís sa pháipéar iomlán le fios gur féidir an tsaincheist seo a mhaolú trí na sonraí is déanaí atá ar fáil a úsáid.
Is cur chuige nua é ionsamhlú soláthair i leith measúnú riosca réamh-soláthair a chuidíonn le saotharlanna ar thús cadhnaíochta agus le meastóirí a thuar conas a d’fhéadfadh samhlacha teanga iad féin a iompar sa saol fíor agus na rioscaí a bhaineann leo a thuiscint roimh soláthar. Comhlánaíonn sé meastóireachtaí sábháilteachta, modh na foirne deirge, agus anailís spriocdhírithe atá ann cheana trí shraith tuartha níos cosúla le táirgeadh a chur leis, ar féidir léi meastacháin ar iompar soláthair a fheabhsú, éifeachtaí feasachta ar mheastóireacht a laghdú, agus tuartha réamh-soláthair a dhéanamh inseiceáilte tar éis scaoilte. Nuair a úsáidtear é in éineacht le meastóireachtaí traidisiúnta, is féidir le hionsamhlú soláthair measúnú riosca samhla a dhéanamh níos réalaíche, níos cainníochtúla, agus níos úsáidí do chinntí soláthair.


