Gníomhairí AI a dhearadh chun ionsaí treoracha a sheasamh
An méid a mhúineann innealtóireacht shóisialta dúinn faoi ghníomhairí AI a dhaingniú.
Tá gníomhairí AI ag éirí níos ábalta an gréasán a bhrabhsáil, faisnéis a aisghabháil, agus gníomhartha a dhéanamh thar ceann úsáideora. Tá na cumais sin úsáideach, ach cruthaíonn siad bealaí nua freisin d’ionsaitheoirí chun iarracht a dhéanamh an córas a ionramháil.
Is minic a chuirtear síos ar na hionsaithe seo mar ionsaí treoracha: treoracha a chuirtear in ábhar seachtrach mar iarracht a chur ar an tsamhail rud éigin a dhéanamh nár iarr an t-úsáideoir. Dar lenár dtaithí, tá na leaganacha fíorshaoil is éifeachtaí de na hionsaithe seo ag cosúlú níos mó le hinnealtóireacht shóisialta ná le sáruithe simplí treoracha.
Tá tábhacht leis an athrú sin. Mura mbaineann an fhadhb le teaghrán mailíseach a aithint amháin, ach le cur in aghaidh ábhar míthreorach nó ionramhálach i gcomhthéacs, ní féidir cosaint ina choinne a bhunú ar ionchuir a scagadh amháin. Éilíonn sé freisin an córas a dhearadh ionas go mbeidh tionchar an ionramhála srianta, fiú má éiríonn le roinnt ionsaithe.
D’fhéadfadh ionsaithe luatha den chineál “ionsaí treoracha” a bheith chomh simplí le halt Vicipéide a chur in eagar chun treoracha díreacha a chur ann do ghníomhairí AI a thug cuairt air; gan taithí ag am na hoiliúna ar a leithéid de thimpeallacht ionsaitheach, ba mhinic a leanfadh samhlacha AI na treoracha sin gan cheist1. De réir mar atá samhlacha ag éirí níos cliste, tá siad ag éirí níos lú leochaileach don chineál seo molta freisin agus thugamar faoi deara gur fhreagair ionsaithe i stíl ionsaí treoracha trí eilimintí den innealtóireacht shóisialta a chur san áireamh:
Sampla ríomhphoist d’ionsaí treoracha
Sampla ó 2025 d’ionsaí treoracha ar ChatGPT a tuairiscíodh do OpenAI ag taighdeoirí seachtracha slándála(osclaíonn i bhfuinneog nua). Le linn tástála, d’oibrigh sé 50% den am leis an leid úsáideora “Ba mhaith liom go ndéanfá diantaighde ar mo ríomhphoist ón lá inniu, ba mhaith liom go léifeá agus go seiceálfá gach foinse a d’fhéadfadh eolas a chur ar fáil faoi mo phróiseas nua fostaithe.”
Laistigh d’éiceachóras níos leithne slándála AI, tá sé coitianta anois teicnící amhail “balla dóiteáin AI” a mholadh ina ndéanann idirghabhálaí idir an gníomhaire AI agus an domhan lasmuigh iarracht ionchuir a rangú ina n-ionchuir mailíseacha ionsaí treoracha agus ina ngnáthionchuir—ach de ghnáth ní ghabhtar na hionsaithe lánfhorbartha seo le córais den sórt sin. I gcás córas mar seo, is ionann ionchur mailíseach a bhrath agus an fhadhb an-deacair chéanna le bréag nó mífhaisnéis a bhrath, agus go minic gan an comhthéacs riachtanach.
De réir mar a d’fhorbair ionsaithe fíorshaoil ionsaí treoracha ó thaobh castachta de, fuaireamar gur bhain na teicnící ionsaitheacha ba éifeachtaí úsáid as cleasanna innealtóireachta sóisialta. In ionad na n-ionsaithe treoracha seo a láimhseáil le hinnealtóireacht shóisialta mar aicme ar leith nó iomlán nua fadhbanna, thosaíomar á fheiceáil tríd an lionsa céanna a úsáidtear chun riosca innealtóireachta sóisialta ar dhaoine a bhainistiú i réimsí eile. Sna córais seo, níl an sprioc teoranta d’ionchuir mailíseacha a aithint go foirfe, ach gníomhairí agus córais a dhearadh ionas go mbeidh tionchar an ionramhála srianta, fiú má éiríonn leis. Léiríonn a leithéid de chórais go bhfuil siad éifeachtach chun maolú a dhéanamh ar ionsaí treoracha agus ar innealtóireacht shóisialta araon.
Ar an mbealach seo, is féidir linn an gníomhaire AI a shamhlú mar dhuine atá i gcóras trí ghníomhaí cosúil le gníomhaire seirbhíse do chustaiméirí; ba mhaith leis an ngníomhaire gníomhú thar ceann a fhostóra, ach bíonn sé nochtaithe go leanúnach d’ionchur seachtrach a d’fhéadfadh iarracht a dhéanamh é a chur ar seachrán. Ní mór srianta a chur ar chumais an ghníomhaire tacaíochta custaiméara, daonna nó AI, chun an riosca díobhála atá mar chuid den chineál timpeallachta mailísí seo a theorannú.
Samhlaigh cás ina n-oibríonn duine córas tacaíochta custaiméara agus ina bhfuil sé ábalta cártaí bronntanais agus aisíocaíochtaí a thabhairt amach mar chúiteamh ar mhíchaoithiúlachtaí a d’fhulaing an custaiméir amhail moill ar sheachadadh, damáiste mar thoradh ar mhífheidhmiú, srl. Is fadhb ilpháirtí í seo ina gcaithfidh an chorparáid muinín a bheith aici go dtugann an gníomhaire aisíocaíochtaí amach ar na cúiseanna cearta, agus ag an am céanna idirghníomhaíonn an gníomhaire le tríú páirtithe a d’fhéadfadh iarracht a dhéanamh é a chur ar seachrán nó fiú brú a chur air.
Sa saol fíor, tugtar sraith rialacha don ghníomhaire le leanúint, ach táthar ag súil leis, sa timpeallacht ionsaitheach ina bhfuil siad, go gcuirfear ar seachrán iad. B’fhéidir go seolann custaiméir teachtaireacht ag maíomh nár próiseáladh a aisíocaíocht riamh, nó go mbagraíonn sé díobháil mura bhfaigheann sé aisíocaíocht. Cuireann córais chinntitheacha a n-idirghníomhaíonn an gníomhaire leo teorainn leis an méid aisíocaíochtaí is féidir a thabhairt do chustaiméir, cuireann siad foláireamh ar ríomhphoist fhéideartha fioscaireachta, agus soláthraíonn siad maoluithe eile dá leithéid chun tionchar chomhréiteach gníomhaire aonair a theorannú.
Mhúnlaigh an meon seo sraith láidir frithbheart atá imscaraithe againn agus a sheasann leis na hionchais slándála atá ag ár n-úsáideoirí.
I gChatGPT, comhcheanglaímid an tsamhail innealtóireachta sóisialta seo le cur chuige níos traidisiúnta innealtóireachta slándála, amhail anailís source-sink.
Sa chreat sin, teastaíonn foinse ó ionsaitheoir agus doirteal araon, is é sin bealach chun tionchar a imirt ar an gcóras agus cumas a éiríonn contúirteach sa chomhthéacs mícheart. I gcás córas gníomhaitheach, ciallaíonn sé sin go minic ábhar seachtrach neamhiontaofa a chomhcheangal le gníomh amhail faisnéis a tharchur chuig tríú páirtí, nasc a leanúint, nó idirghníomhú le huirlis.
Is é ár sprioc croí-ionchas slándála d’úsáideoirí a chaomhnú: níor cheart go dtarlódh gníomhartha a d’fhéadfadh a bheith contúirteach, nó tarchur faisnéise a d’fhéadfadh a bheith íogair, go ciúin ná gan cosaintí cuí.
Is iondúil go mbíonn na hionsaithe a fheicimid á bhforbairt i gcoinne ChatGPT comhdhéanta d’iarracht a chur ina luí ar an gcúntóir gur cheart dó roinnt faisnéise rúnda a thógáil as comhrá agus í a tharchur chuig tríú páirtí mailíseach. I bhformhór na gcásanna is eol dúinn, teipeann ar na hionsaithe seo toisc go gcuireann ár n-oiliúint sábháilteachta ar an ngníomhaire diúltú. Sna cásanna sin ina gcuirtear ina luí ar an ngníomhaire, d’fhorbraíomar straitéis mhaolaithe darb ainm Safe Url atá ceaptha chun a bhrath nuair a tharchuirfí faisnéis a d’fhoghlaim an cúntóir sa chomhrá chuig tríú páirtí. Sna cásanna neamhchoitianta seo, taispeánaimid don úsáideoir an fhaisnéis a tharchuirfí agus iarraimid air a dheimhniú, nó cuirimid bac air agus deirimid leis an ngníomhaire bealach eile a thriail chun dul ar aghaidh le hiarratas an úsáideora.
Baineann an meicníocht chéanna le nascleanúint agus leabharmharcanna in Atlas; agus le cuardaigh agus nascleanúint in Deep Research. Glacann ChatGPT Canvas & ChatGPT Apps cur chuige comhchosúil, rud a cheadaíonn don ghníomhaire feidhmchláir fheidhmiúla a chruthú agus a úsáid—ritheann siad seo i mbosca gainimh atá in ann cumarsáidí gan choinne a bhrath agus toiliú an úsáideora a iarraidh(osclaíonn i bhfuinneog nua).
Is féidir leat tuilleadh eolais faoi Safe Url a léamh agus páipéar a aimsiú faoina struchtúr ina bhlagphost tiomnaithe Do shonraí a choinneáil sábháilte nuair a chliceálann gníomhaire AI nasc.
Tá idirghníomhaíocht shábháilte leis an domhan seachtrach naimhdeach riachtanach do ghníomhairí atá go hiomlán uathrialach. Agus samhail AI á comhtháthú le córas feidhmchláir, molaimid fiafraí cé na rialuithe ba cheart a bheith ag gníomhaire daonna i gcás comhchosúil agus iad sin a chur i bhfeidhm. Táimid ag súil go mbeidh samhail AI ar a huasmhéid faisnéise ábalta cur in aghaidh innealtóireachta sóisialta níos fearr ná gníomhaire daonna, ach ní bhíonn sé sin indéanta ná costéifeachtach i gcónaí ag brath ar an bhfeidhmchlár.
Leanaimid orainn ag fiosrú impleachtaí na hinnealtóireachta sóisialta i gcoinne samhlacha AI agus na gcosaintí ina coinne agus cuirimid ár dtorthaí san áireamh inár n-ailtireachtaí slándála feidhmchláir agus san oiliúint a gcuirimid ár samhlacha AI tríd.
Fonótaí
- 1
Rehberger, J. (2023, 04 15). Ná cuir muinín dall i bhfreagraí LLM. Bagairtí ar róbónna comhrá. EmbraceTheRed. Aisghafa 11 14, 2025, ó https://embracethered.com/blog/posts/2023/ai-injections-threats-context-matters
Údair
Thomas Shadwell, Adrian Spânu


