Ár n-aighneachtaí chuig First Proof
Táimid ag roinnt ár n-iarrachtaí cruthúnais do First Proof, dúshlán matamaitice a thástálann an féidir le IS cruthúnais in-seiceála a tháirgeadh ar fhadhbanna sainsainiúla.
Ritheamar samhail inmheánach ar na 10 bhfadhb ar fad de First Proof(osclaíonn i bhfuinneog nua), dúshlán matamaitice ar leibhéal taighde atá deartha chun a thástáil an féidir le córais IS iarrachtaí cruthúnais cearta agus in-seiceála a tháirgeadh. Murab ionann agus matamaitic gearrfhreagraí nó stíl chomórtais, éilíonn na fadhbanna seo argóintí iomlána ó thús go deireadh i réimsí speisialaithe, agus is deacair cruinneas a bhunú gan athbhreithniú saineolaithe. Is saineolaithe ceannródaíocha ina réimsí féin iad údair fhadhbanna First Proof, agus bhí ar a laghad cúpla ceann de na fadhbanna oscailte ar feadh blianta sular aimsigh na húdair réitigh. D’fhéadfadh roinn acadúil a bhfuil forluí suntasach aici leis na réimsí ábhair go leor de na fadhbanna a réiteach in aon seachtain amháin, is féidir.
Rinneamar comhroinnt(osclaíonn i bhfuinneog nua) ar ár n-iarrachtaí cruthúnais Dé Sathairn, an 14 Feabhra 2026 ag 12:00 AM PT. Bunaithe ar aiseolas ó shaineolaithe, creidimid go bhfuil seans ard ann go bhfuil ar a laghad cúig cinn d’iarrachtaí cruthúnais na samhla (fadhbanna 4, 5, 6, 9, agus 10) ceart, agus tá roinnt eile fós faoi athbhreithniú. Chreideamar ar dtús gur dócha go raibh ár n-iarracht ar fhadhb 2 ceart. Bunaithe ar thráchtaireacht oifigiúil First Proof agus ar anailís bhreise ón bpobal, creidimid anois go bhfuil sí mícheart. Táimid buíoch as an rannpháirtíocht agus táimid ag tnúth le hathbhreithniú leanúnach. Tá ár sraith iomlán d’iarrachtaí cruthúnais le fáil anseo(osclaíonn i bhfuinneog nua). Áirítear sa réamhchló na deich n-iarracht cruthúnais ar fad, chomh maith le hiarscríbhinn nua-bhreise le patrúin leide agus samplaí a bhfuil sé mar aidhm acu ár n-idirghníomhaíochtaí láimhe leis na samhlacha a ionsamhlú le linn an phróisis.
Creidimid gurb é taighde úrnua teorainn b’fhéidir an bealach is tábhachtaí chun cumais na chéad ghlúine eile de shamhail IS a mheas. Tá tagarmharcanna úsáideach, ach is féidir leo cuid de na codanna is deacra den taighde a chailliúint: slabhraí fada réasúnaíochta a chothú, na haibstrithe cearta a roghnú, débhríocht i ráitis fhadhbanna a láimhseáil, agus argóintí a tháirgeadh a sheasann do ghrinnscrúdú saineolaithe. Cabhraíonn dúshláin teorainn cosúil le First Proof linn na cumais sin a bhrú-thástáil i suíomhanna ina bhfuil sé neamhthriobhálach cruinneas a fhíorú agus ina mbíonn na modhanna teipe faisnéiseach.
“Táimid ag traenáil samhail nua faoi láthair arb é príomhfhócas amháin di leibhéal na déine ina smaointeoireacht a mhéadú, agus é mar sprioc go mbeidh an tsamhail in ann smaoineamh go leanúnach ar feadh go leor uaireanta an chloig agus fanacht thar a bheith muiníneach ina conclúidí. Nuair a fógraíodh fadhbanna First Proof, ba chosúil gurbh é an timpeallacht tástála fhoirfe é, mar sin thar an deireadh seachtaine bhain mé triail aisti. Cheana féin bhí sí in ann dhá cheann de na fadhbanna (#9 agus #10) a réiteach. De réir mar a rinne sí traenáil, d’éirigh sí níos cumasaí de réir a chéile, agus sa deireadh réitigh sí—dar linn—trí cinn eile ar a laghad. Bhí áthas orainn go háirithe nuair a réitigh sí #6 agus ansin, dhá lá ina dhiaidh sin, #4, mar go raibh na fadhbanna sin ó réimsí a raibh taithí ag go leor againn orthu. Tá sé dochreidte go maith féachaint ar shamhail ag éirí níos cliste ó lá go lá ar bhealach inbhraite.”
– James R. Lee (Taighdeoir OpenAI, Réasúnaíocht)
Ritheamar an tsamhail le maoirseacht dhaonna theoranta. Nuair a bhíomar ag tabhairt leide do leaganacha den tsamhail le linn na hoiliúna, mholamar uaireanta straitéisí a thriail arís a raibh cuma thairbheach orthu in iarrachtaí níos luaithe. I gcás roinnt iarrachtaí, d’iarramar ar an tsamhail codanna de chruthúnas a leathnú nó a shoiléiriú tar éis aiseolas saineolaithe a fháil, chun an réasúnaíocht a dhéanamh níos éasca a fhíorú. D’éascaíomar malartú anonn is anall freisin idir an tsamhail seo agus ChatGPT le haghaidh fíoraithe, formáidithe agus stíle. I gcás roinnt fadhbanna, cuirimid an ceann is fearr de chúpla iarracht i láthair, roghnaithe de réir breithiúnas daonna. Sprint tapa a bhí anseo, agus ní raibh ár bpróiseas chomh glan agus ba mhaith linn in measúnú a bheadh rialaithe i gceart. Táimid ag tnúth le plé le heagraithe First Proof faoi thurgnamh agus creat measúnaithe níos déine do leaganacha amach anseo.
Tógtar an obair seo ar thorthaí níos luaithe ó shamhlacha teorainn réasúnaíochta sa mhatamaitic agus san eolaíocht. I mí Iúil 2025, bhaineamar feidhmíocht ar leibhéal bonn óir(osclaíonn i bhfuinneog nua) amach ag an Oilimpiad Idirnáisiúnta Matamaitice le samhail réasúnaíochta ilchuspóireach (35/42 pointe). I mí na Samhna 2025, roinneamar “Turgnaimh luatha i luasghéarú na heolaíochta le GPT‑5”, sraith cás-staidéar inar chabhraigh GPT‑5 le taighdeoirí dul chun cinn nithiúil a dhéanamh sa mhatamaitic, san fhisic, sa bhitheolaíocht agus i réimsí eile, chomh maith leis na teorainneacha a thugamar faoi deara. Agus le déanaí féin, thuairiscíomar comhoibriú fisice inar mhol GPT‑5.2 slonn iarrthóra d’fhoirmle aimplitiúide glúóin a chruthaigh samhail inmheánach go foirmiúil ina dhiaidh sin agus a d’fhíoraigh na húdair.
Táimid ag tnúth le rannpháirtíocht níos doimhne leis an bpobal maidir le conas réasúnaíocht ar leibhéal taighde a mheas, lena n-áirítear aiseolas saineolaithe ar na hiarrachtaí seo, agus táimid ar bís na cumais nua seo a chur ar fáil i samhlacha poiblí amach anseo.


