5 Márta 2026

GPT‑5.4 á thabhairt isteach

Deartha d’obair ghairmiúil

Ag lódáil…

Inniu, táimid ag scaoileadh GPT‑5.4 i ChatGPT (mar GPT‑5.4 Thinking), san API, agus i Codex. Is í ár samhail teorainn is cumasaí agus is éifeachtúla d’obair ghairmiúil. Táimid ag scaoileadh GPT‑5.4 Pro freisin i ChatGPT agus san API, do dhaoine ar mian leo uasfheidhmíocht ar thascanna casta.

Tugann GPT‑5.4 an chuid is fearr dár ndul chun cinn le déanaí i réasúnaíocht, códú, agus sreafaí oibre gníomhaireacha le chéile in aon tsamhail teorainn amháin. Ionchorpraíonn sé cumais chódaithe cheannródaíocha tionscail GPT‑5.3‑Codex⁠ agus é ag feabhsú an chaoi a n-oibríonn an tsamhail ar fud uirlisí, timpeallachtaí bogearraí, agus tascanna gairmiúla a bhaineann le scarbhileoga, cur i láthair, agus doiciméid. Is é an toradh samhail a chuireann fíorobair chasta i gcrích go cruinn, go héifeachtach, agus go hinscálaithe—ag seachadadh an méid a d’iarr tú le níos lú anonn is anall.

I ChatGPT, is féidir le GPT‑5.4 Thinking plean tosaigh dá smaointeoireacht a sholáthar anois, ionas gur féidir leat an treo a choigeartú i lár an fhreagra agus é ag obair, agus aschur deiridh a bhaint amach atá níos gaire don mhéid atá uait gan casanna breise. Feabhsaíonn GPT‑5.4 Thinking freisin taighde domhain gréasáin, go háirithe do cheisteanna an-sonracha, agus é ag coinneáil comhthéacs níos fearr do cheisteanna a éilíonn smaointeoireacht níos faide. Le chéile, ciallaíonn na feabhsuithe seo freagraí ar chaighdeán níos airde a thagann níos tapúla agus a fhanann ábhartha don tasc atá idir lámha.

I Codex agus san API, is é GPT‑5.4 an chéad tsamhail ilchuspóireach atá scaoilte againn le cumais úsáid ríomhaire dhúchasacha den chéad scoth, rud a chuireann ar chumas gníomhairí ríomhairí a oibriú agus sreafaí oibre casta a dhéanamh ar fud feidhmchlár. Tacaíonn sé le suas le 1M téacschomhartha comhthéacs, rud a ligeann do ghníomhairí tascanna a phleanáil, a fhorghníomhú, agus a fhíorú thar thréimhsí fada. Feabhsaíonn GPT‑5.4 freisin an chaoi a n-oibríonn samhlacha ar fud éiceachóras mór uirlisí agus nascóirí le cuardach uirlisí, ag cabhrú le gníomhairí na huirlisí cearta a aimsiú agus a úsáid ar bhealach níos éifeachtúla gan éirim a íobairt. Ar deireadh, is é GPT‑5.4 ár samhail réasúnaíochta is éifeachtúla ó thaobh téacschomharthaí de go fóill, agus i bhfad níos lú téacschomharthaí á n-úsáid aige chun fadhbanna a réiteach i gcomparáid le GPT‑5.2—rud a aistrítear go húsáid laghdaithe téacschomharthaí agus luasanna níos tapúla.

In éineacht le dul chun cinn i réasúnaíocht ghinearálta, códú, agus obair eolais ghairmiúil, cuireann GPT‑5.4 gníomhairí níos iontaofa, sreafaí oibre forbróirí níos tapúla, agus aschuir ar chaighdeán níos airde ar fáil ar fud ChatGPT, an API, agus Codex.

	GPT‑5.4	GPT‑5.3‑Codex	GPT‑5.2
GDPval (wins or ties)	83.0%	70.9%	70.9%
SWE-Bench Pro (Public)	57.7%	56.8%	55.6%
OSWorld-Verified	75.0%	74.0%*	47.3%
Toolathlon	54.6%	51.9%	46.3%
BrowseComp	82.7%	77.3%	65.8%

*Previously reported as 64.7%. GPT‑5.3‑Codex achieves 74.0% with a newly introduced API parameter that preserves the original image resolution.

Obair eolais

Ag tógáil ar chumais réasúnaíochta ghinearálta GPT‑5.2, seachadann GPT‑5.4 torthaí níos comhsheasmhaí agus níos snasta fós ar thascanna sa saol fíor atá tábhachtach do ghairmithe.

Ar GDPval⁠, a thástálann cumas gníomhairí obair eolais atá sainithe go soiléir a tháirgeadh ar fud 44 gairm, baineann GPT‑5.4 caighdeán úrnua amach, ag meaitseáil nó ag sárú gairmithe tionscail i 83.0% de na comparáidí, i gcomparáid le 70.9% do GPT‑5.2.

In GDPval, déanann samhlacha iarracht ar obair eolais atá sainithe go soiléir a chlúdaíonn 44 gairm ó na 9 dtionscal is mó a chuireann le OTI SAM. Iarrann tascanna táirgí fíoroibre, ar nós cur i láthair díolacháin, scarbhileoga cuntasaíochta, sceidil chúraim phráinnigh, léaráidí déantúsaíochta, nó físeáin ghearra. Socraíodh iarracht réasúnaíochta go xhigh do GPT‑5.4 agus heavy do GPT‑5.2 (leibhéal beagán níos ísle i ChatGPT).

“Is é GPT-5.4 an tsamhail is fearr ar bhain muid triail aisti riamh. Tá sé anois ar bharr an chláir ceannairí ar ár dtagarmharc APEX-Agents, a thomhaiseann feidhmíocht samhlacha d’obair seirbhísí gairmiúla. Sáraíonn sé i gcruthú inseachadtaí fadtréimhseacha cosúil le deiceanna sleamhnán, samhlacha airgeadais, agus anailís dlí, ag seachadadh barrfheidhmíochta agus é ag rith níos tapúla agus ar chostas níos ísle ná samhlacha teorainn iomaíocha.”

— Brendan Foody, POF ag Mercor

Dhíríomar go háirithe ar chumas GPT‑5.4 scarbhileoga, cur i láthair, agus doiciméid a chruthú agus a chur in eagar a fheabhsú. Ar thagarmharc inmheánach de thascanna samhaltaithe scarbhileog a d’fhéadfadh anailísí baincéireachta infheistíochta sóisearach a dhéanamh, baineann GPT‑5.4 meánscór 87.3% amach, i gcomparáid le 68.4% do GPT‑5.2. Ar shraith leideanna meastóireachta cur i láthair, b’fhearr le meastóirí daonna cur i láthair ó GPT‑5.4 68.0% den am thar iad siúd ó GPT‑5.2 mar gheall ar aeistéitic níos láidre, éagsúlacht amhairc níos mó, agus úsáid níos éifeachtaí as giniúint íomhá.

Sampla taobh le taobh d’aschuir scarbhileoige ó GPT-5.2 vs GPT-5.4

Gineadh na doiciméid agus an iarracht réasúnaíochta socraithe go xhigh

Is féidir leat triail a bhaint as na cumais seo i ChatGPT ag úsáid GPT‑5.4 Thinking nó Pro. Más custaiméir Enterprise thú, molaimid ár mbreiseán ChatGPT for Excel⁠(osclaíonn i bhfuinneog nua) nua-scaoilte a úsáid, a seoladh inniu freisin. Tá ár scileanna scarbhileoige⁠(osclaíonn i bhfuinneog nua) agus cur i láthair⁠(osclaíonn i bhfuinneog nua) ar fáil i Codex agus san API nuashonraithe againn freisin.

Chun GPT‑5.4 a dhéanamh níos fearr don fhíorobair sa saol, leanamar lenár ndul chun cinn maidir le siabhránachtaí agus earráidí a laghdú. Is é GPT‑5.4 an tsamhail is fíorasúla atá againn go fóill: ar shraith leideanna dí-aitheanta inar chuir úsáideoirí earráidí fíorasacha in iúl, tá éilimh aonair GPT‑5.4 33% níos lú seansach a bheith bréagach agus tá a fhreagraí iomlána 18% níos lú seansach go mbeadh aon earráidí iontu, i gcoibhneas le GPT‑5.2.

“Socraíonn GPT-5.4 caighdeán nua d’obair dlí atá trom ó thaobh doiciméad de. Ar ár meastóireacht BigLaw Bench, scóráil sé 91%. I gcomparáid le samhlacha eile, tá GPT-5.4 níos fearr faoi láthair ag struchtúrú anailíse idirbheartaí casta, ag coinneáil cruinnis ar fud conarthaí fada, agus ag seachadadh an leibhéil ard sonraí a éilíonn cleachtóirí dlí.”

— Niko Grupen, Ceann Taighde Feidhmigh ag Harvey

Úsáid ríomhaire agus fís

Is í GPT‑5.4 ár gcéad tsamhail ilchuspóireach le cumais dhúchasacha úsáid ríomhaire agus léiríonn sí céim mhór chun cinn d’fhorbróirí agus do ghníomhairí araon. Is í an tsamhail is fearr atá ar fáil faoi láthair d’fhorbróirí atá ag tógáil gníomhairí a chríochnaíonn fíorthascanna ar fud suíomhanna gréasáin agus córas bogearraí.

Tá GPT‑5.4 deartha againn le bheith ardfheidhmíochta ar fud réimse leathan ualaí oibre úsáid ríomhaire. Tá sé ar fheabhas ag scríobh cód chun ríomhairí a oibriú trí leabharlanna cosúil le Playwright, chomh maith le horduithe luchóige agus méarchláir a eisiúint mar fhreagra ar seatanna scáileáin. Is féidir a iompar a stiúradh trí theachtaireachtaí forbróra, rud a chiallaíonn gur féidir le forbróirí iompar a choigeartú d’úsáidchásanna áirithe. Is féidir le forbróirí fiú iompar sábháilteachta na samhla a chumrú do leibhéil éagsúla lamháltais riosca trí bheartais dheimhnithe shaincheaptha a shonrú.

Léirítear feidhmíocht agus solúbthacht na samhla ar fud tagarmharcanna a thástálann úsáid ríomhaire i suíomhanna éagsúla. Ar OSWorld-Verified, a thomhaiseann cumas samhla timpeallacht deisce a nascleanúint trí seatanna scáileáin agus gníomhartha méarchláir/luchóige, baineann GPT‑5.4 ráta ratha den chéad scoth 75.0% amach, i bhfad níos airde ná 47.3% GPT‑5.2, agus níos fearr ná feidhmíocht dhaonna ag 72.4%.¹

Ar WebArena-Verified, a thástálann úsáid bhrabhsálaí, baineann GPT‑5.4 ráta ratha tosaigh 67.3% amach agus idirghníomhaíocht bunaithe ar DOM agus ar seatanna scáileáin á húsáid aige, i gcomparáid le 65.4% GPT‑5.2. Ar Online-Mind2Web, a thástálann úsáid bhrabhsálaí freisin, baineann GPT‑5.4 ráta ratha 92.8% amach ag úsáid breathnuithe bunaithe ar seatanna scáileáin amháin, feabhas ar Mód Gníomhaire Atlas ChatGPT, a bhaineann ráta ratha 70.9% amach.

Is toradh uirlise é nuair a thugann cúntóir pas chun freagraí uirlise a fhanacht. Má ghlaotar 3 uirlis i gcomhthreo, agus ansin 3 uirlis eile i gcomhthreo, bheadh líon na dtorthaí cothrom le 2. Is ionadaí níos fearr iad torthaí uirlise ar mhoill ná glaonna uirlise mar go léiríonn siad buntáistí an chomhthreomharaithe.

Léirmhíníonn GPT‑5.4 seatanna scáileáin de chomhéadan brabhsálaí agus idirghníomhaíonn sé le heilimintí Comhéadain trí chliceáil bunaithe ar chomhordanáidí chun ríomhphoist a sheoladh agus imeacht féilire a sceidealú. Níor luasaíodh an físeán.

Tá úsáid ríomhaire fheabhsaithe GPT‑5.4 bunaithe ar chumais fheabhsaithe ghinearálta braite amhairc na samhla. Ar MMMU-Pro, tástáil ar thuiscint amhairc agus réasúnaíocht samhla, baineann GPT‑5.4 ráta ratha 81.2% amach gan úsáid uirlise, feabhas ar 79.5% GPT‑5.2. Aistrítear braite amhairc níos fearr go cumais níos fearr parsála doiciméad freisin. Ar OmniDocBench, baineann GPT‑5.4 gan iarracht réasúnaíochta meánearráid amach (tomhaiste ag achar eagarthóireachta normalaithe idir tuar na samhla agus an fhírinne bhunúsach) de 0.109, feabhsaithe ó 0.140 GPT‑5.2.

Ritheadh MMMUPro agus an iarracht réasúnaíochta socraithe go xhigh. Ritheadh OmniDocBench agus an iarracht réasúnaíochta socraithe go none, chun feidhmíocht ar chostas íseal agus moill íseal a léiriú.

Táimid ag feabhsú tuiscint amhairc freisin d’íomhánna dlútha, ardtaifigh ina bhfuil dílseacht iomlán tábhachtach. Ag tosú le GPT‑5.4, táimid ag tabhairt isteach leibhéal mionsonraí ionchuir⁠(osclaíonn i bhfuinneog nua) íomhá original a thacaíonn le braite lán-dílseachta suas le 10.24M picteilín iomlán nó uasthoise 6000 picteilín, cibé acu is ísle; tacaíonn leibhéal mionsonraí ionchuir íomhá high anois le suas le 2.56M picteilín iomlán nó uasthoise 2048 picteilín. I dtástáil luath le húsáideoirí API, thugamar faoi deara gnóthachain láidre i gcumas logánaithe, tuiscint íomhá, agus cruinneas cliceála nuair a bhí mionsonraí original nó high á n-úsáid.

“Inár meastóireachtaí a thomhaiseann feidhmíocht úsáid ríomhaire ar fud ~30K tairseach HOA agus cánach maoine, bhain GPT-5.4 ráta ratha 95% amach ar an gcéad iarracht agus 100% laistigh de thrí iarracht, i gcomparáid le ~73–79% le samhlacha CUA roimhe seo. Chríochnaigh sé seisiúin ~3x níos tapúla freisin agus ~70% níos lú téacschomharthaí á n-úsáid aige, rud a chuir feabhas suntasach ar iontaofacht agus ar éifeachtúlacht costais ag scála.”

— Dod Fraser, POF ag Mainstay

San API, is féidir le forbróirí rochtain a fháil ar na cumais seo ag úsáid na huirlise computer nuashonraithe. Féach ar ár ndoiciméadú nuashonraithe⁠(osclaíonn i bhfuinneog nua) le haghaidh dea-chleachtas molta.

Códú

Comhcheanglaíonn GPT‑5.4 láidreachtaí códaithe GPT‑5.3‑Codex le cumais cheannródaíocha obair eolais agus úsáid ríomhaire, atá is tábhachtaí ar thascanna a ritheann níos faide áit ar féidir leis an tsamhail uirlisí a úsáid, atriall a dhéanamh, agus obair a bhrú chun cinn le níos lú idirghabhála láimhe. Meaitseálann sé nó sáraíonn sé GPT‑5.3‑Codex ar SWE-Bench Pro agus moill níos ísle aige ar fud iarrachtaí réasúnaíochta.

Measaimid moille trí bhreathnú ar iompar táirgthe ár samhlacha, agus trí é seo a insamhlú as líne. Cuireann an meastachán moille fad glaonna uirlisí (am rite cód), téacschomharthaí sampláilte, agus téacschomharthaí ionchuir san áireamh. D’fhéadfadh moill sa saol fíor athrú go mór, agus braitheann sí ar go leor tosca nach ngabhann ár n-insamhlú. Scuabadh iarrachtaí réasúnaíochta ó none go xhigh.

Nuair a chuirtear ar siúl é, seachadann mód /fast i Codex luas téacschomharthaí suas le 1.5x níos tapúla le GPT‑5.4. Is í an tsamhail chéanna agus an éirim chéanna í, díreach níos tapúla. Ciallaíonn sé sin gur féidir le húsáideoirí bogadh trí thascanna códaithe, atriall, agus dífhabhtú agus fanacht sa tsruth. Is féidir le forbróirí rochtain a fháil ar GPT‑5.4 ag na luasanna tapa céanna tríd an API trí phróiseáil tosaíochta⁠(osclaíonn i bhfuinneog nua) a úsáid.

I meastóireacht agus i dtástáil inmheánach fuaireamar amach go sáraíonn GPT‑5.4 i dtascanna casta frontend, le torthaí i bhfad níos aeistéitiúla agus níos feidhmiúla ná aon samhlacha a sheolamar roimhe seo.

Mar léiriú ar chumais fheabhsaithe úsáid ríomhaire agus códaithe na samhla ag obair as lámh a chéile, táimid ag scaoileadh scil thurgnamhach Codex freisin ar a dtugtar “Playwright (Interactive)⁠(osclaíonn i bhfuinneog nua)”. Ligeann sé seo do Codex dífhabhtú amhairc a dhéanamh ar aipeanna gréasáin agus Electron; is féidir é a úsáid fiú chun aip atá á tógáil aige a thástáil agus é á tógáil.

Cluiche insamhlaithe páirce téamaí a rinneadh le GPT‑5.4 ó leid aonair ar bheagán sonraíochta, ag úsáid Playwright Interactive le haghaidh súgradhthástála sa bhrabhsálaí agus giniúint íomhá don tacar sócmhainní isiméadracha. Áirítear leis an insamhlú leagan cosáin bunaithe ar thíleanna, tógáil turas agus radharcra, aimsiú cosáin aíonna, scuaineáil, agus timthriallta turas, agus ardóidh nó titfidh méadrachtaí páirce cosúil le hairgead, líon aíonna, sonas, glaineacht, agus rátáil bunaithe ar conas a fheidhmíonn an leagan amach agus conas a fhreagraíonn aíonna dó. Úsáideadh Playwright chun súgradhthástálacha brabhsálaí a uathoibriú tríd an bpáirc a thógáil agus a leathnú, cosáin agus nithe meallta a chur agus a bhaint, nascleanúint an cheamara a sheiceáil, agus a fhíorú gur nuashonraíodh aíonna, scuainí, staid na dturas, agus méadrachtaí an Chomhéadain i gceart thar roinnt babhtaí súgartha.

Leid: Use $playwright-interactive and $imagegen. Create an interactive isometric theme park simulation game that I can build and navigate in the browser. Use imagegen to establish the overall visual vision and generate the game’s assets, including rides, paths, terrain, trees, water, food stalls, decorations, buildings, icons, and UI illustrations. The world should feel cohesive, polished, and visually rich, with a premium art direction that works well from an isometric perspective. Let me place and remove paths, add attractions, position scenery, and move around the park smoothly while monitoring guest activity, ride status, and park growth. Include believable guest movement, simple park management systems like money, cleanliness, queueing, and happiness, and make the experience feel playful, clear, and complete rather than like a rough prototype. Prioritize charm, readability, and strong game feel over realism.

When play testing, be sure to build and expand a park through several rounds of play, verify that placement and navigation work smoothly, confirm that guests react to the park layout and attractions, and ensure the visuals, UI, and interactions feel stable and cohesive.

“Tá GPT-5.4 ar thús cadhnaíochta faoi láthair ar ár dtagarmharcanna inmheánacha. Measann ár n-innealtóirí go bhfuil sé níos nádúrtha agus níos dearfaí ná samhlacha roimhe seo. Oibríonn sé trí fhadhbanna débhríocha gan é féin a chur in amhras, agus bíonn sé réamhghníomhach maidir le hobair a chomhthreomharú chun rudaí a choinneáil ag gluaiseacht.”

— Lee Robinson, Leas-Uachtarán Oideachais d’Fhorbróirí ag Cursor

Úsáid uirlisí

Le GPT‑5.4, tá feabhas suntasach curtha againn ar an gcaoi a n-oibríonn samhlacha le huirlisí seachtracha. Is féidir le gníomhairí oibriú anois ar fud éiceachóras uirlisí níos mó, na huirlisí cearta a roghnú ar bhealach níos iontaofa, agus sreafaí oibre ilchéime a chríochnú ar chostas agus moill níos ísle.

Cuardach uirlisí

San API, tugann GPT‑5.4 isteach cuardach uirlisí⁠(osclaíonn i bhfuinneog nua), a ligeann do shamhlacha oibriú go héifeachtúil nuair a thugtar go leor uirlisí dóibh.

Roimhe seo, nuair a tugadh uirlisí do shamhail, cuireadh gach sainmhíniú uirlise san áireamh sa leid roimh ré. I gcórais le go leor uirlisí, d’fhéadfadh sé seo na mílte—nó fiú na deicheanna mílte—téacschomhartha a chur le gach iarratas, rud a mhéadaigh costas, a mhoilligh freagraí, agus a líon an comhthéacs le faisnéis nach mb’fhéidir go n-úsáidfeadh an tsamhail riamh.

Le cuardach uirlisí, ina ionad sin faigheann GPT‑5.4 liosta éadrom d’uirlisí atá ar fáil mar aon le cumas cuardaigh uirlisí. Nuair is gá don tsamhail uirlis a úsáid, is féidir leis sainmhíniú na huirlise sin a lorg agus é a chur leis an gcomhrá ag an nóiméad sin.

Laghdaíonn an cur chuige seo go mór líon na dtéacschomharthaí a theastaíonn do shreafaí oibre trom-uirlise agus caomhnaíonn sé an taisce, rud a fhágann go bhfuil iarratais níos tapúla agus níos saoire. Cuireann sé ar chumas gníomhairí freisin oibriú go hiontaofa le héiceachórais uirlisí i bhfad níos mó. I gcás freastalaithe MCP a bhféadfadh deicheanna mílte téacschomhartha de shainmhínithe uirlise a bheith iontu, d’fhéadfadh na gnóthachain éifeachtúlachta a bheith suntasach.

Chun na gnóthachain éifeachtúlachta a léiriú, rinneamar meastóireacht ar 250 tasc ó thagarmharc MCP Atlas⁠(osclaíonn i bhfuinneog nua) Scale agus gach ceann de na 36 freastalaí MCP cumasaithe i dhá mhodh: (1) gach feidhm MCP a nochtadh go díreach i gcomhthéacs na samhla, agus (2) gach freastalaí MCP a chur taobh thiar de chuardach uirlisí. Laghdaigh cumraíocht cuardaigh uirlisí úsáid iomlán téacschomharthaí faoi 47% agus an cruinneas céanna á bhaint amach aici.

Tagann líon samplach téacschomharthaí ó mheánú 250 tasc sa tacar sonraí poiblí MCP-Atlas.

Glaoch uirlisí gníomhaireach

Feabhsaíonn GPT‑5.4 freisin glaoch uirlisí, rud a fhágann go bhfuil sé níos cruinne agus níos éifeachtúla agus é ag cinneadh cathain agus conas uirlisí a úsáid le linn réasúnaíochta, go háirithe san API. I gcomparáid le GPT‑5.2, baineann sé cruinneas níos airde amach i níos lú casanna ar Toolathlon, tagarmharc a thástálann cé chomh maith agus is féidir le gníomhairí AI uirlisí agus APIanna sa saol fíor a úsáid chun tascanna ilchéime a chríochnú. Mar shampla, ní mór do ghníomhaire ríomhphoist a léamh, ceangaltáin sannacháin a bhaint astu, iad a uaslódáil, iad a ghrádú agus torthaí a thaifeadadh i scarbhileog.

I gcás úsáidchásanna atá íogair do mhoill áit a mbronntar tosaíocht d’iarracht réasúnaíochta None, feabhsaíonn GPT‑5.4 níos mó fós ar a réamhtheachtaithe.

In τ2-bench⁠⁠(osclaíonn i bhfuinneog nua), ní mór do shamhail uirlisí a úsáid chun tasc seirbhíse custaiméara a chur i gcrích, áit a bhféadfadh úsáideoir insamhlaithe a bheith ann ar féidir leis cumarsáid a dhéanamh agus gníomhartha a dhéanamh ar staid an domhain. Socraíodh iarracht réasúnaíochta go None.

Cuardach gréasáin feabhsaithe

Tá GPT‑5.4 níos fearr ag cuardach gréasáin gníomhaireach. Ar BrowseComp, tomhas ar cé chomh maith agus is féidir le gníomhairí AI an gréasán a bhrabhsáil go seasmhach chun faisnéis atá deacair a aimsiú a fháil, léimeann GPT‑5.4 17%_abs os cionn GPT‑5.2, agus socraíonn GPT‑5.4 Pro caighdeán úrnua de 89.3%.

Go praiticiúil, ciallaíonn sé seo go bhfuil GPT‑5.4 Thinking níos láidre ag freagairt ceisteanna a éilíonn faisnéis a thabhairt le chéile ó go leor foinsí ar an ngréasán. Is féidir leis cuardach níos seasmhaí a dhéanamh thar iliomad babhtaí chun na foinsí is ábhartha a shainaithint, go háirithe do cheisteanna “snáthaid sa chruach féir”, agus iad a shintéisiú i bhfreagra soiléir dea-réasúnaithe.

In BrowseComp, d’úsáideamar blocliosta cuardaigh a d’eisiaigh suíomhanna gréasáin ina raibh freagraí tagarmhairc ón meastóireacht chun éilliú a chosc agus tomhas cothrom feidhmíochta a chinntiú. Tomhaiseadh GPT‑5.4 ar dháta níos déanaí ná GPT‑5.2, mar sin léiríonn na scóir athruithe sa tsamhail, inár gcóras cuardaigh, agus i staid an idirlín. Tástáladh GPT‑5.4 le blocliosta níos faide agus nuashonraithe. Úsáideann samhlacha uirlis chuardaigh ChatGPT, a bhféadfadh difríochtaí beaga a bheith aici ó chuardach API.

“Is é GPT-5.4 xhigh an caighdeán úrnua d’úsáid uirlisí ilchéime. Ritheann Zapier cuid de na tagarmharcanna úsáide uirlisí is déine sa tionscal, ag tástáil samhlacha ar fud na gcéadta sreabhadh oibre ardleibhéil sa saol fíor. Chríochnaigh GPT-5.4 an jab nuair a ghéill samhlacha roimhe seo - an tsamhail is seasmhaí go dtí seo.”

— Wade, POF ag Zapier

Inrialaitheacht

Cosúil leis an gcaoi a leagann Codex amach a chur chuige nuair a thosaíonn sé ag obair, leagfaidh GPT‑5.4 Thinking i ChatGPT a chuid oibre amach anois le preamble do cheisteanna níos faide agus níos casta. Is féidir leat treoracha a chur leis freisin nó a threo a choigeartú i lár an fhreagra. Déanann sé seo níos éasca an tsamhail a threorú i dtreo an toraidh bheachta atá uait gan tosú arís nó gan iliomad casanna breise a bheith ag teastáil. Tá an ghné seo ar fáil anois ar chatgpt.com⁠(osclaíonn i bhfuinneog nua) agus ar an aip Android, agus beidh sí ag teacht go luath chuig an aip iOS.

Is féidir leis an tsamhail smaoineamh níos faide freisin ar thascanna deacra agus feasacht níos láidre a choinneáil ar chéimeanna níos luaithe sa chomhrá. Ligeann sé seo di sreafaí oibre níos faide agus leideanna níos casta a láimhseáil agus freagraí a choinneáil comhleanúnach agus ábhartha tríd síos.

Luasaíodh an físeán seo chun críocha léirithe.

Sábháilteacht

Le míonna beaga anuas, leanamar le feabhas a chur ar na cosaintí a thugamar isteach le GPT‑5.3‑Codex agus GPT‑5.4 á hullmhú le haghaidh imscartha. Cosúil le GPT‑5.3‑Codex, táimid ag caitheamh le GPT‑5.4 mar chumhacht chibear Ard faoi ár gCreata Ullmhachta, agus táimid á imscaradh leis na cosaintí comhfhreagracha mar atá doiciméadaithe sa chárta córais⁠(osclaíonn i bhfuinneog nua). Áirítear orthu sin cruach sábháilteachta cibear leathnaithe, lena n-áirítear córais mhonatóireachta, rialuithe rochtana iontaofa, agus bacáil asincrónach d’iarratais níos airde riosca do chustaiméirí ar dhromchlaí Gan Coinneáil Sonraí (ZDR), chomh maith le hinfheistíocht leanúnach san éiceachóras slándála níos leithne.

Toisc go bhfuil cumais chibearshlándála dé-úsáideach ó nádúr, coinnímid cur chuige réamhchúramach maidir le himscaradh agus muid ag leanúint orainn ag calabrú ár mbeartas agus ár n-aicmitheoirí. I gcás custaiméirí áirithe ar dhromchlaí ZDR, tá bacáil ar leibhéal iarratais fós mar chuid dár gcruach maolaithe riosca cibear; toisc go bhfuil aicmitheoirí fós á bhfeabhsú, d’fhéadfadh roinnt dearfacha bréagacha tarlú agus muid ag leanúint orainn leis na cosaintí seo a mhionchoigeartú. Tá sé mar aidhm ag na nuashonruithe seo feabhas a chur ar an gcaoi a n-oibríonn cosaintí go praiticiúil, lena n-áirítear diúltuithe neamhriachtanacha agus freagraí róchúramacha a laghdú, agus cosaintí láidre i gcoinne mí-úsáide á gcaomhnú.

Leanamar lenár dtaighde sábháilteachta ar mhonatóirí Intinne Slabhraí (CoT) chun tuiscint níos fearr a fháil ar an gcaoi a réasúnaíonn samhlacha agus chun cabhrú le drochiompar féideartha a bhrath. Mar chuid den obair seo, tugaimid isteach meastóireacht nua foinse oscailte, inrialaitheacht CoT⁠, a thomhaiseann an féidir le samhlacha a réasúnaíocht a cheilt d’aon ghnó chun monatóireacht a sheachaint. Faighimid amach go bhfuil cumas GPT‑5.4 Thinking a CoT a rialú íseal, rud atá dearfach don tsábháilteacht, agus a thugann le fios nach bhfuil an cumas ag an tsamhail a réasúnaíocht a cheilt agus go bhfuil monatóireacht CoT fós ina huirlis sábháilteachta éifeachtach.

Infhaighteacht agus praghsáil

Tá GPT‑5.4 á rolladh amach de réir a chéile inniu ar fud ChatGPT agus Codex. San API, tá GPT‑5.4 ar fáil anois mar gpt-5.4. Tá GPT‑5.4 Pro ar fáil freisin san API mar gpt-5.4-pro d’fhorbróirí a bhfuil uasfheidhmíocht ag teastáil uathu ar na tascanna is casta.

I ChatGPT, tá GPT‑5.4 Thinking ar fáil ag tosú inniu d’úsáideoirí ChatGPT Plus, Team, agus Pro, agus é in áit GPT‑5.2 Thinking. Fanfaidh GPT‑5.2 Thinking ar fáil ar feadh trí mhí d’úsáideoirí íoctha sa roghnóir samhlacha faoin rannán Legacy Models, agus ina dhiaidh sin scoirfear é an 5 Meitheamh 2026. Is féidir leo siúd ar phleananna Enterprise agus Edu luathrochtain a chumasú trí shocruithe riarthóra. Tá GPT‑5.4 Pro ar fáil do phleananna Pro agus Enterprise. Fanann fuinneoga comhthéacs⁠(osclaíonn i bhfuinneog nua) i ChatGPT do GPT‑5.4 Thinking gan athrú ó GPT‑5.2 Thinking.

Is í GPT‑5.4 ár gcéad phríomhlíne samhail réasúnaíochta a ionchorpraíonn cumais chódaithe teorainn GPT‑5.3‑codex agus atá á rolladh amach ar fud ChatGPT, an API agus Codex. Táimid á tabhairt mar GPT‑5.4 chun an léim sin a léiriú, agus chun an rogha idir samhlacha a shimpliú agus Codex á úsáid. Le himeacht ama, is féidir leat a bheith ag súil go dtiocfaidh ár samhlacha Instant agus ár samhlacha Thinking chun cinn ar luasanna éagsúla.

Áirítear le GPT‑5.4 i Codex tacaíocht thurgnamhach don fhuinneog chomhthéacs 1M. Is féidir le forbróirí triail a bhaint as seo trí model_context_window agus model_auto_compact_token_limit a chumrú. Déantar iarratais a sháraíonn an ghnáthfhuinneog chomhthéacs 272K a chomhaireamh i gcoinne teorainneacha úsáide ag 2x an ghnáthráta.

San API, tá praghas níos airde in aghaidh an téacschomhartha ar GPT‑5.4 ná GPT‑5.2 chun a chumais fheabhsaithe a léiriú, agus cuidíonn a éifeachtúlacht níos mó ó thaobh téacschomharthaí de líon iomlán na dtéacschomharthaí a theastaíonn do go leor tascanna a laghdú. Tá praghsáil Batch agus Flex ar fáil ag leath an ghnáthráta API, agus tá próiseáil Priority ar fáil ag dúbailt an ghnáthráta API.

Samhail API	Praghas ionchuir	Praghas ionchuir i dtaisce	Praghas aschuir
gpt-5.2	$1.75 / M tokens	$0.175 / M tokens	$14 / M tokens
gpt-5.4	$2.50 / M tokens	$0.25 / M tokens	$15 / M tokens
gpt-5.2-pro	$21 / M tokens	-	$168 / M tokens
gpt-5.4-pro	$30 / M tokens	-	$180 / M tokens

Meastóireachtaí

Gairmiúil

Meastóireacht	GPT‑5.4	GPT‑5.4 Pro	GPT‑5.3-Codex	GPT‑5.2	GPT‑5.2 Pro
GDPval	83.0%	82.0%	70.9%	70.9%	74.1%
FinanceAgent v1.1	56.0%	61.5%	54.0%	59.5%	—
Tascanna Samhaltaithe Baincéireachta Infheistíochta (Inmheánach)	87.3%	83.6%	79.3%	68.4%	71.7%
OfficeQA	68.1%	—	65.1%	63.1%	—

Códú

Meastóireacht	GPT‑5.4	GPT‑5.4 Pro	GPT‑5.3-Codex	GPT‑5.2	GPT‑5.2 Pro
SWE-Bench Pro (Poiblí)	57.7%	—	56.8%	55.6%	—
Terminal-Bench 2.0	75.1%	—	77.3%	62.2%	—

Úsáid ríomhaire agus fís

Meastóireacht	GPT‑5.4	GPT‑5.4 Pro	GPT‑5.3-Codex	GPT‑5.2	GPT‑5.2 Pro
OSWorld-Verified	75.0%	—	74.0%	47.3%	—
MMMU Pro (gan uirlisí)	81.2%	—	—	79.5%	—
MMMU Pro (le huirlisí)	82.1%	—	—	80.4%	—

Úsáid uirlisí

Meastóireacht	GPT‑5.4	GPT‑5.4 Pro	GPT‑5.3-Codex	GPT‑5.2	GPT‑5.2 Pro
BrowseComp	82.7%	89.3%	77.3%	65.8%	77.9%
MCP Atlas	67.2%	—	—	60.6%	—
Toolathlon	54.6%	—	51.9%	45.7%	—
Tau2-bench Telecom	98.9%	—	—	98.7%	—

Acadúil

Meastóireacht	GPT‑5.4	GPT‑5.4 Pro	GPT‑5.3-Codex	GPT‑5.2	GPT‑5.2 Pro
Taighde Eolaíochta Teorainn	33.0%	36.7%	—	25.2%	—
FrontierMath Sraith 1–3	47.6%	50.0%	—	40.7%	—
FrontierMath Sraith 4	27.1%	38.0%	—	18.8%	31.3%
GPQA Diamond	92.8%	94.4%	92.6%	92.4%	93.2%
Humanity's Last Exam (gan uirlisí)	39.8%	42.7%	—	34.5%	36.6%
Humanity's Last Exam (le huirlisí)	52.1%	58.7%	—	45.5%	50.0%

Comhthéacs fada

Meastóireacht	GPT‑5.4	GPT‑5.4 Pro	GPT‑5.3-Codex	GPT‑5.2	GPT‑5.2 Pro
Graphwalks BFS 0K–128K	93.0%	—	—	94.0%	—
Graphwalks BFS 256K–1M	21.4%	—	—	—	—
Graphwalks parents 0–128K (cruinneas)	89.8%	—	—	89.0%	—
Graphwalks parents 256K–1M (cruinneas)	32.4%	—	—	—	—
OpenAI MRCR v2 8-needle 4K–8K	97.3%	—	—	98.2%	—
OpenAI MRCR v2 8-needle 8K–16K	91.4%	—	—	89.3%	—
OpenAI MRCR v2 8-needle 16K–32K	97.2%	—	—	95.3%	—
OpenAI MRCR v2 8-needle 32K–64K	90.5%	—	—	92.0%	—
OpenAI MRCR v2 8-needle 64K–128K	86.0%	—	—	85.6%	—
OpenAI MRCR v2 8-needle 128K–256K	79.3%	—	—	77.0%	—
OpenAI MRCR v2 8-needle 256K–512K	57.5%	—	—	—	—
OpenAI MRCR v2 8-needle 512K–1M	36.6%	—	—	—	—

Réasúnaíocht theibí

Meastóireacht	GPT‑5.4	GPT‑5.4 Pro	GPT‑5.3-Codex	GPT‑5.2	GPT‑5.2 Pro
ARC-AGI-1 (Fíoraithe)	93.7%	94.5%	—	86.2%	90.5%
ARC-AGI-2 (Fíoraithe)	73.3%	83.3%	—	52.9%	54.2% (high)

Meastóireachtaí gan réasúnaíocht

Meastóireacht	GPT‑5.4 (none)	GPT‑5.2 (none)	GPT‑4.1
OmniDocBench (achar eagarthóireachta normalaithe)	0.109	0.140	—
Tau2-bench Telecom	64.3%	57.2%	43.6%

Rinneadh meastóireachtaí leis an iarracht réasúnaíochta socraithe go xhigh, ach amháin nuair a sonraíodh a mhalairt. Rinneadh tagarmharcanna i dtimpeallacht taighde, a bhféadfadh aschur beagán difriúil a sholáthar ó ChatGPT táirgthe i gcásanna áirithe.