GPT‑5 do fhorbróirí á thabhairt isteach
An tsamhail is fearr do chódú agus do thascanna gníomhaireacha.
Inniu, tá GPT‑5 á eisiúint againn ar ár n-ardán API—an tsamhail is fearr atá againn go fóill do chódú agus do thascanna gníomhaireacha.
Tá GPT‑5 ar thús cadhnaíochta (SOTA) ar fud príomhthagarmharcanna códaithe, le scór 74.9% ar SWE-bench Verified agus 88% ar Aider polyglot. Chuireamar oiliúint ar GPT‑5 le bheith ina chomhoibrí códaithe fíor. Tá sé ar fheabhas ag táirgeadh cód ardchaighdeáin agus ag láimhseáil tascanna amhail fabhtanna a dheisiú, cód a chur in eagar, agus ceisteanna a fhreagairt faoi bhunachair chóid chasta. Tá an tsamhail in-stiúrtha agus comhoibríoch—is féidir léi treoracha an-mhionsonraithe a leanúint le cruinneas ard agus is féidir léi mínithe tosaigh a thabhairt ar a cuid gníomhartha roimh agus idir ghlaonna uirlisí. Tá an tsamhail ar fheabhas freisin i gcódú comhéadain tosaigh, ag bualadh OpenAI o3 i bhforbairt gréasáin frontend 70% den am i dtástáil inmheánach.
Chuireamar oiliúint ar GPT‑5 ar thascanna códaithe sa saol fíor i gcomhar le tástálaithe luatha ar fud gnólachtaí nuathionscanta agus fiontar. Deir Cursor gurb é GPT‑5 “an tsamhail is cliste [atá] in úsáid acu” agus go bhfuil sé “thar a bheith cliste, éasca le stiúradh, agus fiú go bhfuil pearsantacht aige [nach bhfaca siad] i samhlacha eile.” Roinn Windsurf go bhfuil GPT‑5 SOTA ar a measúnuithe agus “go bhfuil leath an ráta earráide glao uirlise aige i gcomparáid le samhlacha teorainn eile.” Deir Vercel “gurb é an tsamhail AI frontend is fearr é, ag baint barrfeidhmíochta amach ó thaobh céadfa aeistéitiúil agus cháilíocht an chóid araon, rud a chuireann i gcatagóir dá chuid féin é.”
Tá GPT‑5 ar fheabhas freisin ag tascanna gníomhaireacha fadrithime—ag baint torthaí SOTA amach ar τ2-bench telecom (96.7%), tagarmharc glaonna uirlisí a eisíodh díreach 2 mhí ó shin. Ligeann faisnéis uirlisí fheabhsaithe GPT‑5 dó mórán glaonna uirlisí a nascadh go hiontaofa le chéile—i ndiaidh a chéile agus go comhthreomhar araon—gan dul ar strae, rud a fhágann go bhfuil sé i bhfad níos fearr ag cur tascanna casta sa saol fíor i gcrích ó thús deireadh. Leanann sé treoracha uirlisí níos cruinne freisin, tá sé níos fearr ag láimhseáil earráidí uirlisí, agus tá sé ar fheabhas ag aisghabháil ábhair i gcomhthéacs fada. Deir Manus gur “bhain GPT‑5 an fheidhmíocht ab fhearr amach [dá bhfaca siad] riamh ó aon tsamhail amháin ar [a] dtagarmharcanna inmheánacha.” Deir Notion go ndéanann “[freagraí tapa na samhla], go háirithe i mód íseal réasúnaíochta, GPT‑5 ina shamhail idéalach nuair is gá tascanna casta a réiteach in aon iarracht amháin.” Roinn Inditex gurb é “an rud a chuireann [GPT‑5] i ndáiríre ó chéile ná doimhneacht a réasúnaíochta: freagraí nuansacha, ilshraitheacha a léiríonn fíorthuiscint ar an ábhar.”
Tá gnéithe nua á dtabhairt isteach againn inár API chun níos mó smachta a thabhairt d’fhorbróirí ar fhreagraí na samhla. Tacaíonn GPT‑5 le paraiméadar nua verbosity (luachanna: low, medium, high) chun cabhrú le rialú a dhéanamh ar cibé acu atá freagraí gearr agus díreach nó fada agus cuimsitheach. Is féidir le paraiméadar reasoning_effort GPT‑5 luach íosta a ghlacadh anois chun freagraí a fháil ar ais níos tapa, gan réasúnaíocht fhairsing ar dtús. Chuir muid cineál uirlise nua leis freisin—uirlisí saincheaptha—chun ligean do GPT‑5 uirlisí a ghlaoch le gnáth-théacs in ionad JSON. Tacaíonn uirlisí saincheaptha le srianadh trí ghramadaí shaorthéacs a sholáthraíonn an forbróir.
Tá GPT‑5 á eisiúint againn in trí mhéid san API—gpt-5, gpt-5-mini, agus gpt-5-nano—chun níos mó solúbthachta a thabhairt d’fhorbróirí idir feidhmíocht, costas agus moill a chothromú. Cé gur córas de shamhlacha réasúnaíochta, neamh-réasúnaíochta agus ródairí é GPT‑5 i ChatGPT, is í an tsamhail réasúnaíochta í GPT‑5 san ardán API a chumhachtaíonn an fheidhmíocht uasta i ChatGPT. Go suntasach, is samhail dhifriúil é GPT‑5 le réasúnaíocht íosta ná an tsamhail neamh-réasúnaíochta i ChatGPT, agus tá sé níos fearr tiúnáilte d’fhorbróirí. Tá an tsamhail neamh-réasúnaíochta a úsáidtear i ChatGPT ar fáil mar gpt-5-chat-latest.
Chun léamh faoi GPT‑5 i ChatGPT, agus chun tuilleadh a fhoghlaim faoi fheabhsuithe eile ChatGPT, féach ar ár mblag taighde. Chun tuilleadh a fháil amach faoin gcaoi a bhfuil fiontair ar bís GPT‑5 a úsáid, féach ar ár mblag fiontraíochta.
Is é GPT‑5 an tsamhail códaithe is láidre a d’eisíomar riamh. Sáraíonn sé o3 ar fud tagarmharcanna códaithe agus cásanna úsáide sa saol fíor, agus rinneadh mionchoigeartú air chun barr feabhais a bhaint amach i dtáirgí códaithe gníomhaireacha cosúil le Cursor, Windsurf, GitHub Copilot, agus Codex CLI. Chuir GPT‑5 an-iontas ar ár dtástálaithe alfa, ag socrú taifid ar go leor dá measúnuithe príobháideacha inmheánacha.
Aiseolas luath ar GPT‑5 do thascanna códaithe sa saol fíor
“Is é GPT-5 an tsamhail códaithe is cliste atá in úsáid againn. Fuair ár bhfoireann go bhfuil GPT-5 thar a bheith cliste, éasca le stiúradh, agus fiú go bhfuil pearsantacht aige nach bhfaca muid in aon tsamhail eile. Ní hamháin go n-aithníonn sé fabhtanna casta, an-fholaithe, ach is féidir leis gníomhairí cúlra fada, ilchasta a rith freisin chun tascanna casta a thabhairt chun críche—na cineálacha fadhbanna a d’fhágadh samhlacha eile sáinnithe. Tá sé anois mar ár bpríomhrogha laethúil do gach rud ó raonú agus pleanáil PRs go tógálacha ceann go ceann a chríochnú.”
Ar SWE-bench Verified, measúnú bunaithe ar thascanna fíor-innealtóireachta bogearraí, scórálann GPT‑5 74.9%, suas ó 69.1% o3. Go suntasach, baineann GPT‑5 a scór ard amach le héifeachtúlacht agus luas níos fearr: i gcoibhneas le o3 ag iarracht ard réasúnaíochta, úsáideann GPT‑5 22% níos lú téacschomharthaí aschuir agus 45% níos lú glaonna uirlise.
In SWE-bench Verified, tugtar stór cód agus cur síos ar shaincheist do shamhail, agus caithfidh sé paiste a ghiniúint chun an tsaincheist a réiteach. Léiríonn lipéid téacs an iarracht réasúnaíochta. Fágann ár scóir ar lár 23 de 500 fadhb nár éirigh lena réitigh pas a fháil go hiontaofa ar ár mbonneagar. Tugadh leid ghearr do GPT‑5 a chuir béim ar réitigh a fhíorú go críochnúil; níor bhain an leid chéanna tairbhe do o3.
Ar Aider polyglot, measúnú ar eagarthóireacht cóid, socraíonn GPT‑5 taifead nua de 88%, laghdú aon trian ar an ráta earráide i gcomparáid le o3.
In Aider polygot(osclaíonn i bhfuinneog nua) (diff), tugtar cleachtadh códaithe ó Exercism do shamhail agus caithfidh sé a réiteach a scríobh mar diff cóid. Rith samhlacha réasúnaíochta le hiarracht ard réasúnaíochta.
Fuaireamar amach freisin go bhfuil GPT‑5 ar fheabhas ag tochailt go domhain isteach i mbunachair chóid chun ceisteanna a fhreagairt faoi conas a oibríonn píosaí éagsúla nó conas a idir-idirghníomhaíonn siad. I mbunachar cód chomh casta le cruach foghlaim atreisiúcháin OpenAI, táimid ag fáil amach gur féidir le GPT‑5 cabhrú linn réasúnú a dhéanamh faoinár gcód agus ceisteanna a fhreagairt faoi, rud a luasghéaraíonn ár gcuid oibre laethúla féin.
Agus cód frontend á tháirgeadh d’aipeanna gréasáin, tá GPT‑5 níos aeistéitiúla, níos uaillmhianaí, agus níos cruinne. I gcomparáidí taobh le taobh le o3, ba fhearr le ár dtástálaithe GPT‑5 70% den am.
Seo roinnt samplaí spraíúla, roghnaithe go cúramach, de na rudaí is féidir le GPT‑5 a dhéanamh le leid amháin:
Leid: Cruthaigh leathanach tuirlingthe álainn, réalaíoch do sheirbhís a chuireann síntiús $200/mí ar fáil don díograiseoir caife deiridh, lena n-áirítear cíos trealaimh agus cóitseáil do róstadh caife agus don espresso deiridh a chruthú. Is é an spriocphobal duine meánaosta i gceantar an bhá a d’fhéadfadh a bheith ag obair sa teicneolaíocht agus atá oilte, a bhfuil ioncam indiúscartha aige, agus atá paiseanta faoi ealaín agus eolaíocht an chaife. Barrfheabhsaigh é le haghaidh tiontaithe do chlárú 6 mhí.
Féach níos mó samplaí ó GPT‑5 inár dánlann anseo(osclaíonn i bhfuinneog nua).
Is comhoibrí níos fearr é GPT‑5, go háirithe i dtáirgí códaithe gníomhaireacha cosúil le Cursor, Windsurf, GitHub Copilot, agus Codex CLI. Agus é ag obair, is féidir le GPT‑5 pleananna, nuashonruithe, agus achoimrí a aschur idir ghlaonna uirlise. I gcomparáid lenár samhlacha roimhe seo, tá GPT‑5 níos réamhghníomhaí ag cur tascanna uaillmhianacha i gcrích gan stad chun do chead a lorg ná cúlú ó chastacht ard.
Seo sampla den chaoi a bhféadfadh GPT‑5 breathnú agus é ag tabhairt faoi thasc casta (sa chás seo, suíomh gréasáin a chruthú do bhialann):
Tar éis don úsáideoir suíomh gréasáin a iarraidh dá mbialann, roinneann GPT‑5 plean tapa, cuireann sé creatlach ar an aip, suiteálann sé spleáchais, cruthaíonn sé ábhar an tsuímh, ritheann sé tógáil chun earráidí tiomsaithe a sheiceáil, déanann sé achoimre ar a chuid oibre, agus molann sé na chéad chéimeanna eile a d’fhéadfadh a bheith ann. Cuireadh luas an fhíseáin seo suas thart ar 3x chun an fanacht a shábháil duit; bhí an fad iomlán chun an suíomh gréasáin a chruthú thart ar thrí nóiméad.
Taobh amuigh de chódú gníomhaireach, tá GPT‑5 níos fearr ag tascanna gníomhaireacha go ginearálta. Socraíonn GPT‑5 taifid nua ar thagarmharcanna leanúna treoracha (69.6% ar Scale MultiChallenge, mar a ghrádáil o3‑mini é) agus glaonna uirlise (96.7% ar τ2-bench telecom). Cuireann faisnéis uirlise fheabhsaithe ar chumas GPT‑5 gníomhartha a nascadh le chéile ar bhealach níos iontaofa chun tascanna sa saol fíor a chur i gcrích.
Aiseolas luath ar GPT‑5 do thascanna gníomhaireacha
“Is céim mhór chun cinn é GPT-5. Bhain sé an fheidhmíocht ab fhearr amach dá bhfaca muid riamh ó aon tsamhail amháin ar ár dtagarmharcanna inmheánacha. Bhí GPT-5 ar fheabhas thar réimse tascanna gníomhaireacha—fiú sular choigeartaíomar líne amháin chód ná gur shaincheapamar leid. Chuir na réamhráite nua agus an rialú níos cruinne ar úsáid uirlisí léim shuntasach ar chobhsaíocht agus ar in-stiúrthacht ár ngníomhairí.”
Leanann GPT‑5 treoracha níos iontaofa ná aon cheann dá réamhtheachtaithe, ag scóráil go hard ar COLLIE, Scale MultiChallenge, agus ar ár measúnú inmheánach ar leanúint treoracha.
In COLLIE(osclaíonn i bhfuinneog nua), caithfidh samhlacha téacs a scríobh a chomhlíonann srianta éagsúla. In Scale MultiChallenge(osclaíonn i bhfuinneog nua), tugtar dúshlán do shamhlacha i gcomhráite ilchasadh chun ceithre chineál faisnéise ó theachtaireachtaí roimhe seo a úsáid i gceart. Tagann ár scóir ó o3‑mini a úsáid mar ghrádóir, a bhí níos cruinne ná GPT‑4o. Inár measúnú inmheánach OpenAI API ar leanúint treoracha, caithfidh samhlacha treoracha deacra a leanúint a tógadh ó aiseolas fíor-fhorbróirí. Rith samhlacha réasúnaíochta le hiarracht ard réasúnaíochta.
D’oibríomar go dian chun glao uirlise a fheabhsú sna bealaí a bhfuil tábhacht leo d’fhorbróirí. Tá GPT‑5 níos fearr ag leanúint treoracha uirlisí, níos fearr ag déileáil le hearráidí uirlisí, agus níos fearr ag go leor glaonna uirlise a dhéanamh go réamhghníomhach i ndiaidh a chéile nó go comhthreomhar. Nuair a thugtar treoir dó, is féidir le GPT‑5 teachtaireachtaí réamhráite a aschur freisin roimh agus idir ghlaonna uirlise chun úsáideoirí a nuashonrú faoi dhul chun cinn le linn tascanna gníomhaireacha níos faide.
Dhá mhí ó shin, d’fhoilsigh Sierra.ai τ2-bench telecom mar thagarmharc dúshlánach úsáide uirlisí a léirigh conas a thiteann feidhmíocht samhlacha teanga go suntasach agus iad ag idirghníomhú le staid chomhshaoil ar féidir le húsáideoirí í a athrú. Ina bhfoilseachán(osclaíonn i bhfuinneog nua), níor scóráil aon tsamhail os cionn 49%. Scórálann GPT‑5 97%.
In τ2-bench(osclaíonn i bhfuinneog nua), caithfidh samhail uirlisí a úsáid chun tasc seirbhíse do chustaiméirí a chur i gcrích, áit a bhféadfadh úsáideoir a bheith ann atá in ann cumarsáid a dhéanamh agus gníomhartha a dhéanamh ar staid an domhain. Rith samhlacha réasúnaíochta le hiarracht ard réasúnaíochta.
Léiríonn GPT‑5 feabhsuithe láidre ar fheidhmíocht comhthéacs fhada freisin. Ar OpenAI-MRCR, tomhas ar aisghabháil faisnéise i gcomhthéacs fada, sáraíonn GPT‑5 o3 agus GPT‑4.1, le bearna a fhásann go mór ag faid ionchuir níos faide.
In OpenAI-MRCR(osclaíonn i bhfuinneog nua) (réiteach comhthagartha ilbhabhta), cuirtear il-iarratais úsáideora “snáthaid” chomhionanna isteach i “gcruacha féir” fada d’iarratais agus freagraí comhchosúla, agus iarrtar ar an tsamhail an freagra ar an i-ú snáthaid a atáirgeadh. Tomhaiseann an meánchóimheas meaitseála an meánchóimheas meaitseála teaghráin idir freagra na samhla agus an freagra ceart. Léiríonn na pointí ag 256k uas-théacschomhartha ionchuir meáin thar 128k–256k téacschomhartha ionchuir, agus mar sin de. Anseo, seasann 256k do 256 * 1,024 = 262,114 téacschomhartha. Rith samhlacha réasúnaíochta le hiarracht ard réasúnaíochta.
Táimid ag oscailt an fhoinse freisin do BrowseComp Long Context(osclaíonn i bhfuinneog nua), tagarmharc nua chun Q&A comhthéacs fhada a mheas. Sa tagarmharc seo, tugtar ceist úsáideora, liosta fada de thorthaí cuardaigh ábhartha, agus caithfidh an tsamhail an cheist a fhreagairt bunaithe ar na torthaí cuardaigh. Dhearamar BrowseComp Long Context le bheith réalaíoch, deacair, agus le freagraí fíor-bhunaithe atá iontaofa agus ceart. Ar ionchuir atá 128K–256K téacschomhartha, tugann GPT‑5 an freagra ceart 89% den am.
San API, is féidir le gach samhail GPT‑5 uaslíon de 272,000 téacschomhartha ionchuir a ghlacadh agus uaslíon de 128,000 téacschomhartha réasúnaíochta & aschuir a astú, ar feadh fad comhthéacs iomlán de 400,000 téacschomhartha.
Tá GPT‑5 níos iontaofa ná ár samhlacha roimhe seo. Ar leideanna ó thagarmharcanna LongFact agus FactScore, déanann GPT‑5 ~80% níos lú earráidí fíorasacha ná o3. Fágann sé sin go bhfuil sé níos oiriúnaí do chásanna úsáide gníomhaireacha ina bhfuil cruinneas tábhachtach—go háirithe i gcód, sonraí, agus cinnteoireacht.
Is measa scóir níos airde. Is éard atá in LongFact(osclaíonn i bhfuinneog nua) agus FActScore(osclaíonn i bhfuinneog nua) ceisteanna oscailte atá ag lorg fíricí. Úsáidimid grádóir bunaithe ar LLM le brabhsáil chun freagraí ar leideanna ó na tagarmharcanna seo a fhíorú agus chun codán na n-éileamh atá mícheart ó thaobh fíricí de a thomhas. Is féidir sonraí cur chun feidhme agus grádaithe a fháil sa chárta córais. D’úsáid samhlacha réasúnaíochta iarracht ard réasúnaíochta. Níor cuireadh cuardach ar siúl.
Go ginearálta, cuireadh oiliúint ar GPT‑5 le bheith níos féin-fheasaí faoina theorainneacha féin agus níos ábalta déileáil le cásanna gan choinne. Chuireamar oiliúint ar GPT‑5 freisin le bheith i bhfad níos cruinne ar cheisteanna sláinte (léigh tuilleadh inár mblag taighde). Mar is amhlaidh le gach samhail teanga, molaimid duit obair GPT‑5 a fhíorú nuair a bhíonn an oiread i gceist.
Is féidir le forbróirí am smaointeoireachta GPT‑5 a rialú tríd an bparaiméadar reasoning_effort san API. Chomh maith leis na luachanna roimhe seo—low, medium (réamhshocrú), agus high—tacaíonn GPT‑5 le minimal freisin, a íoslaghdaíonn réasúnaíocht GPT‑5 chun freagra a thabhairt go tapa.
Uasmhéadaíonn luachanna níos airde reasoning_effort cáilíocht agus uasmhéadaíonn luachanna níos ísle luas. Ní bhaineann gach tasc tairbhe chomhionann as réasúnaíocht bhreise, mar sin molaimid triail a bhaint astu chun a fheiceáil cé acu is fearr do na cásanna úsáide a bhfuil suim agat iontu.
Mar shampla, cuireann réasúnaíocht os cionn low beagán le haisghabháil réasúnta simplí i gcomhthéacs fada, ach cuireann sí go leor pointí céatadáin le CharXiv Reasoning(osclaíonn i bhfuinneog nua), tagarmharc réasúnaíochta amhairc.
Tugann iarracht réasúnaíochta GPT‑5 tairbhí éagsúla ar thascanna éagsúla. Do CharXiv Reasoning, tugadh rochtain do GPT‑5 ar uirlis python.
Chun cabhrú le fad réamhshocraithe freagraí GPT‑5 a stiúradh, thugamar isteach paraiméadar nua API verbosity, a ghlacann luachanna low, medium (réamhshocrú), agus high. Má thagann treoracha follasacha salach ar na paraiméadair fadchainteachta, bíonn tosaíocht ag treoracha follasacha. Mar shampla, má iarrann tú ar GPT‑5 “aiste 5 mhír a scríobh”, ba cheart freagra na samhla a bheith 5 mhír i gcónaí beag beann ar an leibhéal fadchainteachta (cé go bhféadfadh na míreanna féin a bheith níos faide nó níos giorra).
Fadchainteacht=íseal
Fadchainteacht=meánach
Fadchainteacht=ard
Má thugtar treoir dó, aschuirfidh GPT‑5 teachtaireachtaí réamhráite atá infheicthe ag an úsáideoir roimh agus idir ghlaonna uirlise. Murab ionann agus teachtaireachtaí réasúnaíochta i bhfolach, ligeann na teachtaireachtaí infheicthe seo do GPT‑5 pleananna agus dul chun cinn a chur in iúl don úsáideoir, rud a chabhraíonn le húsáideoirí deiridh a chur ar an eolas faoina chur chuige agus faoin rún atá taobh thiar de na glaonna uirlise.
Tá cineál uirlise nua á thabhairt isteach againn—uirlisí saincheaptha—a ligeann do GPT‑5 uirlis a ghlaoch le gnáth-théacs in ionad JSON. Chun GPT‑5 a shrianadh le formáidí uirlisí saincheaptha a leanúint, is féidir le forbróirí regex a sholáthar, nó fiú gramadach shaorthéacs(osclaíonn i bhfuinneog nua) níos iomláine fós.
Roimhe seo, d’éiligh ár gcomhéadan d’uirlisí a shainíonn forbróirí go nglaofaí orthu le JSON, formáid choitianta a úsáideann APIanna gréasáin agus forbróirí go ginearálta. Mar sin féin, chun JSON bailí a aschur, caithfidh an tsamhail gach comhartha athfhriotail, cúlslais, líne nua, agus carachtair rialaithe eile a éalú go foirfe. Cé go bhfuil ár samhlacha oilte go maith chun JSON a aschur, ar ionchuir fhada cosúil leis na céadta líne cóid nó tuairisc 5 leathanach, méadaíonn an seans earráide. Le huirlisí saincheaptha, is féidir le GPT‑5 ionchuir uirlise a scríobh mar ghnáth-théacs, gan na carachtair go léir a éalú a bhfuil éalú de dhíth orthu.
Ar SWE-bench Verified agus uirlisí saincheaptha á n-úsáid in ionad uirlisí JSON, scórálann GPT‑5 thart ar an gcéanna.
Cuireann GPT‑5 an teorainn chun cinn i sábháilteacht agus is samhail níos láidre, níos iontaofa agus níos cabhraí í. Tá GPT‑5 i bhfad níos lú seans maith go gcruthóidh sé bréagshamhluithe ná ár samhlacha roimhe seo, cuireann sé a ghníomhartha agus a chumais in iúl don úsáideoir níos macánta, agus soláthraíonn sé an freagra is cabhraí nuair is féidir agus é fós laistigh de theorainneacha sábháilteachta. Is féidir leat tuilleadh a léamh inár mblag taighde.
Tá GPT‑5 ar fáil anois ar an ardán API i dtrí mhéid: gpt-5, gpt-5-mini, agus gpt-5-nano. Tá sé ar fáil ar an Responses API, API críochnuithe comhráite, agus is é an réamhshocrú é in Codex CLI. Tá praghas $1.25/1M téacschomhartha ionchuir agus $10/1M téacschomhartha aschuir ar GPT‑5, tá praghas $0.25/1M téacschomhartha ionchuir agus $2/1M téacschomhartha aschuir ar GPT‑5 mini, agus tá praghas $0.05/1M téacschomhartha ionchuir agus $0.40/1M téacschomhartha aschuir ar GPT‑5 nano.
Tacaíonn na samhlacha seo leis na paraiméadair API reasoning_effort agus verbosity, chomh maith le huirlisí saincheaptha. Tacaíonn siad freisin le glao uirlise comhthreomhar, uirlisí ionsuite (cuardach gréasáin, cuardach comhaid, giniúint íomhá, agus eile), croíghnéithe API (sruthú, aschur struchtúrtha, agus eile), agus gnéithe sábhála costais amhail taisceadh leide agus Batch API.
Tá an leagan neamh-réasúnaíochta de GPT‑5 a úsáidtear i ChatGPT ar fáil san API mar gpt-5-chat-latest, le praghas $1.25/1M téacschomhartha ionchuir agus $10/1M téacschomhartha aschuir air freisin.
Tá GPT‑5 á sheoladh freisin ar fud ardáin Microsoft, lena n-áirítear Microsoft 365 Copilot, Copilot, GitHub Copilot, agus Azure AI Foundry.
Féach ar an gcáipéisíocht(osclaíonn i bhfuinneog nua) GPT‑5, ar shonraí praghsála(osclaíonn i bhfuinneog nua), agus ar an treoir leideanna(osclaíonn i bhfuinneog nua) chun tús a chur leis.
Intleacht
| GPT-5(high) | GPT-5 mini(high) | GPT-5 nano(high) | OpenAI o3(high) | OpenAI o4-mini(high) | GPT-4.1 | GPT-4.1 mini | GPT-4.1 nano | |
|---|---|---|---|---|---|---|---|---|
| AIME ’25(no tools) | 94.6% | 91.1% | 85.2% | 88.9% | 92.7% | 46.4% | 40.2% | - |
| FrontierMath(with python tool only) | 26.3% | 22.1% | 9.6% | 15.8% | 15.4% | - | - | - |
| GPQA diamond(no tools) | 85.7% | 82.3% | 71.2% | 83.3% | 81.4% | 66.3% | 65.0% | 50.3% |
| HLE[1](no tools) | 24.8% | 16.7% | 8.7% | 20.2% | 14.7% | 5.4% | 3.7% | - |
| HMMT 2025(no tools) | 93.3% | 87.8% | 75.6% | 81.7% | 85.0% | 28.9% | 35.0% | - |
[1] Tá neamhréireacht bheag sna huimhreacha a tuairiscíodh inár mblagphost roimhe seo, mar gur ritheadh iad sin ar leagan roimhe seo de HLE.
Ilmhódach
| GPT-5(high) | GPT-5 mini(high) | GPT-5 nano(high) | OpenAI o3(high) | OpenAI o4-mini(high) | GPT-4.1 | GPT-4.1 mini | GPT-4.1 nano | |
|---|---|---|---|---|---|---|---|---|
| MMMU | 84.2% | 81.6% | 75.6% | 82.9% | 81.6% | 74.8% | 72.7% | 55.4% |
| MMMU-Pro(avg across standard and vision sets) | 78.4% | 74.1% | 62.6% | 76.4% | 73.4% | 60.3% | 58.9% | 33.0% |
| CharXiv reasoning(python enabled) | 81.1% | 75.5% | 62.7% | 78.6% | 72.0% | 56.7% | 56.8% | 40.5% |
| VideoMMMU, max frame 256 | 84.6% | 82.5% | 66.8% | 83.3% | 79.4% | 60.9% | 55.1% | 30.2% |
| ERQA | 65.7% | 62.9% | 50.1% | 64.0% | 56.5% | 44.3% | 42.3% | 26.5% |
Códú
| GPT-5(high) | GPT-5 mini(high) | GPT-5 nano(high) | OpenAI o3(high) | OpenAI o4-mini(high) | GPT-4.1 | GPT-4.1 mini | GPT-4.1 nano | |
|---|---|---|---|---|---|---|---|---|
| SWE-Lancer: IC SWE Diamond Freelance Coding Tasks | $112k | $75k | $49k | $86k | $66k | $34k | $31k | $9k |
| SWE-bench Verified[2] | 74.9% | 71.0% | 54.7% | 69.1% | 68.1% | 54.6% | 23.6% | - |
| Aider polyglot(diff) | 88.0% | 71.6% | 48.4% | 79.6% | 58.2% | 52.9% | 31.6% | 6.2% |
[2] Fágaimid ar lár 23/500 fadhb nárbh fhéidir a rith ar ár mbonneagar. Is é liosta iomlán na 23 dtasc a fágadh ar lár ná 'astropy__astropy-7606', 'astropy__astropy-8707', 'astropy__astropy-8872', 'django__django-10097', 'django__django-7530', 'matplotlib__matplotlib-20488', 'matplotlib__matplotlib-20676', 'matplotlib__matplotlib-20826', 'matplotlib__matplotlib-23299', 'matplotlib__matplotlib-24970', 'matplotlib__matplotlib-25479', 'matplotlib__matplotlib-26342', 'psf__requests-6028', 'pylint-dev__pylint-6528', 'pylint-dev__pylint-7080', 'pylint-dev__pylint-7277', 'pytest-dev__pytest-5262', 'pytest-dev__pytest-7521', 'scikit-learn__scikit-learn-12973', 'sphinx-doc__sphinx-10466', 'sphinx-doc__sphinx-7462', 'sphinx-doc__sphinx-8265', agus 'sphinx-doc__sphinx-9367'.
Leanúint Treoracha
| GPT-5(high) | GPT-5 mini(high) | GPT-5 nano(high) | OpenAI o3(high) | OpenAI o4-mini(high) | GPT-4.1 | GPT-4.1 mini | GPT-4.1 nano | |
|---|---|---|---|---|---|---|---|---|
| Scale multichallenge[3](o3-mini grader) | 69.6% | 62.3% | 54.9% | 60.4% | 57.5% | 46.2% | 42.2% | 31.1% |
| Internal API instruction following eval(hard) | 64.0% | 65.8% | 56.1% | 47.4% | 44.7% | 49.1% | 45.1% | 31.6% |
| COLLIE | 99.0% | 98.5% | 96.9% | 98.4% | 96.1% | 65.8% | 54.6% | 42.5% |
[3] Nóta: feicimid go minic go ndéanann an grádóir réamhshocraithe in MultiChallenge (GPT-4o) míghrádú ar fhreagraí samhla. Fuaireamar amach go gcuireann athrú an ghrádóra go samhail réasúnaíochta, cosúil le o3-mini, feabhas suntasach ar chruinneas an ghrádaithe ar shamplaí a rinneamar iniúchadh orthu.
Glao Feidhme
| GPT-5(high) | GPT-5 mini(high) | GPT-5 nano(high) | OpenAI o3(high) | OpenAI o4-mini(high) | GPT-4.1 | GPT-4.1 mini | GPT-4.1 nano | |
|---|---|---|---|---|---|---|---|---|
| Tau2-bench airline | 62.6% | 60.0% | 41.0% | 64.8% | 60.2% | 56.0% | 51.0% | 14.0% |
| Tau2-bench retail | 81.1% | 78.3% | 62.3% | 80.2% | 70.5% | 74.0% | 66.0% | 21.5% |
| Tau2-bench telecom | 96.7% | 74.1% | 35.5% | 58.2% | 40.5% | 34.0% | 44.0% | 12.1% |
Comhthéacs Fada
| GPT-5(high) | GPT-5 mini(high) | GPT-5 nano(high) | OpenAI o3(high) | OpenAI o4-mini(high) | GPT-4.1 | GPT-4.1 mini | GPT-4.1 nano | |
|---|---|---|---|---|---|---|---|---|
| OpenAI-MRCR: 2 needle 128k | 95.2% | 84.3% | 43.2% | 55.0% | 56.4% | 57.2% | 47.2% | 36.6% |
| OpenAI-MRCR: 2 needle 256k | 86.8% | 58.8% | 34.9% | - | - | 56.2% | 45.5% | 22.6% |
| Graphwalks bfs <128k | 78.3% | 73.4% | 64.0% | 77.3% | 62.3% | 61.7% | 61.7% | 25.0% |
| Graphwalks parents <128k | 73.3% | 64.3% | 43.8% | 72.9% | 51.1% | 58.0% | 60.5% | 9.4% |
| BrowseComp Long Context 128k | 90.0% | 89.4% | 80.4% | 88.3% | 80.0% | 85.9% | 89.0% | 89.4% |
| BrowseComp Long Context 256k | 88.8% | 86.0% | 68.4% | - | - | 75.5% | 81.6% | 19.1% |
| VideoMME(long, with subtitle category) | 86.7% | 78.5% | 65.7% | 84.9% | 79.5% | 78.7% | 68.4% | 55.2% |
Bréagshamhluithe
| GPT-5(high) | GPT-5 mini(high) | GPT-5 nano(high) | OpenAI o3(high) | OpenAI o4-mini(high) | GPT-4.1 | GPT-4.1 mini | GPT-4.1 nano | |
|---|---|---|---|---|---|---|---|---|
| LongFact-Concepts hallucination rate(no tools)[lower is better] | 1.0% | 0.7% | 1.0% | 5.2% | 3.0% | 0.7% | 1.1% | - |
| LongFact-Objects hallucination rate(no tools)[lower is better] | 1.2% | 1.3% | 2.8% | 6.8% | 8.9% | 1.1% | 1.8% | - |
| FActScore hallucination rate(no tools)[lower is better] | 2.8% | 3.5% | 7.3% | 23.5% | 38.7% | 6.7% | 10.9% | - |


