2026. gada 23. aprīlis

Iepazīstinām ar GPT‑5.5

Jauna intelekta paaudze reālam darbam

Notiek ielāde…

Atjauninājums 2026. gada 24. aprīlī: GPT‑5.5 un GPT‑5.5 Pro tagad ir pieejami API. Sistēmas karte arī ir atjaunināta, lai aprakstītu piemērojamos papildu aizsardzības pasākumus.

Mēs izlaižam GPT‑5.5 – līdz šim mūsu gudrāko un intuitīvāk lietojamo modeli, kas ir nākamais solis jaunā pieejā darbam ar datoru.

GPT‑5.5 ātrāk saprot, ko vēlies paveikt, un spēj uzņemties lielāku daļu darba pats. Tas izceļas programmēšanā un atkļūdošanā, tiešsaistes izpētē, datu analīzē, dokumentu un izklājlapu veidošanā, darbā ar programmatūru un uzdevumu izpildē dažādos rīkos līdz pat gala rezultātam. Tā vietā, lai rūpīgi pārvaldītu katru soli, vari GPT‑5.5 uzticēt sarežģītu, daudzdaļīgu uzdevumu un paļauties, ka tas plānos, izmantos rīkus, pārbaudīs savu darbu, orientēsies neskaidros apstākļos un turpinās līdz rezultātam.

Uzlabojumi ir īpaši izteikti aģentiskajā programmēšanā, darbā ar datoru, zināšanu darbā un agrīnajos zinātniskajos pētījumos – jomās, kur progress ir atkarīgs no spriestspējas dažādos kontekstos un rīkoties laika gaitā. GPT‑5.5 nodrošina šo intelekta līmeņa pieaugumu, nezaudējot ātrumu: lielāki un jaudīgāki modeļi bieži darbojas lēnāk, taču GPT‑5.5 reālos lietošanas apstākļos saglabā tādu pašu latentumu uz vienu tekstvienību kā GPT‑5.4, vienlaikus demonstrējot ievērojami augstāku intelekta līmeni. Tas arī izmanto būtiski mazāk tekstvienību, lai izpildītu tos pašus Codex uzdevumus, padarot to gan efektīvāku, gan jaudīgāku.

Mēs izlaižam GPT‑5.5 ar līdz šim spēcīgāko drošības mehānismu kopumu, kas izstrādāts, lai mazinātu ļaunprātīgu izmantošanu, vienlaikus saglabājot piekļuvi lietderīgam darbam. Mēs novērtējām šo modeli visā mūsu drošības un gatavības ietvaru kopumā, sadarbojāmies ar iekšējām un ārējām komandām, kas veic imitētos uzbrukumus, ieviesām mērķtiecīgu testēšanu progresīvām kiberdrošības un bioloģijas spējām, kā arī pirms izlaišanas apkopojām atsauksmes par reāliem lietošanas scenārijiem no gandrīz 200 uzticamiem agrīnās piekļuves partneriem.

Šodien GPT‑5.5 tiek ieviests ChatGPT un Codex lietotājiem Plus, Pro, Business un Enterprise plānos, savukārt GPT‑5.5 Pro tiek ieviests ChatGPT lietotājiem Pro, Business un Enterprise plānos. API izvietošanai nepieciešami atšķirīgi drošības mehānismi, un mēs cieši sadarbojamies ar partneriem un klientiem, lai nodrošinātu drošības un aizsardzības prasības, kas nepieciešamas mērogošanai. Drīzumā GPT‑5.5 un GPT‑5.5 Pro būs pieejami arī API.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0	82,7%	75,1%	-	-	69,4 %	68,5 %
Expert-SWE (Iekšējs)	73,1 %	68,5 %	-	-	-	-
GDPval (uzvaras vai neizšķirts)	84,9 %	83,0%	82,3 %	82,0%	80,3%	67,3 %
OSWorld verificēts	78,7 %	75,0%	-	-	78,0 %	-
Toolathlon	55,6%	54,6 %	-	-	-	48,8 %
BrowseComp	84,4 %	82,7%	90,1 %	89,3%	79,3%	85,9 %
FrontierMath 1.–3. līmenis	51,7 %	47,6%	52,4 %	50,0%	43,8 %	36,9 %
FrontierMath 4. līmenis	35,4 %	27,1%	39,6 %	38,0 %	22,9 %	16,7 %
CyberGym	81,8 %	79,0 %	-	-	73,1 %	-

Modeļa iespējas

OpenAI veido globālu infrastruktūru aģentiskajam MI, padarot iespējamu cilvēkiem un uzņēmumiem visā pasaulē paveikt darbu ar MI. Pēdējā gada laikā esam redzējuši, kā MI būtiski paātrina programmatūras izstrādi. Ar GPT‑5.5 Codex un ChatGPT vidē šī pati transformācija sāk paplašināties arī zinātniskajā pētniecībā un plašākā darbā, ko cilvēki veic ar datoru.

Šajās jomās GPT‑5.5 nav tikai gudrāks – tas ir arī efektīvāks problēmu risināšanā, bieži sasniedzot augstākas kvalitātes rezultātus ar mazāku tekstvienību skaitu un mazāku atkārtotu mēģinājumu skaitu. Artificial Analysis programmēšanas indeksā GPT‑5.5 nodrošina modernāko intelekta līmeni par uz pusi zemākām izmaksām nekā konkurējošie robežšķirtnes programmēšanas modeļi.

Artificial Analysis intelekta indekss⁠(atveras jaunā logā) ir svērts vidējais rādītājs, kas balstīts uz 10 neatkarīgas organizācijas veiktajiem novērtējumiem: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Aģentiskā programmēšana

GPT‑5.5 ir līdz šim mūsu spēcīgākais aģentiskās programmēšanas modelis. Terminal-Bench 2.0, kas testē sarežģītas komandrindas darbplūsmas ar plānošanu, iterācijām un rīku koordināciju, tas sasniedz modernāko precizitāti – 82,7 %. SWE-Bench Pro, kas novērtē reālu GitHub problēmu risināšanu, tas sasniedz 58,6 %, vienā piegājienā pilnībā atrisinot vairāk uzdevumu nekā iepriekšējie modeļi. Expert-SWE, mūsu iekšējā robežšķirtnes novērtējumā ilgtermiņa programmēšanas uzdevumiem ar mediāno cilvēka izpildes laiku 20 stundas, GPT‑5.5 arī pārspēj GPT‑5.4.

Visos trīs novērtējumos GPT‑5.5 uzlabo GPT‑5.4 rezultātus, vienlaikus izmantojot mazāk tekstvienību.

Modeļa stiprās puses programmēšanā īpaši izceļas Codex vidē, kur tas spēj veikt dažādus inženierijas uzdevumus – no ieviešanas un koda pārstrukturēšanas līdz atkļūdošanai, testēšanai un validācijai. Agrīnie testi liecina, ka GPT‑5.5 labāk izpilda uzvedības, kas nepieciešamas reālā inženierijas darbā, piemēram, saglabā kontekstu lielās sistēmās, nodrošina spriestspēju neskaidru kļūmju gadījumā, pārbauda pieņēmumus ar rīkiem un konsekventi ievieš izmaiņas visā koda bāzē.

Attēlotajā trajektorijā izmantoti NASA/JPL Horizons vektordati Orion, Mēnesim un Saulei, un lasāmības labad ir piemērota attēlojuma mērogošana.

Uzvedne: [pievienots attēls] Izstrādā to kā jaunu lietotni, izmantojot WebGL un Vite, balstoties uz reāliem Artemis II misijas datiem. Pārliecinies, ka lietotne ir rūpīgi testēta, pilnībā funkcionāla un vizuāli atbilst attēlā redzamajai. Īpašu uzmanību pievērs planētu un trajektoriju attēlošanai. Man jāspēj mijiedarboties ar 3D attēlojumu. Nodrošini, ka tiek ievērota reālistiska orbitālā mehānika.

Papildus etalonvērtībām agrīnie testētāji norāda, ka GPT‑5.5 labāk izprot sistēmas struktūru: kāpēc rodas kļūda, kur jāveic labojums un kā tas ietekmēs citas koda bāzes daļas.

“Pirmais programmēšanas modelis, ko esmu izmantojis un kam ir patiesi skaidra konceptuālā izpratne.”

Dens Šipers (Dan Shipper), Every dibinātājs un izpilddirektors, raksturoja GPT‑5.5 kā “pirmo programmēšanas modeli, ko esmu izmantojis un kam ir patiesi skaidra konceptuālā izpratne.”

Pēc lietotnes palaišanas viņš vairākas dienas pavadīja, atkļūdojot problēmu, kas radās pēc palaišanas, pirms piesaistīja vienu no saviem labākajiem inženieriem, lai pārrakstītu daļu sistēmas. Lai pārbaudītu GPT‑5.5, viņš būtībā “pagrieza laiku atpakaļ”: vai modelis spētu apskatīt bojāto stāvokli un izveidot tādu pašu pārrakstījumu, pie kā inženieris galu galā nonāca? GPT‑5.4 to nespēja. GPT‑5.5 spēja.

“Tas patiešām rada sajūtu, ka strādāju ar augstāku intelektu, un gandrīz rodas savstarpējas cieņas izjūta.”

Pjetro Skirano (Pietro Schirano), MagicPath izpilddirektors, novēroja līdzīgu kvalitātes lēcienu, kad GPT‑5.5 apvienoja atzaru ar simtiem lietotāja interfeisa un pārstrukturēšanas izmaiņu galvenajā atzarā, kas arī bija būtiski mainījies, atrisinot šo uzdevumu vienā piegājienā aptuveni 20 minūtēs.

Vecākie inženieri, kuri testēja modeli, norādīja, ka GPT‑5.5 ir ievērojami spēcīgāks nekā GPT‑5.4 un Claude Opus 4.7 spriestspējas un autonomijas ziņā, spējot laikus pamanīt problēmas un prognozēt testēšanas un pārskatīšanas vajadzības bez tiešām norādēm. Vienā gadījumā inženieris lūdza pārveidot komentāru sistēmas arhitektūru sadarbības markdown redaktorā un, atgriežoties, atrada gandrīz pabeigtu 12 izmaiņu kopu. Citi atzina, ka nepieciešama pārsteidzoši neliela implementācijas korekcija un ka viņi jūtas pārliecinātāki par GPT‑5.5 plāniem salīdzinājumā ar GPT‑5.4.

Kāds NVIDIA inženieris, kuram bija agrīna piekļuve modelim, pat teica: "Pazaudēt piekļuvi GPT‑5.5 ir tā, it kā man būtu amputēta roka vai kāja."

“GPT-5.5 ir ievērojami gudrāks un noturīgāks nekā GPT-5.4, ar spēcīgāku sniegumu programmēšanā un uzticamāku rīku izmantošanu. Tas spēj strādāt pie uzdevuma būtiski ilgāk, nepārtraucot darbu pārāk agri, kas ir īpaši svarīgi sarežģītiem, ilgstošiem uzdevumiem, ko mūsu lietotāji deleģē Cursor.”

— Maikls Truels (Michael Truell), Cursor līdzdibinātājs un izpilddirektors

Zināšanu darbs

Tās pašas īpašības, kas padara GPT‑5.5 izcilu programmēšanā, padara to jaudīgu arī ikdienas darbā ar datoru. Tā kā modelis labāk saprot lietotāja nodomu, tas spēj dabiskāk iziet cauri visam zināšanu darba ciklam: atrast informāciju, saprast, kas ir būtiski, izmantot rīkus, pārbaudīt rezultātu un pārvērst neapstrādātus datus lietderīgā rezultātā.

Codex vidē GPT‑5.5 pārspēj GPT‑5.4 dokumentu, izklājlapu un prezentāciju veidošanā. Alfa testētāji norādīja, ka tas pārspēj iepriekšējos modeļus tādos uzdevumos kā operatīvā analīze, izklājlapu modelēšana un nekārtīgu biznesa ievades datu pārvēršana strukturētos plānos. Apvienojumā ar Codex spējām darbam ar datoru, GPT‑5.5 mūs pietuvina sajūtai, ka modelis patiešām var izmantot datoru kopā ar tevi: redzēt ekrānā notiekošo, klikšķināt, rakstīt, pārvietoties saskarnēs un precīzi darboties dažādos rīkos.

OpenAI komandas jau izmanto šīs priekšrocības reālās darbplūsmās. Šobrīd vairāk nekā 85 % uzņēmuma darbinieku katru nedēļu izmanto Codex dažādās jomās, tostarp programmatūras izstrādē, finansēs, komunikācijā, mārketingā, datu zinātnē un produktu vadībā. Komunikācijas komandā GPT‑5.5 Codex vidē tika izmantots, lai analizētu sešu mēnešu uzstāšanās pieprasījumu datus, izveidotu vērtēšanas un riska ietvaru un validētu automatizētu Slack aģentu, lai zema riska pieprasījumi tiktu apstrādāti automātiski, bet augstāka riska pieprasījumi joprojām tiktu nodoti cilvēku pārskatīšanai. Finanšu komandā Codex tika izmantots, lai pārskatītu 24 771 K-1 nodokļu veidlapu (kopā 71 637 lapas), izmantojot darbplūsmu, kas izslēdza personīgo informāciju un palīdzēja komandai paātrināt šo uzdevumu par divām nedēļām salīdzinājumā ar iepriekšējo gadu. Tirgū palaišanas komandā darbinieks automatizēja iknedēļas biznesa atskaišu ģenerēšanu, ietaupot 5–10 stundas nedēļā.

ChatGPT vidē GPT‑5.5 Thinking nodrošina ātrāku palīdzību sarežģītāku problēmu risināšanā, piedāvājot gudrākas un kodolīgākas atbildes, kas palīdz efektīvāk virzīties cauri kompleksam darbam. Tas izceļas profesionālos uzdevumos, piemēram, programmēšanā, pētniecībā, informācijas apkopošanā un analīzē, kā arī darbā ar dokumentiem, īpaši izmantojot spraudņus.

GPT‑5.5 Pro režīmā agrīnie testētāji novēro būtisku uzlabojumu gan uzdevumu sarežģītībā, gan kvalitātē, ko ChatGPT spēj uzņemties, kā arī latentuma samazinājumu, kas padara to daudz praktiskāku prasīgiem uzdevumiem. Salīdzinājumā ar GPT‑5.4 Pro testētāji atzina, ka GPT‑5.5 Pro atbildes ir ievērojami visaptverošākas, labāk strukturētas, precīzākas, atbilstošākas un noderīgākas, ar īpaši spēcīgu sniegumu biznesā, tiesību jomā, izglītībā un datu zinātnē.

GPT‑5.5 sasniedz modernāko veiktspēju vairākos testos, kas atspoguļo šāda veida darbu. Novērtējumā GDPval⁠, kas pārbauda aģentu spējas veikt precīzi definētu zināšanu darbu 44 profesijās, GPT‑5.5 iegūst 84,9%. Novērtējumā OSWorld-Verified, kas pārbauda, vai modelis spēj patstāvīgi darboties reālās datorvidēs, tas sasniedz 78,7%. Savukārt novērtējumā Tau2-bench Telecom, kas testē sarežģītas klientu apkalpošanas darbplūsmas, tas sasniedz 98,0% bez uzvedņu pielāgošanas. GPT‑5.5 arī uzrāda spēcīgu sniegumu citos zināšanu darba etalonos: 60,0% FinanceAgent, 88,5% iekšējos investīciju banku modelēšanas uzdevumos un 54,1% OfficeQA Pro.

Tau2-bench Telecom tika veikts bez uzvedņu pielāgošanas (un ar GPT‑4.1 kā lietotāja modeli). GPT‑5.5 labāk saprot uzdevuma nolūku un izmanto tekstvienības efektīvāk nekā tā priekšgājēji.

“GPT-5.5 nodrošina stabilu veiktspēju, kas nepieciešama izpildes intensīviem uzdevumiem. Modelis ir izstrādāts un darbināts uz NVIDIA GB200 NVL72 sistēmām, ļaujot mūsu komandām izstrādāt pilnus funkcionalitātes risinājumus no dabiskās valodas uzvednēm, samazināt atkļūdošanas laiku no dienām līdz stundām un pārvērst nedēļu ilgu eksperimentēšanu progresā vienas nakts laikā sarežģītās koda bāzēs. Tas ir vairāk nekā ātrāka programmēšana – tas ir jauns darba veids, kas ļauj cilvēkiem strādāt būtiski citā ātrumā.”

— Džastins Boitano (Justin Boitano), NVIDIA uzņēmumu MI viceprezidents

Zinātniskā pētniecība

GPT‑5.5 uzrāda uzlabojumus arī zinātniskās un tehniskās pētniecības darbplūsmās, kur nepietiek tikai ar sarežģīta jautājuma atbildēšanu. Pētniekiem jāspēj izpētīt ideju, apkopot pierādījumus, pārbaudīt pieņēmumus, interpretēt rezultātus un izlemt, ko darīt tālāk. GPT‑5.5 šo ciklu spēj uzturēt labāk nekā citi modeļi.

Ievērojami, ka GPT‑5.5 uzrāda skaidru uzlabojumu salīdzinājumā ar GPT‑5.4 GeneBench⁠(atveras jaunā logā) testā – jaunā novērtējumā, kas fokusējas uz daudzposmu zinātnisko datu analīzi ģenētikā un kvantitatīvajā bioloģijā. Šie uzdevumi prasa modeļiem spriest par potenciāli neskaidriem vai kļūdainiem datiem ar minimālu uzraudzību, risināt reālistiskus izaicinājumus, piemēram, slēptus traucējošos faktorus vai kvalitātes kontroles kļūmes, kā arī pareizi īstenot un interpretēt mūsdienīgas statistikas metodes. Modeļa sniegums ir īpaši iespaidīgs, ņemot vērā, ka šie uzdevumi bieži atbilst vairāku dienu darbam zinātniskajiem ekspertiem.

Līdzīgi arī BixBench⁠(atveras jaunā logā) testā – novērtējumā, kas balstīts uz reālās pasaules bioinformātikas un datu analīzes uzdevumiem –, GPT‑5.5 sasniedza vadošu sniegumu starp modeļiem ar publiski pieejamiem rezultātiem. Modeļa zinātniskās spējas tagad ir pietiekami attīstītas, lai kā pilnvērtīgs līdzpētnieks būtiski paātrinātu progresu biomedicīniskās pētniecības robežšķirtnēs.

Citā piemērā GPT‑5.5 iekšējā versija ar pielāgotu izpildes vidi palīdzēja atklāt jaunu pierādījumu⁠(atveras jaunā logā) par Remzija skaitļiem, kas ir viens no centrālajiem objektiem kombinatorikā. Kombinatorika pēta, kā diskrēti objekti savstarpēji sakārtojas: grafi, tīkli, kopas un raksti. Remzija skaitļi aptuveni nosaka, cik lielam jābūt tīklam, lai tajā neizbēgami parādītos kāda kārtība. Rezultāti šajā jomā ir reti un bieži tehniski sarežģīti. Šajā gadījumā GPT‑5.5 atrada pierādījumu ilgstoši zināmam asimptotiskam faktam par nediagonālajiem Remzija skaitļiem, ko vēlāk verificēja Lean vidē. Šis rezultāts ir konkrēts piemērs tam, ka GPT‑5.5 spēj sniegt ne tikai kodu vai skaidrojumu, bet arī pārsteidzošu un noderīgu matemātisku argumentu fundamentālā pētniecības jomā.

Agrīnie testētāji izmantoja GPT‑5.5 Pro ChatGPT vidē nevis kā vienpiemēra atbilžu rīku, bet drīzāk kā pētniecības partneri: vairākkārt pārskatot manuskriptus, pārbaudot tehniskos argumentus, piedāvājot analīzes un strādājot ar kodu, piezīmēm un PDF kontekstu. Kopīgais secinājums – GPT‑5.5 labāk palīdz pētniekiem pāriet no jautājuma uz eksperimentu un tālāk uz rezultātu.

Derja Unutmāza (Derya Unutmaz), imunoloģijas profesore un pētniece Džeksona Genomiskās medicīnas laboratorijā (Jackson Laboratory for Genomic Medicine), izmantoja GPT‑5.5 Pro, lai analizētu gēnu ekspresijas datu kopu ar 62 paraugiem un gandrīz 28 000 gēniem, izveidojot detalizētu pētniecības ziņojumu, kas ne tikai apkopoja rezultātus, bet arī izcēla galvenos jautājumus un ieskatus – darbu, kas, pēc viņas teiktā, viņas komandai būtu prasījis vairākus mēnešus.

Bartošs Naskrencskis (Bartosz Naskręcki), matemātikas docents Adama Mickeviča universitātē Poznaņā, Polijā, izmantoja GPT‑5.5 Codex vidē, lai 11 minūtēs no vienas uzvednes izveidotu algebriskās ģeometrijas lietotni, vizualizējot kvadrātisko virsmu krustpunktus un pārvēršot iegūto līkni Veierštrāsa modelī.

Vēlāk viņš paplašināja lietotni ar stabilāku singularitāšu vizualizāciju un precīziem koeficientiem, kurus var izmantot turpmākajā darbā. Viņaprāt, lielākā pārmaiņa ir tā, ka Codex tagad var palīdzēt izstrādāt pielāgotas matemātiskās vizualizācijas un datoralgebras darbplūsmas, kas iepriekš prasīja specializētus rīkus. Kopumā šie piemēri parāda, kā GPT‑5.5 pārvērš ekspertu ieceres funkcionējošos pētniecības rīkos un analīzēs.

Avots: Bartošs Naskrencskis⁠(atveras jaunā logā)

Uzvedne: # Algebriskās ģeometrijas virsmu krustojums

Izveido lietotni, kas attēlo divas kvadrātiskas virsmas un sarkanā krāsā izceļ to krustošanās līkni. Izmanto skaitļošanas Rīmaņa–Roha teorēmu, lai to pārveidotu Veierštrāsa līknē.

## Galvenais logs

Divas tonētas virsmas ar viegli caurspīdīgu ēnojumu, augstas kvalitātes attēlojums, kas krustojas pa sarkanā krāsā attēlotu algebrisku līkni

Rotācija ar peli abos virzienos, pilnvērtīga “pinch” mehānika pietuvināšanai, haptisks pieskāriens, lai atvērtu nelielu izvēlni ar slīdņiem katras virsmas koeficientu maiņai; detekcija, izmantojot Z-buferi

## Labās puses logs

Īsa Veierštrāsa vienādojuma forma (virs Q vai kvadrātiska lauka paplašinājuma), kas tiek aprēķināta reāllaikā, izmantojot efektīvās Rīmaņa–Roha teorēmas formulas

## Ambientais režīms, kurā visas vadības ir paslēptas un lietotājs var pilnībā koncentrēties uz formu vizuālo estētiku

## Specifikācija

Lietotne darbojas pārlūkprogrammā, viegla implementācija ar jaunākajām pilna steka bibliotēkām, portatīva un viegli izvietojama

## Dokumenti

Git repozitorijs, žurnāls, plāns (Markdown faili)

“Ir neticami iedvesmojoši izmantot OpenAI jauno GPT-5.5 modeli mūsu sistēmā, ļaut tam analizēt milzīgus bioķīmiskos datu apjomus, lai prognozētu zāļu iedarbību uz cilvēkiem, un redzēt būtiskus precizitātes uzlabojumus mūsu sarežģītākajos zāļu izpētes novērtējumos. Ja OpenAI turpinās šādā tempā, zāļu izstrādes pamati līdz gada beigām būtiski mainīsies.”

— Brendons Vaits (Brandon White), Axiom Bio līdzdibinātājs un izpilddirektors

Nākamās paaudzes inference efektivitāte

Lai nodrošinātu GPT‑5.5 darbību ar GPT‑5.4 latentumu, bija nepieciešams pārdomāt inference kā integrētu sistēmu, nevis kā atsevišķu optimizāciju kopumu. GPT‑5.5 tika kopīgi izstrādāts, trenēts un darbināts uz NVIDIA GB200 un GB300 NVL72 sistēmām. Codex un GPT‑5.5 bija būtiski faktori mūsu veiktspējas mērķu sasniegšanā. Codex palīdzēja komandai ātrāk pāriet no idejas līdz izmērāmai implementācijai, iezīmējot pieejas, savienojot eksperimentus un palīdzot noteikt, kuras optimizācijas ir vērts attīstīt padziļināti. GPT‑5.5 palīdzēja atrast un ieviest būtiskus uzlabojumus pašā sistēmas stekā. Vienkārši sakot, modelis palīdzēja uzlabot infrastruktūru, kas to apkalpo.

Viens no šādiem uzlabojumiem bija slodzes balansēšanas un sadalīšanas heuristikas. Pirms GPT‑5.5 mēs sadalījām pieprasījumus akseleratorā fiksētā daļu skaitā, lai izlīdzinātu darbu starp skaitļošanas kodoliem un nodrošinātu, ka gan lieli, gan mazi pieprasījumi var darboties uz viena GPU. Tomēr iepriekš noteikts statisku daļu skaits nav optimāls visiem trafika scenārijiem. Lai labāk izmantotu GPU resursus, Codex analizēja vairāku nedēļu produkcijas datplūsmas modeļus un izstrādāja pielāgotus heuristiskos algoritmus optimālai darba sadalei un balansēšanai. Šim darbam bija būtiska ietekme – tas palielināja tekstvienību ģenerēšanas ātrumu par vairāk nekā 20 %.

Kiberdrošības attīstība visu drošībai

Gatavot pasauli modeļiem, kas ļoti labi spēj atrast un novērst drošības ievainojamības, ir kopīgs uzdevums, un tas prasīs visas ekosistēmas dalībnieku iesaisti, lai veidotu noturību, nodrošinot plašāku piekļuvi modeļiem un pakāpenisku ieviešanu nākamajai kiberaizsardzības ērai⁠.

Robežšķirtnes modeļi kļūst arvien spējīgāki kiberdrošības jomā. Šīs spējas kļūs plaši pieejamas, un mēs uzskatām, ka labākais virziens ir nodrošināt, lai tās tiktu izmantotas kiberaizsardzības paātrināšanai un visas ekosistēmas stiprināšanai.

GPT‑5.5 ir pakāpenisks, bet nozīmīgs solis ceļā uz MI, kas spēj risināt dažus no pasaules sarežģītākajiem izaicinājumiem, piemēram, kiberdrošību. Ar GPT‑5.2 decembrī mēs proaktīvi ieviesām nepieciešamos kiberdrošības aizsardzības mehānismus⁠, lai ierobežotu iespējamu mūsu modeļu ļaunprātīgu izmantošanu; tagad ar GPT‑5.5 mēs ieviešam stingrākus klasifikatorus potenciālā kiberriska noteikšanai, kas sākotnēji dažiem lietotājiem var šķist traucējoši, kamēr mēs tos laika gaitā pilnveidojam.

Mēs jau vairākus gadus esam identificējuši kiberdrošību kā vienu no kategorijām mūsu Sagatavotības satvarā⁠(atveras jaunā logā), jo mūsu modeļi pakāpeniski uzlabojas, vienlaikus iteratīvi izstrādājot un kalibrējot riska mazināšanas pasākumus, lai varētu atbildīgi ieviest modeļus ar nozīmīgām kiberdrošības spējām.

Mēs ieviešam nozarē vadošus drošības mehānismus šāda līmeņa kiberspējām. Kiberdrošībai specifiskos aizsardzības mehānismus pirmo reizi ieviesām ar GPT‑5.2⁠(atveras jaunā logā) pagājušajā gadā, un kopš tā laika tos esam turpinājuši testēt, pilnveidot un attīstīt nākamajās ieviešanās. GPT‑5.5 gadījumā mēs izstrādājām stingrākas kontroles augstāka riska aktivitātēm, sensitīviem kiberdrošības pieprasījumiem, kā arī pievienojām aizsardzību pret atkārtotu ļaunprātīgu izmantošanu. Plašāka piekļuve ir iespējama, pateicoties mūsu ieguldījumiem modeļu drošībā, autentificētā lietošanā un neatļautas izmantošanas uzraudzībā. Mēs vairākus mēnešus sadarbojāmies ar ārējiem ekspertiem, lai izstrādātu, testētu un iteratīvi uzlabotu šo aizsardzības mehānismu noturību. Ar GPT‑5.5 mēs nodrošinām, ka izstrādātāji var viegli aizsargāt savu kodu, vienlaikus ieviešot stingrākas kontroles tajās kiberdarbplūsmās, kuras ļaunprātīgi dalībnieki varētu visbiežāk izmantot kaitējuma radīšanai.
Mēs paplašinām piekļuvi, lai paātrinātu kiberaizsardzību visos līmeņos. Mēs nodrošinām savus kiberdrošībai pielāgotos modeļus, izmantojot Uzticamu piekļuvi kiberdrošībai⁠, sākot ar Codex, kas piedāvā paplašinātu piekļuvi GPT‑5.5 progresīvajām kiberdrošības iespējām ar mazākiem ierobežojumiem verificētiem lietotājiem, kuri atbilst noteiktiem uzticamības signāliem⁠(atveras jaunā logā) jau palaišanas brīdī. Organizācijas, kas ir atbildīgas par kritiskās infrastruktūras aizsardzību⁠, var pieteikties piekļuvei kiberdrošībai pielāgotiem modeļiem, piemēram, GPT‑5.4‑Cyber, ievērojot stingras drošības prasības, lai izmantotu šos modeļus savu iekšējo sistēmu aizsardzībai. Tas nodrošina plašam verificētu aizstāvju lokam jaudīgākus rīkus leģitīmam drošības darbam ar mazāku nevajadzīgu berzi, veicinot svarīgu aizsardzības spēju pieejamību. Lietotāji var pieteikties uzticamajai piekļuvei vietnē chatgpt.com/cyber⁠(atveras jaunā logā), lai samazinātu nevajadzīgus atteikumus, izmantojot GPT‑5.5 verificētam aizsardzības darbam.
Mēs sadarbojamies ar valdības partneriem, lai palīdzētu aizsargāt sabiedrībai svarīgo kritisko infrastruktūru. Kopā mēs pētām, kā progresīvs MI var atbalstīt uzticamu amatpersonu aizsardzības darbu, kuras atbild par sistēmām, uz kurām cilvēki paļaujas – no digitālajām sistēmām, kas aizsargā svarīgus nodokļu maksātāju datus, līdz elektroapgādes tīkliem un ūdensapgādei vietējās kopienās.

Mēs klasificējam GPT‑5.5 bioloģiskās/ķīmiskās un kiberdrošības spējas kā augstas mūsu Sagatavotības satvarā⁠(atveras jaunā logā). Lai gan GPT‑5.5 nesasniedza kritisko kiberdrošības spēju līmeni, mūsu novērtējumi un testēšana parādīja, ka tā kiberdrošības spējas ir solis uz priekšu salīdzinājumā ar GPT‑5.4.

Papildus tam GPT‑5.5 pirms izlaišanas izgāja visu mūsu drošības un pārvaldības procesu, tostarp novērtēšanu gatavības ietvaros, jomai specifisku testēšanu, jaunus mērķtiecīgus novērtējumus progresīvām bioloģijas un kiberdrošības spējām, kā arī plašu testēšanu sadarbībā ar ārējiem ekspertiem. Plašāku informāciju sniedzam GPT‑5.5 sistēmas kartē⁠(atveras jaunā logā).

Šis darbs atspoguļo mūsu plašāko pieeju MI noturībai, kas, mūsuprāt, ir nepieciešama, attīstoties modeļu spējām. Mēs vēlamies, lai jaudīgs MI būtu pieejams tiem, kas to izmanto sistēmu, institūciju un sabiedrības aizsardzībai. Ilgtspējīgs ceļš ir uzticama piekļuve, droši aizsardzības mehānismi, kas attīstās līdz ar spējām, un operatīvā kapacitāte nopietnas ļaunprātīgas izmantošanas atklāšanai un novēršanai.

Pieejamība un izcenojums

ChatGPT vidē GPT‑5.5 Thinking ir pieejams Plus, Pro, Business un Enterprise lietotājiem. GPT‑5.5 Pro, kas paredzēts vēl sarežģītākiem jautājumiem un augstākas precizitātes darbam, ir pieejams Pro, Business un Enterprise lietotājiem.

Codex vidē GPT‑5.5 ir pieejams Plus, Pro, Business, Enterprise, Edu un Go plānos ar 400 K konteksta logu. GPT‑5.5 ir pieejams arī Fast režīmā, kur tas ģenerē tekstvienības 1,5× ātrāk par 2,5× augstāku cenu.

API izstrādātājiem gpt-5.5 drīzumā būs pieejams Atbildes un Tērzēšanas pabeigšanas API par 5 USD par 1 M ievades tekstvienību un 30 USD par 1 M izvades tekstvienību, ar 1 M konteksta logu. Batch un Flex cenas ir pieejamas par pusi no standarta API cenas, savukārt Priority apstrāde ir pieejama par 2,5× standarta cenu. Mēs arī izlaidīsim gpt-5.5-pro API ar vēl augstāku precizitāti – cena būs 30 USD par 1 M ievades tekstvienību un 180 USD par 1 M izvades tekstvienību. Pilnu informāciju skati cenu lapā⁠.

Lai gan GPT‑5.5 cena ir augstāka nekā GPT‑5.4, tas ir gan gudrāks, gan ievērojami efektīvāks tekstvienību izmantošanā. Codex vidē mēs esam rūpīgi optimizējuši lietošanas pieredzi, lai GPT‑5.5 lielākajai daļai lietotāju sniegtu labākus rezultātus ar mazāku tekstvienību skaitu nekā GPT‑5.4, vienlaikus saglabājot dāsnu lietošanas apjomu dažādos abonēšanas plānos.

Novērtējumi

Programmēšana

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (Publisks) *	58,6 %	57,7%	-	-	64,3%	54,2 %
Terminal-Bench 2.0	82,7%	75,1%	-	-	69,4 %	68,5 %
Expert-SWE (Iekšējs)	73,1 %	68,5 %	-	-	-	-

^*^{Laboratorijas ir konstatējušas}^{iegaumēšanas pazīmes}⁠(atveras jaunā logā)^{šajā vērtējumā}

Profesionāls

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GDPval (uzvaras vai neizšķirts)	84,9 %	83,0%	82,3 %	82,0%	80,3%	67,3 %
FinanceAgent v1.1	60,0 %	56,0%	-	61,5%	64,4 %	59,7 %
Investīciju banku modelēšanas uzdevumi (iekšējie)	88,5 %	87,3 %	88,6 %	83,6%	-	-
OfficeQA Pro	54,1 %	53,2 %	-	-	43,6%	18,1 %

Datora lietošana un redze

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
OSWorld verificēts	78,7 %	75,0%	-	-	78,0 %	-
MMMU Pro (bez rīkiem)	81,2%	81,2%	-	-	-	80,5 %
MMMU Pro (ar rīkiem)	83,2 %	82,1%	-	-	-	-

Rīku izmantošana

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84,4 %	82,7%	90,1 %	89,3%	79,3%	85,9 %
MCP Atlas**	75,3 %	70,6 %	-	-	79,1 %	78,2 %
Toolathlon	55,6%	54,6 %	-	-	-	48,8 %
Tau2-bench Telecom*** (oriģinālās uzvednes)	98,0 %	92,8%	-	-	-	-

^{** MCP Atlas: rezultāti no Scale AI pēc jaunākā 2026. gada aprīļa atjauninājuma.
*** Tau2-bench Telecom: rezultāti GPT‑5.5 un GPT‑5.4 ar oriģinālajām uzvednēm (bez uzvedņu pielāgošanas). Tas neietver rezultātus no citām laboratorijām, kur novērtēšanā tika izmantota uzvedņu pielāgošana.}

Akadēmisks

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25,0 %	19,0 %	33,2 %	25,6 %	-	-
FrontierMath 1.–3. līmenis	51,7 %	47,6%	52,4 %	50,0%	43,8 %	36,9 %
FrontierMath 4. līmenis	35,4 %	27,1%	39,6 %	38,0 %	22,9 %	16,7 %
BixBench	80,5 %	74,0%	-	-	-	-
GPQA Diamond	93,6 %	92,8%	-	94,4%	94,2 %	94,3 %
Cilvēces pēdējais eksāmens (bez rīkiem)	41,4 %	39,8%	43,1 %	42,7%	46,9 %	44,4 %
Cilvēces pēdējais eksāmens (ar rīkiem)	52,2 %	52,1%	57,2%	58,7%	54,7 %	51,4 %

Kiberdrošība

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Iegūsti karogus izaicinājumu uzdevumi (iekšējie)****	88,1%	83,7 %	-	-	-	-
CyberGym	81,8 %	79,0 %	-	-	73,1 %	-

^{**** Sarežģītāko iegūsti karogu izaicinājumu paplašinājums, kas izmantoti sistēmas aprakstos, ar papildu grūtiem uzdevumiem.}

Garš konteksts

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k f1	73,7 %	62,5 %	-	-	76,9 %	-
Graphwalks BFS 1mil f1	45,4 %	9,4 %	-	-	41,2 % (Opus 4.6)	-
Graphwalks parents 256k f1	90,1 %	82,8 %	-	-	93,6 %	-
Graphwalks parents 1mil f1	58,5 %	44,4 %	-	-	72,0 % (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K-8K	98,1 %	97,3%	-	-	-	-
OpenAI MRCR v2 8-needle 8K-16K	93,0%	91,4%	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96,5 %	97,2%	-	-	-	-
OpenAI MRCR v2 8-needle 32K-64K	90,0%	90.5 %	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83,1 %	86,0%	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87,5 %	79,3%	-	-	59,2 %	-
OpenAI MRCR v2 8-needle 256K-512K	81,5 %	57,5%	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74,0%	36,6%	-	-	32,2%	-

Abstraktā domāšana

Novērtējums	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (Verified)	95,0 %	93,7%	-	94,5%	93,5 %	98,0 %
ARC-AGI-2 (Verified)	85,0 %	73,3%	-	83,3%	75,8 %	77,1 %

GPT novērtējumi tika veikti ar spriestspēju, kas iestatīta uz “xhigh”, un tika veikti pētnieciskā vidē, tāpēc dažos gadījumos rezultāti var nedaudz atšķirties no ražošanas vides ChatGPT.