Jäta vahele ja mine põhisisu juurde
OpenAI

23. aprill 2026

ToodeVäljalase

Tutvustame GPT‑5.5

Uus intelligentsuse klass tegeliku töö jaoks

Laadimine…

24. aprilli 2026. aasta värskendus: GPT‑5.5 ja GPT‑5.5 Pro on nüüd API-s saadaval. Süsteemikaart on täiendavate kohaldatavate kaitsemeetmete kirjeldamiseks samuti ajakohastatud.


Toome turule GPT‑5.5, meie seni targema ja intuitiivsema mudeli ning järgmise sammu arvutitöö uue viisi poole.

GPT‑5.5 mõistab kiiremini, mida sa teha püüad, ja suudab ise rohkem tööd ära teha. See saab suurepäraselt hakkama koodi kirjutamise ja silumisega, veebis uurimistöö tegemisega, andmete analüüsimisega, dokumentide ja arvutustabelite loomisega, tarkvara kasutamisega ning eri tööriistade vahel liikumisega, kuni ülesanne on lõpetatud. Selle asemel et iga sammu hoolikalt hallata, võid anda GPT‑5.5‑le segase, mitmest osast koosneva ülesande ja usaldada, et see suudab planeerida, tööriistu kasutada, oma tööd kontrollida, ebamäärasuses orienteeruda ja edasi liikuda.

Eelised on eriti tugevad agendipõhises koodikirjutamises, arvutikasutuses, teadmistepõhises töös ja teadusuuringute varajases etapis – valdkondades, kus areng sõltub kontekstiülesest arutlemisest ja aja jooksul tegutsemisest. GPT‑5.5 toob selle intelligentsuse hüppe ilma kiiruses järeleandmisi tegemata: suuremad ja võimekamad mudelid on sageli kasutusse andmisel aeglasemad, kuid GPT‑5.5 vastab GPT‑5.4 tokenipõhisele latentsusele reaalses kasutuses, pakkudes samal ajal palju kõrgemat intelligentsuse taset. See kasutab samade Codex ülesannete täitmiseks oluliselt vähem tokeneid, muutes selle nii tõhusamaks kui ka võimekamaks.

Avaldame GPT‑5.5 koos seni kõige tugevamate kaitsemeetmetega, mis on loodud väärkasutuse vähendamiseks ja samal ajal juurdepääsu säilitamiseks kasulikuks tööks. Enne avaldamist hindasime seda mudelit meie ohutus- ja valmisolekuraamistike alusel, tegime koostööd sisemiste ja väliste ekspertidega, lisasime sihtotstarbelise testimise kõrgtasemel küberturvalisuse ja bioloogia võimekuste jaoks ning kogusime tagasisidet ligi 200 usaldusväärselt varajase juurdepääsuga partnerilt.

Täna jõuab GPT‑5.5 ChatGPT‑s ja Codexis Plus, Pro, Business ja Enterprise kasutajateni ning GPT‑5.5 Pro jõuab ChatGPT‑s Pro, Business ja Enterprise kasutajateni. API juurutused nõuavad erinevaid kaitsemeetmeid ning teeme tihedat koostööd partnerite ja klientidega, et tagada suuremahulise pakkumise ohutus ja turvalisus. Toome GPT‑5.5 ja GPT‑5.5 Pro API-sse peagi.

GPT‑5.5

GPT‑5.4 

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Terminal-Bench 2.0

82,7%

75,1%

-

-

69,4%

68,5%

Expert-SWE (Sisemine)

73,1%

68,5%

-

-

-

-

GDPval (võidud või viigid)

84,9%

83,0%

82,3%

82,0%

80,3%

67,3%

OSWorld-Verified

78,7%

75,0%

-

-

78,0%

-

Toolathlon

55,6%

54,6%

-

-

-

48,8 %

BrowseComp

84,4 %

82,7%

90,1 %

89,3%

79,3%

85,9 %

FrontierMath 1.–3. tase

51,7%

47,6%

52,4 %

50,0%

43,8%

36,9 %

FrontierMath 4. tase

35,4%

27,1%

39,6%

38,0%

22,9%

16,7%

CyberGym

81,8%

79,0%

-

-

73,1%

-

Mudeli võimekused

OpenAI ehitab agentse tehisintellekti ülemaailmset infrastruktuuri, mis võimaldab inimestel ja ettevõtetel üle maailma tehisintellekti abil tööd teha. Viimase aasta jooksul oleme näinud, kuidas tehisintellekt on tarkvaraarendust märkimisväärselt kiirendanud. Koos GPT‑5.5‑ga Codexis ja ChatGPT‑s hakkab seesama muutus laienema ka teadusuuringutesse ja laiemale arvutitööle.

Kõigis neis valdkondades ei ole GPT‑5.5 mitte ainult intelligentsem, vaid ka tõhusam probleemide lahendamisel, saavutades sageli parema kvaliteediga tulemusi vähemate tokenite ja korduskatsega. Artificial Analysis Coding Index võrdlustestis demonstreerib GPT‑5.5 tipptasemel intelligentsust poole väiksemate kuludega kui konkureerivad tipptasemel kodeerimismudelid.

Tehisanalüüsi intelligentsuse indeks(avaneb uues aknas) on välise osapoole läbi viidud kümne hindamise kaalutud keskmine: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard, τ²-Bench Telecom.

Agentne kodeerimine

GPT‑5.5 on meie seni kõige tugevam agentne mudel. Terminal-Bench 2.0-s, mis testib keerukaid käsurea töövooge, mis nõuavad planeerimist, iteratsiooni ja tööriistade koordineerimist, saavutab see tipptasemel täpsuse 82.7%. SWE-Bench Pro testis, mis hindab pärismaailma GitHubi probleemide lahendamist, saavutab see 58,6%, lahendades ühe läbimisega otsast lõpuni rohkem ülesandeid kui varasemad mudelid. Expert-SWE-s, meie sisemises tipptasemel hindamises pika horisondiga kodeerimisülesannete jaoks, mille hinnanguline mediaanne inimeste lahendusaeg on 20 tundi, edestab GPT‑5.5 samuti GPT‑5.4.

Kõigis kolmes hindamises ületab GPT‑5.5 GPT‑5.4. tulemusi, kasutades vähem tokeneid.

Mudeli kodeerimisalased tugevused tulevad eriti selgelt esile Codexis, kus see suudab ette võtta inseneritöid alates juurutamisest ja refaktoreerimisest kuni silumise, testimise ja valideerimiseni. Esialgsed testid viitavad sellele, et GPT‑5.5 on parem sellistes käitumisviisides, millest tegelik inseneritöö sõltub, nagu konteksti säilitamine suurte süsteemide lõikes, arutlus ebaselgete rikete üle, eelduste kontrollimine tööriistade abil ja muudatuste läbiviimine ümbritsevas koodibaasis.

Renderdatud trajektoor kasutab NASA/JPL Horizonsi vektorandmeid Orioni, Kuu ja Päikese kohta ning loetavuse parandamiseks on rakendatud kuva skaleerimist.

Viip: [lisatud pilt] Rakenda see uue rakendusena, kasutades WebGL-i ja Vite’i ning Artemis II missiooni tegelikke andmeid. Veendu, et testid rakendust põhjalikult, kuni see on täielikult toimiv ja näeb välja nagu pildil olev rakendus. Pööra suurt tähelepanu planeetide ja lennutrajektooride renderdamisele. Ma tahan 3D-renderdusega suhelda. Veendu, et sellel oleks realistlik orbitaalmehaanika.

Lisaks testitulemustele ütlesid varajased testijad, et GPT‑5.5 suudab paremini mõista süsteemi ülesehitust: miks miski ebaõnnestub, kuhu parandus tuleb teha ja mida muud see koodibaasis mõjutaks.

alt

„Esimene kodeerimismudel, mida ma olen kasutanud ja millel on tõeline kontseptuaalne selgus.“

Dan Shipper, Every asutaja ja tegevjuht, kirjeldas GPT‑5.5 kui „esimest kodeerimismudelit, mida olen kasutanud ja millel on tõeliselt selge kontseptuaalne arusaam.”

Pärast rakenduse käivitamist veetis ta päevi käivitamisjärgse probleemi silumisel, enne kui kutsus ühe oma parima inseneri osa süsteemist ümber kirjutama. GPT‑5.5 testimiseks keeras ta sisuliselt kella tagasi: kas mudel suudaks vaadata katkist olekut ja luua samasuguse ümberkirjutuse, mille insener lõpuks valis? GPT‑5.4 ei suutnud. GPT‑5.5 suutis.

alt

„See tundub tõesti, nagu töötaksin kõrgema intelligentsusega, ja tekib peaaegu austuse tunne.“

Pietro Schirano, MagicPathi tegevjuht, nägi sarnast hüppelist muutust, kui GPT‑5.5 liitis sadade kasutajaliidese- ja refaktoreerimismuudatustega haru peaharusse, mida oli samuti märkimisväärselt muudetud, lahendades töö ühe näitega umbes 20 minutiga.

Mudelit testinud vaneminsenerid märkisid, et GPT‑5.5 oli arutlus ja autonoomsuse poolest märgatavalt parem kui GPT‑5.4 ja Claude Opus 4.7, tuvastades probleeme ette ning ennustades testimis- ja ülevaatusvajadusi ilma otsese juhendamiseta. Ühel juhul palus insener sellel kujundada koostööpõhises markdown-redaktoris kommentaarisüsteem ümber ja naasis 12 muudatusest koosneva virna juurde, mis oli peaaegu valmis. Teised märkisid, et nad vajasid üllatavalt vähe rakenduse parandusi ja tundsid end GPT‑5.5 plaanide suhtes kindlamalt võrreldes GPT‑5.4‑ga.

Üks NVIDIA insener, kellel oli mudelile varajane juurdepääs, läks koguni nii kaugele, et ütles: „Juurdepääsu kaotamine GPT‑5.5‑le tekitab tunde, nagu oleks mul jäse amputeeritud.”

„GPT-5.5 on märgatavalt targem ja visam kui GPT-5.4, tugevama programmeerimisjõudluse ja usaldusväärsema tööriistade kasutamisega. See püsib ülesande juures märksa kauem, ilma enneaegselt katkestamata, mis on kõige olulisem keeruka ja pikaajalise töö puhul, mida meie kasutajad Cursorile usaldavad,“
Michael Truell, Cursori kaasasutaja ja tegevjuht

Teadmiste töö

Samad tugevused, mis teevad GPT‑5.5 suurepäraseks kodeerimisel, muudavad selle võimsaks tööriistaks ka igapäevaseks arvutitööks. Kuna mudel mõistab kavatsust paremini, suudab see loomulikumalt liikuda läbi teadmustöö tsükli: teabe leidmine, olulise mõistmine, tööriistade kasutamine, väljundi kontrollimine ja toormaterjali muutmine millekski kasulikuks.

Codex on GPT‑5.5 dokumentide, tabelarvutuste ja slaidiesitluste genereerimisel parem kui GPT‑5.4. Alfatestijad ütlesid, et see edestas varasemaid mudeleid sellistes töödes nagu operatsioonianalüüs, arvutustabelite modelleerimine ja segaste äriliste sisendite plaanideks muutmine. Koos Codexi arvuti kasutamise oskustega toob GPT‑5.5 meid lähemale tundele, et mudel saab tegelikult koos sinuga arvutit kasutada: näha ekraanil toimuvat, klõpsata, kirjutada, liikuda liidestes ning liikuda täpselt eri tööriistade vahel.

OpenAI meeskonnad kasutavad neid tugevusi juba reaalsetes töövoogudes. Täna kasutab enam kui 85% ettevõtte töötajatest Codexit igal nädalal erinevates valdkondades, sealhulgas tarkvaraarenduses, finantsides, kommunikatsioonis, turunduses, andmeteaduses ja tootejuhtimises. Kommunikatsioonitiimis kasutas meeskond Codexis GPT‑5.5‑t, et analüüsida kuue kuu esinemistaotluste andmeid, koostada hindamis- ja riskiraamistik ning valideerida automatiseeritud Slacki agent, et madala riskiga taotlusi saaks käsitleda automaatselt, samal ajal kui kõrgema riskiga taotlused suunatakse inimülevaatusele. Finantsvaldkonnas kasutas meeskond Codex, et vaadata läbi 24 771 K-1 maksuvormi kogumahuga 71 637 lehekülge, kasutades töövoogu, mis välistas isikuandmed ja aitas meeskonnal ülesande täitmist võrreldes eelmise aastaga kahe nädala võrra kiirendada. Turundusmeeskonnas automatiseeris üks töötaja iganädalaste äriraportite koostamise, säästes nädalas 5–10 tundi.

ChatGPT‑s aitab GPT‑5.5 Thinking kiiremini lahendada keerukamaid probleeme: see annab nutikamad ja kokkuvõtlikumad vastused, et saaksid keerukast tööst tõhusamalt läbi tulla. See on eriti tugev professionaalsetes töödes, nagu programmeerimine, uurimistöö, teabe süntees ja analüüs ning dokumendirohked ülesanded, eriti siis, kui kasutad pluginaid.

GPT‑5.5 Pro-s näevad varajased testijad märkimisväärset edasiminekut nii nende ülesannete keerukuses kui kvaliteedis, millega ChatGPT suudab toime tulla, ning latentsuse paranemist, mis muudab selle märksa praktilisemaks nõudlike ülesannete jaoks. Võrreldes GPT‑5.4 Pro-ga olid GPT‑5.5 Pro vastused testijate hinnangul märkimisväärselt põhjalikumad, paremini struktureeritud, täpsemad, asjakohasemad ja kasulikumad ning eriti tugevad äri-, õigus-, haridus- ja andmeteaduse valdkonnas.

GPT‑5.5 saavutab tipptasemel tulemused mitmetes võrdlustestides, mis peegeldavad seda tüüpi tööd. GDPval⁠ võrdlustestis, mis hindab agentide võimekust teha hästi määratletud teadmustööd 44 ametikoha kontekstis, on GPT‑5.5 tulemus 84,9%. OSWorld-Verifiedil, mis mõõdab, kas mudel suudab iseseisvalt kasutada reaalseid arvutikeskkondi, saavutab see 78,7%. Ja Tau2-bench Telecomis, mis testib keerukaid klienditeeninduse töövooge, saavutab see ilma viiba häälestamiseta 98,0%. GPT‑5.5 toimib hästi ka teistes teadmustöö hindamistestides: 60,0% FinanceAgentis, 88,5% sisemistes investeerimispanganduse modelleerimisülesannetes ja 54,1% OfficeQA Pro testis.

Tau2-bench Telecom käitati ilma viiba häälestamiseta (ja GPT‑4.1 kasutajamudelina). GPT‑5.5 mõistab ülesande eesmärki paremini ja on token kasutamisel tõhusam kui selle eelkäijad.

„GPT-5.5 pakub täitmismahuka töö jaoks vajalikku püsivat jõudlust. NVIDIA GB200 NVL72 süsteemidel loodud ja käitatud mudel võimaldab meie meeskondadel juurutada algusest lõpuni funktsioone loomuliku keele viipadest, vähendada silumisaega päevadelt tundidele ning muuta nädalatepikkune eksperimenteerimine üleöö edusammudeks keerukates koodibaasides. See ei tähenda ainult kiiremat kodeerimist – see on uus tööviis, mis aitab inimestel töötada olemuslikult teistsuguse kiirusega,”
Justin Boitano, NVIDIA ettevõtte tehisintellekti valdkonna asepresident

Teadusuuringud

GPT‑5.5 näitab edusamme teaduslike ja tehniliste uurimistööde töövoogudes, mis nõuavad enamat kui keerulistele küsimustele vastamist. Teadlased peavad uurima ideed, koguma tõendeid, testima eeldusi, tõlgendama tulemusi ja otsustama, mida järgmisena proovida. GPT‑5.5 suudab selles tsüklis järjepidevalt paremini toimida kui teised mudelid.

Märkimisväärselt näitab GPT‑5.5 GeneBenchis(avaneb uues aknas) selget paranemist võrreldes GPT‑5.4‑ga, tegemist on uue hindamistestiga, mis keskendub mitmeetapilisele teadusandmete analüüsile geneetikas ja kvantitatiivses bioloogias. Need probleemid nõuavad, et mudelid arutleksid potentsiaalselt mitmetimõistetavate või vigaste andmete üle minimaalse juhendamisega, käsitleksid realistlikke takistusi, nagu varjatud segavad tegurid või kvaliteedikontrolli tõrked, ning rakendaksid ja tõlgendaksid kaasaegseid statistilisi meetodeid korrektselt. Mudeli jõudlus on tähelepanuväärne, arvestades, et siinsed ülesanded vastavad teadusekspertide jaoks sageli mitme päeva pikkustele projektidele.

Samamoodi saavutas GPT‑5.5 BixBenchil(avaneb uues aknas), mis on loodud reaalmaailma bioinformaatika ja andmeanalüüsi ümber, avaldatud tulemustega mudelite seas juhtiva jõudluse. Mudeli teaduslikud võimed on nüüd piisavalt tugevad, et märkimisväärselt kiirendada edasiminekut biomeditsiiniliste teadusuuringute tipptasemel tõelise kaasteadlasena.

Teises näites aitas GPT‑5.5 sisemine versioon koos kohandatud testkeskkonnaga avastada uue tõestuse(avaneb uues aknas) Ramsey arvude kohta, mis on kombinatoorika üks keskseid objekte. Kombinatoorika uurib, kuidas diskreetsed objektid omavahel kokku sobivad: graafid, võrgustikud, hulgad ja mustrid. Ramsey arvud käsitlevad laias laastus seda, kui suur peab võrgustik olema, enne kui mingi korrapära ilmumine on tagatud. Tulemused selles valdkonnas on haruldased ja sageli tehniliselt keerulised. Siin leidis GPT‑5.5 tõestuse ammu tuntud asümptootilise fakti kohta diagonaaliväliste Ramsey arvude kohta, mis hiljem Leanis kinnitati. Tulemus on konkreetne näide sellest, kuidas GPT‑5.5 panustab teadustöö põhivaldkonnas mitte ainult koodi või selgitustega, vaid ka üllatava ja kasuliku matemaatilise arutluskäiguga.

Varajased testijad kasutasid ChatGPT‑s GPT‑5.5 Pro-d mitte niivõrd ühe näitega vastusemootorina, vaid pigem uurimispartnerina: käsikirju mitme läbivaatuse jooksul kritiseerides, tehnilisi argumente proovile pannes, analüüse välja pakkudes ning koodi, märkmete ja PDF-ide kontekstiga töötades. Ühine joon on see, et GPT‑5.5 aitab teadlastel paremini liikuda küsimusest eksperimendi ja tulemuseni.

Derya Unutmaz, immunoloogiaprofessor ja teadlane Jacksoni Genoomimeditsiini laboratooriumis, kasutas GPT‑5.5 Pro-d, et analüüsida geeniekspressiooni andmestikku, mis sisaldas 62 valimit ja ligi 28 000 geeni. Ta koostas üksikasjaliku uurimisaruande, mis mitte ainult ei võtnud tulemusi kokku, vaid tõi esile ka olulised küsimused ja tähelepanekud — töö, milleks oleks tema sõnul tema meeskonnal kulunud kuid.

Bartosz Naskręcki, matemaatika abiprofessor Poolas Poznańis Adam Mickiewiczi ülikoolis, kasutas Codexis GPT‑5.5‑t, et luua üheainsa viip põhjal 11 minutiga algebralise geomeetria rakendus: see visualiseeris ruutpindade lõike ja teisendas saadud kõvera Weierstrassi mudeliks.

Hiljem täiendas ta rakendust stabiilsema singulaarsuse visualiseerimise ja täpsete koefitsientidega, mida saab edasises töös taaskasutada. Tema jaoks on suurem muutus see, et Codex saab nüüd aidata luua kohandatud matemaatilise visualiseerimise ja arvutialgebra töövooge, mis varem nõudsid spetsiaalseid tööriistu. Kokkuvõttes näitavad need näited, kuidas GPT‑5.5 muudab ekspertide kavatsuse toimivateks uurimistööriistadeks ja analüüsideks.

""

Allikas: Bartosz Naskręcki(avaneb uues aknas)

Viip: # Algebralise geomeetria pindade lõikumine

Loo rakendus, mis joonistab kaks ruutpinda ja värvib lõikekõvera punaseks. Kasuta arvutuslikku Riemanni–Rochi teoreemi, et teisendada see Weierstrassi kõveraks.

## Põhiaken

Kaks toonitud pinda kergelt läbipaistva varjundiga lõikuvad kõrgekvaliteedilises renderduses piki punast värvi algebralist kõverat.

Pööramine hiirega mõlemas suunas; täielik pigistusliigutuse mehhanism suumimiseks; haptiline vajutus väikese liuguritega menüü kuvamiseks iga pinna koefitsientide muutmiseks; tuvastamine Z-puhvri taseme kaudu.

## Parempoolne külgaken

Lühike Weierstrassi võrrand (üle Q või ruutvälja laienduse), arvutatud Go efektiivse Riemanni–Rochi teoreemi valemite abil

## Ambientne režiim, kus kõik juhtelemendid on peidetud ja kasutaja saab imetleda kujundite ilu

## Spetsifikatsioonid

Rakendus töötab brauseris, kergekaaluline teostus uusimate täispinu teekidega, kaasaskantav ja juurutatav.

## Dokumendid

Giti varamu, päevik, plaan (Markdown-failid)

„OpenAI uue GPT-5.5 mudeli kasutamine meie testkeskkonnas, selle võime analüüsida tohutuid biokeemilisi andmestikke, et prognoosida ravimite mõju inimestele, ning seejärel näha, kuidas see parandab täpsust meie kõige keerulisemates ravimite avastamise hindamistes, on äärmiselt innustav. Kui OpenAI jätkab samas tempos, muutuvad ravimite avastamise alused aasta lõpuks,“
Brandon White, Axiom Bio kaasasutaja ja tegevjuht

Järgmise põlvkonna järeldamise tõhusus

GPT‑5.5 pakkumine GPT‑5.4 latentsusega nõudis järeldustöötluse ümbermõtestamist kui integreeritud süsteemi, mitte eraldiseisvate optimeerimiste kogumit. GPT‑5.5 oli kaasdisainitud, treenitud ja käitatud NVIDIA GB200 ja GB300 NVL72 süsteemidel. Codex ja GPT‑5.5 mängisid olulist rolli meie jõudluseesmärkide saavutamisel. Codex aitas meeskonnal liikuda kiiremini ideest võrdlusalustega hinnatava teostuseni, visandades lähenemisviise, seadistades eksperimente ja aidates kindlaks teha, millised optimeerimised väärivad suuremat süvenemist. GPT‑5.5 aitas leida ja rakendada olulisi täiustusi süsteemi virnas. Lihtsalt öeldes aitas mudel parandada taristut, mis seda toetab.

Üks selline täiustus oli koormuse tasakaalustamine ja partitsioneerimise heuristikad. Enne GPT‑5.5 jagasime kiirendil päringud kindlaks arvuks segmentideks, et jaotada töö ühtlaselt arvutustuumade vahel, tagades, et nii suured kui ka väikesed päringud saaksid töötada samal GPU-l. Kuid eelnevalt kindlaks määratud arv staatilisi lõike ei ole kõigi liiklusmustrite jaoks optimaalne. GPU-sid tõhusamaks kasutamiseks analüüsis Codex mitme nädala jagu tootluskeskkonna liiklusmustreid ja kirjutas kohandatud heuristilisi algoritme, et tööd optimaalselt jaotada ja tasakaalustada. See pingutus avaldas ebaproportsionaalselt suurt mõju, suurendades tokeni genereerimise kiirust rohkem kui 20%.

Küberturvalisuse edendamine kõigi turvalisuse heaks

Maailma ettevalmistamine mudelite jaoks, mis on väga osavad turvanõrkuste leidmisel ja parandamisel, on meeskonnatöö, mis nõuab kogu ökosüsteemilt suuri pingutusi vastupidavuse suurendamiseks, kasutades mudelite demokratiseeritud juurdepääsu ja iteratiivset juurutamist küberkaitse uue ajastu jaoks.

Tipptasemel mudelid muutuvad küberturvalisuses üha võimekamaks. Need võimekused muutuvad laialdaselt kättesaadavaks ning me usume, et parim edasine tee on tagada, et neid saaks kasutada küberkaitse kiirendamiseks ja ökosüsteemi tugevdamiseks.

GPT‑5.5 on järkjärguline, kuid oluline samm tehisintellekti suunas, mis suudab lahendada maailma keerulisemaid väljakutseid, näiteks küberturvalisuse valdkonnas. GPT‑5.2‑ga juurutasime detsembris vajalikud küberkaitsemeetmed, et piirata mudelite võimalikku küberkuritarvitamist; nüüd GPT‑5.5‑ga juurutame rangemaid klassifitseerijaid võimalike küberriskide jaoks, mis võivad alguses mõnele kasutajale tüütud tunduda, kuid mida häälestame aja jooksul.

Oleme juba aastaid määratlenud küberturvalisuse kategooriana meie Valmisoleku raamistikus(avaneb uues aknas), kuna meie mudelid on järk-järgult paranenud, samal ajal kui töötame iteratiivselt välja ja kalibreerime leevendusmeetmeid, et saaksime vastutustundlikult avaldada mudeleid, millel on olulised küberturvalisuse võimed.

  • Me juurutame selle kübervõimekuse taseme jaoks valdkonna juhtivaid kaitsemeetmeid. Võtsime kübervaldkonna spetsiifilised kaitsemeetmed esimest korda kasutusele koos GPT‑5.2‑ga(avaneb uues aknas) eelmisel aastal ning oleme neid järgnevates juurutustes edasi testinud, täiustanud ja edasi arendanud. GPT‑5.5 jaoks kavandasime rangemad kontrollmehhanismid kõrgema riskiga tegevuse ja tundlike küberpäringute ümber ning lisasime kaitsemeetmed korduva väärkasutuse puhuks. Laialdane juurdepääs on võimalik tänu meie investeeringutele mudelite ohutusse, autentitud kasutusse ja keelatud kasutuse jälgimisse. Oleme juba kuid teinud koostööd välisekspertidega, et arendada, testida ja täiustada nende kaitsemeetmete töökindlust. GPT‑5.5 abil tagame, et arendajad saavad oma koodi hõlpsasti turvata, kehtestades samal ajal rangemad kontrollimeetmed nende kübertöövoogude ümber, mida pahatahtlikud osapooled kõige tõenäolisemalt kahju tekitamiseks ära kasutavad.
  • Laiendame juurdepääsu, et kiirendada küberkaitset igal tasandil. Teeme oma kübervaldkonnas leebemate piirangutega mudelid kättesaadavaks programmi Trusted Access for Cyber kaudu, alustades Codexist, mis hõlmab GPT‑5.5 täiustatud küberturbevõimekustele laiendatud juurdepääsu ja millel on käivitamisel vähem piiranguid kontrollitud kasutajatele, kes vastavad teatud usaldussignaalidele(avaneb uues aknas). Organisatsioonid, kes vastutavad elutähtsa taristu kaitsmise eest, saavad taotleda juurdepääsu kübertegevusi lubavatele mudelitele nagu GPT‑5.4‑Cyber, kui nad täidavad rangeid turvanõudeid, et kasutada neid mudeleid oma sisemiste süsteemide kaitsmiseks. See annab laiale hulgale kontrollitud kaitsjatele võimekamad tööriistad õiguspäraseks turbetööks, vähendades tarbetut hõõrdumist, et demokratiseerida juurdepääsu olulistele kaitsevõimekustele. Kasutajad saavad taotleda usaldusväärset juurdepääsu aadressil chatgpt.com/cyber(avaneb uues aknas), et vähendada tarbetuid keeldumisi GPT‑5.5 kasutamisel kontrollitud kaitseotstarbeliseks tööks.
  • Teeme koostööd valitsuspartneritega, et kaitsta avalikkuse jaoks olulist taristut. Koos uurime, kuidas arenenud tehisintellekt saab toetada usaldusväärsete ametnike tööd, kes vastutavad süsteemide eest, millest inimesed sõltuvad, alates maksumaksjate andmeid kaitsvatest digisüsteemidest kuni kohalike kogukondade elektrivõrgu ja veevarustuseni.

Käsitleme GPT‑5.5 bioloogilisi, keemilisi ja küberturvalisuse võimeid oma Valmisoleku raamistiku(avaneb uues aknas) alusel kõrge tasemena. Kuigi GPT‑5.5 ei saavutanud küberturvalisuse võimekuse kriitilist taset, näitasid meie hindamised ja testimine, et selle küberturvalisuse võimekus on võrreldes GPT‑5.4‑ga samm edasi.

Lisaks läbis GPT‑5.5 enne väljaandmist meie täieliku ohutus- ja juhtimisprotsessi, mis hõlmas valmisoleku hindamisi, valdkonnapõhiseid teste, uusi sihipäraseid hindamisi bioloogia ja küberturvalisuse täiustatud võimekuste jaoks ning põhjalikku testimist välisekspertidega. Jagame rohkem üksikasju GPT‑5.5 süsteemikaardis(avaneb uues aknas).

See töö peegeldab meie laiemat TI vastupidavuse lähenemist, mis on meie hinnangul vajalik, kuna mudelite võimekus areneb. Me tahame, et võimekas tehisintellekt oleks kättesaadav inimestele, kes seda kasutavad süsteemide, institutsioonide ja avalikkuse kaitsmiseks. Elujõuline tee on usaldusväärne juurdepääs, tugevad kaitsemeetmed, mis arenevad koos võimekusega, ning tegevusvõimekus tõsise väärkasutuse tuvastamiseks ja sellele reageerimiseks.

Saadavus ja hinnastamine

Täna jõuab GPT‑5.5 ChatGPT‑s ja Codexis Plus, Pro, Business ja Enterprise kasutajateni ning GPT‑5.5 Pro jõuab ChatGPT‑s Pro, Business ja Enterprise kasutajateni. Toome GPT‑5.5 ja GPT‑5.5 Pro API-sse peagi.

ChatGPT GPT‑5.5 Thinking on saadaval Plus, Pro, Businessi ja Enterprise’i kasutajatele. GPT‑5.5 Pro, mis on mõeldud veel keerulisemate küsimuste ja suuremat täpsust nõudva töö jaoks, on saadaval Pro, Businessi ja Enterprise’i kasutajatele.

Codex on GPT‑5.5 saadaval Plus, Pro, Business, Enterprise, Edu ja Go plaanides 400K kontekstiaknaga. GPT‑5.5 on saadaval ka kiirrežiimis, genereerides tokeneid 1,5 korda kiiremini 2,5-kordse hinnaga.

API arendajatele on gpt-5.5 peagi saadaval vastuste ja vestluse lõpetamise API-des hinnaga 5 dollarit miljoni sisendtokeni ja 30 dollarit miljoni väljundtokeni eest ning 1 miljoni kontekstiaknaga. Batch- ja Flex hinnastamine on saadaval poole standardse API hinnaga, samas kui prioriteetne töötlemine on saadaval 2,5 korda standardse hinnaga. Teeme gpt-5.5-pro ka API-s kättesaadavaks veelgi suurema täpsuse jaoks; hind on 30 dollarit 1 miljoni sisend tokeni kohta ja 180 dollarit 1 miljoni väljundtokeni kohta. Vaata hinnastamise lehte täieliku teabe saamiseks.

Kuigi GPT‑5.5 on kõrgema hinnaga kui GPT‑5.4, see on nii intelligentsem kui ka palju rohkem tokeniefektiivne. Codexis oleme kogemust hoolikalt häälestanud, et GPT‑5.5 annaks enamiku kasutajate jaoks GPT‑5.4‑ga võrreldes vähemate tokenitega paremaid tulemusi, pakkudes samal ajal jätkuvalt heldet kasutusmahtu kõigil tellimustasemetel.

Hindamised

Kodeerimine

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

SWE-Bench Pro (Avalik) *

58,6%

57,7%

-

-

64,3%

54,2%

Terminal-Bench 2.0

82,7%

75,1%

-

-

69,4 %

68,5%

Expert-SWE (sisemine)

73,1%

68,5%

-

-

-

-

*Laborid on täheldanud selle hindamistesti puhul meeldejätmise märke(avaneb uues aknas)

Professionaalne

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GDPval (võidud või viigid)

84,9%

83,0%

82,3%

82,0%

80,3%

67,3%

FinanceAgent v1.1

60,0%

56,0%

-

61,5%

64,4%

59,7%

Investeerimispanganduse modelleerimisülesanded (sisemine)

88,5 %

87,3%

88,6%

83,6%

-

-

OfficeQA Pro

54,1%

53,2%

-

-

43,6%

18,1 %

Arvuti kasutamine ja nägemine

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

OSWorld-Verified

78,7%

75,0%

-

-

78,0%

-

MMMU Pro (ilma tööriistadeta)

81,2%

81,2%

-

-

-

80,5%

MMMU Pro (tööriistadega)

83,2%

82,1%

-

-

-

-

Tööriistade kasutamine

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

BrowseComp

84,4 %

82,7%

90,1 %

89,3%

79,3%

85,9 %

MCP Atlas**

75,3 %

70,6%

-

-

79,1%

78,2%

Toolathlon

55,6%

54,6%

-

-

-

48,8 %

Tau2-bench Telecom***
(algsed viibad)

98,0 %

92,8%

-

-

-

-

** MCP Atlas: Scale AI tulemused pärast viimast 2026. aasta aprilli uuendust. 
*** Tau2-bench Telecom: 5.5 ja 5.4 tulemused algsete viipadega, st viipasid ei kohandatud. See jätab välja teiste laborite tulemused, mida hinnati viip kohandustega.

Akadeemiline

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

GeneBench

25,0%

19,0%

33,2%

25,6%

-

-

FrontierMath 1.–3. tase

51,7%

47,6%

52,4 %

50,0%

43,8%

36,9 %

FrontierMath 4. tase

35,4%

27,1%

39,6%

38,0%

22,9%

16,7%

BixBench

80,5%

74,0%

-

-

-

-

GPQA Diamond

93,6%

92,8%

-

94,4%

94,2 %

94.3 %

Inimkonna viimane eksam (ilma tööriistadeta)

41,4%

39,8%

43,1%

42,7%

46,9%

44,4%

Inimkonna viimane eksam (tööriistadega)

52,2%

52,1%

57,2%

58,7%

54,7%

51,4%

Küberturvalisus

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Lipu vallutamise väljakutseülesanded (sisemine)****

88,1%

83,7%

-

-

-

-

CyberGym

81,8%

79,0%

-

-

73,1%

-

**** Kõige raskemate süsteemikaartidel kasutatavate CTF-ide laiendus koos täiendavate keeruliste väljakutsetega.

Pikk kontekst

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

Graphwalks BFS 256k f1

73,7%

62,5%

-

-

76,9%

-

Graphwalks BFS 1 miljon f1

45,4%

9,4%

-

-

41,2 % (Opus 4.6)

-

Graphwalks parents 256k f1

90,1 %

82,8 %

-

-

93,6%

-

Graphwalks vanemad 1 miljon f1

58,5%

44,4%

-

-

72,0% (Opus 4.6)

-

OpenAI MRCR v2 8-needle 4K-8K

98,1%

97,3%

-

-

-

-

OpenAI MRCR v2 8-needle 8K-16K

93,0%

91,4%

-

-

-

-

OpenAI MRCR v2 8-needle 16K-32K

96,5%

97,2%

-

-

-

-

OpenAI MRCR v2 8-needle 32K-64K

90,0%

90,5%

-

-

-

-

OpenAI MRCR v2 8-needle 64K-128K

83,1%

86,0%

-

-

-

-

OpenAI MRCR v2 8-needle 128K-256K

87,5%

79,3%

-

-

59,2%

-

OpenAI MRCR v2 8-needle 256K-512K

81,5%

57,5%

-

-

-

-

OpenAI MRCR v2 8-needle 512K–1M

74,0%

36,6%

-

-

32,2%

-

Abstraktne arutlemine

Hindamine

GPT‑5.5

GPT‑5.4

GPT‑5.5 Pro

GPT‑5.4 Pro

Claude Opus 4.7

Gemini 3.1 Pro

ARC-AGI-1 (kinnitatud)

95,0%

93,7%

-

94,5%

93,5%

98,0 %

ARC-AGI-2 (kinnitatud)

85,0 %

73,3%

-

83,3%

75,8%

77,1 %

GPT hindamistestid viidi läbi, kui arutluse intensiivsus oli seatud tasemele xhigh, ning need toimusid uurimiskeskkonnas, mis võib mõnel juhul anda veidi erinevaid tulemusi võrreldes tootmiskeskkonna ChatGPT‑ga.

Autor

OpenAI