Í dag kynnum við rannsóknarforskoðun á GPT‑5.3‑Codex‑Spark, sem er minni útgáfa af GPT‑5.3‑Codex og fyrsta líkanið okkar sem er hannað fyrir rauntímakóðun. Codex-Spark er fínstillt til að virka nánast tafarlaust—með 15x hraðari myndunarhraða á sama tíma og það er afar öflugt fyrir raunveruleg kóðunarverkefni.
Codex-Spark markar fyrsta áfangann í samstarfi okkar við Cerebras, sem við tilkynntum í janúar. Við erum að deila Codex-Spark sem rannsóknarforskoðun með ChatGPT Pro-notendum svo að forritarar geti byrjað að gera tilraunir snemma á meðan við vinnum með Cerebras að því að auka gagnaversgetu, bæta heildarupplifunina og dreifa stærra framarlega líkaninu okkar.
Nýjustu framarlegu líkönin okkar hafa sýnt sérstaka styrkleika í getu sinni til að sinna langvarandi verkefnum, vinna sjálfstætt í margar klukkustundir, daga eða vikur án íhlutunar. Codex-Spark er fyrsta líkanið okkar sem er hannað sérstaklega til að vinna með Codex í rauntíma—til að gera markvissar breytingar, endurmóta rökfræði eða fínstilla viðmót og sjá niðurstöður strax. Með Codex-Spark styður Codex-fjölskyldan nú bæði langvarandi og metnaðarfull verkefni sem og að klára verk í augnablikinu. Við vonumst til að læra af því hvernig forritarar nota það og taka við ábendingum eftir því sem við höldum áfram að auka aðgang.
Við ræsingu hefur Codex-Spark 128k samhengisglugga og er eingöngu textamiðað. Á meðan á rannsóknarforskoðun stendur mun Codex-Spark hafa sínar eigin hraðatakmarkanir og notkun mun ekki teljast með í stöðluðum hraðatakmörkunum. Hins vegar, þegar eftirspurn er mikil, geturðu upplifað hægari aðgang eða tímabundna biðröð þar sem við tryggjum jafnvægi á áreiðanleika fyrir alla notendur.
Codex-Spark er fínstillt fyrir gagnvirka vinnu þar sem tafir skipta jafn miklu máli og gervigreind. Þú getur unnið með líkaninu eins og með samstarfsaðila í rauntíma—truflað eða beint því í aðra átt á meðan það vinnur, og endurtekið hratt án þess að bíða eftir að útgáfa klárist. Þar sem það er stillt fyrir hraða, heldur Codex-Spark sjálfgefnum vinnustíl sínum léttum: það gerir lágmarks, markvissar breytingar og keyrir ekki sjálfkrafa prófanir nema þú biðjir um það.
Codex-Spark er mjög hæft lítið líkan sem er fínstillt fyrir hraða úrvinnslu. Á SWE-Bench Pro og Terminal-Bench 2.0, tveimur viðmiðum sem meta getu í hugbúnaðarverkfræði með fulltrúum, skilar GPT‑5.3‑Codex‑Spark verri árangri en GPT‑5.3‑Codex, en getur lokið verkefninu á broti af tímanum.
Tímalengd er áætluð sem summa af (1) úttaksframleiðslutíma (úttakstákn ÷ sýnatökuhraði), (2) forfyllingartíma (forfyllingartákn ÷ forfyllingarhraði), (3) heildar keyrslutíma verkfæra og (4) heildarnetálag.
Þegar við þjálfuðum Codex-Spark kom í ljós að hraði líkansins var aðeins hluti af jöfnunni fyrir rauntímasamstarf—við þurftum einnig að minnka leyndina í öllu beiðni-svar ferlinu. Við innleiddum endurbætur á leynd frá upphafi til enda í kerfinu okkar sem gagnast öllum líkönum. Undir húddinu einfölduðum við hvernig svör streyma frá viðskiptavini til netþjóns og til baka, endurskrifuðum lykilhluta ályktunarstaflans okkar og endurhönnuðum hvernig lotur eru frumstilltar þannig að fyrsti sýnilegi tóki birtist fyrr og Codex haldist móttækilegt þegar þú ítrar. Með innleiðingu á viðvarandi WebSocket-tengingu og markvissum hagræðingum innan Responses API drógum við úr yfirbyggingu á hverja umferð viðskiptavinar/þjóns um 80%, yfirbyggingu á hvert tákn um 30% og tíma að fyrsta tákni um 50%. Sama hvaða líkan þú velur munt þú upplifa þéttari lykkju í allri Codex-upplifuninni.
Codex-Spark keyrir á Wafer Scale Engine 3(opnast í nýjum glugga)frá Cerebras—sérhönnuðum gervigreindarhraðali fyrir háhraða ályktanir sem veitir Codex-þjónustulag sem setur biðtíma í forgang. Við unnum með Cerebras til að bæta þessari lágbiðtímaleið við sama framleiðsluþjónustustafla og restin af flota okkar, svo hún virkar hnökralaust yfir Codex og undirbýr okkur til að styðja framtíðarlíkön.
„Það sem heillar okkur mest við GPT-5.3-Codex-Spark er samstarfið við OpenAI og forritarasamfélagið til að uppgötva hvað hröð ályktun gerir mögulegt—ný samskiptamynstur, ný notkunartilvik og í grundvallaratriðum ólík líkanaupplifun“ Þessi forskoðun er aðeins byrjunin.“
GPU eru áfram grunnstoð í þjálfunar- og ályktunarleiðslum okkar og skila hagkvæmustu tókunum fyrir almenna notkun. Cerebras bætir við þann grunn með því að skara fram úr í vinnuflæðum sem krefjast afar lítils biðtíma, herðir endalokalykkjuna svo Codex virðist móttækilegra þegar þú endurtekur.
Codex-Spark er sett í loftið í dag sem rannsóknarforskoðun fyrir alla ChatGPT Pro-notendur í nýjustu útgáfum Codex-appsins, CLI og VS Code-viðbótarinnar. Vegna þess að það keyrir á sérhæfðum vélbúnaði með litlum biðtíma, er notkunin háð sérstakri hraðatakmörkun sem getur breyst eftir eftirspurn á meðan á rannsóknarforskoðun stendur. Að auki erum við að gera Codex-Spark aðgengilegt í API fyrir lítinn hóp hönnunarsamstarfsaðila til að skilja hvernig forritarar vilja samþætta Codex-Spark í vörur sínar. Við munum auka aðgang á næstu vikum á meðan við höldum áfram að fínstilla samþættingu okkar undir raunverulegu vinnuálagi.
Codex-Spark er nú eingöngu textamiðað með 128 þús. samhengisglugga og er það fyrsta í röð ofurhraðra líkana. Eftir því sem við lærum meira með þróunarsamfélaginu um hvar hröð líkön skara fram úr í kóðun, munum við kynna enn fleiri eiginleika–þar á meðal stærri líkön, lengri samhengisglugga og fjölþætt inntak.
Codex-Spark inniheldur sömu öryggisþjálfun og aðallíkönin okkar, þar á meðal þjálfun sem tengist netöryggi. Við mátum Codex-Spark sem hluta af stöðluðu innleiðingarferli okkar, sem felur í sér grunnmat á netöryggi og öðrum getuþáttum, og komumst að þeirri niðurstöðu að það hafi ekki raunhæfa möguleika á að ná viðmiðunarmörkum undirbúningsramma okkar fyrir háa getu í netöryggi.
Codex-Spark er fyrsta skrefið í átt að Codex með tveimur viðbótarmátum: langtímarök og framkvæmd, og rauntímasamvinna fyrir hraða endurtekningu. Með tímanum munu stillingarnarrenna saman—Codex getur haldið þér í þéttri gagnvirkri lykkju á meðan lengri verkefni eru úthlutuð til undirfulltrúa í bakgrunni, eða dreift verkefnum til margra líkana samhliða þegar þú vilt breidd og hraða, svo þú þurfir ekki að velja einn ham fyrirfram.
Eftir því sem líkön verða hæfari, verður samskiptahraði augljós flöskuháls. Ofurhröð ályktun herðir þá hringrás, gerir Codex eðlilegri í notkun og víkkar út það sem er mögulegt fyrir alla sem vilja breyta hugmynd í virkan hugbúnað.


