Pereiti prie pagrindinio turinio
OpenAI

2025 m. rugsėjo 15 d.

LeidimasProduktas

Pristatome „Codex“ atnaujinimus

„Codex“ tapo spartesnis, patikimesnis, geriau bendradarbiauja realiuoju laiku ir savarankiškai vykdo užduotis bet kurioje kūrimo aplinkoje – terminale, IDE, internete ar net telefone.

Kodų fragmentai, plūduriuojantys šviesiai mėlyname fone su neryškiomis gėlių formomis, kuriame pavaizduotas centrinis būsenos laukelis su žalia etikete „Open“, rodantis +27 įtraukimus ir -15 panaikinimų.
Įkeliama...

2025 m. rugsėjo 23 d. atnaujinimas:  „GPT‑5‑Codex“ dabar prieinamas programuotojams, naudojantiems „Codex“ su API raktu (be to, kad yra prieinamas programuotojams, naudojantiems „Codex“ su „ChatGPT“ prenumerata). „GPT‑5 Codex“ kainuoja tiek pat, kiek „GPT‑5“, ir yra prieinamas tik per „Responses API“. Pagrindinė modelio momentinė nuotrauka bus nuolat atnaujinama. Daugiau informacijos rasite „Codex“ programuotojams skirtoje dokumentacijoje(atsidaro naujame lange) ir pakeitimų žurnale(atsidaro naujame lange).

Šiandien išleidžiame „GPT‑5‑Codex“ – „GPT‑5“ versiją, papildomai optimizuotą agentiniam programavimui „Codex“ aplinkoje. „GPT‑5‑Codex“ buvo mokomas sutelkiant dėmesį į realius programinės įrangos inžinerijos darbus; jis vienodai gerai veikia tiek per greitus, interaktyvius seansus, tiek savarankiškai atliekant ilgas, sudėtingas užduotis. Jo kodo peržiūros funkcija gali aptikti kritinius riktus prieš jiems patenkant į galutinę versiją. „GPT‑5‑Codex“ prieinamas visur, kur naudojate „Codex“ – tai numatytoji reikšmė debesijos užduotims ir kodo peržiūrai, o programuotojai gali pasirinkti naudoti jį vietinėms užduotims per „Codex CLI“ ir IDE plėtinį.

Nuo tada, kai balandį pristatėme „Codex CLI“(atsidaro naujame lange), o gegužę – „Codex“ internete, „Codex“ nuolat tobulėjo ir tapo veiksmingesniu programavimo partneriu. Prieš dvi savaites sujungėme „Codex“ į vieną produktą, susietą su jūsų „ChatGPT“ paskyra, kad galėtumėte sklandžiai perkelti darbą iš vietinės aplinkos į debesį neprarasdami konteksto. Dabar „Codex“ veikia ten, kur kuriate – terminale arba IDE, internete, „GitHub“ ir net „ChatGPT“ „iOS“ programoje. „Codex“ įtrauktas į „ChatGPT Plus“, „Pro“, „Business“, „Edu“ ir „Enterprise“ planus.

Su šiais atnaujinimais „Codex“ priartėja prie to, ką visą laiką kūrėme – komandos nario, kuris supranta jūsų kontekstą, dirba kartu su jumis ir patikimai imasi jūsų komandos darbų.

GPT‑5‑Codex

„GPT‑5‑Codex“ – tai GPT‑5 versija, papildomai optimizuota agentinei programinės įrangos inžinerijai „Codex“ aplinkoje. Jis mokytas atlikti sudėtingas, realias inžinerines užduotis, tokias kaip išbaigtų projektų kūrimas nuo nulio, funkcijų ir testų įtraukimas, riktų taisymas, didelio masto pertvarkymų atlikimas ir kodo peržiūrų vykdymas. Jis geriau valdomas, tiksliau laikosi AGENTS.md(atsidaro naujame lange) instrukcijų ir generuoja kokybiškesnį kodą – tiesiog pasakykite, ko jums reikia, nerašydami ilgų stiliaus ar kodo švaros instrukcijų.

SWE-bench Verified: istoriškai, įskaitant per GPT‑5 paleidimą, skelbėme rezultatus pagal 477 „SWE-bench Verified“ užduotis, nes kai kurios užduotys negalėjo veikti mūsų infrastruktūroje. Tai ištaisėme ir dabar teikiame ataskaitas apie visas 500 užduočių.

Kodo pertvarkymo užduotys: mūsų kodo pertvarkymo vertinimas apima pertvarkymo tipo užduotis iš didelių, sukurtų saugyklų ir apima užduotis, parašytas „Python“, „Go“ ir net OCaml kalbomis. Užduoties pavyzdys yra toliau pateikta „Gitea“ išsiuntimo užklausa(atsidaro naujame lange), kurioje pakeičiami 232 failai ir 3 541 eilutė, siekiant įtraukti ctx kintamąjį į visą programos logiką.

„GPT‑5‑Codex“ dinamiškiau pritaiko laiką, kurį praleidžia galvodamas, atsižvelgdamas į užduoties sudėtingumą. Modelis sujungia du esminius programavimo agento įgūdžius: porinį darbą su programuotojais interaktyviuose seansuose ir nuoseklų, savarankišką ilgesnių užduočių vykdymą. Tai reiškia, kad „Codex“ veiks sparčiau gavęs nedideles, aiškiai apibrėžtas užklausas ar kai su juo kalbatės, ir dirbs ilgiau atlikdamas sudėtingas užduotis, pavyzdžiui, didelius pertvarkymus. Testuodami matėme, kaip „GPT‑5‑Codex“ savarankiškai dirba daugiau nei septynias valandas iš eilės atlikdamas dideles, sudėtingas užduotis, kartoja įgyvendinimo veiksmus, taiso testų nesėkmes ir galiausiai pateikia sėkmingą įgyvendinimą.

Analizuojant „OpenAI“ darbuotojų judėjimą matyti, kad 10 proc. mažiausiai resursų naudojančių naudotojo užklausų, surikiuotų pagal modelio sugeneruotus prieigos raktus (įskaitant paslėptą samprotavimą ir galutinę išvestį), „GPT‑5‑Codex“ sunaudoja 93,7 proc. mažiau prieigos raktų nei GPT‑5. Priešingai, 10 proc. daugiausiai resursų naudojančių užklausų atvejų „GPT‑5‑Codex“ galvoja daugiau ir praleidžia dvigubai daugiau laiko samprotaudamas, redaguodamas bei testuodamas kodą ir atlikdamas iteracijas.

„GPT‑5‑Codex“ buvo specialiai mokomas atlikti kodo peržiūras ir rasti kritinius trūkumus. Peržiūrėdamas jis naršo jūsų kodų bazėje, samprotauja apie priklausomybes ir vykdo jūsų kodą bei testus, kad patikrintų teisingumą. Įvertinome kodo peržiūros našumą pagal naujausius pakeitimus populiariose atvirojo kodo saugyklose. Kiekvieno pakeitimo atveju patyrę programinės įrangos inžinieriai įvertino peržiūros komentarų teisingumą ir svarbą. Nustatėme, kad „GPT‑5‑Codex“ komentarai rečiau būna neteisingi ar nesvarbūs, todėl daugiau naudotojo dėmesio lieka kritinėms problemoms.

„GPT‑5‑Codex“ yra patikimas partneris atliekant išorinės sąsajos kūrimo užduotis. Be estetiškų kompiuterių programų kūrimo, „GPT‑5‑Codex“ taip pat rodo reikšmingus pagerėjimus žmonių pirmenybės vertinimuose kuriant mobiliąsias interneto svetaines. Dirbdamas debesyje, jis gali peržiūrėti kaip įvestį pateiktus vaizdus ar ekrano kopijas, vizualiai tikrinti savo pažangą ir rodyti jums savo darbo ekrano kopijas.

„GPT‑5‑Codex“ sukurtas specialiai „Codex CLI“, „Codex“ IDE plėtiniui, „Codex“ debesijos aplinkai ir darbui „GitHub“, taip pat palaiko įvairiapusį įrankių naudojimą. Skirtingai nei GPT‑5, kuris yra bendrosios paskirties modelis, „GPT‑5‑Codex“ rekomenduojame naudoti tik agentinio programavimo užduotims „Codex“ ar į „Codex“ panašiose aplinkose.

„Codex“ atnaujinimai

Taip pat neseniai atlikome keletą atnaujinimų, kad „Codex“ taptų geresniu programuotoju-porininku, įskaitant atnaujintą „Codex CLI“ ir naująjį „Codex“ IDE plėtinį.

„Codex“ CLI

„Codex CLI“ yra atvirojo kodo; bendruomenės atsiliepimai per pastaruosius kelis mėnesius buvo neįkainojami formuojant jo evoliuciją. Remdamiesi šiais atsiliepimais, perkūrėme „Codex CLI“ pagal agentinio programavimo darbo eigas, kad paverstume savo modelius pajėgesniais ir patikimesniais partneriais. Dabar tiesiai CLI sąsajoje galite pridėti ir dalytis vaizdais – ekrano kopijomis, maketais ir diagramomis, – kad sukurtumėte bendrą kontekstą dėl dizaino sprendimų ir gautumėte būtent tai, ko norite. Atliekant sudėtingesnius darbus, „Codex“ dabar stebi pažangą naudodamas darbų sąrašą ir įtraukia tokius įrankius kaip internetinė paieška bei MCP, skirtus jungtis prie išorinių sistemų, užtikrinant apskritai tikslesnį įrankių naudojimą.

Taip pat atnaujinta terminalo naudotojo sąsaja: įrankių iškvietimai ir skirtumai geriau suformatuoti ir lengviau sekami. Patvirtinimo režimai supaprastinti iki trijų lygių: tik skaityti su aiškiais patvirtinimais, automatinis su visa prieiga prie darbo srities, bet reikalaujantis patvirtinimų už darbo srities ribų, ir visa prieiga su galimybe skaityti failus bet kur ir vykdyti komandas naudojant tinklo prieigą. Taip pat palaikomas pokalbio būsenos glaudinimas, kad būtų lengviau valdyti ilgesnius seansus.

Daugiau informacijos rasite „Codex CLI“ sparčiosios paleisties vadove(atsidaro naujame lange).

„Codex“ IDE plėtinys

„Codex“ pasitinka jus ten, kur jau dirbate, įskaitant jūsų IDE. IDE plėtinys perkelia „Codex“ agentą į „VS Code“, „Cursor“ ir kitas „VS Code“ atšakas, kad galėtumėte sklandžiai peržiūrėti vietinius pakeitimus ir redaguoti kodą naudodami „Codex“. Naudodami „Codex“ savo IDE, galite rašyti trumpesnius raginimus ir gauti greitesnius rezultatus, nes „Codex“ gali naudoti kontekstą, pavyzdžiui, jūsų atidarytus failus ar pasirinktą kodą.

„Codex“ IDE plėtinys taip pat leidžia sklandžiai perkelti darbus tarp debesies ir vietinės aplinkos. Galite kurti naujas debesijos užduotis, stebėti vykdomą darbą ir peržiūrėti atliktas užduotis neišeidami iš redagavimo priemonės. Norėdami sudėti baigiamuosius akcentus, galite atidaryti debesijos užduotis savo IDE, o „Codex“ išlaikys kontekstą. Sužinokite daugiau, kaip geriausiai išnaudoti IDE plėtinį, sparčiosios paleisties vadove(atsidaro naujame lange).

„Codex“ debesyje

Be „Codex CLI“, naujasis IDE plėtinys ir „GitHub“ integracija priartina „Codex“ debesijos agentą prie programuotojų darbo eigų, todėl dabar galite deleguoti užduotis neatsitraukdami nuo redagavimo priemonės ar „GitHub“.

Užkulisiuose taip pat nuolat gerinome debesijos infrastruktūros našumą. Talpykloje saugodami programines vykdymo aplinkas, 90 proc. sumažinome naujų užduočių ir tolesnių veiksmų atlikimo laiko medianą. „Codex“ dabar taip pat automatiškai sukonfigūruoja savo aplinką, nuskaitydamas įprastus sąrankos scenarijus ir juos vykdydamas, o naudodamas konfigūruojamą interneto prieigą gali vykdyti tokias komandas kaip „pip install“, kad prireikus gautų priklausomybes vykdymo metu.

Kaip ir CLI bei IDE plėtinyje, dabar galite naudoti vaizdus, kad pasidalytumėte sąsajos dizaino specifikacijomis ar paaiškintumėte naudotojo sąsajos riktus. Kurdamas jums, „Codex“ gali paleisti savo naršyklę, peržiūrėti, ką sukūrė, atlikti iteracijas ir pridėti rezultato ekrano kopiją prie užduoties ir „GitHub“ PR. Daugiau informacijos rasite dokumentacijoje(atsidaro naujame lange).

Kodo peržiūra

Dabar „Codex“ taip pat turi kodo peržiūros galimybes, išmokytas aptikti kritinius trūkumus. Skirtingai nei statinės analizės įrankiai, jis suderina nurodytą PR ketinimą su faktiniu skirtumu, samprotauja apie visą kodų bazę ir priklausomybes bei vykdo kodą ir testus, kad patvirtintų elgseną. Tik kruopščiausi žmonės peržiūrėtojai deda tiek pastangų į kiekvieną peržiūrimą PR, todėl „Codex“ užpildo šią spragą – padeda komandoms anksčiau rasti problemas, sumažinti peržiūrinčiųjų krūvį ir drąsiau pristatyti produktus.

Įjungus funkciją „GitHub“ saugykloje, „Codex“ automatiškai peržiūri PR, kai jos iš projekto būsenos pereina į parengties būseną, ir paskelbia savo analizę toje PR. Jei jis rekomenduoja redagavimus, galite likti toje pačioje gijoje ir paprašyti „Codex“ juos įgyvendinti. Taip pat galite aiškiai paprašyti peržiūros paminėdami „@codex review“ išsiuntimo užklausoje (PR) ir pateikti papildomų gairių, pavyzdžiui, „@codex review for security vulnerabilities“ arba „@codex review for outdated dependencies“. Norėdami sužinoti, kaip nustatyti kodo peržiūrą savo saugyklose, skaitykite sparčiosios paleisties vadovą(atsidaro naujame lange).

„OpenAI“ įmonėje „Codex“ dabar peržiūri didžiąją dalį mūsų PR, kasdien aptikdamas šimtus problemų – dažnai dar prieš pradedant žmogaus peržiūrą. „Codex“ komandai tai labai svarbu, nes leidžia judėti greitai ir su didesniu pasitikėjimu.

Kaip programuotojai naudoja „Codex“

„Reikėjo atnaujinti kitai komandai priklausančią kodų bazę funkcijų išleidimui. [...] Su „Codex“ perdaviau pertvarkymą ir testų generavimą, o pats susitelkiau į kitus prioritetus. Modelis sugeneravo kokybišką, visiškai ištestuotą kodą, kurį galėjau greitai grąžinti, – taip funkcija buvo atlikta laiku ir be papildomos rizikos.“
Tres Wong-Godfrey, „Cisco Meraki“ technikos vadovas

Saugių ir patikimų DI agentų kūrimas

Kuriame „Codex“ sutelkdami dėmesį į kodo ir duomenų apsaugą nuo nutekinimo ir saugodami nuo piktnaudžiavimo. Pagal numatytąsias nuostatas „Codex“ veikia „sandbox“ aplinkoje su išjungta tinklo prieiga(atsidaro naujame lange), tiek vietoje, tiek debesyje. Tai padeda užtikrinti, kad „Codex“ negalėtų atlikti žalingų veiksmų jūsų kompiuteryje, ir sumažina raginimų injekcijų iš nepatikimų šaltinių riziką.

„Codex“ gali paprašyti leidimo prieš atlikdamas potencialiai pavojingus veiksmus ir yra išmokytas vykdyti komandas, kad patikrintų savo išvestis. Programuotojai gali pritaikyti saugumo nuostatas, kad jos atitiktų jų rizikos toleranciją. Debesyje galite apriboti tinklo prieigą tik prie patikimų domenų. CLI ir IDE plėtinyje programuotojai gali patvirtinti komandas, kad jos būtų vykdomos su visa prieiga, arba leisti agentui naudotis internetine paieška ir jungtis prie MCP serverių. Tai gali išplėsti agento galimybes, tačiau padidina riziką – sužinokite daugiau, kaip saugiai valdyti ir naudoti „Codex“, čia(atsidaro naujame lange).

Visada raginame programuotojus peržiūrėti agento darbą prieš atliekant pakeitimus ar diegiant į gamybinę aplinką. Kad padėtų tai padaryti, „Codex“ su kiekviena užduotimi pateikia citatas, terminalo žurnalus ir testų rezultatus. Nors „Codex“ kodo peržiūros padeda sumažinti riziką, kad į gamybinę aplinką pateks pavojingų problemų (sukurtų žmonių ar agentų), visada rekomenduojame naudoti „Codex“ kaip papildomą peržiūrėtoją, o ne kaip žmogaus atliekamos peržiūros pakaitalą.

Vadovaudamiesi mūsų požiūriu į GPT‑5, nusprendėme laikyti „GPT‑5‑Codex“ didelio pajėgumo modeliu biologijos ir chemijos srityse ir įdiegėme apsaugos priemones, kad sumažintume susijusią riziką. Daugiau apie mūsų vertinimus ir patikimą saugos metodiką skaitykite sistemos kortelės priede.

Kainos ir prieinamumas

„Codex“ įtrauktas į „ChatGPT Plus“, „Pro“, „Business“, „Edu“ ir „Enterprise“ planus. Naudojimas kinta priklausomai nuo jūsų plano: „Plus“, „Edu“ ir „Business“ vietos gali apimti kelis sutelktus programavimo seansus per savaitę, o „Pro“ gali palaikyti visą darbo savaitę vykdant kelis projektus.

„Business“ planų naudotojai gali įsigyti kreditų, kad programuotojai galėtų viršyti įtrauktus limitus, o „Enterprise“ planai suteikia bendrą kreditų fondą, tad mokate tik už tai, ką sunaudoja jūsų programuotojai. Sužinokite daugiau apie naudojimo limitus „ChatGPT“ čia(atsidaro naujame lange).

Programuotojams, naudojantiems „Codex CLI“ su API raktu, planuojame netrukus suteikti „GPT‑5.1‑Codex‑Max“ per API.

„Codex“ tampa tokiu programavimo partneriu, kokį visada įsivaizdavome – spartesniu, patikimesniu ir giliai integruotu į jūsų jau naudojamus įrankius. Nekantraujame pamatyti, ką su juo sukursite, ir toliau tobulinsime „Codex“, kad jis taptų dar geresniu komandos nariu įgyvendinant ambicingiausius jūsų projektus.

Autorius

OpenAI