Prezantimi i Codex
Një agjent inxhinierie softuerësh i bazuar në cloud që mund të punojë në shumë detyra paralelisht, i fuqizuar nga codex-1. Në dispozicion për përdoruesit e ChatGPT Pro, Business dhe Enterprise sot, dhe për përdoruesit e Plus së shpejti.

Përditësimi më 3 qershor 2025: Codex tani është në dispozicion për përdoruesit e ChatGPT Plus. Ne gjithashtu po i lejojmë përdoruesit t'i japin Codex qasje në internet gjatë ekzekutimit të detyrës. Referoju changelog(hapet në një dritare të re) dhe docs(hapet në një dritare të re) për më shumë detaje.
Sot po prezantojmë një tablo paraprake kërkimore të Codex: një agjent inxhinierie softuerike i bazuar në cloud që mund të punojë në shumë detyra paralelisht. Codex mund të kryejë detyra për ty si të shkruajë funksione, t'u përgjigjet pyetjeve rreth bazës së kodit, të rregullojë gabime dhe të propozojë kërkesa për rishikim; çdo detyrë funksionon në mjedisin e vet të izoluar në cloud, e parangarkuar me depon tënde.
Codex mbështetet nga codex-1, një version i OpenAI o3 i optimizuar për inxhinieri softuerike. U trajnua duke përdorur të mësuarit përforcues në detyra kodimi reale në një sërë mjedisesh për të gjeneruar kod që pasqyron nga afër stilin njerëzor dhe preferencat e PR, i përmbahet saktësisht udhëzimeve dhe mund të kryejë teste në mënyrë të përsëritur derisa të marrë një rezultat kalues. Po fillojmë të shpërndajmë Codex për përdoruesit e ChatGPT Pro, Enterprise dhe Business sot, me mbështetje për Plus dhe Edu që do të vijë së shpejti.
Sot mund të kesh qasje në Codex përmes shirit anësor në ChatGPT dhe t'i caktosh detyra të reja kodimi duke shtypur një kërkesë dhe duke klikuar “Code”. Nëse dëshiron t'i bësh Codex një pyetje në lidhje me bazën e kodit, kliko “Pyet”. Çdo detyrë përpunohet në mënyrë të pavarur në një mjedis të veçantë dhe të izoluar, të ngarkuar paraprakisht me bazën e kodit. Codex mund të lexojë dhe të modifikojë skedarët, si dhe të ekzekutojë komanda duke përfshirë sistemet e testimit, linter dhe kontrolluesit e tipit (type checker). Përfundimi i detyrës zakonisht zgjat nga 1 deri në 30 minuta, në varësi të kompleksitetit, dhe ti mund të monitorosh progresin e Codex në kohë reale.
Pasi Codex përfundon një detyrë, ai kryen ndryshimet e veta në mjedisin e tij. Codex ofron prova të verifikueshme të veprimeve të tij përmes citimeve të regjistrave të terminalit dhe përfundimeve të testeve, duke të lejuar të gjurmosh çdo hap të ndërmarrë gjatë përfundimit të detyrës. Pastaj mund të rishikosh rezultatet, të kërkosh rishikime të mëtejshme, të hapësh një kërkesë tërheqjeje në GitHub ose t'i integrosh ndryshimet drejtpërsëdrejti në mjedisin tënd lokal. Në produkt, mund të konfigurosh mjedisin Codex që të përputhet sa më shumë me mjedisin tënd real të zhvillimit.
Codex mund të udhëzohet nga skedarët AGENTS.md të vendosur brenda depove e tua. Këta janë skedarë teksti, të ngjashëm me README.md, ku mund t'i tregosh Codex-it se si të lundrojë në bazën e kodit, cilat komanda të përdorë për testim dhe si të ndjekë më mirë praktikat standarde të projektit tënd. Ashtu si zhvilluesit njerëzorë, agjentët e Codex performojnë më mirë kur u ofrohen mjedise të konfiguruara zhvillimi, konfigurime të besueshme testimi dhe dokumentacion i qartë.
Në vlerësimet e kodimit dhe standardet e brendshme, codex-1 tregon performancë të fortë edhe pa skedarët AGENTS.md ose skela të personalizuara.
23 mostra të verifikuara SWE-Bench që nuk mund të ekzekutoheshin në infrastrukturën tonë të brendshme u përjashtuan. codex-1 u testua me një gjatësi maksimale konteksti prej 192 mijë tokenësh dhe përpjekje arsyetimi të mesme, që është cilësimi që do të jetë i disponueshëm në produkt sot. Për detaje mbi vlerësimet e o3, shiko këtu.
Vlerësimi ynë i brendshëm i detyrave SWE është një grup i kuruar i detyrave të brendshme të SWE në botën reale në OpenAI.
Po e publikojmë Codex si një pamje paraprake kërkimore, në përputhje me strategjinë tonë të implementimit iterativ. Ne i dhamë përparësi sigurisë dhe transparencës kur dizajnuam Codex në mënyrë që përdoruesit të mund të verifikojnë daljet e tij - një mbrojtje që bëhet gjithnjë e më e rëndësishme pasi modelet e AI trajtojnë detyra më komplekse kodimi në mënyrë të pavarur dhe çështjet e sigurisë evoluojnë. Përdoruesit mund të verifikojnë punën e Codex përmes citimeve, regjistrave të terminaleve dhe rezultateve të testeve. Kur është i pasigurt ose përballet me dështime të testimit, agjenti i Codex i komunikon qartë këto çështje, duke u mundësuar përdoruesve të marrin vendime të informuara se si të veprojnë. Mbetet ende thelbësore që përdoruesit të rishikojnë dhe të vërtetojnë manualisht të gjithë kodin e gjeneruar nga agjentët përpara integrimit dhe ekzekutimit.


Një qëllim kryesor gjatë trajnimit të codex-1 ishte të përshtateshin daljet ngushtësisht me preferencat dhe standardet e kodimit njerëzor. Krahasuar me OpenAI o3, codex-1 prodhon vazhdimisht "patches" më të pastra, të gatshme për rishikim të menjëhershëm nga njerëzit dhe integrim në rrjedhat standarde të punës.
Mbrojtja nga aplikacionet keqdashëse të inxhinierisë së softuerëve të drejtuar nga IA, siç është zhvillimi i programeve dashakeqe (malware), është gjithnjë e më kritike. Në të njëjtën kohë, është e rëndësishme që masat mbrojtëse të mos pengojnë në mënyrë të panevojshme aplikacionet legjitime dhe të dobishme që mund të përfshijnë teknika që ndonjëherë përdoren edhe për zhvillimin e programeve dashakeqe, siç është inxhinieria e kernelit në nivel të ulët.
Për të balancuar sigurinë dhe përdorshmërinë, Codex u trajnua për të identifikuar dhe refuzuar saktësisht kërkesat që synojnë zhvillimin e softuerëve keqdashës, duke dalluar dhe mbështetur qartë detyrat legjitime. Ne gjithashtu kemi përmirësuar kuadrin e politikave tona dhe kemi përfshirë vlerësime rigoroze të sigurisë për t'i forcuar këta kufij në mënyrë efektive. Kemi publikuar një shtojcë në Kartën e Sistemit o3 për të pasqyruar këto vlerësime.
Agjenti Codex operon plotësisht brenda një konteineri të sigurt dhe të izoluar në re. Gjatë ekzekutimit të detyrës, qasja në internet është e çaktivizuar, duke kufizuar ndërveprimin e agjentit vetëm në kodin e dhënë në mënyrë eksplicite përmes depove GitHub dhe varësive të para-instaluara të konfiguruara nga përdoruesi përmes një skripti konfigurimi. Agjenti nuk mund të hyjë në faqet e internetit, API-të ose shërbimet e tjera të jashtme.
Ekipet teknike te OpenAI kanë filluar të përdorin Codex si pjesë të mjetit të tyre të përditshëm. Përdoret më shpesh nga inxhinierët e OpenAI për të lehtësuar detyra të përsëritura dhe të përcaktuara mirë, si rifaktorizimi, riemërtimi dhe shkrimi i testeve, të cilat përndryshe do të prishnin fokusin. Është po aq i dobishëm për krijimin e funksioneve të reja, lidhjen e komponentëve, rregullimin e defekteve dhe hartimin e dokumentacionit. Ekipet po krijojnë zakone të reja rreth tij: trajtimi i problemeve gjatë thirrjeve, planifikimi i detyrave në fillim të ditës dhe delegimi i punës në sfond për të vazhduar përpara. Duke zvogëluar ndërrimin e kontekstit dhe duke shfaqur detyrat e harruara, Codex ndihmon inxhinierët të punojnë më shpejt dhe të qëndrojnë të përqendruar në atë që ka më shumë rëndësi.
Para prezantimit, kemi punuar gjithashtu me një grup të vogël testuesish të jashtëm për të kuptuar më mirë se si performon Codex në baza të ndryshme kodimi, procese zhvillimi dhe ekipe.
- Cisco(hapet në një dritare të re) po eksploron se si Codex mund të ndihmojë ekipet e tyre inxhinierike që të sjellin më shpejt në jetë ide ambicioze. Si partnerë të hershëm të dizajnit, Cisco po ndihmon në formimin e së ardhmes së Codex duke e vlerësuar atë për rastet e përdorimit në botë reale në të gjithë portofolin e tyre të produkteve dhe duke ofruar përshtypje për Team e OpenAI.
- Temporal(hapet në një dritare të re) përdor Codex për të përshpejtuar zhvillimin e veçorive, për të spastruar, për të shkruar dhe ekzekutuar teste dhe për të rifaktuar baza të mëdha kodesh. Gjithashtu i ndihmon ata të qëndrojnë të përqendruar duke kryer detyra komplekse në sfond—duke i mbajtur inxhinierët në rrjedhën e punës ndërkohë që përshpejtohet përsëritja.
- Superhuman(hapet në një dritare të re) përdor Codex për të përshpejtuar detyra të vogla por të përsëritura, si përmirësimi i mbulimit të testeve dhe rregullimi i dështimeve të integrimit. Gjithashtu i ndihmon ata të dërgojnë më shpejt duke u mundësuar menaxherëve të produkteve të kontribuojnë në ndryshime të lehta në kod pa përfshirë një inxhinier, përveç për rishikimin e kodit.
- Kodiak(hapet në një dritare të re) po përdor Codex për të ndihmuar në shkrimin e mjeteve të korrigjimit, përmirësimin e mbulimit të testit dhe rifaktorizimin e kodit—duke përshpejtuar zhvillimin e Kodiak Driver, teknologjisë së tyre të drejtimit autonom. Codex është bërë gjithashtu një mjet i vlefshëm referimi, duke ndihmuar inxhinierët të kuptojnë pjesët e panjohura të paketës duke shfaqur kontekstin përkatës dhe ndryshimet e kaluara.
Bazuar në mësimet nga testuesit e hershëm, ne rekomandojmë caktimin e detyrave të mirëpërcaktuara për agjentë të shumtë njëkohësisht dhe eksperimentimin me lloje të ndryshme detyrash dhe kërkesash për të eksploruar aftësitë e modelit në mënyrë efektive.
Muajin e kaluar prezantuam Codex CLI, një agjent të lehtë dhe me burim të hapur për kodim që funksionon në terminalin tënd. Ajo sjell fuqinë e modeleve si o3 dhe o4-mini në proceset e tua lokale të punës, duke e bërë të lehtë çiftimin me ta për të përfunduar detyrat më shpejt.
Sot po publikojmë gjithashtu një version më të vogël të codex-1, një version të o4-mini të projektuar posaçërisht për përdorim në Codex CLI. Ky model i ri ofron mbështetje për proceset më të shpejta të punës në CLI dhe është optimizuar për pyetje-përgjigje dhe redaktim të kodit me vonesë të ulët, duke ruajtur të njëjtat pika të forta në ndjekjen e udhëzimeve dhe në stil. Tani është i disponueshëm si modeli i parazgjedhur në Codex CLI dhe në API si codex-mini-latest. Pamja e çastit do të përditësohet rregullisht ndërsa vazhdojmë të përmirësojmë modelin e Codex-mini.
Ne po e bëjmë gjithashtu shumë më të lehtë lidhjen e llogarisë tënde të zhvilluesit me Codex CLI. Në vend që të përftosh dhe të konfigurosh manualisht një token API, tani mund të hysh me llogarinë tënde të ChatGPT dhe të zgjedhësh organizatën API që dëshiron të përdorësh. Ne do të gjenerojmë dhe do ta konfigurojmë automatikisht çelësin API për ty. Përdoruesit Plus dhe Pro që hyjnë në Codex CLI me ChatGPT mund të fillojnë gjithashtu të shlyejnë kredite API falas prej 5 dhe 50 dollarësh, përkatësisht, më vonë sot për 30 ditët para.
Duke filluar nga sot, po e shpërndajmë Codex për përdoruesit e ChatGPT Pro, Enterprise dhe Business në mbarë botën, me mbështetje për Plus dhe Edu që do të vijë së shpejti. Përdoruesit do të kenë qasje të gjerë pa kosto shtesë për javët e ardhshme, kështu që mund të eksplorosh se çfarë mund të bëjë Codex, pas së cilës do të ofrojmë akses të kufizuar me tarifë dhe opsione fleksibël çmimesh që të lejojnë të blesh përdorim shtesë sipas kërkesës. Ne planifikojmë të zgjerojmë qasjen për përdoruesit e Plus dhe Edu së shpejti.
Për zhvilluesit që ndërtojnë me codex-mini-latest, modeli është i disponueshëm në Responses API dhe kushton 1.50 dollarë për 1 milion kode të hyrjes dhe 6 dollarë për 1 milion kode të daljes, me një zbritje prej 75% për ruajtjen në cache të kërkesës.
Codex është ende në fazat e hershme të zhvillimit të tij. Si një pamje paraprake kërkimore, aktualisht i mungojnë veçori si hyrje imazhe për punën e frontend dhe aftësia për të korrigjuar kursin e agjentit ndërsa punon. Për më tepër, delegimi te një agjent në distancë kërkon më shumë kohë sesa redaktimi interaktiv, gjë që mund të kërkojë pak kohë për t'u mësuar. Me kalimin e kohës, ndërveprimi me agjentët e Codex do të ngjajë gjithnjë e më shumë me bashkëpunimin asinkron me kolegët. Ndërsa aftësitë e modeleve përparojnë, ne presim që agjentët të merren me detyra më komplekse për periudha më të gjata.
Ne imagjinojmë një të ardhme ku zhvilluesit drejtojnë punën që duan të zotërojnë dhe delegojnë pjesën tjetër te agjentët—duke lëvizur më shpejt dhe duke qenë më produktivë me IA. Për ta arritur këtë, po ndërtojmë një grup mjetesh Codex që mbështesin si bashkëpunimin në kohë reale ashtu edhe delegimin asinkron.
Përdorimi i mjeteve IA si Codex CLI dhe të tjerë është bërë shpejt një normë në industri, duke i ndihmuar zhvilluesit të punojnë më shpejt ndërsa kodojnë. Por ne besojmë se rrjedha e punës asinkrone dhe me shumë agjentë e prezantuar nga Codex në ChatGPT do të bëhet mënyra de facto se si inxhinierët prodhojnë kod me cilësi të lartë.
Në fund të fundit, ne shohim këto dy mënyra të ndërveprimit—çiftimi në kohë reale dhe delegimi i detyrave—duke u bashkuar. Zhvilluesit do të bashkëpunojnë me agjentët e IA në të gjitha IDE-të dhe mjetet e tyre të përditshme për të bërë pyetje, për të marrë sugjerime dhe për të deleguar detyra më të gjata, të gjitha në një rrjedhë pune të unifikuar.
Duke parë përpara, planifikojmë të prezantojmë rrjedha pune më interaktive dhe fleksibël për agjentët. Zhvilluesit së shpejti do të mund të ofrojnë udhëzime gjatë detyrës, të bashkëpunojnë për strategjitë e zbatimit dhe të marrin përditësime proaktive mbi progresin. Ne gjithashtu parashikojmë integrime më të thella nëpër mjetet që ti tashmë përdor: sot Codex lidhet me GitHub dhe së shpejti do të jesh në gjendje të caktosh detyra nga Codex CLI, ChatGPT Desktop apo edhe mjete të tilla si gjurmuesi yt i problemeve ose sistemi CI.
Inxhinieria e softuerit është një nga industritë e para që përjeton rritje të rëndësishme të produktivitetit të drejtuara nga IA, duke hapur mundësi të reja për individët dhe ekipet e vogla. Ndërsa jemi optimistë për këto përfitime, po bashkëpunojmë gjithashtu me partnerët për të kuptuar më mirë implikimet e adoptimit të gjerë të agjentëve në rrjedhat e punës së zhvilluesve, zhvillimin e aftësive midis njerëzve, nivelet e aftësive dhe vendndodhjet gjeografike.
Ky është vetëm fillimi—dhe jemi të emocionuar të shohim se çfarë do të ndërtosh me Codex.
Mesazh sistemi
Ne po ndajmë mesazhin e sistemit codex-1 për të ndihmuar zhvilluesit të kuptojnë sjelljen e parazgjedhur të modelit dhe ta përshtatin Codex që të funksionojë në mënyrë efektive në proceset e personalizuara të punës. Për shembull, mesazhi i sistemit codex-1 in e nxit Codex të kryejë të gjitha testet e përmendura në skedarin AGENTS.md, por nëse ke pak kohë, mund t'i kërkosh Codex t'i kapërcejë këto teste.