18 dhjetor 2025

Prezantimi i GPT‑5.2‑Codex

Modeli më i avancuar agjentik i kodimit për inxhinieri softuerike profesionale dhe siguri kibernetike mbrojtëse.

Sot po publikojmë GPT‑5.2‑Codex, modelin më të avancuar agjentik për kodim në inxhinierinë komplekse të softuerëve në botën reale. GPT‑5.2‑Codex është një version i GPT‑5.2⁠ i optimizuar më tej për kodimin agjentik në Codex, duke përfshirë përmirësime në punën me horizont të gjatë përmes kompaktimit të kontekstit, performancë më të fortë në ndryshime të mëdha të kodit si ristrukturimet dhe migrimet, performancë të përmirësuar në mjediset Windows dhe aftësi shumë më të forta në sigurinë kibernetike.

Ndërsa modelet tona vazhdojnë të avancojnë përgjatë kufirit të inteligjencës, kemi vërejtur se këto përmirësime gjithashtu përkthehen në rritje të aftësive në fusha të specializuara si siguria kibernetike⁠. Për shembull, vetëm javën e kaluar, një studiues sigurie duke përdorur GPT‑5.1‑Codex‑Max me Codex CLI gjeti dhe zbuloi⁠(hapet në një dritare të re) në mënyrë të përgjegjshme një dobësi në React që mund të çojë në ekspozimin e kodit burimor.

GPT‑5.2‑Codex ka aftësi më të forta në sigurinë kibernetike se çdo model që kemi publikuar deri tani. Këto përparime mund të ndihmojnë në forcimin e sigurisë kibernetike në shkallë të gjerë, por gjithashtu ngrenë rreziqe të reja të përdorimit të dyfishtë që kërkojnë një zbatim të kujdesshëm. Ndërsa GPT‑5.2‑Codex nuk arrin një nivel "Të lartë" të aftësive kibernetike sipas Kuadrit tonë të Gatishmërisë, ne po projektojmë strategjinë tonë të vendosjes⁠ duke pasur parasysh rritjen e ardhshme të aftësive.

Ne po qarkullojmë GPT‑5.2‑Codex sot në të gjitha sipërfaqet e Codex për përdoruesit me pagesë të ChatGPT, dhe po punojmë për të mundësuar në mënyrë të sigurt aksesin në GPT‑5.2‑Codex për përdoruesit e API në javët e ardhshme. Në të njëjtën kohë, po pilotojmë akses të besuar vetëm me ftesë për aftësitë e ardhshme dhe modele më të lejuara për profesionistët dhe organizatat e verifikuara që fokusohen në punën mbrojtëse të sigurisë kibernetike. Ne besojmë se kjo qasje distribucioni do të balancojë aksesin me sigurinë.

Shtyrja e kufijve në inxhinierinë softuerike në botën reale

GPT‑5.2‑Codex ngrihet mbi pikat e forta të GPT‑5.2⁠ në punë me njohuri profesionale dhe aftësi kodimi agjentike të GPT‑5.1‑Codex‑Max⁠ në kufi, si dhe aftësi për përdorimin e terminalit. GPT‑5.2‑Codex tani është më i aftë në kuptimin e kontekstit të gjatë, thirrjen e besueshme të mjeteve, përmirësimin e faktualitetit dhe kompaktësimin natyral, duke e bërë atë një partner më të besueshëm për detyra të gjata kodimi, ndërkohë që mbetet efikas në përdorimin e tokenëve në arsyetimin e tij.

GPT‑5.2‑Codex arrin performancë të nivelit më të lartë në SWE-Bench Pro dhe Terminal-Bench 2.0, standarde të krijuara për të testuar performancën agjentike në një gamë të gjerë detyrash në mjedise terminale realiste. Është gjithashtu shumë më efektiv dhe i besueshëm në kodimin agjentik në mjediset vendase të Windows, duke u mbështetur në aftësitë e prezantuara në GPT‑5.1‑Codex‑Max.

Me këto përmirësime, Codex është më i aftë të punojë në depo të mëdha gjatë sesioneve të zgjatura me kontekstin e plotë të paprekur. Ai mund të përfundojë më me besueshmëri detyra komplekse si rifaktorizime të mëdha, migrime të kodit dhe ndërtimin e veçorive — duke vazhduar pa humbur drejtimin, edhe kur planet ndryshojnë ose përpjekjet dështojnë.

Në SWE-Bench Pro, një model merr një depo kodi dhe duhet të përftojë një patch për të zgjidhur një detyrë realiste të inxhinierisë softuerike. Terminal-Bench 2.0 është një pikë referimi për testimin e agjentëve IA në mjedise reale terminali. Detyrat përfshijnë përpilimin e kodit, trajnimin e modeleve dhe konfigurimin e serverëve.

Performanca më e fortë e vizionit aktivizon GPT‑5.2‑Codex të interpretojë më saktë pamjet e ekranit, diagramet teknike, grafikët dhe sipërfaqet e UI të ndara gjatë sesioneve të kodimit.

Codex mund të marrë skica dizajni dhe t'i përkthejë shpejt në prototipa funksionalë, dhe mund të bashkëpunosh me Codex për t'i çuar këto prototipa në prodhim.

Maket i dizajnit

Model dizajni i përdorur për të përftuar një prototip webi me Codex-5.2

Prototipi i gjeneruar nga GPT‑5.2‑Codex

Avancimi i kufirit kibernetik

Kur hartojmë performancën në një nga vlerësimet tona kryesore të sigurisë kibernetike me kalimin e kohës, vërejmë një rritje të mprehtë në aftësi duke filluar me GPT‑5‑Codex, një tjetër rritje të madhe me GPT‑5.1‑Codex‑Max dhe tani një rritje të tretë me GPT‑5.2‑Codex. Ne presim që modelet e ardhshme të AI të vazhdojnë në këtë trajektore. Në përgatitje, po planifikojmë dhe vlerësojmë sikur secili model i ri mund të arrijë nivele "Të larta" të aftësive të sigurisë kibernetike, siç matet nga Kuadri ynë i gatishmërisë⁠(hapet në një dritare të re). Ndërsa GPT‑5.2‑Codex ende nuk e ka arritur nivelin "E lartë" të aftësisë kibernetike, ne po përgatitemi për modelet e ardhshme që do ta kalojnë këtë prag. Për shkak të aftësive të shtuara kibernetike, kemi shtuar masa mbrojtëse shtesë në model dhe në produkt, të cilat janë përshkruar në kartën e sistemit⁠.

Vlerësimi Profesional Capture-the-Flag (CTF) mat se sa shpesh modeli mund të zgjidhë sfida të avancuara me shumë hapa të botës reale (që kërkojnë aftësi profesionale në sigurinë kibernetike) në një mjedis Linux.

Aftësi kibernetike të botës reale

Shoqëria moderne funksionon mbi softuerin, dhe besueshmëria e tij varet nga siguria e fortë kibernetike—duke mbajtur sistemet kritike në bankë, shëndetësi, komunikime dhe shërbime thelbësore online, duke mbrojtur të dhënat e ndjeshme dhe duke siguruar që njerëzit të mund të besojnë softuerin në të cilin mbështeten çdo ditë. Dobësitë mund të ekzistojnë për një kohë të gjatë përpara se dikush të dijë për to, dhe gjetja, verifikimi dhe rregullimi i tyre shpesh varet nga një komunitet inxhinierësh dhe studiuesish të pavarur të sigurisë të pajisur me mjetet e duhura.

Më 11 dhjetor 2025, ekipi i React publikoi tre dobësi sigurie që prekin aplikacionet e ndërtuara me React Server Components. Ajo që e bëri këtë zbulim të veçantë nuk ishin vetëm vetë dobësitë, por edhe mënyra se si ato u zbuluan.

Andrew MacPherson, një inxhinier kryesor i sigurisë në Privy (një kompani e Stripe), po përdorte GPT‑5.1‑Codex‑Max me Codex CLI dhe agjentë të tjerë të kodimit për të riprodhuar dhe studiuar një dobësi tjetër kritike të React të zbuluar javën e kaluar, e njohur si React2Shell⁠(hapet në një dritare të re) (CVE-2025-55182⁠(hapet në një dritare të re)). Qëllimi i tij ishte të vlerësonte se sa mirë mund të ndihmonte modeli në kërkimin e dobësisë në botën reale.

Fillimisht, ai u përpoq disa analiza "zero-shot", duke nxitur modelin të ekzaminojë masën korrigjuese dhe të identifikojë dobësinë që ai adresonte. Kur kjo nuk dha rezultate, ai kaloi në një qasje me volum më të lartë dhe të përsëritur. Kur ato qasje nuk patën sukses, ai e orientoi Codex përmes cikleve standarde të sigurisë mbrojtëse—duke konfiguruar një mjedis testimi lokal, duke arsyetuar përmes sipërfaqeve të mundshme të sulmit dhe duke përdorur "fuzzing" për të testuar sistemin me inpute të keqformuara. Ndërsa përpiqeshim të riprodhonim problemin fillestar të React2Shell, Codex shfaqi sjellje të papritura që kërkonin një hetim më të thelluar. Gjatë një jave të vetme, ky proces çoi në zbulimin e dobësive të panjohura më parë, të cilat iu raportuan në mënyrë të përgjegjshme ekipit të React.

Diagram cikli i titulluar “Zbulimi i dobësive me Codex: CVE-2025-55183” që tregon një cikël pune që fillon me një depo Git dhe Codex që skanon kodin për dobësi. Një përpjekje "zero-shot" dështon, e ndjekur nga një proces i udhëhequr nga ekspertët që shqyrton bazën e kodit, identifikon objektivat e mundshme, ndërton një kornizë dhe kryen testim "fuzz" kundër një aplikacioni shembull me rivlerësim. Rezultatet verifikohen për të krijuar një provë koncepti, duke çuar në zbulimin e përgjegjshëm dhe një masë korrigjuese që zbatohet mbrapa në depo.

Kjo tregon se si sistemet e avancuara të AI mund të përshpejtojnë ndjeshëm punën mbrojtëse të sigurisë në softuerin e përdorur gjerësisht në botën reale. Në të njëjtën kohë, aftësitë që ndihmojnë mbrojtësit të lëvizin më shpejt mund të keqpërdoren gjithashtu nga aktorë keqdashës.

Ndërsa sistemet agjentike bëhen më të afta në detyrat e rëndësishme për sigurinë kibernetike, ne po e bëjmë një prioritet kryesor që këto përparime të zbatohen në mënyrë të përgjegjshme—duke shoqëruar çdo rritje të aftësive me masa mbrojtëse më të forta, kontrolle më të rrepta të aksesit dhe bashkëpunim të vazhdueshëm me komunitetin e sigurisë.

Fuqizimi i mbrojtjes kibernetike përmes qasjes së besueshme

Ekipet e sigurisë mund të hasin në kufizime kur përpiqen të imitojnë aktorët e kërcënimeve, të analizojnë programet e keqdashëse (malware) për të mbështetur ndreqjen, ose për të testuar qëndrueshmërinë e infrastrukturës kritike. Ne po zhvillojmë një pilot aksesi të besuar për ta hequr atë pengesë për përdoruesit dhe organizatat që kualifikohen dhe për të aktivizuar mbrojtësit e besuar që të përdorin aftësitë kibernetike të avancuara të AI për të përshpejtuar mbrojtjen kibernetike.

Fillimisht, programi pilot do të jetë vetëm me ftesë për profesionistët e sigurisë të verifikuar me një historik të zbulimit të përgjegjshëm të dobësive dhe për organizatat që kanë një rast të qartë përdorimi profesional në sigurinë kibernetike. Pjesëmarrësit që kualifikohen do të kenë akses në modelet tona më të afta për raste përdorimi mbrojtës, për të aktivizuar punë legjitime me përdorim të dyfishtë.

Nëse je një profesionist i sigurisë ose pjesë e një organizate që bën punë etike në fushën e sigurisë si kërkimi i dobësisë ose simulimi i autorizuar i sulmeve, të ftojmë të shprehësh interes për t'u bashkuar dhe të ndash përshtypje për atë që dëshiron të shohësh nga programi këtu⁠(hapet në një dritare të re).

Përfundim

GPT‑5.2‑Codex përfaqëson një hap përpara në mënyrën se si AI e avancuar mund të ofrojë mbështetje për inxhinierinë softuerike në botën reale dhe domenet e specializuara si siguria kibernetike — duke ndihmuar zhvilluesit dhe mbrojtësit të përballen me punë komplekse dhe afatgjata, dhe duke forcuar mjetet e disponueshme për kërkimin e përgjegjshëm të sigurisë.

Duke prezantuar GPT‑5.2‑Codex duke e shpërndarë gradualisht, duke e shoqëruar zbatimin me masa mbrojtëse dhe duke punuar ngushtë me komunitetin e sigurisë, synojmë të maksimizojmë ndikimin mbrojtës duke reduktuar rrezikun e keqpërdorimit. Ajo që mësojmë nga ky publikim do të ndikojë drejtpërdrejt në mënyrën se si zgjerojmë aksesin me kalimin e kohës, ndërsa kufijtë e softuerit dhe kibernetikës vazhdojnë të avancojnë.

Autor

OpenAI

Vazhdo të lexosh

Shiko të gjitha

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 tani është modeli i preferuar në Microsoft 365 Copilot

Produkti9 korr 2026

ChatGPT tashmë është partner për punën tënde më ambicioze

Produkti9 korr 2026

GPT-5.6: inteligjencë avangardë që rritet me ambicien tënde

Produkti9 korr 2026