18 დეკემბერი, 2025

გაიცანით GPT‑5.2‑Codex

ყველაზე მოწინავე აგენტური კოდირების მოდელი პროფესიონალური პროგრამული ინჟინერიისა და თავდაცვითი კიბერუსაფრთხოებისთვის.

დღეს ვუშვებთ GPT‑5.2‑Codex‑ს — ყველაზე მოწინავე აგენტურ კოდირების მოდელს კომპლექსური, რეალური პროგრამული ინჟინერიისთვის. GPT‑5.2‑Codex არის GPT‑5.2⁠-ის ვერსია, რომელიც დამატებით არის ოპტიმიზებული Codex-ში აგენტური კოდირებისთვის; ის მოიცავს გაუმჯობესებებს გრძელჰორიზონტიან სამუშაოში კონტექსტის კომპაქტაციის მეშვეობით, უკეთეს შედეგებს კოდის მასშტაბურ ცვლილებებში, როგორიცაა რეფაქტორინგი და მიგრაციები, გაუმჯობესებულ მუშაობას Windows გარემოებში და მნიშვნელოვნად ძლიერ კიბერუსაფრთხოების შესაძლებლობებს.

რადგან ჩვენი მოდელები ინტელექტის მოწინავე საზღვარზე წინ მიიწევს, დავაკვირდით, რომ ეს გაუმჯობესებები შესაძლებლობების ნახტომებად ითარგმნება ასევე სპეციალიზებულ სფეროებში, როგორიცაა კიბერუსაფრთხოება⁠. მაგალითად, სულ გასულ კვირას უსაფრთხოების მკვლევარმა, რომელიც იყენებდა GPT‑5.1‑Codex‑Max‑ს Codex CLI-სთან ერთად, აღმოაჩინა და პასუხისმგებლიანად გაამჟღავნა⁠(იხსნება ახალ ფანჯარაში) React-ში არსებული მოწყვლადობა, რომელსაც შეეძლო საწყისი კოდის გამჟღავნებამდე მიეყვანა.

GPT‑5.2‑Codex‑ს უფრო ძლიერი კიბერუსაფრთხოების შესაძლებლობები აქვს, ვიდრე ნებისმიერ მოდელს, რომელიც აქამდე გამოგვიშვია. ეს წინსვლები კიბერუსაფრთხოების მასშტაბურად გაძლიერებას დაეხმარება, თუმცა ასევე წარმოშობს ახალ ორმაგი დანიშნულების რისკებს, რომლებიც ფრთხილ დანერგვას მოითხოვს. მიუხედავად იმისა, რომ GPT‑5.2‑Codex ჩვენს მზაობის ჩარჩოში კიბერშესაძლებლობების „High“ დონეს არ აღწევს, ჩვენს დანერგვის მიდგომას⁠ ვქმნით მომავალი შესაძლებლობების ზრდის გათვალისწინებით.

დღეს GPT‑5.2‑Codex‑ს ვუშვებთ Codex-ის ყველა ზედაპირზე ფასიანი ChatGPT მომხმარებლებისთვის და ვმუშაობთ იმაზე, რომ მომდევნო კვირებში API მომხმარებლებისთვის GPT‑5.2‑Codex‑ზე წვდომა უსაფრთხოდ გავააქტიუროთ. პარალელურად, ვტესტავთ მხოლოდ მოწვევით ხელმისაწვდომ სანდო წვდომას მოახლოებულ შესაძლებლობებზე და უფრო მოქნილ მოდელებზე იმ შემოწმებული პროფესიონალებისა და ორგანიზაციებისთვის, რომლებიც თავდაცვით კიბერუსაფრთხოებაზე არიან ფოკუსირებული. გვჯერა, რომ დანერგვის ეს მიდგომა ხელმისაწვდომობას უსაფრთხოებასთან დააბალანსებს.

რეალური პროგრამული ინჟინერიის მოწინავე საზღვრის გაწევა

GPT‑5.2‑Codex ეფუძნება GPT‑5.2‑ის ძლიერ მხარეებს⁠ პროფესიონალურ ცოდნაზე დაფუძნებულ სამუშაოში და GPT‑5.1‑Codex‑Max⁠-ის მოწინავე აგენტურ კოდირებისა და ტერმინალის გამოყენების შესაძლებლობებს. GPT‑5.2‑Codex ახლა უკეთესია გრძელი კონტექსტის გაგებაში, ხელსაწყოების სანდო გამოძახებაში, გაუმჯობესებულ ფაქტობრივ სიზუსტეში და ნატიურ კომპაქტაციაში, რაც მას უფრო საიმედო პარტნიორად აქცევს ხანგრძლივი კოდირების ამოცანებისთვის, ამასთან თავის მსჯელობაში token-ეფექტიანობას ინარჩუნებს.

GPT‑5.2‑Codex აღწევს უახლესი დონის შედეგებს SWE-Bench Pro-სა და Terminal-Bench 2.0-ზე — ბენჩმარკებზე, რომლებიც შექმნილია რეალისტურ ტერმინალის გარემოებში მრავალფეროვან ამოცანებზე აგენტური ეფექტიანობის შესამოწმებლად. ის ასევე გაცილებით უფრო ეფექტური და სანდოა აგენტურ კოდირებაში ნატიურ Windows გარემოებში და ეყრდნობა GPT‑5.1‑Codex‑Max‑ში დანერგილ შესაძლებლობებს.

ამ გაუმჯობესებებით Codex უკეთესად მუშაობს დიდ რეპოზიტორიუმებში ხანგრძლივი სესიების განმავლობაში, მთელი კონტექსტის შენარჩუნებით. მას შეუძლია უფრო საიმედოდ შეასრულოს ისეთი რთული ამოცანები, როგორიცაა მასშტაბური რეფაქტორინგი, კოდის მიგრაციები და ფუნქციების აგება — განაგრძოს იტერაცია კვალის დაკარგვის გარეშე, მაშინაც კი, როცა გეგმები იცვლება ან მცდელობები წარუმატებელია.

SWE-Bench Pro⁠⁠⁠⁠-ში მოდელს ეძლევა კოდის რეპოზიტორიუმი და მან უნდა შექმნას პაჩი, რათა გადაჭრას რეალისტური პროგრამული ინჟინერიის ამოცანა. Terminal-Bench 2.0 არის ბენჩმარკი, რომელიც ამოწმებს AI აგენტებს რეალურ ტერმინალის გარემოებში. ამოცანები მოიცავს კოდის კომპილაციას, მოდელების გაწვრთნას და სერვერების გამართვას.

ხედვის უფრო ძლიერი ეფექტიანობა GPT‑5.2‑Codex‑ს საშუალებას აძლევს უფრო ზუსტად განმარტოს სქრინშოთები, ტექნიკური დიაგრამები, გრაფიკები და UI ზედაპირები, რომლებიც კოდირების სესიების დროს არის გაზიარებული.

Codex-ს შეუძლია დიზაინის მაკეტები სწრაფად გარდაქმნას ფუნქციურ პროტოტიპებად, და თქვენ შეგიძლიათ Codex-თან ერთად ეს პროტოტიპები წარმოებამდე მიიყვანოთ.

დიზაინის მაკეტი

GPT‑5.2‑Codex‑ის მიერ შექმნილი პროტოტიპი

კიბერის მოწინავე საზღვრის განვითარება

როდესაც დროში ვაკვირდებით ეფექტიანობას ჩვენს ერთ-ერთ ძირითად კიბერუსაფრთხოების შეფასებაზე, ვხედავთ შესაძლებლობების მკვეთრ ნახტომს, რომელიც იწყება GPT‑5‑Codex‑ით, შემდეგ კიდევ ერთ დიდ ნახტომს GPT‑5.1‑Codex‑Max‑ით და ახლა მესამე ნახტომს GPT‑5.2‑Codex‑ით. ველით, რომ მომავალი AI მოდელები ამ ტრაექტორიას გააგრძელებენ. მოსამზადებლად, ვგეგმავთ და ვაფასებთ ისე, თითქოს თითოეულ ახალ მოდელს შეეძლოს კიბერუსაფრთხოების შესაძლებლობების „High“ დონის მიღწევა, როგორც ეს ჩვენი მზაობის ჩარჩოთი⁠⁠(იხსნება ახალ ფანჯარაში) იზომება. მიუხედავად იმისა, რომ GPT‑5.2‑Codex‑ს ჯერ არ მიუღწევია კიბერშესაძლებლობების „High“ დონისთვის, ვემზადებით მომავალი მოდელებისთვის, რომლებიც ამ ზღვარს გადაკვეთენ. გაზრდილი კიბერშესაძლებლობების გამო, დამატებითი დამცავი მექანიზმები დავამატეთ როგორც მოდელში, ისე პროდუქტში, რაც აღწერილია სისტემურ ბარათში⁠.

Professional Capture-the-Flag (CTF) შეფასება ზომავს, რამდენად ხშირად შეუძლია მოდელს Linux გარემოში გადაჭრას რთული, მრავალსაფეხურიანი რეალური გამოწვევები (რომლებიც პროფესიონალური დონის კიბერუსაფრთხოების უნარებს მოითხოვს).

რეალური კიბერშესაძლებლობები

თანამედროვე საზოგადოება პროგრამულ უზრუნველყოფაზეა დამოკიდებული, და მისი სანდოობა ძლიერ კიბერუსაფრთხოებაზე დგას — საბანკო, ჯანდაცვის, კომუნიკაციებისა და სასიცოცხლო სერვისების კრიტიკული სისტემების ონლაინ შენარჩუნებაზე, მგრძნობიარე მონაცემების დაცვაზე და იმაზე, რომ ადამიანებს შეეძლოთ ენდონ პროგრამულ უზრუნველყოფას, რომელსაც ყოველდღიურად ეყრდნობიან. მოწყვლადობები შეიძლება არსებობდეს დიდი ხნით ადრე, ვიდრე ვინმე მათ შესახებ გაიგებს, ხოლო მათი პოვნა, დადასტურება და გამოსწორება ხშირად დამოკიდებულია ინჟინრებისა და დამოუკიდებელი უსაფრთხოების მკვლევრების საზოგადოებაზე, რომლებსაც სწორი ხელსაწყოები აქვთ.

2025 წლის 11 დეკემბერს React-ის გუნდმა გამოაქვეყნა უსაფრთხოების სამი მოწყვლადობა, რომლებიც React Server Components-ით აგებულ აპებზე მოქმედებდა. ეს გამჟღავნება საყურადღებო იყო არა მხოლოდ თვითონ მოწყვლადობების გამო, არამედ იმის გამოც, თუ როგორ იქნა ისინი აღმოჩენილი.

ენდრიუ მაკფერსონი, Privy-ის (Stripe-ის კომპანიის) მთავარი უსაფრთხოების ინჟინერი, იყენებდა GPT‑5.1‑Codex‑Max‑ს Codex CLI-სთან და სხვა კოდირების აგენტებთან ერთად, რათა გაემეორებინა და შეესწავლა სხვა კრიტიკული React მოწყვლადობა, რომელიც წინა კვირაში გამჟღავნდა და ცნობილია როგორც React2Shell⁠(იხსნება ახალ ფანჯარაში) (CVE-2025-55182⁠(იხსნება ახალ ფანჯარაში)). მისი მიზანი იყო შეეფასებინა, რამდენად კარგად შეეძლო მოდელს დახმარება რეალურ მოწყვლადობათა კვლევაში.

მან თავდაპირველად სცადა რამდენიმე ნულოვანი მცდელობა/სწავლება ანალიზი და მოდელს სთხოვდა, შეესწავლა პაჩი და ამოეცნო ის მოწყვლადობა, რომელსაც ის აგვარებდა. როცა ამან შედეგი არ გამოიღო, ის გადავიდა უფრო მოცულობით, იტერაციულ მოთხოვნებზე დაფუძნებულ მიდგომაზე. როდესაც ამ მიდგომებმაც არ იმუშავა, მან Codex სტანდარტულ თავდაცვით უსაფრთხოების სამუშაო პროცესებში წარმართა — ადგილობრივი სატესტო გარემოს გამართვა, შესაძლო შეტევის ზედაპირებზე მსჯელობა და fuzzing-ის გამოყენება სისტემის არასწორი შეყვანებით გამოსაცდელად. თავდაპირველი React2Shell პრობლემის გამეორების მცდელობისას, Codex-მა გამოავლინა მოულოდნელი ქცევები, რომლებმაც უფრო ღრმა გამოძიება მოითხოვა. ერთი კვირის განმავლობაში ამ პროცესმა მანამდე უცნობი მოწყვლადობების აღმოჩენამდე მიიყვანა, რომლებიც პასუხისმგებლიანად გაუმჟღავნეს React-ის გუნდს.

ნაკადის დიაგრამა სათაურით „Vulnerability Discovery with Codex: CVE-2025-55183“, რომელიც აჩვენებს სამუშაო პროცესს: Git რეპოზიტორიუმიდან დაწყებული, Codex-ის მიერ კოდის სკანირებით მოწყვლადობების საპოვნელად. ნულოვანი მცდელობა/სწავლება ვერ ხერხდება, რის შემდეგაც იწყება ექსპერტის მიერ მართული პროცესი, რომელიც იკვლევს კოდის ბაზას, ადგენს შესაძლო სამიზნეებს, აგებს harness-ს და ატარებს fuzz ტესტირებას მაგალით აპზე ხელახალი გადამოწმებით. შედეგები მოწმდება proof of concept-ის შესაქმნელად, რაც პასუხისმგებლიან გამჟღავნებამდე და პაჩამდე მიდის, რომელიც შემდეგ ისევ რეპოზიტორიუმში ინერგება.

ეს აჩვენებს, როგორ შეუძლიათ მოწინავე AI სისტემებს არსებითად დააჩქარონ თავდაცვითი უსაფრთხოების სამუშაო ფართოდ გამოყენებულ, რეალურ პროგრამულ უზრუნველყოფაში. ამავე დროს, შესაძლებლობები, რომლებიც დამცველებს უფრო სწრაფად გადაადგილებაში ეხმარება, ბოროტმოქმედებმაც შეიძლება ბოროტად გამოიყენონ.

რადგან აგენტური სისტემები კიბერუსაფრთხოებასთან დაკავშირებულ ამოცანებში უფრო შესაძლებლიანები ხდებიან, ჩვენთვის ძირითადი პრიორიტეტია იმის უზრუნველყოფა, რომ ეს წინსვლები პასუხისმგებლიანად დაინერგოს — შესაძლებლობების ყოველ ზრდას უფრო ძლიერი დამცავი მექანიზმები, უფრო მკაცრი წვდომის კონტროლი და უსაფრთხოების საზოგადოებასთან მუდმივი თანამშრომლობა ახლდეს.

კიბერთავდაცვის გაძლიერება სანდო წვდომის მეშვეობით

უსაფრთხოების გუნდებს შესაძლოა შეეზღუდოთ მოქმედება, როდესაც ცდილობენ საფრთხის აქტორების იმიტაციას, remediation-ის მხარდასაჭერად მავნე პროგრამის ანალიზს, ან კრიტიკული ინფრასტრუქტურის დატვირთვით ტესტირებას. ჩვენ ვავითარებთ სანდო წვდომის საპილოტე პროგრამას, რათა ეს ხახუნი მოვხსნათ შესაბამისი მომხმარებლებისა და ორგანიზაციებისთვის და სანდო დამცველებს მივცეთ საშუალება, გამოიყენონ მოწინავე AI კიბერშესაძლებლობები კიბერთავდაცვის დასაჩქარებლად.

საწყის ეტაპზე საპილოტე პროგრამა მხოლოდ მოწვევით იქნება ხელმისაწვდომი იმ შემოწმებული უსაფრთხოების პროფესიონალებისთვის, რომლებსაც პასუხისმგებლიანი მოწყვლადობის გამჟღავნების გამოცდილება აქვთ, და იმ ორგანიზაციებისთვის, რომლებსაც მკაფიო პროფესიონალური კიბერუსაფრთხოების გამოყენების შემთხვევა აქვთ. შესაბამის მონაწილეებს მიეცემათ წვდომა ჩვენს ყველაზე შესაძლებლიან მოდელებზე თავდაცვითი გამოყენების შემთხვევებისთვის, რათა შესაძლებელი გახდეს ლეგიტიმური ორმაგი დანიშნულების სამუშაო.

თუ უსაფრთხოების პროფესიონალი ხართ ან ორგანიზაციის ნაწილი, რომელიც ეთიკურ უსაფრთხოების საქმიანობას ეწევა, მაგალითად მოწყვლადობის კვლევას ან ავტორიზებულ red-teaming-ს, გიწვევთ, გამოხატოთ ინტერესი გაწევრიანებისადმი და გაგვიზიაროთ, რისი ნახვა გსურთ პროგრამისგან აქ⁠(იხსნება ახალ ფანჯარაში).

დასკვნა

GPT‑5.2‑Codex წარმოადგენს წინგადადგმულ ნაბიჯს იმაში, თუ როგორ შეუძლია მოწინავე AI-ს მხარი დაუჭიროს რეალურ პროგრამულ ინჟინერიას და სპეციალიზებულ სფეროებს, როგორიცაა კიბერუსაფრთხოება — დაეხმაროს დეველოპერებსა და დამცველებს კომპლექსურ, გრძელჰორიზონტიან სამუშაოში და გააძლიეროს პასუხისმგებლიანი უსაფრთხოების კვლევისთვის ხელმისაწვდომი ხელსაწყოები.

GPT‑5.2‑Codex‑ის ეტაპობრივი გაშვებით, დანერგვის დამცავ მექანიზმებთან შეწყვილებით და უსაფრთხოების საზოგადოებასთან მჭიდრო თანამშრომლობით, ჩვენი მიზანია მაქსიმალურად გავზარდოთ თავდაცვითი გავლენა და ამავე დროს შევამციროთ ბოროტად გამოყენების რისკი. რასაც ამ გამოშვებიდან ვისწავლით, პირდაპირ განსაზღვრავს, როგორ გავაფართოებთ დროთა განმავლობაში წვდომას, რადგან პროგრამული და კიბერის მოწინავე საზღვრები განვითარებას აგრძელებს.

ავტორი

OpenAI

განაგრძეთ კითხვა

ყველას ნახვა

A scorecard for the AI age

კომპანია17 ივლ. 2026

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 ახლა Microsoft 365 Copilot-ის რჩეული მოდელია

პროდუქტი9 ივლ. 2026

GPT-5.6: მოწინავე ინტელექტი, რომელიც თქვენს ამბიციას პასუხობს და მასშტაბირდება

პროდუქტი9 ივლ. 2026