Przejdź do treści głównej
OpenAI

18 grudnia 2025

ProduktWersja

Przedstawiamy GPT‑5.2‑Codex

Najbardziej zaawansowany model zapewniający możliwości kodowania z użyciem agentów w celu profesjonalnego tworzenia oprogramowania i realizacji zadań związanych z cyberbezpieczeństwem i ochroną.

$ npm i -g @openai/codex

Dzisiaj udostępniamy GPT‑5.2‑Codex – najbardziej zaawansowany model programowania agentowego przeznaczony do złożonego, tworzenia oprogramowania. GPT‑5.2‑Codex to wersja GPT‑5.2 zoptymalizowana pod kątem programowania agentowego w Codex. Obejmuje on ulepszenia w obszarze pracy z długim horyzontem czasowym dzięki kompaktowaniu kontekstu, zapewnienia lepszej wydajności w przypadku dużych zmian w kodzie, takich jak refaktoryzacje i migracje, poprawy wydajności w środowiskach Windows oraz oferuje także znacznie potężniejsze możliwości w zakresie cyberbezpieczeństwa.

W miarę rozwoju naszych pionierskich modeli inteligencji zauważyliśmy, że te ulepszenia przekładają się również na skoki możliwości w wyspecjalizowanych domenach, takich jak cyberbezpieczeństwo. Przykładowo: zaledwie w zeszłym tygodniu badacz ds. bezpieczeństwa używający GPT‑5.1‑Codex‑Max z Codex CLI znalazł i odpowiedzialnie(otwiera nowe okno) ujawnił lukę w React, która mogła prowadzić do ujawnienia kodu źródłowego.

GPT‑5.2‑Codex dysponuje potężniejszymi możliwościami w zakresie cyberbezpieczeństwa niż jakikolwiek model, który do tej pory wydaliśmy. Postępy te mogą pomóc wzmocnić cyberbezpieczeństwo na dużą skalę, ale jednocześnie stwarzają nowe zagrożenia związane z zastosowaniem do niewłaściwych celów, przez co wymagają ostrożnego wdrożenia. GPT‑5.2‑Codex nie osiąga poziomu „wysokiego” w zakresie zdolności cybernetycznych w ramach naszych Ram gotowości, jednak nasze rozwiązania projektujemy z myślą o rozwijaniu ich możliwości w przyszłości.

Dziś udostępniamy GPT‑5.2‑Codex na wszystkich platformach Codex dla płatnych użytkowników ChatGPT, a w najbliższych tygodniach zapewnimy dostęp do GPT‑5.2‑Codex użytkownikom API. Równocześnie prowadzimy pilotażowy program zaufanego dostępu. W ramach tej inicjatywy będziemy zapraszać doświadczonych specjalistów i organizacje działające w branży cyberbezpieczeństwa do korzystania z najnowszych funkcji. Uważamy, że takie podejście do wdrażania zrównoważy dostępność i bezpieczeństwo.

Nowa jakość w dziedzinie rzeczywistej inżynierii oprogramowania

GPT‑5.2‑Codex rozwija mocne strony GPT‑5.2 w profesjonalnej pracy z wiedzą oraz pionierskie zdolności programowania agentowego i korzystania z terminala w GPT‑5.1‑Codex‑Max . Dzięki ulepszonemu rozumieniu długiego kontekstu, niezawodnemu wywoływaniu narzędzi, poprawionej zgodności z faktami i natywnemu kompaktowaniu GPT‑5.2‑Codex jest bardziej niezawodnym partnerem podczas wykonywania długotrwałych zadań programistycznych, a jednocześnie jest wydajny pod względem wykorzystania tokenów w trakcie działania.

GPT‑5.2‑Codex osiąga najlepsze wyniki w testach SWE-Bench Pro i Terminal-Bench 2.0, które zostały stworzone do oceny wydajności agentowej w szerokim zakresie zadań w realistycznych środowiskach terminalowych. Jest także znacznie bardziej efektywny i niezawodny w kodowaniu agentowym w natywnych środowiskach Windows, bazując na możliwościach wprowadzonych w GPT‑5.1‑Codex‑Max.

Dzięki tym usprawnieniom Codex lepiej się sprawdza w pracy z dużymi repozytoriami podczas długich sesji i zachowuje pełny kontekst. Model ten potrafi sprawniej wykonywać złożone zadania, na przykład duże refaktoryzacje, migracje kodu i tworzenie funkcji, ponieważ jest w stanie kontynuować iterację bez utraty wątku, nawet gdy plany się zmieniają lub próby rozwiązywania problemów zakończą się niepowodzeniem.

W teście SWE-Bench Pro model otrzymuje repozytorium kodu i musi wygenerować poprawkę, aby rozwiązać realistyczne zadanie z zakresu inżynierii oprogramowania. Terminal-Bench 2.0 to narzędzie do testowania agentów AI w rzeczywistych środowiskach terminalowych. Zadania obejmują kompilowanie kodu, trening modeli oraz konfigurowanie serwerów.

Lepsza wydajność wizualna pozwala modelowi GPT‑5.2‑Codex na dokładniejsze interpretowanie zrzutów ekranu, diagramów technicznych, wykresów i interfejsów użytkownika udostępnianych podczas sesji kodowania.

Codex potrafi szybko przekształcać makiety projektowe w funkcjonalne prototypy, a użytkownik może następnie wprowadzić te prototypy do produkcji z pomocą tego modelu.

Makieta projektu
Makieta projektowa używana do generowania prototypu strony internetowej z Codex-5.2
Prototyp wygenerowany przez GPT‑5.2‑Codex

Poszerzanie granic cyberprzestrzeni

Porównując wydajność w jednym z naszych testów z zakresu cyberbezpieczeństwa na przestrzeni czasu, zauważamy gwałtowny wzrost zdolności w przypadku modelu GPT‑5‑Codex, kolejny duży skok w modelu GPT‑5.1‑Codex‑Max, a następny w modelu GPT‑5.2‑Codex. Oczekujemy, że nadchodzące modele AI będą kontynuować te wzrosty. W ramach przygotowań planujemy i szacujemy, czy nowy model może osiągnąć „wysoki” poziom zdolności w zakresie cyberbezpieczeństwa, mierzony przez nasze Ramy gotowości(otwiera nowe okno). Chociaż GPT‑5.2‑Codex nie osiągnął jeszcze „wysokiego” poziomu zdolności cybernetycznych, zakładamy, że przyszłe modele przekroczą ten próg. Ze względu na zwiększone możliwości cybernetyczne modelu wprowadziliśmy w nim kolejne zabezpieczenia, które są opisane na karcie systemu.

Test Professional Capture-the-Flag (CTF) mierzy, jak często model jest w stanie rozwiązać zaawansowane, wieloetapowe wyzwania rzeczywiste, które wymagają profesjonalnych umiejętności z zakresu cyberbezpieczeństwa w środowisku Linux.

Rzeczywiste możliwości cybernetyczne

Nowoczesne społeczeństwa opierają się na oprogramowaniu, a jego niezawodność zależy od silnego cyberbezpieczeństwa – utrzymania krytycznych systemów w bankowości, opiece zdrowotnej, komunikacji i najważniejszych usługach online, ochronie wrażliwych danych oraz zapewnieniu, że ludzie mogą ufać oprogramowaniu, z którego korzystają codziennie. Luki w zabezpieczeniach mogą istnieć długo, zanim ktokolwiek się o nich dowie, a ich znalezienie, weryfikacja i usunięcie często są zasługą społeczności inżynierów oraz niezależnych specjalistów ds. bezpieczeństwa, którzy mają odpowiednie narzędzia.

11 grudnia 2025 r. zespół React opublikował trzy luki w zabezpieczeniach dotyczące aplikacji zbudowanych z użyciem React Server Components. Informacje te były godne uwagi, nie tylko ze względu na same luki, ale także sposób, w jaki je odkryto.

Andrew MacPherson, główny inżynier ds. bezpieczeństwa w Privy (firmie należącej do Stripe), używał GPT‑5.1‑Codex‑Max z Codex CLI i innymi agentami programistycznymi, aby odtworzyć i zbadać inną krytyczną lukę w React ujawnioną tydzień wcześniej, znaną jako React2Shell(otwiera nowe okno) (CVE-2025-55182(otwiera nowe okno)). Jego celem było ocenić, jak dobrze model może wspierać badania nad rzeczywistymi zagrożeniami.

Początkowo próbował kilku analiz zero-shot, zachęcając model do zbadania poprawki i zidentyfikowania luki, którą naprawiała. Kiedy to nie przyniosło rezultatów, zmienił podejście na bardziej wymagające, iteracyjne zapytania. Gdy ta strategia również zawiodła, przeprowadził Codex przez standardowe przepływy pracy związane z obroną bezpieczeństwa: skonfigurowanie lokalnego środowiska testowego, analizowanie potencjalnych obszarów ataku oraz użycie fuzzingu do testowania systemu za pomocą nieprawidłowo sformułowanych danych wejściowych. Podczas próby odtworzenia oryginalnego problemu React2Shell Codex napotkał nieoczekiwane zachowania, które wymagały dokładniejszej analizy. W ciągu tygodnia ten proces doprowadził do odkrycia wcześniej nieznanych luk w zabezpieczeniach, które zostały odpowiedzialnie ujawnione zespołowi React.

Schemat zatytułowany „Wyszukiwanie luk w zabezpieczeniach z Codex: CVE-2025-55183” przedstawia przepływ pracy, który rozpoczyna się od repozytorium Git, a Codex skanuje kod w poszukiwaniu luk w zabezpieczeniach. Próba zero-shot nie powiodła się, po czym następuje proces prowadzony przez eksperta, który bada bazę kodu, identyfikuje możliwe cele, tworzy środowisko testowe i przeprowadza testy fuzzingowe na przykładowej aplikacji z ponowną walidacją. Wyniki są weryfikowane, aby tworzyć dowód słuszności koncepcji, co prowadzi do odpowiedzialnego ujawnienia i stworzenia poprawki, która jest zastosowana w repozytorium.

Pokazuje to, w jaki sposób zaawansowane systemy AI mogą znacząco przyspieszyć działania w zakresie bezpieczeństwa defensywnego w powszechnie używanym oprogramowaniu. Jednocześnie te same możliwości, które pomagają obrońcom działać szybciej, mogą również ułatwić pracę przestępcom.

W miarę jak systemy agentowe coraz lepiej wykonują zadania związane z cyberbezpieczeństwem naszym priorytetem jest zapewnienie, że te postępy są wdrażane odpowiedzialnie. Łączymy więc każdy wzrost zdolności z silniejszymi zabezpieczeniami, bardziej rygorystycznymi kontrolami dostępu i ciągłą współpracą ze społecznością zajmującą się bezpieczeństwem.

Wzmacnianie cyberobrony dzięki zaufanemu dostępowi

Zespoły ds. bezpieczeństwa mogą napotkać ograniczenia przy próbie emulacji działań sprawców ataków, analizie złośliwego oprogramowania w celu wsparcia działań naprawczych lub testowania wytrzymałości infrastruktury krytycznej. Tworzymy właśnie pilotażowy program zaufanego dostępu, który usuwa te przeszkody dla kwalifikujących się użytkowników i organizacji, umożliwiając zaufanym obrońcom korzystanie z najnowocześniejszych zdolności AI w cyberbezpieczeństwie, aby przyspieszyć budowanie obrony cybernetycznej.

Początkowo program pilotażowy będzie dostępny tylko na zaproszenie dla zweryfikowanych specjalistów ds. bezpieczeństwa mogących pochwalić się udokumentowaną historią odpowiedzialnego ujawniania podatności oraz dla organizacji z wyraźnym profilem działań z zakresu cyberbezpieczeństwa. Zakwalifikowani uczestnicy uzyskają dostęp do naszych najbardziej zaawansowanych modeli do zastosowań obronnych, co pozwoli zwiększyć ich potencjał.

Jeśli jesteś specjalistą ds. bezpieczeństwa lub działasz w ramach organizacji zajmującej się etyczną pracą w zakresie bezpieczeństwa, taką jak badania nad podatnościami systemów na ataki lub realizujesz autoryzowane działania red-teamingowe, zapraszamy do dołączenia do naszego programu i podzielenia się opinią(otwiera nowe okno) na temat tego, co chcesz zobaczyć w ramach tej inicjatywy.

Podsumowanie

GPT‑5.2‑Codex to duży krok naprzód pod względem stosowania zaawansowanej AI w dziedzinie rzeczywistej inżynierii oprogramowania i w wyspecjalizowanych branżach oraz w cyberbezpieczeństwie. Model ten pomaga programistom i obrońcom w rozwiązywaniu złożonych problemów oraz rozwija narzędzia dostępne dla odpowiedzialnych specjalistów ds. bezpieczeństwa.

Wprowadzając stopniowo GPT‑5.2‑Codex, łącząc wdrożenie z zabezpieczeniami i ściśle współpracując ze społecznością zajmującą się cyberbezpieczeństwem, dążymy do maksymalizacji efektu obronnego przy jednoczesnym zmniejszeniu ryzyka niewłaściwego użycia. To czego nauczyliśmy się dzięki tej wersji, bezpośrednio wpłynie na to, jak z czasem będziemy rozszerzać dostęp do programu w miarę rozwoju oprogramowania i cyberprzestrzeni.

Autor

OpenAI