Przejdź do treści głównej
OpenAI

10 grudnia 2025

Zabezpieczenia

Wzmacnianie cyberodporności w miarę rozwoju możliwości AI

W miarę jak nasze modele stają się coraz bardziej zaawansowane w obszarze cyberbezpieczeństwa inwestujemy w ich wzmacnianie, wprowadzanie dodatkowych mechanizmów obronnych oraz współpracę z ekspertami ds. bezpieczeństwa z całego świata.

Ładowanie…

Zdolności modeli AI w zakresie cyberbezpieczeństwa szybko się rozwijają, przynosząc istotne korzyści dla obrony cybernetycznej, ale też wywołując nowe zagrożenia związane z niezamierzonym zastosowaniem, które trzeba uważnie redukować. Na przykład zdolności oceniane w zadaniach capture-the-flag (CTF) wzrosły z 27% w przypadku GPT‑5(otwiera nowe okno) w sierpniu 2025 r. do 76% w przypadku GPT‑5.1‑Codex‑Max(otwiera nowe okno) w listopadzie 2025 r.

Oczekujemy, że w nadchodzących modelach AI ten kierunek będzie kontynuowany. W ramach przygotowań planujemy i oceniamy, jak każdy nowy model może osiągnąć „wysoki” poziom zdolności w zakresie cyberbezpieczeństwa, mierzony przez nasze Ramy gotowości(otwiera nowe okno). W założeniu będą to modele, które potrafią opracowywać działające zdalne exploity zero-day przeciwko dobrze zabezpieczonym systemom lub znacząco wspierać złożone, skryte operacje włamań do systemów firmowych lub przemysłowych, ukierunkowane na odnoszenie rzeczywistych skutków. W tym wpisie wyjaśniamy nasze podejście do zabezpieczeń dla modeli osiągających ten poziom możliwości, aby znacząco pomagały one obrońcom, jednocześnie ograniczając możliwość ich niewłaściwego użycia.

W miarę rozwoju tych możliwości OpenAI inwestuje w ulepszanie modeli do zadań związanych z cyberbezpieczeństwem oraz tworzenie narzędzi, które umożliwiają obrońcom łatwiejsze wykonywanie zadań, takich jak audyt kodu i usuwanie podatności. Naszym celem jest zapewnienie, aby nasze modele i produkty przynosiły istotne korzyści obrońcom, którzy często są mniej liczni i dysponują ograniczonymi zasobami.

Podobnie jak w innych sytuacjach, kiedy technologia może być używana na różne sposoby, defensywne i ofensywne procesy cybernetyczne często opierają się na tej samej bazowej wiedzy i technikach. Inwestujemy w zabezpieczenia, aby zapewnić, że te potężne możliwości służą przede wszystkim celom obronnym i ograniczają możliwość ich wykorzystywania do działań szkodliwych. Cyberbezpieczeństwo dotyczy niemal każdej dziedziny życia, co oznacza, że nie możemy polegać na żadnej pojedynczej kategorii zabezpieczeń, takiej jak ograniczanie wiedzy lub poleganie wyłącznie na zweryfikowanym dostępie, lecz zamiast tego potrzebujemy podejścia opartego na głębokiej obronie, która redukuje ryzyko i daje użytkownikom większą sprawczość. W praktyce oznacza to kształtowanie sposobu udostępniania, ukierunkowywania i wykorzystywania możliwości tak, aby zaawansowane modele zwiększały bezpieczeństwo, a nie ułatwiały ich niewłaściwe wykorzystanie.

Postrzegamy tę pracę nie jako jednorazowe działanie, lecz jako trwałą, długoterminową inwestycję w zapewnienie przewagi obrońcom i ciągłe wzmacnianie poziomu bezpieczeństwa infrastruktury krytycznej w szerokim ekosystemie.

Przeciwdziałanie szkodliwemu wykorzystaniu

Nasze modele zostały zaprojektowane i przeszkolone pod kątem bezpiecznego działania, a ich pracę wspierają aktywne systemy, które wykrywają nadużycia cybernetyczne i reagują na nie. Nieustannie udoskonalamy te zabezpieczenia w miarę jak zmieniają się nasze możliwości i spektrum zagrożeń. Żaden system nie jest w stanie zagwarantować całkowitego zapobiegania cyberatakom bez poważnego ograniczenia zastosowań obronnych, ale nasza strategia polega na ograniczaniu ryzyka za pomocą wielowarstwowego stosu zabezpieczeń.

U podstaw takiej filozofii leży wielowarstwowe podejście do obrony, opierające się na połączeniu mechanizmów kontroli dostępu, wzmacniania infrastruktury, mechanizmów kontroli ruchu wychodzącego oraz monitorowania. Poza tymi środkami stosujemy systemy wykrywania i reagowania oraz specjalistyczne programy analizy zagrożeń i ograniczania ryzyka wewnętrznego, dzięki czemu nowe zagrożenia są szybko identyfikowane i blokowane. Podstawą projektu naszych zabezpieczeń jest możliwość ich rozwoju wraz ze zmieniającymi się zagrożeniami. Jesteśmy gotowi na modyfikacje i tworzymy rozwiązania, które pozwalają szybko i odpowiednio się dostosować.

W oparciu o te fundamenty:

  • Trenujemy model tak, aby odmawiał wykonania szkodliwych żądań lub odpowiadał na nie w bezpieczny sposób bez rezygnacji z zastosowań edukacyjnych i obronnych: Trenujemy nasze pionierskie modele tak, aby odmawiały realizacji żądań lub odpowiadały na nie w bezpieczny sposób, w przypadku gdyby żądania te mogły stanowić jednoznaczne nadużycia w cyberprzestrzeni, a jednocześnie chcemy by nasze rozwiązania zapewniały maksymalną pomoc w legalnych zastosowaniach obronnych i edukacyjnych.
  • Systemy wykrywania: Udoskonalamy i utrzymujemy monitorowanie obejmujące cały system we wszystkich produktach wykorzystujących pionierskie modele do wykrywania potencjalnie złośliwej aktywności cybernetycznej. Gdy aktywność wydaje się niebezpieczna, możemy blokować dane wyjściowe, kierować polecenia do bezpieczniejszych lub mniej zaawansowanych modeli albo eskalować sprawę w celu podjęcia działań egzekucyjnych. Zakres tych działań obejmuje zautomatyzowaną analizę i weryfikację przez ludzi, przy uwzględnieniu takich czynników jak wymogi prawne, waga naruszenia i powtarzające się zachowania. Ściśle współpracujemy z deweloperami i klientami korporacyjnymi, aby uzgodnić standardy bezpieczeństwa i umożliwić odpowiedzialne korzystanie z jasno określonymi ścieżkami eskalacji.
  • Kompleksowy kontrolowany atak: Współpracujemy z wyspecjalizowanymi organizacjami zajmującymi się kontrolowanymi atakami, aby oceniać i ulepszać nasze zabezpieczenia. Ich zadaniem jest próba kompleksowego obejścia wszystkich naszych zabezpieczeń, tak jak mógłby to zrobić zdeterminowany i dobrze wyposażony haker. Pomaga nam to wcześnie identyfikować luki i wzmacniać cały system.

Inicjatywy systemowe na rzecz wzmacniania odporności cybernetycznej 

W OpenAI wcześnie zaczęliśmy inwestować w wykorzystanie AI w defensywnych zastosowaniach w obszarze cyberbezpieczeństwa, a nasz zespół ściśle współpracuje z ekspertami z całego świata, rozwijając nasze modele oraz sposoby ich zastosowania. Niezwykle cenimy globalną społeczność specjalistów ds. cyberbezpieczeństwa, którzy niestrudzenie pracują nad tym, by nasz cyfrowy świat był bezpieczniejszy, i dokładamy wszelkich starań, aby dostarczać zaawansowane narzędzia wspierające działania obronne w tym obszarze. W miarę wprowadzania nowych zabezpieczeń będziemy nadal współpracować ze społecznością zajmującą się cyberbezpieczeństwem, aby lepiej zrozumieć, gdzie AI może w istotny sposób wzmacniać odporność oraz które dobrze przemyślane zabezpieczenia są najważniejsze.

Oprócz tej współpracy wprowadzamy działania, które pomogą obrońcom działać szybciej, dostosować nasze zabezpieczenia do rzeczywistych potrzeb i przyspieszyć wprowadzanie odpowiedzialnych środków zaradczych na dużą skalę.

Programy zaufanego dostępu dla obrony cybernetycznej

Wkrótce wprowadzimy program zaufanego dostępu, w ramach którego będziemy badać możliwość zapewnienia kwalifikującym się użytkownikom i klientom zajmującym się cyberobroną wielopoziomowego dostępu do zaawansowanych funkcji naszych najnowszych modeli przeznaczonych do zastosowań obronnych. Nadal staramy się zdefiniować funkcje, które możemy udostępnić szeroko, a które wymagają ograniczeń zależnych od poziomu, co może wpłynąć na przyszły kształt tego programu. Chcemy, aby program zaufanego dostępu stał się fundamentem budowy odpornego ekosystemu.

Rozszerzenie zdolności obronnych dzięki Aardvark

Aardvark, nasze specjalistyczne narzędzie zabezpieczające, które pomaga programistom i zespołom zajmującym się bezpieczeństwem wykrywać i usuwać luki w zabezpieczeniach na dużą skalę, jest już dostępne w prywatnej wersji beta. Rozwiązanie to skanuje bazy kodu pod kątem luk w zabezpieczeniach i proponuje poprawki, które opiekunowie projektu mogą szybko wdrożyć. Już teraz, dzięki rozumowaniu obejmującemu całe bazy kodu, Aardvark wykrył nowe CVE w oprogramowaniu open source. Planujemy oferować bezpłatną ochronę wybranym niekomercyjnym repozytoriom open source, aby podnieść poziom bezpieczeństwa ekosystemu oprogramowania i łańcucha dostaw open source. Zgłoś się do udziału tutaj.

Rada ds. zagrożeń ze strony modeli pionierskich

Powołamy Radę ds. zagrożenia ze strony modeli pionierskich, która będzie stanowić grupę doradczą zapewniającą doświadczonym specjalistom ds. cyberobrony i bezpieczeństwa możliwość ścisłej współpracy z naszymi zespołami. Rada ta początkowo będzie koncentrować się na cyberbezpieczeństwie, a w przyszłości rozszerzy zakres działania na inne pionierskie obszary funkcjonalności. Członkowie tego zespołu będą doradzać w kwestii granic między użytecznymi, odpowiedzialnymi możliwościami a potencjalnymi nadużyciami; uzyskane w ten sposób wnioski będą bezpośrednio kształtować nasze oceny i zabezpieczenia. Wkrótce podamy więcej informacji na ten temat. 

Wspólne rozumienie modeli zagrożeń

Przewidujemy, że każdy pionierski model AI tworzony przez dowolnego producenta może stać się narzędziem nadużyć w cyberprzestrzeni. Aby temu zaradzić, współpracujemy z innymi laboratoriami pionierskimi za pośrednictwem Frontier Model Forum, organizacji non-profit wspieranej przez czołowe laboratoria AI i partnerów z branży, w celu wypracowania wspólnego rozumienia modeli zagrożeń i wypracowania najlepszych praktyk obronnych. W tym kontekście modelowanie zagrożeń pomaga ograniczać ryzyko poprzez identyfikowanie sposobów, w jakie sztuczna inteligencja mogłaby zostać wykorzystana jako broń, występowania kluczowych obszarów umożliwiających działanie cyberprzestępcom oraz tego, w jaki sposób pionierskie modele mogą zapewniać znaczącą poprawę bezpieczeństwa. Celem tej współpracy jest wypracowanie spójnego, obejmującego cały ekosystem rozumienia działań podmiotów stanowiących zagrożenie i wektorów ataków, co pozwoli laboratoriom, opiekunom projektów i obrońcom na skuteczniejsze udoskonalanie swoich zabezpieczeń oraz zapewnienie szybkiego przekazywania kluczowych informacji dotyczących bezpieczeństwa w całym systemie. Współpracujemy również z zespołami zewnętrznymi, aby opracować oceny z zakresu cyberbezpieczeństwa(otwiera nowe okno). Mamy nadzieję, że ekosystem niezależnych ocen pomoże jeszcze bardziej rozwijać wspólne zrozumienie możliwości modeli.

Wszystkie te działania odzwierciedlają nasze długoterminowe zaangażowanie we wzmacnianie obronnych aspektów ekosystemu. Modele ciągle się rozwijają, a naszym celem jest zapewnienie, by ich możliwości zapewniały obrońcom przewagę, dlatego chcemy poznać realne potrzeby środowiska, uzyskać opinie ekspertów i starannie wdrażać nowe rozwiązania. Równolegle do tych działań planujemy rozwijać inne inicjatywy i oferować granty z zakresu cyberbezpieczeństwa, aby wspomóc powstawanie przełomowych pomysłów, które mogą nie ujawnić się w tradycyjnych kanałach, oraz pozyskiwać odważne i kreatywne rozwiązania obronne ze środowisk akademickich, przemysłu i społeczności open source. Wszystkie te inicjatywy prowadzimy równolegle i zakładamy, że będziemy nadal je rozwijać w miarę zdobywania wiedzy o najskuteczniejszych sposobach zwiększania poziomu cyberbezpieczeństwa w rzeczywistych warunkach.