Przejdź do treści głównej
OpenAI

Przedstawiamy program Safety Bug Bounty firmy OpenAI

Badanie kwestii bezpieczeństwa i nadużyć w OpenAI

W dniu dzisiejszym OpenAI uruchamia publiczny program Safety Bug Bounty(otwiera nowe okno), którego celem jest identyfikowanie nadużyć związanych z AI i zagrożeń dla bezpieczeństwa w naszych produktach. Wraz z szybkim rozwojem technologii AI rośnie też liczba potencjalnych sposobów jej niewłaściwego wykorzystania. Chcemy zapewnić, aby nasze systemy pozostawały bezpieczne i odporne na nadużycia, które mogłyby prowadzić do wymiernych szkód. 

Nowy program będzie uzupełnieniem programu Security Bug Bounty(otwiera nowe okno) od OpenAI – przyjmowane będą zgłoszenia dotyczące problemów stwarzających istotne ryzyko nadużyć i zagrożenia dla bezpieczeństwa, nawet jeśli nie spełniają one kryteriów luki w zabezpieczeniach. W ramach programu zamierzamy kontynuować współpracę z badaczami ds. bezpieczeństwa i ochrony, aby wspólnie identyfikować i rozwiązywać problemy, które wykraczają poza zakres typowych luk w zabezpieczeniach, ale nadal stwarzają realne zagrożenia. Zgłoszenia będą wstępnie oceniane przez zespoły Safety Bug Bounty oraz Security Bug Bounty i mogą być przekierowywane między tymi dwoma programami w zależności od zakresu i odpowiedzialności.

Omówienie programu

Nowy program Safety Bug Bounty(otwiera nowe okno) koncentruje się na scenariuszach związanych z bezpieczeństwem AI, które wymieniono poniżej:

Ryzyko agentowe, w tym MCP

  • Wstrzykiwanie poleceń przez strony trzecie i eksfiltracja danych: sytuacja, w której tekst atakującego pozwala na skuteczne przejęcie kontroli nad agentem ofiary (w tym przeglądarką, agentem ChatGPT i podobnymi produktami agentowymi), aby nakłonić go do wykonania szkodliwego działania lub ujawnienia poufnych danych użytkownika. Zachowanie musi być odtwarzalne w co najmniej 50% przypadków. 
  • Produkt agentowy OpenAI wykonuje niedozwolone działanie na dużą skalę na stronie internetowej OpenAI.
  • Produkt agentowy OpenAI wykonuje potencjalnie szkodliwe działanie, które nie zostało wymienione powyżej. Prawidłowe zgłoszenia muszą wskazywać na wiarygodną i istotną szkodę.
  • Wszelkie testy ryzyka MCP muszą być zgodne z warunkami korzystania z usług stron trzecich.

Informacje poufne OpenAI

  • Wygenerowane przez model treści zawierające poufne informacje dotyczące mechanizmów jego rozumowania.
  • Luki w zabezpieczeniach, które ujawniają inne zastrzeżone informacje OpenAI.

Integralność kont i platformy

  • Podatności związane z integralnością kont i sygnałami integralności platformy, takie jak obchodzenie mechanizmów zapobiegających automatyzacji, manipulowanie sygnałami zaufania konta, unikanie ograniczeń, zawieszeń i blokad konta i tym podobne.
  • Problemy, które umożliwiają użytkownikom uzyskanie dostępu do funkcji, danych lub funkcjonalności wykraczających poza przyznane uprawnienia, należy zgłaszać do programu Security Bug Bounty(otwiera nowe okno).

Chociaż program nie obejmuje obejść zabezpieczeń, okresowo prowadzimy prywatne kampanie związane z wykrywaniem błędów, ukierunkowane na określone rodzaje zagrożeń, takie jak problemy z treściami dotyczącymi zagrożeń biologicznych w Agencie ChatGPT i GPT‑5. Zapraszamy zainteresowanych badaczy do ubiegania się o udział we wspomnianych programach. 

Oprócz wyżej wymienionych kategorii, jeśli badacze zidentyfikują luki, które stwarzają bezpośrednie zagrożenie dla użytkowników, oraz konkretne, możliwe do wdrożenia działania naprawcze, będą one rozpatrywane indywidualnie pod kątem przyznania nagrody. Ogólne obejścia zasad dotyczących treści bez wykazanego wpływu na bezpieczeństwo lub nadużycia nie wchodzą w zakres programu. Mogą to być na przykład obejścia zabezpieczeń skutkujące używaniem przez model obraźliwego języka lub zwracaniem informacji, które można łatwo znaleźć za pomocą wyszukiwarek internetowych.

Jak wziąć udział?

Badacze zainteresowani udziałem mogą zgłosić się poprzez program Safety Bug Bounty(otwiera nowe okno). Liczymy na współpracę z badaczami, etycznymi hakerami oraz społecznością zajmującą się zabezpieczeniami w dążeniu do stworzenia bezpiecznego ekosystemu AI.

Autor

OpenAI