Przejdź do treści głównej
OpenAI

9 września 2025

SafetyKit skaluje agentów ds. ryzyka za pomocą modeli OpenAI

Multimodalne agenty SafetyKit wkraczają w nowe obszary i zwiększają dokładność w zastosowaniach obejmujących całe spektrum od prototypowania z użyciem wczesnych wersji poglądowych modeli wizualnych po skalowanie z GPT‑5.

Białe logo SafetyKit na środku ciemnego, pionowo teksturowanego tła z ciepłym gradientem pomarańczowego, żółtego i turkusowego światła.
Rozmiar przedsiębiorstwa: Start-up
Region: Ameryka Północna
Branża: Technologia, Usługi
Produkty: API

Wyniki

95%+

Dokładna ocena 100% treści klientów (oceny SafetyKit)

Wyniki

16B

Tokeny przetwarzane dziennie, wzrost z 200 mln sześć miesięcy temu

Wyniki

10+

Punktowy wzrost wydajności w najtrudniejszych zadaniach wizualnych dzięki GPT-5

Ładowanie…

SafetyKit(otwiera nowe okno) tworzy multimodalne agenty AI, które pomagają platformom handlowym, płatniczym i firmom fintech wykrywać oszustwa i niedozwolone działania między innymi w tekstach, obrazach, transakcjach finansowych, ofertach produktów oraz reagować na nie. Najnowsze rewolucje w rozumowaniu modeli i multimodalnym zrozumieniu sprawiają, że działania te stały się jeszcze skuteczniejsze i wyznaczają nowy standard operacji związanych z zarządzaniem ryzykiem, zgodnością i bezpieczeństwem.

Agenty SafetyKit wykorzystują GPT‑5, GPT‑4.1, głębokie badania oraz agenta korzystającego z komputera (CUA) do analizy 100% treści klientów z dokładnością przekraczającą 95% według ocen SafetyKit. Mogą one pomagać platformom chronić użytkowników, zapobiegać oszustwom, unikać kar regulacyjnych i egzekwować złożone zasady, których starsze systemy mogą nie wychwytywać, takie jak reguły specyficzne dla danego regionu, numery telefonów osadzone w obrazach czy treści jednoznacznie seksualne. Automatyzacja może również chronić moderatorów przed kontaktem z wulgarnymi treściami i pozwala im zajmować się podejmowaniem skomplikowanych decyzji dotyczących zasad.

„OpenAI daje nam dostęp do najbardziej zaawansowanych na rynku modeli rozumowania i multimodalnych. Dzięki temu możemy szybko się dostosowywać, wdrażać nowe agenty i obsługiwać typy treści, których inne rozwiązania nie potrafią nawet przetworzyć”,
David Graunke, założyciel i dyrektor generalny firmy SafetyKit

Projektuj agenty zgodnie z wymaganiami zadania, a następnie wybieraj odpowiedni model

Agenty SafetyKit mogą obsługiwać określoną kategorię ryzyka: od oszustw po nielegalne produkty. Każda treść jest kierowana do agenta najbardziej odpowiedniego do obsługi danego naruszenia, z użyciem optymalnego modelu OpenAI:

  • GPT‑5 wykorzystuje rozumowanie multimodalne w zakresie tekstu, obrazów i interfejsu użytkownika do ujawniania ukrytych zagrożeń i usprawniania podejmowania wielowarstwowych, precyzyjnych decyzji
  • GPT‑4.1 niezawodnie wykonuje szczegółowe instrukcje dotyczące zasad treści i efektywnie zarządza procesami moderacji na dużą skalę.
  • Funkcja dostosowania ze wzmocnieniem (RFT) rozwija przywołanie i podnosi precyzję ponad poziom modeli domyślnych, osiągając pionierską wydajność przy złożonych zasadach bezpieczeństwa.
  • Funkcja głębokich badań łączy dochodzenia online w czasie rzeczywistym z recenzjami sprzedawców i ich weryfikacją.
  • Agent korzystający z komputera (CUA) automatyzuje złożone zadania związane z zasadami, redukując zakres kosztownych, ręcznych weryfikacji.

Takie podejście oparte na dopasowywaniu modeli pozwala SafetyKit skalować weryfikację treści w różnych formatach z większą precyzją i dokładnością niż starsze rozwiązania.

Agent Scam Detection wykonuje więcej działań niż tylko skanowanie tekstu i na przykład analizuje elementy wizualne, takie jak kody QR lub numery telefonów, umieszczone na obrazach produktów. GPT‑4.1 pomaga mu analizować obrazy, rozumieć układ i decydować, czy naruszają one zasady.

Agent Policy Disclosure sprawdza oferty lub strony docelowe pod kątem wymaganych treści, takich jak zastrzeżenia prawne lub ostrzeżenia dotyczące zgodności z przepisami określonymi dla danego regionu. Model GPT‑4.1 wyodrębnia odpowiednie sekcje, GPT‑5 ocenia zgodność, a agent wskazuje naruszenia.

„Traktujemy nasze agenty jak procesy robocze stworzone do konkretnych celów”, mówi Graunke. „Niektóre zadania wymagają głębokiego rozumowania, inne potrzebują kontekstu multimodalnego. OpenAI zapewnia jedyne rozwiązanie, które oferuje niezawodną wydajność w obu obszarach.

Wykres liniowy i słupkowy oznaczony etykietą „SafetyKit” na jasnym tle, przedstawiający trendy danych i porównania w wielu kategoriach.

GPT‑5 ułatwia operowanie w niejednoznacznych sytuacjach i podejmowanie istotnych decyzji

Decyzje podejmowane w przypadku zasad często zależą od subtelnych rozróżnień. Na przykład: pewna platforma handlowa wymaga od sprzedawców dołączania zastrzeżenia do produktów wellness, przy czym wymagania są różne w zależności od deklarowanych właściwości produktu i przepisów regionalnych. Dotychczasowi dostawcy korzystają z wyzwalaczy opartych na słowach kluczowych lub sztywnych zbiorów reguł, które mogą nie uwzględniać bardziej złożonych ocen sytuacji, jakich wymagają te decyzje, co prowadzi do pominięć lub nieprawidłowego egzekwowania zasad.

Agent Policy Disclosure w SafetyKit najpierw odwołuje się do zasad z wewnętrznej biblioteki SafetyKit, a następnie GPT‑5 ocenia treść: czy produkt jest związany z leczeniem lub profilaktyką? Czy jest sprzedawany w regionie, w którym ujawnienie informacji jest obowiązkowe? A jeśli tak, czy wymagany język jest rzeczywiście uwzględniony w ofercie? Jeśli jakiekolwiek informacje okażą zbyt skąpe, GPT‑5 zwraca ustrukturyzowane dane wyjściowe, które agent wykorzystuje do oznaczenia problemu.

„Siła GPT‑5 wynika z precyzyjnego rozumowania, gdy model ten bazuje na rzeczywistych zasadach”, zauważa Graunke. „Pozwala nam to podejmować trafne decyzje, które można uzasadnić, nawet w skrajnych przypadkach, w których inne systemy zawodzą”.

Każda premiera modelu może być sukcesem produktu

SafetyKit testuje porównawczo każdy nowy model OpenAI na swoich najtrudniejszych przypadkach testowych, często wdrażając najlepiej radzące sobie modele jeszcze tego samego dnia. Rygorystyczne oceny wewnętrzne pozwalają zespołowi szybko określić, w jaki sposób nowe modele mogą zwiększać wydajność pracy i następnie bezproblemowo integrować je z infrastrukturą podstawową.

Po premierze modelu OpenAI o3 w SafetyKit wykorzystano go do zwiększenia skuteczności w przypadkach brzegowych w kluczowych obszarach zasad. Następnie pojawił się GPT‑5 i w ciągu kilku dni został wdrożony wśród ich najbardziej wymagających agentów, poprawiając wyniki w testach porównawczych o ponad 10 punktów w ich najtrudniejszych zadaniach związanych z rozumieniem obrazu.

„OpenAI działa szybko, a nasz system zaprojektowaliśmy tak, aby nie zostawał w tyle. Każde nowe wydanie daje nam przewagę operacyjną, otwiera przed nami nowe możliwości i obszary, których wcześniej nie mogliśmy obsługiwać, oraz zwiększa zakres i dokładność rozwiązań dostarczanych klientom”,
David Graunke, założyciel i dyrektor generalny firmy SafetyKit

SafetyKit przekazuje również usprawnienia z powrotem do ekosystemu, udostępniając wyniki ocen, informacje o niepowodzeniach w przypadkach brzegowych oraz wnioski dotyczące konkretnych zasad bezpośrednio OpenAI, aby ułatwić dalszy rozwój modelu w przypadku obciążeń o krytycznym znaczeniu dla bezpieczeństwa.

Więcej klientów i zrealizowanych zadań dzięki najlepszemu stosowi OpenAI

Architektura SafetyKit egzekwuje zasady na dużą skalę, zapewniając szybkość, precyzję i kompleksową obsługę ryzyka. Obsługuje ona obecnie ponad 16 miliardów tokenów dziennie, w porównaniu z 200 milionami sprzed sześciu miesięcy i analizuje więcej treści bez utraty dokładności.

Jednocześnie w SafetyKit rozszerzono działalność firmową na ryzyko związane z płatnościami, oszustwa, przeciwdziałanie wykorzystywaniu dzieci, przeciwdziałanie praniu pieniędzy oraz zdobyto nowych klientów, których setki milionów użytkowników końcowych są chronione przez SafetyKit. Te fundamenty umożliwiają klientom szybkie i pewne reagowanie na pojawiające się zagrożenia.

„Stworzyliśmy pętlę, w której każda premiera nowej wersji od OpenAI bezpośrednio zwiększa nasze możliwości”, mówi Graunke. „Dlatego system stale jest ulepszany i znajduje się krok przed pojawiającymi się czynnikami ryzyka”.

Podsumowanie wyników

  • Ponad 95% dokładności przy weryfikacji 100% treści klientów
  • 16 mld tokenów przetwarzanych dziennie, wzrost z 200 mln w ciągu sześciu miesięcy
  • Ponad 10-punktowy wzrost w testach porównawczych w najtrudniejszych zadaniach związanych z widzeniem komputerowym

Nowa epoka pracy

Ponad 1 milion firm na całym świecie osiąga znaczące rezultaty dzięki OpenAI.