Preskočite na glavni sadržaj
OpenAI

9. septembar 2025.

SafetyKit skalira agente za rizik s naprednim modelima OpenAI-a

Od izrade prototipa uz rane preglede modela za vid do skaliranja uz GPT‑5, SafetyKitovi multimodalni agenti šire se na nova područja i povećavaju preciznost.

SafetyKit logo u bijeloj boji centriran na tamnoj pozadini s vertikalnom teksturom i toplim gradijentom narandžaste, žute i tirkizne svjetlosti.
Veličina kompanije: Startup
Regija: Sjeverna Amerika
Industrija: Tehnologija, Usluge
Proizvodi: API

Rezultati

95%+

Tačnost pregleda 100% sadržaja kupaca (evaluacije SafetyKit-a)

Rezultati

16B

Tokena obrađenih dnevno, u odnosu na 200.000.000 prije šest mjeseci

Rezultati

10+

Ostvarite poboljšanja performansi na najtežim zadacima računalnog vida uz GPT-5

Učitavanje…

SafetyKit(otvara se u novom prozoru) gradi multimodalne AI agente kako bi pomogao online tržištima, platnim platformama i fintech kompanijama da otkriju prevare i zabranjene aktivnosti te poduzmu mjere u vezi s njima u tekstu, slikama, finansijskim transakcijama, listama proizvoda i drugom. Nedavni proboji u rezonovanju modela i višemodalnom razumijevanju sada čine ovo efikasnijim, postavljajući nove standarde za operacije upravljanja rizikom, usklađenosti i sigurnosti.

SafetyKitovi agenti koriste GPT‑5, GPT‑4.1, duboko istraživanje i agenta koji koristi računalo (CUA) za pregled 100% korisničkog sadržaja s više od 95% tačnosti prema SafetyKitovim evaluacijama. Oni mogu pomoći platformama da zaštite korisnike, spriječe prevare, izbjegnu regulatorne kazne i provode složena pravila koja zastarjeli sistemi mogu propustiti, poput pravila specifičnih za regije, ugrađenih brojeva telefona u slikama prevara ili eksplicitnog sadržaja. Automatizacija može zaštititi ljudske moderatore od izloženosti uvredljivom sadržaju i omogućiti im da se fokusiraju na nijansirane odluke o pravilima.

„OpenAI nam omogućava pristup najnaprednijim modelima zaključivanja i multimodalnim modelima na tržištu. Omogućava nam da se brzo prilagodimo, brže isporučujemo nove agente i obrađujemo tipove sadržaja koje druga rješenja ne mogu čak ni parsirati.”
David Graunke, osnivač i izvršni direktor kompanije SafetyKit

Dizajnirajte agente prema onome što zadatak zahtijeva, a zatim odaberite odgovarajući model

Svaki agent SafetyKit-a dizajniran je da se bavi određenom kategorijom rizika, od prevara do ilegalnih proizvoda. Svaki dio sadržaja preusmjerava se agentu koji je najprikladniji za tu povredu, koristeći optimalni model OpenAI-a:

  • GPT‑5 koristi multimodalno rezonovanje kroz tekst, slike i korisnički interfejs kako bi otkrio skrivene rizike i podržao slojevito i precizno donošenje odluka
  • GPT‑4.1 pouzdano prati detaljna uputstva o pravilima sadržaja i efikasno upravlja radnim procesima moderiranja velikog obima
  • Fino podešavanje s potkrepljenjem (RFT) povećava prisjetljivost i preciznost iznad zadanih modela, postižući granične performanse sa složenim sigurnosnim politikama
  • Duboko istraživanje objedinjuje online istraživanje u stvarnom vremenu s recenzijama i verifikacijama trgovaca
  • Agent za korištenje računara (CUA) automatizira složene zadatke vezane za politiku, smanjujući oslanjanje na skupe ručne preglede

Ovaj pristup usklađivanja modela omogućava SafetyKitu da preciznije i nijansiranije pregleda sadržaj kroz različite modalitete nego što to mogu zastarjela rješenja.

Agent za otkrivanje prevara, na primjer, ne svodi se samo na skeniranje teksta. Analizira vizuelne sadržaje, poput QR kodova ili brojeva telefona ugrađenih u slike proizvoda. GPT‑4.1 mu pomaže da obradi sliku, razumije raspored i odluči da li je to kršenje politike.

Agent za otkrivanje politika provjerava listinge ili odredišne stranice radi obaveznog jezika, kao što su pravna odricanja od odgovornosti ili upozorenja o usklađenosti specifična za regiju. GPT‑4.1 izdvaja relevantne odjeljke, GPT‑5 procjenjuje usklađenost, a agent označava kršenja.

„O našim agentima razmišljamo kao o namjenski izrađenim tokovima rada“, kaže Graunke. „Neki zadaci zahtijevaju duboko rezonovanje, dok je drugima potreban multimodalni kontekst. OpenAI je jedini stack koji pruža pouzdane performanse u oba slučaja.”

Linijski i stubasti grafikon nazvan „SafetyKit“ na svijetloj pozadini, prikazuje trendove podataka i poređenja kroz više kategorija.

Iskoristite GPT‑5 da se snađete u sivim zonama i odlukama od velike važnosti

Odluke o politikama često zavise od suptilnih razlika. Uzmimo tržište koje zahtijeva da prodavači uključe odricanje od odgovornosti za proizvode za wellness, pri čemu se zahtjevi razlikuju u zavisnosti od tvrdnji o proizvodu i regionalnih pravila. Naslijeđeni pružaoci usluga koriste okidače ključnih riječi ili krute skupove pravila, koji mogu propustiti dublje prosudbe koje ove odluke mogu zahtijevati, što dovodi do propuštene ili netačne primjene.

Agent za objavu pravila SafetyKita prvo koristi pravila iz interne biblioteke SafetyKita, a zatim GPT‑5 procjenjuje sadržaj: spominje li se liječenje ili prevencija? Da li se prodaje u regiji u kojoj je objava obavezna? Ako jeste, da li je traženi jezik zaista uključen u popis? Ako nešto nedostaje, GPT‑5 vraća strukturirani izlaz koji agent koristi da označi problem.

„Snaga GPT‑5 je u tome koliko precizno može zaključivati kada je utemeljen na stvarnim pravilima“, napominje Graunke. „Omogućava nam da donosimo tačne i opravdane odluke čak i u graničnim slučajevima u kojima drugi sistemi ne uspijevaju.“

Pretvori svako lansiranje modela u uspješan proizvod

SafetyKit svaki novi OpenAI model testira prema mjerilima u odnosu na njegove najteže slučajeve, često puštajući najuspješnije u upotrebu istog dana. Rigorozne interne evaluacije omogućavaju timu da brzo utvrdi kako novi modeli mogu unaprijediti performanse i neprimjetno se integrirati u svoju osnovnu infrastrukturu.

Kada je OpenAI o3 lansiran, SafetyKit ga je koristio za poboljšanje performansi u rubnim slučajevima u ključnim područjima politika. GPT‑5 je uslijedio i u roku od nekoliko dana bio je implementiran u njihove najzahtjevnije agente, poboljšavajući rezultate na mjerilima za više od 10 bodova na njihovim najtežim zadacima iz oblasti računalnog vida.

„OpenAI se brzo razvija, a mi smo dizajnirali naš sistem da pratimo. Svako novo izdanje daje nam operativnu prednost — otključava nove mogućnosti i domene koje ranije nismo mogli podržati te povećava obuhvat i tačnost koje pružamo korisnicima.”
—David Graunke, osnivač i izvršni direktor kompanije SafetyKit

SafetyKit također unosi poboljšanja u ekosistem, dijeleći rezultate evaluacija, neuspjehe u rubnim slučajevima i uvide specifične za politike direktno s OpenAI-jem kako bi pomogao oblikovati buduće performanse modela za sigurnosno kritične zadatke.

Povećajte rast broja kupaca i obima uz najbolji OpenAI stack.

SafetyKitova arhitektura omogućava sprovođenje politika u velikim razmjerama, isporučujući brzinu, preciznost i sveobuhvatnu pokrivenost rizika. U pozadini sada obrađuje više od 16 milijardi tokena dnevno, u odnosu na 200 miliona prije šest mjeseci, analizirajući više sadržaja bez žrtvovanja tačnosti.

U tom istom periodu, SafetyKit se proširio na rizike u plaćanjima, prevaru, sprečavanje iskorištavanja djece, sprečavanje pranja novca i nove klijente sa stotinama miliona krajnjih korisnika pod zaštitom SafetyKit-a. Ovaj temelj omogućava korisnicima da brzo i s povjerenjem odgovore na nove rizike.

„Stvorili smo ciklus u kojem svako OpenAI izdanje direktno jača naše sposobnosti“, kaže Graunke. „Zato se sistem kontinuirano poboljšava, uvijek ostajući ispred rizika koji se razvijaju.“

Rezultati na prvi pogled

  • 95%+ tačnost pri pregledu 100% korisničkog sadržaja
  • 16B tokena obrađenih dnevno, u odnosu na 200M prije šest mjeseci
  • Više od 10 poena dobitka na benchmarku u najtežim zadacima računalnog vida

Pridruži se novoj eri rada

Više od milion preduzeća širom svijeta postiže značajne rezultate s OpenAI-jem.