9. rujna 2025.

SafetyKit skalira agente za rizik uz najbolje modele OpenAI-ja

Od izrade prototipa s ranim pretprikazima modela za vid do skaliranja uz GPT‑5, SafetyKitovi multimodalni agenti šire se na nova područja i povećavaju točnost.

Obratite se prodaji

Logotip SafetyKit u bijeloj boji, centriran na tamnoj pozadini s okomitom teksturom i toplim gradijentom narančaste, žute i tirkizne svjetlosti.

Veličina tvrtke: Startup

Regija: Sjeverna Amerika

Industrija: Tehnologija, Usluge

Proizvodi: API

Rezultati

95%+

Točnost pri pregledu 100 % korisničkog sadržaja (SafetyKit evaluacije)

Rezultati

16B

Dnevno obrađeni tokeni, u odnosu na 200 milijuna prije šest mjeseci

Rezultati

10+

Istaknite poboljšanja performansi na najtežim zadacima računalnog vida uz GPT-5

Učitavanje…

SafetyKit⁠(otvara se u novom prozoru) izrađuje multimodalne AI agente koji internetskim tržištima, platformama za plaćanje i fintech tvrtkama pomažu u otkrivanju i reagiranju na prijevare i zabranjene aktivnosti u tekstu, slikama, financijskim transakcijama, popisima proizvoda i drugome. Nedavni pomaci u rasuđivanju modela i multimodalnom razumijevanju omogućili su veću učinkovitost, postavljajući nove standarde za operacije upravljanja rizikom, usklađenošću i sigurnošću.

SafetyKitovi agenti upotrebljavaju GPT‑5, GPT‑4.1, dubinsko istraživanje i agenta koji koristi računalo (CUA) kako bi pregledali 100 % korisničkog sadržaja s točnošću većom od 95 %, prema SafetyKitovim evaluacijama. Oni platformama mogu pomoći zaštititi korisnike, spriječiti prijevare, izbjeći regulatorne kazne i provesti složena pravila koja naslijeđeni sustavi mogu propustiti, poput regionalno specifičnih pravila, ugrađenih telefonskih brojeva u slikama povezanima s prijevarama ili eksplicitnog sadržaja. Automatizacija također može zaštititi ljudske moderatore od izloženosti uvredljivom sadržaju i omogućiti im da se posvete rješavanju nijansiranih odluka o pravilima.

„OpenAI nam omogućuje pristup najnaprednijim modelima za rasuđivanje i multimodalnim modelima dostupnim na tržištu. Omogućuje nam brzo prilagođavanje, bržu isporuku novih agenata i obradu vrsta sadržaja koje druga rješenja ne mogu ni raščlaniti.”

David Graunke, osnivač i izvršni direktor tvrtke SafetyKit

Osmislite agente prema zahtjevima zadatka, zatim odaberite pravi model

SafetyKitovi agenti osmišljeni su za obradu određene kategorije rizika, od prijevara do nezakonitih proizvoda. Svaki dio sadržaja usmjerava se agentu koji je najprikladniji za to kršenje, upotrebom optimalnog OpenAI modela:

GPT‑5 primjenjuje multimodalno rasuđivanje na tekst, slike i korisničko sučelje (UI) kako bi otkrio skrivene rizike i podržao slojevito i precizno donošenje odluka
GPT‑4.1 pouzdano slijedi detaljne upute o pravilima sadržaja i učinkovito upravlja radnim procesima moderacije velikog opsega
precizno podešavanje s potkrepljivanjem (RFT) povećava odziv i preciznost iznad zadanih modela, čime se postižu granične performanse sa složenim sigurnosnim pravilima
dubinsko istraživanje uključuje internetsko istraživanje recenzija i provjera trgovaca u stvarnom vremenu
agent koji koristi računalo (CUA) automatizira složene zadatke vezane uz pravila, čime se smanjuje oslanjanje na skupe manualne provjere

Taj pristup usklađivanja modela omogućuje SafetyKitu da proširi opseg pregleda sadržaja na različite modalitete s većom preciznošću i točnošću nego što to mogu zastarjela rješenja.

Agent za otkrivanje prijevara, na primjer, nadilazi puko skeniranje teksta. Analizira vizualne elemente poput QR kodova ili brojeva telefona ugrađenih u slike proizvoda. GPT‑4.1 pomaže mu analizirati sliku, razumjeti raspored i odlučiti predstavlja li to kršenje pravila.

Agent za otkrivanje pravila provjerava popise ili odredišne stranice radi obaveznog jezika, poput pravnih izjava o odricanju odgovornosti ili upozorenja o usklađenosti specifičnih za regiju. GPT‑4.1 izdvaja relevantne odjeljke, GPT‑5 procjenjuje usklađenost, a agent označava prekršaje.

„Naše agente smatramo radnim tijekovima izrađenima za određenu svrhu”, kaže Graunke. „Neki zadaci zahtijevaju duboko rasuđivanje, dok je drugima potreban multimodalni kontekst. OpenAI jedini je sustav koji osigurava pouzdanu izvedbu u oba slučaja.

Linijski i stupčasti grafikon s oznakom „SafetyKit” na svijetloj pozadini, koji prikazuje trendove podataka i usporedbe u više kategorija.

Iskoristite GPT‑5 za snalaženje u sivim zonama i donošenje važnih odluka

Odluke o pravilima često ovise o suptilnim razlikama. Uzmimo tržište koje zahtijeva da prodavatelji uključe odricanje od odgovornosti za proizvode za dobrobit, pri čemu se zahtjevi razlikuju ovisno o tvrdnjama o proizvodu i regionalnim pravilima. Postojeći pružatelji usluga koriste okidače ključnih riječi ili krute skupove pravila, koji mogu propustiti dublje prosudbe koje te odluke mogu zahtijevati, što dovodi do propuštene ili netočne provedbe.

SafetyKitov agent za otkrivanje pravila najprije upućuje na pravila iz SafetyKitove interne knjižnice, a zatim GPT‑5 procjenjuje sadržaj: spominje li liječenje ili prevenciju? Prodaje li se u regiji u kojoj je objava obvezna? Ako da, je li traženi jezik doista uključen u popis? Ako nešto nije zadovoljavajuće, GPT‑5 vraća strukturirani izlaz koji agent koristi za označavanje problema.

„Snaga GPT‑5 leži u tome koliko precizno može zaključivati kada je utemeljen na stvarnim pravilima”, napominje Graunke. „Omogućuje nam donošenje točnih i opravdanih odluka čak i u rubnim slučajevima u kojima drugi sustavi zakažu.”

Pretvorite svako izdanje modela u uspješan proizvod

SafetyKit uspoređuje svaki novi OpenAI model s najzahtjevnijim slučajevima i često uvodi najbolje modele istoga dana. Rigorozne interne evaluacije omogućuju timu brzo prepoznavanje načina na koji novi modeli mogu poboljšati performanse i besprijekorno se integrirati u osnovnu infrastrukturu.

Kada je OpenAI o3 predstavljen, SafetyKit ga je upotrijebio za poboljšanje performansi u rubnim slučajevima u ključnim područjima politika. Uslijedio je GPT‑5, a već je u roku od nekoliko dana implementiran u njihovim najzahtjevnijim agentima, čime su se poboljšali rezultati na referentnim testovima za više od 10 bodova na njihovim najzahtjevnijim zadacima računalnog vida.

„OpenAI brzo napreduje, a naš smo sustav osmislili tako da to može pratiti. Svako novo izdanje daje nam operativnu prednost – otključava nove mogućnosti i područja koja prije nismo mogli podržati te povećava obuhvat i točnost koje pružamo korisnicima.

— David Graunke, osnivač i izvršni direktor tvrtke SafetyKit

SafetyKit također vraća poboljšanja u ekosustav, dijeleći rezultate evaluacija, neuspjehe u rubnim slučajevima i uvide specifične za pravila izravno s OpenAI-jem kako bi pomogao unaprijediti buduće performanse modela za sigurnosno kritične radne zadatke.

Skalirajte rast broja korisnika i obujma uz najbolji OpenAI tehnološki stack

Arhitektura SafetyKita omogućuje provođenje pravila u velikom opsegu, pružajući brzinu, preciznost i sveobuhvatnu pokrivenost rizika. U pozadini sada svakodnevno obrađuje više od 16 milijardi tokena, u odnosu na 200 milijuna prije šest mjeseci, analizirajući više sadržaja bez žrtvovanja preciznosti.

U istom razdoblju, SafetyKit se proširio na rizike povezane s plaćanjima, prijevare, zaštitu djece od iskorištavanja, sprječavanje pranja novca i nove korisnike sa stotinama milijuna krajnjih korisnika pod njegovom zaštitom. Ta osnova omogućuje korisnicima da brzo i pouzdano odgovore na nove rizike.

„Stvorili smo petlju u kojoj svako OpenAI-jevo izdanje izravno jača naše sposobnosti”, kaže Graunke. „Zato se sustav kontinuirano unapređuje, uvijek ostajući korak ispred rizika koji se razvijaju.”

Rezultati na prvi pogled

Preciznost od 95 % + pri pregledu 100 % korisničkog sadržaja
16 milijardi tokena obrađuje se dnevno, u odnosu na 200 milijuna prije šest mjeseci
Povećanje od više od 10 bodova na najzahtjevnijim vizualnim zadacima

Pridružite se novoj eri rada

Više od milijun poduzeća diljem svijeta postiže značajne rezultate uz OpenAI.

Obratite se prodaji

Nastavite čitati

$math-breakthroughs art-card 1x1$

Ten advances in mathematics and theoretical computer science

Publikacija1. kol 2026.

Advancing responsible AI across Europe — card

Unaprjeđenje odgovorne umjetne inteligencije u Europi

Globalna suradnja31. srp 2026.

Building abundant intelligence

Tvrtka31. srp 2026.