2025. gada 9. septembris

SafetyKit mērogo riska aģentus ar OpenAI spējīgākajiem modeļiem

Sākot ar prototipēšanu, izmantojot agrīnus redzes modeļu priekšskatījumus, un līdz pat mērogošanai ar GPT‑5 – SafetyKit multimodālie aģenti paplašina darbību jaunās jomās un uzlabo precizitāti.

Sazināties ar Pārdošanas daļu

SafetyKit logotips baltā krāsā, centrēts uz tumša, vertikāli teksturēta fona ar siltu oranžas, dzeltenas un zilganzaļas gaismas gradientu.

Uzņēmuma lielums: Jaunuzņēmums

Reģions: Ziemeļamerika

Nozare: Tehnoloģija, Pakalpojumi

Produkti: API

Rezultāti

95%+

Precizitāte, pārskatot 100% klientu satura (SafetyKit vērtējumi)

Rezultāti

16B

Ik dienu apstrādāto tekstvienību skaits, salīdzinot ar 200 miljoniem salīdzinot pirms sešiem mēnešiem.

Rezultāti

10+

Punktu snieguma pieaugums sarežģītākajos redzes uzdevumos ar GPT-5

Notiek ielāde…

SafetyKit⁠(atveras jaunā logā) izstrādā multimodālus MI aģentus, kas palīdz tiešsaistes tirdzniecības platformām, maksājumu platformām un finanšu tehnoloģiju uzņēmumiem atklāt un novērst krāpšanu un aizliegtas darbības tekstā, attēlos, finanšu darījumos, produktu lapās un citur. Nesenie sasniegumi modeļu spriestspējā un multimodālajā izpratnē tagad padara to efektīvāku, paceļot latiņu riska, atbilstības un drošības operācijām.

SafetyKit aģenti izmanto GPT‑5, GPT‑4.1, dziļo izpēti un datoru izmantojošu aģentu (CUA), lai pārskatītu 100% klientu satura ar vairāk nekā 95% precizitāti, pamatojoties uz SafetyKit novērtējumiem. Tie var palīdzēt platformām aizsargāt lietotājus, novērst krāpšanu, izvairīties no regulatīvajiem sodiem un īstenot sarežģītu politiku, ko vecās sistēmas var neievērot, piemēram, reģionam specifiskus noteikumus, krāpnieciskos attēlos iegultus tālruņu numurus vai nepiedienīgu saturu. Automatizācija var arī pasargāt moderatorus no saskares ar aizskarošu saturu un ļaut viņiem pievērsties niansētiem politikas lēmumiem.

“OpenAI sniedz mums piekļuvi tirgū vismodernākajiem spriestspējas un multimodālajiem modeļiem. Tas ļauj mums ātri pielāgoties, ātrāk piegādāt jaunus aģentus un apstrādāt tādus satura veidus, ko citi risinājumi pat nespēj parsēt.”

Deivids Graunke, SafetyKit dibinātājs un izpilddirektors

Izstrādā aģentus atbilstoši uzdevuma prasībām, pēc tam izvēlies pareizo modeli

SafetyKit aģenti ir izveidoti, lai pārvaldītu noteiktu riska kategoriju – no krāpniecības līdz nelegāliem produktiem. Katrs satura elements tiek novirzīts aģentam, kas vislabāk atbilst attiecīgajam pārkāpumam, izmantojot optimālo OpenAI modeli:

GPT‑5 izmanto multimodālu spriestspēju tekstā, attēlos un lietotāja saskarnē, lai atklātu slēptos riskus un atbalstītu daudzslāņainu, precīzu lēmumu pieņemšanu
GPT‑4.1 uzticami ievēro detalizētas satura politikas instrukcijas un efektīvi pārvalda liela apjoma moderēšanas darbplūsmas
Stimulēšanas pielāgošana (RFT) uzlabo atsaukšanu un precizitāti salīdzinājumā ar noklusējuma modeļiem, sasniedzot robežšķirtnes veiktspēju ar sarežģītām drošības politikām
Padziļināta izpēte integrē reāllaika tiešsaistes izmeklēšanu tirgotāju atsauksmēs un pārbaudēs
Datoru izmantojošs aģents (CUA) automatizē sarežģītus politikas uzdevumus, samazinot atkarību no dārgām manuālām pārbaudēm

Šī modeļu saskaņošanas pieeja ļauj SafetyKit paplašināt satura pārskatīšanu dažādās modalitātēs ar lielāku niansētību un precizitāti, nekā to spēj līdzšinējie risinājumi.

Piemēram, krāpniecības atklāšanas aģents sniedzas tālāk par vienkāršu teksta skenēšanu. Tas analizē vizuālus elementus, piemēram, kvadrātkodus vai tālruņa numurus, kas ir ietverti produktu attēlos. GPT‑4.1 palīdz tam analizēt attēlu, saprast izkārtojumu un noteikt, vai tas ir politikas pārkāpums.

Politikas atklāšanas aģents pārbauda produktu lapas vai mērķlapas, lai pārliecinātos, ka tajās ir iekļauta nepieciešamā informācija, piemēram, juridiskās atrunas vai reģionam specifiski atbilstības brīdinājumi. GPT‑4.1 izgūst atbilstošās sadaļas, GPT‑5 novērtē atbilstību, un aģents atzīmē pārkāpumus.

“Mēs domājam par saviem aģentiem kā par īpaši izveidotām darbplūsmām,” saka Graunke. “Dažiem uzdevumiem nepieciešama dziļa spriestspēja, citiem – multimodāls konteksts. OpenAI ir vienīgā platforma, kas nodrošina uzticamu sniegumu abās jomās.”

Līniju un joslu diagramma ar uzrakstu “SafetyKit” uz gaiša fona, kurā attēlotas datu tendences un salīdzinājumi vairākās kategorijās.

GPT‑5 izmantošana, lai orientētos neskaidrībās un pieņemtu svarīgus lēmumus

Politikas lēmumi bieži ir atkarīgi no smalkām niansēm. Iedomāsimies tirdzniecības platformu, kas prasa pārdevējiem pievienot atrunu par veselības produktiem, kuras prasības atšķiras atkarībā no apgalvojumiem par preci un reģionālajiem noteikumiem. Tradicionālie pakalpojumu sniedzēji izmanto atslēgvārdu aktivizētājus vai stingrus noteikumu kopumus, kas var neļaut veikt padziļinātus spriedumus, kādi var būt nepieciešami, un tādējādi var tikt neizpildīti vai nepareizi izpildīti.

SafetyKit politikas atklāšanas aģents vispirms atsaucas uz politikām no SafetyKit iekšējās bibliotēkas, pēc tam GPT‑5 novērtē saturu: vai tajā ir minēta ārstēšana vai profilakse? Vai tas tiek pārdots reģionā, kurā informācijas atklāšana ir obligāta? Un, ja jā, vai nepieciešamais formulējums ir iekļauts aprakstā? Ja kaut kas neatbilst prasībām, GPT‑5 atgriež strukturētus rezultātus, ko aģents izmanto, lai atzīmētu problēmu.

“GPT‑5 spēks slēpjas tajā, cik precīzi tas spēj spriest, ja tas balstās uz reālām politikas nostādnēm,” norāda Graunke. “Tas ļauj mums pieņemt precīzus, pamatotus lēmumus pat robežsituācijās, kur citas sistēmas cieš neveiksmi.”

Pārvērtiet katru modeļa izlaidumu par produkta ieguvumu

SafetyKit testē katru jauno OpenAI modeli, salīdzinot to ar visgrūtākajiem gadījumiem, bieži vien jau tajā pašā dienā ieviešot modeļus, kas uzrāda vislabākos rezultātus. Stingri iekšējie novērtējumi ļauj komandai ātri noteikt, kā jaunie modeļi var uzlabot veiktspēju un netraucēti integrēties pamatinfrastruktūrā.

Kad OpenAI laida klajā o3, SafetyKit to izmantoja, lai uzlabotu veiktspēju robežsituācijās galvenajās politikas jomās. Pēc tam sekoja GPT‑5, un dažu dienu laikā tas tika izvietots viņu prasīgākajos aģentos, uzlabojot etalontestu rezultātus par vairāk nekā 10 punktiem sarežģītākajos datorredzes uzdevumos.

“OpenAI virzās ātri, un mēs esam izstrādājuši savu sistēmu, lai neatpaliktu. Katra jaunā versija sniedz mums darbības priekšrocības, paverot jaunas iespējas un jomas, ko iepriekš nevarējām atbalstīt, un palielinot klientiem nodrošināto pārklājumu un precizitāti.”

—Deivids Graunke, SafetyKit dibinātājs un izpilddirektors

SafetyKit arī sniedz uzlabojumus atpakaļ ekosistēmai, daloties ar izvērtēšanas rezultātiem, robežgadījumu kļūmēm un ar politiku saistītiem ieskatiem tieši ar OpenAI, lai palīdzētu uzlabot modeļu veiktspēju drošībai kritiskām darba slodzēm.

Palieliniet klientu skaitu un apjomu pieaugumu ar labāko OpenAI tehnoloģiju kopumu

SafetyKit arhitektūra nodrošina politikas ievērošanu plašā mērogā, piedāvājot ātrumu, precizitāti un visaptverošu riska pārklājumu. Aizkulisēs tas tagad apstrādā vairāk nekā 16 miljardus tekstvienību dienā, kas ir pieaugums no 200 miljoniem pirms sešiem mēnešiem, analizējot vairāk satura, nezaudējot precizitāti.

Tajā pašā laika sprīdī SafetyKit ir paplašinājis darbību, aptverot maksājumu riskus, krāpšanu, bērnu ekspluatācijas novēršanu, nelikumīgi iegūtu līdzekļu legalizēšanas novēršanu, kā arī jaunus klientus, un šodien SafetyKit aizsargā simtiem miljonu galalietotāju. Šis pamats ļauj klientiem ātri un pārliecinoši reaģēt uz jauniem riskiem.

“Mēs esam izveidojuši ciklu, kurā katrs OpenAI izlaidums tiešā veidā stiprina mūsu spējas,” saka Graunke. “Tāpēc sistēma pastāvīgi uzlabojas, vienmēr esot soli priekšā jauniem riskiem.”

Rezultāti īsumā

95% vai augstāka precizitāte, pārskatot 100% klientu satura
Katru dienu tiek apstrādāti 16 miljardi tekstvienību, salīdzinājumā ar 200 miljoniem pirms sešiem mēnešiem
10+ punktu uzlabojums etalontestos sarežģītākajos datorredzes uzdevumos

Pievienojies jaunajam darba laikmetam

Vairāk nekā 1 miljons uzņēmumu visā pasaulē sasniedz nozīmīgus rezultātus, izmantojot OpenAI.

Sazināties ar Pārdošanas daļu

Turpināt lasīt

$math-breakthroughs art-card 1x1$

Ten advances in mathematics and theoretical computer science

Publikācija2026. g. 1. aug.

Advancing responsible AI across Europe — card

Atbildīga MI attīstība visā Eiropā

Globālā situācija2026. g. 31. jūl.

Building abundant intelligence

Uzņēmums2026. g. 31. jūl.