Siirry pääsisältöön
OpenAI

9. syyskuuta 2025

SafetyKit skaalaa riskiagentteja tehokkaimmilla OpenAI-malleilla

Prototypoinnista varhaisilla visuaalisen havainnon esikatseluversioilla aina GPT‑5:n skaalaamiseen asti SafetyKitin multimodaaliset agentit laajentavat käyttöä uusille alueille ja parantavat tarkkuutta.

Valkoinen SafetyKit-logo keskellä tummaa, pystysuuntaisesti kuvioitua taustaa, jossa on lämmin oranssin, keltaisen ja vaaleansinisen sävyjen liukuväri.
Yrityksen koko: Startup-yritykset
Alue: Pohjois-Amerikka
Toimiala: Teknologia, Palvelut
Tuotteet: API

Tulokset

95%+

Tarkkuuden tarkastelu 100 %:ssa asiakassisällöstä (SafetyKit-arvioinnit)

Tulokset

16B

Päivittäin käsiteltävien tokenien määrä on kasvanut kuuden kuukauden takaisesta 200 miljoonasta

Tulokset

10+

Suorituskyvyn parannuksia vaikeimmissa visuaalisen havainnon tehtävissä GPT-5:n avulla

Ladataan...

SafetyKit(avautuu uudessa ikkunassa) rakentaa multimodaalisia tekoälyagentteja, jotka auttavat verkkokauppoja, maksualustoja ja fintech-yrityksiä havaitsemaan petoksia ja kiellettyä toimintaa sekä reagoimaan niihin tekstien, kuvien, rahoitustapahtumien, tuotetietojen ja muiden tietojen perusteella. Viimeaikaiset läpimurrot mallien päättelyssä ja multimodaalisessa ymmärryksessä tekevät tästä entistä tehokkaampaa ja asettavat uuden standardin riskienhallinnan, vaatimustenmukaisuuden ja turvallisuuden toiminnoille.

SafetyKitin agentit hyödyntävät GPT‑5:tä, GPT‑4.1:tä, syvätutkimusta ja tietokonetta käyttävää agenttia (CUA) tarkastaakseen 100 % asiakassisällöstä yli 95 %:n tarkkuudella SafetyKitin arvioiden perusteella. Ne voivat auttaa alustoja suojelemaan käyttäjiä, ehkäisemään petoksia, välttämään sääntelyyn liittyviä sakkoja ja panemaan täytäntöön monimutkaisia käytäntöjä, joita vanhat järjestelmät eivät tunnista, kuten aluekohtaiset säännöt, huijauskuviin upotetut puhelinnumerot tai sopimaton sisältö. Automaatio voi myös suojata ihmismoderaattoreita loukkaavalle materiaalille altistumiselta ja vapauttaa heidät keskittymään monimutkaisiin käytäntöjä koskeviin päätöksiin.

”OpenAI tarjoaa meille pääsyn markkinoiden edistyneimpiin päättely- ja multimodaalisiin malleihin. Se mahdollistaa nopean mukautumisen, uusien agenttien toimittamisen nopeammin ja sellaisten sisältötyyppien käsittelyn, joita muut ratkaisut eivät edes pysty jäsentämään.”
David Graunke, SafetyKitin perustaja ja toimitusjohtaja

Suunnittele agentit tehtävän vaatimusten mukaan ja valitse sitten oikea malli

SafetyKitin agentit on suunniteltu käsittelemään tiettyjä riskiluokkia, kuten huijauksia ja laittomia tuotteita. Jokainen sisältö ohjataan rikkomukseen parhaiten sopivalle agentille käyttäen parasta mahdollista OpenAI-mallia:

  • GPT‑5 hyödyntää multimodaalista päättelyä tekstissä, kuvissa ja käyttöliittymässä tuodakseen piilevät riskit esiin ja tukeakseen monitasoista ja täsmällistä päätöksentekoa
  • GPT‑4.1 noudattaa luotettavasti yksityiskohtaisia sisältökäytäntöohjeita ja hallinnoi tehokkaasti suuren volyymin moderointityönkulkuja
  • Vahvistusoppimiseen perustuva hienosäätö (RFT) parantaa muistamista ja tarkkuutta oletusmalleja paremmin ja saavuttaa huipputason suorituskyvyn monimutkaisten turvallisuuskäytäntöjen kanssa.
  • Syvätutkimus yhdistää reaaliaikaisen verkkotutkimuksen kauppiaiden arviointeihin ja varmennuksiin
  • Tietokonetta käyttävä agentti (CUA) automatisoi monimutkaisia käytäntötehtäviä, mikä vähentää riippuvuutta kalliista manuaalisista tarkistuksista.

Tämä mallien yhteensovittamiseen perustuva lähestymistapa mahdollistaa SafetyKitin sisällöntarkistuksen skaalaamisen eri modaliteetteihin tarkemmin ja vivahteikkaammin kuin perinteiset ratkaisut.

Esimerkiksi huijausten tunnistamiseen tarkoitettu agentti tekee muutakin kuin pelkästään skannaa tekstiä. Se analysoi tuotekuvissa olevia visuaalisia elementtejä, kuten QR-koodeja tai puhelinnumeroita. GPT‑4.1 auttaa sitä jäsentämään kuvan, ymmärtämään asettelun ja päättelemään, onko kyseessä käytäntöjen rikkominen.

Policy Disclosure -agentti tarkistaa listaukset tai aloitussivut vaaditun kielen, kuten lakisääteiset vastuuvapauslausekkeet tai aluekohtaiset vaatimustenmukaisuusvaroitukset, osalta. GPT‑4.1 poimii olennaiset osiot, GPT‑5 arvioi vaatimustenmukaisuutta ja agentti merkitsee rikkomukset.

”Ajattelemme agenttejamme tiettyyn tarkoitukseen suunniteltuina työnkulkuina”, Graunke sanoo. ”Jotkin tehtävät vaativat syvällistä päättelyä, toiset taas multimodaalista kontekstia.” OpenAI on ainoa kokonaisuus, joka tarjoaa luotettavaa suorituskykyä molemmissa."

Vaalealla taustalla oleva viiva- ja pylväsdiagrammi, jossa on merkintä ”SafetyKit” ja joka esittää datan suuntauksia ja vertailuja useissa luokissa.

Hyödynnä GPT‑5:tä navigoidaksesi epäselvillä alueilla ja tärkeissä päätöksissä

Käytäntöjä koskevat päätökset riippuvat usein hienovaraisista eroista. Ajatellaan markkinapaikkaa, joka edellyttää myyjien sisällyttävän hyvinvointituotteisiin vastuuvapauslausekkeen ja jossa vaatimukset vaihtelevat tuotetta koskevien väitteiden ja alueellisten sääntöjen mukaan. Perinteiset palveluntarjoajat käyttävät avainsanakäynnistimiä tai jäykkiä sääntökokonaisuuksia, jotka voivat jättää huomiotta näiden päätösten edellyttämän syvällisemmän harkinnan ja johtaa puutteelliseen tai virheelliseen valvontaan.

SafetyKitin Policy Disclosure -agentti viittaa ensin SafetyKitin sisäisen kirjaston käytäntöihin, minkä jälkeen GPT‑5 arvioi sisällön: mainitaanko siinä hoito tai ennaltaehkäisy? Myydäänkö sitä alueella, jossa ilmoittaminen on pakollista? Ja jos näin on, onko vaadittu kieli todella mainittu ilmoituksessa? Jos jokin asia ei täytä vaatimuksia, GPT‑5 palauttaa strukturoidun tuotoksen, jota agentti käyttää ongelman merkitsemiseen.

”GPT‑5:n voima on siinä, kuinka tarkasti se pystyy päättelemään todellisiin toimintalinjoihin perustuen”, Graunke toteaa. ”Sen avulla voimme tehdä tarkkoja ja perusteltuja päätöksiä jopa niissä ääritapauksissa, joissa muut järjestelmät epäonnistuvat.”

Tee jokaisesta mallin julkaisusta tuotemenestys

SafetyKit vertaa jokaista uutta OpenAI-mallia vaikeimpaan tapaukseen ja ottaa parhaiten suoriutuvat mallit käyttöön jo samana päivänä. Tiukat sisäiset arvioinnit auttavat tiimiä tunnistamaan nopeasti, miten uudet mallit voivat parantaa suorituskykyä ja integroitua saumattomasti niiden ydininfrastruktuuriin.

Kun OpenAI o3 lanseerattiin, SafetyKit hyödynsi sitä parantaakseen järjestelmän suorituskykyä harvinaisissa tilanteissa keskeisillä sääntelyalueilla. Seuraavaksi GPT‑5 otettiin käyttöön muutamassa päivässä vaativimmissa agenteissa, mikä paransi vertailutuloksia yli 10 pisteellä vaikeimmissa visuaalisen havainnon tehtävissä.

“OpenAI kehittyy vauhdilla, ja olemme suunnitelleet järjestelmämme pysymään kehityksen mukana. Jokainen uusi julkaisu tuo meille operatiivista etumatkaa – avaa uusia valmiuksia ja toimialueita, joita emme aiemmin voineet tukea, ja parantaa asiakkaille tarjoamamme kattavuutta ja tarkkuutta.”
– David Graunke, SafetyKitin perustaja ja toimitusjohtaja

SafetyKit välittää parannuksia takaisin ekosysteemiin jakamalla arviointituloksia, reunatapausten virheitä ja käytäntökohtaisia havaintoja suoraan OpenAI:lle, jotta tulevien mallien suorituskykyä voidaan parantaa turvallisuuden kannalta kriittisissä käyttötehtävissä.

Laajenna asiakas- ja volyymikasvua parhaalla OpenAI-pinolla

SafetyKitin arkkitehtuuri valvoo käytäntöjen noudattamista laajassa mittakaavassa tarjoten nopeutta, tarkkuutta ja kattavan riskienhallinnan. Kulissien takana se käsittelee nyt päivittäin yli 16 miljardia tokenia, kun määrä oli vielä kuusi kuukautta sitten 200 miljoonaa, ja analysoi enemmän sisältöä tarkkuudesta tinkimättä.

Samalla ajanjaksolla SafetyKit on laajentunut maksuriskeihin, petoksiin, lasten hyväksikäytön torjuntaan, rahanpesun torjuntaan sekä uusiin asiakkaisiin, joiden satoja miljoonia loppukäyttäjiä SafetyKiti suojaa. Tämä perusta antaa asiakkaille valmiudet reagoida nopeasti ja luottavaisesti uusiin riskeihin.

”Olemme luoneet silmukan, jossa jokainen OpenAI:n julkaisu vahvistaa suoraan kyvykkyyksiämme”, sanoo Graunke. ”Siksi järjestelmä paranee jatkuvasti ja pysyy aina kehittyvien riskien edellä.”

Tulokset yhdellä silmäyksellä

  • 95 %+:n tarkkuus tarkastamalla 100 % asiakassisällöstä
  • 16 miljardia tokenia käsitellään päivittäin, kun määrä oli vielä kuusi kuukautta sitten 200 miljoonaa
  • Yli 10 pisteen parannukset vaikeimmissa visuaalisen havainnon tehtävissä

Liity työnteon uuteen aikakauteen

Yli miljoona yritystä ympäri maailmaa saavuttaa merkittäviä tuloksia OpenAI:n avulla.