9 settembre 2025

SafetyKit scala gli agenti di rischio con i modelli OpenAI

Dalla prototipazione con le prime anteprime dei modelli di visione alla scalabilità con GPT‑5, gli agenti multimodali di SafetyKit si espandono in nuovi ambiti e aumentano l’accuratezza.

Contatta il Team vendite

Dimensioni azienda: Startup

Regione: America del Nord

Settore: Tecnologia, Servizi

Prodotti: API

Risultati

95%+

Accuratezza nella revisione del 100% dei contenuti dei clienti (valutazioni SafetyKit)

Risultati

16B

Token elaborati ogni giorno, rispetto ai 200 milioni di sei mesi fa

Risultati

10+

Miglioramenti di performance nelle attività di visione più complesse con GPT-5

Caricamento in corso...

SafetyKit⁠(si apre in una nuova finestra) sviluppa agenti IA multimodali per aiutare marketplace, piattaforme di pagamento e fintech a rilevare e intervenire su frodi e attività vietate in testi, immagini, transazioni finanziarie, schede prodotto e altro. I recenti progressi nel ragionamento e nella comprensione multimodale rendono tutto questo più efficace, fissando un nuovo standard per rischio, conformità e sicurezza.

Gli agenti di SafetyKit sfruttano GPT‑5, GPT‑4.1, deep research e Computer Using Agent (CUA) per esaminare il 100% dei contenuti con oltre il 95% di accuratezza secondo le loro valutazioni. Aiutano le piattaforme a proteggere gli utenti, prevenire le frodi, evitare sanzioni e applicare policy complesse che i sistemi legacy non intercettano, come regole locali, numeri di telefono nascosti nelle immagini o contenuti espliciti. L’automazione protegge anche i moderatori dall’esposizione a contenuti offensivi e li libera per decisioni più complesse.

“OpenAI ci dà accesso ai modelli di ragionamento e multimodali più avanzati sul mercato.” “Ci consente di adattarci rapidamente, distribuire nuovi agenti più velocemente e gestire contenuti che altre soluzioni non riescono nemmeno ad analizzare.”

David Graunke, fondatore e CEO di SafetyKit

Progetta agenti in base al compito, poi scegli il modello giusto

Gli agenti di SafetyKit sono progettati per specifiche categorie di rischio, dalle truffe ai prodotti illegali. Ogni contenuto viene instradato all’agente più adatto, usando il modello OpenAI ottimale:

GPT‑5 applica ragionamento multimodale su testo, immagini e UI per individuare rischi nascosti e supportare decisioni precise e stratificate
GPT‑4.1 segue istruzioni di policy dettagliate e gestisce in modo efficiente flussi di moderazione ad alto volume
Il fine-tuning con apprendimento per rinforzo (RFT) aumenta richiamo e precisione oltre i modelli base, raggiungendo prestazioni di frontiera con policy complesse
Deep Research integra indagini online in tempo reale su recensioni e verifiche dei merchant
Computer Using Agent (CUA), o Agente IA informatico, automatizza attività di policy complesse, riducendo le revisioni manuali

Questo approccio consente a SafetyKit di scalare la revisione dei contenuti su tutte le modalità con maggiore precisione e profondità rispetto ai sistemi legacy.

L’agente Scam Detection, ad esempio, va oltre la semplice analisi del testo. Analizza elementi visivi come codici QR o numeri di telefono nelle immagini dei prodotti. GPT‑4.1 lo aiuta a interpretare l’immagine, comprenderne la struttura e stabilire se viola le policy.

L’agente Policy Disclosure verifica schede e landing page per la presenza del linguaggio richiesto, come disclaimer legali o avvisi di conformità locali. GPT‑4.1 estrae le sezioni rilevanti, GPT‑5 valuta la conformità e l’agente segnala eventuali violazioni.

“Consideriamo i nostri agenti come workflow progettati su misura”, afferma Graunke. “Alcune attività richiedono ragionamento profondo, altre contesto multimodale.” “OpenAI è l’unico stack che offre prestazioni affidabili in entrambi i casi.”

Grafico a linee e barre “SafetyKit” su sfondo chiaro, con tendenze e confronti tra categorie.

Sfrutta GPT‑5 per gestire le zone grigie e le decisioni critiche

Le decisioni di policy dipendono spesso da distinzioni sottili. Ad esempio, un marketplace può richiedere disclaimer per prodotti wellness, con requisiti che variano per claim e normativa locale. I sistemi legacy si basano su keyword o regole rigide e non colgono le valutazioni più complesse, con enforcement incompleto o errato.

L’agente Policy Disclosure consulta prima la libreria interna, poi GPT‑5 valuta: si parla di trattamento o prevenzione? Il prodotto è venduto in una regione dove il disclaimer è obbligatorio? E in tal caso, la lingua richiesta è effettivamente inclusa nell’elenco? Se qualcosa non torna, GPT‑5 restituisce un output strutturato che l’agente usa per segnalare il problema.

“La forza di GPT‑5 sta nella precisione del ragionamento quando è ancorato a policy reali”, osserva Graunke. “Ci permette di prendere decisioni accurate e difendibili anche nei casi limite.”

Trasforma ogni release di modello in un vantaggio di prodotto

SafetyKit testa ogni nuovo modello sui casi più complessi, spesso distribuendo i migliori nello stesso giorno. Valutazioni interne rigorose permettono di individuare rapidamente i miglioramenti e integrarli nell’infrastruttura.

Al lancio di OpenAI o3, SafetyKit lo ha usato per migliorare i casi limite nelle policy chiave. Con GPT‑5, in pochi giorni è stato distribuito sugli agenti più esigenti, migliorando i benchmark di oltre 10 punti nelle attività di visione più complesse.

“OpenAI si muove rapidamente e abbiamo progettato il nostro sistema per stare al passo. Ogni nuova release ci offre un vantaggio operativo, sbloccando nuove funzionalità e nuovi ambiti che prima non potevamo supportare e aumentando la copertura e l'accuratezza che offriamo ai clienti.”

—David Graunke, fondatore e CEO di SafetyKit

SafetyKit contribuisce anche all’ecosistema condividendo risultati, errori nei casi limite e insight sulle policy per migliorare i modelli OpenAI.

Scala clienti e volumi con il miglior stack OpenAI

L’architettura di SafetyKit applica le policy su larga scala, garantendo velocità, precisione e copertura completa dei rischi. Oggi gestisce oltre 16 miliardi di token al giorno (contro 200 milioni sei mesi fa), analizzando più contenuti senza perdere accuratezza.

Nello stesso periodo si è espanso a rischio pagamenti, frodi, contrasto allo sfruttamento minorile, antiriciclaggio e nuovi clienti con centinaia di milioni di utenti. Questa base consente ai clienti di reagire rapidamente e con sicurezza ai rischi emergenti.

“Abbiamo creato un ciclo in cui ogni release OpenAI rafforza le nostre capacità”, afferma Graunke. “Per questo il sistema migliora continuamente e resta avanti rispetto ai rischi.”

Uno sguardo ai risultati

Oltre il 95% di accuratezza nella revisione del 100% dei contenuti
16 miliardi di token elaborati al giorno, rispetto ai 200 milioni di sei mesi fa
Oltre 10 punti di miglioramento nei benchmark sulle attività di visione più complesse

Entra nella nuova era del lavoro

Più di 1.000.000 di aziende in tutto il mondo stanno ottenendo risultati significativi con OpenAI.

Contatta il Team vendite

Continua a leggere

$math-breakthroughs art-card 1x1$

Ten advances in mathematics and theoretical computer science

Pubblicazione1 ago 2026

Advancing responsible AI across Europe — card

Promuovere un’IA responsabile in tutta Europa

Affari globali31 lug 2026

Building abundant intelligence

Azienda31 lug 2026