SafetyKit scala gli agenti di rischio con i modelli OpenAI
Dalla prototipazione con le prime anteprime dei modelli di visione alla scalabilità con GPT‑5, gli agenti multimodali di SafetyKit si espandono in nuovi ambiti e aumentano l’accuratezza.

Risultati
95%+
Accuratezza nella revisione del 100% dei contenuti dei clienti (valutazioni SafetyKit)
Risultati
16B
Token elaborati ogni giorno, rispetto ai 200 milioni di sei mesi fa
Risultati
10+
Miglioramenti di performance nelle attività di visione più complesse con GPT-5
SafetyKit(si apre in una nuova finestra) sviluppa agenti IA multimodali per aiutare marketplace, piattaforme di pagamento e fintech a rilevare e intervenire su frodi e attività vietate in testi, immagini, transazioni finanziarie, schede prodotto e altro. I recenti progressi nel ragionamento e nella comprensione multimodale rendono tutto questo più efficace, fissando un nuovo standard per rischio, conformità e sicurezza.
Gli agenti di SafetyKit sfruttano GPT‑5, GPT‑4.1, deep research e Computer Using Agent (CUA) per esaminare il 100% dei contenuti con oltre il 95% di accuratezza secondo le loro valutazioni. Aiutano le piattaforme a proteggere gli utenti, prevenire le frodi, evitare sanzioni e applicare policy complesse che i sistemi legacy non intercettano, come regole locali, numeri di telefono nascosti nelle immagini o contenuti espliciti. L’automazione protegge anche i moderatori dall’esposizione a contenuti offensivi e li libera per decisioni più complesse.
“OpenAI ci dà accesso ai modelli di ragionamento e multimodali più avanzati sul mercato.” “Ci consente di adattarci rapidamente, distribuire nuovi agenti più velocemente e gestire contenuti che altre soluzioni non riescono nemmeno ad analizzare.”
Progetta agenti in base al compito, poi scegli il modello giusto
Gli agenti di SafetyKit sono progettati per specifiche categorie di rischio, dalle truffe ai prodotti illegali. Ogni contenuto viene instradato all’agente più adatto, usando il modello OpenAI ottimale:
- GPT‑5 applica ragionamento multimodale su testo, immagini e UI per individuare rischi nascosti e supportare decisioni precise e stratificate
- GPT‑4.1 segue istruzioni di policy dettagliate e gestisce in modo efficiente flussi di moderazione ad alto volume
- Il fine-tuning con apprendimento per rinforzo (RFT) aumenta richiamo e precisione oltre i modelli base, raggiungendo prestazioni di frontiera con policy complesse
- Deep Research integra indagini online in tempo reale su recensioni e verifiche dei merchant
- Computer Using Agent (CUA), o Agente IA informatico, automatizza attività di policy complesse, riducendo le revisioni manuali
Questo approccio consente a SafetyKit di scalare la revisione dei contenuti su tutte le modalità con maggiore precisione e profondità rispetto ai sistemi legacy.
L’agente Scam Detection, ad esempio, va oltre la semplice analisi del testo. Analizza elementi visivi come codici QR o numeri di telefono nelle immagini dei prodotti. GPT‑4.1 lo aiuta a interpretare l’immagine, comprenderne la struttura e stabilire se viola le policy.
L’agente Policy Disclosure verifica schede e landing page per la presenza del linguaggio richiesto, come disclaimer legali o avvisi di conformità locali. GPT‑4.1 estrae le sezioni rilevanti, GPT‑5 valuta la conformità e l’agente segnala eventuali violazioni.
“Consideriamo i nostri agenti come workflow progettati su misura”, afferma Graunke. “Alcune attività richiedono ragionamento profondo, altre contesto multimodale.” “OpenAI è l’unico stack che offre prestazioni affidabili in entrambi i casi.”
Sfrutta GPT‑5 per gestire le zone grigie e le decisioni critiche
Le decisioni di policy dipendono spesso da distinzioni sottili. Ad esempio, un marketplace può richiedere disclaimer per prodotti wellness, con requisiti che variano per claim e normativa locale. I sistemi legacy si basano su keyword o regole rigide e non colgono le valutazioni più complesse, con enforcement incompleto o errato.
L’agente Policy Disclosure consulta prima la libreria interna, poi GPT‑5 valuta: si parla di trattamento o prevenzione? Il prodotto è venduto in una regione dove il disclaimer è obbligatorio? E in tal caso, la lingua richiesta è effettivamente inclusa nell’elenco? Se qualcosa non torna, GPT‑5 restituisce un output strutturato che l’agente usa per segnalare il problema.
“La forza di GPT‑5 sta nella precisione del ragionamento quando è ancorato a policy reali”, osserva Graunke. “Ci permette di prendere decisioni accurate e difendibili anche nei casi limite.”
Trasforma ogni release di modello in un vantaggio di prodotto
SafetyKit testa ogni nuovo modello sui casi più complessi, spesso distribuendo i migliori nello stesso giorno. Valutazioni interne rigorose permettono di individuare rapidamente i miglioramenti e integrarli nell’infrastruttura.
Al lancio di OpenAI o3, SafetyKit lo ha usato per migliorare i casi limite nelle policy chiave. Con GPT‑5, in pochi giorni è stato distribuito sugli agenti più esigenti, migliorando i benchmark di oltre 10 punti nelle attività di visione più complesse.
“OpenAI si muove rapidamente e abbiamo progettato il nostro sistema per stare al passo. Ogni nuova release ci offre un vantaggio operativo, sbloccando nuove funzionalità e nuovi ambiti che prima non potevamo supportare e aumentando la copertura e l'accuratezza che offriamo ai clienti.”
SafetyKit contribuisce anche all’ecosistema condividendo risultati, errori nei casi limite e insight sulle policy per migliorare i modelli OpenAI.
Scala clienti e volumi con il miglior stack OpenAI
L’architettura di SafetyKit applica le policy su larga scala, garantendo velocità, precisione e copertura completa dei rischi. Oggi gestisce oltre 16 miliardi di token al giorno (contro 200 milioni sei mesi fa), analizzando più contenuti senza perdere accuratezza.
Nello stesso periodo si è espanso a rischio pagamenti, frodi, contrasto allo sfruttamento minorile, antiriciclaggio e nuovi clienti con centinaia di milioni di utenti. Questa base consente ai clienti di reagire rapidamente e con sicurezza ai rischi emergenti.
“Abbiamo creato un ciclo in cui ogni release OpenAI rafforza le nostre capacità”, afferma Graunke. “Per questo il sistema migliora continuamente e resta avanti rispetto ai rischi.”
Uno sguardo ai risultati
- Oltre il 95% di accuratezza nella revisione del 100% dei contenuti
- 16 miliardi di token elaborati al giorno, rispetto ai 200 milioni di sei mesi fa
- Oltre 10 punti di miglioramento nei benchmark sulle attività di visione più complesse


