Ana içeriğe atla
OpenAI

9 Eylül 2025

SafetyKit en güçlü OpenAI modelleriyle risk ajanlarını ölçekliyor

İlk görsel model önizlemeleriyle yapılan prototiplemeden, GPT‑5 ile büyümeyi sistemli biçimde yönetmeye kadar SafetyKit'in çok modlu ajanları, yeni alanlara açılıyor ve doğruluk düzeyini artırıyor.

Turuncu, sarı ve deniz mavisi ışıkların sıcak bir geçişiyle birlikte koyu, dikey dokulu bir arka plan üzerinde ortalanmış beyaz SafetyKit logosu.
Şirket büyüklüğü: Startup
Bölge: Kuzey Amerika
Sektör: Teknoloji, Hizmetler
Ürünler: API

Sonuçlar

95%+

Doğruluk oranı (müşteri içeriğinin yüzde 100'ü incelenirken elde edilen) (SafetyKit değerlendirmeleri)

Sonuçlar

16B

Token işlendi (günlük olarak). Bu sayı altı ay önce 200 milyondu.

Sonuçlar

10+

Puan bazında performans artışı (GPT-5 ile en zorlu görsel görevlerde)

Yükleniyor...

SafetyKit(yeni bir pencerede açılır), pazar yerlerinin, ödeme platformlarının ve finansal teknoloji şirketlerinin; metin, görseller, finansal işlemler, ürün listeleri ve daha birçok alanda dolandırıcılığı ve yasaklı faaliyetleri tespit edip bunlara müdahale etmesine yardımcı olan çok modlu yapay zeka ajanları geliştiriyor. Model akıl yürütmesi ve çok modlu anlama alanındaki son atılımlar, bu yetkinlikleri artık çok daha etkili hale getiriyor ve risk, uyumluluk ile güvenlik operasyonları için yeni bir standart oluşturuyor.

SafetyKit'in ajanları, müşteri içeriğinin %100'ünü incelemek için GPT‑5, GPT‑4.1, derin araştırma ve Bilgisayar Kullanma Ajanından (CUA) yararlanıyor. SafetyKit'in değerlendirmelerine göre doğruluk oranı yüzde 95'in üzerine çıkıyor. Bu ajanlar, platformların kullanıcılarını korumasına, dolandırıcılığı önlemesine, yasal para cezalarından kaçınmasına ve eski sistemlerin gözden kaçırabileceği karmaşık politikaları uygulamasına yardımcı oluyor. Buna, bölgeye özgü kurallar, dolandırıcılık görsellerine gömülü telefon numaraları veya müstehcen içerikler gibi örnekler de dahil. Otomasyon aynı zamanda insan moderatörlerin rahatsız edici materyallere maruz kalmasını azaltabiliyor ve daha incelikli politika kararlarına odaklanmalarını mümkün kılıyor.

"OpenAI, bize piyasadaki en gelişmiş akıl yürütme ve çok modlu modellere erişim sunuyor. Bu sayede hızla uyum sağlayabiliyor, yeni ajanları daha hızlı devreye alabiliyor ve diğer çözümlerin işleyemediği içerik türlerini analiz edebiliyoruz."
David Graunke, SafetyKit'in Kurucusu ve CEO'su

Önce görevin gerektirdiği ajanları tasarlayın, ardından doğru modeli seçin

SafetyKit'in ajanlarının her biri, dolandırıcılıktan yasa dışı ürünlere kadar belirli bir risk kategorisini ele almak üzere tasarlanmıştır. Her içerik parçası, ilgili ihlale en uygun ajana yönlendirilir ve bu süreçte en uygun OpenAI modeli kullanılır.

  • GPT‑5; metin, görsel ve kullanıcı arayüzü genelinde çok modlu akıl yürütme uygulayarak gizli riskleri ortaya çıkarır ve katmanlı, hassas karar almayı destekler.
  • GPT‑4.1, ayrıntılı içerik politikası talimatlarını güvenilir şekilde izler ve yüksek hacimli moderasyon iş akışlarını verimli şekilde yönetir.
  • Pekiştirmeli öğrenmeye dayalı ince ayar (RFT), varsayılan modellere kıyasla duyarlılığı ve kesinliği artırarak karmaşık güvenlik politikalarında en üst seviye performans sağlar.
  • Derin araştırma ise satıcı incelemeleri ve doğrulama süreçlerine gerçek zamanlı online araştırmayı entegre eder.
  • Bilgisayar Kullanma Ajanı (CUA), karmaşık politika görevlerini otomatikleştirip maliyetli manuel incelemelere duyulan ihtiyacı azaltır.

Bu model eşleştirme yaklaşımı, SafetyKit'in içerik incelemesini farklı veri türleri genelinde, geleneksel çözümlerin sunabildiğinden daha yüksek doğruluk ve daha fazla nüansla ölçeklendirmesini sağlar.

Örneğin, Dolandırıcılık Tespit ajanı yalnızca metni taramakla yetinmez; ürün görsellerine gömülü QR kodları veya telefon numaraları gibi görsel unsurları da analiz eder. GPT‑4.1, görselin ayrıştırılmasına, yerleşimin anlaşılmasına ve bunun bir politika ihlali olup olmadığının değerlendirilmesine yardımcı olur.

Politika Açıklaması ajanı ise feragatname veya bölgeye özgü uyumluluk uyarıları gibi listelerde ya da açılış sayfalarında zorunlu ifadelerin yer alıp almadığını kontrol eder. GPT‑4.1 ilgili bölümleri ayıklar, GPT‑5 uyumluluğu değerlendirir ve ajan da ihlalleri tespit eder.

Graunke şunları söylüyor: "Ajanlarımızı, belirli amaçlara hizmet edecek şekilde tasarlanmış iş akışları olarak görüyoruz. Bazı görevler derin akıl yürütme gerektirirken, bazılarıysa çok modlu bağlamı anlamayı gerektiriyor. OpenAI, her ikisinde de güvenilir performans sunan tek sistem katmanıdır."

Açık renkli bir arka plan üzerinde yer alan "SafetyKit" etiketli çizgi ve çubuk grafik; birden fazla kategori genelindeki veri eğilimlerini ve karşılaştırmaları göstermektedir.

Gri alanları ve yüksek riskli kararları değerlendirmek için GPT‑5'ten yararlanın

Politika kararları çoğu zaman ince ayrımlara dayanır. Örneğin, satıcıların wellness ürünleri için bir feragatname eklemesini zorunlu kılan bir pazar yerini düşünün. Bu tür gereklilikler, ürün iddialarına ve bölgesel kurallara göre değişiklik gösterebilir. Geleneksel sağlayıcılar, anahtar sözcük tetikleyicileri veya katı kural setleri kullanır. Ancak bu yöntemler, bu tür kararların gerektirdiği daha derin muhakemeyi çoğu zaman yakalayamaz. Bunun sonucunda bazı ihlaller gözden kaçabilir ya da yanlış yaptırımlar uygulanabilir.

SafetyKit'in Politika Açıklaması ajanı önce SafetyKit'in kurum içi kitaplığındaki politikaları referans alır, ardından GPT‑5 de içeriği şu açıdan değerlendirir: Tedavi veya önleme iddiası içeriyor mu? Açıklamanın zorunlu olduğu bir bölgede mi satılıyor? Öyleyse, listede zorunlu ifade yer alıyor mu? Bir şey eksik ya da yetersiz kaldığında GPT‑5, ajanın sorunu tespit etmek için kullandığı yapılandırılmış bir çıktı üretir.

Graunke, "GPT‑5'in gücü, gerçek politikalara dayandırıldığında ne kadar hassas akıl yürütebildiğinde yatıyor. Bu sayede, diğer sistemlerin yetersiz kaldığı uç durumlarda bile doğru ve savunulabilir kararlar alabiliyoruz," diyor.

Her model sürümünü ürün için bir kazanıma dönüştürün

SafetyKit, her yeni OpenAI modelini en zorlu vakalarına karşı karşılaştırmalı olarak test eder ve en iyi performans gösterenleri çoğu zaman aynı gün devreye alır. Titiz kurum içi değerlendirmeler, ekibin yeni modellerin performansı nasıl artırabileceğini hızla belirlemesine ve bunları temel altyapısına sorunsuz biçimde entegre etmesine olanak tanır.

OpenAI o3 kullanıma sunulduğunda SafetyKit bunu temel politika alanlarında uç durum performansını artırmak için kullandı. Ardından GPT‑5 geldi ve birkaç gün içinde en zorlu ajanlarda devreye alındı; en zorlu görsel görevlerde kıyaslama puanlarını 10 puanın üzerinde artırdı.

"OpenAI hızla ilerliyor ve biz de sistemimizi bu tempoya ayak uydurabilecek şekilde tasarladık. Her yeni sürüm, bize operasyonel avantaj sağlıyor; daha önce destekleyemediğimiz yeni yetkinliklerin ve kullanım alanlarının önünü açarken, müşterilere sunduğumuz kapsamı ve doğruluğu artırıyor."
- David Graunke, SafetyKit'in Kurucusu ve CEO'su

SafetyKit ayrıca elde ettiği iyileştirmeleri yeniden ekosisteme kazandırır; değerlendirme sonuçlarını, uç durum hatalarını ve politikaya özgü çıkarımları, güvenlik açısından kritik iş yüklerinde gelecekteki model performansını geliştirmeye katkı sağlamak amacıyla doğrudan OpenAI ile paylaşır.

En gelişmiş OpenAI altyapısıyla müşteri ve hacim artışını yönetin

SafetyKit'in mimarisi, politikaların büyük ölçekte uygulanmasını mümkün kılarken hız, kesinlik ve risklerin kapsamlı şekilde ele alınmasına olanak sağlar. Arka planda sistem artık günde 16 milyarın üzerinde token işliyor; altı ay önce bu rakam yalnızca 200 milyondu. Üstelik bunu, doğruluktan ödün vermeden daha fazla içeriği analiz ederek başarıyor.

Aynı dönemde SafetyKit; ödeme riski, dolandırıcılık, çocukların istismarını önleme, kara para aklamayla mücadele ve yeni müşteri segmentleri gibi alanlara genişledi. Bugün yüz milyonlarca son kullanıcı, SafetyKit'in sağladığı korumadan yararlanıyor. Bu temel altyapı, müşterilerin ortaya çıkan risklere hızlı ve güvenli şekilde yanıt vermesini sağlar.

Graunke şunları söylüyor: "Her yeni OpenAI sürümüyle yetkinliklerimizi doğrudan güçlendiren bir yapı kurduk. Bu sayede sistem sürekli gelişiyor ve değişen risklere karşı hep bir adım önde kalıyor."

Sonuçlara genel bakış

  • Müşteri içeriğinin yüzde 100'ü incelenirken yüzde 95'in üzerinde doğruluk
  • Günde 16 milyar token işlenmesi (altı ay önce bu rakam 200 milyondu)
  • En zorlu görsel görevlerde kıyaslama puanlarında 10 puanın üzerinde artış

İş dünyasının yeni çağında yerinizi alın

Dünya genelinde 1 milyondan fazla işletme, OpenAI ile anlamlı sonuçlar elde ediyor.