Langsung ke konten utama
OpenAI

9 September 2025

SafetyKit meningkatkan agen risiko dengan model tercanggih OpenAI

Dari pembuatan prototipe dengan pratinjau awal model visi hingga peningkatan skala dengan GPT‑5, agen multimodal SafetyKit berekspansi ke domain baru dan meningkatkan akurasi.

Logo SafetyKit putih di tengah pada latar belakang gelap bertekstur vertikal dengan gradasi hangat cahaya oranye, kuning, dan hijau toska.
Ukuran perusahaan: Startup
Wilayah: Amerika Utara
Industri: Teknologi, Layanan
Produk: API

Hasil

95%+

Akurasi peninjauan 100% konten pelanggan (evaluasi SafetyKit)

Hasil

16B

Token diproses setiap hari, meningkat dari 200 juta enam bulan yang lalu

Hasil

10+

Raih peningkatan performa pada tugas-tugas visi tersulit dengan GPT-5

Memuat…

SafetyKit(terbuka di jendela baru) membangun agen AI multimodal untuk membantu marketplace, platform pembayaran, dan perusahaan fintech mendeteksi dan menindak penipuan serta aktivitas terlarang di teks, gambar, transaksi keuangan, daftar produk, dan lainnya. Terobosan terbaru dalam penalaran model dan pemahaman multimodal kini membuat hal ini lebih efektif, menetapkan standar baru untuk operasi risiko, kepatuhan, dan keamanan.

Agen SafetyKit memanfaatkan GPT‑5, GPT‑4.1, riset mendalam, dan Agen Berbasis Komputer (CUA) untuk meninjau 100% konten pelanggan dengan akurasi lebih dari 95% berdasarkan evaluasi SafetyKit. Agen dapat membantu platform melindungi pengguna, mencegah penipuan, menghindari denda regulasi, dan menegakkan kebijakan yang kompleks yang mungkin terlewat oleh sistem lama, seperti aturan khusus wilayah, nomor telepon yang dicantumkan dalam gambar penipuan, atau konten eksplisit. Otomatisasi juga dapat melindungi moderator manusia dari paparan materi menyinggung dan membebaskan mereka untuk menangani keputusan kebijakan yang bernuansa.

“OpenAI memberi kami akses ke model penalaran dan multimodal tercanggih di pasar. Hal ini memungkinkan kami untuk beradaptasi dengan cepat, merilis agen baru lebih cepat, dan menangani jenis konten yang bahkan tidak dapat diurai oleh solusi lain.”
David Graunke, Founder dan CEO SafetyKit

Rancang agen sesuai dengan tuntutan tugas, lalu pilih model yang tepat

Agen SafetyKit masing-masing dirancang untuk menangani kategori risiko tertentu, mulai dari penipuan hingga produk ilegal. Setiap konten diarahkan ke agen yang paling sesuai untuk pelanggaran tersebut, menggunakan model OpenAI yang optimal:

  • GPT‑5 menerapkan penalaran multimodal pada teks, gambar, dan antarmuka untuk mengungkap risiko tersembunyi serta mendukung pengambilan keputusan yang berlapis dan presisi
  • GPT‑4.1 secara andal mengikuti instruksi kebijakan konten yang terperinci dan secara efisien mengelola alur kerja moderasi bervolume tinggi
  • Reinforcement fine-tuning (RFT) meningkatkan daya ingat dan presisi melampaui model default, mencapai kinerja terdepan dengan kebijakan keamanan yang kompleks.
  • Riset mendalam mengintegrasikan investigasi daring secara real time ke dalam ulasan dan verifikasi penjual
  • Agen Berbasis Komputer (CUA) mengotomatisasi tugas kebijakan operasional yang kompleks, mengurangi ketergantungan pada peninjauan manual yang mahal

Pendekatan pencocokan model ini memungkinkan SafetyKit meningkatkan skala peninjauan konten di berbagai modalitas dengan nuansa dan keakuratan yang lebih baik daripada yang dapat dicapai solusi lama.

Agen Deteksi Scam, misalnya, lebih dari sekadar memindai teks. Menganalisis elemen visual seperti kode QR atau nomor telepon yang dicantumkan dalam gambar produk. GPT‑4.1 membantunya mengurai gambar, memahami tata letaknya, dan memutuskan apakah itu merupakan pelanggaran kebijakan.

Agen Pengungkapan Kebijakan memeriksa daftar atau halaman arahan untuk bahasa yang diwajibkan, seperti penafian hukum atau peringatan kepatuhan khusus wilayah. GPT‑4.1 mengekstrak bagian yang relevan, GPT‑5 mengevaluasi kepatuhan, dan agen menandai pelanggaran.

“Kami menganggap agen kami sebagai alur kerja yang dirancang khusus,” kata Graunke. “Beberapa tugas memerlukan penalaran mendalam, sementara yang lain membutuhkan konteks multimodal. OpenAI adalah satu-satunya ekosistem yang memberikan kinerja andal pada keduanya.”

Diagram garis dan batang berlabel “SafetyKit” pada latar belakang terang, yang menampilkan tren data dan perbandingan di berbagai kategori.

Manfaatkan GPT‑5 untuk menavigasi area abu-abu dan keputusan berisiko tinggi

Keputusan kebijakan sering bergantung pada perbedaan yang sangat kecil. Ambil contoh marketplace yang mewajibkan penjual untuk menyertakan disclaimer pada produk kesehatan, dengan persyaratan yang bervariasi berdasarkan klaim produk dan aturan regional. Penyedia lama menggunakan pemicu kata kunci atau seperangkat aturan yang kaku, yang dapat melewatkan pertimbangan yang lebih mendalam yang mungkin diperlukan oleh keputusan-keputusan ini, sehingga menyebabkan penegakan terlewat atau keliru.

Agen Pengungkapan Kebijakan SafetyKit pertama-tama merujuk pada kebijakan dari pustaka internal SafetyKit, kemudian GPT‑5 mengevaluasi konten tersebut: apakah konten tersebut menyebutkan pengobatan atau pencegahan? Apakah produk ini dijual di wilayah yang mewajibkan pengungkapan? Dan jika demikian, apakah bahasa yang diwajibkan benar-benar tercantum dalam daftar? Jika ada yang kurang memadai, GPT‑5 akan mengembalikan output terstruktur yang digunakan oleh agen untuk menandai masalah tersebut.

“Kekuatan GPT‑5 terletak pada seberapa presisi GPT‑5 dapat bernalar ketika didasarkan pada kebijakan nyata,” catat Graunke. “Ini memungkinkan kami membuat keputusan yang akurat dan dapat dipertanggungjawabkan bahkan dalam kasus tepi ketika sistem lain gagal.”

Ubah setiap rilis model menjadi kemenangan produk

SafetyKit menguji setiap model OpenAI baru terhadap kasus-kasus tersulitnya, dan sering kali menerapkan model yang berkinerja terbaik pada hari yang sama. Evaluasi internal yang ketat memungkinkan tim untuk dengan cepat mengidentifikasi bagaimana model-model baru dapat meningkatkan kinerja dan terintegrasi secara lancar ke dalam infrastruktur inti mereka.

Saat OpenAI o3 diluncurkan, SafetyKit menggunakannya untuk meningkatkan performa pada kasus-kasus tepi di berbagai area kebijakan utama. GPT‑5 menyusul, dan dalam hitungan hari, model ini diterapkan di seluruh agen mereka yang paling banyak permintaan, meningkatkan skor tolok ukur lebih dari 10 poin pada tugas visi mereka yang paling sulit.

“OpenAI bergerak cepat, dan kami telah merancang sistem kami agar dapat mengimbanginya. Setiap rilis baru memberi kami keunggulan operasional—menghadirkan kemampuan dan domain baru yang sebelumnya tidak dapat kami dukung, serta meningkatkan cakupan dan akurasi yang kami berikan kepada pelanggan.”
—David Graunke, Pendiri dan CEO SafetyKit

SafetyKit juga memberikan peningkatan kembali ke ekosistem, dengan membagikan hasil evaluasi, kegagalan pada kasus tepi, dan wawasan spesifik kebijakan secara langsung kepada OpenAI untuk membantu meningkatkan kinerja model di masa depan untuk beban kerja yang sangat penting bagi keamanan.

Tingkatkan skala pertumbuhan pelanggan dan volume dengan ekosistem OpenAI terbaik

Arsitektur SafetyKit menegakkan kebijakan dalam skala besar, menghadirkan kecepatan, presisi, dan cakupan risiko yang menyeluruh. Di balik layar, kini sistem ini menangani lebih dari 16 miliar token per hari, naik dari 200 juta enam bulan lalu, menganalisis lebih banyak konten tanpa mengorbankan akurasi.

Pada kurun waktu yang sama, SafetyKit telah memperluas jangkauannya ke bidang risiko pembayaran, penipuan, pencegahan eksploitasi anak, pencegahan pencucian uang, serta menjangkau pelanggan baru dengan ratusan juta pengguna akhir yang berada di bawah perlindungan SafetyKit. Fondasi ini memberdayakan para pelanggan untuk merespons risiko-risiko yang muncul secara sigap dan penuh keyakinan.

“Kami telah menciptakan sebuah siklus di mana setiap perilisan OpenAI secara langsung memperkuat kapabilitas kami,” kata Graunke. “Itulah sebabnya sistem ini terus berkembang, selalu selangkah lebih maju dalam menghadapi risiko yang terus berubah.”

Ringkasan hasil

  • Akurasi lebih dari 95% dalam meninjau 100% konten pelanggan
  • 16 miliar token diproses setiap hari, naik dari 200 juta dalam enam bulan
  • Peningkatan lebih dari 10 poin pada tolok ukur untuk tugas visual tersulit

Bergabung dengan era baru dunia kerja

Lebih dari 1 juta bisnis di seluruh dunia mencapai hasil yang bermakna dengan OpenAI.