OpenAI മോഡലുകളോടെ SafetyKit റിസ്ക് ഏജന്റുകൾ സ്കെയിൽ ചെയ്യുന്നു
ആദ്യകാല വിഷൻ മോഡൽ പ്രിവ്യൂകളിൽ നിന്ന് പ്രോട്ടോടൈപ്പിംഗ് മുതൽ GPT‑5 ഉപയോഗിച്ച് സ്കെയിലിംഗ് വരെ, SafetyKit-ന്റെ മൾട്ടി-മോഡൽ ഏജന്റുകൾ പുതിയ ഡൊമെയ്നുകളിലേക്ക് വ്യാപിക്കുകയും കൃത്യത വർധിപ്പിക്കുകയും ചെയ്യുന്നു.

ഫലങ്ങൾ
95%+
ഉപഭോക്തൃ ഉള്ളടക്കത്തിന്റെ 100% കൃത്യതയോടെ അവലോകനം ചെയ്യുന്നു (സേഫ്റ്റികിറ്റ് വിലയിരുത്തലുകൾ)
ഫലങ്ങൾ
16B
പ്രതിദിനം പ്രോസസ് ചെയ്യുന്ന ടോക്കൺ, ആറുമാസം മുമ്പുണ്ടായിരുന്ന 200M-ൽ നിന്ന് വർധിച്ചു
ഫലങ്ങൾ
10+
GPT-5 ഉപയോഗിച്ച് ഏറ്റവും പ്രയാസമുള്ള വിഷൻ ടാസ്കുകളിൽ പ്രകടന നേട്ടങ്ങൾ ഉണ്ടായിട്ടുണ്ട്
SafetyKit(പുതിയ വിൻഡോയിൽ തുറക്കുന്നു) ടെക്സ്റ്റ്, ചിത്രങ്ങൾ, സാമ്പത്തിക ഇടപാടുകൾ, ഉൽപ്പന്ന ലിസ്റ്റിംഗുകൾ എന്നിവയിലുടനീളം തട്ടിപ്പും നിരോധിത പ്രവർത്തനങ്ങളും കണ്ടെത്താനും അവയ്ക്കെതിരെ നടപടി സ്വീകരിക്കാനും മാർക്കറ്റ്പ്ലേസുകൾ, പേയ്മെന്റ് പ്ലാറ്റ്ഫോമുകൾ, ഫിൻടെക്കുകൾ എന്നിവയെ സഹായിക്കുന്ന മൾട്ടിമോഡൽ AI ഏജന്റുമാരെ നിർമ്മിക്കുന്നു. മോഡൽ റീസണിംഗിലും മൾട്ടിമോഡൽ മനസ്സിലാക്കലിലുമുള്ള സമീപകാല മുന്നേറ്റങ്ങൾ ഇപ്പോൾ ഇതിനെ കൂടുതൽ ഫലപ്രദമാക്കുന്നു, അതുവഴി റിസ്ക്, കംപ്ലയൻസ്, സുരക്ഷാ പ്രവർത്തനങ്ങൾക്കായി ഒരു പുതിയ മാനദണ്ഡം സ്ഥാപിക്കുന്നു.
SafetyKit-ന്റെ ഏജന്റുകൾ, SafetyKit-ന്റെ evals അടിസ്ഥാനമാക്കി 95%-ത്തിലധികം കൃത്യതയോടെ ഉപഭോക്താക്കളുടെ ഉള്ളടക്കത്തിന്റെ 100% അവലോകനം ചെയ്യാൻ GPT‑5, GPT‑4.1, ഡീപ് റിസർച്ച്, കൂടാതെ കമ്പ്യൂട്ടർ-യൂസിംഗ് ഏജന്റ് (CUA) എന്നിവ പ്രയോജനപ്പെടുത്തുന്നു. ഉപയോക്താക്കളെ സംരക്ഷിക്കാനും, തട്ടിപ്പ് തടയാനും, നിയന്ത്രണപരമായ പിഴകൾ ഒഴിവാക്കാനും, ലെഗസി സിസ്റ്റങ്ങൾ കാണാതെ പോകാൻ സാധ്യതയുള്ള സങ്കീർണ്ണ നയങ്ങൾ നടപ്പിലാക്കാനും അവ പ്ലാറ്റ്ഫോമുകളെ സഹായിക്കും; ഉദാഹരണമായി പ്രാദേശിക നിയമങ്ങൾ, തട്ടിപ്പ് ചിത്രങ്ങളിൽ എംബെഡ് ചെയ്ത ഫോൺ നമ്പറുകൾ, അല്ലെങ്കിൽ വ്യക്തമായ ഉള്ളടക്കം എന്നിവ. ഓട്ടോമേഷൻ മാനുഷിക മോഡറേറ്റർമാരെ അപമാനകരമായ ഉള്ളടക്കത്തിൽ നിന്ന് സംരക്ഷിക്കുകയും, സൂക്ഷ്മമായ നയപരമായ തീരുമാനങ്ങൾ കൈകാര്യം ചെയ്യുന്നതിനായി അവരെ സ്വതന്ത്രരാക്കുകയും ചെയ്യുന്നു.
“OpenAI വിപണിയിലെ ഏറ്റവും നൂതനമായ റീസണിംഗ്, മൾട്ടിമോഡൽ മോഡലില് വരെ ഞങ്ങൾക്ക് പ്രവേശനം നൽകുന്നു. ഇത് ഞങ്ങളെ വേഗത്തിൽ പൊരുത്തപ്പെടാനും, പുതിയ ഏജൻ്റുകൾ വേഗത്തിൽ അയയ്ക്കാനും, മറ്റ് പരിഹാരങ്ങൾക്ക് പാർസ് ചെയ്യാൻ കഴിയാത്ത ഉള്ളടക്ക തരങ്ങൾ കൈകാര്യം ചെയ്യാനും സഹായിക്കുന്നു.”
ടാസ്ക് ആവശ്യപ്പെടുന്നതനുസരിച്ച് ഏജന്റുകളെ രൂപകൽപ്പന ചെയ്യുക, തുടർന്ന് ശരിയായ മോഡൽ തിരഞ്ഞെടുക്കുക
SafetyKit-ന്റെ ഓരോ ഏജന്റും തട്ടിപ്പുകൾ മുതൽ നിയമവിരുദ്ധ ഉൽപ്പന്നങ്ങൾ വരെ ഉൾപ്പെടുന്ന ഒരു നിർദ്ദിഷ്ട അപകടസാധ്യത വിഭാഗം കൈകാര്യം ചെയ്യുന്നതിനായി രൂപകൽപ്പന ചെയ്തതാണ്. ഏറ്റവും അനുയോജ്യമായ OpenAI മോഡൽ ഉപയോഗിച്ച്, ഓരോ ഉള്ളടക്കവും ആ ലംഘനത്തിന് ഏറ്റവും അനുയോജ്യമായ ഏജന്റിലേക്കാണ് റൂട്ട് ചെയ്യപ്പെടുന്നത്:
- GPT‑5 ടെക്സ്റ്റ്, ചിത്രങ്ങൾ, UI എന്നിവയിലുടനീളം മൾട്ടിമോഡൽ റീസണിംഗ് പ്രയോഗിച്ച് മറഞ്ഞിരിക്കുന്ന അപകടസാധ്യതകൾ കണ്ടെത്താനും, ഘടനാപരമായതും കൃത്യവുമായ തീരുമാനങ്ങൾ എടുക്കുന്നതിന് പിന്തുണ നൽകാനും സഹായിക്കുന്നു
- GPT‑4.1 വിശദമായ ഉള്ളടക്ക-നയ നിർദ്ദേശങ്ങൾ വിശ്വസനീയമായി പാലിക്കുകയും ഉയർന്ന വോളിയം മോഡറേഷൻ പ്രവാഹങ്ങൾ കാര്യക്ഷമമായി കൈകാര്യം ചെയ്യുകയും ചെയ്യുന്നു
- റീഇൻഫോഴ്സ്മെന്റ് ഫൈൻ-ട്യൂണിംഗ് (RFT) ഡീഫോൾട്ട് മോഡലുകളെക്കാൾ റിക്കോളും പ്രിസിഷനും മെച്ചപ്പെടുത്തുന്നു, സങ്കീർണ്ണമായ സുരക്ഷാ നയങ്ങളോടൊപ്പം അത്യാധുനിക പ്രകടനം കൈവരിക്കുന്നു
- ഡീപ് റിസർച്ച് വ്യാപാര അവലോകനങ്ങളിലേക്കും സ്ഥിരീകരണങ്ങളിലേക്കും തത്സമയ ഓൺലൈൻ പരിശോധന സംയോജിപ്പിക്കുന്നു
- കമ്പ്യൂട്ടർ യൂസിംഗ് ഏജന്റ് (CUA) സങ്കീർണ്ണമായ നയപരമായ ടാസ്കുകൾ ഓട്ടോമേറ്റുചെയ്യുന്നു, ചെലവേറിയ മാനുവൽ അവലോകനങ്ങളിൽ ആശ്രയം കുറയ്ക്കുന്നു
ഈ മോഡൽ-മാച്ചിംഗ് സമീപനം SafetyKit-ന് പഴയ പരിഹാരങ്ങളെക്കാൾ കൂടുതൽ സൂക്ഷ്മതയോടെയും കൃത്യതയോടെയും വിവിധ മോഡാലിറ്റികളിലുടനീളം ഉള്ളടക്ക അവലോകനം സ്കെയിൽ ചെയ്യാൻ അനുവദിക്കുന്നു.
ഉദാഹരണത്തിന്, തട്ടിപ്പ് കണ്ടെത്തൽ ഏജന്റ് വെറും ടെക്സ്റ്റ് സ്കാൻ ചെയ്യുന്നതിന് അപ്പുറം പ്രവര്ത്തിക്കുന്നു. ഇത് ഉൽപ്പന്ന ചിത്രങ്ങളിൽ ഉൾച്ചേർത്തിരിക്കുന്ന QR കോഡുകൾ അല്ലെങ്കിൽ ഫോൺ നമ്പറുകൾ പോലുള്ള ദൃശ്യ ഘടകങ്ങൾ വിശകലനം ചെയ്യുന്നു. GPT‑4.1 ചിത്രം പാഴ്സ് ചെയ്യാനും, ലേഔട്ട് മനസ്സിലാക്കാനും, അത് നയലംഘനമാണോ എന്ന് തീരുമാനിക്കാനും സഹായിക്കുന്നു.
പോളിസി ഡിസ്ക്ലോഷർ ഏജന്റ്, നിയമപരമായ ഡിസ്ക്ലെയിമറുകളോ പ്രദേശ-നിർദ്ദിഷ്ട അനുസരണ മുന്നറിയിപ്പുകളോ പോലുള്ള ആവശ്യമായ ഭാഷയ്ക്കായി ലിസ്റ്റിംഗുകളിലോ ലാൻഡിംഗ് പേജുകളിലോ പരിശോധിക്കുന്നു. GPT‑4.1 പ്രസക്തമായ വിഭാഗങ്ങൾ എക്സ്ട്രാക്റ്റ് ചെയ്യുന്നു, GPT‑5 അനുസരണം വിലയിരുത്തുന്നു, ഏജന്റ് ലംഘനങ്ങൾ ഫ്ലാഗ് ചെയ്യുന്നു.
“ഞങ്ങളുടെ ഏജൻ്റുകളെ പ്രത്യേക ഉദ്ദേശ്യത്തിനായി രൂപകൽപ്പന ചെയ്ത പ്രവാഹങ്ങളായി ഞങ്ങൾ കരുതുന്നു,” ഗ്രൗൻകെ പറയുന്നു. “ചില ജോലികൾക്ക് ആഴത്തിലുള്ള റീസണിംഗ് ആവശ്യമാണ്, മറ്റുചിലയ്ക്ക് മൾട്ടിമോഡൽ സന്ദർഭം ആവശ്യമാണ്.” OpenAI മാത്രമാണ് രണ്ടിടത്തും വിശ്വസനീയമായ പ്രകടനം നൽകുന്ന ഏക പ്ലാറ്റ്ഫോം.
അവ്യക്ത മേഖലകളിലും ഉയർന്ന പ്രാധാന്യമുള്ള തീരുമാനങ്ങളിലും വഴി കണ്ടെത്താൻ GPT‑5 പ്രയോജനപ്പെടുത്തുക
നയപരമായ തീരുമാനങ്ങൾ പലപ്പോഴും സൂക്ഷ്മമായ വ്യത്യാസങ്ങളെ ആശ്രയിക്കുന്നു. വിൽപ്പനക്കാർ വെൽനെസ് ഉൽപ്പന്നങ്ങൾക്ക് ഒരു ഡിസ്ക്ലെയിമർ ഉൾപ്പെടുത്തേണ്ടതും, ഉൽപ്പന്ന അവകാശവാദങ്ങളും പ്രാദേശിക നിയമങ്ങളും അനുസരിച്ച് വ്യത്യാസപ്പെടുന്ന ആവശ്യകതകളുള്ള ഒരു മാർക്കറ്റ്പ്ലേസ് എടുത്താൽ. പൈതൃക ദാതാക്കൾ കീവേഡ് ട്രിഗറുകളെയോ കർശനമായ നിയമസമുച്ചയങ്ങളെയോ ഉപയോഗിക്കുന്നു. ഈ തീരുമാനങ്ങൾക്ക് ആവശ്യമായേക്കാവുന്ന കൂടുതൽ ആഴത്തിലുള്ള വിവേചനപരമായ തീരുമാനങ്ങളെ ഇവ നഷ്ടപ്പെടുത്താൻ ഇടയാകാം, അതുവഴി നഷ്ടപ്പെട്ടതോ തെറ്റായതോ ആയ നടപ്പാക്കലിലേക്ക് നയിക്കപെടും.
SafetyKit-ന്റെ പോളിസി ഡിസ്ക്ലോഷർ ഏജന്റ് ആദ്യം SafetyKit-ന്റെ ആന്തരിക ലൈബ്രറിയിൽ നിന്നുള്ള പോളിസികളെ പരാമർശിക്കുന്നു. തുടർന്ന് GPT‑5 ഉള്ളടക്കം വിലയിരുത്തുന്നു: അതിൽ ചികിത്സയെയോ പ്രതിരോധത്തെയോ കുറിച്ച് പരാമർശിക്കുന്നുണ്ടോ? വെളിപ്പെടുത്തൽ നിർബന്ധമായ ഒരു പ്രദേശത്താണോ ഇത് വിൽക്കപ്പെടുന്നത്? അങ്ങനെയാണെങ്കിൽ, ആവശ്യമായ ഭാഷ യഥാർത്ഥത്തിൽ ലിസ്റ്റിംഗിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ടോ? എന്തെങ്കിലും കുറവുണ്ടെങ്കിൽ, പ്രശ്നം ഫ്ലാഗ് ചെയ്യാൻ ഏജന്റ് ഉപയോഗിക്കുന്ന ഒരു സ്ട്രക്ചേഡ് ഔട്ട്പുട്ടുകൾ GPT‑5 തിരികെ നൽകുന്നു.
“യഥാർത്ഥ നയങ്ങളെ അടിസ്ഥാനമാക്കിയിരിക്കുമ്പോൾ GPT‑5 എത്ര കൃത്യമായി യുക്തിസഹമായി ചിന്തിക്കാൻ കഴിയും എന്നതിലാണ് അതിന്റെ ശക്തി,” ഗ്രൗൻകെ പറയുന്നു. “മറ്റ് സിസ്റ്റങ്ങൾ പരാജയപ്പെടുന്ന എഡ്ജ് കേസുകളിലും കൃത്യവും ന്യായീകരിക്കാവുന്നതുമായ തീരുമാനങ്ങൾ എടുക്കാൻ ഇത് ഞങ്ങളെ സഹായിക്കുന്നു.”
ഓരോ മോഡൽ റിലീസിനെയും ഒരു ഉൽപ്പന്ന വിജയത്തിലേക്ക് മാറ്റുക
SafetyKit ഓരോ പുതിയ OpenAI മോഡലിനെയും അതിന്റെ ഏറ്റവും പ്രയാസമുള്ള കേസുകളുമായി താരതമ്യം ചെയ്യുന്നു, പലപ്പോഴും ഏറ്റവും മികച്ച പ്രകടനം കാഴ്ചവെക്കുന്നവയെ അതേ ദിവസം തന്നെ വിന്യസിക്കുകയും ചെയ്യുന്നു. കർശനമായ ആന്തരിക മൂല്യനിർണയങ്ങൾ പുതിയ മോഡലുകൾ പ്രകടനം എങ്ങനെ മെച്ചപ്പെടുത്താമെന്നും അവരുടെ അടിസ്ഥാന ഇൻഫ്രാസ്ട്രക്ചറിലേക്ക് തടസ്സമില്ലാതെ എങ്ങനെ സംയോജിപ്പിക്കാമെന്നും വേഗത്തിൽ തിരിച്ചറിയാൻ ടീമിനെ സഹായിക്കുന്നു.
OpenAI o3 അവതരിക്കപ്പെട്ടപ്പോൾ, SafetyKit അത് പ്രധാന നയ മേഖലകളിലെ എഡ്ജ് കേസുകളുടെ പ്രകടനം മെച്ചപ്പെടുത്താൻ ഉപയോഗിച്ചു. GPT‑5 തുടർന്ന് വന്നു, ഏതാനും ദിവസങ്ങൾക്കുള്ളിൽ അത് അവരുടെ ഏറ്റവും ആവശ്യകതയേറിയ ഏജന്റുകളിലുടനീളം വിന്യസിക്കപ്പെട്ടു, അവരുടെ ഏറ്റവും കഠിനമായ വിഷൻ ടാസ്കുകളിൽ ബെഞ്ച്മാർക്ക് സ്കോറുകൾ 10 പോയിന്റിൽ കൂടുതൽ മെച്ചപ്പെടുത്തി.
“OpenAI വേഗത്തിൽ മുന്നേറുന്നു, അതിനനുസരിച്ച് പ്രവർത്തിക്കാൻ ഞങ്ങൾ ഞങ്ങളുടെ സിസ്റ്റം രൂപകൽപ്പന ചെയ്തിരിക്കുന്നു. ഓരോ പുതിയ റിലീസും ഞങ്ങൾക്ക് പ്രവർത്തനപരമായ മുൻതൂക്കം നൽകുന്നു–മുമ്പ് പിന്തുണയ്ക്കാൻ കഴിയാത്ത പുതിയ കഴിവുകളും മേഖലകളും തുറക്കുകയും, ഉപഭോക്താക്കൾക്ക് ഞങ്ങൾ നൽകുന്ന കവറേജും കൃത്യതയും വർധിപ്പിക്കുകയും ചെയ്യുന്നു.
SafetyKit മെച്ചപ്പെടുത്തലുകൾ ഇക്കോസിസ്റ്റത്തിലേക്ക് തിരികെ നൽകുന്നു. സുരക്ഷാ നിർണായക പ്രവർത്തനങ്ങൾക്കായുള്ള ഭാവിയിലെ മോഡൽ പ്രകടനം മെച്ചപ്പെടുത്താൻ സഹായിക്കുന്നതിനായി വിലയിരുത്തൽ ഫലങ്ങൾ, ഏറ്റവും വലിയ കേസ് പരാജയങ്ങൾ, നയ-നിർദ്ദിഷ്ട വിവരങ്ങൾ എന്നിവ OpenAI-യുമായി നേരിട്ട് പങ്കിടുന്നു.
മികച്ച OpenAI സ്റ്റാക്ക് ഉപയോഗിച്ച് ഉപഭോക്തൃ വളർച്ചയും വോളിയം വളർച്ചയും വ്യാപിപ്പിക്കുക
SafetyKit-ന്റെ ആർക്കിടെക്ചർ വിപുലമായ തോതിൽ നയങ്ങൾ പ്രാബല്യത്തിൽ കൊണ്ടുവരുന്നു. ഇത് വേഗത, കൃത്യത, സമഗ്രമായ റിസ്ക് കവറേജ് എന്നിവ നൽകുന്നു. തിരശ്ശീലയ്ക്ക് പിന്നിൽ, ഇത് ഇപ്പോൾ ദിവസേന 16 ബില്യൺ ടോക്കൺ കൈകാര്യം ചെയ്യുന്നു. ആറ് മാസം മുമ്പുണ്ടായിരുന്ന 200 മില്ല്യണിൽ നിന്ന് ഇത് ഉയർന്നതാണ്. കൃത്യതയിൽ വിട്ടുവീഴ്ച ചെയ്യാതെ കൂടുതൽ ഉള്ളടക്കം വിശകലനം ചെയ്യുന്നു.
അതേ കാലയളവിൽ, SafetyKit പേയ്മെന്റ്സ് റിസ്ക്, തട്ടിപ്പ്, ശിശു ചൂഷണ വിരുദ്ധ പ്രവർത്തനങ്ങൾ, കള്ളപ്പണം വെളുപ്പിക്കൽ വിരുദ്ധ പ്രവർത്തനങ്ങൾ എന്നിവയിലേക്കും, SafetyKit സംരക്ഷണത്തിലുള്ള കോടിക്കണക്കിന് ഉപയോക്താക്കളുള്ള പുതിയ ഉപഭോക്താക്കളിലേക്കും വ്യാപിച്ചു. ഈ ഫൗണ്ടേഷൻ ഉപഭോക്താക്കളെ ഉയർന്നുവരുന്ന അപകടസാധ്യതകൾക്ക് വേഗത്തിലും ആത്മവിശ്വാസത്തോടെയും പ്രതികരിക്കാൻ പ്രാപ്തരാക്കുന്നു.
“ഓരോ OpenAI റിലീസും ഞങ്ങളുടെ കഴിവുകളെ നേരിട്ട് ശക്തിപ്പെടുത്തുന്ന ഒരു ചക്രം ഞങ്ങൾ സൃഷ്ടിച്ചിട്ടുണ്ട്,” എന്ന് ഗ്രൗങ്കെ പറയുന്നു. “അതിനാൽ സിസ്റ്റം തുടർച്ചയായി മെച്ചപ്പെടുന്നു, ഉയർന്നുവരുന്ന അപകടസാധ്യതകളെ എപ്പോഴും മറികടന്ന് മുന്നിൽ നിൽക്കുന്നു.”
സർവേ ഫലങ്ങൾ ഒരു നോട്ടത്തിൽ
- ഉപഭോക്തൃ ഉള്ളടക്കത്തിന്റെ 100% അവലോകനം ചെയ്യുന്നതിൽ 95%+ കൃത്യത
- പ്രതിദിനം 16B ടോക്കൺ പ്രോസസ് ചെയ്യുന്നു, ആറ് മാസത്തിനിടെ 200M-ൽ നിന്ന് വർദ്ധിച്ചു
- ഏറ്റവും കഠിനമായ വിഷൻ ടാസ്കുകളിൽ 10+ പോയിന്റ് ബെഞ്ച്മാർക്ക് നേട്ടങ്ങൾ നേടുക


