OpenAI இன் திறமையான மாடல்களுடன் SafetyKit ஆபத்து ஏஜென்ட்கள்
ஆரம்பகால பார்வை மாடல் முன்பார்வைகளுடன் புரோட்டோடைப்பிங் செய்வதிலிருந்து GPT‑5 உடன் அளவீடு செய்வதுவரை, SafetyKit இன் மல்டி-மோடல் ஏஜென்ட்கள் புதிய துறைகளுக்கு விரிவடைந்து துல்லியத்தை மேம்படுத்துகின்றன.

முடிவுகள்
95%+
வாடிக்கையாளர் உள்ளடக்கத்தின் 100% மதிப்பாய்வில் துல்லியம் (SafetyKit evals)
முடிவுகள்
16B
தினசரி செயலாக்கப்படும் டோக்கன், ஆறு மாதங்களுக்கு முன்பு இருந்த 200 மில்லியனில் இருந்து அதிகரித்துள்ளன
முடிவுகள்
10+
GPT-5 மூலம் மிகக் கடினமான பார்வை பணிகளில் செயல்திறன் மேம்பாடுகளைப் பெறுங்கள்
SafetyKit(புதிய சாளரத்தில் திறக்கும்) உரை, படங்கள், நிதி பரிவர்த்தனைகள், தயாரிப்பு பட்டியல்கள் மற்றும் பலவற்றில் மோசடி மற்றும் தடைசெய்யப்பட்ட செயல்பாடுகளைக் கண்டறிந்து அவற்றின் மீது நடவடிக்கை எடுக்க மார்க்கெட்ப்ளேஸ்கள், கட்டண தளங்கள் மற்றும் ஃபின்டெக்குகளுக்கு உதவும் பல்முக AI முகவர்களை உருவாக்குகிறது. மாடல் ரீஸனிங் மற்றும் மல்டிமோடல் புரிதலில் ஏற்பட்ட சமீபத்திய முன்னேற்றங்கள் இப்போது இதை மேலும் பயனுள்ளதாக மாற்றுகின்றன, இதன் மூலம் அபாயம், இணக்கம் மற்றும் பாதுகாப்பு செயல்பாடுகளுக்கு ஒரு புதிய அளவுகோலை அமைக்கின்றன.
SafetyKit இன் ஏஜென்ட்கள், SafetyKit இன் evals அடிப்படையில் 95% க்கும் அதிகமான துல்லியத்துடன், வாடிக்கையாளர் உள்ளடக்கத்தின் 100% ஐ மதிப்பாய்வு செய்ய GPT‑5, GPT‑4.1, டீப் ரிசர்ச் மற்றும் கம்ப்யூட்டர்-யூசிங் ஏஜென்ட் (CUA) ஆகியவற்றைப் பயன்படுத்துகின்றன. அவை தளங்கள் பயனர்களைப் பாதுகாக்கவும், மோசடியைத் தடுக்கவும், ஒழுங்குமுறை அபராதங்களைத் தவிர்க்கவும், மேலும் பழைய அமைப்புகள் கவனிக்கத் தவறக்கூடிய பிராந்தியத்திற்கே உரிய விதிகள், மோசடி படங்களில் உட்பொதிக்கப்பட்ட தொலைபேசி எண்கள், அல்லது வெளிப்படையான உள்ளடக்கம் போன்ற சிக்கலான கொள்கைகளை அமல்படுத்தவும் உதவக்கூடும். தானியக்கம் மனித மதிப்பீட்டாளர்களை புண்படுத்தக்கூடிய உள்ளடக்கத்தை எதிர்கொள்வதிலிருந்து பாதுகாக்கவும், நுணுக்கமான கொள்கை முடிவுகளைக் கையாள அவர்களுக்கு வாய்ப்பளிக்கவும் முடியும்.
“OpenAI சந்தையில் உள்ள மிகவும் மேம்பட்ட ரீஸனிங் மற்றும் பலவகை மாடல்களுக்கு எங்களுக்கு அணுகலை வழங்குகிறது. இது எங்களுக்கு விரைவாக செயல்பாடுகளை மாற்றவும், புதிய ஏஜென்ட்களை இன்னும் வேகமாக அனுப்பவும், மேலும் பிற தீர்வுகளால் பகுத்தறிய முடியாத உள்ளடக்க வகைகளை கையாளவும் உதவுகிறது.
பணி தேவைக்கேற்ப நீங்கள் ஏஜென்ட்களை வடிவமைத்து, பின்னர் சரியான மாடலைத் தேர்ந்தெடுக்க வேண்டும்
SafetyKit-இன் ஏஜென்ட்கள் ஒவ்வொருவரும் மோசடிகள் முதல் சட்டவிரோத தயாரிப்புகள் வரை, குறிப்பிட்ட ஒரு அபாய வகையை கையாளும் வகையில் உருவாக்கப்பட்டுள்ளனர். ஒவ்வொரு உள்ளடக்கமும் அந்த மீறலுக்கு மிகவும் பொருத்தமான ஏஜென்ட்டுக்கு சிறந்த OpenAI மாடலை பயன்படுத்தி வழிநடத்தப்படுகிறது:
- GPT‑5 உரை, படங்கள் மற்றும் UI முழுவதும் பன்முக ரீஸனிங் பயன்படுத்தி, மறைந்திருக்கும் அபாயங்களை வெளிக்கொணரவும் அடுக்குகளைக் கொண்ட, துல்லியமான முடிவெடுப்பை ஆதரிக்கவும் செய்கிறது
- GPT‑4.1, விரிவான உள்ளடக்கக் கொள்கை வழிமுறைகளை நம்பகத்தன்மையுடன் பின்பற்றுகிறது மற்றும் அதிக அளவிலான மதிப்பாய்வு பணிப்பாய்வுகளை திறம்பட நிர்வகிக்கிறது
- ரீஇன்ஃபோர்ஸ்மென்ட் ஃபைன்-ட்யூனிங் (RFT) மூலம் ரீகால் மற்றும் துல்லியத்தை இயல்புநிலை மாடல்களை விட மேம்படுத்தி, சிக்கலான பாதுகாப்புக் கொள்கைகளுடன் அதிநவீன செயல்திறனை அடைகிறது
- டீப் ரிசர்ச் வணிகர் மதிப்புரைகள் மற்றும் சரிபார்ப்புகளுடன் நிகழ்நேர ஆன்லைன் விசாரணையை ஒருங்கிணைக்கிறது
- கம்ப்யூட்டர்-யூசிங் ஏஜென்ட் (CUA) சிக்கலான கொள்கை சார்ந்த பணிகளை தானியக்கமாக்கி, அதிக செலவான கைமுறை மதிப்பாய்வுகளின் மீதான சார்பைக் குறைக்கிறது
இந்த மாடல்-பொருத்த அணுகுமுறை, பழைய தீர்வுகளால் முடிவதைக் காட்டிலும் அதிக நுணுக்கத்தன்மையுடனும் துல்லியத்துடனும் பல்வேறு modality களில் உள்ள உள்ளடக்க மதிப்பாய்வை விரிவுபடுத்த SafetyKit-க்கு உதவுகிறது.
உதாரணமாக, மோசடி கண்டறிதல் ஏஜென்ட் வெறும் உரையை ஸ்கேன் செய்வதைத் தாண்டிச் செல்கிறது. இது தயாரிப்பு படங்களில் உள்ள QR குறியீடுகள் அல்லது தொலைபேசி எண்கள் போன்ற காட்சிக் கூறுகளை பகுப்பாய்வு செய்கிறது. GPT‑4.1 படத்தை பகுப்பாய்வு செய்ய, அமைப்பைப் புரிந்துகொள்ள, மேலும் அது கொள்கை மீறலா என்பதைத் தீர்மானிக்க உதவுகிறது.
கொள்கை வெளிப்படுத்தல் ஏஜென்ட், சட்ட மறுப்புரைகள் அல்லது பிராந்தியத்திற்கே உரிய இணக்க எச்சரிக்கைகள் போன்ற தேவையான மொழிக்காக பட்டியல்கள் அல்லது லாண்டிங் பக்கங்களைச் சரிபார்க்கிறது. GPT‑4.1 தொடர்புடைய பிரிவுகளைப் பிரித்தெடுக்கிறது, GPT‑5 இணக்கத்தை மதிப்பீடு செய்கிறது, மேலும் ஏஜென்ட் மீறல்களை குறிக்கிறது.
“எங்கள் ஏஜென்ட்களை குறிப்பிட்ட நோக்கத்திற்காக உருவாக்கப்பட்ட பணிச்சூழல்களாக நாங்கள் கருதுகிறோம்,” என்று Graunke கூறுகிறார். “சில பணிகளுக்கு ஆழமான ரீஸனிங் தேவைப்படுகிறது, மற்றவற்றுக்கு பல்முக சூழல் தேவைப்படுகிறது. OpenAI மட்டுமே இரண்டிலும் நம்பகமான செயல்திறனை வழங்கும் ஒரே ஸ்டாக் ஆகும்.
தெளிவற்ற பகுதிகளையும், மிக முக்கியமான முடிவுகளையும் சமாளிக்க GPT‑5 ஐ பயன்படுத்துங்கள்
கொள்கை முடிவுகள் பெரும்பாலும் நுட்பமான வேறுபாடுகளைச் சார்ந்திருக்கும். நலவாழ்வு தயாரிப்புகளுக்கான பொறுப்புத் துறப்பு அறிவிப்பை விற்பனையாளர்கள் சேர்க்க வேண்டும் என்று கோரும் சந்தைத் தளத்தை எடுத்துக்கொள்ளுங்கள்; இதில் தயாரிப்பு கூற்றுகள் மற்றும் பிராந்திய விதிகளின் அடிப்படையில் தேவைகள் மாறுபடும். முந்தைய வழங்குநர்கள் முக்கியச் சொல் தூண்டுதல்கள் அல்லது கடுமையான விதிமுறைத் தொகுப்புகளைப் பயன்படுத்துகின்றனர்; இத்தகைய முடிவுகளுக்கு தேவைப்படக்கூடிய ஆழமான தீர்மானங்களை அவை தவறவிடக்கூடும், இதனால் செயலாக்கம் தவறவிடப்படவோ அல்லது தவறாக மேற்கொள்ளப்படவோலாம்.
SafetyKit இன் கொள்கை வெளிப்படுத்தல் ஏஜென்ட் முதலில் SafetyKit இன் உள் நூலகத்தில் உள்ள கொள்கைகளை மேற்கோள் காட்டுகிறது. பின்னர் GPT‑5 உள்ளடக்கத்தை மதிப்பீடு செய்கிறது: அது சிகிச்சை அல்லது தடுப்பைப் பற்றி குறிப்பிடுகிறதா? வெளிப்படுத்தல் கட்டாயமான பகுதியில் இது விற்கப்படுகிறதா? அப்படியானால், தேவையான மொழி உண்மையில் பட்டியலில் சேர்க்கப்பட்டுள்ளதா? ஏதேனும் குறைபாடு இருந்தால், அந்தச் சிக்கலைக் குறித்துக் காட்ட ஏஜென்ட் பயன்படுத்திக்கொள்ளும் ஒரு ஸ்ட்ரக்ச்சர்டு அவுட்புட்ஸ் ஐ GPT‑5 வழங்குகிறது.
“உண்மையான கொள்கையை அடிப்படையாகக் கொண்டிருக்கும்போது GPT‑5 எவ்வளவு துல்லியமாக பகுத்தறிய முடிகிறதோ அதில்தான் அதன் சக்தி இருக்கிறது,” என்று கிரௌன்கே குறிப்பிடுகிறார். “மற்ற அமைப்புகள் தோல்வியடையும் விளிம்பு நிலைச் சம்பவங்களிலும் கூட, இது நமக்கு துல்லியமான, நியாயப்படுத்தக்கூடிய முடிவுகளை எடுக்க உதவுகிறது.”
ஒவ்வொரு மாடல் வெளியீட்டையும் தயாரிப்பு வெற்றியாக மாற்றுங்கள்
SafetyKit ஒவ்வொரு புதிய OpenAI மாடலையும் அதன் மிகவும் கடினமான வழக்குகளுடன் ஒப்பிட்டு மதிப்பிடுகிறது; மேலும், சிறப்பாக செயல்படும் மாடல்களை அதே நாளிலேயே அடிக்கடி பயன்படுத்துகிறது. கடுமையான உள்மதிப்பீடுகள், புதிய மாடல்கள் செயல்திறனை எவ்வாறு மேம்படுத்த முடியும் என்பதை குழு விரைவாக கண்டறியவும், அவற்றை அவர்களின் முக்கிய உள்கட்டமைப்புடன் தடையின்றி ஒருங்கிணைக்கவும் உதவுகின்றன.
OpenAI o3 அறிமுகமானபோது, முக்கிய கொள்கைப் பகுதிகளில் எட்ஜ் கேஸ் செயல்திறனை மேம்படுத்த SafetyKit அதை பயன்படுத்தியது. GPT‑5 அதைத் தொடர்ந்து வந்தது, மேலும் சில நாட்களுக்குள், அது அவர்களின் மிகவும் கோரிக்கையுள்ள ஏஜென்ட்கள் முழுவதும் பயன்படுத்தப்பட்டது; இதனால் அவர்களின் மிகக் கடினமான பார்வைப் பணிகளில் அளவுகோல் மதிப்பெண்கள் 10 புள்ளிகளுக்கும் அதிகமாக மேம்பட்டன.
“OpenAI வேகமாக செயல்படுகிறது, மேலும் அதற்கேற்ப செயல்படும் வகையில் எங்கள் அமைப்பை வடிவமைத்துள்ளோம். ஒவ்வொரு புதிய வெளியீடும் எங்களுக்கு ஒரு செயல்பாட்டு முன்னிலையை வழங்குகிறது–முன்பு நாம் ஆதரிக்க முடியாத புதிய திறன்களையும் துறைகளையும் திறந்து, வாடிக்கையாளர்களுக்கு நாம் வழங்கும் கவரேஜையும் துல்லியத்தையும் அதிகரிக்கிறது.
SafetyKit மேலும் மேம்பாடுகளை சூழலமைப்பிற்கு வழங்குகிறது; பாதுகாப்பு முக்கியமான பணிச்சுமைகளுக்கான எதிர்கால மாடல் செயல்திறனை வடிவமைக்க உதவ, மதிப்பீட்டு முடிவுகள், அரிதான நிலை தோல்விகள் மற்றும் கொள்கை சார்ந்த நுண்ணறிவுகளை நேரடியாக OpenAI உடன் பகிர்கிறது.
சிறந்த OpenAI stack ஐப் பயன்படுத்தி வாடிக்கையாளர் வளர்ச்சியையும் பரிவர்த்தனை அளவின் வளர்ச்சியையும் விரிவாக்குங்கள்
SafetyKit-இன் கட்டமைப்பு பரந்த அளவில் கொள்கையை அமல்படுத்தி, வேகம், துல்லியம் மற்றும் முழுமையான ஆபத்து கவரேஜை வழங்குகிறது. திரைக்குப் பின்னால், இது இப்போது தினமும் 16 பில்லியனுக்கும் அதிகமான டோக்கன்களை கையாளுகிறது; ஆறு மாதங்களுக்கு முன்பு அது 200 மில்லியனாக இருந்தது. இதனால், துல்லியத்தை குறைக்காமல் மேலும் அதிகமான உள்ளடக்கத்தை பகுப்பாய்வு செய்கிறது.
அதே காலகட்டத்தில், SafetyKit கட்டண அபாயம், மோசடி, குழந்தைகள் சுரண்டல் தடுப்பு, பணமோசடி தடுப்பு ஆகிய துறைகளுக்கும், SafetyKit இன் பாதுகாப்பின் கீழ் கோடிக்கணக்கான இறுதி பயனர்களைக் கொண்ட புதிய வாடிக்கையாளர்களுக்கும் விரிவடைந்துள்ளது. இந்த அடித்தளம் வாடிக்கையாளர்கள் உருவாகும் அபாயங்களுக்கு விரைவாகவும் நம்பிக்கையுடனும் பதிலளிக்க இயலுமைப்படுத்துகிறது.
“OpenAI வெளியிடும் ஒவ்வொரு வெளியீடும் எங்கள் திறன்களை நேரடியாக வலுப்படுத்தும் ஒரு சுழற்சியை நாங்கள் உருவாக்கியுள்ளோம்,” என்று Graunke கூறுகிறார். “அதனால்தான் இந்த அமைப்பு தொடர்ந்து மேம்படுகிறது, மாறிவரும் அபாயங்களை எப்போதும் முன்கூட்டியே சமாளிக்கிறது.”
சுருக்கமான முடிவுகள்
- வாடிக்கையாளர் உள்ளடக்கத்தின் 100%-ஐ மீளாய்வு செய்வதில் 95%+ துல்லியம்
- தினசரி 16B டோக்கன்கள் செயலாக்கப்படுகின்றன, இது ஆறு மாதங்களில் 200M இலிருந்து அதிகரித்துள்ளது
- மிகக் கடினமான காட்சிப் பணிகளில் 10+ புள்ளி அளவுகோல் முன்னேற்றங்கள்


