முக்கிய உள்ளடக்கத்திற்கு செல்க
OpenAI

7 நவம்பர், 2025

பாதுாய்வு

ப்ராம்ப்ட் இன்ஜெக்ஷன்களைப் புரிந்துகொள்வது: அதிநவீன பாதுகாப்பு சவால்

AI கருவிகள் கேள்விகளுக்கு பதிலளிப்பதைத் தவிர, மேலும் பல செயல்களை செய்யத் தொடங்கியுள்ளன. இப்போது அவர்கள் இணையத்தில் உலாவலாம், ஆராய்ச்சிக்கு உதவலாம், பயணங்களைத் திட்டமிடலாம், மற்றும் பொருட்களை வாங்க உதவலாம். அவை மேலும் திறன் பெறும்போது, பிற செயலிகளில் உள்ள உங்கள் தரவுகளை அணுகவும், உங்கள் சார்பாக நடவடிக்கைகளை எடுக்கவும் முடியும் என்பதால், புதிய பாதுகாப்பு சவால்கள் உருவாகின்றன. நாங்கள் மிகுந்த கவனம் செலுத்துவது 'ப்ராம்ப்ட் இன்ஜெக்ஷன்' ஆகும்.

ப்ராம்ப்ட் இன்ஜெக்ஷன் தாக்குதல் எவ்வாறு செயல்படுகிறது என்பதை விளக்கும் ஒரு வரைபடம். இடதுபுறத்தில், சிரிக்கும் பயனர் ஐகான் “பயனர் ஒரு பணிக்காக AI-யிடம் உதவி கேட்கிறார்” என்று குறிக்கப்படுகிறது. ஒரு அம்பு மையத்தைச் சுட்டிக்காட்டுகிறது, அங்கு ஒரு கணினித் திரை ஐகானில் “AI தாக்குதலுடன் ஒரு இணையதளத்தைப் பார்க்கிறது” என்று லேபல் செய்யப்பட்டுள்ளது, மேலும் அதன் மேலே தொப்பி அணிந்து சிரிப்புடன் இருக்கும் ஒரு சிறிய உருவத்தில் “தாக்குதலாளர் ப்ராம்ப்ட் இன்ஜெக்ஷனை செருகினார்” என்று லேபல் செய்யப்பட்டுள்ளது. மற்றொரு அம்பு வலதுபுறமாகச் செல்கிறது, அது எச்சரிக்கை முக்கோணத்துடன் கூடிய ஆவண ஐகானை காட்டுகிறது, அதில் “AI tricked into unintended action.” என்று குறிக்கப்பட்டுள்ளது. இந்த செயல்முறை, இன்ஜெக்ட்டட் ப்ராம்ப்ட்கள் மூலம் ஒரு தாக்குதலாளர் AI-யை எவ்வாறு மாற்றம் செய்ய முடியும் என்பதை விளக்குகிறது.

ப்ராம்ப்ட் இன்ஜெக்ஷன் என்றால் என்ன?

ப்ராம்ப்ட் இன்ஜெக்ஷன் என்பது உரையாடல் AI-க்கு குறிப்பாக உள்ள ஒரு சமூக பொறியியல் தாக்குதல் வகை. ஆரம்பகால AI அமைப்புகள் தனிப்பட்ட பயனர் மற்றும் தனிப்பட்ட AI ஏஜென்ட் இடையிலான உரையாடல்களாக இருந்தன. இன்றைய AI தயாரிப்புகளில், உங்கள் உரையாடலில் இணையம் உள்ளிட்ட பல்வேறு மூலங்களிலிருந்து உள்ளடக்கம் இருக்கலாம். மூன்றாம் தரப்பு (பயனரும் அல்ல, AIயும் அல்ல) உரையாடல் சூழலில் தீங்கிழைக்கும் வழிமுறைகளை உட்செலுத்தி மாடலை தவறாக வழிநடத்த முடியும் என்ற கருத்து “ப்ராம்ப்ட் இன்ஜெக்ஷன்” என்ற சொல்லை உருவாக்கியது.

ஃபிஷிங் மின்னஞ்சல்கள் அல்லது இணைய மோசடிகள் மக்கள் முக்கியமான தகவல்களை வெளிப்படுத்த ஏமாற்ற முயல்வதைப் போலவே, ப்ராம்ப்ட் இன்ஜெக்ஷன்கள் AI-களை நீங்கள் கேட்காத ஒன்றை செய்ய ஏமாற்ற முயல்கின்றன.

நீங்கள் இணையத்தில் விடுமுறை தொடர்பான ஆராய்ச்சிகளைச் செய்ய AI-யிடம் உதவி கேட்டிருக்கிறீர்கள் என்று கற்பனை செய்யுங்கள். அது அந்த ஆராய்ச்சியைச் செய்யும் போது, ஒரு பட்டியல் அல்லது மதிப்புரையின் கருத்தில் மறைத்து வைக்கப்பட்ட தவறான தகவல் அல்லது தீங்கான வழிமுறைகளை ஒரு வலைப்பக்கத்தில் எதிர்கொள்ளக்கூடும். உள்ளடக்கம் மிக கவனமாக உருவாக்கப்பட்டு, AI-ஐ தவறான பட்டியலை பரிந்துரைக்க ஏமாற்ற முயற்சிக்கலாம், அல்லது அதைவிட மோசமாக, உங்கள் கிரெடிட் கார்டு தகவலை திருடும் நோக்கத்துடன் இருக்கலாம்.

இவை “ப்ராம்ப்ட் இன்ஜெக்ஷன்” தாக்குதல்களின் சில உதாரணங்கள் மட்டுமே—AI-ஐ நீங்கள் எதிர்பாராத செயல்களைச் செய்ய ஏமாற்றுவதற்காக வடிவமைக்கப்பட்ட தீங்கிழைக்கும் வழிமுறைகள், அவை பெரும்பாலும் வலைப்பக்கம், ஆவணம் அல்லது மின்னஞ்சல் போன்ற சாதாரண உள்ளடக்கத்திற்குள் மறைக்கப்பட்டிருக்கும்.

AI-களுக்கு மேலும் சென்சிடிவ் தரவுகளுக்கான அணுகல் கிடைத்து, மேலும் அதிக முன்முயற்சியையும் நீண்ட கால பணிகளையும் மேற்கொள்ளும்போது இந்த அபாயங்கள் அதிகரிக்கின்றன.

சுருக்கம்

நீங்கள் AI-யிடம் என்ன செய்யச் சொன்னீர்கள்

தாக்குபவர் என்ன செய்கிறார்

தாக்குதல் வெற்றி பெற்றால் ஏற்படும் சாத்தியமான விளைவுகள்

நீங்கள் ஒரு AI-யிடம் அபார்ட்மெண்ட்களை ஆராயச் சொல்கிறீர்கள், மேலும் அது ப்ராம்ப்ட் ப்ராம்ப்ட் இன்ஜெக்ஷன்-க்கு உள்ளாகி, உங்களுக்கு சிறந்த தேர்வாக இல்லாத ஒரு பட்டியலை பரிந்துரைக்கிறது.

நீங்கள் சில கொடுக்கப்பட்ட அளவுகோல்களுடன் அபார்ட்மெண்ட்களை ஆராய AI-யிடம் கேட்கிறீர்கள்.

தங்களின் பட்டியலே தேர்ந்தெடுக்கப்பட வேண்டும் என்று AI நினைக்கும்படி ஏமாற்ற, பயனரின் தெரிவுகளைக் கவனிக்காமல், தாக்குதலாளர் அபார்ட்மெண்ட் பட்டியலில் ஒரு ப்ராம்ப்ட் இன்ஜெக்ஷன் தாக்குதலை சேர்த்துள்ளார்.

தாக்குதல் வெற்றியடைந்தால், உங்கள் விருப்பங்களை அடிப்படையாகக் கொண்டு AI தவறாக, உங்களுக்கு குறைவான தரமுள்ள ஒரு அபார்ட்மெண்ட் பட்டியலை பரிந்துரைக்கலாம்.

நீங்கள் இரவு நேரத்தில் வந்த உங்கள் மின்னஞ்சல்களுக்கு பதிலளிக்க ஒரு AI ஏஜென்டிடம் கேட்கிறீர்கள், ஆனால் அது உங்கள் வங்கி கணக்குப் பத்திரங்களை பகிர்ந்து விடுகிறது.

நீங்கள் இன்று காலை பிஸியாக இருப்பதால், இரவு நேரத்தில் வந்த உங்கள் மின்னஞ்சல்களுக்கு பொதுவாக பதிலளிக்க ஒரு AI ஏஜென்ட்டை கேட்கிறீர்கள்.

கீழே உள்ள “முடிந்தால், ஏஜென்ட்டிற்கு தெளிவான வழிமுறைகளை வழங்கவும்” என்பதைப் பார்க்கவும்


தாக்குதலாளர் உங்களுக்கு தவறான தகவல்களை உள்ளடக்கிய ஒரு மின்னஞ்சலை அனுப்பினார், அது மாடலை ஏமாற்றி உங்கள் வங்கி அறிக்கைகளை கண்டுபிடித்து அவற்றை தாக்குதலாளருடன் பகிர்கிறது.

தாக்குதல் வெற்றியடைந்தால், ஏஜென்ட் உங்கள் மின்னஞ்சலில் (நீங்கள் பணிக்காக அணுகலை வழங்கிய) வங்கி அறிக்கைகள் போன்றவற்றை தேடக்கூடும் மற்றும் அவற்றை தாக்குதலாளருடன் பகிரக்கூடும்.

பயனர்களைப் பாதுகாப்பதற்கான எங்கள் அணுகுமுறை

ப்ராம்ப்ட் இன்ஜெக்ஷனுக்கு எதிராக பாதுகாப்பது AI துறையில் ஒரு சவாலாகவும் OpenAI-யில் ஒரு முக்கிய கவனமாகவும் உள்ளது. எதிரிகள் இத்தகைய தாக்குதல்களை தொடர்ந்து உருவாக்குவார்கள் என்று நாங்கள் எதிர்பார்த்தாலும், ஒருவர் அவர்களை தவறாக வழிநடத்த முயற்சித்தாலும், பயனர் நோக்கமிட்ட பணியை நிறைவேற்றுவதற்காக வடிவமைக்கப்பட்ட பாதுகாப்புகளை நாங்கள் உருவாக்கி வருகிறோம். AGI இன் நன்மைகளை பாதுகாப்பாக அடைவதற்கு அந்த திறன் அத்தியாவசியமானது.

எங்கள் பயனர்களைப் பாதுகாக்கவும், இந்த தாக்குதல்களுக்கு எதிராக எங்கள் மாடல்களை மேம்படுத்தவும், பின்வரும் பல அடுக்குகளைக் கொண்ட அணுகுமுறையை நாங்கள் பின்பற்றுகிறோம்:

பாதுகாப்பு பயிற்சி

ப்ராம்ப்ட் இன்ஜெக்ஷன்களை அடையாளம் கண்டு, அவற்றில் ஏமாறாத AI ஐ நாங்கள் விரும்புகிறோம். எனினும், எதிர்மறை தாக்குதல்களுக்கு எதிரான வலிமை என்பது இயந்திர கற்றல் மற்றும் AI-க்கு நீண்டகால சவாலாக இருந்து வருகிறது, இதனால் இது கடினமான, திறந்த பிரச்சினையாகும். நம்பத்தகுந்த மற்றும் நம்பத்தகாத அறிவுறுத்தல்களை வேறுபடுத்தும் மாடல்களை உருவாக்க, அறிவுறுத்தல் படிநிலை என்ற ஆராய்ச்சியை நாங்கள் உருவாக்கியுள்ளோம். ப்ராம்ப்ட் இன்ஜெக்ஷன் முறைமைகளை மாடல்கள் மேலும் சிறப்பாக அடையாளம் காணும் வகையில் அவற்றை பயிற்றுவிக்க புதிய அணுகுமுறைகளை நாங்கள் தொடர்ந்து உருவாக்கி வருகிறோம். இதனால் அவை அவற்றை புறக்கணிக்கவோ அல்லது பயனர்களுக்கு அவற்றை குறிக்கவோ முடியும். நாங்கள் பயன்படுத்தும் நுட்பங்களில் ஒன்று தானியங்கி ரெட் டீமிங் ஆகும், இது பல ஆண்டுகளாக நாங்கள் ஆய்வு செய்து வரும்(புதிய சாளரத்தில் திறக்கும்) ஒரு துறையாகும், புதிய ப்ராம்ப்ட் இன்ஜெக்ஷன் தாக்குதல்களை உருவாக்க.

கண்காணித்தல்

ப்ராம்ப்ட் இன்ஜெக்ஷன் தாக்குதல்களை கண்டறிந்து தடுக்க, AI மூலம் இயக்கப்படும் பல தானியங்கி கண்காணிப்பிகளை நாங்கள் உருவாக்கியுள்ளோம். இவை பாதுகாப்பு பயிற்சி அணுகுமுறைகளுக்கு துணையாக உள்ளன, ஏனெனில் நாம் கண்டறியும் புதிய தாக்குதல்களை விரைவாகத் தடுக்க அவற்றை உடனடியாகப் புதுப்பிக்க முடியும். இந்த மானிட்டர்கள் எங்கள் பயனர்களுக்கு எதிரான சாத்தியமான ப்ராம்ப்ட் இன்ஜெக்ஷன் தாக்குதல்களை அடையாளம் காண உதவுவதோடு மட்டுமல்லாமல், அந்த தாக்குதல்கள் வெளியில் நடைமுறையில் பயன்படுத்தப்படுவதற்கு முன்பே, எங்கள் தளத்தைப் பயன்படுத்தி நடைபெறும் எதிர்மறை ப்ராம்ப்ட் இன்ஜெக்ஷன் ஆராய்ச்சி மற்றும் சோதனைகளையும் கண்டறிய நாங்கள் முடியும்.

பாதுகாப்பு ஏற்பாடுகள்

பயனர் தரவைப் பாதுகாக்க உதவ, பல்வேறு ஒன்றோடொன்று மேலோடும் பாதுகாப்பு அம்சங்களுடன் எங்கள் தயாரிப்புகள் மற்றும் உள்கட்டமைப்பை நாங்கள் வடிவமைத்துள்ளோம். இந்த அம்சங்கள், எதிர்கால பதிவுகளில் மேலும் தொழில்நுட்ப விவரங்களுடன் நாம் ஆராய்வோம், ஒவ்வொரு தயாரிப்பிற்கும் தனிப்பட்ட முறையில் அமைக்கப்பட்டுள்ளன. உதாரணமாக, நம்பமுடியாத தளங்களைத் தவிர்க்க உங்களுக்கு உதவ, குறிப்பாக எங்களை பட்டியலிட வேண்டாம் என்று கேட்கும் இணையதளங்களில்(புதிய சாளரத்தில் திறக்கும்) உள்ள சில இணைப்புகளை ChatGPT இல் நீங்கள் செல்லுமுன் ஒப்புதல் அளிக்குமாறு கேட்போம். எங்கள் AI கருவிகளைப் பயன்படுத்தி பிற நிரல்கள் அல்லது கோடுகளை இயக்கும் போது (உதாரணமாக canvas அல்லது எங்கள் மேம்பாட்டு கருவியான Codex), ப்ராம்ப்ட் இன்ஜெக்ஷன் மூலம் ஏற்படக்கூடிய தீங்கான மாற்றங்களைத் தடுக்க, சாண்ட்பாக்ஸிங் எனப்படும் ஒரு நுட்பத்தை நாங்கள் பயன்படுத்துகிறோம்.

பயனர்களுக்கு கட்டுப்பாட்டை வழங்குதல்

பயனர்கள் தங்களைப் பாதுகாத்துக்கொள்ள எங்கள் தயாரிப்புகளில் உள்ளமைக்கப்பட்ட கட்டுப்பாடுகளை நாங்கள் வழங்குகிறோம். உதாரணமாக, ChatGPT Atlas-இல், நீங்கள் லாக்-அவுட் பயன்முறையைத் தேர்ந்தெடுக்கலாம், இது ChatGPT ஏஜென்ட்டை தளங்களில் உள்நுழையாமல் பணிகளைத் தொடங்க அனுமதிக்கிறது. ChatGPT ஏஜென்ட் ஒரு கொள்முதல் முடிப்பது போன்ற முக்கியமான படிகளை எடுப்பதற்கு முன்பு இடைநிறுத்தி உறுதிப்படுத்தலைக் கேட்கும். ஏஜென்ட் உணர்திறன் கொண்ட தளங்களில் செயல்படும் போது, தளத்தின் உணர்திறன் தன்மையை உங்களுக்கு எச்சரிக்கும் மற்றும் ஏஜென்ட் தனது பணியைச் செய்வதைப் பார்க்க நீங்கள் அந்த தாவலை செயலில் வைத்திருக்க வேண்டும் எனக் கோரும் “வாட்ச் மோடு” என்பதையும் நாங்கள் செயல்படுத்தியுள்ளோம். நுணுக்கமான தகவல் கொண்ட தாவலிலிருந்து நீங்கள் விலகினால், ஏஜென்ட் இடைநிறுத்தப்படுவார். இது, ஏஜென்ட் எவ்வாறு செயல்படுகிறது என்பதை நீங்கள் அறிந்திருக்கவும் மற்றும் அதைக் கட்டுப்பாட்டில் வைத்திருக்கவும் உறுதிசெய்கிறது.

ரெட் டீமிங்

நாங்கள் எங்கள் பாதுகாப்புகளைச் சோதித்து மேம்படுத்தவும், தாக்குபவர்களின் நடத்தைப் பின்பற்றவும், எங்கள் பாதுகாப்பை மேம்படுத்த புதிய வழிகளைக் கண்டறியவும், உள் மற்றும் வெளிப்புற குழுக்களுடன் விரிவான ரெட்-டீமிங் செய்கிறோம். இதில் ப்ராம்ப்ட் இன்ஜெக்ஷன் மீது குறிப்பாக கவனம் செலுத்திய ஆயிரக்கணக்கான மணிநேரங்கள் அடங்குகின்றன. புதிய நுட்பங்களையும் தாக்குதல்களையும் நாங்கள் கண்டுபிடித்துள்ளதால், எங்கள் குழுக்கள் பாதுகாப்பு பாதிப்புகளை முன்கூட்டியே நிவர்த்தி செய்து எங்கள் மாடல் தணிப்புகளை மேம்படுத்துகின்றன.

பக் பவுண்டி

நல்ல நம்பிக்கையுடன் செயல்படும் சுயாதீன பாதுகாப்பு ஆராய்ச்சியாளர்கள் புதிய ப்ராம்ப்ட் இன்ஜெக்ஷன் நுட்பங்களையும் தாக்குதல்களையும் கண்டறிய எங்களுக்கு உதவ ஊக்குவிக்க, அவர்கள் எதிர்பாராத பயனர் தரவு வெளிப்பாட்டை ஏற்படுத்தக்கூடிய ஒரு யதார்த்தமான தாக்குதல் பாதையை காட்டும்போது, எங்கள் பக் பவுண்டி திட்டத்தின்(புதிய சாளரத்தில் திறக்கும்) கீழ் நாங்கள் நிதி வெகுமதிகளை வழங்குகிறோம். இந்தச் சிக்கல்கள் விரைவாக வெளிப்படுவதற்காக வெளிப்புற பங்களிப்பாளர்களுக்கு நாங்கள் ஊக்கத்தொகை வழங்குகிறோம், இதனால் அவற்றைத் தீர்த்து எங்கள் பாதுகாப்புகளை மேலும் வலுப்படுத்த முடியும்.

பயனர்கள் தாங்களே முடிவு செய்யட்டும்

தயாரிப்பின் சில அம்சங்களைப் பயன்படுத்துவதால் ஏற்படும் அபாயங்களைப் பற்றி பயனர்களுக்கு நாங்கள் அறிவுறுத்துகிறோம், இதனால் அவர்கள் அறிவார்ந்த முடிவுகளை எடுக்க முடியும். உதாரணமாக, ChatGPT ஐ பிற செயலிகளுடன் இணைக்கும் போது, எந்த தரவை அணுகலாம், அது எவ்வாறு பயன்படுத்தப்படலாம், மேலும் ஒரு தளம் உங்கள் தரவைத் திருட முயற்சிக்கலாம் போன்ற அபாயங்கள் ஏற்படக்கூடும் என்பதையும், மேலும் பாதுகாப்பாக இருப்பது எப்படி என்பதை அறிய ஒரு இணைப்பையும் நாங்கள் விளக்குகிறோம். அவர்களின் வர்க்ஸ்பேஸ்களில் பயனர்கள் எந்த அம்சங்களை இயக்கலாம் அல்லது பயன்படுத்தலாம் என்பதற்கான கட்டுப்பாட்டையும் நாங்கள் நிறுவனங்களுக்கு வழங்குகிறோம்.

நீங்கள் மேலும் பாதுகாப்பாக இருக்க எடுக்கக்கூடிய நடவடிக்கைகள்

ப்ராம்ப்ட் இன்ஜெக்ஷன் என்பது அதிநவீன பாதுகாப்பு சவாலாகும், இது காலப்போக்கில் தொடர்ந்து வளர்ச்சியடையும் என்று நாங்கள் எதிர்பார்க்கிறோம். புதிய புத்திசாலித்தனமும் திறனும் நிலைகளுக்கு தொழில்நுட்பம், சமூகம் மற்றும் இடர் தணிப்பு உத்தி இணைந்து வளர வேண்டும். 2000களின் தொடக்கத்தில் கணினி வைரஸ்கள் இருந்ததைப் போலவே, ப்ராம்ப்ட் இன்ஜெக்ஷன்களின் அச்சுறுத்தலையும் அபாயத்தை எவ்வாறு கையாள்வது என்பதையும் அனைவரும் புரிந்துகொள்வது முக்கியம் என்று நாங்கள் நினைக்கிறோம். இதனால் இந்த தொழில்நுட்பத்தின் நன்மைகளை நாம் அனைவரும் பாதுகாப்பாகப் பெற கற்றுக்கொள்ள முடியும். AI மற்றும் உங்கள் சார்பாக செயல்படக்கூடிய ஏஜெண்ட் அம்சங்களைப் பயன்படுத்தும்போது விழிப்புடன் இருந்து எச்சரிக்கையாக இருப்பது உங்கள் தரவை மேலும் பாதுகாப்பாக வைத்திருக்க உதவும்.

அதிகரித்த தரவுகளுக்கான அணுகலைக் கட்டுப்படுத்த உள்ளமைக்கப்பட்ட அம்சங்களைப் பயன்படுத்தவும்

சாத்தியமான இடங்களில், ஒரு ஏஜென்டின் அணுகலை, அது ஒரு பணியை முடிக்க தேவையான முக்கியமான தரவுகள் அல்லது சான்றுகளுக்கு மட்டுமே வரையறுக்கவும். உதாரணமாக, ChatGPT Atlas இல் ஏஜென்ட் பயன்முறையைப் பயன்படுத்தி விடுமுறை ஆராய்ச்சி செய்யும்போது, ஏஜென்ட் ஆராய்ச்சி மட்டும் செய்து, உள்நுழைந்த அணுகல் தேவையில்லை என்றால், “வெளியேறிய” பயன்முறையைப் பயன்படுத்தவும்.

ஒரு ஏஜென்ட் உறுதிப்படுத்தல் கேட்கும்போது, அது சரியான செயலைச் செய்யப் போகிறதா என்பதை கவனமாக பரிசீலிக்கவும்

கொள்முதலை முடிப்பது அல்லது மின்னஞ்சல் அனுப்புவது போன்ற சில தொடர்ச்சியான நடவடிக்கைகளை எடுப்பதற்கு முன், உங்களிடமிருந்து இறுதி உறுதிப்படுத்தலைப் பெறுவதற்காக நாங்கள் பெரும்பாலும் ஏஜென்ட்களை வடிவமைக்கிறோம். ஒரு ஏஜென்ட் உங்களிடம் ஒரு செயலை உறுதிப்படுத்துமாறு கேட்டால், அந்தச் செயல் சரியானதா என்பதையும், பகிரப்படும் தகவல் அந்தச் சூழலில் பகிர்வதற்கு ஏற்றதா என்பதையும் கவனமாகச் சரிபார்க்கவும்.

ஒரு ஏஜென்ட் உங்கள் வங்கி போன்ற உணர்திறன் மிக்க தளத்தில் செயல்படும் போது, அந்த ஏஜென்ட் தனது பணியைச் செய்வதை கவனிக்கவும். இது, உங்கள் கைகளை ஸ்டியரிங் சக்கரத்தில் வைத்துக்கொண்டு ஒரு சுய இயக்கம் கொண்ட காரை கண்காணிப்பது போன்றது.

சாத்தியமானபோது, ஏஜென்ட்களுக்கு வெளிப்படையான வழிமுறைகளை வழங்கவும்

"எனது மின்னஞ்சல்களை மதிப்பீடு செய்து தேவையான எந்த நடவடிக்கையையும் எடுக்கவும்" போன்ற மிகப் பரந்த வழிமுறையை ஒரு ஏஜென்டுக்கு வழங்குவது, அது முக்கியமான நடவடிக்கைகளை எடுப்பதற்கு முன் உங்களிடம் உறுதிப்படுத்துமாறு வடிவமைக்கப்பட்டிருந்தாலும் கூட, மறைந்திருக்கும் தீங்கிழைக்கும் உள்ளடக்கம் மாடலுக்கு தவறாக வழிநடத்த எளிதாக்கலாம்.

உங்கள் ஏஜென்டிடம் குறிப்பிட்ட செயல்களைச் செய்யச் சொல்வது பாதுகாப்பானது, மேலும் மின்னஞ்சல்கள் போன்ற வெளிப்புற மூலங்களிலிருந்து வரும் தீங்கு விளைவிக்கும் அறிவுறுத்தல்களை பின்பற்றக்கூடிய வகையில் அதற்கு பரந்த சுதந்திரம் வழங்காமல் இருப்பது நல்லது. இது தாக்குதல்கள் இருக்காது என்று உறுதியளிக்காவிட்டாலும், இது தாக்குதலாளர்கள் வெற்றியடைய சிரமமாக்குகிறது.

தகவல்களை அறிந்து கொண்டு பாதுகாப்பு சிறந்த நடைமுறைகளை பின்பற்றுங்கள்

AI தொழில்நுட்பம் முன்னேற்றமடையும் போது, புதிய அபாயங்கள் மற்றும் பாதுகாப்பு நடவடிக்கைகள் உருவாகும். சிறந்த நடைமுறைகளைப் பற்றி அறிய OpenAI மற்றும் பிற நம்பகமான மூலங்களின் புதுப்பிப்புகளை பின்தொடரவும்.

எதிர்கால நோக்கு

ப்ராம்ப்ட் இன்ஜெக்ஷன் இன்னும் ஒரு அதிநவீன, சவாலான ஆராய்ச்சி பிரச்சினையாகவே உள்ளது, மேலும் இணையத்தில் உள்ள பாரம்பரிய மோசடிகளைப் போலவே, எங்கள் பணி தொடர்ச்சியாக இருக்கும் என்று நாங்கள் எதிர்பார்க்கிறோம். இந்த நுட்பத்தை தாக்குதலாளர்கள் இன்னும் பெரிதும் ஏற்றுக்கொள்ளவில்லை என்றாலும், எதிரிகள் AIகளை இந்த தாக்குதல்களுக்கு ஏமாறச் செய்ய வழிகளை கண்டுபிடிக்க அதிக நேரத்தையும் வளங்களையும் செலவிடுவார்கள் என்று நாங்கள் எதிர்பார்க்கிறோம். எங்கள் தயாரிப்புகளைப் பாதுகாப்பானதாக்குவதிலும், இந்த ஆபத்தை எதிர்கொள்ள AI இன் வலிமையை மேம்படுத்துவதற்கான ஆராய்ச்சியிலும் நாங்கள் தொடர்ந்து அதிக அளவில் முதலீடு செய்து வருகிறோம். நாங்கள் மேலும் அறிந்து கொள்ளும்போது, இந்தப் பகுதியில் எங்கள் பாதுகாப்புப் பணியில் தொடர்ந்து நடைபெறும் முன்னேற்றம் உட்பட, புதுப்பிப்புகளைப் பகிர்ந்து கொள்வோம். உதாரணமாக, உங்கள் AI இணையத்துடன் தொடர்பு கொள்ளும்போது உங்கள் உரையாடலிலிருந்து தகவல் பரிமாறப்படுகிறதா என்பதை நாங்கள் எவ்வாறு கண்டறிகிறோம் என்பதற்கான மேலும் விவரங்களைப் பகிரும் ஒரு அறிக்கையை நாங்கள் உருவாக்கி வருகிறோம். அதை விரைவில் வெளியிடுவோம்.

எங்கள் நோக்கம், இந்த அமைப்புகளை உங்கள் மிக நம்பகமான மற்றும் பாதுகாப்பு விழிப்புணர்வு கொண்ட சக பணியாளர் அல்லது நண்பருடன் பணிபுரிவதைப் போலவே நம்பகமான மற்றும் பாதுகாப்பானதாக உருவாக்குவதாகும். நிஜ உலகப் பயன்பாட்டிலிருந்து நாங்கள் தொடர்ந்து கற்றுக்கொள்வோம், பாதுகாப்பாக மீண்டும் மீண்டும் மேம்படுத்துவோம், மேலும் தொழில்நுட்பம் முன்னேறும்போது நாங்கள் கற்றதை வெளியிடுவோம்.