जैसे-जैसे AI सिस्टम अधिक जटिल कार्यों को संभालते हैं—विशेष रूप से वे जो वेब और जुड़े हुए ऐप्स से संबंधित होते हैं—सुरक्षा के जोखिम बदल जाते हैं.
एक उभरता हुआ जोखिम विशेष रूप से महत्वपूर्ण हो गया है: प्रॉम्प्ट इंजेक्शन. इन हमलों में, एक तीसरा पक्ष संवादात्मक AI सिस्टम को हानिकारक निर्देशों का पालन करने या संवेदनशील जानकारी प्रकट करने के लिए गुमराह करने का प्रयास करता है.
आज, हम उपयोगकर्ताओं और संगठनों को प्रॉम्प्ट इंजेक्शन हमलों को कम करने में मदद करने के लिए डिज़ाइन किए गए दो नए सुरक्षा उपाय पेश कर रहे हैं, जो जोखिम की स्पष्ट दृश्यता और मज़बूत नियंत्रण प्रदान करते हैं:
- ChatGPT में Lockdown Mode, उच्च जोखिम वाले उपयोगकर्ताओं के लिए एक उन्नत, वैकल्पिक सुरक्षा सेटिंग
- “उन्नत जोखिम” लेबल कुछ क्षमताओं के लिए, जो ChatGPT, ChatGPT Atlas, और Codex में अतिरिक्त जोखिम उत्पन्न कर सकती हैं
ये अतिरिक्त उपाय हमारे मॉडल, उत्पाद और सिस्टम स्तरों पर मौजूदा सुरक्षा को और मज़बूत करते हैं. इसमें सैंडबॉक्सिंग, URL-आधारित डेटा एक्सफ़िल्ट्रेशन के खिलाफ सुरक्षा, मॉनिटरिंग और प्रवर्तन, और भूमिका-आधारित एक्सेस और ऑडिट लॉग्स जैसे एंटरप्राइज़ नियंत्रण शामिल हैं.
Lockdown Mode एक वैकल्पिक, उन्नत सुरक्षा सेटिंग है, जो अत्यधिक सुरक्षा-सचेत उपयोगकर्ताओं के एक छोटे समूह के लिए डिज़ाइन की गई है—जैसे प्रमुख संगठनों के कार्यकारी या सुरक्षा टीमें—जिन्हें उन्नत खतरों के खिलाफ बढ़ी हुई सुरक्षा की आवश्यकता होती है. अधिकांश उपयोगकर्ताओं के लिए यह आवश्यक नहीं है. Lockdown Mode, प्रॉम्प्ट इंजेक्शन-आधारित डेटा एक्सफ़िल्ट्रेशन के जोखिम को कम करने के लिए, ChatGPT के बाहरी सिस्टम्स के साथ इंटरैक्शन को सख्ती से सीमित करता है.
Lockdown Mode, ChatGPT में कुछ टूल्स और क्षमताओं को निश्चित रूप से अक्षम कर देता है, जिनका कोई प्रतिद्वंद्वी प्रॉम्प्ट इंजेक्शन जैसे हमलों के माध्यम से उपयोगकर्ताओं की बातचीत या जुड़े हुए ऐप्स से संवेदनशील डेटा निकालने के लिए दुरुपयोग कर सकता है.
उदाहरण के लिए, लॉकडाउन मोड में वेब ब्राउज़िंग केवल कैश की गई सामग्री तक सीमित होती है, इसलिए कोई भी लाइव नेटवर्क अनुरोध OpenAI के नियंत्रित नेटवर्क से बाहर नहीं जाता. यह प्रतिबंध ब्राउज़िंग के माध्यम से संवेदनशील डेटा को किसी हमलावर तक पहुँचने से रोकने के लिए बनाया गया है. जब हम डेटा सुरक्षा की मज़बूत, निश्चित गारंटी नहीं दे सकते, तो कुछ फीचर्स पूरी तरह से निष्क्रिय कर दिए जाते हैं.

Lockdown Mode एक नई निश्चित सेटिंग है जो डेटा को अनजाने में तीसरे पक्षों के साथ साझा होने से बचाने में मदद करती है, यह सख्ती से सीमित करता है कि ChatGPT कुछ बाहरी प्रणालियों के साथ कैसे इंटरैक्ट कर सकता है.
ChatGPT के व्यावसायिक योजनाएँ पहले से ही उद्यम-स्तरीय डेटा सुरक्षा प्रदान करती हैं. Lockdown Mode उन सुरक्षा उपायों को और मज़बूत करता है और यह ChatGPT Enterprise, ChatGPT Edu, हेल्थकेयर के लिए ChatGPT, और ChatGPT for Teachers के लिए उपलब्ध है. एडमिन वर्कस्पेस सेटिंग्स(एक नई विंडो में खुलेगा) में एक नया रोल(एक नई विंडो में खुलेगा) बनाकर इसे सक्षम कर सकते हैं. जब सक्षम किया जाता है, Lockdown Mode मौजूदा व्यवस्थापक सेटिंग्स पर अतिरिक्त प्रतिबंधों की परतें जोड़ता है.
हमारे हेल्प सेंटर(एक नई विंडो में खुलेगा) में Lockdown Mode के बारे में अधिक जानें.
क्योंकि कुछ महत्वपूर्ण वर्कफ़्लो ऐप्स पर निर्भर करते हैं, वर्कस्पेस एडमिन्स अधिक विस्तृत नियंत्रण बनाए रखते हैं. वे Lockdown Mode में उपयोगकर्ताओं के लिए सटीक रूप से चुन सकते हैं कि कौन-से ऐप्स—और उन ऐप्स के भीतर कौन-से विशिष्ट क्रियाएँ—उपलब्ध होंगी. इसके अतिरिक्त, और Lockdown Mode से अलग, कंप्लायंस API लॉग्स प्लेटफ़ॉर्म(एक नई विंडो में खुलेगा) ऐप के उपयोग, साझा डेटा, और जुड़े स्रोतों में विस्तृत दृश्यता प्रदान करता है, जिससे प्रशासकों को निगरानी बनाए रखने में मदद मिलती है.
हम आने वाले महीनों में उपभोक्ताओं के लिए Lockdown Mode उपलब्ध कराने की योजना बना रहे हैं.
AI उत्पाद आपके ऐप्स और वेब से जुड़े होने पर अधिक सहायक हो सकते हैं, और हमने जुड़े हुए डेटा को सुरक्षित रखने में भारी निवेश किया है. साथ ही, नेटवर्क से संबंधित कुछ क्षमताएँ नए जोखिम पेश करती हैं, जिन्हें अभी तक उद्योग की सुरक्षा और सुरक्षा उपायों द्वारा पूरी तरह से संबोधित नहीं किया गया है. कुछ उपयोगकर्ता इन जोखिमों को लेने में सहज हो सकते हैं, और हमारा मानना है कि उपयोगकर्ताओं के लिए यह महत्वपूर्ण है कि उनके पास यह तय करने की क्षमता हो कि उन्हें इनका उपयोग करना है या नहीं, और यदि करना है तो कैसे, विशेष रूप से जब वे अपने निजी डेटा के साथ काम कर रहे हों.
हमारा दृष्टिकोण यह रहा है कि उन फीचर्स के लिए उत्पाद के भीतर मार्गदर्शन प्रदान किया जाए जो अतिरिक्त जोखिम पेश कर सकते हैं. इसे और स्पष्ट और सुसंगत बनाने के लिए, हम मौजूदा क्षमताओं की एक छोटी सूची को लेबल करने के तरीके को मानकीकृत कर रहे हैं. ये फीचर्स अब ChatGPT, ChatGPT Atlas, और Codex में एक समान “Elevated Risk” लेबल का उपयोग करेंगे, ताकि उपयोगकर्ताओं को जहाँ भी वे इन्हें देखें, वही मार्गदर्शन प्राप्त हो.
उदाहरण के लिए, Codex, हमारे कोडिंग सहायक में, डेवलपर्स Codex को नेटवर्क एक्सेस दे सकते हैं ताकि वह वेब पर डाक्यूमेंटेशन खोजने जैसी कार्रवाइयाँ कर सके. संबंधित सेटिंग्स स्क्रीन में “Elevated Risk” लेबल शामिल है, साथ ही यह स्पष्ट व्याख्या भी है कि क्या परिवर्तन होते हैं, कौन-से जोखिम उत्पन्न हो सकते हैं, और वह एक्सेस कब उपयुक्त है.

Codex सेटिंग्स स्क्रीन का एक स्क्रीनशॉट, जहां उपयोगकर्ता यह कॉन्फ़िगर कर सकते हैं कि Codex को कौन-सा नेटवर्क एक्सेस प्राप्त है.
हम सुरक्षा और संरक्षा के उपायों को मजबूत करने में निवेश करना जारी रखते हैं, विशेष रूप से नए, उभरते, या बढ़ते जोखिमों के लिए. जैसे-जैसे हम इन विशेषताओं के लिए सुरक्षा उपायों को मजबूत करेंगे, हम “Elevated Risk” लेबल को तब हटा देंगे जब हम यह सुनिश्चित कर लेंगे कि सुरक्षा में हुई प्रगति ने सामान्य उपयोग के लिए उन जोखिमों को पर्याप्त रूप से कम कर दिया है. हम समय के साथ यह भी अपडेट करना जारी रखेंगे कि कौन-से फीचर्स पर यह लेबल होगा, ताकि उपयोगकर्ताओं को जोखिम के बारे में सबसे अच्छे तरीके से सूचित किया जा सके.


