OpenAI में Codex को सुरक्षित रूप से चलाना
वास्तविक वर्कफ़्लोज़ में कोडिंग एजेंट्स को गवर्न करने के लिए OpenAI जिन कंट्रोल्स, सीमाओं और टेलीमेट्री का उपयोग करता है, उन पर एक नज़र.
जैसे-जैसे AI सिस्टम्स ज़्यादा कैपेबल होते जाते हैं, वे यूज़र्स की ओर से ज़्यादा एक्शन्स लेने लगते हैं. कोडिंग एजेंट्स स्वायत्त रूप से रिपॉज़िटरी की समीक्षा कर सकते हैं, कमांड्स चला सकते हैं और डेवलपमेंट टूल्स के साथ इंटरैक्ट कर सकते हैं. ये ऐसे टास्क हैं जिन्हें पहले सीधे मनुष्यों द्वारा निष्पादित करना पड़ता था.
Codex के साथ, हमने इन क्षमताओं को उन नियंत्रणों के साथ डिज़ाइन किया है जिनकी संगठनों को सुरक्षित तैनाती के लिए आवश्यकता होती है. सुरक्षा टीमों को ऐसे तरीकों की आवश्यकता होती है जिनसे वे यह नियंत्रित कर सकें कि एजेंट कैसे काम करते हैं: वे क्या एक्सेस कर सकते हैं, कब मानव अनुमोदन आवश्यक होता है, वे किन प्रणालियों के साथ इंटरैक्ट कर सकते हैं, और उनके व्यवहार को समझाने के लिए कौन सी टेलीमेट्री उपलब्ध है.
OpenAI में, हम Codex को कुछ स्पष्ट लक्ष्यों के साथ तैनात करते हैं: एजेंट को स्पष्ट तकनीकी सीमाओं के भीतर रखना, डेवलपर्स को कम जोखिम वाले कार्यों पर तेजी से आगे बढ़ने देना, और उच्च जोखिम वाले कार्यों को स्पष्ट बनाना. हम एजेंट-नेटिव टेलीमेट्री को भी संरक्षित रखते हैं, ताकि हम समझ सकें और ऑडिट कर सकें कि एजेंट ने क्या किया. व्यवहार में, इसका अर्थ है प्रबंधित कॉन्फ़िगरेशन, सीमित निष्पादन, नेटवर्क नीतियाँ, और एजेंट-नेटिव लॉग्स.
हम Codex को एक सरल सिद्धांत के साथ लागू करते हैं: इसे सीमित वातावरण में उत्पादक होना चाहिए, कम जोखिम वाले रोज़मर्रा के कार्य बिना रुकावट के होने चाहिए, और अधिक जोखिम वाले कार्यों को समीक्षा के लिए रोकना चाहिए.
अनुमोदन और सैंडबॉक्सिंग एक साथ काम करते हैं. सैंडबॉक्स तकनीकी एग्ज़िक्यूशन सीमा को परिभाषित करता है, जिसमें यह शामिल है कि Codex कहां राइट कर सकता है, क्या वह नेटवर्क तक पहुंच सकता है, और कौन-से पाथ्स संरक्षित रहते हैं. अप्रूवल पॉलिसी यह तय करती है कि Codex को कोई कार्रवाई करने के लिए कब पूछना होगा, जैसे जब उसे सैंडबॉक्स के बाहर कुछ करने की ज़रूरत हो. यूज़र्स उस एक्शन को एक बार अप्रूव कर सकते हैं, या उस सेशन के लिए उस प्रकार के एक्शन को अप्रूव कर सकते हैं.
सैंडबॉक्स सीमा पार करने वाले अनुरोधों के लिए, हम ऑटो-रिव्यू मोड(एक नई विंडो में खुलेगा) का उपयोग कर रहे हैं, जो एक ऐसा फीचर है जो चालू होने पर, कुछ प्रकार के अनुरोधों को अपने आप अनुमोदित करता है ताकि उपयोगकर्ताओं को Codex कार्यों को रोककर अनुमोदित करने की आवश्यकता कम पड़े. Codex योजनाबद्ध कार्य और हालिया संदर्भ को ऑटो-अप्रूवल सबएजेंट को भेजता है, जो उपयोगकर्ता को बाधित करने के बजाय कम जोखिम वाले कार्यों—या पर्याप्त स्तर का उपयोगकर्ता प्राधिकरण होने पर उच्च जोखिम वाले कार्यों—को स्वचालित रूप से अनुमोदित कर सकता है. इससे Codex नियमित कार्यों पर आगे बढ़ता रहता है, जबकि उच्च जोखिम वाली या अनपेक्षित परिणामों वाली कार्रवाइयों पर रुक जाता है.
हम Codex को ओपन-एंडेड आउटबाउंड एक्सेस के साथ रन नहीं करते. हमारी प्रबंधित नेटवर्क नीति अपेक्षित गंतव्यों की अनुमति देती है, उन गंतव्यों को ब्लॉक करती है जिन तक हम नहीं चाहते कि Codex पहुँचे, और अपरिचित डोमेन के लिए स्वीकृति की आवश्यकता होती है. यह Codex को व्यापक नेटवर्क एक्सेस दिए बिना सामान्य और सत्यापित वर्कफ़्लोज़ को पूरा करने की अनुमति देता है.
हम यह भी प्रबंधित करते हैं कि Codex कैसे प्रमाणीकरण करता है. CLI और MCP OAuth क्रेडेंशियल्स सुरक्षित OS कीरिंग में संग्रहीत किए जाते हैं, लॉगिन ChatGPT के माध्यम से अनिवार्य किया जाता है, और एक्सेस हमारे ChatGPT Enterprise वर्कस्पेस तक सीमित रखा जाता है. इससे Codex का उपयोग हमारे वर्कस्पेस-लेवल कंट्रोल्स से जुड़ा रहता है और हमारे Enterprise वर्कस्पेस के लिए Codex गतिविधि ChatGPT Compliance Logs Platform में उपलब्ध हो जाती है.
हम नियमों का उपयोग करते हैं ताकि Codex हर शेल कमांड को समान रूप से सुरक्षित न माने. रोज़मर्रा के विकास में इंजीनियर जिन सामान्य हानिरहित कमांड्स का उपयोग करते हैं, उन्हें सैंडबॉक्स के बाहर बिना अनुमोदन के अनुमति दी जाती है, और विशिष्ट खतरनाक कमांड्स को ब्लॉक किया जा सकता है या उनके लिए अनुमोदन की आवश्यकता हो सकती है. इससे Codex सामान्य इंजीनियरिंग कार्यों को तेजी से पूरा कर सकता है, साथ ही उन पैटर्न्स के लिए समीक्षा अनिवार्य करता है या उन्हें ब्लॉक करता है जिन्हें हम सैंडबॉक्स के बाहर चलाना नहीं चाहते.
हम इस पोश्चर को क्लाउड-प्रबंधित आवश्यकताओं, macOS प्रबंधित प्राथमिकताओं और लोकल आवश्यकताओं की फ़ाइलों के संयोजन के माध्यम से लागू करते हैं. आवश्यकताएँ एडमिन द्वारा लागू किए गए नियंत्रण हैं, जिन्हें यूज़र्स ओवरराइड नहीं कर सकते. macOS मैनेज्ड प्रेफरेंसेज़ और लोकल रिक्वायरमेंट्स फ़ाइलें हमें एक समान बेसलाइन बनाए रखने की सुविधा देती हैं, साथ ही टीम, यूज़र ग्रुप या एनवायरनमेंट के हिसाब से अलग-अलग कॉन्फ़िगरेशन को टेस्ट करने में भी मदद करती हैं. ये कॉन्फ़िगरेशन डेस्कटॉप ऐप, CLI, और IDE एक्सटेंशन सहित सभी लोकल Codex सतहों पर लागू होते हैं.
नियंत्रण तो काम का सिर्फ़ आधा हिस्सा है. एक बार एजेंट्स डिप्लॉय हो जाने के बाद, सुरक्षा टीमों को यह विज़िबिलिटी चाहिए कि ये एजेंट्स क्या कर रहे हैं और क्यों. पारंपरिक सुरक्षा लॉग्स Codex द्वारा की गई कार्रवाइयों को देखते समय अब भी उपयोगी होते हैं, लेकिन वे ज़्यादातर यह बताते हैं कि क्या हुआ: एक प्रोसेस शुरू हुआ, एक फ़ाइल बदली, नेटवर्क कनेक्शन का प्रयास किया गया. डिफेंडर्स को अब भी खुद ही यह पता लगाना पड़ता है कि Codex ने कुछ क्यों किया, या उपयोगकर्ता का इरादा क्या था.
Codex सुरक्षा टीमों को अधिक एजेंट-अवेयर दृष्टिकोण दे सकता है. Codex यूज़र प्रॉम्प्ट, टूल अनुमोदन निर्णय, टूल निष्पादन परिणाम, MCP सर्वर उपयोग, और नेटवर्क प्रॉक्सी अनुमति या अस्वीकृति इवेंट जैसे विभिन्न Codex इवेंट के लिए OpenTelemetry लॉग एक्सपोर्ट को सपोर्ट करता है. Codex गतिविधि लॉग्स एंटरप्राइज़ और Edu ग्राहकों के लिए OpenAI अनुपालन प्लेटफ़ॉर्म के माध्यम से भी उपलब्ध हैं.
OpenAI में, हम अपने AI-पावर्ड सिक्योरिटी ट्रायेज एजेंट के साथ Codex लॉग्स का उपयोग करते हैं. जब कोई एंडपॉइंट अलर्ट कहता है कि Codex ने कुछ असामान्य किया, तो एंडपॉइंट सुरक्षा टूल हमें बताता है कि एक संदिग्ध इवेंट हुआ. इसके बाद Codex लॉग उपयोगकर्ता और एजेंट की संदर्भगत मंशा को समझाने में मदद करते हैं. हमारा AI सुरक्षा ट्रायाज एजेंट मूल अनुरोध, टूल गतिविधि, अनुमोदन निर्णयों, टूल परिणामों और नेटवर्क पॉलिसी से जुड़े किसी भी प्रासंगिक निर्णय या ब्लॉक की जाँच करने के लिए Codex लॉग्स का उपयोग करता है. AI सिक्योरिटी ट्रायाज एजेंट अपना विश्लेषण समीक्षा के लिए हमारी सिक्योरिटी टीम के सामने प्रस्तुत करता है, ताकि अपेक्षित एजेंट व्यवहार, हानिरहित गलतियों, और ऐसी गतिविधि के बीच अंतर किया जा सके जिसे वास्तव में एस्केलेशन की आवश्यकता है.
हम उसी टेलीमेट्री का ऑपरेशनल स्तर पर भी उपयोग करते हैं. हम इन लॉग्स का इस्तेमाल यह समझने के लिए करते हैं कि इंटरनल अडॉप्शन कैसे बदल रहा है, कौन-से टूल्स और MCP सर्वर इस्तेमाल किए जा रहे हैं, नेटवर्क सैंडबॉक्स कितनी बार ब्लॉक कर रहा है या प्रॉम्प्ट कर रहा है, और रोलआउट में अब भी कहाँ ट्यूनिंग की ज़रूरत है. इन OpenTelemetry लॉग्स को SIEM और कंप्लायंस लॉगिंग सिस्टम में केंद्रीकृत किया जा सकता है.
जैसे-जैसे Codex जैसे कोडिंग एजेंट्स विकास कार्यप्रवाह में एकीकृत होते जा रहे हैं, सुरक्षा टीमों को इस बदलाव को प्रबंधित करने के लिए विशेष रूप से डिज़ाइन किए गए उपकरणों की आवश्यकता है. Codex सुरक्षित रूप से अपनाने को सुनिश्चित करने के लिए आवश्यक नियंत्रण सतहें, कॉन्फ़िगरेशन प्रबंधन, सैंडबॉक्सिंग और विस्तृत एजेंट-अवेयर टेलीमेट्री प्रदान करता है. उन क्षमताओं के लागू होने पर, सुरक्षा टीमें एंटरप्राइज़ सुरक्षा के लिए आवश्यक दृश्यता और नियंत्रण के साथ डेवलपर उत्पादकता को संतुलित करते हुए, Codex को अधिक आत्मविश्वास के साथ सक्षम कर सकती हैं. Codex को कॉन्फ़िगर करने के बारे में अधिक जानकारी यहाँ(एक नई विंडो में खुलेगा) मिल सकती है, और कंप्लायंस API के बारे में अधिक जानकारी यहाँ(एक नई विंडो में खुलेगा) मिल सकती है.


