8 मई 2026

OpenAI में Codex को सुरक्षित रूप से चलाना

वास्तविक वर्कफ़्लोज़ में कोडिंग एजेंट्स को गवर्न करने के लिए OpenAI जिन कंट्रोल्स, सीमाओं और टेलीमेट्री का उपयोग करता है, उन पर एक नज़र.

लोड किया जा रहा है...

जैसे-जैसे AI सिस्टम्स ज़्यादा कैपेबल होते जाते हैं, वे यूज़र्स की ओर से ज़्यादा एक्शन्स लेने लगते हैं. कोडिंग एजेंट्स स्वायत्त रूप से रिपॉज़िटरी की समीक्षा कर सकते हैं, कमांड्स चला सकते हैं और डेवलपमेंट टूल्स के साथ इंटरैक्ट कर सकते हैं. ये ऐसे टास्क हैं जिन्हें पहले सीधे मनुष्यों द्वारा निष्पादित करना पड़ता था.

Codex के साथ, हमने इन क्षमताओं को उन नियंत्रणों के साथ डिज़ाइन किया है जिनकी संगठनों को सुरक्षित तैनाती के लिए आवश्यकता होती है. सुरक्षा टीमों को ऐसे तरीकों की आवश्यकता होती है जिनसे वे यह नियंत्रित कर सकें कि एजेंट कैसे काम करते हैं: वे क्या एक्सेस कर सकते हैं, कब मानव अनुमोदन आवश्यक होता है, वे किन प्रणालियों के साथ इंटरैक्ट कर सकते हैं, और उनके व्यवहार को समझाने के लिए कौन सी टेलीमेट्री उपलब्ध है.

OpenAI में, हम Codex को कुछ स्पष्ट लक्ष्यों के साथ तैनात करते हैं: एजेंट को स्पष्ट तकनीकी सीमाओं के भीतर रखना, डेवलपर्स को कम जोखिम वाले कार्यों पर तेजी से आगे बढ़ने देना, और उच्च जोखिम वाले कार्यों को स्पष्ट बनाना. हम एजेंट-नेटिव टेलीमेट्री को भी संरक्षित रखते हैं, ताकि हम समझ सकें और ऑडिट कर सकें कि एजेंट ने क्या किया. व्यवहार में, इसका अर्थ है प्रबंधित कॉन्फ़िगरेशन, सीमित निष्पादन, नेटवर्क नीतियाँ, और एजेंट-नेटिव लॉग्स.

Codex के संचालन को नियंत्रित करना

हम Codex को एक सरल सिद्धांत के साथ लागू करते हैं: इसे सीमित वातावरण में उत्पादक होना चाहिए, कम जोखिम वाले रोज़मर्रा के कार्य बिना रुकावट के होने चाहिए, और अधिक जोखिम वाले कार्यों को समीक्षा के लिए रोकना चाहिए.

सैंडबॉक्सिंग और अनुमोदन

अनुमोदन और सैंडबॉक्सिंग एक साथ काम करते हैं. सैंडबॉक्स तकनीकी एग्ज़िक्यूशन सीमा को परिभाषित करता है, जिसमें यह शामिल है कि Codex कहां राइट कर सकता है, क्या वह नेटवर्क तक पहुंच सकता है, और कौन-से पाथ्स संरक्षित रहते हैं. अप्रूवल पॉलिसी यह तय करती है कि Codex को कोई कार्रवाई करने के लिए कब पूछना होगा, जैसे जब उसे सैंडबॉक्स के बाहर कुछ करने की ज़रूरत हो. यूज़र्स उस एक्शन को एक बार अप्रूव कर सकते हैं, या उस सेशन के लिए उस प्रकार के एक्शन को अप्रूव कर सकते हैं.

सैंडबॉक्स सीमा पार करने वाले अनुरोधों के लिए, हम ऑटो-रिव्यू मोड⁠(एक नई विंडो में खुलेगा) का उपयोग कर रहे हैं, जो एक ऐसा फीचर है जो चालू होने पर, कुछ प्रकार के अनुरोधों को अपने आप अनुमोदित करता है ताकि उपयोगकर्ताओं को Codex कार्यों को रोककर अनुमोदित करने की आवश्यकता कम पड़े. Codex योजनाबद्ध कार्य और हालिया संदर्भ को ऑटो-अप्रूवल सबएजेंट को भेजता है, जो उपयोगकर्ता को बाधित करने के बजाय कम जोखिम वाले कार्यों—या पर्याप्त स्तर का उपयोगकर्ता प्राधिकरण होने पर उच्च जोखिम वाले कार्यों—को स्वचालित रूप से अनुमोदित कर सकता है. इससे Codex नियमित कार्यों पर आगे बढ़ता रहता है, जबकि उच्च जोखिम वाली या अनपेक्षित परिणामों वाली कार्रवाइयों पर रुक जाता है.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

नेटवर्क एक्सेस

हम Codex को ओपन-एंडेड आउटबाउंड एक्सेस के साथ रन नहीं करते. हमारी प्रबंधित नेटवर्क नीति अपेक्षित गंतव्यों की अनुमति देती है, उन गंतव्यों को ब्लॉक करती है जिन तक हम नहीं चाहते कि Codex पहुँचे, और अपरिचित डोमेन के लिए स्वीकृति की आवश्यकता होती है. यह Codex को व्यापक नेटवर्क एक्सेस दिए बिना सामान्य और सत्यापित वर्कफ़्लोज़ को पूरा करने की अनुमति देता है.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

पहचान और क्रेडेंशियल्स

हम यह भी प्रबंधित करते हैं कि Codex कैसे प्रमाणीकरण करता है. CLI और MCP OAuth क्रेडेंशियल्स सुरक्षित OS कीरिंग में संग्रहीत किए जाते हैं, लॉगिन ChatGPT के माध्यम से अनिवार्य किया जाता है, और एक्सेस हमारे ChatGPT Enterprise वर्कस्पेस तक सीमित रखा जाता है. इससे Codex का उपयोग हमारे वर्कस्पेस-लेवल कंट्रोल्स से जुड़ा रहता है और हमारे Enterprise वर्कस्पेस के लिए Codex गतिविधि ChatGPT Compliance Logs Platform में उपलब्ध हो जाती है.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

नियम

हम नियमों का उपयोग करते हैं ताकि Codex हर शेल कमांड को समान रूप से सुरक्षित न माने. रोज़मर्रा के विकास में इंजीनियर जिन सामान्य हानिरहित कमांड्स का उपयोग करते हैं, उन्हें सैंडबॉक्स के बाहर बिना अनुमोदन के अनुमति दी जाती है, और विशिष्ट खतरनाक कमांड्स को ब्लॉक किया जा सकता है या उनके लिए अनुमोदन की आवश्यकता हो सकती है. इससे Codex सामान्य इंजीनियरिंग कार्यों को तेजी से पूरा कर सकता है, साथ ही उन पैटर्न्स के लिए समीक्षा अनिवार्य करता है या उन्हें ब्लॉक करता है जिन्हें हम सैंडबॉक्स के बाहर चलाना नहीं चाहते.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

प्रबंधित कॉन्फ़िग

हम इस पोश्चर को क्लाउड-प्रबंधित आवश्यकताओं, macOS प्रबंधित प्राथमिकताओं और लोकल आवश्यकताओं की फ़ाइलों के संयोजन के माध्यम से लागू करते हैं. आवश्यकताएँ एडमिन द्वारा लागू किए गए नियंत्रण हैं, जिन्हें यूज़र्स ओवरराइड नहीं कर सकते. macOS मैनेज्ड प्रेफरेंसेज़ और लोकल रिक्वायरमेंट्स फ़ाइलें हमें एक समान बेसलाइन बनाए रखने की सुविधा देती हैं, साथ ही टीम, यूज़र ग्रुप या एनवायरनमेंट के हिसाब से अलग-अलग कॉन्फ़िगरेशन को टेस्ट करने में भी मदद करती हैं. ये कॉन्फ़िगरेशन डेस्कटॉप ऐप, CLI, और IDE एक्सटेंशन सहित सभी लोकल Codex सतहों पर लागू होते हैं.

एजेंट-नेटिव टेलीमेट्री और ऑडिट ट्रेल

नियंत्रण तो काम का सिर्फ़ आधा हिस्सा है. एक बार एजेंट्स डिप्लॉय हो जाने के बाद, सुरक्षा टीमों को यह विज़िबिलिटी चाहिए कि ये एजेंट्स क्या कर रहे हैं और क्यों. पारंपरिक सुरक्षा लॉग्स Codex द्वारा की गई कार्रवाइयों को देखते समय अब भी उपयोगी होते हैं, लेकिन वे ज़्यादातर यह बताते हैं कि क्या हुआ: एक प्रोसेस शुरू हुआ, एक फ़ाइल बदली, नेटवर्क कनेक्शन का प्रयास किया गया. डिफेंडर्स को अब भी खुद ही यह पता लगाना पड़ता है कि Codex ने कुछ क्यों किया, या उपयोगकर्ता का इरादा क्या था.

Codex सुरक्षा टीमों को अधिक एजेंट-अवेयर दृष्टिकोण दे सकता है. Codex यूज़र प्रॉम्प्ट, टूल अनुमोदन निर्णय, टूल निष्पादन परिणाम, MCP सर्वर उपयोग, और नेटवर्क प्रॉक्सी अनुमति या अस्वीकृति इवेंट जैसे विभिन्न Codex इवेंट के लिए OpenTelemetry लॉग एक्सपोर्ट को सपोर्ट करता है. Codex गतिविधि लॉग्स एंटरप्राइज़ और Edu ग्राहकों के लिए OpenAI अनुपालन प्लेटफ़ॉर्म के माध्यम से भी उपलब्ध हैं.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

OpenAI में, हम अपने AI-पावर्ड सिक्योरिटी ट्रायेज एजेंट के साथ Codex लॉग्स का उपयोग करते हैं. जब कोई एंडपॉइंट अलर्ट कहता है कि Codex ने कुछ असामान्य किया, तो एंडपॉइंट सुरक्षा टूल हमें बताता है कि एक संदिग्ध इवेंट हुआ. इसके बाद Codex लॉग उपयोगकर्ता और एजेंट की संदर्भगत मंशा को समझाने में मदद करते हैं. हमारा AI सुरक्षा ट्रायाज एजेंट मूल अनुरोध, टूल गतिविधि, अनुमोदन निर्णयों, टूल परिणामों और नेटवर्क पॉलिसी से जुड़े किसी भी प्रासंगिक निर्णय या ब्लॉक की जाँच करने के लिए Codex लॉग्स का उपयोग करता है. AI सिक्योरिटी ट्रायाज एजेंट अपना विश्लेषण समीक्षा के लिए हमारी सिक्योरिटी टीम के सामने प्रस्तुत करता है, ताकि अपेक्षित एजेंट व्यवहार, हानिरहित गलतियों, और ऐसी गतिविधि के बीच अंतर किया जा सके जिसे वास्तव में एस्केलेशन की आवश्यकता है.

हम उसी टेलीमेट्री का ऑपरेशनल स्तर पर भी उपयोग करते हैं. हम इन लॉग्स का इस्तेमाल यह समझने के लिए करते हैं कि इंटरनल अडॉप्शन कैसे बदल रहा है, कौन-से टूल्स और MCP सर्वर इस्तेमाल किए जा रहे हैं, नेटवर्क सैंडबॉक्स कितनी बार ब्लॉक कर रहा है या प्रॉम्प्ट कर रहा है, और रोलआउट में अब भी कहाँ ट्यूनिंग की ज़रूरत है. इन OpenTelemetry लॉग्स को SIEM और कंप्लायंस लॉगिंग सिस्टम में केंद्रीकृत किया जा सकता है.

आगे का विज़न

जैसे-जैसे Codex जैसे कोडिंग एजेंट्स विकास कार्यप्रवाह में एकीकृत होते जा रहे हैं, सुरक्षा टीमों को इस बदलाव को प्रबंधित करने के लिए विशेष रूप से डिज़ाइन किए गए उपकरणों की आवश्यकता है. Codex सुरक्षित रूप से अपनाने को सुनिश्चित करने के लिए आवश्यक नियंत्रण सतहें, कॉन्फ़िगरेशन प्रबंधन, सैंडबॉक्सिंग और विस्तृत एजेंट-अवेयर टेलीमेट्री प्रदान करता है. उन क्षमताओं के लागू होने पर, सुरक्षा टीमें एंटरप्राइज़ सुरक्षा के लिए आवश्यक दृश्यता और नियंत्रण के साथ डेवलपर उत्पादकता को संतुलित करते हुए, Codex को अधिक आत्मविश्वास के साथ सक्षम कर सकती हैं. Codex को कॉन्फ़िगर करने के बारे में अधिक जानकारी यहाँ⁠(एक नई विंडो में खुलेगा) मिल सकती है, और कंप्लायंस API के बारे में अधिक जानकारी यहाँ⁠(एक नई विंडो में खुलेगा) मिल सकती है.

लेखक

OpenAI

पढ़ते रहें

सभी देखें

Safety and alignment in an era of long-horizon models

सुरक्षा20 जुलाई 2026

Why teens deserve access to safe AI

सुरक्षा16 जुलाई 2026

GPT-Red: मजबूती के लिए स्व-सुधार को अनलॉक करना

सुरक्षा15 जुलाई 2026