8 მაისი, 2026

Codex-ის უსაფრთხოდ გაშვება OpenAI-ში

მიმოხილვა იმ კონტროლის მექანიზმების, საზღვრებისა და ტელემეტრიისა, რომლებსაც OpenAI იყენებს რეალურ სამუშაო პროცესებში კოდირების აგენტების მართვისთვის.

იტვირთება…

ხელოვნური ინტელექტის სისტემების შესაძლებლობების ზრდასთან ერთად, ისინი სულ უფრო მეტად მოქმედებენ მომხმარებლების სახელით. პროგრამირების აგენტებს შეუძლიათ ავტონომიურად განიხილონ რეპოზიტორიუმები, შეასრულონ ბრძანებები და ჰქონდეთ ურთიერთქმედება განვითარების ინსტრუმენტებთან. ეს ამოცანები ადრე ადამიანის მიერ უშუალო შესრულებას მოითხოვდა.

Codex-ში ჩვენ ეს შესაძლებლობები შევიმუშავეთ იმ კონტროლის მექანიზმებთან ერთად, რომლებიც ორგანიზაციებს უსაფრთხო დანერგვისთვის სჭირდებათ. უსაფრთხოების გუნდებს სჭირდებათ აგენტების მუშაობის მართვის გზები: რაზე აქვთ წვდომა, როდის არის საჭირო ადამიანის დასტური, რომელ სისტემებთან შეუძლიათ ურთიერთქმედება და რა სახის ტელემეტრია არსებობს მათი ქცევის ასახსნელად.

OpenAI-ში Codex-ს რამდენიმე მკაფიო მიზნისთვის ვნერგავთ: აგენტი მკაფიო ტექნიკურ საზღვრებში შევინარჩუნოთ, დეველოპერებს დაბალი რისკის ქმედებების სწრაფად შესრულების საშუალება მივცეთ და მაღალი რისკის ქმედებები მკაფიოდ გამოვყოთ. ჩვენ ასევე ვინარჩუნებთ აგენტის ნატიურ ტელემეტრიას, რათა გავიგოთ და შევამოწმოთ, თუ რა გააკეთა აგენტმა. პრაქტიკაში ეს ნიშნავს მართვად კონფიგურაციას, შეზღუდულ გარემოში შესრულებას, ქსელის პოლიტიკებს და აგენტისთვის მორგებულ ჟურნალებს.

Codex-ის მუშაობის კონტროლი

Codex-ს ვნერგავთ მარტივი პრინციპით: ის უნდა იყოს პროდუქტიული შეზღუდულ გარემოში; დაბალი რისკის ყოველდღიური მოქმედებები უნდა სრულდებოდეს შეუფერხებლად, ხოლო უფრო მაღალი რისკის მოქმედებები — განხილვისთვის უნდა შეჩერდეს.

სენდბოქსინგი და დამტკიცებები

დამტკიცებები და სანდბოქსი ერთად მუშაობენ. სენდბოქსი განსაზღვრავს ტექნიკური შესრულების საზღვარს, მათ შორის: სად შეუძლია Codex-ს ჩაწერა, შეუძლია თუ არა ქსელთან წვდომა და რომელი ფაილური ბილიკები რჩება დაცული. დასტურის პოლიტიკა განსაზღვრავს, თუ როდის უნდა მოითხოვოს Codex-მა მოქმედების შესრულების ნებართვა — მაგალითად, როდესაც მას სჭირდება რაიმეს გაკეთება „სენდბოქსის“ ფარგლებს გარეთ. მომხმარებლებს შეუძლიათ მოქმედების ერთჯერადად დადასტურება, ან მოცემული სესიის განმავლობაში ამ ტიპის ყველა მოქმედებაზე თანხმობის მიცემა.

იმ მოთხოვნებისთვის, რომლებიც სენდბოქსის საზღვარს კვეთს, ვიყენებთ ავტომატური გადახედვის რეჟიმს⁠(იხსნება ახალ ფანჯარაში) — ესაა ფუნქცია, რომლის ჩართვის შემთხვევაში გარკვეული ტიპის მოთხოვნები ავტომატურად მტკიცდება, რომ შემცირდეს შემთხვევები, როცა მომხმარებლებს უწევთ შეჩერება და Codex-ის მოქმედებების დამტკიცება. Codex-ი დაგეგმილ მოქმედებასა და ბოლოდროინდელ კონტექსტს უგზავნის ავტომატური დამტკიცების ქვეაგენტს, რომელსაც შეუძლია, ავტომატურად დაამტკიცოს დაბალრისკიანი მოქმედებები (ან მაღალრისკიანი მოქმედებები, თუ მომხმარებლის ავტორიზაციის საკმარისი დონე არსებობს) ისე, რომ მომხმარებელს ხელი არ შეუშალოს. ეს Codex-ს საშუალებას აძლევს, უწყვეტად იმუშაოს რუტინულ დავალებებზე, თუმცა მაინც ჩერდება მაღალრისკიანი მოქმედებების ან ისეთი ოპერაციების შესრულებისას, რომლებსაც გაუთვალისწინებელი შედეგები შეიძლება მოჰყვეს.

TOML

1# config.toml
2
3# Turn on auto_review
4approvals_reviewer = "auto_review" 
5# Add known development directories to the sandbox automatically
6sandbox_workspace_write.writable_roots = ["~/development"] 
7
8# requirements.toml
9
10# Require Codex to operate inside the sandbox
11allowed_sandbox_modes = ["read-only", "workspace-write"]

ქსელზე წვდომა

ჩვენ Codex-ს შეუზღუდავი გამავალი ქსელური წვდომით არ ვუშვებთ. ჩვენი მართვადი ქსელური პოლიტიკა ნებას რთავს წვდომას მოსალოდნელ მისამართებზე, ბლოკავს იმ მიმართულებებს, რომლებთანაც არ გვსურს Codex-ის დაკავშირება და მოითხოვს დადასტურებას უცხო დომენების შემთხვევაში. ეს Codex-ს საშუალებას აძლევს, შეასრულოს გავრცელებული, აპრობირებული სამუშაო პროცესები ისე, რომ მას ფართო ქსელური წვდომა არ მიენიჭოს.

TOML

1# requirements.toml
2
3# Ensure web fetch only comes from OpenAI's cache
4allowed_web_search_modes = ["cached"] 
5
6[experimental_network]
7# Turn on Network Proxy
8enabled = true
9# Allow Codex to interact with localhost
10allow_local_binding = true 
11# Block all requests to this domain
12denied_domains = ["pastebin.com"] 
13# Auto-allow requests to these domains
14allowed_domains = ["login.microsoftonline.com", "*.openai.com"]

იდენტობა და სერთიფიკატები

ჩვენ ასევე ვმართავთ Codex-ის ავთენტიფიკაციის პროცესს. CLI-სა და MCP-ის OAuth ავტორიზაციის მონაცემები ინახება ოპერაციული სისტემის უსაფრთხო გასაღებების საცავში, შესვლა სავალდებულოდ ChatGPT‑ის მეშვეობით ხდება, ხოლო წვდომა მიბმულია ჩვენს ChatGPT Enterprise-ის სამუშაო სივრცეზე. ეს უზრუნველყოფს Codex-ის გამოყენების დაკავშირებას ჩვენი სამუშაო სივრცის დონის კონტროლის მექანიზმებთან და Codex-ის აქტივობას ხელმისაწვდომს ხდის ChatGPT‑ის შესაბამისობის ჟურნალების პლატფორმაზე ჩვენი კორპორაციული სამუშაო სივრცისთვის.

TOML

1# config.toml
2
3# Store CLI Auth Creds in OS Keychain
4cli_auth_credentials_store = "keyring"           
5# Store MCP Creds in OS Keychain
6mcp_oauth_credentials_store = "keyring"          
7# Require Auth via ChatGPT
8forced_login_method = "chatgpt"                  
9# Require Auth to Specific ChatGPT Workspace
10forced_chatgpt_workspace_id = "<workspace-uuid>"

წესები

ჩვენ ვიყენებთ წესებს, რათა Codex-მა ყველა Shell-ბრძანება თანაბრად უსაფრთხოდ არ მიიჩნიოს. გავრცელებული, უვნებელი ბრძანებები, რომლებსაც ინჟინრები ყოველდღიურ განვითარებაში იყენებენ, სენდბოქსის გარეთ დამტკიცების გარეშე ნებადართულია, ხოლო კონკრეტული საშიში ბრძანებები შეიძლება დაიბლოკოს ან დამტკიცებას საჭიროებდეს. ეს Codex-ს საშუალებას აძლევს, სწრაფად გაუმკლავდეს ჩვეულებრივ საინჟინრო ამოცანებს, და ამავდროულად მაინც მოითხოვოს განხილვა ან დაბლოკოს ისეთი შაბლონები, რომელთა სენდბოქსის გარეთ გაშვება არ გვსურს.

Starlark

1# default.rules
2
3prefix_rule(
4    pattern = ["gh", "pr", ["view", "list"]],
5    decision = "allow",
6    justification = "Allows read-only GitHub PR inspection via gh CLI.",
7)
8prefix_rule(
9    pattern = ["kubectl", ["get", "describe", "logs"]],
10    decision = "allow",
11    justification = "Allows Kubernetes resource inspection for debugging.",
12)

მართული კონფიგურაციები

ამ მიდგომას ვახორციელებთ ღრუბლიდან მართული მოთხოვნების, macOS-ის მართული პრეფერენციებისა და ლოკალური მოთხოვნების ფაილების კომბინაციით. მოთხოვნები არის ადმინისტრატორის მიერ დაწესებული კონტროლის მექანიზმები, რომელთა შეცვლა მომხმარებლებს არ შეუძლიათ. macOS-ის მართვადი პრეფერენციები და ლოკალური მოთხოვნების ფაილები საშუალებას გვაძლევს, შევინარჩუნოთ თანმიმდევრული საბაზისო კონფიგურაცია და ამავდროულად გამოვცადოთ სხვადასხვა კონფიგურაცია გუნდის, მომხმარებელთა ჯგუფის ან გარემოს მიხედვით. ეს კონფიგურაციები გამოიყენება Codex-ის ყველა ლოკალურ ინტერფეისზე, მათ შორის დესკტოპ აპლიკაციაში, CLI-სა და IDE-ის გაფართოებაში.

აგენტებზე დაფუძნებული ტელემეტრია და აუდიტის კვალი

კონტროლი საქმის მხოლოდ ნახევარია. აგენტების განთავსების შემდეგ, უსაფრთხოების გუნდებს სჭირდებათ ხილვადობა იმის შესახებ, თუ რას აკეთებენ ეს აგენტები და რატომ. ტრადიციული უსაფრთხოების ჟურნალებიი კვლავ სასარგებლოა Codex-ის მიერ შესრულებული ქმედებების განხილვისას, მაგრამ ისინი ძირითადად პასუხობენ კითხვას, რა მოხდა: პროცესი დაიწყო, ფაილი შეიცვალა, ქსელური კავშირის დამყარების მცდელობა განხორციელდა. დამცველებს კვლავ თავად უწევთ იმის გარკვევა, რატომ გააკეთა Codex-მა რაღაც, ან რა იყო მომხმარებლის განზრახვა.

Codex-ს შეუძლია უსაფრთხოების გუნდებს აგენტების შესახებ უფრო ინფორმირებული ხედვა მისცეს. Codex-ს აქვს OpenTelemetry-ის ჟურნალების ექსპორტის მხარდაჭერა, Codex-ის სხვადასხვა მოვლენებისთვის, როგორიცაა მომხმარებლის მოთხოვნები, ინსტრუმენტის დამტკიცების გადაწყვეტილებები, ინსტრუმენტის შესრულების შედეგები, MCP სერვერის გამოყენება და ქსელის პროქსის დაშვების ან უარყოფის მოვლენები. Codex-ის აქტივობის ჟურნალები ასევე ხელმისაწვდომია OpenAI-ის შესაბამისობის პლატფორმის მეშვეობით Enterprise და Edu კატეგორიის მომხმარებლებისთვის.

TOML

1# config.toml
2
3[otel]
4log_user_prompt = true
5environment = "prod"
6
7[otel.exporter.otlp-http]
8endpoint = "http://localhost:14318/v1/logs"
9protocol = "binary"

OpenAI-ში Codex-ის ჟურნალებს ვიყენებთ ჩვენს AI-ზე დაფუძნებულ უსაფრთხოების ტრიაჟის აგენტთან ერთად. როდესაც საბოლოო წერტილის გაფრთხილება ამბობს, რომ Codex-მა რაღაც უჩვეულო გააკეთა, საბოლოო წერტილის უსაფრთხოების ინსტრუმენტი გვატყობინებს, რომ საეჭვო მოვლენა მოხდა. შემდეგ Codex-ის ჟურნალები მომხმარებლისა და აგენტის კონტექსტური განზრახვის ახსნაში გვეხმარება. ჩვენი AI უსაფრთხოების ტრიაჟის აგენტი იყენებს Codex-ის ჟურნალებს თავდაპირველი მოთხოვნის, ინსტრუმენტების აქტივობის, დამტკიცების გადაწყვეტილებების, ინსტრუმენტების შედეგებისა და ქსელის პოლიტიკის ნებისმიერი შესაბამისი გადაწყვეტილების ან დაბლოკვის შესამოწმებლად. AI უსაფრთხოების ტრიაჟის აგენტი თავის ანალიზს წარუდგენს ჩვენს უსაფრთხოების გუნდს განსახილველად, რათა ერთმანეთისგან განასხვაონ აგენტის მოსალოდნელი ქცევა, უსაფრთხო შეცდომები და ისეთი აქტივობა, რომელიც ნამდვილად საჭიროებს რეაგირებას.

ჩვენ ასევე ვიყენებთ იმავე ტელემეტრიას საოპერაციო მიზნებისთვის. ჩვენ ვიყენებთ ამ ჟურნალებს იმისთვის, რომ გავიგოთ, როგორ იცვლება შიდა დანერგვის პროცესი, რომელი ინსტრუმენტები და MCP სერვერები გამოიყენება, რამდენად ხშირად ბლოკავს ან ითხოვს დასტურს ქსელური „სენდბოქსი“ და სად საჭიროებს დახვეწას სისტემის დანერგვის პროცესი. ამ OpenTelemetry-ის ჟურნალების ცენტრალიზება შესაძლებელია SIEM და შესაბამისობის აღრიცხვის სისტემებში.

მომავლის ხედვები

იმ დროს, როცა შემუშავების სამუშაო პროცესებში ინტეგრირდება კოდის წერის ისეთი აგენტები, როგორიცაა Codex-ი, უსაფრთხოების გუნდებს სჭირდებათ ხელსაწყოები, რომლებიც სპეციალურად ამ გადასვლის სამართავად არის შექმნილი. Codex-ი უზრუნველყოფს უსაფრთხო დანერგვისთვის საჭირო მართვის ინტერფეისებს, კონფიგურაციის მართვას, სენდბოქსში იზოლაციასა და დეტალურ, აგენტზე ორიენტირებულ ტელემეტრიას. ამ შესაძლებლობების არსებობა უსაფრთხოების გუნდებს საშუალებას აძლევს, უფრო მეტი თავდაჯერებით დანერგონ Codex-ი, რაც უზრუნველყოფს ბალანსს დეველოპერების პროდუქტიულობასა და კორპორაციული უსაფრთხოებისთვის აუცილებელ კონტროლსა და გამჭვირვალობას შორის. Codex-ის კონფიგურაციის შესახებ მეტი ინფორმაცია ხელმისაწვდომია აქ⁠(იხსნება ახალ ფანჯარაში), ხოლო შესაბამისობის API-ს შესახებ — აქ⁠(იხსნება ახალ ფანჯარაში).

ავტორი

OpenAI

განაგრძეთ კითხვა

ყველას ნახვა

Safety and alignment in an era of long-horizon models

უსაფრთხოება20 ივლ. 2026

Why teens deserve access to safe AI

უსაფრთხოება16 ივლ. 2026

GPT-Red: თვითგაუმჯობესება სიმტკიცისთვის

უსაფრთხოება15 ივლ. 2026