Menjalankan Codex dengan aman di OpenAI
Tinjauan tentang kontrol, batasan, dan telemetri yang digunakan OpenAI untuk mengatur agen coding dalam alur kerja nyata.
Seiring dengan menjadi lebih mumpuninya sistem AI, sistem tersebut semakin sering bertindak atas nama pengguna. Agen pengodean dapat secara otonom meninjau repositori, menjalankan perintah, dan berinteraksi dengan alat pengembangan. Ini adalah tugas-tugas yang sebelumnya memerlukan pelaksanaan langsung oleh manusia.
Dengan Codex, kami merancang kapabilitas ini bersamaan dengan kontrol yang dibutuhkan organisasi untuk penerapan yang aman. Tim keamanan memerlukan cara untuk mengatur bagaimana agen beroperasi: apa yang dapat mereka akses, kapan persetujuan manusia diperlukan, sistem mana yang dapat mereka gunakan untuk berinteraksi, dan telemetri apa yang tersedia untuk menjelaskan perilaku mereka.
Di OpenAI, kami menerapkan Codex dengan beberapa tujuan yang jelas: menjaga agen tetap berada dalam batas teknis yang jelas, memungkinkan pengembang bergerak cepat pada tindakan berisiko rendah, dan membuat tindakan berisiko lebih tinggi menjadi eksplisit. Kami juga mempertahankan telemetri asli agen agar kami dapat memahami dan mengaudit apa yang dilakukan agen. Dalam praktiknya, itu berarti konfigurasi terkelola, eksekusi yang dibatasi, kebijakan jaringan, dan log asli agen.
Kami menerapkan Codex dengan prinsip sederhana bahwa Codex harus produktif dalam lingkungan yang dibatasi, tindakan sehari-hari berisiko rendah harus tanpa hambatan, dan tindakan berisiko lebih tinggi harus berhenti untuk ditinjau.
Persetujuan dan sandboxing bekerja bersama. Sandbox menentukan batas eksekusi teknis, termasuk di mana Codex dapat menulis, apakah Codex dapat mengakses jaringan, dan jalur mana yang tetap dilindungi. Kebijakan persetujuan menentukan kapan Codex harus meminta izin untuk melakukan suatu tindakan, misalnya saat perlu melakukan sesuatu di luar sandbox. Pengguna dapat menyetujui tindakan itu satu kali, atau menyetujui jenis tindakan tersebut untuk sesi itu.
Untuk permintaan yang melintasi batas sandbox, kami menggunakan mode Auto-review(terbuka di jendela baru), yaitu fitur yang ketika diaktifkan akan secara otomatis menyetujui jenis permintaan tertentu untuk mengurangi seberapa sering pengguna harus berhenti dan menyetujui tindakan Codex. Codex mengirimkan tindakan yang direncanakan dan konteks terbaru ke subagen persetujuan otomatis, yang dapat secara otomatis menyetujui tindakan berisiko rendah—atau tindakan berisiko tinggi dengan tingkat otorisasi pengguna yang memadai—alih-alih menginterupsi pengguna. Ini membuat Codex tetap berjalan untuk pekerjaan rutin sekaligus tetap berhenti pada tindakan berisiko lebih tinggi atau tindakan yang memiliki konsekuensi tak diinginkan.
Kami tidak menjalankan Codex dengan akses keluar yang terbuka tanpa batas. Kebijakan jaringan terkelola kami mengizinkan tujuan yang diharapkan, memblokir tujuan yang tidak kami inginkan untuk diakses Codex, dan memerlukan persetujuan untuk domain yang tidak dikenal. Ini memungkinkan Codex menyelesaikan alur kerja umum yang sudah diketahui aman tanpa memberinya akses jaringan yang luas.
Kami juga mengelola cara Codex melakukan autentikasi. Kredensial OAuth CLI dan MCP disimpan di keyring OS yang aman, proses masuk diwajibkan melalui ChatGPT, dan akses dikunci ke workspace perusahaan ChatGPT kami. Ini membuat penggunaan Codex tetap terikat pada kontrol tingkat workspace kami dan membuat aktivitas Codex tersedia di Platform Log Kepatuhan ChatGPT untuk workspace perusahaan kami.
Kami menggunakan aturan agar Codex tidak memperlakukan setiap perintah shell sebagai sesuatu yang sama amannya. Perintah umum yang tidak berbahaya dan digunakan insinyur dalam pengembangan sehari-hari diizinkan tanpa persetujuan di luar sandbox, dan perintah berbahaya tertentu dapat diblokir atau memerlukan persetujuan. Ini memungkinkan Codex bergerak cepat melalui tugas rekayasa biasa sambil tetap memaksa peninjauan atau memblokir pola yang tidak ingin kami jalankan di luar sandbox.
Kami menerapkan pendekatan ini melalui kombinasi persyaratan yang dikelola cloud, preferensi terkelola macOS, dan file persyaratan lokal. Persyaratan adalah kontrol yang diberlakukan admin dan tidak dapat ditimpa oleh pengguna. Preferensi terkelola macOS dan file persyaratan lokal memungkinkan kami mempertahankan dasar yang konsisten sambil tetap menguji konfigurasi yang berbeda berdasarkan tim, grup pengguna, atau lingkungan. Konfigurasi ini berlaku di seluruh permukaan Codex lokal, termasuk aplikasi desktop, CLI, dan ekstensi IDE.
Kontrol hanyalah setengah dari pekerjaan. Setelah agen diterapkan, tim keamanan memerlukan visibilitas terhadap apa yang dilakukan agen ini dan alasannya. Log keamanan tradisional tetap berguna saat melihat tindakan yang diambil oleh Codex, tetapi sebagian besar hanya menjawab apa yang terjadi: sebuah proses dimulai, file berubah, koneksi jaringan dicoba. Pembela masih harus mencari tahu mengapa Codex melakukan sesuatu, atau apa maksud pengguna.
Codex dapat memberi tim keamanan pandangan yang lebih sadar-agen. Codex mendukung ekspor log OpenTelemetry untuk berbagai peristiwa Codex seperti prompt pengguna, keputusan persetujuan alat, hasil eksekusi alat, penggunaan server MCP, dan peristiwa proksi jaringan yang diizinkan atau ditolak. Log aktivitas Codex juga tersedia melalui Platform Kepatuhan OpenAI untuk pelanggan Enterprise dan Edu.
Di OpenAI, kami menggunakan log Codex bersama agen triase keamanan yang didukung AI kami. Ketika peringatan endpoint mengatakan Codex melakukan sesuatu yang tidak biasa, alat keamanan endpoint memberi tahu kami bahwa peristiwa mencurigakan telah terjadi. Log Codex kemudian membantu menjelaskan maksud yang melatarbelakanginya, baik dari sisi pengguna dan agen. Agen triase keamanan AI kami menggunakan log Codex untuk memeriksa permintaan asli, aktivitas alat, keputusan persetujuan, hasil alat, dan setiap keputusan atau pemblokiran kebijakan jaringan yang relevan. Agen triase keamanan AI menampilkan analisisnya kepada tim keamanan kami untuk ditinjau guna membedakan antara perilaku agen yang diharapkan, kesalahan ringan, dan aktivitas yang benar-benar memerlukan eskalasi.
Kami juga menggunakan telemetri yang sama secara operasional. Kami menggunakan log ini untuk memahami bagaimana adopsi internal berubah, alat dan server MCP mana yang digunakan, seberapa sering sandbox jaringan memblokir atau meminta konfirmasi, dan di mana peluncuran masih perlu disesuaikan. Log OpenTelemetry ini dapat dipusatkan dalam sistem logging SIEM dan kepatuhan.
Seiring dengan semakin terintegrasinya agen pengodean seperti Codex ke dalam alur kerja pengembangan, tim keamanan membutuhkan alat yang dirancang khusus untuk mengelola perubahan ini. Codex menyediakan permukaan kontrol, manajemen konfigurasi, sandboxing, dan telemetri detail yang sadar-agen yang diperlukan untuk memastikan adopsi yang aman. Dengan kapabilitas tersebut, tim keamanan dapat mengaktifkan Codex dengan lebih percaya diri, menyeimbangkan produktivitas pengembang dengan visibilitas dan kontrol yang dibutuhkan untuk keamanan perusahaan. Informasi lebih lanjut tentang mengonfigurasi Codex dapat ditemukan di sini(terbuka di jendela baru), dan Kepatuhan API di sini(terbuka di jendela baru).


