Memperkenalkan Codex
Sebuah agen rekayasa perangkat lunak berbasis cloud yang dapat bekerja di berbagai tugas secara paralel, ditenagai oleh codex-1. Tersedia untuk pengguna ChatGPT Pro, Team, dan Enterprise untuk saat ini dan bagi pengguna Plus segera.

Diperbarui pada 3 Juni 2025: Codex sekarang tersedia bagi pengguna ChatGPT Plus. Kami juga memungkinkan pengguna untuk menyediakan akses internet kepada Codex selama pelaksanaan tugas. Harap mengacu pada changelog(terbuka di jendela baru) dan dokumen(terbuka di jendela baru) untuk detail selengkapnya.
Hari ini kami sedang meluncurkan pratinjau riset dari Codex: sebuah agen rekayasa perangkat lunak berbasis cloud yang dapat bekerja di berbagai tugas secara paralel. Codex dapat melakukan berbagai tugas untuk Anda seperti menulis fitur, menjawab pertanyaan mengenai codebase, memperbaiki bug, dan mengajukan permintaan penuh untuk melakukan peninjauan; setiap tugas berjalan di lingkungan sandbox cloud tersendiri, dilengkapi dengan repositori.
Codex ditenagai oleh codex-1,versi dari OpenAI o3 yang dioptimalkan untuk teknik rekayasa perangkat lunak. Codex dilatih dengan menggunakan pembelajaran penguatan di tugas koding dunia sebenarnya di berbagai lingkungan untuk membuat kode yang sangat mirip dengan preferensi gaya manusia dan PR, mematuhi instruksi dengan presisi dan dapat menjalankan pengujian berulang hingga menerima hasil kelulusan. Kami mulai meluncurkan Codex untuk para pengguna ChatGPT Pro, Enterprise, dan Team hari ini, serta dukungan untuk Plus dan Edu akan segera hadir.
Kini Anda dapat mengakses Codex melalui sidebar di ChatGPT dan menerapkan tugas koding baru padanya dengan mengetik prompt dan mengeklik “Kode”. Jika Anda ingin mengajukan kepada Codex sebuah pertanyaan terkait codebase, klik “Tanya”. Setiap tugas diproses secara independen dalam lingkungan terpisah dan terisolasi yang dilengkapi dengan codebase. Codex dapat membaca dan mengedit file, sekaligus menjalankan perintah termasuk pengujian harness, linter, dan pemeriksa tipe. Penyelesaian tugas biasanya memerlukan waktu antara 1 dan 30 menit, bergantung pada tingkat kerumitan, dan Anda dapat memantau perkembangan Codex secara real time.
Setelah Codex menyelesaikan suatu tugas, Codex berkomitmen terhadap perubahannya di lingkungannya sendiri. Codex memberikan bukti terverifikasi dari tindakannya melalui kutipan dari log terminal dan hasil pengujian, yang memungkinkan Anda untuk melacak setiap langkah yang diambil selama proses penyelesaian tugas. Anda kemudian dapat meninjau hasilnya, meminta revisi lebih lanjut, membuka pull request GitHub, atau secara langsung mengintegrasikan perubahannya ke dalam lingkungan lokal Anda. Dalam produk tersebut, Anda dapat mengonfigurasi lingkungan Codex untuk menyesuaikan lingkungan pengembangan asli Anda semirip mungkin.
Codex dapat dipandu oleh file AGENTS.md yang ditempatkan di dalam repositori. Semua ini adalah file teks, mirip dengan README.md, yang mana Anda dapat menginformasikan Codex cara untuk menavigasi codebase, perintah mana untuk menjalankan pengujian, dan cara terbaik untuk mematuhi praktik standar proyek Anda. Layaknya pengembang manusia, agen Codex melakukan yang terbaik saat disediakan lingkungan dev yang terkonfigurasi, penyiapan pengujian yang andal, dan dokumen yang jelas.
Dalam tolok ukur evaluasi koding dan internal, codex-1 menunjukkan kinerja yang kuat bahkan tanpa file AGENTS.md atau membangun kerangka kerja kustom.
Sampel Terverifikasi 23 SWE-Bench yang tidak dapat dijalankan di infrastruktur internal kami telah dikecualikan. codex-1 telah diuji pada panjang konteks maksimal dari 192 ribu token dan upaya penalaran sedang, yang merupakan pengaturan yang akan tersedia untuk produk saat ini. Untuk detail mengenai evaluasi o3, lihat di sini.
Tolok ukur tugas SWE internal kami disusun dari tugas-tugas SWE internal dunia sebenarnya di OpenAI.
Kami sedang merilis Codex sebagai pratinjau riset, sesuai dengan strategi penerapan berulang kami. Kami memprioritaskan keamanan dan transparansi saat merancang Codex sehingga pengguna dapat memverifikasi keluarannya - langkah perlindungan yang menjadi makin penting karena model AI menangani tugas-tugas koding yang makin rumit dan pertimbangan keselamatan meningkat. Pengguna dapat memeriksa pekerjaan Codex melalui kutipan, log terminal, dan hasil pengujian. Saat ada ketidakpastian dan dihadapkan dengan kegagalan pengujian, agen Codex secara eksplisit mengomunikasikan masalahnya, memungkinkan pengguna untuk melakukan pengambilan keputusan berdasarkan informasi mengenai langkah yang harus diambil. Masih tetap penting bagi pengguna untuk meninjau dan memvalidasi semua kode yang dibuat oleh agen secara manual sebelum integrasi dan eksekusi.


Tujuan utama saat melatih codex-1 adalah untuk menyelaraskan keluaran sedekat mungkin dengan preferensi dan standar koding manusia. Dibandingkan dengan OpenAI o3, codex-1 secara konsisten memproduksi patch lebih bersih yang siap untuk tinjauan manusia dan integrasi alur kerja standar yang mendesak.
Perlindungan terhadap aplikasi berbahaya dari teknik rekayasa perangkat lunak yang berbasis AI, seperti pengembangan malware, menjadi makin penting. Pada saat yang sama, penting agar langkah-langkah perlindungan tidak secara berlebihan menghambat penerapan yang sah dan bermanfaat yang mungkin melibatkan teknik-teknik yang kadang-kadang juga digunakan untuk pengembangan malware, seperti rekayasa kernel tingkat rendah.
Untuk menyeimbangkan keselamatan dan kebermanfaatan, Codex dilatih untuk mengidentifikasi dan secara presisi menolak permintaan yang bertujuan untuk mengembangkan perangkat lunak berbahaya, sekaligus membedakan dengan jelas dan mendukung tugas-tugas yang sah. Kami juga telah menyempurnakan kerangka kerja kebijakan kami dan menggabungkan evaluasi keselamatan yang ketat untuk memperkuat batasan-batasan ini secara efektif. Kami telah menerbitkan lampiran Kartu Sistem o3 untuk merefleksikan berbagai evaluasi ini.
Agen Codex beroperasi sepenuhnya di dalam kontainer yang aman dan terisolasi di cloud. Saat eksekusi tugas, akses internet dinonaktifkan, membatasi interaksi agen agar semata-mata pada kode yang secara eksplisit disediakan melalui repositori GitHub dan dependensi prainstal yang dikonfigurasi oleh pengguna melalui skrip penyiapan. Agen tidak dapat mengakses situs web eksternal, API, atau layanan lainnya.
Tim teknis di OpenAI telah mulai menggunakan Codex sebagai bagian dari perangkat sehari-hari mereka. Codex paling sering digunakan oleh teknisi OpenAI untuk mendelegasikan tugas-tugas yang berulang dan memiliki cakupan yang jelas seperti refactoring, mengubah nama, dan menulis pengujian, yang jika dilakukan sendiri akan merusak fokus. Codex juga dapat digunakan untuk membangun kerangka kerja fitur baru, menghubungkan komponen, memperbaiki bug, dan menyusun dokumentasi. Tim sedang membangun kebiasaan baru sehubungan dengannya: mencatat masalah panggilan, merencanakan tugas di awal hari, dan mendelegasikan pekerjaan latar belakang agar terus melangkah maju. Dengan mengurangi pergantian konteks dan mengingatkan tugas-tugas yang terlupakan, Codex membantu insinyur merilis produk lebih cepat dan tetap fokus pada hal-hal yang paling penting.
Menjelang rilis, kami juga telah bekerja dengan grup kecil dari penguji eksternal untuk lebih memahami bagaimana performa Codex di berbagai codebase, proses pengembangan, dan tim yang berbeda.
- Cisco(terbuka di jendela baru) sedang mendalami cara Codex dapat membantu tim teknik rekayasa mereka untuk bisa menghadirkan berbagai ide penuh ambisi ke kehidupan dengan lebih cepat. Sebagai mitra desain awal, Cisco membantu membentuk masa depan Codex dengan melakukan evaluasi padanya dalam kasus penggunaan dunia sebenarnya di seluruh portofolio produk mereka dan memberikan masukan pada tim OpenAI.
- Temporal(terbuka di jendela baru) menggunakan Codex untuk mempercepat pengembangan fitur, merunut masalah, menulis dan mengeksekusi pengujian, dan melakukan refaktor codebase besar. Codex juga membantu mereka tetap fokus dengan menjalankan tugas-tugas rumit di latar belakang—menjaga teknisi tetap berada dalam alur saat mempercepat iterasi.
- Superhuman(terbuka di jendela baru) menggunakan Codex untuk mempercepat tugas-tugas kecil tetapi berulang seperti meningkatkan cakupan pengujian dan memperbaiki kegagalan integrasi. Codex juga membantu mereka merilis lebih cepat dengan mengaktifkan pengelola produk untuk berkontribusi pada perubahan kode ringan tanpa melibatkan teknisi, kecuali untuk peninjauan kode.
- Kodiak(terbuka di jendela baru) menggunakan Codex untuk membantu menulis alat perunutan, meningkatkan cakupan pengujian, dan refraktor kode—mempercepat pengembangan Kodiak Driver, teknologi swakemudi mereka. Codex juga telah menjadi alat referensi yang bernilai, membantu para teknisi memahami bagian yang tidak dikenal dari ekosistem dengan menampilkan konteks yang relevan dan perubahan yang lalu.
Berdasarkan pembelajaran dari penguji awal, kami merekomendasikan menetapkan tugas yang tercakup dengan baik ke banyak agen secara bersamaan, dan melakukan eksperimen dengan tipe tugas dan prompt yang berbeda untuk mendalami kemampuan model secara efektif.
Bulan lalu, kami telah meluncurkan Codex CLI, agen koding sumber terbuka ringan yang berjalan di terminal. Codex CLI menghadirkan kekuatan model seperti o3 dan o4-mini ke dalam alur kerja lokal, mempermudah memasangkannya untuk menyelesaikan tugas dengan lebih cepat.
Kini, kami juga sedang merilis versi codex-1 yang lebih kecil, versi o4-mini yang dirancang secara khusus untuk digunakan di Codex CLI. Model baru ini mendukung alur kerja yang lebih cepat di CLI dan dioptimalkan untuk Q&A dan pengeditan kode latensi rendah, sekaligus mempertahankan kekuatan yang sama dalam mengikuti instruksi dan gaya. Model ini kini tersedia sebagai model default di Codex CLI dan di API sebagai codex-mini-latest. Snapshot dasar akan diperbarui secara rutin seiring kami terus meningkatkan model Codex-mini.
Kami juga membuatnya lebih mudah untuk menghubungkan akun pengembang ke Codex CLI. Alih-alih membuat dan mengonfigurasi manual token API, Anda sekarang dapat masuk dengan akun ChatGPT dan memilih organisasi API yang ingin digunakan. Kami akan otomatis membuat dan mengonfigurasi kunci API untuk Anda. Pengguna Plus dan Pro yang masuk ke Codex CLI dengan ChatGPT juga dapat mulai menukarkan $5 dan $50 dalam bentuk kredit API gratis, masing-masing, nanti di kemudian hari dalam 30 hari selanjutnya.
Mulai hari ini, kami meluncurkan Codex untuk para pengguna ChatGPT Pro, Enterprise, dan Team secara global, dengan dukungan untuk Plus dan Edu akan segera hadir. Pengguna akan memiliki akses berlimpah tanpa biaya tambahan untuk minggu-minggu yang akan datang sehingga Anda dapat mendalami apa yang dapat Codex lakukan, setelah itu kami akan meluncurkan opsi akses dengan batasan dan skema biaya fleksibel yang memungkinkan Anda membeli penggunaan tambahan sesuai kebutuhan. Kami berencana untuk memperluas akses bagi pengguna Plus dan Edu segera.
Untuk pengembang yang membangun dengan codex-mini terbaru, model tersebut tersedia di API Respons dan dihargai $1,50 per 1JT token masukan dan $6 per 1JT token keluaran, dengan diskon prompt caching sebesar 75%.
Codex masih dini dalam pengembangannya. Sebagai pratinjau riset, Codex saat ini kekurangan fitur seperti masukan gambar untuk tugas frontend, dan kemampuan untuk mengoreksi arah agen saat agen tersebut sedang bekerja. Selain itu, mendelegasikan ke agen jarak jauh membutuhkan waktu yang lebih banyak dari pengeditan interaktif, yang membutuhkan waktu agar terbiasa dengannya. Seiring waktu, interaksi dengan agen Codex akan makin menyerupai kolaborasi asinkron dengan rekan kerja. Seiring dengan kemajuan kemampuan model, kami memperkirakan agen akan mampu menangani tugas-tugas yang lebih kompleks dalam jangka waktu yang lebih lama.
Kami membayangkan sebuah masa depan yang mana para pengembang memegang kendali akan pekerjaan yang mereka inginkan dan mendelegasikan sisanya ke agen—bergerak lebih cepat dan menjadi makin produktif dengan AI. Untuk mencapai hal tersebut, kami sedang membangun rangkaian alat Codex yang mendukung kolaborasi real-time dan delegasi asinkron.
Pemasangan dengan alat AI seperti Codex CLI dan yang lainnya dengan cepat telah menjadi norma industri, membantu para pengembang bergerak lebih cepat saat melakukan koding. Namun kami meyakini alur kerja asinkron dan multiagen yang diperkenalkan Codex di ChatGPT akan menjadi jalan de facto bagi para pengembang untuk membuat kode berkualitas tinggi.
Pada akhirnya, kami melihat dua mode interaksi ini—pemasangan tugas secara real-time dan delegasi tugas—berkonvergensi. Pengembang akan berkolaborasi dengan agen AI di seluruh IDE mereka dan alat-alat sehari-harinya untuk mengajukan pertanyaan, mendapatkan saran, dan mendelegasikan tugas yang lebih panjang, semua di satu alur kerja yang terpadu.
Ke depannya, kami berencana untuk memperkenalkan alur kerja yang lebih interaktif dan fleksibel. Pengembang segera akan mampu untuk memberikan panduan tugas menengah, berkolaborasi dalam strategi implementasi, dan menerima pembaruan kemajuan proaktif. Kami juga membayangkan integrasi yang lebih dalam di seluruh alat yang sudah Anda gunakan: hari ini Codex terhubung dengan GitHub, dan segera Anda akan dapat menetapkan tugas dari Codex CLI, Desktop ChatGPT, atau bahkan alat-alat seperti pelacak masalah Anda atau sistem CI.
Teknik rekayasa perangkat lunak adalah salah satu yang pertama di industri yang mengalami keuntungan produktivitas signifikan yang didorong AI, membuka peluang baru untuk individu dan tim kecil. Meskipun kami optimis mengenai berbagai keuntungan ini, kami juga berkolaborasi bersama para mitra untuk lebih memahami implikasi dari adopsi agen yang meluas dalam alur kerja pengembang, pengembangan keahlian, tingkat keahlian, dan geografi.
Ini barulah permulaannya—dan kami sangat bersemangat untuk menyaksikan apa yang Anda bangun dengan Codex.
Pesan sistem
Kami membagikan pesan sistem codex-1 untuk membantu para pengembang memahami perilaku default model dan menyesuaikan Codex agar berfungsi secara efektif di alur kerja kustom. Misalnya, pesan sistem codex-1 mendorong Codex untuk menjalankan semua pengujian yang disebutkan di file AGENTS.md, tapi jika waktunya mendesak, Anda dapat meminta Codex untuk melewati berbagai pengujian ini.