16 Mei 2025

Memperkenalkan Codex

Sebuah agen rekayasa perangkat lunak berbasis cloud yang dapat bekerja di berbagai tugas secara paralel, ditenagai oleh codex-1. Tersedia untuk pengguna ChatGPT Pro, Team, dan Enterprise untuk saat ini dan bagi pengguna Plus segera.

Coba Codex

Dasbor menanyakan ‘Apa yang harus kita kodekan selanjutnya?’ dengan kotak prompt, pemilih repo/cabang, dan daftar tugas pada latar belakang bertema kode pastel.

Memuat…

Diperbarui pada 3 Juni 2025: Codex sekarang tersedia bagi pengguna ChatGPT Plus. Kami juga memungkinkan pengguna untuk menyediakan akses internet kepada Codex selama pelaksanaan tugas. Harap mengacu pada changelog⁠(terbuka di jendela baru) dan dokumen⁠(terbuka di jendela baru) untuk detail selengkapnya.

Hari ini kami sedang meluncurkan pratinjau riset dari Codex: sebuah agen rekayasa perangkat lunak berbasis cloud yang dapat bekerja di berbagai tugas secara paralel. Codex dapat melakukan berbagai tugas untuk Anda seperti menulis fitur, menjawab pertanyaan mengenai codebase, memperbaiki bug, dan mengajukan permintaan penuh untuk melakukan peninjauan; setiap tugas berjalan di lingkungan sandbox cloud tersendiri, dilengkapi dengan repositori.

Codex ditenagai oleh codex-1,versi dari OpenAI o3 yang dioptimalkan untuk teknik rekayasa perangkat lunak. Codex dilatih dengan menggunakan pembelajaran penguatan di tugas koding dunia sebenarnya di berbagai lingkungan untuk membuat kode yang sangat mirip dengan preferensi gaya manusia dan PR, mematuhi instruksi dengan presisi dan dapat menjalankan pengujian berulang hingga menerima hasil kelulusan. Kami mulai meluncurkan Codex untuk para pengguna ChatGPT Pro, Enterprise, dan Team hari ini, serta dukungan untuk Plus dan Edu akan segera hadir.

Cara kerja Codex

Kini Anda dapat mengakses Codex melalui sidebar di ChatGPT dan menerapkan tugas koding baru padanya dengan mengetik prompt dan mengeklik “Kode”. Jika Anda ingin mengajukan kepada Codex sebuah pertanyaan terkait codebase, klik “Tanya”. Setiap tugas diproses secara independen dalam lingkungan terpisah dan terisolasi yang dilengkapi dengan codebase. Codex dapat membaca dan mengedit file, sekaligus menjalankan perintah termasuk pengujian harness, linter, dan pemeriksa tipe. Penyelesaian tugas biasanya memerlukan waktu antara 1 dan 30 menit, bergantung pada tingkat kerumitan, dan Anda dapat memantau perkembangan Codex secara real time.

Setelah Codex menyelesaikan suatu tugas, Codex berkomitmen terhadap perubahannya di lingkungannya sendiri. Codex memberikan bukti terverifikasi dari tindakannya melalui kutipan dari log terminal dan hasil pengujian, yang memungkinkan Anda untuk melacak setiap langkah yang diambil selama proses penyelesaian tugas. Anda kemudian dapat meninjau hasilnya, meminta revisi lebih lanjut, membuka pull request GitHub, atau secara langsung mengintegrasikan perubahannya ke dalam lingkungan lokal Anda. Dalam produk tersebut, Anda dapat mengonfigurasi lingkungan Codex untuk menyesuaikan lingkungan pengembangan asli Anda semirip mungkin.

Codex dapat dipandu oleh file AGENTS.md yang ditempatkan di dalam repositori. Semua ini adalah file teks, mirip dengan README.md, yang mana Anda dapat menginformasikan Codex cara untuk menavigasi codebase, perintah mana untuk menjalankan pengujian, dan cara terbaik untuk mematuhi praktik standar proyek Anda. Layaknya pengembang manusia, agen Codex melakukan yang terbaik saat disediakan lingkungan dev yang terkonfigurasi, penyiapan pengujian yang andal, dan dokumen yang jelas.

Dalam tolok ukur evaluasi koding dan internal, codex-1 menunjukkan kinerja yang kuat bahkan tanpa file AGENTS.md atau membangun kerangka kerja kustom.

Sampel Terverifikasi 23 SWE-Bench yang tidak dapat dijalankan di infrastruktur internal kami telah dikecualikan. codex-1 telah diuji pada panjang konteks maksimal dari 192 ribu token dan upaya penalaran sedang, yang merupakan pengaturan yang akan tersedia untuk produk saat ini. Untuk detail mengenai evaluasi o3, lihat di sini⁠.

Tolok ukur tugas SWE internal kami disusun dari tugas-tugas SWE internal dunia sebenarnya di OpenAI.

Membangun agen yang aman dan tepercaya

Kami sedang merilis Codex sebagai pratinjau riset, sesuai dengan strategi penerapan berulang kami. Kami memprioritaskan keamanan dan transparansi saat merancang Codex sehingga pengguna dapat memverifikasi keluarannya - langkah perlindungan yang menjadi makin penting karena model AI menangani tugas-tugas koding yang makin rumit dan pertimbangan keselamatan meningkat. Pengguna dapat memeriksa pekerjaan Codex melalui kutipan, log terminal, dan hasil pengujian. Saat ada ketidakpastian dan dihadapkan dengan kegagalan pengujian, agen Codex secara eksplisit mengomunikasikan masalahnya, memungkinkan pengguna untuk melakukan pengambilan keputusan berdasarkan informasi mengenai langkah yang harus diambil. Masih tetap penting bagi pengguna untuk meninjau dan memvalidasi semua kode yang dibuat oleh agen secara manual sebelum integrasi dan eksekusi.

Tangkapan layar tinjauan Kode dengan lapisan file pengujian sedang memverifikasi nama file yang dikutip, dengan ringkasan dan hasil pengujian di latar belakang berwarna biru.

Tangkapan layar tinjauan kode dengan lapisan terminal hitam menampilkan satu pengujian kelulusan untuk nama file yang dikutip; ringkasan dan diff dari ‘Fix /diff error with special characters’ tampak di latar belakang pastel biru.

Menyelaraskan dengan preferensi manusia

Tujuan utama saat melatih codex-1 adalah untuk menyelaraskan keluaran sedekat mungkin dengan preferensi dan standar koding manusia. Dibandingkan dengan OpenAI o3, codex-1 secara konsisten memproduksi patch lebih bersih yang siap untuk tinjauan manusia dan integrasi alur kerja standar yang mendesak.

Please fix the following issue in the astropy/astropy repository. Please resolve the issue in the problem below by editing and testing code files in your current code execution session. The repository is cloned in the /testbed folder. You must fully solve the problem for your answer to be considered correct. Problem statement:Modeling's `separability_matrix` does not compute separability correctly for nested CompoundModels Consider the following model: ```python from astropy.modeling import models as m from astropy.modeling.separable import separability_matrix cm = m.Linear1D(10) & m.Linear1D(5) ``` It's separability matrix as you might expect is a diagonal: ```python >>> separability_matrix(cm) array([[ True, False], [False, True]]) ``` If I make the model more complex: ```python >>> separability_matrix(m.Pix2Sky_TAN() & m.Linear1D(10) & m.Linear1D(5)) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, False], [False, False, False, True]]) ``` The output matrix is again, as expected, the outputs and inputs to the linear models are separable and independent of each other. If however, I nest these compound models: ```python >>> separability_matrix(m.Pix2Sky_TAN() & cm) array([[ True, True, False, False], [ True, True, False, False], [False, False, True, True], [False, False, True, True]]) ``` Suddenly the inputs and outputs are no longer separable? This feels like a bug to me, but I might be missing something?

Codex

OpenAI o3

Mencegah pelecehan

Perlindungan terhadap aplikasi berbahaya dari teknik rekayasa perangkat lunak yang berbasis AI, seperti pengembangan malware, menjadi makin penting. Pada saat yang sama, penting agar langkah-langkah perlindungan tidak secara berlebihan menghambat penerapan yang sah dan bermanfaat yang mungkin melibatkan teknik-teknik yang kadang-kadang juga digunakan untuk pengembangan malware, seperti rekayasa kernel tingkat rendah.

Untuk menyeimbangkan keselamatan dan kebermanfaatan, Codex dilatih untuk mengidentifikasi dan secara presisi menolak permintaan yang bertujuan untuk mengembangkan perangkat lunak berbahaya, sekaligus membedakan dengan jelas dan mendukung tugas-tugas yang sah. Kami juga telah menyempurnakan kerangka kerja kebijakan kami dan menggabungkan evaluasi keselamatan yang ketat untuk memperkuat batasan-batasan ini secara efektif. Kami telah menerbitkan lampiran Kartu Sistem o3⁠ untuk merefleksikan berbagai evaluasi ini.

Eksekusi yang aman

Agen Codex beroperasi sepenuhnya di dalam kontainer yang aman dan terisolasi di cloud. Saat eksekusi tugas, akses internet dinonaktifkan, membatasi interaksi agen agar semata-mata pada kode yang secara eksplisit disediakan melalui repositori GitHub dan dependensi prainstal yang dikonfigurasi oleh pengguna melalui skrip penyiapan. Agen tidak dapat mengakses situs web eksternal, API, atau layanan lainnya.

Contoh penggunaan awal

Tim teknis di OpenAI telah mulai menggunakan Codex sebagai bagian dari perangkat sehari-hari mereka. Codex paling sering digunakan oleh teknisi OpenAI untuk mendelegasikan tugas-tugas yang berulang dan memiliki cakupan yang jelas seperti refactoring, mengubah nama, dan menulis pengujian, yang jika dilakukan sendiri akan merusak fokus. Codex juga dapat digunakan untuk membangun kerangka kerja fitur baru, menghubungkan komponen, memperbaiki bug, dan menyusun dokumentasi. Tim sedang membangun kebiasaan baru sehubungan dengannya: mencatat masalah panggilan, merencanakan tugas di awal hari, dan mendelegasikan pekerjaan latar belakang agar terus melangkah maju. Dengan mengurangi pergantian konteks dan mengingatkan tugas-tugas yang terlupakan, Codex membantu insinyur merilis produk lebih cepat dan tetap fokus pada hal-hal yang paling penting.

Menjelang rilis, kami juga telah bekerja dengan grup kecil dari penguji eksternal untuk lebih memahami bagaimana performa Codex di berbagai codebase, proses pengembangan, dan tim yang berbeda.

Cisco⁠(terbuka di jendela baru) sedang mendalami cara Codex dapat membantu tim teknik rekayasa mereka untuk bisa menghadirkan berbagai ide penuh ambisi ke kehidupan dengan lebih cepat. Sebagai mitra desain awal, Cisco membantu membentuk masa depan Codex dengan melakukan evaluasi padanya dalam kasus penggunaan dunia sebenarnya di seluruh portofolio produk mereka dan memberikan masukan pada tim OpenAI.
Temporal⁠(terbuka di jendela baru) menggunakan Codex untuk mempercepat pengembangan fitur, merunut masalah, menulis dan mengeksekusi pengujian, dan melakukan refaktor codebase besar. Codex juga membantu mereka tetap fokus dengan menjalankan tugas-tugas rumit di latar belakang—menjaga teknisi tetap berada dalam alur saat mempercepat iterasi.
Superhuman⁠(terbuka di jendela baru) menggunakan Codex untuk mempercepat tugas-tugas kecil tetapi berulang seperti meningkatkan cakupan pengujian dan memperbaiki kegagalan integrasi. Codex juga membantu mereka merilis lebih cepat dengan mengaktifkan pengelola produk untuk berkontribusi pada perubahan kode ringan tanpa melibatkan teknisi, kecuali untuk peninjauan kode.
Kodiak⁠(terbuka di jendela baru) menggunakan Codex untuk membantu menulis alat perunutan, meningkatkan cakupan pengujian, dan refraktor kode—mempercepat pengembangan Kodiak Driver, teknologi swakemudi mereka. Codex juga telah menjadi alat referensi yang bernilai, membantu para teknisi memahami bagian yang tidak dikenal dari ekosistem dengan menampilkan konteks yang relevan dan perubahan yang lalu.

Berdasarkan pembelajaran dari penguji awal, kami merekomendasikan menetapkan tugas yang tercakup dengan baik ke banyak agen secara bersamaan, dan melakukan eksperimen dengan tipe tugas dan prompt yang berbeda untuk mendalami kemampuan model secara efektif.

Pembaruan Codex CLI

Bulan lalu, kami telah meluncurkan Codex CLI, agen koding sumber terbuka ringan yang berjalan di terminal. Codex CLI menghadirkan kekuatan model seperti o3 dan o4-mini ke dalam alur kerja lokal, mempermudah memasangkannya untuk menyelesaikan tugas dengan lebih cepat.

Kini, kami juga sedang merilis versi codex-1 yang lebih kecil, versi o4-mini yang dirancang secara khusus untuk digunakan di Codex CLI. Model baru ini mendukung alur kerja yang lebih cepat di CLI dan dioptimalkan untuk Q&A dan pengeditan kode latensi rendah, sekaligus mempertahankan kekuatan yang sama dalam mengikuti instruksi dan gaya. Model ini kini tersedia sebagai model default di Codex CLI dan di API sebagai codex-mini-latest. Snapshot dasar akan diperbarui secara rutin seiring kami terus meningkatkan model Codex-mini.

Kami juga membuatnya lebih mudah untuk menghubungkan akun pengembang ke Codex CLI. Alih-alih membuat dan mengonfigurasi manual token API, Anda sekarang dapat masuk dengan akun ChatGPT dan memilih organisasi API yang ingin digunakan. Kami akan otomatis membuat dan mengonfigurasi kunci API untuk Anda. Pengguna Plus dan Pro yang masuk ke Codex CLI dengan ChatGPT juga dapat mulai menukarkan $5 dan $50 dalam bentuk kredit API gratis, masing-masing, nanti di kemudian hari dalam 30 hari selanjutnya.

Ketersediaan, harga, dan batasan Codex

Mulai hari ini, kami meluncurkan Codex untuk para pengguna ChatGPT Pro, Enterprise, dan Team secara global, dengan dukungan untuk Plus dan Edu akan segera hadir. Pengguna akan memiliki akses berlimpah tanpa biaya tambahan untuk minggu-minggu yang akan datang sehingga Anda dapat mendalami apa yang dapat Codex lakukan, setelah itu kami akan meluncurkan opsi akses dengan batasan dan skema biaya fleksibel yang memungkinkan Anda membeli penggunaan tambahan sesuai kebutuhan. Kami berencana untuk memperluas akses bagi pengguna Plus dan Edu segera.

Untuk pengembang yang membangun dengan codex-mini terbaru, model tersebut tersedia di API Respons dan dihargai $1,50 per 1JT token masukan dan $6 per 1JT token keluaran, dengan diskon prompt caching sebesar 75%.

Codex masih dini dalam pengembangannya. Sebagai pratinjau riset, Codex saat ini kekurangan fitur seperti masukan gambar untuk tugas frontend, dan kemampuan untuk mengoreksi arah agen saat agen tersebut sedang bekerja. Selain itu, mendelegasikan ke agen jarak jauh membutuhkan waktu yang lebih banyak dari pengeditan interaktif, yang membutuhkan waktu agar terbiasa dengannya. Seiring waktu, interaksi dengan agen Codex akan makin menyerupai kolaborasi asinkron dengan rekan kerja. Seiring dengan kemajuan kemampuan model, kami memperkirakan agen akan mampu menangani tugas-tugas yang lebih kompleks dalam jangka waktu yang lebih lama.

Selanjutnya

Kami membayangkan sebuah masa depan yang mana para pengembang memegang kendali akan pekerjaan yang mereka inginkan dan mendelegasikan sisanya ke agen—bergerak lebih cepat dan menjadi makin produktif dengan AI. Untuk mencapai hal tersebut, kami sedang membangun rangkaian alat Codex yang mendukung kolaborasi real-time dan delegasi asinkron.

Pemasangan dengan alat AI seperti Codex CLI dan yang lainnya dengan cepat telah menjadi norma industri, membantu para pengembang bergerak lebih cepat saat melakukan koding. Namun kami meyakini alur kerja asinkron dan multiagen yang diperkenalkan Codex di ChatGPT akan menjadi jalan de facto bagi para pengembang untuk membuat kode berkualitas tinggi.

Pada akhirnya, kami melihat dua mode interaksi ini—pemasangan tugas secara real-time dan delegasi tugas—berkonvergensi. Pengembang akan berkolaborasi dengan agen AI di seluruh IDE mereka dan alat-alat sehari-harinya untuk mengajukan pertanyaan, mendapatkan saran, dan mendelegasikan tugas yang lebih panjang, semua di satu alur kerja yang terpadu.

Ke depannya, kami berencana untuk memperkenalkan alur kerja yang lebih interaktif dan fleksibel. Pengembang segera akan mampu untuk memberikan panduan tugas menengah, berkolaborasi dalam strategi implementasi, dan menerima pembaruan kemajuan proaktif. Kami juga membayangkan integrasi yang lebih dalam di seluruh alat yang sudah Anda gunakan: hari ini Codex terhubung dengan GitHub, dan segera Anda akan dapat menetapkan tugas dari Codex CLI, Desktop ChatGPT, atau bahkan alat-alat seperti pelacak masalah Anda atau sistem CI.

Teknik rekayasa perangkat lunak adalah salah satu yang pertama di industri yang mengalami keuntungan produktivitas signifikan yang didorong AI, membuka peluang baru untuk individu dan tim kecil. Meskipun kami optimis mengenai berbagai keuntungan ini, kami juga berkolaborasi bersama para mitra untuk lebih memahami implikasi dari adopsi agen yang meluas dalam alur kerja pengembang, pengembangan keahlian, tingkat keahlian, dan geografi.

Ini barulah permulaannya—dan kami sangat bersemangat untuk menyaksikan apa yang Anda bangun dengan Codex.

Putar ulang streaming langsung

Lampiran

Pesan sistem

Kami membagikan pesan sistem codex-1 untuk membantu para pengembang memahami perilaku default model dan menyesuaikan Codex agar berfungsi secara efektif di alur kerja kustom. Misalnya, pesan sistem codex-1 mendorong Codex untuk menjalankan semua pengujian yang disebutkan di file AGENTS.md, tapi jika waktunya mendesak, Anda dapat meminta Codex untuk melewati berbagai pengujian ini.

1# Instructions
2- The user will provide a task.
3- The task involves working with Git repositories in your current working directory.
4- Wait for all terminal commands to be completed (or terminate them) before finishing.
5
6# Git instructions
7If completing the user's task requires writing or modifying files:
8- Do not create new branches.
9- Use git to commit your changes.
10- If pre-commit fails, fix issues and retry.
11- Check git status to confirm your commit. You must leave your worktree in a clean state.
12- Only committed code will be evaluated.
13- Do not modify or amend existing commits.
14
15# AGENTS.md spec
16- Containers often contain AGENTS.md files. These files can appear anywhere in the container's filesystem. Typical locations include `/`, `~`, and in various places inside of Git repos.
17- These files are a way for humans to give you (the agent) instructions or tips for working within the container.
18- Some examples might be: coding conventions, info about how code is organized, or instructions for how to run or test code.
19- AGENTS.md files may provide instructions about PR messages (messages attached to a GitHub Pull Request produced by the agent, describing the PR). These instructions should be respected.
20- Instructions in AGENTS.md files:
21  - The scope of an AGENTS.md file is the entire directory tree rooted at the folder that contains it.
22  - For every file you touch in the final patch, you must obey instructions in any AGENTS.md file whose scope includes that file.
23  - Instructions about code style, structure, naming, etc. apply only to code within the AGENTS.md file's scope, unless the file states otherwise.
24  - More-deeply-nested AGENTS.md files take precedence in the case of conflicting instructions.
25  - Direct system/developer/user instructions (as part of a prompt) take precedence over AGENTS.md instructions.
26- AGENTS.md files need not live only in Git repos. For example, you may find one in your home directory.
27- If the AGENTS.md includes programmatic checks to verify your work, you MUST run all of them and make a best effort to validate that the checks pass AFTER all code changes have been made.
28  - This applies even for changes that appear simple, i.e. documentation. You still must run all of the programmatic checks.
29
30# Citations instructions
31- If you browsed files or used terminal commands, you must add citations to the final response (not the body of the PR message) where relevant. Citations reference file paths and terminal outputs with the following formats:
32  1) `【F:<file_path>†L<line_start>(-L<line_end>)?】`
33  - File path citations must start with `F:`. `file_path` is the exact file path of the file relative to the root of the repository that contains the relevant text.
34  - `line_start` is the 1-indexed start line number of the relevant output within that file.
35  2) `【<chunk_id>†L<line_start>(-L<line_end>)?】`
36  - Where `chunk_id` is the chunk_id of the terminal output, `line_start` and `line_end` are the 1-indexed start and end line numbers of the relevant output within that chunk.
37- Line ends are optional, and if not provided, line end is the same as line start, so only 1 line is cited.
38- Ensure that the line numbers are correct, and that the cited file paths or terminal outputs are directly relevant to the word or clause before the citation.
39- Do not cite completely empty lines inside the chunk, only cite lines that have content.
40- Only cite from file paths and terminal outputs, DO NOT cite from previous pr diffs and comments, nor cite git hashes as chunk ids.
41- Use file path citations that reference any code changes, documentation or files, and use terminal citations only for relevant terminal output.
42- Prefer file citations over terminal citations unless the terminal output is directly relevant to the clauses before the citation, i.e. clauses on test results.
43  - For PR creation tasks, use file citations when referring to code changes in the summary section of your final response, and terminal citations in the testing section.
44  - For question-answering tasks, you should only use terminal citations if you need to programmatically verify an answer (i.e. counting lines of code). Otherwise, use file citations.

Penulis

OpenAI