Langsung ke konten utama
OpenAI

13 November 2025

Produk

Memperkenalkan GPT‑5.1 untuk pengembang

Memuat…

Hari ini kami merilis GPT‑5.1 di platform API, model terbaru dalam seri GPT‑5 yang menyeimbangkan kecerdasan dan kecepatan untuk berbagai tugas agen dan pengodean. GPT‑5.1 secara dinamis menyesuaikan waktu yang dihabiskan untuk berpikir berdasarkan kompleksitas tugas, membuat model jauh lebih cepat dan lebih efisien dalam penggunaan token pada tugas sehari-hari yang lebih sederhana. Model ini juga memiliki mode “tanpa penalaran” untuk merespons lebih cepat pada tugas yang tidak memerlukan pemikiran mendalam, sambil tetap mempertahankan kecerdasan terdepan GPT‑5.1.

Untuk membuat GPT‑5.1 lebih efisien, kami merilis prompt caching tambahan dengan retensi hingga 24 jam, menghasilkan respons yang lebih cepat untuk pertanyaan lanjutan dengan biaya yang lebih rendah. Pelanggan Pemrosesan Prioritas(terbuka di jendela baru) kami juga akan merasakan kinerja yang lebih cepat dengan GPT‑5.1 dibandingkan GPT‑5.

Dalam hal pengodean, kami telah bekerja sama erat dengan perusahaan rintisan seperti Cursor, Cognition, Augment Code, Factory, dan Warp untuk meningkatkan performa GPT‑5.1 gaya pengodean, kemampuan mengarahkan, dan kualitas kode. Secara umum, GPT‑5.1 terasa lebih mudah dipahami untuk digunakan dalam pengkodean dan lebih komunikatif dengan pembaruan kepada pengguna saat menyelesaikan tugas.

Akhirnya, kami memperkenalkan dua alat baru dengan GPT‑5.1: alat apply_patch yang dirancang untuk mengedit kode dengan lebih andal dan alat shell untuk memungkinkan model menjalankan perintah shell.

GPT‑5.1 adalah peningkatan terbaru dalam seri GPT‑5, dan kami berencana untuk terus berinvestasi dalam model yang lebih cerdas dan lebih mampu untuk membantu pengembang membangun alur kerja agen yang andal.

Penalaran efisien di berbagai tugas

Penalaran adaptif

Untuk membuat GPT‑5.1 lebih cepat, kami merombak cara melatihnya untuk berpikir. Pada tugas-tugas sederhana, GPT‑5.1 menggunakan lebih sedikit token untuk berpikir, memungkinkan pengalaman produk yang lebih cepat dan tagihan token yang lebih rendah. Pada tugas-tugas sulit yang memerlukan pemikiran ekstra, GPT‑5.1 tetap gigih, menjelajahi opsi dan memeriksa pekerjaannya untuk memaksimalkan keandalan.

Balyasny Asset Management(terbuka di jendela baru) menyatakan bahwa GPT‑5.1 "telah mengungguli baik GPT‑4.1 maupun GPT‑5 dalam rangkaian evaluasi dinamis penuh kami, dan berjalan 2-3 kali lebih cepat dari GPT‑5." Mereka juga mengatakan bahwa dalam tugas penalaran yang banyak menggunakan alat, GPT‑5.1 “secara konsisten menggunakan sekitar setengah dari jumlah token dibandingkan dengan pesaing utama dengan kualitas yang sama atau lebih baik.” Demikian pula, AI insurance BPO Pace(terbuka di jendela baru) juga menguji model tersebut dan mengatakan bahwa agen mereka beroperasi "50% lebih cepat pada GPT‑5.1 sekaligus melampaui akurasi GPT‑5 dan model terkemuka lainnya di seluruh evaluasi kami."

GPT‑5.1 memvariasikan waktu berpikirnya lebih dinamis daripada GPT‑5. Pada distribusi representatif tugas ChatGPT, GPT‑5.1 jauh lebih cepat dalam menyelesaikan tugas yang lebih mudah, bahkan ketika memerlukan upaya penalaran yang tinggi.

Sebagai contoh, ketika ditanya "tunjukkan perintah npm untuk menampilkan paket yang terpasang secara global", GPT‑5.1 menjawab dalam 2 detik, bukan 10 detik.

GPT-5 (Medium) memerlukan ~250 token (~10 detik)

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (Medium) memerlukan ~50 token (~2 detik)

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

Mode "tanpa penalaran" yang baru

Pengembang sekarang dapat menggunakan GPT‑5.1 tanpa penalaran dengan mengatur reasoning_effort ke 'none'. Ini membuat model berperilaku seperti model tanpa penalaran untuk kasus penggunaan yang sensitif terhadap latensi, dengan tetap mempertahankan kecerdasan tinggi GPT‑5.1 serta bonus tambahan berupa pemanggilan alat yang efisien. Dibandingkan dengan GPT‑5 dengan penalaran 'minimal', GPT‑5.1 tanpa penalaran lebih baik dalam pemanggilan alat secara paralel (yang dengan sendirinya meningkatkan kecepatan penyelesaian tugas ujung ke ujung), tugas pengodean, mengikuti instruksi, dan menggunakan alat pencarian—serta dukungan web search(terbuka di jendela baru) di platform API kami. Sierra(terbuka di jendela baru) menyampaikan bahwa GPT‑5.1 dalam mode “tanpa penalaran” menunjukkan “peningkatan 20% dalam kinerja pemanggilan alat berlatensi rendah dibandingkan dengan GPT‑5 dengan penalaran minimal” dalam evaluasi dunia nyata mereka.

Dengan diperkenalkannya 'none' sebagai nilai dalam reasoning_effort, para pengembang kini memiliki lebih banyak fleksibilitas dan kontrol atas keseimbangan antara kecepatan, biaya, dan kecerdasan untuk kasus penggunaan mereka. GPT‑5.1 secara default diatur ke 'none', yang ideal untuk beban kerja yang sensitif terhadap latensi. Kami menyarankan para pengembang memilih 'rendah' atau 'sedang' untuk tugas dengan kompleksitas lebih tinggi dan 'tinggi' ketika kecerdasan dan keandalan lebih penting daripada kecepatan.

Caching prompt tambahan

Caching tambahan meningkatkan efisiensi penalaran dengan memungkinkan prompt tetap aktif dalam cache hingga 24 jam, bukan hanya beberapa menit seperti yang didukung saat ini. Dengan jendela retensi yang lebih panjang, lebih banyak permintaan tindak lanjut dapat memanfaatkan konteks yang di-cache—menghasilkan latensi yang lebih rendah, biaya yang lebih rendah, dan kinerja yang lebih lancar untuk interaksi jangka panjang seperti percakapan multi-giliran, sesi pengodean, atau alur kerja pengambilan pengetahuan.

Harga prompt tetap tidak berubah, dengan token input yang di-cache 90% lebih murah daripada token yang tidak di-cache, dan tidak ada biaya tambahan untuk penulisan atau penyimpanan cache. Untuk menggunakan caching tambahan dengan GPT‑5.1, tambahkan parameter “prompt_cache_retention='24h'” pada API Respons atau API Penyelesaian Obrolan. Silakan lihat dokumen caching prompt(terbuka di jendela baru) untuk detail lebih lanjut.

Pengodean

GPT‑5.1 dibangun dengan dasar kemampuan pengodean GPT‑5 tapi dengan kepribadian pengodean yang lebih dapat diarahkan, lebih sedikit overthinking, kualitas kode yang lebih baik, pesan pembaruan yang lebih tepat sasaran bagi pengguna (preambles) selama rangkaian pemanggilan alat, dan desain antarmuka depan yang lebih fungsional—terutama dengan upaya penalaran yang rendah.

Pada tugas pengodean yang lebih sederhana seperti pengeditan kode cepat, GPT‑5.1 kecepatan yang lebih tinggi mempermudah proses iterasi bolak-balik. GPT‑5.1’s kecepatan yang lebih tinggi pada tugas-tugas sederhana tidak mengurangi kinerja pada tugas-tugas yang sulit. Pada SWE-bench Verified, GPT‑5.1 bekerja lebih lama dari GPT‑5 dan mencapai 76,3%.

Di SWE-bench Verified⁠, sebuah model diberikan repositori kode dan deskripsi masalah, dan harus buat patch untuk menyelesaikan masalah tersebut. Label menunjukkan upaya penalaran. Akurasi dirata-ratakan di semua 500 masalah. Semua model menggunakan harness dengan alat apply_patch berbasis JSON.

Kami menerima masukan awal tentang GPT‑5.1 dari beberapa perusahaan pengodean. Berikut adalah kesan mereka:

  • Augment Code(terbuka di jendela baru) menyebut GPT‑5.1 “lebih terarah dengan lebih sedikit tindakan yang terbuang, penalaran yang lebih efisien, dan fokus tugas yang lebih baik, serta mereka melihat perubahan yang lebih akurat, pull request yang lebih mulus, dan iterasi yang lebih cepat pada proyek proyek multi-file.”
  • Cline(terbuka di jendela baru) menyampaikan bahwa dalam evaluasi mereka, “GPT‑5.1 mencapai SOTA pada benchmark pengeditan diff kami dengan peningkatan 7%, menunjukkan keandalan yang luar biasa untuk tugas pengodean yang kompleks.”
  • CodeRabbit(terbuka di jendela baru) menyebut GPT‑5.1 sebagai “model pilihan utama untuk tinjauan PR.”
  • Cognition(terbuka di jendela baru) mengatakan GPT‑5.1 “jelas lebih baik dalam memahami apa yang Anda minta dan bekerja sama dengan Anda untuk menyelesaikannya.”
  • Factory(terbuka di jendela baru) mengatakan “GPT‑5.1 memberikan respons yang lebih cepat dan menyesuaikan kedalaman penalarannya dengan tugas, mengurangi overthinking dan meningkatkan pengalaman pengembang secara keseluruhan.”
  • Warp(terbuka di jendela baru) menjadikan GPT‑5.1 sebagai default untuk pengguna baru, dengan mengatakan bahwa itu “dibangun dengan dasar peningkatan kecerdasan yang mengesankan yang diperkenalkan oleh seri GPT‑5, sekaligus menjadi model yang jauh lebih responsif.”
"GPT 5.1 bukan sekadar LLM biasa—benar-benar bersifat agen, model paling otonom yang pernah saya uji. GPT 5.1 menulis seperti Anda, membuat kode seperti Anda, mengikuti instruksi yang rumit dengan mudah, dan unggul dalam tugas-tugas front-end, serta cocok dengan basis kode Anda yang sudah ada. Anda benar-benar dapat membuka potensi penuhnya di API Respons dan kami senang menawarkannya di IDE kami."
—Denis Shiryaev, Kepala Ekosistem AI DevTools, JetBrains

Alat baru dalam GPT‑5.1

Kami memperkenalkan dua alat baru dalam GPT‑5.1 untuk membantu pengembang mendapatkan hasil maksimal dari model di Responses API: alatapply_patch bebas untuk membuat pengeditan kode menjadi lebih andal tanpa perlu melakukan escaping JSON, dan alatshellyang memungkinkan model menulis perintah untuk dijalankan di mesin lokal Anda.

Alat Apply_patch

Alat apply_patch bebas memungkinkan GPT‑5.1 untuk membuat, memperbarui, dan menghapus file dalam basis kode menggunakan diff terstruktur. Tidak hanya menyarankan pengeditan, model juga mengeluarkan operasi patch yang diterapkan oleh aplikasi dan dilaporkan kembali, memungkinkan alur kerja pengeditan kode multi-langkah yang berulang.

Untuk menggunakan alat apply_patch di API Respons, sertakan dalam array tools dengan "tools": [{“type”: “apply_patch”}] dan sertakan konten file dalam masukan Anda atau berikan alat kepada model untuk berinteraksi dengan sistem file Anda. Model akan membuat item apply_patch_call untuk membuat, memperbarui, atau menghapus file yang berisi diff yang Anda terapkan pada sistem file Anda. Untuk informasi lebih lanjut tentang cara mengintegrasikan dengan alat apply_patch, silakan lihat dokumentasi pengembang(terbuka di jendela baru) kami.

Alat Shell

Alat shell memungkinkan model untuk berinteraksi dengan komputer lokal melalui antarmuka baris perintah yang terkontrol. Model ini mengusulkan perintah shell; integrasi pengembang mengeksekusinya dan mengembalikan outputnya. Ini menciptakan loop rencana-eksekusi sederhana yang memungkinkan model memeriksa sistem, menjalankan utilitas, dan mengumpulkan data hingga mereka dapat menyelesaikan tugas.

Untuk menggunakan alat shell di API Respons, pengembang dapat memasukkannya ke dalam array alat dengan "tools": [{“type”: “shell”}]. API akan membuat item "shell_call" yang berisi perintah shell untuk dijalankan. Para pengembang menjalankan perintah di lingkungan lokal dan mengembalikan hasil eksekusi dalam item "shell_call_output" pada permintaan API selanjutnya. Pelajari lebih lanjut di dokumentasi pengembang(terbuka di jendela baru) kami.

Harga dan ketersediaan

GPT‑5.1 and gpt-5.1-chat-latest tersedia untuk pengembang di semua tingkatan berbayar dalam API. Harga dan batasan tarif(terbuka di jendela baru) sama dengan GPT‑5. Kami juga meluncurkan gpt-5.1-codex dan gpt-5.1-codex-mini di API. Meskipun GPT‑5.1 unggul dalam sebagian besar tugas pengodean, gpt-5.1-codex model dioptimalkan untuk tugas pengodean jangka panjang dan bersifat agen dalam Codex atau harness mirip Codex.

Para pengembang dapat mulai membangun menggunakan dokumentasi pengembang(terbuka di jendela baru) dan panduan pemodelan model(terbuka di jendela baru) GPT‑5.1 kami. Saat ini kami tidak berencana untuk menghentikan GPT‑5 di API dan akan memberikan pemberitahuan sebelumnya kepada para pengembang jika dan ketika kami memutuskan untuk melakukannya.

Selanjutnya

Kami berkomitmen untuk terus menerapkan model yang paling cakap dan andal untuk pekerjaan agen dan pengodean nyata—model yang berpikir secara efisien, beriterasi dengan cepat, dan menangani tugas-tugas kompleks sekaligus menjaga kelancaran kerja pengembang. Dengan penalaran adaptif, kinerja pengodean yang lebih kuat, pembaruan yang lebih jelas untuk pengguna, dan alat baru seperti apply_patch dan shell, GPT‑5.1 dirancang untuk membantu Anda membangun dengan lebih sedikit hambatan. Dan kami akan terus berinvestasi besar-besaran di sini: Anda dapat mengharapkan model agen dan pengodean yang lebih cakap dalam beberapa minggu dan bulan mendatang.

Lampiran: Evaluasi model

Evaluasi

GPT‑5.1 (tinggi)

GPT‑5 (tinggi)

SWE-bench Verified
(semua 500 masalah)

76,3%

72,8%

GPQA Diamond
(tanpa alat)

88,1%

85,7%

AIME 2025
(tanpa alat

94,0%

94,6%

FrontierMath
(dengan alat Python)

26,7%

26,3%

MMMU

85,4%

84,2%

Tau2-bench Airline

67,0%

62,6%

Tau2-bench Telecom*

95,6%

96,7%

Tau2-bench Retail

77,9%

81,1%

BrowseComp Konteks Panjang 128 ribu

90,0%

90,0%

* Untuk Tau2-bench Telecom, kami memberikan GPT‑5.1 sebuah prompt singkat yang bermanfaat secara umum untuk meningkatkan kinerjanya.

Penulis

OpenAI