Evolusi berikutnya dari SDK Agen
SDK Agen yang diperbarui membantu pengembang membangun agen yang dapat memeriksa file, menjalankan perintah, mengedit kode, dan mengerjakan tugas jangka panjang dalam lingkungan sandbox yang terkontrol.
Kami memperkenalkan kemampuan baru pada SDK Agen yang memberi infrastruktur terstandarisasi yang mudah untuk mulai digunakan dan dibangun dengan benar untuk model OpenAI kepada pengembang: harness bawaan model yang memungkinkan agen bekerja di berbagai file dan alat pada komputer, ditambah eksekusi sandbox bawaan untuk menjalankan pekerjaan tersebut dengan aman.
Misalnya, pengembang dapat memberikan agen sebuah workspace yang terkontrol, instruksi eksplisit, dan alat yang dibutuhkannya untuk memeriksa bukti:
Pengembang membutuhkan lebih dari sekadar model terbaik untuk membangun agen yang berguna—mereka membutuhkan sistem yang mendukung cara agen memeriksa file, menjalankan perintah, menulis kode, dan tetap bekerja di banyak langkah.
Sistem yang ada saat ini hadir dengan konsekuensi saat tim beralih dari tahap prototipe menuju produksi. Kerangka kerja yang agnostik terhadap model bersifat fleksibel, namun tidak memanfaatkan kemampuan model mutakhir secara maksimal; SDK dari penyedia model dapat memiliki kedekatan yang lebih erat dengan model itu sendiri, namun sering kali kurang memberikan visibilitas yang memadai terhadap infrastruktur pendukungnya; sementara itu, API agen terkelola dapat menyederhanakan penerapan, namun membatasi lokasi eksekusi agen serta cara mereka mengakses data sensitif.
Berikut pendapat beberapa pelanggan yang menguji SDK baru bersama kami:
“GPT-5.4 menetapkan standar baru untuk pekerjaan hukum yang banyak melibatkan dokumen. Pada evaluasi BigLaw Bench kami, model ini mencetak skor 91%. Dibandingkan dengan model lain, GPT-5.4 saat ini lebih baik dalam menyusun analisis transaksional yang kompleks, mempertahankan akurasi di seluruh kontrak yang panjang, dan memberikan tingkat detail tinggi yang dibutuhkan oleh praktisi hukum.”
Dengan rilis hari ini, harness SDK Agen menjadi lebih mumpuni untuk agen yang bekerja dengan dokumen, file, dan sistem. Kini, harness ini menambahkan memori yang dapat dikonfigurasi, orkestrasi yang sadar terhadap sandbox, alat sistem file mirip Codex, dan integrasi terstandardisasi dengan primitive yang semakin umum dalam sistem agen terdepan.
Primitive ini mencakup penggunaan alat melalui MCP(terbuka di jendela baru), pengungkapan bertahap melalui skill(terbuka di jendela baru), instruksi kustom melalui AGENTS.md(terbuka di jendela baru), eksekusi kode menggunakan alat shell(terbuka di jendela baru), pengeditan file menggunakan alat apply patch(terbuka di jendela baru), dan banyak lagi. Harness ini akan terus menggabungkan pola agentik dan primitive baru seiring waktu, sehingga para pengembang dapat menghabiskan lebih sedikit waktu untuk pembaruan infrastruktur inti dan lebih banyak waktu untuk logika spesifik domain yang membuat agen mereka berguna.
Harness ini juga membantu pengembang membuka lebih banyak kemampuan model terdepan dengan menyelaraskan eksekusi dengan cara model-model tersebut bekerja paling optimal. Hal itu membuat agen tetap lebih dekat dengan pola operasional alami model, sehingga meningkatkan keandalan dan kinerja pada tugas-tugas kompleks—terutama ketika pekerjaan berdurasi panjang atau dikoordinasikan di berbagai alat dan sistem yang beragam.
Selain itu, kami menyadari bahwa setiap produk itu unik dan jarang benar-benar sesuai dengan pola tertentu. Kami merancang SDK Agen untuk mendukung keberagaman ini. Pengembang mendapatkan harness yang siap pakai namun tetap fleksibel—sehingga mudah disesuaikan dengan stack mereka sendiri—termasuk penggunaan alat, memori, dan lingkungan sandbox.
SDK Agen yang diperbarui mendukung eksekusi sandbox secara bawaan, sehingga agen dapat berjalan di lingkungan komputer yang terkontrol dengan file, alat, dan dependensi yang mereka perlukan untuk suatu tugas.
Banyak agen yang berguna memerlukan workspace tempat mereka dapat membaca dan menulis file, menginstal dependensi, menjalankan kode, dan menggunakan alat dengan aman. Dukungan sandbox bawaan memberikan pengembang lapisan eksekusi tersebut secara siap pakai, alih-alih memaksa mereka menyatukannya sendiri.
Pengembang dapat membawa sandbox mereka sendiri atau menggunakan dukungan bawaan untuk Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, dan Vercel.
Untuk membuat lingkungan tersebut portabel di berbagai penyedia, SDK juga memperkenalkan abstraksi Manifest untuk mendeskripsikan workspace agen. Developer dapat memasang file lokal, menentukan direktori output, dan mengambil data dari penyedia penyimpanan termasuk AWS S3, Google Cloud Storage, Azure Blob Storage, dan Cloudflare R2.
Hal ini memberikan pengembang cara yang konsisten untuk membentuk lingkungan agen dari tahap prototipe lokal hingga penerapan di lingkungan produksi. Hal ini juga memberi model workspace yang dapat diprediksi: tempat menemukan input, tempat menulis output, dan cara menjaga pekerjaan tetap teratur di seluruh tugas jangka panjang.

Sistem agen harus dirancang dengan asumsi adanya upaya injeksi prompt dan eksfiltrasi. Memisahkan harness dan komputasi membantu menjaga kredensial tetap berada di luar lingkungan tempat kode yang dihasilkan model dijalankan.
Hal ini juga memungkinkan eksekusi yang tahan lama. Ketika status agen dieksternalisasi, kehilangan kontainer sandbox tidak berarti kehilangan proses eksekusi. Dengan snapshotting dan rehidrasi bawaan, SDK Agen dapat memulihkan status agen di kontainer baru dan melanjutkan dari checkpoint terakhir jika lingkungan asli gagal atau kedaluwarsa.
Terakhir, SDK Agen membuat agen lebih dapat diskalakan. Eksekusi agen dapat menggunakan satu sandbox atau banyak sandbox, memanggil sandbox hanya saat diperlukan, mengarahkan subagen ke lingkungan terisolasi, dan memparalelkan pekerjaan di seluruh kontainer untuk eksekusi yang lebih cepat.
Kapabilitas baru SDK Agen ini tersedia secara umum bagi seluruh pelanggan melalui API dan menggunakan penentuan harga API standar, berdasarkan token dan penggunaan alat.
Seiring kami terus mengembangkan SDK Agen, kami akan terus memperluas apa yang dapat dibangun oleh pengembang dengannya, sehingga lebih mudah untuk menghadirkan agen yang lebih canggih ke produksi dengan infrastruktur khusus yang lebih sedikit, sambil tetap mempertahankan fleksibilitas dan kontrol yang dibutuhkan oleh pengembang untuk menyesuaikan agen ke lingkungan mereka sendiri.
Kapabilitas harness dan sandbox yang baru akan diluncurkan terlebih dahulu di Python, dengan dukungan TypeScript yang direncanakan untuk rilis mendatang. Kami juga sedang berupaya menghadirkan kemampuan agen tambahan, termasuk mode kode dan subagen, ke Python dan TypeScript.
Selain itu, kami ingin membantu menyatukan ekosistem agen yang lebih luas dari waktu ke waktu, dengan dukungan untuk lebih banyak penyedia sandbox, lebih banyak integrasi, dan lebih banyak cara bagi pengembang untuk menghubungkan SDK ke alat dan sistem yang sudah mereka gunakan.


