6 Oktober 2025

Memperkenalkan AgentKit

Alat baru untuk membangun, meluncurkan, dan mengoptimalkan agen.

Memuat…

Hari ini, kami meluncurkan AgentKit, rangkaian alat lengkap bagi pengembang dan perusahaan untuk membangun, meluncurkan, dan mengoptimalkan agen. Hingga kini, membangun agen berarti mengelola berbagai alat yang terfragmentasi—orkestrasi rumit tanpa penomoran versi, konektor kustom, saluran evaluasi manual, penyetelan prompt, dan pekerjaan frontend selama beberapa minggu sebelum peluncuran. Dengan AgentKit, pengembang kini dapat membuat desain alur kerja secara visual dan menyematkan UI agentik secara lebih cepat menggunakan blok pembangun yang baru seperti:

Agent Builder: sebuah kanvas visual untuk membuat dan memberi nomor versi alur kerja multi-agen
Connector Registry: tempat terpusat bagi admin untuk mengelola cara data dan alat terhubung di seluruh produk OpenAI
ChatKit: perangkat untuk menyematkan pengalaman agen berbasis obrolan yang dapat disesuaikan dalam produk Anda

Kami juga memperluas kemampuan evaluasi dengan fitur baru seperti kumpulan data, evaluasi pelacakan, optimasi prompt otomatis, dan dukungan model pihak ketiga untuk mengukur dan meningkatkan kinerja agen.

Sejak meluncurkan API Respons dan SDK Agen⁠ pada bulan Maret, kami telah melihat pengembang dan perusahaan membangun alur kerja agentik menyeluruh untuk riset dalam, dukungan pelanggan, dan lainnya. Klarna membangun agen dukungan⁠ yang menangani dua pertiga dari semua tiket dan Clay meningkatkan pertumbuhan 10 kali lipat⁠ dengan agen penjualan. AgentKit dibangun pada API Respons untuk membantu pengembang membangun agen secara lebih efisien dan andal.

Membuat desain alur kerja dengan Agent Builder

Ketika alur kerja agen menjadi makin rumit, pengembang perlu visibilitas yang lebih jelas tentang cara mereka bekerja. Agent Builder⁠(terbuka di jendela baru) menyediakan kanvas visual untuk menyusun logika dengan node seret dan lepas, menghubungkan alat, dan melakukan konfigurasi pagar pembatas kustom. Agent Builder mendukung uji coba pratinjau, konfigurasi evaluasi inline, dan pembuatan penomoran versi lengkap—ideal untuk iterasi cepat.

Tampilan antarmuka alur automasi layanan pelanggan dalam alat pembangun visual. Kanvas menunjukkan node yang terhubung yang diberi label Mulai, Pagar pembatas jailbreak, Agen klasifikasi, If/else, Agen pengembalian, Agen retensi, Agen informasi, Pagar pembatas halusinasi, dan Akhir. Sidebar di sebelah kiri mencantumkan jenis node yang tersedia seperti Agen, Catatan, Pencarian file, Pagar pembatas, MCP, dan Persetujuan pengguna. Kontrol teratas mencakup opsi untuk Evaluasi, Kode, Pratinjau, dan Publikasikan.

Pembangun dapat memulai dengan kanvas kosong atau templat yang telah dibuat sebelumnya.

Di Ramp, tim bergerak dari kanvas kosong menjadi agen pengadaan hanya dalam waktu beberapa jam:

Agent Builder mengubah hal yang dulu perlu waktu beberapa bulan untuk orkestrasi yang rumit, kode kustom, dan optimasi manual menjadi hanya beberapa jam. Kanvas visual memastikan tim produk, hukum, dan teknik rekayasa berada pada halaman yang sama, memangkas siklus iterasi hingga 70% dan membuat agen aktif dalam dua sprint, bukan dua kuartal.”

— Ramp

Demikian pula, LY Corporation—perusahaan layanan teknologi dan internet terkemuka di Jepang—membangun agen asisten kerja dengan Agent Builder dalam waktu kurang dari dua jam.

“Agent Builder memungkinkan kami untuk mengatur agen dengan cara yang benar-benar baru, dengan teknisi dan pakar di bidangnya berkolaborasi dalam satu antarmuka. Kami membangun alur kerja multi-agentik pertama kami dan menjalankannya dalam waktu kurang dari dua jam, secara dramatis mempercepat waktu untuk membuat dan menyebarkan agen.”

— LY Corporation

Kami juga sedang meluncurkan Connector Registry bagi perusahaan untuk mengatur dan mempertahankan data di berbagai workspace dan organisasi. Connector Registry⁠(terbuka di jendela baru) mengonsolidasikan berbagai sumber data ke dalam satu panel admin di seluruh ChatGPT dan API. Registri mencakup semua konektor yang telah dibangun sebelumnya seperti Dropbox, Google Drive, Sharepoint, dan Microsoft Teams, serta MCP pihak ketiga.

Pengembang juga dapat mengaktifkan Guardrails⁠(terbuka di jendela baru) di Agent Builder—lapisan keselamatan modular sumber terbuka yang membantu melindungi agen terhadap perilaku tidak diinginkan atau berbahaya. Guardrails dapat menutupi atau menandai PII, mendeteksi jailbreak, dan menerapkan perlindungan lain, sehingga mempermudah pembuatan dan penyebaran agen yang andal dan aman. Guardrails dapat disebarkan secara mandiri atau melalui perpustakaan guardrails untuk Python⁠(terbuka di jendela baru) dan JavaScript⁠(terbuka di jendela baru).

Sematkan pengalaman obrolan agentik dengan ChatKit

Meluncurkan UI obrolan untuk agen dapat sangat rumit—menangani respons streaming, mengelola utas, menunjukkan pemikiran model, dan membuat desain pengalaman obrolan yang menarik. ChatKit mempermudah penyematan agen berbasis obrolan yang terasa asli pada produk Anda. Itu dapat disematkan ke aplikasi atau situs web dan disesuaikan agar sesuai dengan tema atau merek Anda.

“Kami menghemat waktu lebih dari dua minggu untuk membangun agen dukungan bagi komunitas Pengembang Canva kami dengan ChatKit, dan mengintegrasikannya dalam waktu kurang dari satu jam. Agen dukungan ini akan mengubah cara pengembang berinteraksi dengan dokumen kami dengan mengubahnya menjadi pengalaman percakapan, sehingga mempermudah untuk membuat aplikasi dan integrasi di Canva.”

— Canva

ChatKit telah mendukung berbagai contoh penggunaan, mulai dari asisten pengetahuan internal dan panduan onboarding hingga agen dukungan dan riset pelanggan. Agen dukungan pelanggan HubSpot⁠(terbuka di jendela baru) adalah salah satu contohnya:

Tampilan dasbor platform Ramp yang menunjukkan antarmuka manajemen pengeluaran. Panel utama menyambut pengguna, Daniel, dan mencantumkan permintaan seperti ‘Permintaan untuk ChatGPT Business’ (menunggu peninjauan) dan ‘Permintaan untuk HubSpot’ (draf), beserta pengeluaran terkini untuk maskapai penerbangan, berbagi tumpangan, dan perangkat lunak. Di sebelah kanan, formulir permintaan perangkat lunak terbuka bagi ChatGPT Business, yang merinci 5 kursi seharga $125 per bulan sejak tanggal 1 Oktober 2025 hingga 1 Oktober 2026, dengan tombol berwarna kuning ‘Serahkan permintaan’.

Mengukur kinerja agen dengan kemampuan Evals baru

Membangun agen yang andal dan siap produksi memerlukan evaluasi kinerja yang ketat. Tahun lalu, kami meluncurkan Evals⁠(terbuka di jendela baru) untuk membantu pengembang menguji prompt dan mengukur perilaku model. Kini, kami menambahkan empat kemampuan baru sehingga makin mempermudah untuk membangun evaluasi:

Kumpulan data–buat evaluasi agen secara cepat dari nol dan perluas seiring waktu dengan pemeringkat otomatis dan anotasi manusia.
Evaluasi pelacakan (trace grading)–jalankan penilaian menyeluruh terhadap alur kerja agentik dan automasi pemeringkatan untuk menemukan kekurangan.
Optimasi prompt otomatis–buat prompt yang ditingkatkan didasarkan pada anotasi manusia dan keluaran pemeringkat.
Dukungan model pihak ketiga–lakukan evaluasi model dari penyedia lain dalam platform OpenAI Evals.

Kami telah melihat peningkatan kinerja yang besar dari pelanggan yang menggunakan Evals.

“Platform evaluasi memangkas waktu pengembangan kerangka uji tuntas multi-agen kami lebih dari 50%, dan meningkatkan keakuratan agen 30%.”

— Carlyle

Antarmuka yang menampilkan tabel kumpulan data dengan kolom untuk Peringkat, Nada, Masukan, dan Keakuratan. Baris menampilkan entri dengan ikon suka atau tidak suka, tag nada seperti Profesional, Ramah, Kasar, dan Buruk, serta hasil keakuratan yang diberi label Lulus atau Gagal dengan skor 3,5. Bilah alat bagian atas mencakup opsi untuk Unggah, Kolom, Peringkat, Hasilkan keluaran, dan Simpan.

Dorong kinerja agen dengan setel lanjutan penguatan

Reinforcement fine-tuning⁠(terbuka di jendela baru) (RFT) memungkinkan pengembang menyesuaikan model penalaran kami. Ini biasanya tersedia di OpenAI o4-mini dan dalam beta privat untuk GPT‑5. Kami sedang bekerja sama secara erat dengan puluhan pelanggan untuk menyempurnakan RFT bagi GPT‑5 sebelum diluncurkan secara lebih luas.

Hari ini, kami memperkenalkan dua fitur baru dalam beta RFT yang didesain untuk mendorong kinerja agen lebih jauh lagi:

Panggilan alat kustom–latih model untuk memanggil alat yang tepat pada waktu yang tepat untuk penalaran yang lebih baik
Pemeringkat kustom–tetapkan kriteria evaluasi kustom untuk hal yang paling penting dalam contoh penggunaan Anda

Harga & ketersediaan

Mulai hari ini, ChatKit dan kemampuan Evals baru tersedia secara umum bagi semua pengembang. Agent Builder tersedia dalam beta, dan Connector Registry mulai meluncurkan beta ke beberapa pelanggan API, ChatGPT Enterprise, dan Edu dengan Konsol Admin Global (tempat Pemilik Global dapat mengelola domain, SSO, beberapa organisasi API). Konsol Admin Global merupakan ⁠(terbuka di jendela baru)prasyarat untuk mengaktifkan Connector Registry. Semua alat ini disertakan dengan penentuan harga model API standar.

Kami berencana untuk segera menambahkan opsi API Alur Kerja mandiri dan penyebaran agen ke ChatGPT.

Kami tidak sabar melihat hasil karya Anda.

Penulis

OpenAI

Terus membaca

Lihat semua

GPT-5.6 is now the preferred model in Microsoft 365 Copilot > Cover image

GPT-5.6 kini menjadi model pilihan di Microsoft 365 Copilot

Produk9 Jul 2026

GPT-5.6: Kecerdasan terdepan yang berkembang seiring ambisi Anda

Produk9 Jul 2026

ChatGPT kini menjadi mitra untuk pekerjaan paling ambisius Anda

Produk9 Jul 2026