Alat bantu baru untuk membangun agen
Kami mengembangkan platform kami untuk membantu para pengembang dan perusahaan dalam membangun agen yang berguna dan andal.

Hari ini, kami sedang merilis kumpulan pertama blok pembangun yang akan membantu para pengembang dan perusahaan untuk membangun agen yang berguna dan andal. Kami melihat agen sebagai sistem yang secara independen menyelesaikan tugas-tugas atas nama pengguna. Selama setahun terakhir, kami telah memperkenalkan kemampuan model baru—seperti penalaran lanjutan, interaksi multimodal, dan teknik keselamatan baru—yang telah meletakkan dasar bagi model kami untuk menangani tugas-tugas rumit dan multilangkah yang diperlukan untuk membangun agen. Namun, para pelanggan telah membagikan pengalamannya bahwa mengubah kemampuan-kemampuan ini ke dalam produksi agen yang siap pakai bisa sangat menantang, sering kali memerlukan iterasi prompt besar-besaran dan orkestrasi logika kustom tanpa visibilitas atau dukungan bawaan yang memadai.
Untuk menangani tantangan ini, kami sedang meluncurkan kumpulan API dan alat bantu baru yang dirancang secara khusus untuk menyederhanakan pengembangan aplikasi agen:
- API Respons(terbuka di jendela baru) yang baru, menggabungkan kesederhanaan API Penyelesaian Obrolan dengan alat bantu yang menggunakan kemampuan API Asisten untuk membangun agen
- Alat bantu bawaan termasuk pencarian web(terbuka di jendela baru), pencarian file(terbuka di jendela baru), dan penggunaan komputer(terbuka di jendela baru)
- SDK Agen(terbuka di jendela baru) yang baru untuk melakukan orkestrasi pada alur kerja satu agen dan multiagen
- Alat bantu observasi(terbuka di jendela baru) terintegrasi untuk melacak dan memeriksa eksekusi alur kerja agen
Berbagai alat bantu ini menyederhanakan logika, orkestrasi, dan interaksi agen inti, membuatnya makin mudah bagi para pengembang untuk mulai membangun agen. Dalam beberapa minggu dan bulan yang akan datang, kami berencana untuk merilis alat bantu dan kemampuan tambahan untuk makin menyederhanakan dan mempercepat pembangunan aplikasi agen di platform kami.
API Respons adalah API sederhana kami yang baru untuk meningkatkan alat bantu bawaan OpenAI untuk membangun agen. API ini menggabungkan kesederhanaan Penyelesaian Obrolan dengan kemampuan penggunaan alat bantu dari API Asisten. Seiring dengan kemampuan model yang terus berkembang, kami percaya API Respons akan memberikan dasar yang lebih fleksibel bagi para pengembang dalam membangun aplikasi agen. Dengan satu panggilan API Respons, para pengembang akan mampu menyelesaikan tugas-tugas yang makin rumit dengan menggunakan banyak alat bantu dan perubahan model.
Pertama, API Respons akan mendukung alat bantu bawaan baru seperti pencarian web, pencarian file, dan penggunaan komputer. Berbagai alat baru ini didesain untuk berfungsi bersama untuk menghubungkan model-model ke dunia sebenarnya, menjadikannya makin berguna dalam menyelesaikan tugas. Alat bantu ini juga hadir dengan beberapa peningkatan kegunaan termasuk desain berbasis item terpadu, polimorfisme yang lebih sederhana, kejadian streaming intuitif, dan pembantu SDK seperti response.output_text untuk mempermudah akses keluaran teks model.
API Respons didesain untuk para pengembang yang perlu menggabungkan berbagai model dan alat bantu bawaan OpenAI ke aplikasi mereka dengan mudah, tanpa adanya kerumitan integrasi dari banyak API atau vendor eksternal. API ini juga mempermudah penyimpanan data di OpenAI sehingga para pengembang dapat mengevaluasi kinerja agen menggunakan fitur-fitur seperti pelacakan dan evaluasi. Sebagai pengingat, kami tidak melatih model-model kami dengan data bisnis secara default, bahkan ketika data tersebut disimpan di OpenAI. API ini tersedia bagi semua pengembang mulai dari hari ini dan tidak dikenai biaya secara terpisah—token dan alat bantu ditagih dengan tarif standar seperti yang disebutkan di halaman harga(terbuka di jendela baru) kami. Baca panduan mulai cepat(terbuka di jendela baru) API Respons untuk mempelajari informasi selengkapnya.
- API Penyelesaian Obrolan(terbuka di jendela baru): Penyelesaian Obrolan tetaplah API kami yang telah diadopsi secara luas. dan kami sepenuhnya berkomitmen untuk mendukungnya dengan berbagai model dan kemampuan baru. Pengembang yang tidak memerlukan alat bantu bawaan dapat dengan yakin melanjutkan menggunakan Penyelesaian Obrolan. Kami akan terus merilis model baru untuk Penyelesaian Obrolan bilamana kemampuannya tidak bergantung pada alat bantu bawaan atau panggilan banyak model. Namun, API Respons adalah kumpulan super(terbuka di jendela baru) dari Penyelesaian Obrolan dengan kinerja yang sama hebatnya, sehingga untuk integrasi baru, kami merekomendasikan untuk memulainya dengan API Respons.
- API Asisten(terbuka di jendela baru): Berdasarkan masukan dari pengembang API Asisten versi beta, kami telah menggabungkan peningkatan penting ke API Respons, menjadikannya lebih fleksibel, lebih cepat, dan lebih mudah untuk digunakan. Kami sedang berupaya untuk mencapai keseimbangan fitur penuh antara API Asisten dan API Respons, termasuk dukungan yang seperti Asisten dan objek yang seperti Utas, serta alat Penerjemah Kode. Setelah ini selesai, kami berencana untuk secara resmi mengumumkan penghentian API Asisten dengan target tanggal akhir di pertengahan tahun 2026. Setelah penghentian, kami akan memberikan panduan jelas migrasi dari API Asisten ke API Respons yang memungkinkan para pengembang untuk mempertahankan datanya dan memigrasikan aplikasi mereka. Sampai kami mengumumkan penghentian tersebut secara resmi, kami akan melanjutkan pengiriman model baru ke API Asisten. API Respons mewakili arah masa depan pembangunan agen di OpenAI.
Pengembang sekarang bisa dengan cepat, mendapatkan jawaban terbaru dengan kutipan yang jelas dan relevan dari web. Di API Respons, pencarian web tersedia sebagai alat bantu saat menggunakan gpt-4o dan gpt-4o-mini, dan dapat dipasangkan dengan berbagai alat bantu lain atau panggilan fungsi.
Selama pengujian awal, kami memperhatikan pengembang yang membangun dengan pencarian web untuk sejumlah contoh penggunaan termasuk bantuan belanja, agen riset, dan agen pemesanan perjalanan—aplikasi yang memerlukan informasi dengan tepat waktu dari web.
Misalnya, Hebbia(terbuka di jendela baru) memanfaatkan alat pencarian web untuk membantu pengelola aset, ekuitas swasta dan perusahaan kredit, dan praktik hukum dengan cepat mengekstrak wawasan beralasan dari kumpulan data umum yang luas dan pribadi. Dengan mengintegrasikan kemampuan pencarian real-time ke alur kerja riset mereka, Hebbia memberikan kecerdasan pasar konteks tertentu dan lebih kaya serta secara terus menerus meningkatkan keakuratan dan relevansi dari analisis mereka, melampaui tolok ukur saat ini.
Pencarian web di API ditenagai oleh model yang sama dengan yang digunakan untuk pencarian ChatGPT. Di SimpleQA, tolok ukur yang mengevaluasi keakuratan LLM dalam menjawab pertanyaan pendek dan faktual, pratinjau pencarian GPT‑4o dan pratinjau pencarian GPT‑4o mini masing-masing mendapatkan skor 90% dan 88%.
Keakuratan SimpleQA (lebih besar lebih baik)
Respons yang dibuat dengan pencarian web di API menyertakan tautan ke sumbernya, seperti artikel berita dan postingan blog, sehingga memberikan cara bagi pengguna untuk mempelajari selengkapnya. Dengan kutipan jelas dan langsung ini, pengguna dapat berinteraksi melalui informasi dengan cara baru, sekaligus pemilik konten mendapatkan peluang baru untuk menjangkau audiens yang lebih luas.
Situs web atau penerbit dapat memilih untuk muncul(terbuka di jendela baru) dalam pencarian web di API.
Alat bantu pencarian web tersedia untuk semua pengembang di pratinjau di API Respons. Kami juga memberikan para pengembang akses langsung ke model pencarian setel lanjutan kami di API Penyelesaian Obrolan melalui pratinjau pencarian gpt-4o dan pratinjau pencarian gpt-4o-mini. Harga(terbuka di jendela baru) masing-masingnya mulai dari $30 dan $25 per seribu kueri untuk pencarian GPT‑4o dan pencarian 4o-mini. Baca pencarian web di Playground(terbuka di jendela baru) dan pelajari selengkapnya di dokumen(terbuka di jendela baru) kami.
Para pengembang kini bisa dengan mudah mendapatkan informasi relevan dari volume dokumen yang besar dengan menggunakan alat pencarian file yang ditingkatkan. Dengan dukungan untuk berbagai tipe file, pengoptimalan kueri, pemfilteran metadata, dan peringkat ulang kustom, alat bantu ini bisa memberikan hasil pencarian yang cepat dan akurat. Dan sekali lagi, dengan API Respons, hanya perlu beberapa baris kode untuk melakukan integrasi.
Alat bantu pencarian file bisa digunakan di berbagai contoh penggunaan dunia sebenarnya, termasuk memungkinkan agen dukungan pelanggan untuk dengan mudah mengakses Pertanyaan Umum, membantu asisten hukum untuk memberikan referensi kasus lalu bagi profesional berkualifikasi, dan membantu agen koding untuk membuat kueri dokumen teknis. Misalnya, Navan(terbuka di jendela baru) menggunakan pencarian file pada agen perjalanannya yang ditenagai AI untuk dengan cepat memberikan para penggunanya jawaban akurat dari berbagai artikel basis pengetahuan (seperti kebijakan perjalanan perusahaan mereka). Dengan pengoptimalan dan peringkat ulang kueri bawaan, mereka mampu menyiapkan alur RAG (retrieval-augmented generation) yang kuat tanpa penyetelan atau konfigurasi ekstra. Dengan toko vektor khusus untuk setiap grup pengguna, Navan mampu menyesuaikan jawaban untuk setiap pengaturan akun dan peran pengguna, menghemat waktu bagi para pelanggan dan stafnya sekaligus membantu menyediakan dukungan akurat dan personal.
Alat bantu ini tersedia di API Respons bagi seluruh pengembang. Penggunaannya berharga(terbuka di jendela baru) sebesar $2,50 per seribu kueri dan penyimpanan file sebesar $0,10/GB/hari, dan gratis untuk GB pertama. Alat bantu tersebut akan terus tersedia di API Asisten. Akhirnya, kami juga telah menambahkan endpoint pencarian baru ke objek API Toko Vektor untuk mengarahkan kueri data Anda agar digunakan di aplikasi dan API lain. Pelajari selengkapnya di dokumen(terbuka di jendela baru) kami dan mulai pengujian di Playground(terbuka di jendela baru).
Untuk membangun agen yang mampu menyelesaikan berbagai tugas di sebuah komputer, para pengembang kini dapat menggunakan alat bantu penggunaan komputer di API Respons, yang ditenagai oleh model Agen Berbasis Komputer (CUA) yang sama yang mengaktifkan Operator. Model pratinjau riset ini menetapkan catatan kecanggihan baru, yang mencapai 38,1% keberhasilan di OSWorld(terbuka di jendela baru) untuk tugas penggunaan komputer penuh, 58,1%di WebArena(terbuka di jendela baru), dan 87% di WebVoyager(terbuka di jendela baru) untuk interaksi berbasis web.
Alat bantu penggunaan komputer bawaan menangkap tindakan mouse dan keyboard yang dibuat oleh model, memungkinkan para pengembang melakukan otomatisasi tugas penggunaan komputer dengan secara langsung menerjemahkan berbagai tindakan ini menjadi perintah yang dapat dieksekusi di dalam lingkungannya.
Para pengembang dapat menggunakan alat bantu penggunaan komputer untuk melakukan otomatisasi pada alur kerja berbasis web seperti melakukan penjaminan mutu pada aplikasi web atau mengeksekusi tugas-tugas entri data di seluruh sistem lama. Misalnya, Unify(terbuka di jendela baru) adalah sebuah sistem tindakan untuk pertumbuhan pendapatan yang menggunakan agen untuk mengidentifikasi niat, akun riset, dan terlibat dengan para pembeli. Dengan menggunakan alat bantu penggunaan komputer dari OpenAI, agen Unify dapat mengakses informasi yang sebelumnya tidak terjangkau melalui API—seperti memungkinkan perusahaan pengelolaan properti untuk melakukan verifikasi melalui peta online jika sebuah bisnis telah memperluas jejak langkah real-estat miliknya. Riset ini bertindak sebagai sinyal kustom untuk memicu jangkauan yang dipersonalisasi—memberdayakan tim go-to-market agar terlibat dengan para pembeli secara akurat dan dalam skala yang besar.
Contoh lainnya, Luminai(terbuka di jendela baru) telah mengintegrasikan alat bantu penggunaan komputer untuk melakukan otomatisasi alur kerja operasional yang rumit untuk perusahaan besar dengan sistem lama yang kekurangan ketersediaan API dan data yang standar. Dalam pilot terbaru dengan organisasi layanan komunitas besar, Luminai telah melakukan otomatisasi proses aplikasi dan proses pendaftaran pengguna dalam beberapa hari saja—sesuatu yang untuk otomatisasi proses robotik (RPA) tradisional sulit capai bahkan setelah upaya berbulan-bulan.
Sebelum meluncurkan CUA di Operator pada tahun lalu, kami telah melakukan pengujian keselamatan luas dan red teaming, mengatasi tiga bidang risiko utama: penyalahgunaan, kesalahan model, dan risiko garis depan. Untuk mengatasi risiko yang terkait dengan perluasan kemampuan Operator untuk sistem operasi lokal melalui CUA di API, kami telah melakukan evaluasi keselamatan dan red teaming tambahan. Kami juga telah menambahkan mitigasi bagi para pengembang, termasuk pemeriksaan keselamatan untuk memberi perlindungan dari injeksi prompt, konfirmasi prompt untuk tugas-tugas sensitif, alat bantu untuk membantu pengembang mengisolasi lingkungannya, dan memperkuat deteksi atas potensi pelanggaran kebijakan. Meskipun mitigasi ini membantu menurunkan risiko, model tersebut masih rentan melakukan kesalahan yang tidak disengaja, terutama pada lingkungan yang bukan browser. Misalnya, kinerja CUA di OSWorld, sebuah tolok ukur yang dirancang untuk mengukur kinerja agen AI dalam tugas dunia sebenarnya, saat ini nilainya di kisaran 38,1%, yang menunjukkan bahwa model tersebut belum diandalkan sepenuhnya untuk tugas otomatisasi di sistem operasi. Pengawasan manusia direkomendasikan dalam berbagai skenario ini. Lebih banyak detail mengenai keselamatan kerja khusus API kami dapat ditemukan di kartu sistem terbaru.
| Jenis tolok ukur | Tolok Ukur | Penggunaan komputer (antarmuka universal) | Agen penjelajahan web | Manusia | |
|---|---|---|---|---|---|
| OpenAI CUA | SOTA Sebelumnya | SOTA Sebelumnya | |||
| Penggunaan komputer | OSWorld | 38,1% | 22,0% | - | 72,4% |
| Penggunaan browser | WebArena | 58,1% | 36,2% | 57,1% | 78,2% |
| WebVoyager | 87,0% | 56,0% | 87,0% | - | |
Mulai dari hari ini, alat bantu penggunaan komputer tersedia sebagai pratinjau riset di API Respons untuk pengembang terpilih di jenjang penggunaan 3-5(terbuka di jendela baru). Penggunaannya dihargai(terbuka di jendela baru) $3/1JT token masukan dan $12/1JT token keluaran. Pelajari selengkapnya di dokumentasi(terbuka di jendela baru) kami dan lihat contoh aplikasi(terbuka di jendela baru) yang menunjukkan cara membangun alat bantu ini.
Selain membangun logika inti untuk agen dan memberikannya akses ke berbagai alat bantu sehingga membuatnya makin berguna, para pengembang juga perlu melakukan orkestrasi pada alur kerja agen. SDK Agen sumber terbuka baru kami menyederhanakan proses orkestrasi alur kerja multiagen dan menawarkan peningkatan signifikan pada Swarm(terbuka di jendela baru), sebuah SDK eksperimental yang telah kami rilis tahun lalu yang diadopsi secara luas oleh komunitas pengembang dan berhasil diterapkan oleh banyak pelanggan.
Peningkatannya termasuk:
- Agen: LLM yang mudah dikonfigurasi dengan instruksi jelas dan alat bantu bawaan.
- Serah terima: Kontrol transfer cerdas di antara agen.
- Pembatas: Pemeriksaan keselamatan yang dapat dikonfigurasi untuk validasi masukan dan keluaran.
- Pelacakan & Observasi: Pelacakan eksekusi agen visual untuk merunut dan mengoptimalkan kinerja.
SDK Agen cocok untuk berbagai aplikasi dunia sebenarnya, termasuk otomatisasi dukungan pelanggan, riset multilangkah, pembuatan konten, tinjau kode, dan prospek penjualan. Misalnya, Coinbase(terbuka di jendela baru) telah menggunakan SDK Agen untuk membuat prototipe dan menerapkan AgentKit dengan cepat, sebuah perangkat yang memungkinkan agen AI untuk berinteraksi secara mulus dengan dompet kripto dan berbagai aktivitas on-chain. Dalam beberapa jam saja, Coinbase telah mengintegrasikan tindakan kustom dari SDK Platform Pengembang menjadi agen yang sepenuhnya berfungsi. Arsitektur yang disederhanakan AgentKit menyederhanakan proses penambahan tindakan agen baru, memungkinkan para pengembang berfokus pada integrasi yang lebih bermakna dan mengurangi navigasi penyiapan agen yang rumit.
Dalam beberapa hari, Box(terbuka di jendela baru) mampu dengan cepat membuat agen yang memanfaatkan pencarian web dan SDK Agen untuk memungkinkan perusahaan melakukan pencarian, membuat kueri, dan mengekstrak wawasan dari data tidak berstruktur yang disimpan di Box dan sumber internet publik. pendekatan ini memungkinkan pelanggan untuk tidak hanya mengakses informasi terbaru, tapi sekaligus mencari data internal dan milik mereka dengan cara yang aman dan terjamin yang mematuhi izin internal dan kebijakan keamanan mereka. Misalnya, perusahaan layanan keuangan dapat membangun agen kustom yang memanggil agen AI Box untuk mengintegrasikan analisis pasar internal mereka yang disimpan di Box dengan berita dan data ekonomi real-time dari web, memberikan para analis mereka pandangan komprehensif untuk keputusan investasi.
SDK Agen berfungsi dengan API Respons dan API Penyelesaian Obrolan. SDK tersebut juga berfungsi dengan berbagai model dari penyedia lain selama penyedia tersebut menyediakan endpoint API yang bergaya Penyelesaian Obrolan. Para pengembang dapat dengan cepat mengintegrasikannya ke codebase Python mereka, dengan dukungan Node.js akan segera hadir. Pelajari lebih lanjut di dokumentasi(terbuka di jendela baru) kami.
Dalam merancang SDK Agen, tim kami terinspirasi oleh kinerja luar biasa dari berbagai komunitas lain termasuk Pydantic(terbuka di jendela baru), Griffe(terbuka di jendela baru) dan MkDocs(terbuka di jendela baru). Kami berkomitmen untuk terus membangun SDK Agen sebagai kerangka kerja sumber terbuka sehingga pihak lain di komunitas dapat memperluas pendekatan kami.
Kami yakin agen sebentar lagi akan menjadi bagian integral dari dunia kerja, secara signifikan meningkatkan produktivitas di seluruh industri. Karena berbagai perusahaan terus berupaya untuk memanfaatkan AI untuk berbagai tugas rumit, kami berkomitmen untuk menyediakan blok pembangunan yang memungkinkan para pengembang dan perusahaan untuk secara efektif membuat sistem otomatis yang memberikan dampak nyata.
Dengan rilis hari ini, kami sedang memperkenalkan blok pembangunan pertama untuk memberdayakan para pengembang dan perusahaan agar makin mudah membangun, menerapkan serta membuat agen AI dengan skala yang andal dan berkinerja tinggi. Seiring kemampuan model yang menjadi makin bersifat agen, kami akan terus berinvestasi dalam integrasi mendalam di seluruh API dan alat bantu baru kami untuk membantu penerapan, evaluasi, dan pengoptimalan agen dalam produksi. Tujuan kami adalah untuk memberikan para pengembang pengalaman platform yang lancar untuk membangun agen yang dapat membantu berbagai macam tugas di setiap industri. Kami sangat bersemangat untuk menyaksikan apa yang akan dibangun para pengembang selanjutnya. Untuk memulai, jelajahi dokumentasi(terbuka di jendela baru) kami dan nantikan pembaruan lainnya.