11 Maret 2025

New tools for building agents

A sleek, minimal interface displaying a task list for an AI agent, including ‘triage_agent,’ ‘guardrail,’ and ‘update_salesforce_record,’ over a fluid blue abstract background.

Dina iki, kita ngluncurake kumpulan pisanan building block sing bakal mbantu pangembang lan perusahaan nggawe agen sing migunani lan andal. Kita ndeleng agen minangka sistem sing bisa ngrampungake tugas kanthi mandiri atas jenenge pangguna. Sajrone setaun kepungkur, kita wis ngenalake kapabilitas model anyar—kayata nalar tingkat lanjut, interaksi multimodal, lan teknik keamanan anyar—sing wis dadi pondasi supaya model kita bisa nangani tugas kompleks lan multi-langkah sing dibutuhake kanggo nggawe agen. Nanging, pelanggan wis nuduhake manawa ngowahi kapabilitas iki dadi agen siap produksi bisa dadi tantangan, asring mbutuhake iterasi prompt sing ekstensif lan logika orkestrasi kustom tanpa visibilitas utawa dhukungan bawaan sing cukup.

Kanggo ngatasi tantangan iki, kita ngluncurake kumpulan API lan alat anyar sing dirancang khusus kanggo nyederhanakake pangembangan aplikasi agentic:

Anyar Responses API⁠(mbukak ing jendhela anyar), sing nggabungake kesederhanaan chat completions API karo kapabilitas panggunaan alat saka Assistants API kanggo mbangun agen
Alat bawaan kalebu panelusuran web⁠(mbukak ing jendhela anyar), panelusuran file⁠(mbukak ing jendhela anyar), lan panggunaan komputer⁠(mbukak ing jendhela anyar)
Anyar Agents SDK⁠(mbukak ing jendhela anyar) kanggo ngorkestrasi alur kerja agen tunggal lan multi-agen
Alat observabilitas⁠(mbukak ing jendhela anyar) terintegrasi kanggo nelusuri lan mriksa eksekusi alur kerja agen

Alat anyar iki nyederhanakake logika inti agen, orkestrasi, lan interaksi, saengga dadi luwih gampang kanggo pangembang miwiti mbangun agen. Ing sawetara minggu lan sasi sabanjure, kita ngrancang ngluncurake alat lan kapabilitas tambahan kanggo luwih nyederhanakake lan nyepetake pembangunan aplikasi agentic ing platform kita.

Ngenalake Responses API

Responses API minangka primitif API anyar kita kanggo nggunakke alat bawaan OpenAI guna mbangun agen. Iki nggabungake kesederhanaan Chat Completions karo kapabilitas panggunaan alat saka Assistants API. Nalika kapabilitas model terus berkembang, kita yakin Responses API bakal nyedhiyakake pondasi sing luwih fleksibel kanggo pangembang sing mbangun aplikasi agentic. Kanthi siji panggilan Responses API, pangembang bakal bisa ngrampungake tugas sing saya kompleks kanthi nggunakake pirang-pirang alat lan giliran model.

Kanggo miwiti, Responses API bakal ndhukung alat bawaan anyar kayata panelusuran web, panelusuran file, lan panggunaan komputer. Alat-alat iki dirancang supaya bisa bebarengan nyambungake model menyang donya nyata, nggawe model luwih migunani kanggo ngrampungake tugas. API iki uga nggawa sawetara perbaikan kegunaan kalebu desain terpadu adhedhasar item, polimorfisme sing luwih prasaja, acara streaming sing intuïtif, lan helper SDK kaya response.output_text kanggo ngakses output teks model kanthi gampang.

Responses API dirancang kanggo pangembang sing pengin kanthi gampang nggabungake model OpenAI lan alat bawaan menyang aplikasi, tanpa kerumitan ngintegrasikake pirang-pirang API utawa vendor eksternal. API iki uga nggampangake panyimpenan data ing OpenAI supaya pangembang bisa ngevaluasi kinerja agen nganggo fitur kaya tracing lan evaluasi. Minangka pangeling, kita ora nglatih model kita nganggo data bisnis kanthi setelan gawan, sanajan data kasebut disimpen ing OpenAI. API iki kasedhiya kanggo kabeh pangembang wiwit dina iki lan ora dikenani biaya kapisah—token lan alat ditagih miturut tarif standar sing kasebut ing kaca rega⁠(mbukak ing jendhela anyar) kita. Delengen pandhuan quickstart⁠(mbukak ing jendhela anyar) Responses API kanggo sinau luwih lengkap.

Apa tegesé iki kanggo API sing wis ana

Chat Completions API⁠(mbukak ing jendhela anyar): Chat Completions tetep dadi API sing paling akeh diadopsi, lan kita tetep setya banget kanggo ndhukung API iki nganggo model lan kapabilitas anyar. Pangembang sing ora mbutuhake alat bawaan bisa kanthi yakin terus nggunakake Chat Completions. Kita bakal terus ngluncurake model anyar menyang Chat Completions kapan wae kapabilitase ora gumantung marang alat bawaan utawa pirang-pirang panggilan model. Nanging, Responses API minangka superset⁠(mbukak ing jendhela anyar) saka Chat Completions kanthi kinerja apik sing padha, mula kanggo integrasi anyar, kita nyaranake miwiti nganggo Responses API.
Assistants API⁠(mbukak ing jendhela anyar): Adhedhasar masukan pangembang saka beta Assistants API, kita wis nggabungake perbaikan utama menyang Responses API, nggawe API iki luwih fleksibel, luwih cepet, lan luwih gampang digunakake. Kita lagi ngupaya supaya Assistants lan Responses API nduweni kesetaraan fitur lengkap, kalebu dhukungan kanggo objek kaya Assistant lan kaya Thread, uga alat Code Interpreter. Yen iki wis rampung, kita ngrancang ngumumake resmi deprecasi Assistants API kanthi target tanggal pungkasan layanan ing pertengahan 2026. Nalika deprecasi, kita bakal nyedhiyakake pandhuan migrasi sing cetha saka Assistants API menyang Responses API sing ngidini pangembang njaga kabeh datane lan mindhah aplikasine. Nganti kita ngumumake deprecasi kasebut kanthi resmi, kita bakal terus ngirim model anyar menyang Assistants API. Responses API nggambarake arah masa depan kanggo mbangun agen ing OpenAI.

Ngenalake alat bawaan ing Responses API

Panelusuran web

Pangembang saiki bisa entuk jawaban sing cepet lan paling anyar kanthi sitasi sing cetha lan relevan saka web. Ing Responses API, panelusuran web kasedhiya minangka alat nalika nggunakake gpt-4o lan gpt-4o-mini, lan bisa dipasangake karo alat utawa function call liyane.

JavaScript

1const response = await openai.responses.create({
2    model: "gpt-4o",
3    tools: [ { type: "web_search_preview" } ],
4    input: "What was a positive news story that happened today?",
5});
6
7console.log(response.output_text);

Sajrone pengujian awal, kita ndeleng pangembang mbangun nganggo panelusuran web kanggo macem-macem kasus panggunaan kalebu asisten belanja, agen riset, lan agen pemesanan lelungan—aplikasi apa wae sing mbutuhake informasi web sing pas wektu.

Contone, Hebbia⁠(mbukak ing jendhela anyar) nggunakke alat panelusuran web kanggo mbantu manajer aset, perusahaan private equity lan kredit, lan praktik hukum kanthi cepet njupuk wawasan sing bisa ditindaklanjuti saka dataset publik lan privat sing ekstensif. Kanthi ngintegrasikake kapabilitas panelusuran wektu nyata menyang alur kerja risete, Hebbia menehi intelijen pasar sing luwih sugih lan spesifik konteks lan terus ningkatake presisi lan relevansi analise, ngluwihi benchmark saiki.

Panelusuran web ing API didhukung dening model sing padha karo sing digunakake kanggo panelusuran ChatGPT. Ing SimpleQA, benchmark sing ngevaluasi akurasi LLM nalika njawab pitakon cekak lan faktual, GPT‑4o search preview lan GPT‑4o mini search preview masing-masing entuk skor 90% lan 88%.

Akurasi SimpleQA (luwih gedhe luwih apik)

Respons sing digawe nganggo panelusuran web ing API kalebu pranala menyang sumber, kayata artikel warta lan kiriman blog, menehi cara kanggo pangguna supaya bisa sinau luwih jero. Kanthi sitasi inline sing cetha iki, pangguna bisa sesambungan karo informasi kanthi cara anyar, dene pemilik konten entuk kesempatan anyar kanggo nggayuh pamirsa sing luwih jembar.

Situs web utawa penerbit apa wae bisa milih kanggo tampil⁠(mbukak ing jendhela anyar) ing panelusuran web ing API.

Alat panelusuran web kasedhiya kanggo kabeh pangembang minangka pratinjau ing Responses API. Kita uga menehi pangembang akses langsung menyang model panelusuran fine-tuned kita ing Chat Completions API liwat gpt-4o-search-preview lan gpt-4o-mini-search-preview. Rega⁠(mbukak ing jendhela anyar) diwiwiti masing-masing saka $30 lan $25 saben sewu query kanggo GPT‑4o search lan 4o-mini search. Delengen panelusuran web ing Playground⁠(mbukak ing jendhela anyar) lan sinau luwih lengkap ing dokumen⁠(mbukak ing jendhela anyar) kita.

Panelusuran file

Pangembang saiki bisa kanthi gampang njupuk informasi relevan saka volume dokumen gedhe nggunakake alat panelusuran file sing wis ditingkatake. Kanthi dhukungan kanggo macem-macem jinis file, optimasi query, panyaringan metadata, lan reranking kustom, alat iki bisa menehi asil panelusuran sing cepet lan akurat. Lan maneh, nganggo Responses API, mung butuh sawetara baris kode kanggo ngintegrasikake.

JavaScript

1const productDocs = await openai.vectorStores.create({
2    name: "Product Documentation",
3    file_ids: [file1.id, file2.id, file3.id],
4});
5
6const response = await openai.responses.create({
7    model: "gpt-4o-mini",
8    tools: [{
9        type: "file_search",
10        vector_store_ids: [productDocs.id],
11    }],
12    input: "What is deep research by OpenAI?",
13});
14
15console.log(response.output_text);

Alat panelusuran file bisa digunakake kanggo macem-macem kasus panggunaan nyata, kalebu ngidini agen dhukungan pelanggan ngakses FAQ kanthi gampang, mbantu asisten hukum kanthi cepet ngrujuk kasus kepungkur kanggo profesional sing mumpuni, lan mbantu agen coding ngetakoni dokumentasi teknis. Contone, Navan⁠(mbukak ing jendhela anyar) nggunakake panelusuran file ing agen lelungan bertenaga AI kanggo kanthi cepet menehi jawaban sing presisi marang pangguna saka artikel basis pengetahuan (kayata kabijakan lelungan perusahaane). Kanthi optimasi query lan reranking bawaan, dheweke bisa nyiyapake pipeline RAG (retrieval-augmented generation) sing kuat tanpa tuning utawa konfigurasi tambahan. Kanthi vector store khusus kanggo saben grup pangguna, Navan bisa nyesuaikake jawaban karo setelan akun individu lan peran pangguna, ngirit wektu kanggo pelanggan lan staf nalika mbantu nyedhiyakake dhukungan sing akurat lan dipersonalisasi.

Alat iki kasedhiya ing Responses API kanggo kabeh pangembang. Panggunaan dikenani biaya⁠(mbukak ing jendhela anyar) $2.50 saben sewu query lan panyimpenan file $0.10/GB/dina, kanthi GB pisanan gratis. Alat iki uga tetep kasedhiya ing Assistants API. Pungkasan, kita uga wis nambah titik pungkasan panelusuran anyar menyang objek Vector Store API kanggo langsung ngetakoni data sampeyan kanggo digunakake ing aplikasi lan API liyane. Sinau luwih lengkap ing dokumen⁠(mbukak ing jendhela anyar) kita lan wiwiti nyoba ing Playground⁠(mbukak ing jendhela anyar).

Panggunaan komputer

Kanggo mbangun agen sing bisa ngrampungake tugas ing komputer, pangembang saiki bisa nggunakake alat panggunaan komputer ing Responses API, didhukung dening model Computer-Using Agent (CUA) sing padha karo sing ngaktifake Operator. Model pratinjau riset iki nyetel rekor state-of-the-art anyar, kanthi nggayuh tingkat sukses 38,1% ing OSWorld⁠(mbukak ing jendhela anyar) kanggo tugas panggunaan komputer lengkap, 58,1% ing WebArena⁠(mbukak ing jendhela anyar), lan 87% ing WebVoyager⁠(mbukak ing jendhela anyar) kanggo interaksi adhedhasar web.

Alat panggunaan komputer bawaan njupuk aksi mouse lan keyboard sing digawe model, supaya pangembang bisa ngotomatisasi tugas panggunaan komputer kanthi nerjemahake aksi kasebut langsung dadi printah sing bisa dieksekusi ing lingkungane.

JavaScript

1const response = await openai.responses.create({
2    model: "computer-use-preview",
3    tools: [{
4        type: "computer_use_preview",
5        display_width: 1024,
6        display_height: 768,
7        environment: "browser",
8    }],
9    truncation: "auto",
10    input: "I'm looking for a new camera. Help me find the best one.",
11});
12
13console.log(response.output);

Pangembang saiki bisa nggunakake alat panggunaan komputer kanggo ngotomatisasi alur kerja adhedhasar browser kayata nindakake jaminan kualitas ing aplikasi web utawa nglakokake tugas entri data ing macem-macem sistem lawas. Contone, Unify⁠(mbukak ing jendhela anyar) minangka sistem aksi kanggo nambah pendapatan sing nggunakake agen kanggo ngenali maksud, neliti akun, lan sesambungan karo para panuku. Kanthi nggunakake alat panggunaan komputer saka OpenAI, agen Unify bisa ngakses informasi sing sadurunge ora bisa digayuh liwat API—kayata ngidini perusahaan manajemen properti mriksa liwat peta online apa sawijining bisnis wis ngembangake jejak real estate-ne. Riset iki dadi sinyal kustom kanggo micu pendekatan sing dipersonalisasi—nguatake tim go-to-market supaya bisa sesambungan karo para panuku kanthi presisi lan skala.

Minangka conto liyane, Luminai⁠(mbukak ing jendhela anyar) ngintegrasikake alat panggunaan komputer kanggo ngotomatisasi alur kerja operasional sing kompleks kanggo perusahaan gedhe kanthi sistem lawas sing ora nduweni API lan data standar. Ing pilot anyar karo organisasi layanan masyarakat gedhe, Luminai ngotomatisasi proses pangolahan aplikasi lan registrasi pangguna mung sajrone sawetara dina—bab sing angel digayuh otomatisasi proses robotik (RPA) tradisional sanajan wis ngupaya nganti pirang-pirang wulan.

Sadurunge ngluncurake CUA ing Operator taun kepungkur, kita wis nindakake pengujian keamanan lan red teaming kanthi ekstensif, ngatasi telung area risiko utama: penyalahgunaan, kesalahan model, lan risiko wates. Kanggo ngatasi risiko sing ana gandhengane karo nggedhekake kapabilitas Operator menyang sistem operasi lokal liwat CUA ing API, kita nindakake evaluasi keamanan lan red teaming tambahan. Kita uga nambah mitigasi kanggo pangembang, kalebu priksa keamanan kanggo nglindhungi saka injeksi prompt, prompt konfirmasi kanggo tugas sensitif, alat kanggo mbantu pangembang ngisolasi lingkungane, lan deteksi sing ditingkatake kanggo potensi pelanggaran kabijakan. Sanajan mitigasi iki mbantu nyuda risiko, model iki isih rentan marang kesalahan sing ora disengaja, mligine ing lingkungan non-browser. Contone, kinerja CUA ing OSWorld, benchmark sing dirancang kanggo ngukur kinerja agen AI ing tugas nyata, saiki ana ing 38,1%, nuduhake yen model iki durung cukup andal kanggo ngotomatisasi tugas ing sistem operasi. Pengawasan manungsa disaranake ing skenario iki. Rincian liyane babagan kerja keamanan API khusus bisa ditemokake ing kertu sistem sing wis dianyari.

Jinis tolok ukur	Tolok ukur	Panggunaan komputer (antarmuka universal)		Agen browsing web	Manungsa
		OpenAI CUA	SOTA Sadurunge	SOTA Sadurunge
Panggunaan komputer	OSWorld	38,1%	22,0%	-	72,4%
Panggunaan browser	WebArena	58,1%	36,2%	57,1%	78,2%
Panggunaan browser	WebVoyager	87,0%	56,0%	87,0%	-

Rincian evaluasi diterangake ing kene

Miwiti dina iki, alat panggunaan komputer kasedhiya minangka pratinjau riset ing Responses API kanggo pangembang tartamtu ing tingkat panggunaan 3-5⁠(mbukak ing jendhela anyar). Panggunaan dikenani biaya⁠(mbukak ing jendhela anyar) $3/1M token input lan $12/1M token output. Sinau luwih lengkap ing dokumen⁠(mbukak ing jendhela anyar) kita lan delengen aplikasi conto⁠(mbukak ing jendhela anyar) sing nerangake cara mbangun nganggo alat iki.

Agents SDK

Saliyane mbangun logika inti agen lan menehi akses menyang alat supaya agen migunani, pangembang uga kudu ngorkestrasi alur kerja agentic. Agents SDK open-source anyar kita nyederhanakake orkestrasi alur kerja multi-agen lan menehi peningkatan signifikan dibandhingake Swarm⁠(mbukak ing jendhela anyar), SDK eksperimental sing kita rilis taun kepungkur lan diadopsi kanthi wiyar dening komunitas pangembang uga kasil dipasang dening akeh pelanggan.

Peningkatane kalebu:

Agen: LLM sing gampang dikonfigurasi kanthi instruksi sing cetha lan alat bawaan.
Handoffs: Ngalihake kontrol antaragen kanthi cerdas.
Guardrails: Priksa keamanan sing bisa dikonfigurasi kanggo validasi input lan output.
Tracing & Observability: Nggambarake jejak eksekusi agen kanggo debug lan ngoptimalake kinerja.

Python

1from agents import Agent, Runner, WebSearchTool, function_tool, guardrail
2
3@function_tool
4def submit_refund_request(item_id: str, reason: str):
5    # Your refund logic goes here
6    return "success"
7
8support_agent = Agent(
9    name="Support & Returns",
10    instructions="You are a support agent who can submit refunds [...]",
11    tools=[submit_refund_request],
12)
13
14shopping_agent = Agent(
15    name="Shopping Assistant",
16    instructions="You are a shopping assistant who can search the web [...]",
17    tools=[WebSearchTool()],
18)
19
20triage_agent = Agent(
21    name="Triage Agent",
22    instructions="Route the user to the correct agent.",
23    handoffs=[shopping_agent, support_agent],
24)
25
26output = Runner.run_sync(
27    starting_agent=triage_agent,
28    input="What shoes might work best with my outfit so far?",
29)

Agents SDK cocog kanggo macem-macem aplikasi nyata, kalebu otomatisasi dhukungan pelanggan, riset multi-langkah, generasi konten, review kode, lan prospek penjualan. Contone, Coinbase⁠(mbukak ing jendhela anyar) nggunakake Agents SDK kanggo kanthi cepet nggawe prototipe lan masang AgentKit, toolkit sing ngidini agen AI sesambungan kanthi mulus karo dompet kripto lan macem-macem aktivitas on-chain. Mung sajrone sawetara jam, Coinbase ngintegrasikake aksi kustom saka SDK Platform Pangembange menyang agen sing fungsional kanthi lengkap. Arsitektur AgentKit sing ringkes nyederhanakake proses nambah aksi agen anyar, ngidini pangembang luwih fokus marang integrasi sing migunani lan luwih sithik marang navigasi setelan agen sing kompleks.

Ing sajrone sawetara dina, Box⁠(mbukak ing jendhela anyar) bisa kanthi cepet nggawe agen sing nggunakake panelusuran web lan Agents SDK kanggo ngidini perusahaan nggoleki, ngetakoni, lan njupuk wawasan saka data ora terstruktur sing disimpen ing Box lan sumber internet umum. Pendekatan iki ngidini pelanggan ora mung ngakses informasi paling anyar, nanging uga nggoleki data internal lan kepemilikan dhewe kanthi cara sing aman lan tundhuk marang izin internal lan kabijakan keamanane. Contone, perusahaan layanan finansial bisa mbangun agen kustom sing nelpon agen AI Box kanggo nggabungake analisis pasar internal sing disimpen ing Box karo kabar wektu nyata lan data ekonomi saka web, menehi analis tampilan sing komprehensif kanggo keputusan investasi.

Agents SDK bisa digunakake karo Responses API lan Chat Completions API. SDK iki uga bakal bisa digunakake karo model saka panyedhiya liyane, anggere padha nyedhiyakake titik pungkasan API gaya Chat Completions. Pangembang bisa langsung ngintegrasikake menyang codebase Python, kanthi dhukungan Node.js bakal teka enggal. Sinau luwih lengkap ing dokumen⁠(mbukak ing jendhela anyar) kita.

Nalika ngrancang Agents SDK, tim kita oleh inspirasi saka karya apik wong liya ing komunitas kalebu Pydantic⁠(mbukak ing jendhela anyar), Griffe⁠(mbukak ing jendhela anyar) lan MkDocs⁠(mbukak ing jendhela anyar). Kita tetep setya terus mbangun Agents SDK minangka framework open source supaya wong liya ing komunitas bisa ngembangake pendekatan kita.

Sabanjure: mbangun platform kanggo agen

Kita yakin agen bakal enggal dadi bagean integral saka tenaga kerja, kanthi signifikan ningkatake produktivitas ing macem-macem industri. Nalika perusahaan saya ngupaya nggunakke AI kanggo tugas kompleks, kita tetep setya nyedhiyakake building block sing ngidini pangembang lan perusahaan kanthi efektif nggawe sistem otonom sing menehi dampak nyata.

Kanthi rilis dina iki, kita ngenalake building block pisanan kanggo nguatake pangembang lan perusahaan supaya luwih gampang mbangun, masang, lan ngembangake agen AI sing andal lan berkinerja dhuwur. Nalika kapabilitas model saya saya agentic, kita bakal terus nandur modal ing integrasi sing luwih jero ing saindenging API kita lan alat anyar kanggo mbantu masang, ngevaluasi, lan ngoptimalake agen ing produksi. Tujuan kita yaiku menehi pangembang pengalaman platform sing mulus kanggo mbangun agen sing bisa mbantu macem-macem tugas ing industri apa wae. Kita bungah ndeleng apa sing bakal dibangun pangembang sabanjure. Kanggo miwiti, jelajahi dokumen⁠(mbukak ing jendhela anyar) kita lan enteni kabar anyar liyane sakcepete.

Penulis

OpenAI