Langsung ke konten utama
OpenAI

23 Oktober 2025

Consensus menggunakan GPT‑5 dan API Respons untuk menyelesaikan riset beberapa minggu dalam hitungan menit

Menggunakan GPT‑5 dan API Respons, Consensus merancang sistem multi-agen yang merencanakan, membaca, dan mempersatukan bukti layaknya peneliti.

Logo Consensus berwarna putih berpusat pada latar belakang biru kehijauan gelap dengan panel bertekstur vertikal dalam berbagai corak biru dan hijau.
Memuat…

Setiap tahun, jutaan makalah ilmiah baru dipublikasikan—jauh lebih banyak dari yang dapat dibaca oleh satu orang. 

Bagi ilmuwan, tantangannya bukan akses terhadap pengetahuan, tetapi tugas berat untuk menemukan, menafsirkan, dan menghubungkannya. Terobosan terjadi di batas dunia pengetahuan yang sudah kita kenal, namun para peneliti menggunakan sebagian besar waktu mereka hanya untuk mencari batas tersebut alih-alih berusaha melampauinya.

Consensus(terbuka di jendela baru), asisten riset yang digunakan oleh lebih dari 8 juta orang, dibangun untuk mengubah itu. Didirikan oleh Christian Salem dan Eric Olson, platform ini mencari, membaca, dan mempersatukan literatur yang telah melalui peninjauan sejawat di lebih dari 220 juta makalah. Kemampuan terbarunya, Scholar Agent, merupakan sistem multi-agen yang dibangun pada GPT‑5 dan API Respons. Scholar Agent menyerupai cara peneliti bekerja, membantu mereka bergerak dari pertanyaan menuju kesimpulan dalam hitungan menit alih-alih minggu.

Namun, sasarannya bukan hanya mempercepat riset—tetapi mempercepat jalur menuju penemuan. “Ilmu pengetahuan berkembang saat lebih mudah diakses”, ujar Salem. “Pekerjaan kami adalah memberikan kemampuan kepada peneliti di mana saja untuk menemukan, memercayai, dan bertindak berdasarkan bukti.”

Dari mesin pencarian menjadi asisten agentik

Versi pertama dari Consensus bekerja seperti mesin pencarian vertikal untuk ilmu pengetahuan: mengindeks makalah akademik, mengambil hasil yang relevan, dan membuat ringkasan berdasarkan kutipan. Namun, pencarian saja tidak cukup. 

“Riset bukan hanya tentang menemukan makalah”, ujar Salem. “Riset adalah menafsirkan hasil, membandingkan temuan, dan menghubungkan ide. Makin banyak waktu yang digunakan ilmuwan untuk mencari, membaca, dan menafsirkan pengetahuan dari masa lalu untuk kajian yang tepat, makin sedikit waktu yang mereka miliki untuk menemukan dan membuat riset sebenarnya.”

Jadi, tim mulai merancang ulang Consensus berdasarkan konsep baru: sistem multi-agen yang disebut “Scholar Agent” yang bekerja layaknya peneliti manusia.

Dibangun pada GPT‑5 dan API Respons, sekarang, sistem menjalankan alur kerja agen yang terkoordinasi:

  • Agen Perencanaan menguraikan pertanyaan pengguna dan memutuskan tindakan selanjutnya yang harus diambil
  • Agen Pencarian memeriksa indeks makalah dari Consensus, perpustakaan pribadi pengguna, dan grafik kutipan
  • Agen Membaca menafsirkan makalah secara individu atau berkelompok
  • Agen Analisis mempersatukan hasil, menentukan struktur dan visual, serta menyusun keluaran akhir

Masing-masing agen memiliki cakupan yang sempit, sehingga menjaga agar penalaran tetap tepat dan memperkecil halusinasi. Arsitektur ini juga memungkinkan Consensus untuk memutuskan kapan tidak menjawab; jika tidak ada kajian relevan yang memenuhi ambang batas kualitasnya, asisten akan mengatakan apa adanya.

“Dengan membagi alur kerja kepada beberapa agen, kami mengurangi kesalahan dan membuat sistem jauh lebih disiplin”, ujar Salem. “Tidak ada satu agen yang memiliki terlalu banyak tanggung jawab, hal yang ternyata menjadi kunci bagi keandalan.”

Diagram alur agen menunjukkan cara kueri pengguna diproses melalui agen perencanaan, pencarian paralel, pembacaan, dan analisis untuk membuat keluaran berbasis riset.

Pendekatan ini disebut tim sebagai teknik rekayasa konteks: mengumpulkan bukti yang tepat sebelum pembuatan hasil dimulai. Setiap jawaban dilengkapi “paket konteks riset”—kumpulan terstruktur dari makalah, metadata, dan temuan utama yang berasal dari riset asli.

“Kami tidak ingin peneliti membuang-buang waktu untuk memeriksa ulang setiap klaim”, ujar Salem. “Jika sistem tidak dapat mendasarkan jawaban pada bukti nyata, sistem tidak akan membuat-buat.”

Membangun dengan API Respons

Consensus bermigrasi dari Penyelesaian Obrolan ke API Respons untuk mendukung perutean multi-agen. Peralihan meningkatkan keandalan dan efisiensi biaya, sehingga memberikan kontrol yang lebih baik kepada tim atas panggilan sub-agen. Dengan penalaran konteks panjang GPT‑5 dan pemanggilan alat yang andal, pilihan sudah jelas.

Evaluasi awal mengonfirmasi keputusan tersebut: GPT‑5 mengungguli GPT‑4.1, Sonnet 4, dan Gemini 2.5 Pro dalam hal keakuratan pemanggilan alat dan stabilitas perencanaan. Ini memungkinkan tim Consensus untuk mengurangi utak-atik prompt dan lebih fokus pada membangun perilaku agen yang langsung mengarah ke alur kerja riset.

Tabel yang membandingkan metrik Agen Riset GPT-5 untuk model OAI, Anthropic, dan Google dalam hal keakuratan, presisi, struktur, dan latensi.

Pilihan pada konsumen di dunia penuh lembaga

Sejak awal, Consensus mendekati pasar secara berbeda dari yang diharapkan. Alih-alih menjual melalui lembaga, tim berfokus pada orang yang melakukan riset itu sendiri: mahasiswa, dosen, dan dokter yang membutuhkan jawaban saat ini. Fokus langsung pada peneliti tersebut membentuk desain produk dan pertumbuhan produk yang cepat.

“Semua orang berkata Anda tidak dapat langsung menuju konsumen di dunia akademis, tetapi AI telah mengubahnya”, ujar Salem. “Orang tidak lagi menunggu persetujuan—mereka menggunakan sesuatu yang memberi hasil.”

Keputusan tersebut membentuk nada dan kurva pertumbuhan produk. Consensus terasa lebih seperti aplikasi konsumen modern dibandingkan alat akademis tradisional: onboarding yang cepat, desain yang intuitif, antarmuka percakapan. Penggunaan menyebar dari mulut ke mulut di seluruh kampus dan laboratorium.

Mahasiswa pascasarjana dan kandidat PhD menjadi pengguna aktif pertama, diikuti oleh dosen dan peneliti swasta. Kemudian, muncul dokter, yang mulai menggunakan Consensus untuk mengungkap bukti terbaru di bidang mereka. 

“Kami tidak bermaksud membangun untuk dokter”, ujar Salem. “Namun, mereka membutuhkan hal yang sama seperti dibutuhkan peneliti: akses cepat ke bukti yang dapat diandalkan.”

Akhir-akhir ini, perusahaan menandatangani kontrak dengan perpustakaan medis Mayo Clinic dan meluncurkan ‘Mode Medis’, fitur baru yang dirancang bagi praktisi yang mencari bukti klinis.

Bertumbuh seiring sains

Dalam setahun terakhir, Consensus telah berkembang pesat, bertumbuh hingga lebih dari 8 juta peneliti di seluruh dunia dan meningkatkan pendapatan hingga 8x.

Pertumbuhan tersebut tidak mengubah prioritas produk. Setiap fitur masih berpusat pada jawaban yang dapat diverifikasi dan rendah halusinasi. Tim telah banyak berinvestasi dalam jalur evaluasi yang menguji keakuratan, ketertelusuran kutipan, dan konsistensi gaya di seluruh agen.

Arsitektur Consensus sengaja dibuat modular, didesain sehingga agen baru dapat masuk seiring perluasan dan peningkatan model—agen yang mereplikasi eksperimen, membuat angka, atau menjalankan analisis statistik.

“Kami sedang membangun asisten yang benar-benar dibutuhkan peneliti di dunia yang berubah cepat”, ujar Salem. “Model terus membaik, sistem bertumbuh seiring dengannya, dan ilmu pengetahuan bergerak lebih cepat.”

OpenAI <3 startup. Ayo membangun bersama kami.