23 Januari 2025

Memperkenalkan Operator

Pratinjau riset agen yang dapat menggunakan browsernya sendiri untuk menjalankan tugas bagi Anda. Tersedia untuk pengguna Pro di AS

Buka Operator

Gambar menampilkan permintaan pengguna untuk menemukan dan memesan satu hari tur Roma peringkat tertinggi di TripAdvisor. Permintaan ini mencakup ringkasan proses pencarian dan halaman web TripAdvisor menampilkan tur "Best Seller": "Rome: Colosseum, Roman Forum and Palatine Hill."

Memuat…

Pembaruan 17 Juli 2025: Operator sekarang terintegrasi penuh ke ChatGPT sebagai agen ChatGPT. Untuk mengakses kemampuan yang diperbarui ini, cukup pilih “mode agen” dari menu tarik-turun di komposer dan masukkan pertanyaan Anda secara langsung di ChatGPT. Akibatnya, situs Operator mandiri (operator.chatgpt.com) akan ditutup dalam beberapa minggu ke depan.

Hari ini kami merilis Operator⁠(terbuka di jendela baru), agen yang dapat membuka web untuk melakukan tugas bagi Anda. Dengan menggunakan browsernya sendiri, operator dapat melihat halaman web dan berinteraksi dengannya dengan mengetik, mengeklik, dan menggulir. Saat ini operator berada dalam pratinjau riset, yang berarti operator memiliki batasan dan akan berkembang berdasarkan masukan pengguna. Operator adalah salah satu agen pertama kami, yang merupakan kemampuan AI untuk melakukan pekerjaan secara mandiri untuk Anda—Anda memberikan tugas kepada operator dan operator akan menjalankannya.

Operator dapat diminta untuk menangani berbagai tugas browser berulang seperti mengisi formulir, memesan bahan makanan, dan bahkan membuat meme. Kemampuan menggunakan antarmuka dan alat yang sama seperti yang digunakan manusia dalam kehidupan sehari-hari memperluas utilitas AI, membantu orang menghemat waktu pada tugas sehari-hari sekaligus membuka peluang keterlibatan untuk bisnis.

Untuk memastikan peluncuran yang aman dan iteratif, kami memulainya dari hal yang kecil. Mulai dari hari ini, Operator tersedia untuk pengguna Pro⁠(terbuka di jendela baru) di AS.melalui operator.chatgpt.com⁠(terbuka di jendela baru). Pratinjau riset ini memungkinkan kami untuk belajar dari pengguna kami dan ekosistem yang lebih luas, melakukan penyempurnaan dan perbaikan sambil berjalan. Rencana kami adalah untuk melakukan peluasan ke pengguna Plus, Team, dan Enterprise serta mengintegrasikan kemampuan ini ke ChatGPT untuk ke depannya.

Cara kerja Operator

Operator ditenagai model baru yang disebut Computer-Using Agent (CUA). Penggabungan kemampuan visual GPT‑4o dengan penalaran lanjutan melalui pembelajaran penguatan, CUA dilatih untuk berinteraksi dengan antarmuka pengguna grafis (GUI)—bidang tombol, menu dan teks yang dilihat orang-orang di layar.

Operator dapat “melihat” (melalui cuplikan layar) dan “berinteraksi” (menggunakan semua tindakan yang dimungkinkan oleh mouse dan keyboard) dengan sebuah browser, memungkinkannya melakukan tindakan di web tanpa memerlukan integrasi API kustom.

Jika Operator mengalami tantangan atau membuat kesalahan, Operator dapat meningkatkan kemampuan penalarannya untuk melakukan perbaikan sendiri. Saat Operator macet dan membutuhkan bantuan, Operator akan mengembalikan kontrol kembali kepada pengguna, memastikan pengalaman yang mulus dan kolaboratif.

Meskipun CUA masih berada dalam tahap awal dan memiliki batasan, CUA menetapkan hasil tolok ukur yang luar biasa di WebArena dan WebVoyager, dua tolok ukur utama penggunaan browser. Baca selengkapnya mengenai eval dan riset di balik Operator di postingan blog riset kami.

Cara menggunakannya

Untuk memulai, cukup jelaskan tugas yang ingin Anda selesaikan dan Operator akan menangani sisanya. Pengguna dapat memilih untuk mengambil alih kendali browser jarak jauh kapan saja, dan Operator dilatih agar secara proaktif bertanya kepada pengguna untuk mengambil alih tugas yang memerlukan proses masuk, detail pembayaran, atau saat menangani CAPTCHA.

Pengguna dapat melakukan personalisasi pada alur kerjanya di Operator dengan menambahkan instruksi kustom, baik untuk seluruh situs atau untuk situs-situs tertentu, seperti pengaturan preferensi untuk maskapai di Booking.com. Operator memungkinkan pengguna untuk menyimpan prompt untuk akses cepat di beranda, cocok untuk tugas berulang seperti memesan ulang makanan di Instacart. Seperti halnya menggunakan beberapa tab di browser, pengguna dapat membuat Operator menjalankan beberapa tugas secara bersamaan dengan membuat percakapan baru, seperti memesan cangkir enamel di Etsy sekaligus memesan kemah di Hipcamp.

Ekosistem & pengguna

Operator⁠(terbuka di jendela baru) mengubah AI dari alat pasif menjadi peserta aktif di ekosistem digital. Operator akan menyederhanakan tugas pengguna dan memberi manfaat agen bagi perusahaan yang menginginkan pengalaman pelanggan inovatif dan mengharapkan tingkat konversi yang lebih tinggi. Kami sedang berkolaborasi bersama berbagai perusahaan seperti DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber, dan lainnya untuk memastikan Operator menangani kebutuhan dunia nyata sekaligus menghormati norma-norma yang telah ditetapkan. Selain berbagai kolaborasi ini, kami melihat banyak potensi untuk meningkatkan aksesibilitas dan efisiensi untuk alur kerja tertentu, khususnya di aplikasi sektor publik. Untuk mendalami penggunaan kasus ini secara lebih luas, kami bekerja sama dengan berbagai organisasi seperti City of Stockton⁠(terbuka di jendela baru) untuk mempermudahnya mendaftar di layanan dan program kota.

“Seiring dengan pemahaman kami yang makin mendalam tentang Operator selama tahap pratinjau penelitian, kami akan makin siap untuk mengidentifikasi cara-cara yang dapat dilakukan AI untuk mempermudah partisipasi warga dalam kegiatan kemasyarakatan.”

Jamil Niazi, Direktur Teknologi Informasi di City of Stockton

Dengan merilis Operator untuk audiens terbatas sebagai permulaannya, kami bertujuan untuk mempelajarinya dengan cepat dan menyempurnakan kemampuannya berdasarkan masukan dunia sebenarnya, memastikan kami menyeimbangkan inovasi dengan kepercayaan dan keamanan. Pendekatan kolaboratif ini membantu memastikan Operator memberikan nilai yang bermakna pada pengguna, kreator, bisnis, dan organisasi sektor publik.

Operator OpenAI adalah terobosan teknologi yang membuat berbagai proses seperti memesan makanan menjadi sangat mudah.

Daniel Danker, Chief Product Officer di Instacart

Keamanan dan privasi

Memastikan Operator aman digunakan adalah prioritas utama, dengan tiga lapisan keamanan untuk mencegah penyalahgunaan dan memastikan pengguna memiliki kendali kuat.

Pertama, Operator dilatih untuk memastikan bahwa orang yang menggunakannya selalu memiliki kendali dan meminta masukan saat berada di titik kritis.

Mode ambil alih: Operator meminta pengguna untuk mengambil alih saat memasukkan informasi sensitif di browser, seperti kredensial masuk atau informasi pembayaran. Saat berada dalam mode ambil alih, Operator tidak mengumpulkan atau mengambil cuplikan layar informasi yang dimasukkan pengguna.
Konfirmasi pengguna: Sebelum menyelesaikan setiap tindakan penting, seperti menyerahkan pesanan atau mengirim email, Operator akan meminta persetujuan.
Batasan tugas: Operator dilatih untuk menolak tugas sensitif tertentu, seperti transaksi perbankan atau yang memerlukan keputusan berisiko tinggi, seperti membuat keputusan untuk lamaran pekerjaan.
Mode tonton: Pada situs-situs sensitif, seperti layanan email atau keuangan, Operator memerlukan pengawasan ketat dalam tindakannya, memungkinkan pengguna untuk secara langsung melihat setiap potensi kesalahan.

Selanjutnya, kami telah mempermudah untuk mengelola privasi data di Operator.

Penolakan partisipasi dalam pelatihan: Menonaktifkan opsi 'Perbaiki model untuk semua orang' di pengaturan ChatGPT berarti data di Operator juga tidak akan digunakan untuk melatih model kami.
Manajemen data transparan: Pengguna dapat menghapus semua data browsing dan keluar dari semua situs dengan sekali klik di bagian Privasi dari pengaturan Operator. Percakapan sebelumnya di Operator juga dapat dihapus dengan sekali klik.

Terakhir, kami telah membangun perlindungan terhadap situs web bertentangan yang mungkin mencoba untuk menyesatkan Operator melalui prompt tersembunyi, kode berbahaya, atau percobaan phishing.

Navigasi penuh kehati-hatian: Operator dirancang untuk mendeteksi dan mengabaikan injeksi prompt.
Pemantauan: “Model pemantauan” khusus mengawasi perilaku mencurigakan dan dapat menjeda tugas jika terlihat suatu yang mencurigakan.
Alur deteksi: Proses peninjauan otomatis dan oleh manusia secara terus menerus mengidentifikasi ancaman baru dan dengan cepat memperbarui keamanan.

Kami paham aktor jahat mungkin mencoba untuk menyalahgunakan teknologi ini. Oleh karena itulah kami telah mendesain Operator untuk menolak permintaan berbahaya dan memblokir konten yang tidak diizinkan. Sistem moderasi kami dapat menerbitkan peringatan atau bahkan membatalkan akses untuk pelanggaran berulang, dan kami telah mengintegrasikan proses peninjauan tambahan untuk mendeteksi dan menangani penyalahgunaan. Kami juga menyediakan panduan tentang cara berinteraksi dengan Operator yang sesuai dengan Kebijakan Penggunaan kami.

Meskipun Operator didesain dengan berbagai perlindungan ini, tidak ada sistem yang sempurna dan ini masih pratinjau riset, kami berkomitmen pada peningkatan berkelanjutan melalui masukan dari dunia sebenarnya dan pengujian yang ketat. Untuk mendapatkan informasi selengkapnya mengenai pendekatan kami, kunjungi bagian keamanan blog riset Operator.

Pembatasan

Operator saat ini berada pada tahap pratinjau riset awal, dan meskipun Operator sudah mampu menangani berbagai tugas, Operator masih belajar, berkembang dan mungkin melakukan kesalahan. Sebagai contoh, Operator saat ini mengalami tantangan dengan antarmuka rumit seperti membuat tayangan slide atau mengelola kalender. Masukan pengguna awal akan memainkan peran penting dalam menyempurnakan akurasinya, keandalannya, dan keamanannya, membantu kami membuat Operator menjadi lebih baik bagi setiap orang.

Selanjutnya

CUA di API: Kami berencana untuk mengekspos model yang ditenagai Operator, CUA, di API segera sehingga pengembang dapat menggunakannya untuk membangun agen berbasis komputer milik mereka sendiri.

Kemampuan yang Ditingkatkan: Kami akan terus memperbaiki kemampuan Operator untuk menangani alur kerja yang lebih panjang dan rumit.

Akses yang Lebih Luas: Kami berencana untuk memperluas Operator⁠(terbuka di jendela baru) ke pengguna Plus, Team, dan Enterprise dan mengintegrasikan kemampuannya langsung ke ChatGPT di masa mendatang setelah kami yakin akan keamanan dan kegunaannya dalam skala yang besar, membuka eksekusi tugas real-time yang lancar dan asinkron.

Penulis

OpenAI

Kontributor riset dasar

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

Inti

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

Kontributor XFN

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

Para Pemimpin

Aaron Schlesinger (Infrastruktur), Casey Chu (Keselamatan dan Kesiapan Model), David Medina (Infrastruktur Riset), Hyeonwoo Noh (Riset Keseluruhan), Reiichiro Nakano (Riset Keseluruhan), Yash Kumar

Kontributor

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

Kepemimpinan

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba