
2025 年 7 月 17 日更新:Operator 現化身為 ChatGPT 智慧體,與 ChatGPT 完全整合。只要從撰寫工具的下拉式選單選取「智慧體模式」,然後直接在 ChatGPT 中輸入查詢內容,就能使用這些更新版功能。因應這項更新,獨立的 Operator 網站 (operator.chatgpt.com) 將在接下來幾週終止服務。
我們今日正式推出 Operator(在新視窗中開啟):一款能上網替您執行任務的代理智慧體。它可透過內建瀏覽器瀏覽網頁,並執行輸入、點選、捲動等互動操作。目前 Operator 處於研究預覽階段,功能具有一定限制,後續將依據使用者回饋不斷改進。Operator 是我們推出的首批代理工具之一,這些 AI 工具能獨立替您執行任務:您只需交辦任務,它馬上就能執行。
您可指派 Operator 處理各類重複性網頁任務,例如填寫表單、訂購雜貨,甚至創作迷因圖。由於能使用與人類日常相同的介面與工具,AI 的實用性大幅提升,不僅能幫助人們節省處理日常任務的時間,也為企業開啟全新的互動可能。
為了確保這項工具能安全漸進地推出,我們將從小規模開始釋出。從今天起,Operator 將開放給美國地區的 Pro(在新視窗中開啟) 用戶使用,網址是 operator.chatgpt.com(在新視窗中開啟)。本研究預覽版本將持續從使用者與更廣泛的生態系中學習,不斷改進與提升。我們計劃未來也開放 Plus、Team 與 Enterprise 用戶使用,並將這些功能整合到 ChatGPT 中。
Operator 是由名為電腦操作代理程式 (Computer-Using Agent,CUA) 的全新模型所驅動。本模型結合 GPT‑4o 的視覺功能與強化學習中的進階推理能力,訓練其與圖形使用者介面 (GUI) 進行互動,如按鈕、選單與畫面上的文字欄位。
Operator 可以「看見」(透過螢幕截圖) 與「互動」(使用滑鼠和鍵盤允許的所有操作),無需自訂 API 整合,即可在網路上執行動作。
若遭遇挑戰或發生錯誤,Operator 可運用其推理能力自我修正。當陷入困境而需要協助時,它會直接將控制權交還給使用者,確保流程順暢且具合作性。
儘管 CUA 仍處於早期階段且限制頗多,但已於 WebArena 與 WebVoyager (兩項關鍵瀏覽器使用基準) 創下頂尖標竿紀錄。欲了解 Operator 背後的評估與研究詳情,請參閱我們的研究部落格文章。
若要開始使用,只需描述您想完成的任務,Operator 就能處理其餘工作。使用者可隨時選擇接管遠端瀏覽器的控制權,而 Operator 經過訓練,會在需要登入、付款詳細資料或解決驗證碼時主動要求使用者接管。
無論是針對所有網站或特定網站,使用者都能在 Operator 中新增自訂指令,量身打造工作流程,例如在 Booking.com 上設定偏好的航空公司。使用者可在 Operator 中儲存提示詞,方便在首頁快速存取,特別適合像是在 Instacart 補貨這類重複性任務。就像在瀏覽器中開啟多個分頁一樣,使用者可以建立多個新對話,讓 Operator 同時處理不同任務,例如一邊在 Etsy 訂購個人化琺瑯馬克杯,一邊在 Hipcamp 預訂露營地。
Operator(在新視窗中開啟) 把 AI 從被動工具轉型為數位生態系的主動參與者。它能簡化使用者交辦的任務,並為追求創新客戶體驗與提高轉換率的企業提供代理技術的優勢。我們正與 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber 等公司合作,確保 Operator 能依照業界既定規範,滿足真實世界需求。除了這些合作之外,我們也發現這項服務在特定工作流程的可及性與效率上具有顯著的改善潛力,特別是在公部門的應用方面。為了進一步探索這些使用情境,我們正與史托克頓 (Stockton) 市(在新視窗中開啟)等機構合作,協助市民更方便地參與城市服務與相關計畫。
「我們在 Operator 的研究預覽期間便深入了解其運作,因此更能有效找出方式,讓 AI 協助居民參與公民活動。」
Operator 初期僅向特定用戶群釋出,目的是讓它能迅速學習並根據實際回饋調整功能,確保在創新與信任、安全之間達到平衡。這種合作方式有助於確保 Operator 無論面對使用者、創作者、企業或公部門組織,都能帶來重大的價值。
「OpenAI 的 Operator 是一項科技突破,讓訂購雜貨等流程變得輕而易舉。」
我們的首要任務,是確保 Operator 的使用安全:我們建立了三道保護措施,可防止濫用並確保使用者擁有完全掌控權。
首先,Operator 的訓練設計讓使用者始終掌握主控權,能在關鍵時刻要求介入輸入內容。
- 接管模式:當需要在瀏覽器中輸入登入憑證或付款資訊等敏感資料時,Operator 會請使用者接管操作。在接管模式中,Operator 不會收集或截圖使用者輸入的資訊。
- 使用者確認:在完成送出訂單或寄送電子郵件等任何重大的動作前,Operator 都會要求使用者核准。
- 任務限制:Operator 的訓練設計使其會拒絕執行銀行交易等敏感任務,或求職申請決策等高風險操作。
- 監視模式:在電子郵件或金融服務等高度敏感的網站上,Operator 會要求使用者密切監督其行為,以便即時察覺任何潛在錯誤。
接下來,我們簡化了 Operator 的資料隱私權管理作業。
- 選擇退出訓練:在 ChatGPT 設定中關閉「為所有人改善模型」,即代表 Operator 中的資料不會用於訓練我們的模型。
- 透明的資料管理:使用者可在 Operator 設定的隱私權部分一鍵刪除所有瀏覽資料並從所有網站登出。使用者也可以一鍵刪除 Operator 中的對話記錄。
最後,我們也建立了防禦機制,以防止惡意網站試圖透過隱藏提示、惡意程式碼或網路釣魚等手法誤導 Operator:
- 審慎瀏覽:Operator 設計上能偵測並忽略提示注入攻擊。
- 監控:專屬的「監控模型」會監視可疑行為,如果有異常可暫停任務。
- 偵測管道:自動化與人工審查流程可持續識別新威脅並快速更新保護措施。
我們知道不法分子可能會試圖濫用這項科技,因此我們將 Operator 設計為能拒絕有害請求並阻擋不當內容。我們的內容審查系統能對重複違規行為發出警告,甚至撤銷使用者的存取權限,同時我們也整合了額外的審查流程,以偵測並處理濫用行為。我們也提供相關指引,說明如何在遵守我們使用政策的前提下與 Operator 互動。
雖然 Operator 設計上具備多項保護機制,但沒有任何系統能做到萬無一失,且該服務目前仍處於研究預覽階段。我們承諾將持續透過真實世界的回饋與嚴謹測試,不斷強化此服務。如需深入了解我們的方法,請參閱 Operator 研究部落格中的安全性章節。
Operator 目前處於早期研究預覽階段,雖然已能處理廣泛的任務,但仍在學習、進化中,可能會犯錯。例如,目前在處理建立簡報或管理行事曆等複雜介面時,Operator 仍面臨一些挑戰。早期使用者的回饋將在提升其準確性、可靠性與安全性方面發揮關鍵作用,幫助我們持續優化,讓 Operator 更加實用、人人受益。
應用程式介面中的 CUA:我們計劃很快在應用程式介面 (API) 中公開支援 Operator 所使用的模型 CUA,讓開發人員能以此建置自己的電腦使用代理程式。
功能強化:我們將持續改善 Operator 處理更長及更複雜工作流程的能力。
廣泛使用:我們計劃將 Operator(在新視窗中開啟) 擴展到 Plus、Team 及 Enterprise 方案用戶;未來,當我們對其在大規模使用情境下的安全性與實用性有足夠信心後,將會把 Operator 的功能直接整合進 ChatGPT,實現即時與非同步任務的順暢執行。
作者
基礎研究貢獻者
Casey Chu、David Medina、Hyeonwoo Noh、Noah Jorgensen、Reiichiro Nakano、Sarah Yoo
核心人員
Andrew Howell、Aaron Schlesinger、Baishen Xu、Ben Newhouse、Bobby Stocker、Devashish Tyagi、Dibyo Majumdar、Eugenio Panero、Fereshte Khani、Geoffrey Iyer、Jiahui Yu、Nick Fiacco、Patrick Goethe、Sam Jau、Shunyu Yao、Stephan Casas、Yash Kumar、Yilong Qin
XFN 貢獻者
Abby Fanlo Susk、Aleah Houze、Alex Beutel、Alexander Prokofiev、Andrea Vallone、Andrea Chan、Christina Lim、Derek Chen、Duke Kim、Grace Zhao、Heather Whitney、Houda Nait El Barj、Jake Brill、Jeremy Fine、Joe Fireman、Kelly Stirman、Lauren Yang、Lindsay McCallum、Leo Liu、Mike Starr、Minnia Feng、Mostafa Rohaninejad、Oleg Boiko、Owen Campbell-Moore、Paul Ashbourne、Stephen Imm、Taylor Gordon、Tina Sriskandarajah、Winston Howes
組長
Aaron Schlesinger (基礎架構)、Casey Chu (安全與模型整備)、David Medina (研究基礎架構)、Hyeonwoo Noh (整體研究)、Reiichiro Nakano (整體研究)、Yash Kumar
貢獻者
Adam Brandon、Adam Koppel、Adele Li、Ahmed El-Kishky、Akila Welihinda、Alex Karpenko、Alex Nawar、Alex Tachard Passos、Amelia Liu、Andrei Gheorghe、Andrew Duberstein、Andrey Mishchenko、Angela Baek、Ankush Agarwal、Anting Shen、Antoni Baum、Ari Seff、Ashley Tyra、Behrooz Ghorbani、Bo Xu、Brandon McKinzie、Bryan Brandow、Carolina Paz、Cary Hudson、Chak Li、Chelsea Voss、Chen Shen、Chris Koch、Christian Gibson、Christina Kim、Christine McLeavey、Claudia Fischer、Cory Decareaux、Daniel Jacobowitz、Daniel Wolf、David Kjelkerud、David Li、Ehsan Asdar、Elaine Kim、Emilee Goo、Eric Antonow、Eric Hunter、Eric Wallace、Felipe Torres、Fotis Chantzis、Freddie Sulit、Giambattista Parascandolo、Hadi Salman、Haiming Bao、Haoyu Wang、Henry Aspegren、Hyung Won Chung、Ian O’Connell、Ian Sohl、Isabella Fulford、Jake McNeil、James Donovan、Jamie Kiros、Jason Ai、Jason Fedor、Jason Wei、Jay Dixit、Jeffrey Han、Jeffrey Sabin-Matsumoto、Jennifer Griffith-Delgado、Jeramy Han、Jeremiah Currier、Ji Lin、Jiajia Han、Jiaming Zhang、Jiayi Weng、Jieqi Yu、Joanne Jang、Joyce Ruffell、Kai Chen、Kai Xiao、Kevin Button、Kevin King、Kevin Liu、Kristian Georgiev、Kyle Miller、Lama Ahmad、Laurance Fauconnet、Leonard Bogdonoff、Long Ouyang、Louis Feuvrier、Madelaine Boyd、Mamie Rheingold、Matt Jones、Michael Sharman、Miles Wang、Mingxuan Wang、Nick Cooper、Niko Felix、Nikunj Handa、Noel Bundick、Pedro Aguilar、Peter Faiman、Peter Hoeschele、Pranav Deshpande、Raul Puri、Raz Gaon、Reid Gustin、Robin Brown、Rob Honsby、Saachi Jain、Sandhini Agarwal、Scott Ethersmith、Scott Lessans、Shauna O’Brien、Spencer Papay、Steve Coffey、Tal Stramer、Tao Wang、Teddy Lee、Tejal Patwardhan、Thomas Degry、Tomo Hiratsuka、Troy Peterson、Wenda Zhou、William Butler、Wyatt Thompson、Yao Zhou、Yaodong Yu、Yi Cheng、Yinghai Lu、Younghoon Kim、Yu-Ann Wang Madan、Yushi Wang、Zhiqing Sun
領導團隊
Anna Makanju、Greg Brockman、Hannah Wong、Jerry Tworek、Liam Fedus、Mark Chen、Peter Welinder、Sam Altman、Wojciech Zaremba