跳到主要內容
OpenAI

2025年1月23日

產品

Operator 登場

代理程式的研究預覽版,能使用自己的瀏覽器為您執行任務。向美國的 Pro 版用戶提供。

圖像顯示用戶要求在 TripAdvisor 上尋找並預訂羅馬評價最高的單日遊。它包括一個搜尋流程、摘要和一個 TripAdvisor 網頁,顯示「最暢銷」的旅遊行程:「羅馬:羅馬競技場、羅馬廣場和帕拉丁山。」
正在載入...

2025 年 7 月 17 日更新:Operator 現以 ChatGPT 智能代理的形式完全整合到 ChatGPT 之中。如想使用更新後的功能,只需在編輯器的下拉式選單中選取「智能代理模式」,然後直接在 ChatGPT 內輸入查詢。因此,Operator 網站 (operator.chatgpt.com) 將於隨後幾星期停止服務。


我們今天推出 Operator(在新視窗中開啟),這是一款可以在網上為您執行任務的智能代理,可以使用自己的瀏覽器查看網頁,並透過打字、點按和捲動來與網頁互動。此模型目前為研究預覽版,這表示當中有局限性,並將根據用戶意見不斷改進。Operator 是我們首批智能代理程式之一,是可以為您獨立工作的 AI。傯只需提供任務,模型便會代為執行。

您可以要求 Operator 處理各種重複的瀏覽器任務,例如填寫表格、訂購雜貨,甚至製作迷因。模型能夠使用人類日常互動的相同介面和工具,不僅拓寬了 AI 實用性,幫助用戶節省從事日常任務的時間,同時還為企業開闢新的參與機會。

為了確保安全和迭代推出,我們從小型規模開始。從今天起,Operator 在 operator.chatgpt.com(在新視窗中開啟) 向美國的 Pro 版(在新視窗中開啟)用戶提供。我們可以透過這個研究預覽版,向用戶和更廣泛的生態系統學習,並在這個過程中不斷改進和提升。我們計劃未來將它擴展到 Plus、Team 和 Enterprise 用戶,並將這些功能整合到 ChatGPT 中。

Operator 的運作方式

Operator 由一個名為 電腦使用代理 (CUA) 的新模型驅動。CUA 經過訓練,結合 GPT‑4o 的視覺能力,與透過強化學習實現的進階推理,可以與圖形用戶介面 (GUI),即人們在螢幕上看到的按鈕、選單和文字欄位互動。

Operator 可以「觀看」(透過螢幕截圖)並與瀏覽器「互動」(使用滑鼠和鍵盤允許的所有動作),因此無需客製化 API 整合,即可在網路上採取行動。

如果遇到挑戰或犯錯,Operator 可以利用推理能力來自我糾正。當它被卡住而需要協助時,會將控制權交還給用戶,確保流暢的協作體驗。

儘管 CUA 仍處於早期階段並有其局限性,但它已在 WebArena 和 WebVoyager 這兩個關鍵瀏覽器使用基準中取得最新最先進的基準結果。在我們的研究部落格文章中,閱讀更多關於評估和 Operator 背後的研究。

如何使用

若要開始,只需描述你希望完成的任務,Operator 即可處理其餘的工作。用戶可以隨時選擇接管遠端瀏覽器的控制權,而且 Operator 經過訓練,會主動要求用戶接管需要登入、付款詳細資料或解決驗證碼的任務。

用戶可以透過新增自訂指令來個人化他們在 Operator 中的工作流程,無論是針對所有網站還是特定網站,例如在 Booking.com 上設定航空公司喜好。Operator 讓用戶可以在首頁儲存提示詞,以便快速存取,這非常適合重複性任務,例如在 Instacart 上補充雜貨。類似於在瀏覽器上使用多個分頁,用戶可以建立新對話來讓 Operator 同時執行多個任務,例如在 Etsy 上訂購個人化琺瑯馬克杯,同時在 Hipcamp 上預訂露營地。

生態系統和用戶

Operator(在新視窗中開啟) 將人工智能從被動工具轉變為數碼生態系統中的積極參與者。它將為用戶簡化任務,並為那些渴望創新客戶體驗和更高轉換率的公司帶來代理的效益。我們正與 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber 等公司合作,以確保 Operator 在尊重既有規範的同時,能解決現實世界的痛點。除了這些合作,我們在提高某些工作流程的可存取性和效率方面也發現很大的潛力,特別是在公共部門應用中。為了進一步探索這些用例,我們正與如史托克頓市(在新視窗中開啟)等組織合作,讓註冊市政服務和計劃變得更加容易。

「在 Operator 的研究預覽期間,我們對模型的了解有所提升,這有助我們識別透過 AI 讓居民輕鬆參與公民活動的新方法。」
史托克頓市資訊科技總監 Jamil Niazi

初步階段我們向有限的受眾發佈 Operator,目的是讓我們快速學習並根據實際意見來改進功能,確保我們在創新與信任和安全之間取得平衡。這種協作方式有助確保 Operator 為用戶、創作者、企業和公共部門機構帶來有意義的價值。

「OpenAI 的 Operator 是一項技術突破,讓訂購雜貨等流程變得無比輕鬆。」
Instacart 產品主管 Daniel Danker

安全與私隱

確保 Operator 使用安全是首要任務,因此模型設有三層防護措施以防止濫用,並確保用戶可完全掌控。 

首先,Operator 經過訓練,確保用戶可隨時掌控過程,並在關鍵時刻要求輸入。

  • 接管模式:在瀏覽器中輸入敏感資訊,例如登入憑證或付款資訊時,Operator 會要求用戶接管。在接管模式下,Operator 不會收集或截取用戶輸入的資訊。 
  • 用戶確認:在完成例如提交訂單或傳送電郵等重要動作之前,Operator 會要求核准。
  • 任務限制:Operator 經過訓練,會拒絕如銀行交易等敏感任務,又或者對工作申請做決定等需要高風險決策的任務。
  • 監督模式:在電郵或金融服務等特別敏感的網站上,Operator 的操作會受密切監督,讓用戶可以直接發現任何潛在錯誤。

我們亦讓 Operator 中的資料私隱管理變得更輕鬆。 

  • 關閉訓練:在 ChatGPT 設定中關閉「為所有人改進模型」,意味著 Operator 中的資料不會用於訓練我們的模型。 
  • 透明資料管理:用戶可在 Operator 設定的「私隱」部分,輕按一下即可刪除所有瀏覽資料,並登出所有網站。
    在 Operator 中以往的對話,也可以一按刪除。

最後,我們建立防護措施以應對可能試圖透過隱藏提示、惡意程式碼或網絡釣魚來誤導 Operator 的惡意網站:

  • 謹慎導覽:Operator 的設計可偵測並忽略提示注入。
  • 監控:專門的「監控模型」會觀察可疑行為,並在發現異常時暫停任務。
  • 偵測管道:自動化和人工審查流程會持續識別新威脅,並快速更新防護措施。

我們知道不良行為者可能會試圖濫用此技術,因此 Operator 懂得拒絕有害要求並且封鎖禁用的內容。我們的審核系統會針對重複違規發出警告,甚至撤銷存取權限,而我們已整合額外的審查流程來偵測與處理濫用行為。我們也提供關於如何遵守我們的使用政策及與 Operator 互動的指南

儘管 Operator 設計了這些安全措施,但沒有任何系統是完美無缺的,而且此模型現階段只屬研究預覽版;我們承諾會透過實際意見和嚴格測試持續改進。有關我們方法的更多資訊,請瀏覽 Operator 研究網誌的系統防護部分

限制

Operator 目前處於早期研究預覽版階段,雖然它已經能處理各種任務,但仍在學習、發展中,並且可能會犯錯。例如,它目前在處理複雜介面時遇到建立投影片或管理行事曆等挑戰。早期用戶反饋將在提升其準確性、可靠性和安全性方面發揮關鍵作用,幫助我們讓 Operator 為每個人做得更好。

下一步是什麽

API 中的 CUA:我們計劃很快在 API 中開放以 Operator 為核心的模型 CUA,以便開發者可以用它來架設自己的電腦使用代理程式。 

增強功能:我們將持續改進 Operator 處理更長、更複雜工作流程的能力。

更廣泛的存取權:我們計劃將 Operator(在新視窗中開啟) 擴展至 Plus、團隊版和企業版用戶,並在未來當我們對它的安全性與大規模可用性有信心時,將功能直接整合到 ChatGPT 中,以解鎖無縫的即時和非同步任務執行。

作者

OpenAI

基礎研究貢獻者

Casey Chu、David Medina、Hyeonwoo Noh、Noah Jorgensen、Reiichiro Nakano、Sarah Yoo

核心成員

Andrew Howell、Aaron Schlesinger、Baishen Xu、Ben Newhouse、Bobby Stocker、Devashish Tyagi、Dibyo Majumdar、Eugenio Panero、Fereshte Khani、Geoffrey Iyer、Jiahui Yu、Nick Fiacco、Patrick Goethe、Sam Jau、Shunyu Yao、Stephan Casas、Yash Kumar、Yilong Qin

XFN 貢獻者

Abby Fanlo Susktattooist Aleah Houze、Alex Beutel、Alexander Prokofiev、Andrea Vallone、Andrea Chan、Christina Lim、Derek Chen、Duke Kim、Grace Zhao、Heather Whitney、Houda Nait El Barj、Jake Brill、Jeremy Fine、Joe Fireman、Kelly Stirman、Lauren Yang、Lindsay McCallum、Leo Liu、Mike Starr、Minnia Feng、Mostafa Rohaninejad、Oleg Boiko、Owen Campbell-Moore、Paul Ashbourne、Stephen Imm、Taylor Gordon、Tina Sriskandarajah、Winston Howes

負責人

Aaron Schlesinger(基礎架構)、Casey Chu(安全性及模型成熟度)、David Medina(研究基礎架構)、Hyeonwoo Noh(整體研究)、Reiichiro Nakano(整體研究)、Yash Kumar

項目貢獻者

Adam Brandon、Adam Koppel、Adele Li、Ahmed El-Kishky、Akila Welihinda、Alex Karpenko、Alex Nawar、Alex Tachard Passos、Amelia Liu、Andrei Gheorghe、Andrew Duberstein、Andrey Mishchenko、Angela Baek、Ankush Agarwal、Anting Shen、Antoni Baum、Ari Seff、Ashley Tyra、Behrooz Ghorbani、Bo Xu、Brandon McKinzie、Bryan Brandow、Carolina Paz、Cary Hudson、Chak Li、Chelsea Voss、Chen Shen、Chris Koch、Christian Gibson、Christina Kim、Christine McLeavey、Claudia Fischer、Cory Decareaux、Daniel Jacobowitz、Daniel Wolf、David Kjelkerud、David Li、Ehsan Asdar、Elaine Kim、Emilee Goo、Eric Antonow、Eric Hunter、Eric Wallace、Felipe Torres、Fotis Chantzis、Freddie Sulit、Giambattista Parascandolo、Hadi Salman、Haiming Bao、Haoyu Wang、Henry Aspegren、Hyung Won Chung、Ian O’Connell、Ian Sohl、Isabella Fulford、Jake McNeil、James Donovan、Jamie Kiros、Jason Ai、Jason Fedor、Jason Wei、Jay Dixit、Jeffrey Han、Jeffrey Sabin-Matsumoto、Jennifer Griffith-Delgado、Jeramy Han、Jeremiah Currier、Ji Lin、Jiajia Han、Jiaming Zhang、Jiayi Weng、Jieqi Yu、Joanne Jang、Joyce Ruffell、Kai Chen、Kai Xiao、Kevin Button、Kevin King、Kevin Liu、Kristian Georgiev、Kyle Miller、Lama Ahmad、Laurance Fauconnet、Leonard Bogdonoff、Long Ouyang、Louis Feuvrier、Madelaine Boyd、Mamie Rheingold、Matt Jones、Michael Sharman、Miles Wang、Mingxuan Wang、Nick Cooper、Niko Felix、Nikunj Handa、Noel Bundick、Pedro Aguilar、Peter Faiman、Peter Hoeschele、Pranav Deshpande、Raul Puri、Raz Gaon、Reid Gustin、Robin Brown、Rob Honsby、Saachi Jain、Sandhini Agarwal、Scott Ethersmith、Scott Lessans、Shauna O’Brien、Spencer Papay、Steve Coffey、Tal Stramer、Tao Wang、Teddy Lee、Tejal Patwardhan、Thomas Degry、Tomo Hiratsuka、Troy Peterson、Wenda Zhou、William Butler、Wyatt Thompson、Yao Zhou、Yaodong Yu、Yi Cheng、Yinghai Lu、Younghoon Kim、Yu-Ann Wang Madan、Yushi Wang、Zhiqing Sun

領導層

Anna Makanju、Greg Brockman、Hannah Wong、Jerry Tworek、Liam Fedus、Mark Chen、Peter Welinder、Sam Altman、Wojciech Zaremba