
2025 年 7 月 17 日更新:Operator 现已作为 ChatGPT 智能体完全集成到 ChatGPT 中。要访问这些更新的功能,只需从编辑器中的下拉菜单中选择“智能体模式”,然后直接在 ChatGPT 中输入您的查询。因此,独立的 Operator 网站 (operator.chatgpt.com) 将于未来几周内停止服务。
今天,我们将发布一款可以上网为您执行任务的智能体——Operator(在新窗口中打开)。它能使用自己的浏览器查看网页,而您则可以通过键入、点击和滚动操作与之交互。目前发布的是研究预览版,这表示它具有一定的局限性,但将根据用户反馈持续改进。Operator 是我们推出的首批智能体之一,它们作为具备独立工作能力的 AI,能够执行您交给它们的任务。
您可以要求 Operator 处理各种重复性浏览器任务,例如填写表格、订购杂货,甚至创建备忘录。AI 能够使用人类在日常交互时使用的相同界面和工具,其用途因此得以拓宽,不仅能帮助人们节省处理日常任务所需的时间,也能为企业开辟新的参与机会。
为确保安全地进行迭代部署,我们将从小规模起步。从今天开始,美国境内的 Pro(在新窗口中打开) 用户可登录 operator.chatgpt.com(在新窗口中打开) 使用 Operator。此研究预览版让我们可以向用户和更广泛的生态系统学习,并在这个过程中不断完善和改进。我们计划未来逐步推广到 Plus、Team 和 Enterprise 用户,并将相关功能集成到 ChatGPT 中。
支持 Operator 运作的是一个被称为计算机使用智能体 (CUA) 的新模型。CUA 经过训练,将 GPT‑4o 的视觉功能与通过强化学习获得的高级推理能力相结合,与图形用户界面(GUI,即人们在屏幕上看到的按钮、菜单和文本字段)进行交互。
Operator 可以“查看”(通过屏幕截图)浏览器并与之“交互”(使用鼠标和键盘允许的所有操作),所以无需自定义 API 集成也能在网络上执行操作。
如果遇到挑战或犯了错,Operator 可以利用其推理能力进行自我纠正。当它陷入困境需要帮助时,就会将控制权交还给用户,确保用户获得流畅的协作体验。
尽管 CUA 仍处于早期阶段并且存在诸多局限性,但这并不妨碍它在 WebArena 和 WebVoyager 这两项重要的浏览器用基准测试中取得优异成绩并创造新的标杆。如需阅读更多相关评估和关于 Operator 的研究信息,请移步我们的研究博文。
使用方法很简单:只需描述您希望完成的任务,剩下的工作交给 Operator 来处理。用户可以选择随时接管远程浏览器的控制权,在遇到需要提供登录凭据、支付详情或验证码的任务时,训练有素的 Operator 会主动要求用户接管。
用户可以在 Operator 中通过为所有网站或特定网站添加自定义指令,实现个性化的工作流程,例如针对 Booking.com 上的航空公司设置首选项。Operator 还允许用户保存提示,以便快速访问主页。这项功能非常适合重复性任务,例如在 Instacart 上补货。与在浏览器上使用多个标签类似,用户可以通过创建新对话让 Operator 同时执行多项任务,例如在 Etsy 上订购个性化搪瓷杯,同时在 Hipcamp 上预订露营地。
Operator(在新窗口中打开) 将 AI 从被动工具转变为数字生态系统的积极参与者。它将简化用户任务,并为希望提供创新客户体验和提高转化率的公司赋予智能体的优势。我们与 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack 和 Uber 等公司合作,确保 Operator 在遵循既定规范的同时满足真实世界的需求。除上述合作之外,它在提高特定工作流程的可访问性和效率方面也存在巨大潜力,尤其是在公共部门应用领域。为了进一步探索这些用例,我们正与斯托克顿市政府(在新窗口中打开)等机构合作,帮助他们简化城市服务和项目的注册程序。
“研究预览版将加深我们对 Operator 的了解,帮助我们找到更多的方法,利用 AI 来支持市民更轻松地参与公民事务。”
在初期向有限的受众发布 Operator 之后,我们将加快学习速度,并根据真实世界的反馈不断完善它的功能,确保在创新与信任和安全之间取得平衡。这种合作方式有助于确保 Operator 为用户、创作者、企业和公共部门等组织提供有意义的价值。
“OpenAI 的 Operator 是一项技术突破,它让订购杂货等流程变得易如反掌。”
确保安全使用 Operator 是我们的当务之急,为了防止滥用并保证用户牢牢掌控 Operator,我们为其设置了三重保障措施。
首先,Operator 接受的训练确保使用它的用户始终掌握控制权,并且它会在关键时间点征求用户的意见。
- 接管模式:当需要在浏览器中输入敏感信息(例如登录凭据或付款信息)时,Operator 会要求用户接管。在接管模式下,Operator 不会收集或截取用户输入的信息。
- 用户确认:在最终执行任何重大操作(例如提交订单或发送电子邮件)之前,Operator 必须请求用户批准。
- 任务限制:Operator 接受的训练要求它拒绝执行某些敏感任务,例如银行交易或需要做出高风险决策的任务,包括求职决策。
- 观察模式:在电子邮件或金融服务等特别敏感的网站上,Operator 会要求用户密切监督其操作,这样用户就能直接发现任何潜在的错误。
其次,我们简化了 Operator 的数据隐私管理。
- 退出训练选项:在 ChatGPT 设置中关闭“为所有用户改进模型”,这样 Operator 中的数据就不会被用于训练我们的模型。
- 透明的数据管理:用户只需在 Operator 设置的“隐私”部分点击一下,即可删除所有浏览数据并注销所有网站。Operator 中的过往对话也可以一键删除。
最后,我们针对恶意网站构建了防御系统,阻止此类网站通过隐藏提示、恶意代码或网络钓鱼企图来误导 Operator:
- 谨慎导航:Operator 能够检测和忽略提示注入攻击。
- 监控:专门的“监控模型”负责监视可疑行为,一旦发现异常就会暂停任务。
- 检测管道:自动和人工审核流程可持续识别新的威胁并快速更新保障措施。
我们知道,别有用心的人可能会试图滥用这项技术。因此,我们将 Operator 设计为可以拒绝有害请求并阻止不允许的内容。我们的审核系统可以对屡次违规的用户发出警告,甚至取消其访问权限。另外,我们还整合了其他审核流程来检测和解决滥用问题。我们还会就如何遵循我们的使用政策与 Operator 进行交互提供相关指导。
尽管我们为 Operator 设计了上述保障措施,但没有任何系统能够做到无懈可击,而且当前发布的仍是研究预览版,我们将致力于借助真实世界的反馈和严格的测试来推动持续改进。如需详细了解我们的方法,请访问 Operator 研究博客的安全部分。
Operator 目前仍属于早期研究预览版。尽管它已经能够处理众多任务,但仍处在学习和发展的过程中,并且可能会犯错误。例如,它在创建幻灯片或管理日历等复杂界面中,目前还面临诸多挑战。早期用户反馈将在提高它的准确性、可靠性和安全性,帮助我们为所有用户完善 Operator 方面发挥重要作用。
API 中的计算机使用智能体 (CUA):我们计划近期在 API 中公开为 Operator 提供支持的模型 CUA,方便开发人员用来构建自己的计算机使用智能体。
增强功能:我们将继续提升 Operator 处理更长、更复杂工作流程的能力。
扩大访问群体:未来,一旦我们确信大规模使用 Operator(在新窗口中打开) 的安全性和可用性得到保障,我们计划将它推广给 Plus、Team 和 Enterprise 用户,并将其功能直接集成到 ChatGPT 中,真正释放其无缝执行实时和异步任务的强大功能。
作者
基础研究贡献者
Casey Chu、David Medina、Hyeonwoo Noh、Noah Jorgensen、Reiichiro Nakano、Sarah Yoo
核心研究贡献者
Andrew Howell、Aaron Schlesinger、Baishen Xu、Ben Newhouse、Bobby Stocker、Devashish Tyagi、Dibyo Majumdar、Eugenio Panero、Fereshte Khani、Geoffrey Iyer、Jiahui Yu、Nick Fiacco、Patrick Goethe、Sam Jau、Shunyu Yao、Stephan Casas、Yash Kumar、Yilong Qin
XFN 贡献者
Abby Fanlo Susk、Aleah Houze、Alex Beutel、Alexander Prokofiev、Andrea Vallone、Andrea Chan、Christina Lim、Derek Chen、Duke Kim、Grace Zhao、Heather Whitney、Houda Nait El Barj、Jake Brill、Jeremy Fine、Joe Fireman、Kelly Stirman、Lauren Yang、Lindsay McCallum、Leo Liu、Mike Starr、Minnia Feng、Mostafa Rohaninejad、Oleg Boiko、Owen Campbell-Moore、Paul Ashbourne、Stephen Imm、Taylor Gordon、Tina Sriskandarajah、Winston Howes
负责人
Aaron Schlesinger(基础设施)、Casey Chu(安全与模型准备度)、David Medina(研究基础设施)、Hyeonwoo Noh(总体研究)、Reiichiro Nakano(总体研究)、Yash Kumar
贡献者
Adam Brandon、Adam Koppel、Adele Li、Ahmed El-Kishky、Akila Welihinda、Alex Karpenko、Alex Nawar、Alex Tachard Passos、Amelia Liu、Andrei Gheorghe、Andrew Duberstein、Andrey Mishchenko、Angela Baek、Ankush Agarwal、Anting Shen、Antoni Baum、Ari Seff、Ashley Tyra、Behrooz Ghorbani、Bo Xu、Brandon McKinzie、Bryan Brandow、Carolina Paz、Cary Hudson、Chak Li、Chelsea Voss、Chen Shen、Chris Koch、Christian Gibson、Christina Kim、Christine McLeavey、Claudia Fischer、Cory Decareaux、Daniel Jacobowitz、Daniel Wolf、David Kjelkerud、David Li、Ehsan Asdar、Elaine Kim、Emilee Goo、Eric Antonow、Eric Hunter、Eric Wallace、Felipe Torres、Fotis Chantzis、Freddie Sulit、Giambattista Parascandolo、Hadi Salman、Haiming Bao、Haoyu Wang、Henry Aspegren、Hyung Won Chung、Ian O’Connell、Ian Sohl、Isabella Fulford、Jake McNeil、James Donovan、Jamie Kiros、Jason Ai、Jason Fedor、Jason Wei、Jay Dixit、Jeffrey Han、Jeffrey Sabin-Matsumoto、Jennifer Griffith-Delgado、Jeramy Han、Jeremiah Currier、Ji Lin、Jiajia Han、Jiaming Zhang、Jiayi Weng、Jieqi Yu、Joanne Jang、Joyce Ruffell、Kai Chen、Kai Xiao、Kevin Button、Kevin King、Kevin Liu、Kristian Georgiev、Kyle Miller、Lama Ahmad、Laurance Fauconnet、Leonard Bogdonoff、Long Ouyang、Louis Feuvrier、Madelaine Boyd、Mamie Rheingold、Matt Jones、Michael Sharman、Miles Wang、Mingxuan Wang、Nick Cooper、Niko Felix、Nikunj Handa、Noel Bundick、Pedro Aguilar、Peter Faiman、Peter Hoeschele、Pranav Deshpande、Raul Puri、Raz Gaon、Reid Gustin、Robin Brown、Rob Honsby、Saachi Jain、Sandhini Agarwal、Scott Ethersmith、Scott Lessans、Shauna O’Brien、Spencer Papay、Steve Coffey、Tal Stramer、Tao Wang、Teddy Lee、Tejal Patwardhan、Thomas Degry、Tomo Hiratsuka、Troy Peterson、Wenda Zhou、William Butler、Wyatt Thompson、Yao Zhou、Yaodong Yu、Yi Cheng、Yinghai Lu、Younghoon Kim、Yu-Ann Wang Madan、Yushi Wang、Zhiqing Sun
领导团队
Anna Makanju、Greg Brockman、Hannah Wong、Jerry Tworek、Liam Fedus、Mark Chen、Peter Welinder、Sam Altman、Wojciech Zaremba