メインコンテンツにスキップ
OpenAI

2025年1月23日

製品

Operator が登場

エージェント(研究プレビュー版)が自身のブラウザを使って人の代わりにタスクを実行。ご利用対象:アメリカの Pro ユーザー

Introducing Operator > Hero > Media Item
読み込んでいます...

本日、ユーザーに代わってウェブにアクセスしてタスクを実行できるエージェント、Operator(新しいウィンドウで開く) をリリースいたします。このエージェントには、自身のブラウザを使用した Web ページの閲覧、および入力、クリック、スクロールによるインタラクトが可能です。これは現在、研究プレビュー版です。つまり、能力にはまだ制限事項が存在し、ユーザーの方からのフィードバックに基づいて進化させていきます。Operator は、当社初のエージェント(自律での作業が可能な AI)の1つです。人がタスクを与えると、Operator がそれを実行します。

Operator にはブラウザ上での様々な反復的タスクの処理が可能で、フォーム記入や食料品注文など、さらにミーム作成にまで対応します。人が日常的に使うものと同じインターフェースとツールを使用できるため、AI の有用性が広がり、利用者が日常業務に費やす時間を節約するのに役立つのと共に、企業にも新たなエンゲージメントの機会をもたらします。

安全を確保した段階的な展開とするために、小規模の公開から開始します。本日からは、アメリカの Pro ユーザーの方が operator.chatgpt.com(新しいウィンドウで開く) において、Operator をご利用いただけます。この研究プレビュー版によって、当社はユーザーの方および広範なエコシステムから知見を得るにつれて改良・改善を行っていくことが可能となります。今後は Plus、Team、Enterprise ユーザーの方にも対象を拡大し、将来的には本機能を ChatGPT に統合する予定です。

Operator の仕組み

Operator は、Computer-Using Agent(CUA)と呼ばれる新しいモデルによって駆動しています。GPT‑4o の視覚機能と強化学習による高度な論理的思考を組み合わせて、人が画面上に見るボタン、メニュー、テキスト フィールドなどのグラフィカルユーザーインターフェース(GUI)とインタラクトすることを CUA に学習させます。

Operator は、ブラウザを「見て」(スクリーンショットを利用)、「インタラクト」(マウスとキーボードに可能なすべてのアクションを使用)できるため、カスタム API 統合を必要とせずに Web 上でアクションを実行できます。

問題に遭遇したり、間違いを犯した場合には、リーズニング機能を活用して自己修正が可能です。行動に行き詰まり、支援が必要になった場合には、すぐユーザーに制御を戻し、スムーズで共働的なエクスペリエンスが確保されます。

CUA はまだ初期の段階で、制限事項はありますが、主要なブラウザ使用ベンチマークである WebArena と WebVoyager において、現時点最高のベンチマーク結果を新たに達成しました。Operator の評価や開発の基礎となった研究の詳細は、こちらの研究ブログをお読みください。

使用法

使用を開始するには、行いたいタスクを説明するだけで、後は Operator が対応します。ユーザーは、どの時点においてもリモートブラウザの制御を引き継ぐことができます。そして Operator は、ログイン、支払い情報、CAPTCHA の解決を必要とするタスクについては、自発的にユーザーに引き継ぎを依頼することを学習しています。

Operator におけるワークフローは、全サイトまたは特定サイトに対するカスタム指示(Booking.com において利用する航空会社を指定するなど)を追加することで、カスタマイズが可能です。Operator は、ホームページでのアクセスを迅速化するためのプロンプトの保存が可能です。これは繰り返しのタスク(Instacart での食料品の補充購入など)に最適です。ブラウザで複数のタブが使用できるのと同じように、Operator でも、新しい会話を作成していくことで複数タスクの同時進行(Hipcamp でキャンプ場を予約しながら、Etsy でカスタマイズのエナメルマグを注文するなど)が可能です。

エコシステムとユーザー

Operator(新しいウィンドウで開く) は、AI を受動的なツールからデジタルエコシステムへの積極的な参加者へと変革します。これはユーザーのタスクを効率化し、顧客体験の革新、コンバージョン率向上を求める企業にエージェントのメリットをもたらすものです。当社は DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber などの企業と連携して、Operator が確立された規範を尊重すると共に、現実世界のニーズに対応できるようにしています。このような連携に加えて、特定のワークフロー、特に公共部門での利用において、アクセシビリティと効率性向上の大きな可能性があると考えています。このユースケースをさらに検討するために、ストックトン市(新しいウィンドウで開く)などの組織と協働しており、都市のサービスやプログラムへのアクセスを簡易化しています。

「Operator について研究プレビュー中に詳しく知ることで、住民のシビックエンゲージメントを AI で更に容易にする方法の判断をより適切に行えるようになるでしょう」
ストックトン市 IT 責任者 Jamil Niazi 氏

最初は限られた対象者だけに Operator をリリースすることで、迅速な学習および現実世界のフィードバックに基づく機能の改良を目指し、イノベーションと信頼性・安全性とのバランスを確保します。この協力的アプローチは、ユーザー、クリエイター、企業、公共機関の各々に同等の有意義な価値を Operator が確実に提供するために役立つものです。

「OpenAI の Operator は、食料品の注文などのプロセスを信じられないほど簡単にする技術ブレイクスルーです」
Instacart 最高製品責任者 Daniel Danker 氏

安全性とプライバシー

Operator 利用における安全性確保は最優先事項であり、不正使用を防止し、ユーザーによる制御を確実なものとするため、3層の安全対策が講じられています。 

まず、Operator に制御権は常に使用する人にあることを学習させました。そのため重要なポイントでは使用者の入力が求められます。

  • 引き継ぎモード:Operator は、ログイン認証情報や支払い情報などの機密情報をブラウザに入力する場面では、ユーザーに引き継ぎを求めます。引き継ぎモードにおいては、Operator がユーザーが入力した情報を収集したり、スクリーンショットを撮ったりすることはありません。 
  • ユーザーによる確認:発注やメール送信などの重要なアクションにおいては、Operator は実行する前にユーザーの承認を求める必要があります。
  • タスクの制限:Operator は、機密性の高いタスク(銀行取引など)、重大な決断を必要とするタスク(求人への応募など)といった特定のタスクは拒否することを学習しています。
  • 警戒モード:メールや金融サービスなどの特に機密性の高いサイトでは、間違いの可能性をユーザーが直接発見できるように、Operator はアクションの厳密な監視をユーザーに求めます。

次に、Operator ではデータプライバシー管理が容易に行えるようにしました。 

  • 学習のオプトアウト:ChatGPT の Settings(設定)において、「Improve the model for everyone(すべての人のためにモデルを改善する)」をオフにすると、Operator のデータもモデルの学習に使用されなくなります。 
  • 透明性のあるデータ管理:Operator の Settings(設定)内の Privacy(プライバシー)セクションにおいて、すべての閲覧データの削除と、すべてのサイトからのログアウトがワンクリックで行えます。Operator との会話履歴もワンクリックで削除できます。

最後に、隠しプロンプト、悪意のあるコード、フィッシング攻撃などによって Operator の判断を誤らせようとする敵対的な Web サイトに対する以下のような防御を構築しました。

  • 慎重なナビゲーション:Operator は、プロンプトインジェクションを検知し、無視するように設計されています。
  • モニタリング:専用の「モニターモデル」が疑わしい動作を監視し、何かおかしいと思われる場合にはタスクを一時停止させます。
  • 検知パイプライン:自動および人間による評価プロセスにより、新しい脅威の特定が継続的に行われ、迅速に保護手段が更新されます。

当社は、悪意あるアクターが本技術の悪用を試みる可能性があることを認識しています。それが有害なリクエストを拒否し、許可されていないコンテンツをブロックするように Operator を設計した理由です。当社のモデレーションシステムは、違反が繰り返される場合には警告を発し、さらなる場合はアクセスの取り消しも行います。また、悪用を検知して対処するための追加のレビュープロセスも統合されています。また、当社は利用ポリシーに準拠して Operator とインタラクトするためのガイダンスも提供しています。

Operator は上記の安全対策を講じた設計ではありますが、絶対に完璧なシステムというものはなく、これはまだ研究プレビュー版の段階のものです。当社は、実世界のフィードバックと厳格なテストによって、本技術の継続的改善に取り組んでいく所存です。当社のアプローチの詳細につきましては、Operator 研究ブログ内の「安全性」のセクションをお読みください。

制限事項

Operator は現在、初期研究プレビュー版です。すでに幅広いタスクを処理できる能力がありますが、まだ学習と進化の過程にあり、間違いを犯す可能性があります。例えば、現時点では、スライドショー作成やカレンダー管理などの複雑なインターフェースにおいて問題が生じることが分かっています。初期ユーザーの方からいただくフィードバックが、Operator の精度、信頼性、安全性を高める上で極めて重要な役割を果たし、より優れたサービスをすべての人に提供するための助けとなりますので、どうぞご協力をお願いいたします。

今後の展望

API としての CUA 提供:開発者の方向けに、ご自身による Computer-Using Agent 構築にご利用いただけるように、Operator を動かすモデルである CUA の API としての提供をまもなく開始する予定です。 

機能の強化:より長大で、より複雑なワークフローを処理できるように、Operator の機能の改善を継続していきます。

アクセスの拡大:今後は、Operator(新しいウィンドウで開く) へのアクセスを Plus、Team、Enterprise ユーザーの方まで拡大し、将来的に、その安全性と大規模環境におけるユーザビリティに自信が持てるようになった際には、本機能を ChatGPT に直接統合して、シームレスなリアルタイムおよび非同期のタスク実行を実現する予定です。

著者

OpenAI

基礎研究貢献者

Casey Chu、David Medina、Hyeonwoo Noh、Noah Jorgensen、Reiichiro Nakano、Sarah Yoo

主力貢献者

Andrew Howell、Aaron Schlesinger、Baishen Xu、Ben Newhouse、Bobby Stocker、Devashish Tyagi、Dibyo Majumdar、Eugenio Panero、Fereshte Khani、Geoffrey Iyer、Jiahui Yu、Nick Fiacco、Patrick Goethe、Sam Jau、Shunyu Yao、Stephan Casas、Yash Kumar、Yilong Qin

XFN 貢献者

Abby Fanlo Susk、Aleah Houze、Alex Beutel、Alexander Prokofiev、Andrea Vallone、Andrea Chan、Christina Lim、Derek Chen、Duke Kim、Grace Zhao、Heather Whitney、Houda Nait El Barj、Jake Brill、Jeremy Fine、Joe Fireman、Kelly Stirman、Lauren Yang、Lindsay McCallum、Leo Liu、Mike Starr、Minnia Feng、Mostafa Rohaninejad、Oleg Boiko、Owen Campbell-Moore、Paul Ashbourne、Stephen Imm、Taylor Gordon、Tina Sriskandarajah、Winston Howes

責任者

Aaron Schlesinger(インフラストラクチャー)、Casey Chu(安全性・モデルレディネス)、David Medina(研究インフラストラクチャー)、Hyeonwoo Noh(研究全般)、Reiichiro Nakano(研究全般)、Yash Kumar

貢献者

Adam Brandon、Adam Koppel、Adele Li、Ahmed El-Kishky、Akila Welihinda、Alex Karpenko、Alex Nawar、Alex Tachard Passos、Amelia Liu、Andrei Gheorghe、Andrew Duberstein、Andrey Mishchenko、Angela Baek、Ankush Agarwal、Anting Shen、Antoni Baum、Ari Seff、Ashley Tyra、Behrooz Ghorbani、Bo Xu、Brandon McKinzie、Bryan Brandow、Carolina Paz、Cary Hudson、Chak Li、Chelsea Voss、Chen Shen、Chris Koch、Christian Gibson、Christina Kim、Christine McLeavey、Claudia Fischer、Cory Decareaux、Daniel Jacobowitz、Daniel Wolf、David Kjelkerud、David Li、Ehsan Asdar、Elaine Kim、Emilee Goo、Eric Antonow、Eric Hunter、Eric Wallace、Felipe Torres、Fotis Chantzis、Freddie Sulit、Giambattista Parascandolo、Hadi Salman、Haiming Bao、Haoyu Wang、Henry Aspegren、Hyung Won Chung、Ian O’Connell、Ian Sohl、Isabella Fulford、Jake McNeil、James Donovan、Jamie Kiros、Jason Ai、Jason Fedor、Jason Wei、Jay Dixit、Jeffrey Han、Jeffrey Sabin-Matsumoto、Jennifer Griffith-Delgado、Jeramy Han、Jeremiah Currier、Ji Lin、Jiajia Han、Jiaming Zhang、Jiayi Weng、Jieqi Yu、Joanne Jang、Joyce Ruffell、Kai Chen、Kai Xiao、Kevin Button、Kevin King、Kevin Liu、Kristian Georgiev、Kyle Miller、Lama Ahmad、Laurance Fauconnet、Leonard Bogdonoff、Long Ouyang、Louis Feuvrier、Madelaine Boyd、Mamie Rheingold、Matt Jones、Michael Sharman、Miles Wang、Mingxuan Wang、Nick Cooper、Niko Felix、Nikunj Handa、Noel Bundick、Pedro Aguilar、Peter Faiman、Peter Hoeschele、Pranav Deshpande、Raul Puri、Raz Gaon、Reid Gustin、Robin Brown、Rob Honsby、Saachi Jain、Sandhini Agarwal、Scott Ethersmith、Scott Lessans、Shauna O’Brien、Spencer Papay、Steve Coffey、Tal Stramer、Tao Wang、Teddy Lee、Tejal Patwardhan、Thomas Degry、Tomo Hiratsuka、Troy Peterson、Wenda Zhou、William Butler、Wyatt Thompson、Yao Zhou、Yaodong Yu、Yi Cheng、Yinghai Lu、Younghoon Kim、Yu-Ann Wang Madan、Yushi Wang、Zhiqing Sun

リーダーシップ

Anna Makanju、Greg Brockman、Hannah Wong、Jerry Tworek、Liam Fedus、Mark Chen、Peter Welinder、Sam Altman、Wojciech Zaremba