Үндсэн агуулга руу алгасах
OpenAI

2025 оны нэгдүгээр сарын 23

Бүтээгдэхүүн

Introducing Operator

A research preview of an agent that can use its own browser to perform tasks for you. Available to Pro users in the U.S.

Introducing Operator > Hero > Media Item
Ачаалж байна…

2025 оны 7-р сарын 17-ны шинэчлэлт: Operator одоо ChatGPT‑д ChatGPT агент нэрээр бүрэн нэгтгэгдсэн. Эдгээр шинэ боломжуудад хандахын тулд composer дахь унадаг цэснээс “agent mode”-ийг сонгоод хүсэлтээ ChatGPT дотор шууд оруулна уу. Үүний үр дүнд бие даасан Operator сайт (operator.chatgpt.com) ойрын хэдэн долоо хоногт хаагдана.


Өнөөдөр бид Operator(шинэ цонхонд нээгдэнэ)-ийг танилцуулж байна. Энэ нь таны өмнөөс даалгавар гүйцэтгэхээр вэб рүү орж чаддаг агент юм. Өөрийн хөтчийг ашиглан энэ нь вэб хуудсыг харж, шивэх, товших, гүйлгэх замаар түүнтэй харилцаж чадна. Одоогоор энэ нь судалгааны урьдчилсан хувилбар бөгөөд энэ нь хязгаарлалттай, хэрэглэгчийн санал хүсэлтэд үндэслэн хөгжсөөр байна гэсэн үг. Operator бол бидний анхны агентуудын нэг бөгөөд агентууд гэдэг нь таны өмнөөс бие даан ажил хийх чадвартай AI-ууд юм—та даалгавар өгнө, тэр үүнийг гүйцэтгэнэ.

Operator-оор маягт бөглөх, хүнс захиалах, тэр ч байтугай meme бүтээх зэрэг олон төрлийн давтагддаг хөтчийн даалгавруудыг хийлгэж болно. Хүмүүсийн өдөр тутам хэрэглэдэг ижил интерфэйс, хэрэгслүүдийг ашиглах чадвар нь AI-ийн хэрэглээг өргөжүүлж, хүмүүст өдөр тутмын ажлуудад цаг хэмнэхэд туслахын зэрэгцээ бизнесүүдэд харилцан үйлчлэлийн шинэ боломжуудыг нээж өгдөг.

Аюулгүй, үе шаттай нэвтрүүлэлтийг хангахын тулд бид багаас эхэлж байна. Өнөөдрөөс эхлэн Operator нь АНУ дахь Pro(шинэ цонхонд нээгдэнэ) хэрэглэгчдэд operator.chatgpt.com(шинэ цонхонд нээгдэнэ) дээр нээлттэй байна. Энэхүү судалгааны урьдчилсан хувилбар нь хэрэглэгчид болон өргөн экосистемээс суралцаж, явцын дунд сайжруулж, боловсронгуй болгох боломж олгодог. Бидний төлөвлөгөө бол үүнийг Plus, Team, Enterprise хэрэглэгчдэд өргөжүүлж, цаашид эдгээр чадварыг ChatGPT‑д нэгтгэх явдал юм.

Operator хэрхэн ажилладаг вэ

Operator нь Компьютер ашиглах агент (CUA) хэмээх шинэ загвараар ажилладаг. GPT‑4o‑ийн харааны чадварыг бататгах сургалтаар дамжих ахисан түвшний сэтгэн бодохтой хослуулснаар CUA нь график хэрэглэгчийн интерфэйсүүдтэй (GUI)—өөрөөр хэлбэл хүмүүс дэлгэцэн дээр хардаг товч, цэс, текстийн талбаруудтай—харилцахаар сургагдсан.

Operator нь хөтчийг “харж” (дэлгэцийн агшнаар) мөн “харилцаж” (хулгана, гарын бүх боломжит үйлдлээр) чаддаг тул тусгай API интеграц шаардалгүйгээр вэб дээр үйлдэл хийх боломж олгодог.

Хэрэв бэрхшээлтэй тулгарвал эсвэл алдаа гаргавал Operator өөрийгөө засахын тулд сэтгэн бодох чадвараа ашиглаж чадна. Гацаж, тусламж хэрэгтэй болох үедээ энэ нь зүгээр л хяналтыг хэрэглэгчид буцаан өгч, жигд бөгөөд хамтын туршлагыг хангана.

CUA нь одоогоор эхний шатандаа байгаа бөгөөд хязгаарлалтуудтай ч хөтөч ашиглах хоёр чухал шалгуур болох WebArena болон WebVoyager дээр шинэ state-of-the-art үр дүн тогтоож байна. Үнэлгээ болон Operator-ийн цаадах судалгааны талаар дэлгэрэнгүйг манай судалгааны блог нийтлэлээс уншина уу.

Хэрхэн ашиглах вэ

Эхлэхийн тулд зүгээр л ямар даалгавар хийлгэхийг хүсэж байгаагаа тайлбарла, үлдсэнийг нь Operator хариуцна. Хэрэглэгчид алсын хөтчийн хяналтыг хүссэн үедээ өөр дээрээ авч болно, мөн Operator нь нэвтрэх, төлбөрийн мэдээлэл оруулах эсвэл CAPTCHA шийдэх шаардлагатай даалгавруудад хэрэглэгчээс хяналтыг урьдчилан авахыг хүсэхээр сургагдсан.

Хэрэглэгчид бүх сайт эсвэл тодорхой сайтуудад зориулан, жишээ нь Booking.com дээр агаарын тээврийн сонголтоо тохируулах гэх мэт, өөрийн заавар нэмснээр Operator дахь ажлын урсгалаа хувийн болгож чадна. Operator нь нүүр хуудсан дээр хурдан хандахад зориулан өгөгдлүүдийг хадгалах боломж олгодог бөгөөд энэ нь Instacart дээр хүнсээ дахин захиалах зэрэг давтагддаг даалгаварт тохиромжтой. Хөтөч дээр олон tab ашиглахтай адил хэрэглэгчид шинэ яриа үүсгэснээр Operator-оор олон даалгаврыг зэрэг ажиллуулж болно. Жишээлбэл Etsy дээр хувийн паалантай аяга захиулахын зэрэгцээ Hipcamp дээр кемпийн талбай захиалж болно.

Экосистем ба хэрэглэгчид

Operator(шинэ цонхонд нээгдэнэ) нь AI-ийг идэвхгүй хэрэгслээс дижитал экосистемийн идэвхтэй оролцогч болгон хувиргаж байна. Энэ нь хэрэглэгчдийн даалгаврыг хялбарчилж, шинэлэг хэрэглэгчийн туршлага хүсэж, хөрвүүлэлтийн түвшнээ нэмэгдүүлэхийг зорьдог компаниудад агентуудын давуу талыг авчирна. Бид DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber зэрэг компаниуд болон бусадтай хамтран ажиллаж, Operator нь бодит хэрэгцээг хангахын зэрэгцээ тогтсон хэм хэмжээг хүндэтгэхийг баталгаажуулж байна. Эдгээр хамтын ажиллагаанаас гадна бид тодорхой ажлын урсгалуудын хүртээмж, үр ашгийг, ялангуяа төрийн салбарын хэрэглээнд, сайжруулах ихээхэн боломжийг олж харж байна. Эдгээр хэрэглээний тохиолдлуудыг цаашид судлахын тулд бид Стоктон хот(шинэ цонхонд нээгдэнэ) зэрэг байгууллагуудтай хамтран хотын үйлчилгээ, хөтөлбөрүүдэд бүртгүүлэхийг илүү хялбар болгож байна.

“Бид Operator-ийг судалгааны урьдчилсан хувилбарын хугацаанд илүү сайн танин мэдэх тусам AI нь манай оршин суугчдын иргэний оролцоог улам хялбар болгох ямар арга замууд байгааг илүү сайн тодорхойлох боломжтой болно.”
Стоктон хотын Мэдээллийн технологийн захирал Жамил Ниази

Operator-ийг эхлээд хязгаарлагдмал хүрээний хэрэглэгчдэд гаргаснаар бид хурдан суралцаж, бодит хэрэглээний санал хүсэлтэд тулгуурлан түүний чадварыг сайжруулж, инновацыг итгэлцэл ба аюулгүй байдалтай тэнцвэржүүлэхийг зорьж байна. Энэхүү хамтын хандлага нь Operator хэрэглэгчид, бүтээгчид, бизнесүүд болон төрийн байгууллагуудад бодит үнэ цэнэ хүргэхэд тусалдаг.

“OpenAI-ийн Operator нь хүнс захиалах зэрэг үйл явцыг гайхалтай хялбар болгодог технологийн томоохон дэвшил юм.”
Instacart-ын Бүтээгдэхүүн хариуцсан захирал Даниел Данкер

Аюулгүй байдал ба нууцлал

Operator-ийг аюулгүй ашиглахыг хангах нь нэн тэргүүний зорилт бөгөөд урвуулан ашиглахаас сэргийлэх, хэрэглэгчийг хатуу хяналттай байлгах гурван давхар хамгаалалттай.

Нэгдүгээрт, Operator-ийг ашиглаж буй хүн үргэлж хяналтад байх, чухал мөчүүдэд оролт өгөхийг хүсдэг байхаар сургасан.

  • Хяналтыг шилжүүлэх горим: Нэвтрэх мэдээлэл эсвэл төлбөрийн мэдээлэл зэрэг мэдрэмтгий мэдээллийг хөтөчид оруулах үед Operator хэрэглэгчээс хяналтыг авахыг хүсдэг. Хяналтыг шилжүүлэх горимд Operator хэрэглэгчийн оруулсан мэдээллийг цуглуулахгүй, дэлгэцийн зураг авахгүй.
  • Хэрэглэгчийн баталгаажуулалт: Захиалга илгээх эсвэл имэйл явуулах зэрэг аливаа чухал үйлдлийг эцэслэхийн өмнө Operator зөвшөөрөл хүсэх ёстой.
  • Даалгаврын хязгаарлалт: Operator нь банкны гүйлгээ эсвэл ажлын өргөдлийн талаар шийдвэр гаргах зэрэг өндөр эрсдэлтэй шийдвэр шаардсан тодорхой мэдрэмтгий даалгавруудаас татгалзахаар сургагдсан.
  • Ажиглалтын горим: Имэйл эсвэл санхүүгийн үйлчилгээ зэрэг онцгой мэдрэмтгий сайтууд дээр Operator үйлдлүүддээ ойрын хяналт шаардаж, хэрэглэгчдэд аливаа болзошгүй алдааг шууд анзаарах боломж олгодог.

Дараа нь бид Operator дахь өгөгдлийн нууцлалыг удирдахад хялбар болгосон.

  • Сургалтаас хасах: ChatGPT тохиргоон дахь ‘Improve the model for everyone’-ийг унтрааснаар Operator дахь өгөгдөл мөн манай загваруудыг сургахад ашиглагдахгүй.
  • Ил тод өгөгдлийн удирдлага: Хэрэглэгчид Operator тохиргооны Privacy хэсэгт нэг товшилтоор бүх хайлтын өгөгдлөө устгаж, бүх сайтаас гарах боломжтой. Operator дахь өмнөх яриануудыг ч мөн нэг товшилтоор устгаж болно.

Эцэст нь Operator-ийг далд өгөгдөл, хортой код эсвэл фишинг оролдлогоор төөрөгдүүлэхийг оролдож болох дайсагнасан вэбсайтуудын эсрэг хамгаалалтуудыг бид бий болгосон:

  • Болгоомжтой навигаци: Operator нь зааварт халдлагыг илрүүлж, үл тоомсорлохоор бүтээгдсэн.
  • Хяналт: Тусгай “monitor model” нь сэжигтэй үйлдлийг ажиглаж, ямар нэг зүйл буруугаар эргэж байгаа мэт санагдвал даалгаврыг түр зогсоож чадна.
  • Илрүүлэх явц: Автомат болон хүний хяналтын процессууд шинэ аюул заналыг тасралтгүй илрүүлж, хамгаалалтуудыг хурдан шинэчилдэг.

Муу санаатай этгээдүүд энэ технологийг урвуулан ашиглахыг оролдож магадгүй гэдгийг бид мэднэ. Тиймээс бид Operator-ийг хортой хүсэлтээс татгалзаж, зөвшөөрөгдөөгүй агуулгыг хаахаар зохион бүтээсэн. Манай модерацийн системүүд давтан зөрчилд анхааруулга өгөх эсвэл бүр хандалтыг цуцалж болно, мөн бид урвуулан ашиглалтыг илрүүлж, шийдвэрлэх нэмэлт хяналтын процессуудыг нэгтгэсэн. Мөн бид заавар болон манай Хэрэглээний бодлого-той нийцүүлэн Operator-тэй хэрхэн харилцах талаар мэдээлэл өгч байна.

Operator нь эдгээр хамгаалалтуудаар бүтээгдсэн ч төгс систем гэж үгүй бөгөөд энэ нь одоогоор судалгааны урьдчилсан хувилбар хэвээр байна; бид бодит хэрэглээний санал хүсэлт болон нарийн туршилтаар дамжуулан тасралтгүй сайжруулахад тууштай ажиллаж байна. Манай хандлагын талаар дэлгэрэнгүйг Operator судалгааны блогийн аюулгүй байдлын хэсгээс үзнэ үү.

Хязгаарлалтууд

Operator одоогоор судалгааны эрт үеийн урьдчилсан хувилбарт байгаа бөгөөд хэдийгээр олон төрлийн даалгаврыг гүйцэтгэх чадвартай болсон ч одоо ч сурч, хөгжиж байгаа тул алдаа гаргаж болзошгүй. Жишээлбэл, одоогоор слайдшоу үүсгэх эсвэл календарь удирдах зэрэг төвөгтэй интерфэйсүүд дээр хүндрэлтэй тулгарч байна. Эрт үеийн хэрэглэгчдийн санал хүсэлт нь түүний нарийвчлал, найдвартай байдал, аюулгүй байдлыг сайжруулахад чухал үүрэг гүйцэтгэж, Operator-ийг бүх хүнд илүү сайн болгоход тусална.

Дараа нь юу вэ

API дахь CUA: Бид Operator-ийг ажиллуулдаг CUA загварыг удахгүй API-д гаргахаар төлөвлөж байгаа бөгөөд ингэснээр хөгжүүлэгчид өөрсдийн компьютер ашиглах агентуудыг бүтээх боломжтой болно.

Сайжруулсан чадварууд: Бид Operator-ийн илүү урт, илүү төвөгтэй ажлын урсгалуудыг боловсруулах чадварыг үргэлжлүүлэн сайжруулна.

Илүү өргөн хүртээмж: Бид Operator(шинэ цонхонд нээгдэнэ)-ийг Plus, Team, Enterprise хэрэглэгчдэд өргөжүүлж, аюулгүй байдал болон өргөн хүрээнд ашиглах боломжид нь итгэлтэй болсны дараа цаашид ChatGPT‑д шууд нэгтгэхээр төлөвлөж байна. Ингэснээр бодит цагийн болон асинхрон даалгаврын гүйцэтгэл саадгүй болох юм.

Зохиогчид

OpenAI

Суурь судалгааны хувь нэмэр оруулагчид

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

Үндсэн баг

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

XFN хувь нэмэр оруулагчид

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

Удирдагчид

Aaron Schlesinger (Дэд бүтэц), Casey Chu (Аюулгүй байдал ба загварын бэлэн байдал), David Medina (Судалгааны дэд бүтэц), Hyeonwoo Noh (Ерөнхий судалгаа), Reiichiro Nakano (Ерөнхий судалгаа), Yash Kumar

Хувь нэмэр оруулагчид

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

Удирдлага

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba