23 იანვარი, 2025

Introducing Operator

A research preview of an agent that can use its own browser to perform tasks for you. Available to Pro users in the U.S.

გადადით Operator-ზე

Introducing Operator > Hero > Media Item

იტვირთება…

2025 წლის 17 ივლისის განახლება: Operator ახლა სრულად არის ინტეგრირებული ChatGPT‑ში, როგორც ChatGPT აგენტი. ამ განახლებული შესაძლებლობების მისაღებად, უბრალოდ აირჩიეთ „agent mode“ ჩამოსაშლელი მენიუდან კომპოზერში და შეიყვანეთ თქვენი მოთხოვნა პირდაპირ ChatGPT‑ში. შედეგად, დამოუკიდებელი Operator საიტი (operator.chatgpt.com) მომდევნო კვირებში ეტაპობრივად დაიხურება.

დღეს გამოვუშვით Operator⁠(იხსნება ახალ ფანჯარაში), აგენტი, რომელსაც შეუძლია თქვენთვის დავალებების შესასრულებლად ვებზე გასვლა. საკუთარი ბრაუზერის გამოყენებით, მას შეუძლია ვებგვერდის დათვალიერება და მასთან ინტერაქცია აკრეფით, დაწკაპუნებით და სქროლვით. ამჟამად ეს კვლევითი პრევიუა, რაც ნიშნავს, რომ მას შეზღუდვები აქვს და მომხმარებლის უკუკავშირის საფუძველზე განვითარდება. Operator ჩვენი ერთ-ერთი პირველი აგენტია, ანუ ისეთი AI-ები, რომლებსაც დამოუკიდებლად შეუძლიათ თქვენთვის მუშაობა — თქვენ აძლევთ დავალებას და ის მას შეასრულებს.

Operator-ს შეიძლება სთხოვონ მრავალფეროვანი განმეორებადი ბრაუზერული ამოცანების შესრულება, როგორიცაა ფორმების შევსება, სასურსათო პროდუქტების შეკვეთა და მემების შექმნაც კი. იმავე ინტერფეისებისა და ხელსაწყოების გამოყენების უნარი, რომლებსაც ადამიანები ყოველდღიურად იყენებენ, AI-ის სარგებლიანობას აფართოებს, ეხმარება ადამიანებს ყოველდღიურ ამოცანებზე დროის დაზოგვაში და ამავე დროს ბიზნესებისთვის ჩართულობის ახალ შესაძლებლობებს ხსნის.

უსაფრთხო და ეტაპობრივი გამოშვების უზრუნველსაყოფად, პატარა მასშტაბით ვიწყებთ. დღეიდან Operator ხელმისაწვდომია აშშ-ში Pro⁠(იხსნება ახალ ფანჯარაში) მომხმარებლებისთვის მისამართზე operator.chatgpt.com⁠(იხსნება ახალ ფანჯარაში). ეს კვლევითი პრევიუ საშუალებას გვაძლევს ვისწავლოთ ჩვენი მომხმარებლებისა და ფართო ეკოსისტემისგან, თანდათანობით დავხვეწოთ და გავაუმჯობესოთ სისტემა. ჩვენი გეგმაა მომავალში გავფართოვდეთ Plus, Team და Enterprise მომხმარებლებზე და ეს შესაძლებლობები ChatGPT‑ში დავაინტეგრიროთ.

როგორ მუშაობს Operator

Operator მუშაობს ახალ მოდელზე, სახელად Computer-Using Agent (CUA). GPT‑4o‑ის ხედვის შესაძლებლობებისა და განმამტკიცებელი სწავლების გზით მიღებული განვითარებული მსჯელობის შერწყმით, CUA გაწვრთნილია გრაფიკულ მომხმარებლის ინტერფეისებთან (GUI-ებთან) — ღილაკებთან, მენიუებთან და ტექსტის ველებთან — ინტერაქციისთვის, რომლებსაც ადამიანები ეკრანზე ხედავენ.

Operator-ს შეუძლია „დანახვა“ (სქრინშოთების მეშვეობით) და „ინტერაქცია“ (თაგვისა და კლავიატურის ყველა შესაძლო მოქმედების გამოყენებით) ბრაუზერთან, რაც მას საშუალებას აძლევს ვებზე იმოქმედოს სპეციალური API ინტეგრაციების მოთხოვნის გარეშე.

თუ ის დაბრკოლებებს შეხვდება ან შეცდომებს დაუშვებს, Operator-ს შეუძლია საკუთარი მსჯელობის შესაძლებლობები გამოიყენოს თვითშესწორებისთვის. როცა ის გაიჭედება და დახმარება დასჭირდება, უბრალოდ კონტროლს მომხმარებელს უბრუნებს, რაც გლუვ და თანამშრომლობით გამოცდილებას უზრუნველყოფს.

მიუხედავად იმისა, რომ CUA ჯერ კიდევ ადრეულ ეტაპზეა და შეზღუდვები აქვს, ის WebArena-სა და WebVoyager-ში — ბრაუზერის გამოყენების ორ ძირითად ბენჩმარკში — ახალ საუკეთესო შედეგებს აჩვენებს. მეტის გასაგებად შეფასებებისა და Operator-ის უკან მდგომი კვლევის შესახებ, წაიკითხეთ ჩვენი კვლევითი ბლოგპოსტი.

როგორ გამოვიყენოთ

დასაწყებად, უბრალოდ აღწერეთ დავალება, რომლის შესრულებაც გსურთ, და დანარჩენს Operator გაუმკლავდება. მომხმარებლებს ნებისმიერ მომენტში შეუძლიათ დისტანციურ ბრაუზერზე კონტროლის საკუთარ თავზე აღება, ხოლო Operator გაწვრთნილია, რომ პროაქტიულად სთხოვოს მომხმარებელს ჩართვა იმ ამოცანებისთვის, რომლებიც მოითხოვს შესვლას, გადახდის დეტალებს ან CAPTCHA-ების ამოხსნას.

მომხმარებლებს შეუძლიათ Operator-ში თავიანთი სამუშაო პროცესები მოარგონ, დაამატონ რა მორგებული ინსტრუქციები როგორც ყველა საიტისთვის, ასევე კონკრეტულებისთვის, მაგალითად Booking.com-ზე ავიახაზების პრეფერენციების დაყენებით. Operator მომხმარებლებს აძლევს მოთხოვნების შენახვის საშუალებას მთავარ გვერდზე სწრაფი წვდომისთვის, რაც იდეალურია განმეორებადი დავალებებისთვის, როგორიცაა Instacart-ზე სასურსათო პროდუქტების ხელახალი შეკვეთა. ისევე, როგორც ბრაუზერში რამდენიმე ჩანართის გამოყენებისას, მომხმარებლებს შეუძლიათ Operator-ს ერთდროულად რამდენიმე ამოცანა შეასრულებინონ ახალი საუბრების შექმნით, მაგალითად Etsy-ზე პერსონალიზებული ემალის კათხის შეკვეთა, მაშინ როცა Hipcamp-ზე ბანაკის ადგილი ჯავშნდება.

ეკოსისტემა და მომხმარებლები

Operator⁠(იხსნება ახალ ფანჯარაში) AI-ს პასიური ხელსაწყოდან ციფრული ეკოსისტემის აქტიურ მონაწილედ გარდაქმნის. ის მომხმარებლებისთვის დავალებებს გაამარტივებს და აგენტების სარგებელს მოუტანს კომპანიებს, რომლებსაც სურთ ინოვაციური მომხმარებლის გამოცდილება და კონვერსიის უფრო მაღალი მაჩვენებლები. ჩვენ ვთანამშრომლობთ ისეთ კომპანიებთან, როგორებიცაა DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber და სხვები, რათა დავრწმუნდეთ, რომ Operator რეალურ საჭიროებებს პასუხობს და ამავე დროს დამკვიდრებულ ნორმებს სცემს პატივს. ამ თანამშრომლობების გარდა, ჩვენ დიდ პოტენციალს ვხედავთ გარკვეული სამუშაო პროცესების ხელმისაწვდომობისა და ეფექტიანობის გასაუმჯობესებლად, განსაკუთრებით საჯარო სექტორის გამოყენების შემთხვევებში. ამ გამოყენების შემთხვევების უფრო სიღრმისეულად შესასწავლად, ვმუშაობთ ისეთ ორგანიზაციებთან, როგორიცაა City of Stockton⁠(იხსნება ახალ ფანჯარაში), რათა ქალაქის სერვისებსა და პროგრამებში ჩართვა უფრო მარტივი გავხადოთ.

„როგორც კი კვლევითი პრევიუს განმავლობაში Operator-ის შესახებ მეტს გავიგებთ, უკეთ ვიქნებით მზად იმის დასადგენად, როგორ შეუძლია AI-ს ჩვენი მოსახლეობისთვის სამოქალაქო ჩართულობის კიდევ უფრო გამარტივება.“

Jamil Niazi, ინფორმაციული ტექნოლოგიების დირექტორი, City of Stockton

Operator-ის თავდაპირველად შეზღუდული აუდიტორიისთვის გამოშვებით, ჩვენი მიზანია სწრაფად ვისწავლოთ და მისი შესაძლებლობები რეალური სამყაროს უკუკავშირის საფუძველზე დავხვეწოთ, რათა ინოვაციასა და ნდობასა და უსაფრთხოებას შორის ბალანსი შევინარჩუნოთ. ეს თანამშრომლობაზე დაფუძნებული მიდგომა გვეხმარება დავრწმუნდეთ, რომ Operator ღირებულ სარგებელს მოუტანს როგორც მომხმარებლებს, შემქმნელებს, ბიზნესებს, ასევე საჯარო სექტორის ორგანიზაციებს.

„OpenAI-ის Operator ტექნოლოგიური გარღვევაა, რომელიც ისეთ პროცესებს, როგორიცაა სასურსათო პროდუქტების შეკვეთა, წარმოუდგენლად ამარტივებს.“

Daniel Danker, პროდუქტის მთავარი ოფიცერი, Instacart

უსაფრთხოება და კონფიდენციალურობა

იმის უზრუნველყოფა, რომ Operator უსაფრთხო იყოს გამოსაყენებლად, უმთავრესი პრიორიტეტია, და ამისთვის არსებობს დაცვის სამი ფენა, რათა თავიდან ავიცილოთ ბოროტად გამოყენება და უზრუნველვყოთ, რომ კონტროლი მყარად მომხმარებლის ხელში იყოს.

პირველ რიგში, Operator გაწვრთნილია ისე, რომ მისი მომხმარებელი ყოველთვის აკონტროლებდეს პროცესს და კრიტიკულ მომენტებში ითხოვდეს მის ჩარევას.

გადაბარების რეჟიმი: Operator მომხმარებელს სთხოვს ჩაერთოს, როდესაც ბრაუზერში შეაქვს მგრძნობიარე ინფორმაცია, მაგალითად შესვლის მონაცემები ან გადახდის ინფორმაცია. გადაბარების რეჟიმში ყოფნისას Operator არ აგროვებს და არ იღებს სქრინშოთს იმ ინფორმაციის, რომელსაც მომხმარებელი შეიყვანს.
მომხმარებლის დადასტურებები: ნებისმიერი მნიშვნელოვანი მოქმედების დასრულებამდე, მაგალითად შეკვეთის გაგზავნამდე ან ელფოსტის გაგზავნამდე, Operator-მა უნდა მოითხოვოს თანხმობა.
დავალებების შეზღუდვები: Operator გაწვრთნილია, რომ უარი თქვას გარკვეულ მგრძნობიარე დავალებებზე, როგორიცაა საბანკო ტრანზაქციები ან ისეთი ამოცანები, რომლებიც მაღალი რისკის გადაწყვეტილებებს მოითხოვს, მაგალითად სამსახურის განაცხადზე გადაწყვეტილების მიღება.
ყურადღებით ყურების რეჟიმი: განსაკუთრებით მგრძნობიარე საიტებზე, მაგალითად ელფოსტაში ან ფინანსურ სერვისებზე, Operator მოითხოვს მისი მოქმედებების მჭიდრო ზედამხედველობას, რაც მომხმარებლებს შესაძლო შეცდომების პირდაპირ დაფიქსირების საშუალებას აძლევს.

შემდეგ, ჩვენ Operator-ში მონაცემთა კონფიდენციალურობის მართვა გავამარტივეთ.

ტრენინგიდან გამორიცხვა: თუ ChatGPT‑ის პარამეტრებში გამორთავთ „Improve the model for everyone“-ს, Operator-ში არსებული მონაცემებიც აღარ იქნება გამოყენებული ჩვენი მოდელების საწვრთნელად.
მონაცემთა გამჭვირვალე მართვა: მომხმარებლებს შეუძლიათ ერთი დაწკაპუნებით წაშალონ დათვალიერების ყველა მონაცემი და გამოვიდნენ ყველა საიტიდან Operator-ის პარამეტრების Privacy სექციაში. Operator-ში წარსული საუბრების წაშლაც ერთი დაწკაპუნებით არის შესაძლებელი.

ბოლოს, ჩვენ ავაგეთ დაცვითი მექანიზმები მოწინააღმდეგე ვებსაიტების წინააღმდეგ, რომლებიც შეიძლება ცდილობდნენ Operator-ის შეცდომაში შეყვანას დამალული მოთხოვნებით, მავნე კოდით ან ფიშინგის მცდელობებით:

ფრთხილი ნავიგაცია: Operator შექმნილია ისე, რომ ამოიცნოს და უგულებელყოს პრომპტ ინიექცია.
მონიტორინგი: სპეციალური „მონიტორი მოდელი“ აკვირდება საეჭვო ქცევას და შეუძლია შეაჩეროს დავალება, თუ რამე საეჭვოდ მოეჩვენება.
ამოცნობის კონვეიერი: ავტომატური და ადამიანური მიმოხილვის პროცესები უწყვეტად ავლენენ ახალ საფრთხეებს და სწრაფად აახლებენ დამცავ მექანიზმებს.

ვიცით, რომ ბოროტი აქტორები შესაძლოა შეეცადონ ამ ტექნოლოგიის ბოროტად გამოყენებას. ამიტომ Operator ისე შევქმენით, რომ უარი თქვას საზიანო მოთხოვნებზე და დაბლოკოს აკრძალული კონტენტი. ჩვენი მოდერაციის სისტემები შეიძლება გასცენ გაფრთხილებები ან განმეორებითი დარღვევების შემთხვევაში წვდომაც კი გააუქმონ, და ჩვენ დავამატეთ დამატებითი მიმოხილვის პროცესები ბოროტად გამოყენების აღმოსაჩენად და აღმოსაფხვრელად. ასევე ვაწვდით მითითებებს იმის შესახებ, თუ როგორ უნდა იურთიერთოთ Operator-თან ჩვენი გამოყენების პოლიტიკების შესაბამისად.

მიუხედავად იმისა, რომ Operator შექმნილია ამ დამცავი მექანიზმებით, არცერთი სისტემა არ არის უშეცდომო და ეს ჯერ კიდევ კვლევითი პრევიუა; ჩვენ ერთგულნი ვართ უწყვეტი გაუმჯობესების მიმართ რეალური სამყაროს უკუკავშირის და მკაცრი ტესტირების გზით. ჩვენი მიდგომის შესახებ მეტის გასაგებად, ეწვიეთ Operator-ის კვლევითი ბლოგის უსაფრთხოების სექციას.

შეზღუდვები

Operator ამჟამად ადრეულ კვლევით პრევიუშია და მიუხედავად იმისა, რომ უკვე შეუძლია ამოცანების ფართო სპექტრთან გამკლავება, ის ჯერ კიდევ სწავლობს, ვითარდება და შეიძლება შეცდომები დაუშვას. მაგალითად, ამჟამად სირთულეებს აწყდება რთულ ინტერფეისებთან, როგორიცაა სლაიდშოუების შექმნა ან კალენდრების მართვა. ადრეული მომხმარებლების უკუკავშირი გადამწყვეტ როლს შეასრულებს მისი სიზუსტის, სანდოობისა და უსაფრთხოების გაუმჯობესებაში და დაგვეხმარება Operator ყველასთვის უკეთესი გავხადოთ.

რა იქნება შემდეგ

CUA API-ში: ვგეგმავთ, რომ მალე API-ში გავხსნათ მოდელი, რომელიც Operator-ს ამუშავებს — CUA, რათა დეველოპერებმა შეძლონ მისი გამოყენებით საკუთარი კომპიუტერული აგენტების შექმნა.

გაძლიერებული შესაძლებლობები: გავაგრძელებთ Operator-ის შესაძლებლობის გაუმჯობესებას, რათა მან უფრო გრძელ და უფრო რთულ სამუშაო პროცესებს გაუმკლავდეს.

უფრო ფართო წვდომა: ვგეგმავთ Operator⁠(იხსნება ახალ ფანჯარაში)-ის გაფართოებას Plus, Team და Enterprise მომხმარებლებზე და მომავალში მისი შესაძლებლობების პირდაპირ ChatGPT‑ში ინტეგრირებას, როგორც კი დავრწმუნდებით მის უსაფრთხოებასა და გამოყენებადობაში მასშტაბურად, რაც გახსნის უწყვეტ რეალურ დროში და ასინქრონულ დავალებათა შესრულებას.

ავტორები

OpenAI

ფუნდამენტური კვლევის მონაწილეები

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

ძირითადი გუნდი

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

XFN მონაწილეები

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

ხელმძღვანელები

Aaron Schlesinger (ინფრასტრუქტურა), Casey Chu (უსაფრთხოება და მოდელის მზაობა), David Medina (კვლევითი ინფრასტრუქტურა), Hyeonwoo Noh (საერთო კვლევა), Reiichiro Nakano (საერთო კვლევა), Yash Kumar

მონაწილეები

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

ხელმძღვანელობა

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba