23 जनवरी 2025

पेश है Operator

एक एजेंट का रिसर्च प्रीव्यू जो आपके लिए टास्क करने के लिए अपने खुद के ब्राउज़र का इस्तेमाल कर सकता है. अमेरिका में Pro यूज़र्स के लिए उपलब्ध है.

Operator पर जाएँ

ये इमेज TripAdvisor पर रोम के सबसे ज़्यादा-रेटिंग-वाले एक-दिवसीय टूर को खोजने और बुक करने के लिए एक यूज़र का एक अनुरोध दिखाती है. इसमें सर्च प्रोसेस की एक समरी और "बेस्ट सेलर" टूर डिस्प्ले करते हुए TripAdvisor का एक वेबपेज शामिल है: "रोम: कोलोस्सियम, रोमन फ़ोरम और पैलेटाइन हिल."

लोड किया जा रहा है...

17 जुलाई, 2025 का अपडेट: Operator अब ChatGPT में ChatGPT एजेंट के तौर पर पूरी तरह इंटीग्रेट हो गया है. इन अपडेट की गई कैपेबिलिटी को एक्‍सेस करने के लिए, बस कंपोजर में “एजेंट मोड” को चुनें और ChatGPT में सीधे अपनी क्‍वेरी को भरें. नतीजे के तौर पर, स्‍टैंडअलोन Operator साइट (operator.chatgpt.com) जल्‍दी ही सबके बीच आ जाएगी.

आज हम Operator⁠(एक नई विंडो में खुलेगा) को रिलीज़ कर रहे हैं, यह एक ऐसा एजेंट है जो आपके लिए टास्क पूरे करने के लिए वेब पर भी जा सकता है. अपने खुद के ब्राउज़र का इस्तेमाल करके, ये किसी वेबपेज को देख सकता है और टाइप करके, क्लिक करके और स्क्रॉल करके उससे इंटरैक्ट कर सकता है. फ़िलहाल ये एक रिसर्च प्रीव्यू है, जिसका मतलब है कि इसकी सीमाएं हैं और ये यूज़र फ़ीडबैक के आधार पर उभरेगा. Operator हमारे उन पहले वाले एजेंट्स में से एक है, जो एक AI है जो आपके लिए अपने आप टास्क कर सकता है—आप इसे एक टास्क दें और ये उसे एक्सीक्यूट कर देगा.

Operator को कई तरह के दोहराए जाने वाले ब्राउज़र टास्क को हैंडल करने के लिए कहा जा सकता है, जैसे फ़ॉर्म भरना, किराने का सामान ऑर्डर करना और यहां तक कि मीम्स बनाना. इंसान जिन इंटरफ़ेस और टूल्स के साथ रोज़ाना बातचीत करते हैं, उन्हीं का इस्तेमाल करने की क्षमता AI की उपयोगिता को व्यापक बनाती है, जिससे लोगों को रोज़मर्रा के टास्क में समय बचाने में मदद मिलती है, साथ ही बिज़नेसेस के लिए नए जुड़ाव के अवसर खुलते हैं.

सुरक्षित और इटरेटिव रोलआउट पक्का करने के लिए, हम छोटे पैमाने पर शुरुआत कर रहे हैं. आज से, Operator अमेरिका में Pro⁠(एक नई विंडो में खुलेगा) यूज़र्स के लिए opera.chatgpt.com⁠(एक नई विंडो में खुलेगा) पर उपलब्ध है. ये रिसर्च प्रीव्यू हमें अपने यूज़र्स और व्यापक इकोसिस्टम से सीखने, और आगे बढ़ने के साथ-साथ उसे सुधारने और बेहतर बनाने का अवसर देता है. हमारा प्लान इसे Plus, Team और Enterprise यूज़र्स तक बढ़ाने और भविष्य में इन कैपेबिलिटी को ChatGPT में इंटीग्रेट करने का है.

Operator कैसे काम करता है

Operator, कंप्यूटर-यूज़िंग एजेंट (CUA) नाम के एक नए मॉडल की पेशकश है. रीइनफ़ोर्समेंट लर्निंग के ज़रिये एडवांस्ड रीज़निंग के साथ GPT‑4o की विज़न कैपेबिलिटी को साथ मिलाते हुए, CUA को ग्राफ़िकल यूज़र इंटरफ़ेस (GUIs) - बटन, मेनू और टेक्स्ट फ़ील्ड के साथ बातचीत करने के लिए ट्रेन किया जाता है, जिन्हें लोग स्क्रीन पर देखते हैं.

Operator ब्राउज़र के साथ "देख" (स्क्रीनशॉट के ज़रिये) और "इंटरैक्ट" (माउस और कीबोर्ड द्वारा अनुमत सभी एक्शन का इस्तेमाल करके) कर सकता है, जिससे उसे कस्टम API इंटीग्रेशन्स की ज़रुरत के बिना वेब पर कार्रवाई करने में मदद मिलती है.

यदि Operator को चुनौतियों का सामना करना पड़ता है या वो गलतियां करता है, तो वो खुद को सुधारने के लिए अपनी रीज़निंग कैपेबिलिटी का फ़ायदा उठा सकता है. जब वो अटक जाता है और मदद की ज़रुरत पड़ती है, तो वो यूज़र को कंट्रोल वापस सौंप देता है, जिससे एक आसान और सहयोगात्मक अनुभव पक्का होता है.

हालांकि CUA अभी भी शुरूआती स्टेज में है और इसकी अपनी सीमाएं हैं, फ़िर भी ये WebArena और WebVoyager में, जो कि दो प्रमुख ब्राउज़र के इस्तेमाल के बेंचमार्क्स हैं, नए बेहतरीन बेंचमार्क रिज़ल्ट्स सेट करता है. हमारे रिसर्च ब्लॉग पोस्ट में evals और Operator के पीछे की रिसर्च के बारे में और ज़्यादा पढ़ें.

इस्तेमाल कैसे करें

शुरू करने के लिए, बस उस टास्क के बारे में बताएं जिसे आप पूरा करना चाहते हैं और बाकी काम Operator संभाल लेगा. यूज़र्स किसी भी समय रिमोट ब्राउज़र का कंट्रोल अपने हाथ में ले सकते हैं, और Operator को यूज़र्स को उन कार्यों के लिए एक्टिव तरीके से कहने के लिए ट्रेन किया जाता है, जिनमें लॉग इन, पेमेंट डिटेल्स या CAPTCHAs को हल करने की ज़रुरत पड़ती है.

यूज़र्स Operator में कस्टम निर्देशों को जोड़कर अपने वर्कफ़्लो को पर्सनलाइज़ कर सकते हैं, या तो सभी साइट्स के लिए या ख़ास साइट्स के लिए, जैसे Booking.com पर एयरलाइन्स के लिए प्रेफ़रेंसेस सेट करना. Operator यूज़र्स को होमपेज पर जल्द एक्सेस के लिए प्रॉम्प्ट्स को सेव करने की सुविधा देता है, जो Instacart पर किराने का सामान दुबारा स्टॉक करने जैसे दोहराए जाने वाले टास्क के लिए सबसे बढ़िया है. ब्राउज़र पर कई टैब का इस्तेमाल करने के समान, यूज़र्स नई बातचीतें करके Operator से कई टास्क एक साथ करवा सकते हैं, जैसे कि Etsy पर पर्सनलाइज़्ड इनैमल मग का ऑर्डर देना और Hipcamp पर एक कैंपसाइट बुक करना.

इकोसिस्टम और यूज़र्स

Operator⁠(एक नई विंडो में खुलेगा), AI को एक निष्क्रिय टूल से डिजिटल इकोसिस्टम में एक एक्टिव भागीदार में बदल देता है. इससे यूज़र्स के लिए टास्क आसान हो जाएंगे और एजेंट्स के फ़ायदे उन कंपनियों तक पहुंच जाएंगे जो नए ग्राहक अनुभव चाहते हैं और कन्वर्शन की उच्च दरें चाहते हैं. हम DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber, और अन्य जैसी कंपनियों के साथ सहयोग कर रहे हैं ताकि ये पक्का किया जा सके कि Operator स्थापित मानदंडों का सम्मान करते हुए रियल-वर्ल्ड की ज़रूरतों को पूरा करे. इन सहयोगों के अतिरिक्त, हम कुछ वर्कफ़्लो की पहुंच और दक्षता में सुधार करने की काफ़ी संभावनाएं देखते हैं, खास तौर से पब्लिक सेक्टर के ऐप्लिकेशन्स में. इन यूज़ केसेस को और ज़्यादा एक्सप्लोर करने के लिए, हम स्टॉकटन शहर⁠(एक नई विंडो में खुलेगा) जैसे संगठनों के साथ काम कर रहे हैं ताकि शहर की सेवाओं और कार्यक्रमों में नामांकन को आसान बनाया जा सके.

"जैसा कि हम Operator के बारे में इसके रिसर्च प्रीव्यू के दौरान और ज़्यादा सीखते हैं, हम उन तरीकों की पहचान करने में बेहतर तरीके से सक्षम होंगे जिनसे AI हमारे निवासियों के लिए नागरिक सहभागिता को और भी आसान बना सकता है."

जमील नियाज़ी, स्टॉकटन शहर में इन्फ़ॉर्मेशन टेक्नोलॉजी के डायरेक्टर

Operator को शुरू में सीमित दर्शकों के लिए रिलीज़ करके, हमारा लक्ष्य रियल-वर्ल्ड के फ़ीडबैक के आधार पर जल्दी से सीखना और इसकी कैपेबिलिटी में सुधार करना है, जिससे ये पक्का हो सके कि हम विश्वास और सुरक्षा के साथ इनोवेशन को बैलेंस कर सकें. ये सहयोगात्मक दृष्टिकोण ये पक्का करने में मदद करता है कि Operator यूज़र्स, क्रिएटर्स, बिज़नसेस, और पब्लिक सेक्टरर के संगठनों को समान तरीके से सार्थक वैल्यू प्रदान करे.

"OpenAI का Operator एक तकनीकी सफ़लता है जो किराने का सामान ऑर्डर करने जैसे प्रोसेसेस को बेहतरीन तरीके से आसान बनाता है."

डैनियल डैंकर, Instacart के मुख्य प्रोडक्ट ऑफ़िसर

सुरक्षा और गोपनीयता

ये पक्का करना कि Operator का इस्तेमाल सुरक्षित है, एक सबसे ज़रूरी प्राथमिकता है, जिसमें दुरुपयोग को रोकने के लिए सुरक्षा के तीन लेयर हैं और ये पक्का किया जाता है कि यूज़र्स पूरी तरह से कंट्रोल में रहें.

सबसे पहले, Operator को ये पक्का करने के लिए ट्रेन किया जाता है कि इसका इस्तेमाल करने वाला व्यक्ति हमेशा कंट्रोल में रहे और बेहद ज़रूरी पॉइंट्स पर इनपुट मांगे.

टेकओवर मोड: Operator यूज़र्स से ब्राउज़र में संवेदनशील जानकारी, जैसे लॉग इन क्रेडेंशियल्स या पेमेंट की जानकारी, डालते समय कंट्रोल टेकओवर करने के लिए कहता है. टेकओवर मोड में, Operator यूज़र्स द्वारा डाली गई जानकारी जमा या स्क्रीनशॉट नहीं करता है.
यूज़र्स के कन्फ़र्मेंशन: किसी भी ज़रूरी कार्रवाई को फ़ाइनलाइज़ करने से पहले, जैसे कोई ऑर्डर सबमिट करना या ईमेल भेजना, Operator को मंज़ूरी के लिए पूछना होगा.
टास्क की सीमाएं: Operator को कुछ संवेदनशील टास्क को नामंज़ूर करने के लिए ट्रेन किया जाता है, जैसे बैंक के ट्रांज़ेक्शन या हाई-स्टेक वाले फ़ैसले लेने की ज़रुरत वाले टास्य, जैसे जॉब ऍप्लिकेशन पर फ़ैसला लेना.
वॉच मोड: ख़ास तौर से संवेदनशील साइट्स, जैसे ईमेल या वित्तीय सेवाओं पर, Operator को अपने टास्क को बारीकी से सुपरवाइज़ करने की ज़रुरत होती है, जिससे यूज़र्स कोई भी संभावित ग़लतियों को सीधे पकड़ सकें.

इसके बाद, हमने Operator में डेटा गोपनीयता को मैनेज करना आसान बना दिया है.

ऑप्ट आउट करने की ट्रेनिंग: ChatGPT सेटिंग्स में 'सभी के लिए मॉडल में सुधार करें' को बंद करने का मतलब है कि Operator में डेटा का इस्तेमाल हमारे मॉडल्स को ट्रेन करने के लिए भी नहीं किया जाएगा.
पारदर्शी डेटा मैनेजमेंट: यूज़र्स Operator सेटिंग्स के गोपनीयता अनुभाग के अंतर्गत एक क्लिक से पूरा ब्राउज़िंग डेटा डिलीट कर सकते हैं और सभी साइट्स से लॉग आउट कर सकते हैं. Operator में पिछली बातचीत को भी एक क्लिक से डिलीट किया जा सकता है.

आखिर में, हमने प्रतिकूल वेबसाइट्स के खिलाफ़ सुरक्षा तैयार की है जो छिपे हुए प्रॉम्प्ट, दुर्भावनापूर्ण कोड या फ़िशिंग अटेम्प्टस के ज़रिये Operator को गुमराह करने की कोशिश कर सकते हैं:

सतर्क नेविगेशन: Operator को प्रॉम्प्ट इंजेक्शन्स को डिटेक्ट करने और उन्हें अनदेखा करने के लिए डिज़ाइन किया गया है.
मॉनिटर करना: एक समर्पित "मॉनिटर मॉडल" संदिग्ध व्यवहार पर नज़र रखता है और अगर कुछ गड़बड़ लगे तो टास्क को रोक सकता है.
डिटेक्शन पाइपलाइन: ऑटोमेटेड और मानवीय रिव्यु प्रोसेस लगातार नए खतरों की पहचान करते हैं और सुरक्षा उपायों को जल्दी से अपडेट करते हैं.

हम जानते हैं कि बुरे लोग इस टेक्नोलॉजी का गलत इस्तेमाल करने की कोशिश कर सकते हैं. इसीलिए हमने Operator को नुकसान पहुंचाने वाले अनुरोधों को नामंज़ूर करने और अस्वीकृत कंटेंट को ब्लॉक करने के लिए डिज़ाइन किया है. हमारे मॉडरेशन सिस्टम्स बार-बार उल्लंघन के लिए चेतावनी जारी कर सकते हैं या एक्सेस भी कैंसल कर सकते हैं, और हमने गलत इस्तेमाल को डिटेक्ट करने और उसे संबोधित करने के लिए अतिरिक्त रिव्यु प्रोसेसेस को इंटीग्रेट किया है. हम अपनी इस्तेमाल की नीतियों के अनुपालन में Operator के साथ बातचीत करने के तरीके पर भी गाइडेंस दे रहे हैं.

हालांकि Operator को इन सुरक्षा उपायों के साथ डिज़ाइन किया गया है, फ़िर भी कोई भी सिस्टम दोषरहित नहीं होता है और ये अभी भी एक रिसर्च प्रीव्यू है; हम रियल-वर्ल्ड के फ़ीडबैक और सख्त टेस्टिंग के ज़रिये लगातार सुधार के लिए प्रतिबद्ध हैं. हमाऋ अप्रोच के बारे में और ज़्यादा जानकारी के लिए, Operator रिसर्च ब्लॉग के सुरक्षा अनुभाग पर जाएं.

सीमाएं

Operator अभी शुरूआती रिसर्च स्टेज में है, और हालांकि ये पहले से ही कई तरह के टास्क हैंडल कर सकता है, फ़िर भी ये अभी भी सीख रहा है, उभर रहा है और गलतियां कर सकता है. जैसे कि, अभी इसे स्लाइडशो बनाने या कैलेंडर को मैनेज करने जैसे मुश्किल इंटरफ़ेस से जुड़ी चुनौतियों का सामना करना पड़ रहा है. शुरूआती यूज़र फ़ीडबैक इसकी सटीकता, भरोसा और सुरक्षा को बढ़ाने में एक अहम भूमिका निभाएगा, जिससे हमें Operator को सभी के लिए बेहतर बनाने में मदद मिलेगी.

आगे और क्या है

API में CUA: हम जल्द ही API में Operator, CUA की पेशकश करने वाले मॉडल को सामने लाने का प्लान कर रहे हैं, ताकि डेवलपर्स इसका इस्तेमाल अपने खुद के कंप्यूटर-इस्तेमाल करने वाले एजेंट्स बनाने के लिए कर सकें.

बढ़ी हुई क्षमताएं: हम Operator की लंबे और ज़्यादा जटिल वर्कफ़्लो को हैंडल करने की क्षमता में सुधार करना जारी रखेंगे.

व्यापक पहुंच: हम Operator⁠(एक नई विंडो में खुलेगा) को Plus, Team और Enterprise यूज़र्स तक बढ़ाने और भविष्य में इसकी कैपेबिलिटी को सीधे ChatGPT में इंटीग्रेट करने का प्लान कर रहे हैं, जब हम बड़े पैमाने पर इसकी सुरक्षा और प्रयोज्यता के बारे में आश्वस्त होंगे, जिससे निर्बाध रियल-वर्ल्ड और एसिंक्रोनस टास्क एक्सीक्यूशन किया जा सकेगा.

लेखक

OpenAI

फ़ाउंडेशनल रिसर्च कॉन्ट्रीब्यूटर्स

Casey Chu, David Medina, Hyeonwoo Noh, Noah Jorgensen, Reiichiro Nakano, Sarah Yoo

मूल

Andrew Howell, Aaron Schlesinger, Baishen Xu, Ben Newhouse, Bobby Stocker, Devashish Tyagi, Dibyo Majumdar, Eugenio Panero, Fereshte Khani, Geoffrey Iyer, Jiahui Yu, Nick Fiacco, Patrick Goethe, Sam Jau, Shunyu Yao, Stephan Casas, Yash Kumar, Yilong Qin

XFN कॉन्ट्रीब्यूटर्स

Abby Fanlo Susk, Aleah Houze, Alex Beutel, Alexander Prokofiev, Andrea Vallone, Andrea Chan, Christina Lim, Derek Chen, Duke Kim, Grace Zhao, Heather Whitney, Houda Nait El Barj, Jake Brill, Jeremy Fine, Joe Fireman, Kelly Stirman, Lauren Yang, Lindsay McCallum, Leo Liu, Mike Starr, Minnia Feng, Mostafa Rohaninejad, Oleg Boiko, Owen Campbell-Moore, Paul Ashbourne, Stephen Imm, Taylor Gordon, Tina Sriskandarajah, Winston Howes

प्रमुख

Aaron Schlesinger (Infrastructure), Casey Chu (Safety and Model Readiness), David Medina (Research Infrastructure), Hyeonwoo Noh (Overall Research), Reiichiro Nakano (Overall Research), Yash Kumar

कॉन्ट्रीब्यूटर्स

Adam Brandon, Adam Koppel, Adele Li, Ahmed El-Kishky, Akila Welihinda, Alex Karpenko, Alex Nawar, Alex Tachard Passos, Amelia Liu, Andrei Gheorghe, Andrew Duberstein, Andrey Mishchenko, Angela Baek, Ankush Agarwal, Anting Shen, Antoni Baum, Ari Seff, Ashley Tyra, Behrooz Ghorbani, Bo Xu, Brandon McKinzie, Bryan Brandow, Carolina Paz, Cary Hudson, Chak Li, Chelsea Voss, Chen Shen, Chris Koch, Christian Gibson, Christina Kim, Christine McLeavey, Claudia Fischer, Cory Decareaux, Daniel Jacobowitz, Daniel Wolf, David Kjelkerud, David Li, Ehsan Asdar, Elaine Kim, Emilee Goo, Eric Antonow, Eric Hunter, Eric Wallace, Felipe Torres, Fotis Chantzis, Freddie Sulit, Giambattista Parascandolo, Hadi Salman, Haiming Bao, Haoyu Wang, Henry Aspegren, Hyung Won Chung, Ian O’Connell, Ian Sohl, Isabella Fulford, Jake McNeil, James Donovan, Jamie Kiros, Jason Ai, Jason Fedor, Jason Wei, Jay Dixit, Jeffrey Han, Jeffrey Sabin-Matsumoto, Jennifer Griffith-Delgado, Jeramy Han, Jeremiah Currier, Ji Lin, Jiajia Han, Jiaming Zhang, Jiayi Weng, Jieqi Yu, Joanne Jang, Joyce Ruffell, Kai Chen, Kai Xiao, Kevin Button, Kevin King, Kevin Liu, Kristian Georgiev, Kyle Miller, Lama Ahmad, Laurance Fauconnet, Leonard Bogdonoff, Long Ouyang, Louis Feuvrier, Madelaine Boyd, Mamie Rheingold, Matt Jones, Michael Sharman, Miles Wang, Mingxuan Wang, Nick Cooper, Niko Felix, Nikunj Handa, Noel Bundick, Pedro Aguilar, Peter Faiman, Peter Hoeschele, Pranav Deshpande, Raul Puri, Raz Gaon, Reid Gustin, Robin Brown, Rob Honsby, Saachi Jain, Sandhini Agarwal, Scott Ethersmith, Scott Lessans, Shauna O’Brien, Spencer Papay, Steve Coffey, Tal Stramer, Tao Wang, Teddy Lee, Tejal Patwardhan, Thomas Degry, Tomo Hiratsuka, Troy Peterson, Wenda Zhou, William Butler, Wyatt Thompson, Yao Zhou, Yaodong Yu, Yi Cheng, Yinghai Lu, Younghoon Kim, Yu-Ann Wang Madan, Yushi Wang, Zhiqing Sun

लीडरशिप

Anna Makanju, Greg Brockman, Hannah Wong, Jerry Tworek, Liam Fedus, Mark Chen, Peter Welinder, Sam Altman, Wojciech Zaremba