3 अक्टूबर 2024

पेश है कैनवस

राइटिंग और कोडिंग के लिए ChatGPT के साथ काम करने का एक नया तरीका

इमेज में एक वर्टिकल टूलबार दिखाया गया है जिसमें एक हल्के पेस्टल बैकग्राउंड पर एक कॉलम में पांच आइकॉन व्यवस्थित हैं. ऊपर से तीसरा आइकॉन, जिसमें एक खुली किताब दिखाई दे रही है, उसके बगल में "रीडिंग लेवल" लिखा हुआ एक लेबल है.

लोड किया जा रहा है...

हम कैनवस पेश कर रहे हैं, जो ChatGPT के साथ राइटिंग और कोडिंग प्रोजेक्ट्स पर काम करने के लिए एक नया इंटरफ़ेस है जो साधारण चैट से परे है. कैनवस एक अलग विंडो में खुलता है, जिससे आप और ChatGPT किसी प्रोजेक्ट पर सहयोग कर सकते हैं. ये शुरूआती बीटा साथ मिलकर काम करने का एक नया तरीका प्रस्तुत करता है - न सिर्फ़ बातचीत के ज़रिए, बल्कि साथ-साथ विचारों को बनाकर और उन्हें बेहतर करते हुए.

कैनवस को GPT‑4o के साथ बनाया गया था और बीटा में रहते हुए इसे मॉडल पिकर में मैन्युअल तरीके से चुना जा सकता है. आज से हम वैश्विक स्तर पर ChatGPT Plus और Team यूज़र के लिए कैनवस शुरू कर रहे हैं. Enterprise और Edu यूज़र को अगले हफ़्ते तक एक्सेस मिल जाएगा. हम ये भी प्लान कर रहे हैं कि जब ये बीटा से बाहर होगा तो कैनवस को सभी ChatGPT फ़्री यूज़र के लिए उपलब्ध कराया जाएगा.

ChatGPT के साथ बेहतर सहयोग

लोग राइटिंग और कोडिंग में मदद के लिए रोज़ ChatGPT का इस्तेमाल करते हैं. हालांकि चैट इंटरफ़ेस का इस्तेमाल करना आसान है और ये कई टास्क के लिए अच्छी तरह से काम करता है, लेकिन जब आप उन प्रोजेक्ट्स पर काम करना चाहते हैं जिनमें एडिटिंग और बदलावों की ज़रुरत होती है तो ये सीमित हो जाता है. कैनवस इस तरह के काम के लिए एक नया इंटरफ़ेस देता है.

कैनवस के साथ, ChatGPT बेहतर ढंग से कॉन्टेक्स्ट को समझ सकता है कि आप क्या हासिल करने की कोशिश कर रहे हैं. आप ख़ास सेक्शन को हाईलाइट करके ChatGPT को ये बता सकते हैं कि आप चाहते हैं वो वहां फ़ोकस करे. एक कॉपी एडिटर या कोड रिव्युअर की तरह, ये पूरे प्रोजेक्ट को ध्यान में रखते हुए इनलाइन फ़ीडबैक और सुझाव दे सकता है.

आप कैनवस में प्रोजेक्ट को कंट्रोल करते हैं. आप सीधे टेक्स्ट या कोड एडिट कर सकते हैं. ChatGPT से राइटिंग की लेंग्थ एडजस्ट करने, अपने कोड को डीबग करने और दूसरे उपयोगी एक्शन को जल्दी से करने के लिए कहने के लिए शॉर्ट कट का एक मेन्यु है. आप कैनवस में बैक बटन का इस्तेमाल करके अपने काम के पिछले वर्जन भी रीस्टोर कर सकते हैं.

जब ChatGPT किसी ऐसे सिनारियो को डिटेक्ट करता है जिसमें वो मददगार हो सकता है, तो कैनवस अपने आप खुल जाता है. आप कैनवस खोलने और किसी मौजूदा प्रोजेक्ट पर काम करने के लिए इसका इस्तेमाल करने के लिए अपने प्रॉम्प्ट में “कैनवस का इस्तेमाल करें” भी शामिल कर सकते हैं.

राइटिंग के शॉर्ट कट में ये शामिल हैं:

एडिट्स सुझाएँ ChatGPT इनलाइन सुझाव और फ़ीडबैक देता है.
लेंग्थ एडजस्ट करें: डॉक्यूमेंट की लेंग्थ को छोटा या बड़ा करने के लिए एडिट करता है.
रीडिंग लेवल बदलें: किंडरगार्टन से लेकर ग्रेजुएट स्कूल तक रीडिंग के लेवल को एडजस्ट करता है.
फ़ाइनल पॉलिश जोड़ें: व्याकरण, स्पष्टता, और एकरूपता की जांच करता है.
इमोजी जोड़ें: ज़ोर और रंग के लिए प्रासंगिक इमोजी जोड़ता है.

कैनवस में कोडिंग

कोडिंग दोहराने वाला प्रोसेस है, और चैट में अपने कोड के सभी बदलावों को फ़ॉलो करना मुश्किल हो सकता है. कैनवस ChatGPT के बदलावों को ट्रैक करना और समझना आसान बनाता है, और हम इस प्रकार के एडिट्स में पारदर्शिता में सुधार जारी रखने का प्लान कर रहे हैं.

कोडिंग शॉर्ट कट में शामिल हैं:

रिव्यु कोड: ChatGPT आपके कोड को बेहतर बनाने के लिए इनलाइन सुझाव देता है.
लॉग जोड़ें: आपके कोड को डीबग करने और समझने में आपकी मदद के लिए प्रिंट स्टेटमेंट्स इन्सर्ट करता है.
कमेंट्स जोड़ें: कोड को समझने में आसानी के लिए उसमें कमेंट्स जोड़ता है.
बग्स को फ़िक्स करता है: एरर को हल करने के लिए प्रॉब्लम वाले कोड का पता लगाता है और उसे दोबारा लिखता है.
किसी भाषा में पोर्ट करें: आपके कोड को JavaScript, TypeScript, Python, Java, C++, या PHP में अनुवाद करता है.

मॉडल को सहयोगी बनने के लिए ट्रेन करना

हमने GPT‑4o को क्रिएटिव पार्टनर के तौर पर सहयोग करने के लिए ट्रेन किया. मॉडल को पता होता है कि कैनवस को कब खोलना है, टार्गेटेड एडिट्स कब करना है, और कब उसे पूरी तरह से दोबारा लिखना है. ये सटीक फ़ीडबैक और सुझाव देने के लिए व्यापक कॉन्टेक्स्ट को भी समझता है.

इसे सपोर्ट करने के लिए, हमारी रिसर्च टीम ने यह मुख्य बिहेवियर डेवलप किए:

राइटिंग और कोडिंग के लिए कैनवस को ट्रिगर करना
कई प्रकार के कंटेंट जेनरेट करना
टार्गेटेड एडिट्स करना
डॉक्यूमेंट्स को दोबारा लिखना
इनलाइन आलोचना देना

हमने 20 से ज़्यादा ऑटोमेटेड अंदरूनी मूल्यांकनों के ज़रिए प्रोग्रेस को मापा. हमने मॉडल को उसके मूल व्यवहारों के लिए पोस्ट-ट्रेन करने के लिए, OpenAI o1‑preview से आउटपुट पाने जैसी नवीन सिंथेटिक डेटा जेनरेशन तकनीकों का इस्तेमाल किया. इस अप्रोच से हम राइटिंग की क्वालिटी और नए यूज़र इंटरैक्शन को तेज़ी से संबोधित कर पाए, वो भी ह्यूमन-जेनरेटेड डेटा पर निर्भर हुए बिना.

एक प्रमुख चुनौती ये थी कि कैनवस को कब ट्रिगर किया जाए. हमने मॉडल को "कॉफ़ी बीन्स के इतिहास के बारे में एक ब्लॉग पोस्ट लिखें" जैसे प्रॉम्प्ट के लिए एक कैनवस को ओपन करना सिखाया, जबकि "रात के खाने के लिए एक नई रेसिपी बनाने में मेरी मदद करें" जैसे सामान्य सवाल जवाब वाले टास्क के लिए ओवर-ट्रिगरिंग से बचना सिखाया. राइटिंग वाले टास्क के लिए, हमने "सही ट्रिगर्स" ("सही गैर-ट्रिगर्स" की कीमत पर) में सुधार को प्राथमिकता दी, जो कि प्रॉम्प्ट किए गए निर्देशों के साथ बेसलाइन ज़ीरो-शॉट GPT‑4o के मुकाबले 83% तक पहुंच गया.

ये ध्यान देने योग्य है कि ऐसी बेसलाइन्स की क्वालिटी इस्तेमाल किए गए ख़ास प्रॉम्प्ट के प्रति बेहद सेंसिटिव होती है. अलग-अलग प्रॉम्प्ट्स के साथ, बेसलाइन अभी भी ख़राब परफ़ॉर्म कर सकती है, लेकिन एक अलग तरीके से—जैसे कि, कोडिंग और राइटिंग वाले टास्क में समान तौर से गलत होने की वजह, जिसके नतीजे से एरर के अलग डिस्ट्रीब्यूशन और सब-ऑप्टिमल परफ़ॉर्मेंस के वैकल्पिक रूप होते हैं. कोडिंग के लिए, हमने जानबूझकर मॉडल को ट्रिगरिंग के विरुद्ध पक्षपाती बनाया, ताकि हमारे पॉवर यूज़र्स को बाधा न पहुंचे. हम यूज़र्स की प्रतिक्रिया के आधार पर इसे और बेहतर बनाते रहेंगे.

कैनवस निर्णय सीमा ट्रिगर - राइटिंग और कोडिंग

राइटिंग और कोडिंग टास्क के लिए, हमने कैनवस के फ़ैसले की सीमा को सही ढंग से ट्रिगर करने में सुधार किया, जो कि प्रॉम्प्ट किए गए निर्देशों के साथ बेसलाइन ज़ीरो-शॉट GPT‑4o के मुकाबले क्रमश 83% और 94% तक पहुंच गया.

दूसरी चुनौती में कैनवस के ट्रिगर होने के बाद मॉडल के एडिटिंग बिहेवियर को ट्यून करना शामिल था—ख़ास तौर से ये फ़ैसला लेना कि कब टार्गेटेड एडिट करना है और कब पूरे कंटेंट को दोबारा लिखना है. हमने मॉडल को इस प्रकार ट्रेन किया कि जब यूज़र्स इंटरफ़ेस के ज़रिए स्पष्ट तरीके से टेक्स्ट चुनते हैं तो वे टार्गेटेड एडिट्स कर सकें, नहीं तो रीराइट्स को प्राथमिकता दी जाती. जैसे-जैसे हम मॉडल को बेहतर बनाते हैं, इस व्यवहार में और सुधार होता रहता है.

कैनवस एडिट्स बाउंड्री - राइटिंग और कोडिंग

राइटिंग और कोडिंग टास्क के लिए, हमने कैनवस टार्गेटेड एडिट्स को बेहतर बनाने को प्राथमिकता दी. कैनवस के साथ GPT‑4o, बेसलाइन प्रॉम्प्ट किए गए GPT‑4o से 18% बेहतर परफ़ॉर्म करता है.

आख़िरकार, हाई-क्वालिटी वाले कमेंट्स जेनरेट करने के लिए मॉडल को ट्रेन करने में सावधानीपूर्वक दोहराने की ज़रुरत थी. पहले दो मामलों के विपरीत, जो कि पूरे मैनुअल रिव्यु के साथ ऑटोमेटेड मूल्यांकन के लिए आसानी से अनुकूल हैं, ऑटोमेटेड तरीके से क्वालिटी को मापना ख़ास तौर से चुनौतीपूर्ण है. इसलिए, हमने कमेंट की क्वालिटी और सटीकता का आंकलन करने के लिए मानवीय मूल्यांकन का इस्तेमाल किया. हमारा इंटीग्रेटेड कैनवस मॉडल, प्रॉम्प्ट किए गए निर्देशों के साथ ज़ीरो-शॉट GPT‑4o से सटीकता में 30% और क्वालिटी में 16% बेहतर परफ़ॉर्म करता है, जो दर्शाता है कि विस्तृत निर्देशों के साथ ज़ीरो-शॉट प्रॉम्प्टिंग के मुकाबले सिंथेटिक ट्रेनिंग जवाब की क्वालिटी और व्यवहार को काफ़ी ज़्यादा बढ़ाता है.

Canvas Suggested Comments

मानवीय मूल्यांकन ने कैनवस कमेंट की क्वालिटी और सटीकता फ़ंक्शनालिटी का आंकलन किया. हमारा कैनवस मॉडल, प्रॉम्प्ट किए गए निर्देशों के साथ ज़ीरो-शॉट GPT‑4o से सटीकता में 30% और क्वालिटी में 16% बेहतर परफ़ॉर्म करता है.

आगे क्या है

AI को ज़्यादा फ़ायदेमंद और सुलभ बनाने के लिए इस बात पर दोबारा विचार करने की ज़रुरत है कि हम इसके साथ किस तरह बातचीत करते हैं. कैनवस एक नया अप्रोच है और दो साल पहले लॉन्च होने के बाद से ChatGPT के विजुअल इंटरफ़ेस का पहला बड़ा अपडेट है.

कैनवस अभी शुरूआती बीटा स्टेज में है और हम इसकी कैपेबिलिटी में तेज़ी से सुधार करने का प्लान कर रहे हैं.

लेखक

OpenAI

रिसर्च लीड

करीना गुयेन

कोर रिसर्च

Kai Chen, Michael Wu, Tarun Gogineni

कोर इंजीनियरिंग, प्रोडक्ट, डिज़ाइन

Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver, Thomas Dimson

कंट्रिब्‍यूटर

Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao, Yilei Qian

सपोर्ट करने वाली लीडरशिप

Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman, Sulman Choudhry