
हम कैनवस पेश कर रहे हैं, जो ChatGPT के साथ राइटिंग और कोडिंग प्रोजेक्ट्स पर काम करने के लिए एक नया इंटरफ़ेस है जो साधारण चैट से परे है. कैनवस एक अलग विंडो में खुलता है, जिससे आप और ChatGPT किसी प्रोजेक्ट पर सहयोग कर सकते हैं. ये शुरूआती बीटा साथ मिलकर काम करने का एक नया तरीका प्रस्तुत करता है - न सिर्फ़ बातचीत के ज़रिए, बल्कि साथ-साथ विचारों को बनाकर और उन्हें बेहतर करते हुए.
कैनवस को GPT‑4o के साथ बनाया गया था और बीटा में रहते हुए इसे मॉडल पिकर में मैन्युअल तरीके से चुना जा सकता है. आज से हम वैश्विक स्तर पर ChatGPT Plus और Team यूज़र के लिए कैनवस शुरू कर रहे हैं. Enterprise और Edu यूज़र को अगले हफ़्ते तक एक्सेस मिल जाएगा. हम ये भी प्लान कर रहे हैं कि जब ये बीटा से बाहर होगा तो कैनवस को सभी ChatGPT फ़्री यूज़र के लिए उपलब्ध कराया जाएगा.
लोग राइटिंग और कोडिंग में मदद के लिए रोज़ ChatGPT का इस्तेमाल करते हैं. हालांकि चैट इंटरफ़ेस का इस्तेमाल करना आसान है और ये कई टास्क के लिए अच्छी तरह से काम करता है, लेकिन जब आप उन प्रोजेक्ट्स पर काम करना चाहते हैं जिनमें एडिटिंग और बदलावों की ज़रुरत होती है तो ये सीमित हो जाता है. कैनवस इस तरह के काम के लिए एक नया इंटरफ़ेस देता है.
कैनवस के साथ, ChatGPT बेहतर ढंग से कॉन्टेक्स्ट को समझ सकता है कि आप क्या हासिल करने की कोशिश कर रहे हैं. आप ख़ास सेक्शन को हाईलाइट करके ChatGPT को ये बता सकते हैं कि आप चाहते हैं वो वहां फ़ोकस करे. एक कॉपी एडिटर या कोड रिव्युअर की तरह, ये पूरे प्रोजेक्ट को ध्यान में रखते हुए इनलाइन फ़ीडबैक और सुझाव दे सकता है.
आप कैनवस में प्रोजेक्ट को कंट्रोल करते हैं. आप सीधे टेक्स्ट या कोड एडिट कर सकते हैं. ChatGPT से राइटिंग की लेंग्थ एडजस्ट करने, अपने कोड को डीबग करने और दूसरे उपयोगी एक्शन को जल्दी से करने के लिए कहने के लिए शॉर्ट कट का एक मेन्यु है. आप कैनवस में बैक बटन का इस्तेमाल करके अपने काम के पिछले वर्जन भी रीस्टोर कर सकते हैं.
जब ChatGPT किसी ऐसे सिनारियो को डिटेक्ट करता है जिसमें वो मददगार हो सकता है, तो कैनवस अपने आप खुल जाता है. आप कैनवस खोलने और किसी मौजूदा प्रोजेक्ट पर काम करने के लिए इसका इस्तेमाल करने के लिए अपने प्रॉम्प्ट में “कैनवस का इस्तेमाल करें” भी शामिल कर सकते हैं.
राइटिंग के शॉर्ट कट में ये शामिल हैं:
- एडिट्स सुझाएँ ChatGPT इनलाइन सुझाव और फ़ीडबैक देता है.
- लेंग्थ एडजस्ट करें: डॉक्यूमेंट की लेंग्थ को छोटा या बड़ा करने के लिए एडिट करता है.
- रीडिंग लेवल बदलें: किंडरगार्टन से लेकर ग्रेजुएट स्कूल तक रीडिंग के लेवल को एडजस्ट करता है.
- फ़ाइनल पॉलिश जोड़ें: व्याकरण, स्पष्टता, और एकरूपता की जांच करता है.
- इमोजी जोड़ें: ज़ोर और रंग के लिए प्रासंगिक इमोजी जोड़ता है.
कोडिंग दोहराने वाला प्रोसेस है, और चैट में अपने कोड के सभी बदलावों को फ़ॉलो करना मुश्किल हो सकता है. कैनवस ChatGPT के बदलावों को ट्रैक करना और समझना आसान बनाता है, और हम इस प्रकार के एडिट्स में पारदर्शिता में सुधार जारी रखने का प्लान कर रहे हैं.
कोडिंग शॉर्ट कट में शामिल हैं:
- रिव्यु कोड: ChatGPT आपके कोड को बेहतर बनाने के लिए इनलाइन सुझाव देता है.
- लॉग जोड़ें: आपके कोड को डीबग करने और समझने में आपकी मदद के लिए प्रिंट स्टेटमेंट्स इन्सर्ट करता है.
- कमेंट्स जोड़ें: कोड को समझने में आसानी के लिए उसमें कमेंट्स जोड़ता है.
- बग्स को फ़िक्स करता है: एरर को हल करने के लिए प्रॉब्लम वाले कोड का पता लगाता है और उसे दोबारा लिखता है.
- किसी भाषा में पोर्ट करें: आपके कोड को JavaScript, TypeScript, Python, Java, C++, या PHP में अनुवाद करता है.
हमने GPT‑4o को क्रिएटिव पार्टनर के तौर पर सहयोग करने के लिए ट्रेन किया. मॉडल को पता होता है कि कैनवस को कब खोलना है, टार्गेटेड एडिट्स कब करना है, और कब उसे पूरी तरह से दोबारा लिखना है. ये सटीक फ़ीडबैक और सुझाव देने के लिए व्यापक कॉन्टेक्स्ट को भी समझता है.
इसे सपोर्ट करने के लिए, हमारी रिसर्च टीम ने यह मुख्य बिहेवियर डेवलप किए:
- राइटिंग और कोडिंग के लिए कैनवस को ट्रिगर करना
- कई प्रकार के कंटेंट जेनरेट करना
- टार्गेटेड एडिट्स करना
- डॉक्यूमेंट्स को दोबारा लिखना
- इनलाइन आलोचना देना
हमने 20 से ज़्यादा ऑटोमेटेड अंदरूनी मूल्यांकनों के ज़रिए प्रोग्रेस को मापा. हमने मॉडल को उसके मूल व्यवहारों के लिए पोस्ट-ट्रेन करने के लिए, OpenAI o1‑preview से आउटपुट पाने जैसी नवीन सिंथेटिक डेटा जेनरेशन तकनीकों का इस्तेमाल किया. इस अप्रोच से हम राइटिंग की क्वालिटी और नए यूज़र इंटरैक्शन को तेज़ी से संबोधित कर पाए, वो भी ह्यूमन-जेनरेटेड डेटा पर निर्भर हुए बिना.
एक प्रमुख चुनौती ये थी कि कैनवस को कब ट्रिगर किया जाए. हमने मॉडल को "कॉफ़ी बीन्स के इतिहास के बारे में एक ब्लॉग पोस्ट लिखें" जैसे प्रॉम्प्ट के लिए एक कैनवस को ओपन करना सिखाया, जबकि "रात के खाने के लिए एक नई रेसिपी बनाने में मेरी मदद करें" जैसे सामान्य सवाल जवाब वाले टास्क के लिए ओवर-ट्रिगरिंग से बचना सिखाया. राइटिंग वाले टास्क के लिए, हमने "सही ट्रिगर्स" ("सही गैर-ट्रिगर्स" की कीमत पर) में सुधार को प्राथमिकता दी, जो कि प्रॉम्प्ट किए गए निर्देशों के साथ बेसलाइन ज़ीरो-शॉट GPT‑4o के मुकाबले 83% तक पहुंच गया.
ये ध्यान देने योग्य है कि ऐसी बेसलाइन्स की क्वालिटी इस्तेमाल किए गए ख़ास प्रॉम्प्ट के प्रति बेहद सेंसिटिव होती है. अलग-अलग प्रॉम्प्ट्स के साथ, बेसलाइन अभी भी ख़राब परफ़ॉर्म कर सकती है, लेकिन एक अलग तरीके से—जैसे कि, कोडिंग और राइटिंग वाले टास्क में समान तौर से गलत होने की वजह, जिसके नतीजे से एरर के अलग डिस्ट्रीब्यूशन और सब-ऑप्टिमल परफ़ॉर्मेंस के वैकल्पिक रूप होते हैं. कोडिंग के लिए, हमने जानबूझकर मॉडल को ट्रिगरिंग के विरुद्ध पक्षपाती बनाया, ताकि हमारे पॉवर यूज़र्स को बाधा न पहुंचे. हम यूज़र्स की प्रतिक्रिया के आधार पर इसे और बेहतर बनाते रहेंगे.
कैनवस निर्णय सीमा ट्रिगर - राइटिंग और कोडिंग
राइटिंग और कोडिंग टास्क के लिए, हमने कैनवस के फ़ैसले की सीमा को सही ढंग से ट्रिगर करने में सुधार किया, जो कि प्रॉम्प्ट किए गए निर्देशों के साथ बेसलाइन ज़ीरो-शॉट GPT‑4o के मुकाबले क्रमश 83% और 94% तक पहुंच गया.
दूसरी चुनौती में कैनवस के ट्रिगर होने के बाद मॉडल के एडिटिंग बिहेवियर को ट्यून करना शामिल था—ख़ास तौर से ये फ़ैसला लेना कि कब टार्गेटेड एडिट करना है और कब पूरे कंटेंट को दोबारा लिखना है. हमने मॉडल को इस प्रकार ट्रेन किया कि जब यूज़र्स इंटरफ़ेस के ज़रिए स्पष्ट तरीके से टेक्स्ट चुनते हैं तो वे टार्गेटेड एडिट्स कर सकें, नहीं तो रीराइट्स को प्राथमिकता दी जाती. जैसे-जैसे हम मॉडल को बेहतर बनाते हैं, इस व्यवहार में और सुधार होता रहता है.
कैनवस एडिट्स बाउंड्री - राइटिंग और कोडिंग
राइटिंग और कोडिंग टास्क के लिए, हमने कैनवस टार्गेटेड एडिट्स को बेहतर बनाने को प्राथमिकता दी. कैनवस के साथ GPT‑4o, बेसलाइन प्रॉम्प्ट किए गए GPT‑4o से 18% बेहतर परफ़ॉर्म करता है.
आख़िरकार, हाई-क्वालिटी वाले कमेंट्स जेनरेट करने के लिए मॉडल को ट्रेन करने में सावधानीपूर्वक दोहराने की ज़रुरत थी. पहले दो मामलों के विपरीत, जो कि पूरे मैनुअल रिव्यु के साथ ऑटोमेटेड मूल्यांकन के लिए आसानी से अनुकूल हैं, ऑटोमेटेड तरीके से क्वालिटी को मापना ख़ास तौर से चुनौतीपूर्ण है. इसलिए, हमने कमेंट की क्वालिटी और सटीकता का आंकलन करने के लिए मानवीय मूल्यांकन का इस्तेमाल किया. हमारा इंटीग्रेटेड कैनवस मॉडल, प्रॉम्प्ट किए गए निर्देशों के साथ ज़ीरो-शॉट GPT‑4o से सटीकता में 30% और क्वालिटी में 16% बेहतर परफ़ॉर्म करता है, जो दर्शाता है कि विस्तृत निर्देशों के साथ ज़ीरो-शॉट प्रॉम्प्टिंग के मुकाबले सिंथेटिक ट्रेनिंग जवाब की क्वालिटी और व्यवहार को काफ़ी ज़्यादा बढ़ाता है.
Canvas Suggested Comments
मानवीय मूल्यांकन ने कैनवस कमेंट की क्वालिटी और सटीकता फ़ंक्शनालिटी का आंकलन किया. हमारा कैनवस मॉडल, प्रॉम्प्ट किए गए निर्देशों के साथ ज़ीरो-शॉट GPT‑4o से सटीकता में 30% और क्वालिटी में 16% बेहतर परफ़ॉर्म करता है.
AI को ज़्यादा फ़ायदेमंद और सुलभ बनाने के लिए इस बात पर दोबारा विचार करने की ज़रुरत है कि हम इसके साथ किस तरह बातचीत करते हैं. कैनवस एक नया अप्रोच है और दो साल पहले लॉन्च होने के बाद से ChatGPT के विजुअल इंटरफ़ेस का पहला बड़ा अपडेट है.
कैनवस अभी शुरूआती बीटा स्टेज में है और हम इसकी कैपेबिलिटी में तेज़ी से सुधार करने का प्लान कर रहे हैं.
लेखक
रिसर्च लीड
करीना गुयेन
कोर रिसर्च
Kai Chen, Michael Wu, Tarun Gogineni
कोर इंजीनियरिंग, प्रोडक्ट, डिज़ाइन
Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver, Thomas Dimson
कंट्रिब्यूटर
Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao, Yilei Qian
सपोर्ट करने वाली लीडरशिप
Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman, Sulman Choudhry