11 जून 2020

OpenAI API

हम OpenAI द्वारा विकसित नए AI मॉडल को एक्सेस करने के लिए API पेश कर रहे हैं.

लोड किया जा रहा है...

हम OpenAI द्वारा विकसित नए AI मॉडल को एक्सेस करने के लिए API पेश कर रहे हैं. ज्‍़यादातर AI सिस्‍टम, जो एक यूज़-केस के लिए डिज़ाइन किए जाते हैं, उनसे बिल्‍कुल अलग, API आज जनरल-पर्पस वाला "टेक्स्ट इन, टेक्स्ट आउट" इंटरफ़ेस देता है, जिससे यूज़र इसे अंग्रेज़ी भाषा के किसी भी टास्‍क पर आज़मा कर देख सकते हैं. अब आप अपने प्रोडक्‍ट में API को इंटिग्रेट करने, एक पूरी तरह नए ऐप्लिकेशन को डिप्‍लॉय करने, या इस टेक्‍नोलॉजी की ख़ूबियों और सीमाओं को जानने में हमारी मदद करने के लिए एक्‍सेस का अनुरोध कर सकते हैं.

लोड किया जा रहा है...

कोई भी टेक्स्ट प्रॉम्प्ट देने पर, API टेक्स्ट कंप्‍लीशन वापस करेगा, उस पैटर्न से मैच करने की कोशिश करेगा, जो आपने उसे दिया है. आप कुछ ही उदाहरण दिखाकर इसे “प्रोग्राम” कर सकते हैं कि आप इससे क्या करवाना चाहते हैं; इसकी कामयाबी आमतौर पर इस चीज़ पर निर्भर करती है कि टास्क कितना मुश्किल है. API आपको आपके द्वारा उपलब्ध कराए गए उदाहरणों के डेटासेट (छोटे या बड़े) पर ट्रेनिंग देकर, या यूज़र या लेबलर द्वारा उपलब्‍ध कराए गए इंसानी फ़ीडबैक से सीखकर, ख़ास टास्‍क पर परफ़ॉर्मेंस को बेहतर बनाने देता है.

हमने API को दोनों तरह से डिज़ाइन किया है कि यह हर किसी के लिए इस्‍तेमाल में आसान हो, और साथ ही इतना लचीला भी हो कि मशीन लर्निंग टीम ज्‍़यादा प्रोडक्टिव बन सकें. असल में, अब हमारी कई टीम API को इस्‍तेमाल कर रही हैं, ताकि वे अलग-अलग सिस्टम की समस्याओं की जगह मशीन लर्निंग रिसर्च पर फ़ोकस कर सकें. आज API स्‍पीड और थ्रूपुट के कई सुधार के साथ GPT‑3⁠(एक नई विंडो में खुलेगा) फ़ैमिली के वेट्स वाले मॉडल चलाता है. मशीन लर्निंग बहुत तेज़ी से आगे बढ़ रही है, और हम अपनी टेक्‍नोलॉजी को लगातार अपग्रेड कर रहे हैं, ताकि हमारे यूज़र अप-टू-डेट रहें.

लोड किया जा रहा है...

इस फ़ील्‍ड की प्रोग्रेस की रफ़्तार का मतलब है कि AI के पॉज़ि‍टिव और निगेटिव दोनों तरह के नए ऐप्लिकेशन लगातार हैरान करते रहते हैं. हम हरासमेंट, स्पैम, रेडिकलाइज़ेशन या एस्ट्रोटर्फ़िंग जैसे नुक़सान पहुंचाने वाले यूज़-केस के लिए API एक्‍सेस को बिल्‍कुल ही ख़त्‍म कर देंगे. लेकिन हम यह भी जानते हैं कि हम इस टेक्‍नोलॉजी के सभी संभावित नतीजों का अंदाज़ा नहीं लगा सकते, इसलिए हम इसे आज आमतौर पर उपलब्ध होने की बजाय निजी बीटा में लॉन्च कर रहे हैं, यूज़र को हमारे API से वापस मिलने वाले कंटेंट को बेहतर तरीक़े से कंट्रोल करने में मददगार टूल बना रहे हैं, और भाषा टेक्‍नोलॉजी के सुरक्षा से जुड़े पहलुओं (जैसे नुक़सान पहुंचाने वाले पूर्वाग्रहों को एनालाइज़ करना, मिटिगेशन और दख़ल करने) पर रिसर्च कर रहे हैं. हम जो भी सीखेंगे उसे शेयर करेंगे, ताकि हमारे यूज़र और व्यापक कम्‍यूनिटी ज्‍़यादा ह्यूमन-पॉज़िटिव AI सिस्टम बना सकें.

लोड किया जा रहा है...

हमारे मिशन⁠ से जुड़े ख़र्चों को कवर करने⁠ में हमारी मदद करने के लिए आमदनी का सोर्स होने के अलावा, API ने हमें इन जनरल-पर्पस AI टेक्‍नोलॉजी पर अपना फ़ोकस करने की ओर धकेला है – टेक्‍नोलॉजी को बेहतर बनाना, इसे इस्‍तेमाल के लायक़ बनाना और असली दुनिया में इसके असर पर सोच-विचार करना. हमें उम्मीद है कि API, AI से चलने वाले फ़ायदेमंद प्रोडक्‍ट को बनाने में आने वाली रुकावट⁠(एक नई विंडो में खुलेगा) को बहुत कम कर देगा, जिसके नतीजे से हमें ऐसे टूल और सेवाएं मिलेंगी, जिनकी आज कल्पना भी नहीं की जा सकती.

API को जानने-समझने में दिलचस्‍पी है? Algolia⁠(एक नई विंडो में खुलेगा), Quizlet⁠(एक नई विंडो में खुलेगा), और Reddit⁠(एक नई विंडो में खुलेगा) जैसी कंपनियों, और रिसर्चर हमारे प्राइवेट बीटा⁠(एक नई विंडो में खुलेगा) में मिडलबरी इंस्टीट्यूट⁠(एक नई विंडो में खुलेगा) में शामिल हों.

लोड किया जा रहा है...

हमारी एप्‍लाइड AI टीम में शामिल हों(एक नई विंडो में खुलेगा)

अक्‍सर पूछे जाने वाले सवाल

OpenAI ने कमर्शियल प्रोडक्‍ट पेश करने का फ़ैसला क्‍यों लिया?

आख़ि‍रकार, हमारी सबसे बड़ी इच्‍छा⁠ क्‍या है, यही कि हम यह पक्‍का करना चाहते हैं कि आर्टिफ़िशियल जेनरल इंटेलिजेंस के फ़ायदे हर एक तक पहुंचे. हम कमर्शियल प्रोडक्‍ट बनाने को ऐसे तरीकों में से एक मानते हैं, जिससे हमारे पास क़ामयाब होने के लिए काफ़ी पैसा आएगा.

हम यह भी मानते हैं कि दुनिया में ज़ोरदार AI सिस्‍टम को सुरक्षित तरीक़े से डिप्‍लॉय करना सही में बहुत मुश्‍कि‍ल होगा. API को रिलीज़ करते वक्‍़त, हम अपने पार्टनर के साथ बिल्‍कुल जुड़़कर काम कर रहे हैं, ताकि यह देखा जा सके कि असल दुनिया में AI सिस्‍टम के इस्‍तेमाल के समय कौन-कौन सी चुनौतियां पैदा होती हैं. इससे हमें यह समझने में मदद मिलेगी कि भविष्य में AI सिस्टम को कैसे डिप्‍लॉय किया जाएगा और हमें ऐसा क्या करना होगा कि वे सभी के लिए सुरक्षित और फ़ायदेमंद साबित हों.

OpenAI ने मॉडल को ओपन-सोर्स करने की बजाय API को रिलीज़ करने को क्यों चुना?

ऐसा करने के तीन मुख्‍य कारण हैं. पहला, टेक्‍नोलॉजी को कमर्शियल करने से हमें अपने चल रहे AI रिसर्च, सुरक्षा और नीति संबंधी कोशिशों की पेमेंट करने में मदद मिलती है.

दूसरा, API में अंडरलाईंग कई मॉडल बहुत ही बड़े होते हैं, जिन्हें विकसित और डिप्‍लॉय करने में बहुत ज्‍़यादा कुशलता की ज़रूरत पड़ती है और उन्हें चलाना बहुत महंगा होता है. इससे बड़ी कंपनियों को छोड़कर किसी और के लिए अंडरलाईंग टेक्‍नोलॉजी से फ़ायदा उठाना मुश्किल हो जाता है. हमें उम्मीद है कि API ज़ोरदार AI सिस्‍टम को छोटे बिज़नेस और ऑर्गेनाइज़ेशन के लिए ज्‍़यादा पहुंच के काबिल बना देगा.

तीसरा, API मॉडल हमें टेक्‍नोलॉजी के ग़लत इस्‍तेमाल पर ज्‍़यादा आसानी से रिस्‍पांस करने देगा. चूंकि हमारे मॉडल के डाउनस्ट्रीम यूज़ केस का अंदाज़ा लगाना मुश्किल है, इसलिए उन्हें API के ज़रिए रिलीज़ करना और धीरे-धीरे उसकी एक्‍सेस को बढ़ाना बुनियादी तौर से सुरक्षित लगता है, बजाय ओपन सोर्स मॉडल को रिलीज़ करने के, जिसमें नुक़सान पहुंचाने वाले ऐप्लिकेशन के होने के बावजूद उसकी एक्‍सेस को एडजेस्‍ट नहीं किया जा सकता.

GPT-2 के बारे में आपने पहले जो बताया था, उसे देखते हुए API के ग़लत इस्‍तेमाल के बारे में OpenAI ख़ासतौर पर क्या करेगा?

GPT‑2 के बारे में, हमारी एक मुख्‍य चिंता मॉडल का ख़तरनाक इस्‍तेमाल (जैसे कि, ग़लत जानकारी के लिए) थी, जिसे मॉडल के ओपन सोर्स हो जाने के बाद रोकना मुश्किल हो जाता है. API के लिए, हम मंज़ूर किए गए यूज़र और यूज़ केस तक की एक्‍सेस को लिमिटेड करके ग़लत इस्‍तेमाल को बेहतर तरीक़े से रोक पाएंगे. पेश करने के लिए तैयार ऐप्लिकेशन के लाइव होने से पहले हमारे पास एक बेहद ज़रूरी प्रोडक्‍शन रिव्यु प्रोसेस होता है. प्रोडक्‍शन रिव्‍यु में, हम ऐप्लिकेशन के कुछ हिस्‍सों का मूल्यांकन करते हैं, कुछ इस तरह के सवाल पूछकर: क्या यह अभी यूज़ केस को सपोर्ट करता है?, ऐप्लिकेशन कितना ओपन-एंडेड है?, ऐप्लिकेशन कितना ख़तरों भरा है?, ग़लत इस्‍तेमाल की संभावना के संबंधित आपका क्‍या प्‍लान है?, और आपके ऐप्लिकेशन के एंड यूज़र कौन हैं?

हम उन यूज़ केस में API की एक्‍सेस को रोक देते हैं, जो लोगों को शारीरिक, भावनात्मक या मनोवैज्ञानिक नुक़सान पहुंचाने (या पहुंचाने का इरादा रखते हैं) का कारण बनते हैं, जिसमें हरासमेंट, इरादातन धोखा, रेडिकलाइज़ेशन, एस्ट्रोटर्फिंग या स्पैम आदि शामिल हैं, साथ ही ऐसे ऐप्लिकेशन जिनमें एंड यूज़र द्वारा ग़लत इस्‍तेमाल को सीमित करने के लिए नाकाफ़ी गार्डरेल हैं. जैसे-जैसे हम प्रैक्टिस में API को ऑपरेट करने में ज्‍़यादा से ज्‍़यादा अनुभव करते जाएंगे, हम इस्‍तेमाल की उन कैटेगरी को लगातार रिफ़ाइन करते जाएंगे, और उन कैटेगरी को बड़ा कर सकें, जिनका हम सपोर्ट करते हैं, और जिनकी हमें ग़लत इस्‍तेमाल की आशंका है उनके लिए बारीकी वाली बेहतर कैटेगरी बना सकें.

API के इस्‍तेमाल को मंजूरी देने में हम जिस एक मुख्‍य चीज़ पर ध्‍यान देते हैं, वह यह है कि सिस्टम की अंडरलाईंग जेनरेटिव क्षमताओं के बारे में ऐप्लिकेशन किस हद तक ओपन-एंड बनाम ज़बरदस्‍ती वाले बिहेवियर को दिखाता है. API के ओपन-एंडेड ऐप्लिकेशन (जैसे कि, एक जो मनमाने प्रॉम्‍प्‍ट के ज़रिए बड़े पैमाने पर कस्‍टमाइज़ किए जा सकने लायक टेक्‍स्‍ट को बिना किसी रुकावट के जेनरेट कर सकता है) ख़ासतौर पर ग़लत इस्‍तेमाल के प्रति बहुत ही संवेदनशील हैं. जेनरेटिव यूज़ केस को सुरक्षित बनाने वाले प्रतिबंधों में सिस्टम डिज़ाइन शामिल हैं, जिसमें ह्यूमन इन द लूप, एंड यूज़र प्रतिबंध, आउटपुट की पोस्ट-प्रोसेसिंग, कंटेंट फ़िल्टरेशन, इनपुट/आउटपुट लंबाई की लिमिटेशन, एक्टिव मॉनिटरिंग और असली लिमिटेशन को एक्‍सेस हैं.

हम API द्वारा पेश मॉडल के संभावित ग़लत इस्‍तेमाल पर रिसर्च लगातार करते रहेंगे, जिसमें हमारे अकेडमिक एक्‍सेस प्रोग्राम⁠(एक नई विंडो में खुलेगा) के ज़रिए थर्ड पार्टी के रिसर्चर भी शामिल हैं. हम इस समय बहुत थोड़े-से रिसर्चर के साथ शुरुआत कर रहे हैं और मिडलबरी इंस्टीट्यूट⁠(एक नई विंडो में खुलेगा), यूनिवर्सिटी ऑफ़ वाशिंगटन और एलन इंस्टीट्यूट फ़ॉर AIमें हमारे अकेडमिक पार्टनर से मिले कुछ नतीजे पहले से हमारे पास हैं. हमारे पास इस प्रोग्राम के लिए पहले से ही दसियों हज़ार ऐप्लिकेंट हैं और अभी हम फ़ेयरनेस और रिप्रेज़ेंटेशन रिसर्च पर फ़ोकस वाले ऐप्लिकेशन पर ध्यान दे रहे हैं.⁠(एक नई विंडो में खुलेगा)

OpenAI, API द्वारा पेश मॉडल के नुक़सान पहुंचाने वाले पक्षपात और अन्य निगेटिव असर को कैसे कम करेगा?

नुक़सान पहुंचाने वाले पक्षपात जैसे निगेटिव असर को कम करना मुश्किल होता है, पूरी इंडस्‍ट्री में फैली समस्या है जो कि बहुत ही ज्‍़यादा महत्‍वपूर्ण है. जैसा कि हमने GPT‑3 पेपर⁠(एक नई विंडो में खुलेगा) और मॉडल कार्ड⁠(एक नई विंडो में खुलेगा) मे बात की है, हमारे API मॉडल उन पक्षपातों को दिखाते हैं, जो जेनरेटिड टेक्‍स्‍ट में रिफ़्लेक्‍ट होंगे. इन समस्याओं को ध्यान में रखते हुए हम ये क़दम उठा रहे हैं:

हमने इस्‍तेमाल संबंधी गाइडलाइंस बनाई हैं, जो डेवलपर को सुरक्षा से जुड़े संभावित समस्याओं को समझने और सुलझाने में मदद करती हैं.
हम यूज़र के साथ जुड़कर काम कर रहे हैं, ताकि उनके यूज़ केस को समझा जा सके और नुक़सान पहुंचाने वाले पक्षपात को उजागर करने और उन्हें कम करने के लिए दख़ल देने के लिए टूल बनाए जा सकें.
हम नुक़सान पहुंचाने वाले पक्षपात के प्रदर्शन, और निष्पक्षता और रिप्रेज़ेंटेशन में बड़ी समस्याओं पर अपनी ख़ुद की रिसर्च कर रहे हैं, जो मौजूदा मॉडल के बेहतर डॉक्यूमेंटेशन के साथ-साथ भविष्य के मॉडल में अलग-अलग तरह के सुधारों के ज़रिए हमारे काम को पेश करने में मदद करेगा.
हम पक्षपात को एक ऐसी समस्या की तरह देखते हैं जो सिस्‍टम और डिप्‍लॉय किए गए कॉन्टेक्स्ट के इंटरसेक्शन पर सामने आती है; हमारी टेक्‍नोलॉजी से बने ऐप्लिकेशन सोशियो-टेक्‍निकल सिस्‍टम हैं, इसलिए हम अपने डेवलपर के साथ मिलकर इसे यक़ीनी बनाते हैं कि वे ख़ि‍लाफ़त वाले व्यव्हार की निगरानी के लिए मुनासिब प्रोसेस और ह्यूमन-इन-द-लूप सिस्‍टम लगा रहे हैं.

हमारा मक़सद इस्‍तेमाल के हर कॉन्टेक्स्ट में API के संभावित नुक़सानों के बारे में अपनी समझदारी को बढ़ाना जारी रखना है, और उन्हें कम करने में मददगार अपने टूल और प्रोसेस को लगातार बेहतर बनाना है.

18 सितंबर, 2020 को अपडेट किया गया

लेखक

Greg Brockman, Mira Murati, Peter Welinder और OpenAI

OpenAI API

अक्‍सर पूछे जाने वाले सवाल

OpenAI ने कमर्शियल प्रोडक्‍ट पेश करने का फ़ैसला क्‍यों लिया?

OpenAI ने मॉडल को ओपन-सोर्स करने की बजाय API को रिलीज़ करने को क्यों चुना?

GPT-2 के बारे में आपने पहले जो बताया था, उसे देखते हुए API के ग़लत इस्‍तेमाल के बारे में OpenAI ख़ासतौर पर क्या करेगा?

OpenAI, API द्वारा पेश मॉडल के नुक़सान पहुंचाने वाले पक्षपात और अन्य निगेटिव असर को कैसे कम करेगा?

लेखक

संबंधित आर्टिकल