OpenAI API
हम OpenAI द्वारा विकसित नए AI मॉडल को एक्सेस करने के लिए API पेश कर रहे हैं.

हम OpenAI द्वारा विकसित नए AI मॉडल को एक्सेस करने के लिए API पेश कर रहे हैं. ज़्यादातर AI सिस्टम, जो एक यूज़-केस के लिए डिज़ाइन किए जाते हैं, उनसे बिल्कुल अलग, API आज जनरल-पर्पस वाला "टेक्स्ट इन, टेक्स्ट आउट" इंटरफ़ेस देता है, जिससे यूज़र इसे अंग्रेज़ी भाषा के किसी भी टास्क पर आज़मा कर देख सकते हैं. अब आप अपने प्रोडक्ट में API को इंटिग्रेट करने, एक पूरी तरह नए ऐप्लिकेशन को डिप्लॉय करने, या इस टेक्नोलॉजी की ख़ूबियों और सीमाओं को जानने में हमारी मदद करने के लिए एक्सेस का अनुरोध कर सकते हैं.
कोई भी टेक्स्ट प्रॉम्प्ट देने पर, API टेक्स्ट कंप्लीशन वापस करेगा, उस पैटर्न से मैच करने की कोशिश करेगा, जो आपने उसे दिया है. आप कुछ ही उदाहरण दिखाकर इसे “प्रोग्राम” कर सकते हैं कि आप इससे क्या करवाना चाहते हैं; इसकी कामयाबी आमतौर पर इस चीज़ पर निर्भर करती है कि टास्क कितना मुश्किल है. API आपको आपके द्वारा उपलब्ध कराए गए उदाहरणों के डेटासेट (छोटे या बड़े) पर ट्रेनिंग देकर, या यूज़र या लेबलर द्वारा उपलब्ध कराए गए इंसानी फ़ीडबैक से सीखकर, ख़ास टास्क पर परफ़ॉर्मेंस को बेहतर बनाने देता है.
हमने API को दोनों तरह से डिज़ाइन किया है कि यह हर किसी के लिए इस्तेमाल में आसान हो, और साथ ही इतना लचीला भी हो कि मशीन लर्निंग टीम ज़्यादा प्रोडक्टिव बन सकें. असल में, अब हमारी कई टीम API को इस्तेमाल कर रही हैं, ताकि वे अलग-अलग सिस्टम की समस्याओं की जगह मशीन लर्निंग रिसर्च पर फ़ोकस कर सकें. आज API स्पीड और थ्रूपुट के कई सुधार के साथ GPT‑3(एक नई विंडो में खुलेगा) फ़ैमिली के वेट्स वाले मॉडल चलाता है. मशीन लर्निंग बहुत तेज़ी से आगे बढ़ रही है, और हम अपनी टेक्नोलॉजी को लगातार अपग्रेड कर रहे हैं, ताकि हमारे यूज़र अप-टू-डेट रहें.
इस फ़ील्ड की प्रोग्रेस की रफ़्तार का मतलब है कि AI के पॉज़िटिव और निगेटिव दोनों तरह के नए ऐप्लिकेशन लगातार हैरान करते रहते हैं. हम हरासमेंट, स्पैम, रेडिकलाइज़ेशन या एस्ट्रोटर्फ़िंग जैसे नुक़सान पहुंचाने वाले यूज़-केस के लिए API एक्सेस को बिल्कुल ही ख़त्म कर देंगे. लेकिन हम यह भी जानते हैं कि हम इस टेक्नोलॉजी के सभी संभावित नतीजों का अंदाज़ा नहीं लगा सकते, इसलिए हम इसे आज आमतौर पर उपलब्ध होने की बजाय निजी बीटा में लॉन्च कर रहे हैं, यूज़र को हमारे API से वापस मिलने वाले कंटेंट को बेहतर तरीक़े से कंट्रोल करने में मददगार टूल बना रहे हैं, और भाषा टेक्नोलॉजी के सुरक्षा से जुड़े पहलुओं (जैसे नुक़सान पहुंचाने वाले पूर्वाग्रहों को एनालाइज़ करना, मिटिगेशन और दख़ल करने) पर रिसर्च कर रहे हैं. हम जो भी सीखेंगे उसे शेयर करेंगे, ताकि हमारे यूज़र और व्यापक कम्यूनिटी ज़्यादा ह्यूमन-पॉज़िटिव AI सिस्टम बना सकें.
हमारे मिशन से जुड़े ख़र्चों को कवर करने में हमारी मदद करने के लिए आमदनी का सोर्स होने के अलावा, API ने हमें इन जनरल-पर्पस AI टेक्नोलॉजी पर अपना फ़ोकस करने की ओर धकेला है – टेक्नोलॉजी को बेहतर बनाना, इसे इस्तेमाल के लायक़ बनाना और असली दुनिया में इसके असर पर सोच-विचार करना. हमें उम्मीद है कि API, AI से चलने वाले फ़ायदेमंद प्रोडक्ट को बनाने में आने वाली रुकावट(एक नई विंडो में खुलेगा) को बहुत कम कर देगा, जिसके नतीजे से हमें ऐसे टूल और सेवाएं मिलेंगी, जिनकी आज कल्पना भी नहीं की जा सकती.
API को जानने-समझने में दिलचस्पी है? Algolia(एक नई विंडो में खुलेगा), Quizlet(एक नई विंडो में खुलेगा), और Reddit(एक नई विंडो में खुलेगा) जैसी कंपनियों, और रिसर्चर हमारे प्राइवेट बीटा(एक नई विंडो में खुलेगा) में मिडलबरी इंस्टीट्यूट(एक नई विंडो में खुलेगा) में शामिल हों.
आख़िरकार, हमारी सबसे बड़ी इच्छा क्या है, यही कि हम यह पक्का करना चाहते हैं कि आर्टिफ़िशियल जेनरल इंटेलिजेंस के फ़ायदे हर एक तक पहुंचे. हम कमर्शियल प्रोडक्ट बनाने को ऐसे तरीकों में से एक मानते हैं, जिससे हमारे पास क़ामयाब होने के लिए काफ़ी पैसा आएगा.
हम यह भी मानते हैं कि दुनिया में ज़ोरदार AI सिस्टम को सुरक्षित तरीक़े से डिप्लॉय करना सही में बहुत मुश्किल होगा. API को रिलीज़ करते वक़्त, हम अपने पार्टनर के साथ बिल्कुल जुड़़कर काम कर रहे हैं, ताकि यह देखा जा सके कि असल दुनिया में AI सिस्टम के इस्तेमाल के समय कौन-कौन सी चुनौतियां पैदा होती हैं. इससे हमें यह समझने में मदद मिलेगी कि भविष्य में AI सिस्टम को कैसे डिप्लॉय किया जाएगा और हमें ऐसा क्या करना होगा कि वे सभी के लिए सुरक्षित और फ़ायदेमंद साबित हों.
ऐसा करने के तीन मुख्य कारण हैं. पहला, टेक्नोलॉजी को कमर्शियल करने से हमें अपने चल रहे AI रिसर्च, सुरक्षा और नीति संबंधी कोशिशों की पेमेंट करने में मदद मिलती है.
दूसरा, API में अंडरलाईंग कई मॉडल बहुत ही बड़े होते हैं, जिन्हें विकसित और डिप्लॉय करने में बहुत ज़्यादा कुशलता की ज़रूरत पड़ती है और उन्हें चलाना बहुत महंगा होता है. इससे बड़ी कंपनियों को छोड़कर किसी और के लिए अंडरलाईंग टेक्नोलॉजी से फ़ायदा उठाना मुश्किल हो जाता है. हमें उम्मीद है कि API ज़ोरदार AI सिस्टम को छोटे बिज़नेस और ऑर्गेनाइज़ेशन के लिए ज़्यादा पहुंच के काबिल बना देगा.
तीसरा, API मॉडल हमें टेक्नोलॉजी के ग़लत इस्तेमाल पर ज़्यादा आसानी से रिस्पांस करने देगा. चूंकि हमारे मॉडल के डाउनस्ट्रीम यूज़ केस का अंदाज़ा लगाना मुश्किल है, इसलिए उन्हें API के ज़रिए रिलीज़ करना और धीरे-धीरे उसकी एक्सेस को बढ़ाना बुनियादी तौर से सुरक्षित लगता है, बजाय ओपन सोर्स मॉडल को रिलीज़ करने के, जिसमें नुक़सान पहुंचाने वाले ऐप्लिकेशन के होने के बावजूद उसकी एक्सेस को एडजेस्ट नहीं किया जा सकता.
GPT‑2 के बारे में, हमारी एक मुख्य चिंता मॉडल का ख़तरनाक इस्तेमाल (जैसे कि, ग़लत जानकारी के लिए) थी, जिसे मॉडल के ओपन सोर्स हो जाने के बाद रोकना मुश्किल हो जाता है. API के लिए, हम मंज़ूर किए गए यूज़र और यूज़ केस तक की एक्सेस को लिमिटेड करके ग़लत इस्तेमाल को बेहतर तरीक़े से रोक पाएंगे. पेश करने के लिए तैयार ऐप्लिकेशन के लाइव होने से पहले हमारे पास एक बेहद ज़रूरी प्रोडक्शन रिव्यु प्रोसेस होता है. प्रोडक्शन रिव्यु में, हम ऐप्लिकेशन के कुछ हिस्सों का मूल्यांकन करते हैं, कुछ इस तरह के सवाल पूछकर: क्या यह अभी यूज़ केस को सपोर्ट करता है?, ऐप्लिकेशन कितना ओपन-एंडेड है?, ऐप्लिकेशन कितना ख़तरों भरा है?, ग़लत इस्तेमाल की संभावना के संबंधित आपका क्या प्लान है?, और आपके ऐप्लिकेशन के एंड यूज़र कौन हैं?
हम उन यूज़ केस में API की एक्सेस को रोक देते हैं, जो लोगों को शारीरिक, भावनात्मक या मनोवैज्ञानिक नुक़सान पहुंचाने (या पहुंचाने का इरादा रखते हैं) का कारण बनते हैं, जिसमें हरासमेंट, इरादातन धोखा, रेडिकलाइज़ेशन, एस्ट्रोटर्फिंग या स्पैम आदि शामिल हैं, साथ ही ऐसे ऐप्लिकेशन जिनमें एंड यूज़र द्वारा ग़लत इस्तेमाल को सीमित करने के लिए नाकाफ़ी गार्डरेल हैं. जैसे-जैसे हम प्रैक्टिस में API को ऑपरेट करने में ज़्यादा से ज़्यादा अनुभव करते जाएंगे, हम इस्तेमाल की उन कैटेगरी को लगातार रिफ़ाइन करते जाएंगे, और उन कैटेगरी को बड़ा कर सकें, जिनका हम सपोर्ट करते हैं, और जिनकी हमें ग़लत इस्तेमाल की आशंका है उनके लिए बारीकी वाली बेहतर कैटेगरी बना सकें.
API के इस्तेमाल को मंजूरी देने में हम जिस एक मुख्य चीज़ पर ध्यान देते हैं, वह यह है कि सिस्टम की अंडरलाईंग जेनरेटिव क्षमताओं के बारे में ऐप्लिकेशन किस हद तक ओपन-एंड बनाम ज़बरदस्ती वाले बिहेवियर को दिखाता है. API के ओपन-एंडेड ऐप्लिकेशन (जैसे कि, एक जो मनमाने प्रॉम्प्ट के ज़रिए बड़े पैमाने पर कस्टमाइज़ किए जा सकने लायक टेक्स्ट को बिना किसी रुकावट के जेनरेट कर सकता है) ख़ासतौर पर ग़लत इस्तेमाल के प्रति बहुत ही संवेदनशील हैं. जेनरेटिव यूज़ केस को सुरक्षित बनाने वाले प्रतिबंधों में सिस्टम डिज़ाइन शामिल हैं, जिसमें ह्यूमन इन द लूप, एंड यूज़र प्रतिबंध, आउटपुट की पोस्ट-प्रोसेसिंग, कंटेंट फ़िल्टरेशन, इनपुट/आउटपुट लंबाई की लिमिटेशन, एक्टिव मॉनिटरिंग और असली लिमिटेशन को एक्सेस हैं.
हम API द्वारा पेश मॉडल के संभावित ग़लत इस्तेमाल पर रिसर्च लगातार करते रहेंगे, जिसमें हमारे अकेडमिक एक्सेस प्रोग्राम(एक नई विंडो में खुलेगा) के ज़रिए थर्ड पार्टी के रिसर्चर भी शामिल हैं. हम इस समय बहुत थोड़े-से रिसर्चर के साथ शुरुआत कर रहे हैं और मिडलबरी इंस्टीट्यूट(एक नई विंडो में खुलेगा), यूनिवर्सिटी ऑफ़ वाशिंगटन और एलन इंस्टीट्यूट फ़ॉर AIमें हमारे अकेडमिक पार्टनर से मिले कुछ नतीजे पहले से हमारे पास हैं. हमारे पास इस प्रोग्राम के लिए पहले से ही दसियों हज़ार ऐप्लिकेंट हैं और अभी हम फ़ेयरनेस और रिप्रेज़ेंटेशन रिसर्च पर फ़ोकस वाले ऐप्लिकेशन पर ध्यान दे रहे हैं.(एक नई विंडो में खुलेगा)
नुक़सान पहुंचाने वाले पक्षपात जैसे निगेटिव असर को कम करना मुश्किल होता है, पूरी इंडस्ट्री में फैली समस्या है जो कि बहुत ही ज़्यादा महत्वपूर्ण है. जैसा कि हमने GPT‑3 पेपर(एक नई विंडो में खुलेगा) और मॉडल कार्ड(एक नई विंडो में खुलेगा) मे बात की है, हमारे API मॉडल उन पक्षपातों को दिखाते हैं, जो जेनरेटिड टेक्स्ट में रिफ़्लेक्ट होंगे. इन समस्याओं को ध्यान में रखते हुए हम ये क़दम उठा रहे हैं:
- हमने इस्तेमाल संबंधी गाइडलाइंस बनाई हैं, जो डेवलपर को सुरक्षा से जुड़े संभावित समस्याओं को समझने और सुलझाने में मदद करती हैं.
- हम यूज़र के साथ जुड़कर काम कर रहे हैं, ताकि उनके यूज़ केस को समझा जा सके और नुक़सान पहुंचाने वाले पक्षपात को उजागर करने और उन्हें कम करने के लिए दख़ल देने के लिए टूल बनाए जा सकें.
- हम नुक़सान पहुंचाने वाले पक्षपात के प्रदर्शन, और निष्पक्षता और रिप्रेज़ेंटेशन में बड़ी समस्याओं पर अपनी ख़ुद की रिसर्च कर रहे हैं, जो मौजूदा मॉडल के बेहतर डॉक्यूमेंटेशन के साथ-साथ भविष्य के मॉडल में अलग-अलग तरह के सुधारों के ज़रिए हमारे काम को पेश करने में मदद करेगा.
- हम पक्षपात को एक ऐसी समस्या की तरह देखते हैं जो सिस्टम और डिप्लॉय किए गए कॉन्टेक्स्ट के इंटरसेक्शन पर सामने आती है; हमारी टेक्नोलॉजी से बने ऐप्लिकेशन सोशियो-टेक्निकल सिस्टम हैं, इसलिए हम अपने डेवलपर के साथ मिलकर इसे यक़ीनी बनाते हैं कि वे ख़िलाफ़त वाले व्यव्हार की निगरानी के लिए मुनासिब प्रोसेस और ह्यूमन-इन-द-लूप सिस्टम लगा रहे हैं.
हमारा मक़सद इस्तेमाल के हर कॉन्टेक्स्ट में API के संभावित नुक़सानों के बारे में अपनी समझदारी को बढ़ाना जारी रखना है, और उन्हें कम करने में मददगार अपने टूल और प्रोसेस को लगातार बेहतर बनाना है.
18 सितंबर, 2020 को अपडेट किया गया


