पेश है gpt-oss
'gpt-oss-120b' और 'gpt-oss-20b' ने ओपन-वेट रीज़निंग मॉडल्स की सीमा को और आगे बढ़ाया
हम gpt-oss-120b और gpt-oss-20b रिलीज़ कर रहे हैं—दो बेहतरीन ओपन-वेट लैंग्वेज मॉडल्स जो कम खर्चे में मज़बूत रियल-वर्ल्ड परफ़ॉर्मेंस देते हैं. फ़्लेक्सिबल Apache 2.0 लाइसेंस के तहत उपलब्ध, ये मॉडल्स रीज़निंग टास्क पर समान साइज़ वाले open models से बेहतर परफ़ॉर्म करते हैं, टूल को इस्तेमाल करने की बेहतरीन कैपेबिलिटीज़ दिखाते हैं, और कन्ज़्युमर हार्डवेयर पर एफ़िशिएंट डिप्लॉयमेंट के लिए ऑप्टिमाइज़्ड हैं. उन्हें OpenAI के सबसे एडवांस्ड इंटर्नल मॉडल्स, जिनमें o3 और दूसरे फ़्रंटियर सिस्टम्स शामिल हैं, द्वारा इन्फ़ॉर्म किए गए रीइन्फ़ोर्समेंट लर्निंग और टेक्निक्स के मिक्स का इस्तेमाल करके ट्रेन किया गया था.
gpt-oss-120b मॉडल कोर रीज़निंग बेंचमार्क्स पर OpenAI o4-mini के लगभग समान ही है, जबकि ये सिंगल 80 GB GPU पर बहुत अच्छे तरीके से रन करता है. gpt-oss-20b मॉडल आम बेंचमार्क्स पर OpenAI o3‑mini के जैसे ही रिज़ल्ट्स देता है और सिर्फ़ 16 GB की मेमोरी के साथ एज डिवाइसेज़ पर रन कर सकता है, जिसकी वजह से ये ऑन-डिवाइस यूज़ केसेस, लोकल इन्फ़रेंस या महंगे इंफ़्रास्ट्रक्चर के बिना तेज़ इटरेशन के लिए बढ़िया है. दोनों मॉडल्स टूल के इस्तेमाल, कुछ-शॉट फ़ंक्शन कॉलिंग, CoT रीज़निंग (जैसा कि Tau-बेंच एजेंटिक इवैल्यूएशन सुइट पर रिज़ल्ट्स में देखा गया है) और HealthBench (यहां तक कि OpenAI o1 और GPT‑4o जैसे मालिकाना मॉडल्स से बेहतर परफ़ॉर्म करते हैं) पर भी बेहतरीन परफ़ॉर्म करते हैं.
ये मॉडल्स हमारे Responses API(एक नई विंडो में खुलेगा) के साथ कम्पैटिबल हैं और इन्हें एजेंटिक वर्कफ़्लोज़ में इस्तेमाल करने के लिए डिज़ाइन किया गया है, जिसमें बेहतरीन इंस्ट्रक्शन फ़ॉलोविंग, वेब सर्च या Python कोड एक्सीक्यूशन जैसे टूल का इस्तेमाल, और रीज़निंग कैपेबिलिटीज़ शामिल हैं—जिसमें उन टास्क्स के लिए रीज़निंग के लेवल को एडजस्ट करने की क्षमता शामिल है, जिनमें कॉम्प्लेक्स रीज़निंग की ज़रुरत नहीं होती है और/या बहुत कम लेटेंसी वाले फ़ाइनल आउटपुट्स को टार्गेट करते हैं. वे पूरी तरह से कस्टमाइज़ेबल हैं, पूरी चेन ऑफ़ थॉट (CoT) प्रदान करते हैं, और स्ट्रक्चर्ड आउटपुट्स(एक नई विंडो में खुलेगा) को सपोर्ट करते हैं.
सुरक्षा हमारे सभी मॉडल्स को रिलीज़ करने की अप्रोच का आधार है, और open models के लिए ये ख़ास तौर से ज़रूरी है. कॉम्प्रिहेंसिव सेफ़्टी ट्रेनिंग और इवैल्यूएशन्स के ज़रिये मॉडल्स को रन करने के अलावा, हमने अपने तैयार रहने के फ़्रेमवर्क(एक नई विंडो में खुलेगा) के तहत gpt-oss-120b के एडवर्स तरीके से फ़ाइन-ट्यून किए हुए वर्ज़न की टेस्टिंग करके इवैल्यूएशन्स का एक अतिरिक्त लेयर भी डाला है. gpt-oss मॉडल्स इंटर्नल सेफ़्टी बेंचमार्क्स पर हमारे फ़्रंटियर मॉडल्स के समान ही परफ़ॉर्म करते हैं, और डेवलपर्स को हमारे हालिया मालिकाना हक़ वाले मॉडल्स के समान सेफ़्टी स्टैंडर्ड्स पेश करते हैं. हम उस कामय के रिज़ल्ट्स और ज़्यादा जानकारी एक रिसर्च पेपर और मॉडल कार्ड में शेयर कर रहे हैं. हमारी मेथडोलॉजी का रिव्यु एक्सटर्नल एक्सपर्ट्स द्वारा किया गया था और ये ओपन-वेट मॉडल्स के लिए नए सेफ़्टी स्टैंडर्ड्स सेट करने की दिशा में आगे का एक कदम है.
हम अपने open models के रियल-वर्ल्ड के ऐप्लिकेशन्स के बारे में जानने के लिए AI Sweden(एक नई विंडो में खुलेगा), Orange(एक नई विंडो में खुलेगा), और Snowflake(एक नई विंडो में खुलेगा) जैसे शुरुआती पार्टनर्स के साथ काम कर रहे हैं, जिसमें डेटा सिक्योरिटी के लिए इन मॉडल्स को ऑन-प्रिमाइसेस होस्ट करने से लेकर ख़ास डेटासेट्स पर उन्हें फ़ाइन-ट्यूनिंग करने तक शामिल है. हम इन बेहतरीन open models को उपलब्ध कराने के लिए बेहद उत्साहित हैं, ताकि—व्यक्तिगत डेवलपर्स से लेकर बड़े एंटरप्राइसेज़ और सरकारों तक—सभी अपने खुद के इंफ़्रास्ट्रक्चर पर AI को रन और कस्टमाइज़ कर सकें. हमारे API में उपलब्ध मॉडल्स के साथ, डेवलपर्स AI वर्कफ़्लोज़ में मदद करने के लिए ज़रूरी परफ़ॉर्मेंस, खर्चा, और लेटेंसी चुन सकते हैं.
gpt-oss मॉडल्स को हमारी सबसे एडवांस्ड प्री-ट्रेनिंग और पोस्ट-ट्रेनिंग टेक्निक्स का इस्तेमाल करके ट्रेन किया गया, जिसमें कई डिप्लॉयमेंट एन्वायर्नमेंट्स में रीज़निंग, एफ़िशिएंसी, और रियल-वर्ल्ड में इस्तेमाल पर फ़ोकस किया गया. जबकि हमने Whisper और CLIP सहित दूसरे मॉडल्स को खुले तौर पर उपलब्ध कराया है, gpt-oss मॉडल्स GPT‑2 [1] के बाद से हमारे पहले ओपन-वेट लैंग्वेज मॉडल्स हैं.
हरेक मॉडल एक ट्रांसफ़ॉर्मर है जो इनपुट को प्रोसेस करने के लिए ज़रूरी एक्टिव पैरामीटर्स की संख्या को कम करने के लिए मिक्सचर-ऑफ़-एक्सपर्ट्स (MoE[2]) का फ़ायदा उठाता है. gpt-oss-120b प्रति टोकन 5.1B पैरामीटर्स को एक्टिवेट करता है, जबकि gpt-oss-20b 3.6B को एक्टिवेट करता है. मॉडल्स में क्रमशः 117b और 21b कुल पैरामीटर्स हैं. मॉडल्स GPT‑3[3] के समान बारी-बारी से घने और लोकल तरीके से बैंडेड अटेंशन के पैटर्न्स का इस्तेमाल करते हैं. इन्फ़रेंस और मेमोरी की एफ़िशिएंसी के लिए, मॉडल्स 8 की ग्रुप साइज़ के साथ, ग्रुप्ड मल्टी-क्वेरी अटेंशन का भी इस्तेमाल करते हैं. हम पोज़ीशनल एन्कोडिंग के लिए रोटरी पोज़ीशनल एम्बेडिंग (RoPE[4]) का इस्तेमाल करते हैं, और नेटिव तरीके से 128k तक की कॉन्टेक्स्ट लेंग्थ को सपोर्ट करते हैं.
मॉडल | लेयर्स | कुल पैरामीटर्स | प्रति टोकन एक्टिव पैरामीटर्स | कुल एक्सपर्ट्स | प्रति टोकन एक्टिव एक्सपर्ट्स | कॉन्टेक्स्ट लेंग्थ |
gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
हमने हाई-क्वालिटी वाले, ज़्यादातर अंग्रेज़ी, टेक्स्ट-ओनली वाले डेटासेट पर मॉडल्स को ट्रेन किया, जिसमें STEM, कोडिंग, और जनरल नॉलेज पर फ़ोकस किया गया. हमने OpenAI o4-mini और GPT‑4o के लिए इस्तेमाल किए जाने वाले हमारे टोकनाइज़र के सुपरसेट का इस्तेमाल करके डेटा को टोकनाइज़ किया: 'o200k_harmony', जिसे हम आज ओपन-सोर्सिंग भी कर रहे हैं.
हमारे मॉडल्स के आर्किटेक्चर और ट्रेनिंग के बारे में और ज़्यादा जानकारी के लिए, मॉडल कार्ड पढ़ें.
मॉडल्स को o4-mini के लिए इस्तेमाल किया गया एक ऐसे ही प्रोसेस का इस्तेमाल करके पोस्ट-ट्रेन किया गया था, जिसमें एक सुपरवाइज़्ड फ़ाइन-ट्यूनिंग स्टेज और एक हाई-कंप्यूट RL स्टेज शामिल थे. हमारा उद्देश्य मॉडल्स को OpenAIModelSpec(एक नई विंडो में खुलेगा) के साथ अलाइन करना था और जवाब देने से पहले CoT रीज़निंग और टूल के इस्तेमाल को अप्लाई करना सिखाना है. हमारे SoTA मालिकाना हक़ वाले रीज़निंग मॉडल्स के समान टेक्निक्स का इस्तेमाल करके, मॉडल ट्रेनिंग के बाद बेहतरीन कैपेबिलिटीज़ दिखाते हैं.
API में मौजूद OpenAI o-सीरीज़ रीज़निंग मॉडल्स के समान ही, दो ओपन-वेट मॉडल्स तीन रीज़निंग के लेवल्स को सपोर्ट करते हैं—कम, मध्यम और ज़्यादा—जिनमें लेटेंसी बनाम परफ़ॉर्मेंस की अदला-बदली चलती रहती हैं. डेवलपर्स सिस्टम मेसेज में एक वाक्य के साथ आसानी से रीज़निंग का लेवल सेट कर सकते हैं.
हमने दूसरे OpenAI रीज़निंग मॉडल्स जैसे o3, o3‑mini और o4-mini के मुकाबले कोडिंग, कॉम्पिटीशन मैथ, स्वास्थ्य और एजेंटिक टूल के इस्तेमाल में उनकी कैपेबिलिटीज़ को मापने के लिए स्टैंडर्ड अकादमिक बेंचमार्क्स के आधार पर gpt-oss-120b और gpt-oss-20b का इवैल्यूएशन किया.
gpt-oss-120b, OpenAI o3‑mini से बेहतर परफ़ॉर्म करता है और कॉम्पिटीशन कोडिंग (Codeforces), जनरल प्रॉब्लम सॉल्विंग (MMLU और HLE) और टूल कॉलिंग (TauBench) पर OpenAI o4-mini से मैच करता है या उससे भी ज़्यादा बेहतर है. इसके अलावा, ये स्वास्थ्य से जुड़े सवालों (HealthBench) और कॉम्पिटीशन मैथेमैटिक्स (AIME 2024 और 2025) पर o4-मिनी से भी बेहतर परफ़ॉर्म करता है. gpt-oss-20b अपनी छोटी साइज़ के बावजूद, इन समान इवैल्यूएशन्स पर OpenAI o3‑मिनी से मैच करता है या उससे भी ज़्यादा बेहतर है, यहां तक कि कॉम्पिटीशन मैथेमैटिक्स और स्वास्थ्य पर भी इससे बेहतर परफ़ॉर्म करता है.
gpt-oss models किसी मेडिकल प्रोफेशनल का स्थान नहीं लेते और इनका उद्देश्य किसी बीमारी का निदान या इलाज करना नहीं है
उदाहरण रोलआउट्स
gpt-oss-120b एक ब्राउज़िंग टूल का इस्तेमाल करके अप-टू-डेट जानकारी को जल्दी जमा कर सकता है, जिसमें दसों आगे के कॉल्स को एक साथ जोड़ना भी शामिल है.
हमारी हालिया रिसर्च से पता चला है कि रीज़निंग मॉडल्स के CoT को मॉनिटर करने से गलत बिहेवियर का पता लगाने में मदद मिल सकती है, जब तक कि मॉडल को CoT को अलाइन करने के लिए डायरेक्ट सुपरविज़न के साथ ट्रेन न किया गया हो. उद्योग जगत में अन्य लोगों का भी यही(एक नई विंडो में खुलेगा) नज़रिया है. OpenAI o1‑प्रीव्यू लॉन्च करने के बाद से हमारे सिद्धांतों के अनुरूप, हमने किसी भी gpt-oss मॉडल के लिए CoT पर कोई डायरेक्ट सुपरविज़न नहीं रखा. हमारा मानना है कि मॉडल के गलत बेहवियर, धोखाधड़ी और गलत इस्तेमाल को मॉनिटर करने के लिए ये ज़रूरी है. हमारी आशा है कि एक नॉन-सुपरवाइज़्ड चेन ऑफ़ थॉट के साथ एक open model रिलीज़ करने से डेवलपर्स और रिसर्च करने वालों को अपने खुद के CoT मॉनिटरिंग सिस्टम्स पर रिसर्च करने और उन्हें लागू करने का अवसर मिलेगा.
डेवलपर्स को अपने ऐप्लिकेशन्स में यूज़र्स को सीधे CoTs नहीं दिखाना चाहिए. उनमें भ्रामक या हानिकारक कंटेंट हो सकता है, जिसमें ऐसी भाषा भी शामिल हो सकती है जो OpenAI की स्टैंडर्ड सेफ़्टी पॉलिसीयों को रिफ़्लेक्ट नहीं करती है, और इसमें ऐसी जानकारी भी शामिल हो सकती है जिसे मॉडल को स्पष्ट तरीके से फ़ाइनल आउटपुट में शामिल न करने के लिए कहा गया हो.
gpt-oss-120b अपने आउटपुट में सिस्टम के निर्देशों को दृढ़तापूर्वक को फ़ॉलो करता है, लेकिन अक्सर अपने CoT में निर्देशों का साफ़ तरीके से उल्लंघन करता है.
gpt-oss मॉडल्स, सेफ़्टी ट्रेनिंग के लिए हमारे बेहतरीन अप्रोच का फ़ायदा उठाते हैं. प्री-ट्रेनिंग के दौरान, हमने केमिकल, बायोलॉजिकल, रेडियोलॉजिकल, और न्युक्लियर (CBRN) से जुड़े कुछ हानिकारक डेटा को फ़िल्टर किया. ट्रेनिंग के बाद, हमने मॉडल को असुरक्षित प्रॉम्प्ट्स को नामंज़ूर करने और प्रॉम्प्ट इंजेक्न्स के खिलाफ़ बचाव करना सिखाने के लिए जानबूझकर किए गए अलाइनमेंट और इंस्ट्रक्शन हायरार्की(एक नई विंडो में खुलेगा) का इस्तेमाल किया.
एक बार जब ओपन-वेट मॉडल के रिलीज़ हो जाएगा, तो शायद एड्वर्सरीज़ खराब उद्देश्यों के लिए मॉडल में फ़ेरबदल कर सकते हैं. हमने स्पेशलाइज़्ड बायोलॉजी और साइबर सिक्योरिटी डेटा पर मॉडल को रिफ़ाइन करके इन रिस्क का डायरेक्ट असेसमेंट किया, और हरेक डोमेन के लिए एक डोमेन-स्पेसिफ़िक नॉन-रेफ्यूज़िंग वर्ज़न तैयार किया, जैसा कि एक अटैकर कर सकता है. इसके बाद हमने इन मॉडलों की क्षमता स्तर का मूल्यांकन आंतरिक और बाहरी टेस्टिंग के माध्यम से किया। यह टेस्टिंग, जैसा कि हमारे साथ दिए गए सेफ़्टी पेपर में विस्तार से बताया गया है, इस बात की पुष्टि करती है कि OpenAI के अग्रणी ट्रेनिंग स्टैक का उपयोग करके मज़बूत फाइन-ट्यूनिंग के बावजूद, इन models को दुर्भावनापूर्ण तरीके से फाइन-ट्यून करने पर भी वे हमारे प्रिपेयरडनेस फ्रेमवर्क के अनुसार उच्च क्षमता स्तर तक नहीं पहुँच पाए। इस खराब फ़ाइन-ट्यूनिंग मेथडोलॉजी का रिव्यु तीन इंडिपेंडेंट एक्सपर्ट ग्रुप्स द्वारा किया गया, जिन्होंने ट्रेनिंग प्रोसेस और इवैल्यूएशन्स में सुधार करने की सिफ़ारिशें कीं, जिनमें से कई को हमने अपनाया. हमने मॉडल कार्ड में इन सुझावों के बारे में डिटेल में बताया है. ये प्रोसेसेस open model की सुरक्षा के लिए एक सार्थक प्रगति का प्रतीक हैं. इन रिज़ल्ट्स ने gpt-oss मॉडल को रिलीज़ करने के हमारे फ़ैसले को कन्फ़र्म किया. हमें उम्मीद है कि ये मॉडल्स पूरी इंडस्ट्री में सेफ़्टी ट्रेनिंग और अलाइनमेंट रिसर्च को तेज़ करने में मददगार होंगे.
एक सुरक्षित ओपन सोर्स इकोसिस्टम में योगदान देने के लिए, हम दुनिया भर के रिसर्चर्स, डेवलपर्स, और उत्साही लोगों को नए सुरक्षा मुद्दों की पहचान करने में मदद करने के लिए रेड टीमिंग चैलेंज(एक नई विंडो में खुलेगा) की मेज़बानी कर रहे हैं. इस चैलेंज में 500,000 डॉलर की पुरस्कार राशि है, जो OpenAI और दूसरी लीडिंग लैब्स के एक्सपर्ट जजों के पैनल द्वारा रिव्यु के आधार पर दी जाएगी. चैलेंज के आखिर में, हम एक रिपोर्ट पब्लिश करेंगे और वेलिडेट किए हुए निष्कर्षों के आधार पर इवैल्यूएशन डेटा सेट को ओपन-सोर्स करेंगे, ताकि कम्युनिटी के बड़े हिस्से को तुरंत फ़ायदे मिल सकें. और ज़्यादा जानें और यहां(एक नई विंडो में खुलेगा) हिस्सा बनें.
gpt-oss-120b और gpt-oss-20b दोनों के लिए भार Hugging Face पर डाउनलोड के लिए स्वतंत्र तौर पर उपलब्ध हैं और MXFP4 में नेटिव तरीके से क्वांटाइज्ड हैं. इससे gpt-oss-120B मॉडल को 80GB मेमोरी के अंदर रन करने में मदद मिलती है, जबकि gpt-oss-20b को सिर्फ़ 16GB की ज़रुरत होती है.
मॉडल्स को हमारे हार्मनी प्रॉम्प्ट फ़ॉर्मेट(एक नई विंडो में खुलेगा) पर पोस्ट-ट्रेनिंग दी गई है, और हम अपनाए जाने को आसान बनाने के लिए Python और Rust दोनों में हार्मनी रेंडरर(एक नई विंडो में खुलेगा) को ओपन-सोर्स कर रहे हैं. हम मॉडल के लिए एग्ज़ाम्पल टूल्स के एक कलेक्शन के साथ-साथ PyTorch और Apple के मेटल प्लैटफ़ॉर्म पर इन्फ़रेंस रन करने के लिए रेफ़रेंस टूल्स भी रिलीज़ कर रहे हैं.
हमने इन मॉडल्स को कहीं भी रन करने के लिए फ़्लेक्सिबल और आसान बनाया है—लोकल तौर पर, डिवाइस पर, या थर्ड-पार्टी के इन्फ़रेंस प्रोवाइडर्स के ज़रिये. इसे सपोर्ट करने के लिए, हमने लॉन्च से पहले Hugging Face, Azure, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare और OpenRouter जैसे लीडिंग डिप्लॉयमेंट प्लेटफ़ॉर्म्स के साथ पार्टनरशिप की, ताकि मॉडल्स डेवलपर्स के लिए बड़े पैमाने पर एक्सेस किए जा सकें. हार्डवेयर साइड पर, हमने अलग-अलग सिस्टम्स में ऑप्टिमाइज़्ड परफ़ॉर्मेंस पक्का करने के लिए NVIDIA, AMD, Cerebras और Groq सहित इंडस्ट्री के लीडर्स के साथ काम किया.
आज की रिलीज के हिस्से के तौर पर, Microsoft, Windows डिवाइसेस के लिए gpt-oss-20b मॉडल के GPU-ऑप्टिमाइज़्ड वर्ज़न भी ला रहा है. ONNX Runtime की पेशकश, ये मॉडल्स लोकल इन्फ़रेंस को सपोर्ट करते हैं और Foundry Local और VS कोड के लिए AI टूलकिट के ज़रिये उपलब्ध हैं, जिससे Windows डेवलपर्स के लिए open models के साथ बनाना आसान हो जाता है.
उन डेवलपर्स के लिए जो पूरी तरह से कस्टमाइज़ेबल मॉडल्स चाहते हैं, जिन्हें वे अपने खुद के एन्वायर्नमेंट्स में फ़ाइन-ट्यून और डिप्लॉय कर सकते हैं, gpt-oss एक बढ़िया विकल्प है. जो लोग मल्टीमोडल सपोर्ट, बिल्ट-इन टूल्स और हमारे प्लैटफ़ॉर्म के साथ सीमलेस इंटीग्रेशन चाहते हैं, उनके लिए हमारे API प्लैटफ़ॉर्म के ज़रिये उपलब्ध मॉडल्स सबसे बढ़िया विकल्प हैं. हम डेवलपर फ़ीडबैक को ध्यान से सुनते आ रहे हैं और आगे भी gpt-oss के लिए API सपोर्ट पर विचार कर सकते हैं.
अगर आप मॉडल्स को आज़माना चाहते हैं, तो हमारे open model प्लेग्राउंड(एक नई विंडो में खुलेगा) पर जाएं. अलग-अलग इकोसिस्टम प्रोवाइडर्स का इस्तेमाल करके मॉडल्स का इस्तेमाल कैसे करें या मॉडल्स को कैसे फ़ाइन-ट्यून करें, इसके बारे में और ज़्यादा जानकारी के लिए, हमारी गाइड्स देखें(एक नई विंडो में खुलेगा).
gpt-oss-120b और gpt-oss-20b को रिलीज़ करना ओपन-वेट मॉडल्स के लिए आगे उठाया गया एक ज़रूरी कदम है. अपनी साइज़ के अनुसार, ये मॉडल रीज़निंग कैपेबिलिटीज़ और सुरक्षा दोनों में सार्थक प्रगति प्रदान करते हैं. Open models हमारे hosted models को पूरक बनाते हैं, जिससे डेवलपर्स को अधिक टूल्स का दायरा मिलता है ताकि वे अग्रणी रिसर्च को तेज़ कर सकें, नवाचार को बढ़ावा दें और विभिन्न उपयोग मामलों में सुरक्षित व अधिक पारदर्शी AI development को सक्षम बना सकें।
ये open models उभरते बाज़ारों, रिसर्च-बाधित सेक्टर्सर और छोटे संगठनों के लिए बाधाओं को भी कम करते हैं, जिनके पास मालिकाना हक़ वाले मॉडल्स को एडॉप्ट करने के लिए बजट या फ़्लेक्सिबिलिटी की कमी हो सकती है. अपने हाथों में पॉवरफ़ुल, एक्सेस किए जाने लायक टूल्स के साथ, दुनिया भर के लोग अपने और दूसरों के लिए नए मौके बना सकते हैं, इनोवेट कर सकते हैं, और नए अवसर पैदा कर सकते हैं. अमेरिका में बनाए गए इन कैपेबल ओपन-वेट मॉडल्स के लिए बड़े पैमाने पर एक्सेस से डेमोक्रैटिक AI रेल्स को एक्स्पैंड करने में मदद मिलती है.
एक बढ़िया open model इकोसिस्टम, AI को सभी के लिए बड़े पैमाने पर एक्सेस किए जाने लायक और फ़ायदेमंद बनाने में मदद करने का एक डायमेंशन है. हम डेवलपर्स और रिसर्चर्स को इन मॉडल्स को एक्सपेरिमेंट करने, कोलैबोरेट करने और जो मुमकिन है, उसकी सीमाओं को आगे बढ़ाने के लिए इन्वाईट करते हैं. हम देखना चाहते हैं कि आप क्या बनाते हैं.
लेखक
साइटेशन्स
कॉन्ट्रीब्यूटर्स
Zoran Martinovic, Zhuohan Li, Zhiqing Sun, Zach Johnson, Yu Yang, Yu Bai, Yang Song, Xin Wang, Wenting Zhan, Volodymyr Kyrylov, Vlad Fomenko, Tyler Bertao, Tong Mu, Timur Garipov, Tarun Gogineni, Suvansh Sanjeev, Steve Mostovoy, Song Mei, Shengjia Zhao, Sebastien Bubeck, Scott McKinney, Scott Lessans, Sandhini Agarwal, Sam Toizer, Sam Altman, Saachi Jain, Romain Huet, Rahul K. Arora, Philippe Tillet, Olivia Watkins, Nivedita Brett, Nikhil Vyas, Miles Wang, Michihiro Yasunaga, Michelle Pokrass, Mia Glaese, Max Schwarzer, Mark Chen, Mario Lezcano-Casado, Marat Dukhan, Lukas Gross, Ludovic Peran, Ludovic Peran, Lindsay McCallum, Lin Yang, Lily (Xiaoxuan) Liu, Leher Pathak, Lama Ahmad, Kristian Georgiev, Kristen Ying, Kimmy Richardson, Kevin Whinnery, Kevin Weil, Kevin Lu, Kevin Fives, Kendal Simon, Katia Gil Guzman, Karan Singhal, Karan Singhal, Kai Chen, Josh McGrath, Jordan Liss, Jongsoo Park, John Hallman, Johannes Heidecke, Jiancheng Liu, Ji Lin, Jason Kwon, Jason Ai, James Park Lennon, Jakub Pachocki, Jacob Huh, Jackie Hehir, Irina Kofman, Huida Qiu, Hongyu Ren, Harshit Sikchi, Hannah Wong, Haitang Hu, Haitang Hu, Haiming Bao, Hadi Salman, Guillaume Leclerc, Greg Brockman, Gideon Myles, Giambattista Parascandolo, Gaby Raila, Foivos Tsimpourlas, Filippo Raso, Eugene Brevdo, Eric Wallace, Enoch Cheung, Elizabeth Proehl, Elaine Ya Le, Edwin Arbus, Eddie Zhang, Dominik Kundel, Dmitry Pimenov, David Robinson, Dane Stuckey, Dana Palmie, Dan Cook, Cyril Zhang, Chris Lu, Chris Koch, Che Chang, Cedric Whitney, Casey Dvorak, Carolina Paz, Brian Zhang, Bowen Baker, Bob Rotsted, Boaz Barak, Ashley Pantuliano, Andy Applebaum, Amy Wendling, Ally Bennett, Alexander Neitz, Alex Paino, Alex Nichol, Alec Helyar, Aidan McLaughlin, Aidan Clark और Adam Goucher


