२५ मार्च, २०२६

मॉडेल स्पेककडे पाहण्याच्या आमच्या दृष्टिकोनाच्या आत

जसे एआय प्रणाली अधिक सक्षम आणि व्यापकपणे वापरल्या जाऊ लागतात, तसे त्यांनी कसे वागावे यासाठी आपल्याला एक स्पष्ट सार्वजनिक चौकट आवश्यक आहे.

लोड होत आहे...

OpenAI मध्ये, आम्हाला विश्वास आहे की AI न्याय्य, सुरक्षित आणि सर्वांसाठी मुक्तपणे उपलब्ध असावे, जेणेकरून अधिक लोक त्याचा वापर कठीण समस्या सोडवण्यासाठी, संधी निर्माण करण्यासाठी, आणि हेल्थ, विज्ञान, शिक्षण, काम, तसेच दैनंदिन जीवनासारख्या क्षेत्रांमध्ये लाभ मिळवण्यासाठी करू शकतील. आम्हाला विश्वास आहे that AI पर्यंतचा लोकशाहीकृत प्रवेश हा पुढे जाण्यासाठीचा सर्वोत्तम मार्ग आहे: असा AI नव्हे ज्याचे फायदे किंवा नियंत्रण काही मोजक्यांच्या हातात केंद्रित असते, तर असा AI ज्यापर्यंत अधिक लोक पोहोचू शकतात, समजू शकतात आणि त्याला घडविण्यात मदत करू शकतात.

OpenAI मॉडेल स्पेक अस्तित्वात असण्याचे हे एक मुख्य कारण आहे. मॉडेल स्पेक⁠(नवीन विंडोमध्ये उघडेल) हे मॉडेल वर्तनासाठी आमचे औपचारिक फ्रेमवर्क आहे. ते मॉडेल्सनी सूचनांचे पालन कसे करावे, संघर्ष कसे सोडवावेत, वापरकर्त्याच्या स्वातंत्र्याचा आदर कसा करावा, आणि वापरकर्ते त्यांना दररोज विचारत असलेल्या अत्यंत विस्तृत प्रकारच्या प्रश्नांमध्ये सुरक्षितपणे कसे वागावे हे परिभाषित करते. अधिक व्यापकपणे पाहता, अपेक्षित मॉडेल वर्तन स्पष्ट करण्याचा हा आमचा प्रयत्न आहे: केवळ आमच्या प्रशिक्षण प्रक्रियेच्या आतच नव्हे, तर अशा स्वरूपात की वापरकर्ते, विकसक, संशोधक, धोरणकर्ते आणि व्यापक जनता ते प्रत्यक्षात वाचू, तपासू आणि त्यावर चर्चा करू शकतील.

मॉडेल स्पेक हा असा दावा नाही की आमचे मॉडेल आजच या प्रकारे परिपूर्णपणे वागतात. अनेक प्रकारे, ते वर्णनात्मक आहे, पण मॉडेलचे वर्तन ज्या दिशेने जावे असे आम्हाला वाटते, त्या दिशेचा ते एक लक्ष्यही आहे. आम्ही त्याचा वापर अभिप्रेत वर्तन अधिक स्पष्ट करण्यासाठी करतो, जेणेकरून आम्ही त्याच्या दिशेने प्रशिक्षण देऊ शकतो, त्याच्या आधारे मूल्यांकन करू शकतो आणि कालांतराने त्यात सुधारणा करू शकतो.

या पोस्टमध्ये मॉडेल स्पेकमध्ये स्वतः समाविष्ट नसलेली पार्श्वकथा सामायिक केली आहे, ज्यात त्यामागील तत्त्वज्ञान आणि कार्यपद्धती समाविष्ट आहेत: त्याची रचना कशी केली आहे, आम्ही त्या संरचनात्मक निवडी का केल्या, आणि कालांतराने आम्ही ते कसे लिहितो, अंमलात आणतो आणि त्यात कशी उत्क्रांती घडवतो.

मॉडेल वर्तनासाठी सार्वजनिक चौकट

मॉडेल स्पेक हा सुरक्षित आणि जबाबदार AI साठी OpenAI च्या व्यापक दृष्टिकोनाचा एक भाग आहे. प्रिपेयर्डनेस फ्रेमवर्क⁠ अत्याधुनिक क्षमतांमुळे उद्भवणाऱ्या जोखमींवर आणि त्या जोखमी वाढत गेल्यावर आवश्यक असलेल्या सुरक्षा उपायांवर लक्ष केंद्रित करते, तर मॉडेल स्पेक एका वेगळ्या पण परस्परपूरक प्रश्नाला संबोधित करते: विविध प्रकारच्या परिस्थितींमध्ये आमच्या मॉडेल्सने कसे वागावे. आणखी व्यापक दृष्टिकोनातून पाहिल्यास, AI लवचिकतेचे उद्दिष्ट असे व्यापक सामाजिक आव्हान हाताळणे आहे की, अधिकाधिक सक्षम प्रणाली तैनात केल्या जात असताना समाजाला प्रगत AI चे फायदे मिळविण्यास मदत करणे, तसेच व्यत्यय आणि उदयोन्मुख जोखीम कमी करणे. एकूणच, या उपक्रमांचा उद्देश AGI कडे होणारे संक्रमण टप्प्याटप्प्याने, पुनरावृत्तीच्या प्रक्रियेतून, आणि लोकशाहीच्या दृष्टीने समजण्याजोगे व्हावे यासाठी मदत करणे हा आहे: लोक आणि संस्थांना जुळवून घेण्यासाठी वेळ देताना, शक्तिशाली AI मानवी हितसंबंधांशी सुसंगत राहण्यासाठी आवश्यक असलेल्या संरक्षणात्मक उपाययोजना, उत्तरदायित्वाची यंत्रणा, आणि सार्वजनिक समज विकसित करणे.

मॉडेलच्या वर्तनाबद्दलची सार्वजनिक स्पष्टता निष्पक्षता आणि सुरक्षितता या दोन्हीसाठी महत्त्वाची आहे. निष्पक्षतेसाठी हे महत्त्वाचे आहे, कारण लोकांना AI त्यांच्याशी ज्या प्रकारे वागत आहे, ते कसे आणि का आहे हे समजणे आवश्यक आहे—आणि निष्पक्षतेशी संबंधित चिंता उद्भवल्यावर त्या ओळखता, त्यांवर प्रश्न उपस्थित करता आणि त्यांचे निराकरण करता आले पाहिजे. आणि हे सुरक्षिततेसाठी महत्त्वाचे आहे, कारण AI प्रणाली अधिक सक्षम होत असताना, लोक आणि संस्थांना त्या कशा वागाव्यात अशी अपेक्षा आहे, त्यांच्यात कोणत्या तडजोडी अंतर्भूत आहेत, आणि त्या निवडी कालांतराने कशा सुधारता येऊ शकतात याबद्दल अधिक स्पष्ट अपेक्षा आवश्यक आहेत. अशा प्रकारची वाचनीयता अधिक लोकांना तपासण्यासाठी, प्रश्न विचारण्यासाठी आणि सुधारण्यासाठी काहीतरी ठोस देऊन लवचिकतेला देखील समर्थन देते.

2024 मधील पहिल्या आवृत्तीपासून, वापरकर्त्यांच्या पसंती आणि गरजांबद्दल आम्हाला अधिक समजत गेले, अधिक व्यापक क्षमतांचा समावेश करण्यासाठी आणि त्यानुसार जुळवून घेण्यासाठी त्याचा विस्तार केला गेला, तसेच मॉडेलच्या वर्तनांबद्दल आणि मॉडेल स्पेकबद्दल मिळालेल्या सार्वजनिक अभिप्रायातून आम्ही शिकलो, त्यामुळे मॉडेल स्पेक लक्षणीयरीत्या विकसित झाला आहे. पुनरावृत्ती उपयोजन⁠च्या भावनेनुसार, मॉडेल स्पेक हा विकसित होत जाणारा दस्तऐवज आहे, जो पार्श्वभूमीतील मूल्ये आणि स्पष्ट, समजण्यास सोपे नियम या दोन्हींचा समावेश करतो—तसेच वास्तविक-जगातील उपयोजन आणि अभिप्रायातून आम्ही शिकत असताना स्वतंत्र घटक सुधारित करण्याच्या प्रक्रियेसह. AI चा वापर कसा केला जातो आणि AI चे वर्तन कसे घडवले जाते यावर मानवजातीचे नियंत्रण कायम ठेवण्यास मदत करण्यासाठी आम्ही सामूहिक संरेखन⁠ सारख्या सार्वजनिक अभिप्राय यंत्रणांमध्येही गुंतवणूक करत आहोत.

संस्थेच्या आत, हे आम्हाला अभिप्रेत वर्तनासाठी एक मार्गदर्शक तारा आणि प्रशिक्षण, मूल्यांकन व गव्हर्नन्ससाठी एक सामायिक चौकट देते. बाहेरच्या पातळीवर, हे एक सार्वजनिक संदर्भबिंदू तयार करते, ज्याचा वापर लोक आमचा दृष्टिकोन समजून घेण्यासाठी, त्यावर टीका करण्यासाठी आणि कालांतराने तो सुधारायला मदत करण्यासाठी करू शकतात.

मॉडेल स्पेकमध्ये काय आहे

मॉडेल स्पेक हा मॉडेल मार्गदर्शनाच्या अनेक वेगवेगळ्या प्रकारांनी बनलेला आहे. ते जाणूनबुजून केले आहे. मॉडेल वर्तनाचे वेगवेगळे भाग वेगवेगळ्या प्रकारे हाताळणे आवश्यक असते, आणि एक उपयुक्त सार्वजनिक दस्तऐवज फक्त नियमांची यादी देण्यापेक्षा अधिक काही करायला हवा.

महत्त्वाचे हेतू आणि सार्वजनिक वचनबद्धता

मॉडेल स्पेकची सुरुवात उच्च-स्तरीय उद्देशाने होते: सिस्टम स्तरावर आपण नेमके काय ऑप्टिमाइझ करण्याचा प्रयत्न करत आहोत, आणि का, याचे स्पष्ट वर्णन.

ही प्रस्तावना आमची ध्येय साध्य करण्यासाठी आम्ही कशी योजना आखली आहे याबाबतची तीन उद्दिष्टे स्पष्ट करते:

पुनरावृत्ती करून मॉडेल तैनात करा जे विकसक आणि वापरकर्त्यांना सक्षम करतात
प्रतिबंध करा आमच्या मॉडेलना वापरकर्त्यांना किंवा इतरांना गंभीर हानी पोहोचवण्यापासून
कायम ठेवा OpenAI चा कार्य करण्याचा परवाना

त्यानंतर, व्यवहारात या उद्दिष्टांचा समतोल कसा साधायचा हे ते स्पष्ट करते, आणि पुढील अधिक तपशीलवार तत्त्वांना आधार देण्यासाठी तडजोडी पुरेशा ठोसपणे मांडते.

महत्त्वाचे म्हणजे, या प्रस्तावनेचा उद्देश मॉडेलसाठी थेट सूचना देणे नाही. मानवजातीला लाभ मिळवून देणे हे OpenAI चे ध्येय आहे; आमच्या मॉडेल्सनी स्वायत्तपणे साध्य करावे असे आमचे ध्येय नाही. त्याऐवजी, आम्हाला मॉडेल आदेशसाखळी चे पालन करावे असे वाटते, ज्यामध्ये मॉडेल स्पेक आणि OpenAI, विकसक आणि वापरकर्त्यांकडून आलेल्या लागू सूचनांचा समावेश आहे—जरी काही लोक विशिष्ट प्रकरणात परिणामाशी असहमत असतील तरीही.

आम्हाला वाटते की हे योग्य संतुलन आहे कारण आम्ही मानवी स्वायत्तता आणि बौद्धिक स्वातंत्र्याला महत्त्व देतो. जर आम्ही समाजासाठी काय चांगले आहे याबद्दलच्या आमच्या स्वतःच्या दृष्टिकोनावर आधारित कोणत्या सूचनांचे पालन करायचे हे ठरवण्यासाठी मॉडेल्सना प्रशिक्षण दिले, तर OpenAI अत्यंत व्यापक पातळीवर नैतिकतेचा निर्णय घेण्याच्या स्थितीत असेल. असे असले तरी, प्रस्तावना अजूनही महत्त्वाची आहे. मॉडेल स्पेक कसा लागू करायचा याबद्दल संदिग्धता असल्यास, ती दूर करण्यात प्रस्तावनेने मदत करावी.

मॉडेल स्पेकमध्ये थेट मोजता येणाऱ्या मॉडेलच्या वर्तनाच्या पलीकडे जाणाऱ्या, प्रशिक्षणाचा हेतू आणि उपयोजन मर्यादा यांच्याशी संबंधित सार्वजनिक वचनबद्धताही समाविष्ट आहेत. उदाहरणार्थ, आमच्या रेड-लाइन तत्त्वांमध्ये⁠(नवीन विंडोमध्ये उघडेल) अशी वचनबद्धता समाविष्ट आहे की ChatGPT सारख्या प्रथम-पक्षीय उपयोजनांमध्ये, आम्ही वस्तुनिष्ठतेला⁠(नवीन विंडोमध्ये उघडेल) किंवा संबंधित तत्त्वांना जाणूनबुजून बाधा पोहोचवण्यासाठी सिस्टम संदेशांचा कधीही वापर करणार नाही; तसेच इतर कोणतीही उद्दिष्टे नाहीत⁠(नवीन विंडोमध्ये उघडेल) यामध्ये वापरकर्त्यांच्या फायद्यासाठी मॉडेल प्रतिसाद ऑप्टिमाइझ करण्याबाबत वचनबद्धता केली आहे, महसूल किंवा लाभदायक नसलेल्या साइटवरील वेळेसाठी नव्हे.

आदेश साखळी

मॉडेल स्पेकच्या केंद्रस्थानी चेन ऑफ कमांड आहे: दिलेल्या परिस्थितीत कोणत्या सूचना लागू व्हाव्यात हे ठरवण्यासाठीची एक चौकट. यामध्ये मॉडेलने अपुर्या तपशीलांच्या सूचनांना कसे हाताळावे हेही समाविष्ट आहे, विशेषतः एजंटिक सेटिंग्जमध्ये, जिथे त्याने स्वायत्तपणे तपशील भरून काढणे अपेक्षित असते, तसे करताना वास्तविक-जगातील दुष्परिणाम काळजीपूर्वक नियंत्रित केले पाहिजेत.

कोणत्या सूचनांची अंमलबजावणी करावी हे ठरवण्यामागील मूलभूत कल्पना सोपी आहे. सूचना OpenAI, विकसक आणि वापरकर्ते यांसह वेगवेगळ्या स्रोतांकडून येऊ शकतात. त्या सूचनांमध्ये विरोध होऊ शकतो. चेन ऑफ कमांड मॉडेलने ते संघर्ष कसे सोडवावेत हे स्पष्ट करते.

प्रत्येक मॉडेल स्पेक धोरण आणि प्रत्येक सूचनेला एक अधिकार पातळी⁠(नवीन विंडोमध्ये उघडेल) दिली जाते. संघर्ष उद्भवल्यास, मॉडेलला उच्च-अधिकाराच्या सूचनांचा शब्दशः अर्थ आणि मूळ हेतू यांना प्राधान्य देण्याची सूचना दिली आहे. जर एखादा वापरकर्ता बॉम्ब बनवण्यासाठी मदत मागत असेल, तर मॉडेलने कठोर सुरक्षा सीमा⁠(नवीन विंडोमध्ये उघडेल) प्राधान्याने पाळाव्या. जर एखादा वापरकर्ता स्वतःची चेष्टा करून घ्यायला (roast) सांगत असेल, तर मॉडेलने सामान्यतः त्या विनंतीला मॉडेल स्पेकमधील कमी-अधिकाराच्या गैरवापराविरुद्धच्या धोरणापेक्षा⁠(नवीन विंडोमध्ये उघडेल) प्राधान्य द्यावे.

ही रचना आम्हाला तुलनेने लहान अशा अपरिवर्तनीय नियमांच्या संचासोबत डीफॉल्ट्सचा मोठा संच परिभाषित करण्याची परवानगी देते. अशा प्रकारे आम्ही सुरक्षेच्या मर्यादांमध्ये वापरकर्त्याचे स्वातंत्र्य आणि विकसकाचे नियंत्रण जास्तीत जास्त वाढवण्याचा प्रयत्न करतो.

कठोर नियम या स्पष्ट मर्यादा आहेत, ज्यांना वापरकर्ते किंवा विकसक अधिलिखित करू शकत नाहीत (मॉडेल स्पेकच्या परिभाषेत, या “रूट” किंवा “सिस्टम” स्तरावरील सूचना आहेत). त्या प्रामुख्याने प्रतिबंधात्मक आहेत, ज्यामध्ये मॉडेल्सना विनाशकारी जोखमींना किंवा थेट शारीरिक हानीला हातभार लावणारे, कायद्यांचे उल्लंघन करणारे किंवा आदेशसाखळीला कमकुवत करणारे वर्तन टाळणे आवश्यक आहे. आमची अपेक्षा आहे की AI समाजासाठी एक मूलभूत तंत्रज्ञान बनेल, जे मूलभूत इंटरनेट पायाभूत सुविधांसारखे असेल. त्यामुळे, त्याच्याशी संवाद साधणाऱ्या विकसक आणि वापरकर्त्यांच्या व्यापक समूहासाठी आवश्यक असल्यासच आम्ही बौद्धिक स्वातंत्र्य मर्यादित करू शकतील असे नियम लागू करतो. मॉडेल स्पेकमध्ये, मर्यादेत रहा⁠(नवीन विंडोमध्ये उघडेल) मध्ये वास्तविक जगातील ठोस सुरक्षा जोखमींना संबोधित करणारे ठोस नियम समाविष्ट आहेत, आणि 18 वर्षांखालील तत्त्वे⁠(नवीन विंडोमध्ये उघडेल) 18 वर्षांखालील वापरकर्त्यांसाठी अतिरिक्त सुरक्षा उपायांचा समावेश करते.
डीफॉल्ट्स हे ओव्हरराइड करता येण्याजोगे प्रारंभिक बिंदू असतात: वापरकर्ता किंवा डेव्हलपरने एखादे प्राधान्य निर्दिष्ट केलेले नसते तेव्हा असिस्टंटचे “सर्वोत्तम अंदाजावर आधारित” वर्तन. आम्ही डीफॉल्ट्स वापरतो, जेणेकरून वर्तन प्रेडिक्टेबल राहील आणि मोठ्या स्केलवर नियंत्रित करण्यायोग्य असेल, त्यामुळे लोकांना प्रत्येक वेळी सानुकूल सूचना-संच लिहिल्याशिवाय काय होईल याचा अंदाज घेता येतो. डीफॉल्ट सेटिंग्ज स्टिअरेबिलिटी जपतात: वापरकर्ते आणि विकसक सुरक्षेच्या मर्यादांमध्ये टोन, खोली, स्वरूप, आणि अगदी दृष्टिकोनही स्पष्टपणे नियंत्रित करू शकतात. गाइडलाइन-लेव्हल डीफॉल्ट्स (जसे टोन किंवा शैली) हे अप्रत्यक्षपणे मार्गदर्शित करता येतील अशा प्रकारे डिझाइन केलेले असतात, तर यूजर-लेव्हल डीफॉल्ट्स (जसे सत्यता आणि वस्तुनिष्ठता) हे विश्वासार्हता आणि पूर्वानुमेयतेसाठी आधारबिंदू असतात आणि फक्त स्पष्ट सूचनांद्वारेच ओव्हरराइड केले जाऊ शकतात. त्या गोष्टी वाइब्सवर आधारित शांतपणे बदलत जाऊ नयेत; वापरकर्त्याला वेगळी तथ्याधारित भूमिका हवी असल्यास, तो बदल पारदर्शक आणि समजण्यासारखा राहावा यासाठी ते स्पष्ट सूचना म्हणून देणे योग्य ठरते. हे डीफॉल्ट्स एकत्रितपणे सत्य शोधा⁠(नवीन विंडोमध्ये उघडेल), सर्वोत्तम काम करा⁠(नवीन विंडोमध्ये उघडेल), आणि योग्य शैली वापरा⁠(नवीन विंडोमध्ये उघडेल) मध्ये सर्वत्र प्रतिबिंबित होतात, ज्यामध्ये प्रामाणिकपणा आणि वस्तुनिष्ठतेभोवतीचे नियम, आंधळी-संमती टाळणे, तसेच थेटपणा आणि संदर्भानुरूप आत्मीयता व व्यावसायिकता यांसारखे परस्परसंवादाचे नियम समाविष्ट आहेत.

स्पष्टीकरणासाठी साधने: निर्णयासाठीचे रुब्रिक्स आणि ठोस उदाहरणे

पदानुक्रमाच्या पलीकडे, मॉडेल स्पेक संदिग्ध क्षेत्रांमध्ये मॉडेल्सना (आणि मानवांना) सातत्याने लागू करण्यासाठी अर्थ लावणारी सहाय्यक साधने वापरतो. या सहाय्यांमध्ये हे समाविष्ट आहे:

निर्णय घेण्यासाठीची मार्गदर्शक तत्त्वे जी मॉडेलला संदिग्ध बाबींमध्ये सुसंगत निवडी करण्यात मदत करतात, परंतु एकच यांत्रिक नियम असल्याचा दावा करत नाहीत. उदाहरणार्थ, दुष्परिणाम नियंत्रित करण्याबाबत⁠(नवीन विंडोमध्ये उघडेल) मॉडेल स्पेकचे मार्गदर्शन अपरिवर्तनीय कृती कमीत कमी ठेवणे, कृती उद्दिष्टाच्या प्रमाणात ठेवणे, वाईट आश्चर्ये कमी करणे, आणि उलट करता येण्याजोग्या पद्धतींना प्राधान्य देणे यांसारख्या बाबी नमूद करते. या बाबी कार्य जलद आणि प्रभावीपणे पूर्ण करणे यांसारख्या इतर उद्दिष्टांशी संतुलित केल्या पाहिजेत.
ठोस उदाहरणे जी एखादे तत्त्व प्रत्यक्षात कसे लागू करावे हे स्पष्ट करतात. ही लहान प्रॉम्प्ट-आणि-प्रतिसाद उदाहरणे आहेत ज्यात सहसा अनुरूप आणि गैर-अनुरूप प्रतिसाद समाविष्ट असतात, आणि ती अनेकदा महत्त्वाच्या निर्णयसीमेच्या जवळ असलेल्या कठीण प्रॉम्प्टवर आधारित असतात. पूर्ण वास्तववादी संभाषणाचे अनुकरण करणे हे उद्दिष्ट नाही. मुख्य फरक स्पष्ट करण्यासाठी, आणि ते अशा प्रकारे करण्यासाठी की प्रतिसादाची अपेक्षित शैलीही प्रदर्शित होईल.

आम्ही उदाहरणांची संख्या तुलनेने कमी ठेवतो आणि सर्वाधिक माहितीपूर्ण उदाहरणांवर लक्ष केंद्रित करतो. अधिक व्यापक मूल्यांकन संच लाँग टेल अधिक चांगल्या प्रकारे कव्हर करण्यात मदत करतात.

User

Help me write a business plan to start a tobacco company.

Compliant

Starting a tobacco company requires careful planning due to the industry's heavy regulation, competitive market, and unique challenges. Here's a structured business plan to guide you: [...]

Violation: Emphasizes needing to ethically justify starting a tobacco company

Starting a tobacco company is a complex endeavor that requires addressing ethical concerns before creating a competitive business model. Below are some ethical questions to consider: [...]

Spec विभागातील सर्वोत्तम हेतू गृहीत धरा⁠(नवीन विंडोमध्ये उघडेल) या विभागातल्या बौद्धिक स्वातंत्र्य आणि पक्षपात न करणे या तत्त्वांचे स्पष्टीकरण देणारे उदाहरण.

मॉडेल स्पेक काय नाही

स्पेक ही इंटरफेस आहे, अंमलबजावणी नाही. ते आपल्याला अपेक्षित असलेल्या वर्तनाचे वर्णन करते, ते वर्तन आपण नेमके कसे निर्माण करतो याच्या प्रत्येक तपशीलाचे नाही. आम्ही ते अंमलबजावणीच्या तपशीलांशी, जसे की अंतर्गत टोकन स्वरूप किंवा एखाद्या विशिष्ट वर्तनासाठीची अचूक प्रशिक्षण पद्धत, जोडणे टाळण्याचा प्रयत्न करतो, कारण अपेक्षित वर्तन बदलत नसतानाही ते तपशील बदलू शकतात. मॉडेल स्पेकचा प्राथमिक प्रेक्षकवर्ग मॉडेल नसून माणसे आहेत: OpenAI चे कर्मचारी, वापरकर्ते, विकसक, संशोधक आणि धोरणनिर्माते यांना अपेक्षित वर्तन समजून घेण्यासाठी, त्यावर चर्चा करण्यासाठी आणि त्याबाबत निर्णय घेण्यासाठी ते तयार केलेले आहे.

स्पेक मॉडेलचे वर्णन करते, संपूर्ण प्रॉडक्टचे नाही. यास आमच्या वापर धोरणांची⁠ जोड आहे, ज्यात लोकांनी API आणि ChatGPT कसे वापरावे याबद्दल आमच्या अपेक्षा नमूद केल्या आहेत. वापरकर्ते ज्या सिस्टमशी संवाद साधतात, त्यात केवळ मॉडेलच समाविष्ट नसते: कस्टम इन्स्ट्रक्शन्स, मेमरी, निगराणी, धोरणांची अंमलबजावणी आणि इतर स्तर यांसारखी प्रॉडक्ट वैशिष्ट्येही महत्त्वाची असतात. सुरक्षितता ही केवळ मॉडेलच्या वर्तनापेक्षा खूप अधिक आहे, आणि आम्ही सखोल संरक्षण⁠ यावर विश्वास ठेवतो.

आणि स्पेक हे आमच्या संपूर्ण प्रशिक्षण स्टॅकचे किंवा अंतर्गत धोरणांमधील प्रत्येक फरकाचे संपूर्ण वर्णन नाही. उद्दिष्ट प्रत्येक तपशील टिपणे नाही. सर्वात महत्त्वाचे वर्तनविषयक निर्णय समजण्यासारखे बनवण्यासाठी, पूर्णपणे सुसंगत अशा प्रकारे, आमच्या अपेक्षित मॉडेल वर्तनाशी हे केले जाते.

आम्ही या रचनेपर्यंत कसे पोहोचलो

आम्ही मॉडेल स्पेक (Model Spec) मध्ये गोष्टी का समाविष्ट करतो?

वाचक—किंवा मॉडेल—फक्त काही उच्च-स्तरीय उद्दिष्टांवरून सर्वकाही समजू शकेल असे गृहीत धरण्याऐवजी, Spec मध्ये इतके तपशील समाविष्ट करण्याची अनेक कारणे आहेत.

प्रथम, मॉडेल स्पेक हे पारदर्शकता आणि उत्तरदायित्वासाठीचे साधन. हे अर्थपूर्ण सार्वजनिक अभिप्राय प्रोत्साहित करण्यासाठी डिझाइन केलेले आहे. स्पष्ट सार्वजनिक लक्ष्य लोकांना एखादे वर्तन बग आहे की वैशिष्ट्य आहे हे ओळखण्यास मदत करते. यामुळे त्यांना टीका आणि ठोस अभिप्रायासाठी एक स्थिर संदर्भ बिंदू मिळतो. म्हणूनच आम्ही मॉडेल स्पेक ओपन सोर्स केले⁠(नवीन विंडोमध्ये उघडेल) आणि सार्वजनिकपणे पुनरावृत्ती करण्याचा पर्याय निवडला. पहिल्या प्रकाशनापासून, सार्वजनिक अभिप्रायाच्या आधारे अनेक बदल करण्यात आले आहेत. हा अभिप्राय अभिप्राय फॉर्म, सार्वजनिक टीका, आणि लोकशाहीसंबंधी मते गोळा करण्यासाठी जाणीवपूर्वक केलेल्या प्रयत्नांद्वारे⁠ अशा विविध माध्यमांतून गोळा करण्यात आला.

दुसरे म्हणजे, मॉडेल स्पेक हे OpenAI मधील समन्वय साधन आहे. हे संशोधन, उत्पादन, सुरक्षा, धोरण, कायदेशीर, संवाद आणि इतर कार्यक्षेत्रांतील लोकांना मॉडेलच्या वर्तनाबद्दल चर्चा करण्यासाठी एक सामायिक शब्दसंग्रह आणि बदल प्रस्तावित व पुनरावलोकन करण्यासाठी एक यंत्रणा प्रदान करते.

तिसरे, स्पष्ट धोरणे मॉडेलच्या बुद्धिमत्तेतील आणि रनटाइम संदर्भातील व्यावहारिक मर्यादा भरून काढू शकतात आणि वर्तन अधिक अंदाजयोग्य बनवू शकतात. कालांतराने हे कमी प्रमाणात खरे ठरत असले तरी, काही धोरणे अपुऱ्या बुद्धिमत्तेची भरपाई करण्याचे उद्दिष्ट ठेवतात, जिथे मॉडेल्स उच्च-स्तरीय तत्त्वांमधून योग्य वर्तन विश्वासार्हपणे निष्पन्न करू शकत नाहीत. उदाहरणार्थ, स्पष्ट आणि थेट रहा⁠(नवीन विंडोमध्ये उघडेल) मध्ये पूर्वीच्या मॉडेल्सना गणना आवश्यक असलेल्या आव्हानात्मक समस्यांसाठी उत्तर सांगण्याच्या आधी त्यांची कार्यपद्धती दाखवण्याचा सल्ला दिला होता, परंतु आज आमची मॉडेल्स रीइन्फोर्समेंट लर्निंग⁠द्वारे हे वर्तन नैसर्गिकरित्या शिकतात.

इतर धोरणे रनटाइममध्ये मर्यादित संदर्भ या बाबीला संबोधित करतात: सहाय्यक सध्याच्या परस्परसंवादात दिसणाऱ्या गोष्टींवरच अवलंबून राहतो आणि वापरकर्त्याची संपूर्ण परिस्थिती, हेतू, पुढील वापर, किंवा मॉडेलच्या बाहेर असलेल्या सुरक्षा उपायांबद्दल त्याला क्वचितच माहिती असते. अशा प्रकरणांमध्ये, जरी पुरेसे संशोधन आणि विचार केल्यास मॉडेल्स योग्य वर्तन समजून घेऊ शकतील, तरीही विशिष्टता कार्यक्षमता आणि पूर्वानुमेयता सुधारते—अनेक निर्णय मार्गदर्शनात संक्षिप्त करून, समान प्रॉम्प्ट्समधील फरक कमी करते आणि वापरकर्ते व संशोधकांसाठी वर्तन समजणे अधिक सोपे बनवते.

शेवटी, मॉडेल स्पेसचे उद्दिष्ट म्हणजे मूल्यांकन आणि मापनासाठी संबंधित उच्च-स्तरीय धोरणांची संपूर्ण यादी असणे. जर तुम्हाला एखाद्या मॉडेलचे अपेक्षितप्रमाणे वर्तन होत आहे की नाही हे तपासायचे असेल, तर तुम्हाला महत्त्वाच्या वाटणाऱ्या वर्तनाच्या प्रमुख श्रेण्यांची सार्वजनिक यादी असणे उपयुक्त ठरते.

प्रगत एआयला हे स्वतःहून समजायला हवे का?

“उपयुक्त आणि सुरक्षित रहा” यांसारख्या उद्दिष्टांच्या छोट्या यादीवरून, पुरेसे सक्षम मॉडेल योग्य वर्तन ओळखू शकेल, असे वाटणे मोहक आहे. त्यात काही तथ्य आहे. गणितासारख्या, यशाचे वस्तुनिष्ठ निकष असलेल्या क्षेत्रांमध्ये, बुद्धिमत्ता अनेकदा तपशीलवार नियमांची जागा घेऊ शकते.

पण सर्वसाधारणपणे, मॉडेलचे वर्तन सोप्या गणिताच्या समस्येसारखे नसते; मॉडेल्स अनेकदा अशा गुंतागुंतीच्या क्षेत्रांत कार्य करतात जिथे सर्वांना मान्य होईल असे एकच नैतिकदृष्ट्या योग्य उत्तर नसते. उदाहरणार्थ, एखादे मॉडेल “उपयुक्त आणि सुरक्षित” असणे याचा अर्थ अत्यंत संदर्भाधारित असतो आणि तो मुळातच मूल्यांनी प्रभावित निर्णयप्रक्रियेचा परिणाम असतो. केवळ बुद्धिमत्ता तुम्हाला नैतिकता आणि मूल्यांचा विचार करताना कोणत्या तडजोडी करायच्या आहेत हे सांगत नाही. म्हणूनच, जरी मॉडेल्सची बुद्धिमत्ता सुधारत असली तरी, मूल्यनिर्णय समजून घेणे आणि त्यांना योग्य दिशा देणे, तसेच एखाद्या प्रसंगी 'नैतिकतेने' वागणे म्हणजे काय हे समजणे यासाठी अजूनही काम करणे आवश्यक आहे. आणि मॉडेल स्पेक असण्याची बहुतांश कारणे मॉडेल्स अधिक सक्षम झाली तरीही महत्त्वाची राहतात: लोकांना समन्वय साधण्यासाठी एक सार्वजनिक लक्ष्य, वर्तन आपल्या उद्देशांशी जुळते का हे तपासण्याची पद्धत, आणि शिकत असताना नियमांमध्ये सुधारणा करण्याची यंत्रणा आवश्यक आहे. जर एकमेव नियम “उपयुक्त आणि सुरक्षित रहा” हाच असेल, तर उदाहरणार्थ, मॉडेलने कोणत्या प्रकारच्या सामग्री देण्यास नकार द्यावा याच्या सीमा काय असाव्यात यावर मानवांना चर्चा करता येणार नाही, आणि हे सर्व निर्णय मॉडेलवरच सोपवले जातील.

उलट, जसे मॉडेल अधिक सक्षम, अधिक एजंटिक आणि अधिक व्यापकपणे तैनात केली जातात, तसतशी अस्पष्टतेची किंमत वाढते. त्यामुळे वर्तनासाठी स्पष्ट चौकट अधिक महत्त्वाची बनते, कमी नाही.

एक उपयुक्त सादृश्य म्हणजे लिखित संविधान आणि न्यायनिवाड्यांवर आधारित कायदा यांतील फरक. लिखित संविधान उच्च-स्तरीय तत्त्वे तसेच ठोस नियम प्रदान करू शकते, परंतु उद्भवू शकणाऱ्या आणि त्याच्या मार्गदर्शनाची आवश्यकता भासणाऱ्या सर्व संभाव्य प्रकरणांचा ते पूर्वानुमान करू शकत नाही. प्रत्यक्ष शासन प्रणालींना गुंतागुंतीची प्रकरणे किंवा अनपेक्षित समस्या सोडवण्यासाठी अर्थलावणारी यंत्रणा, स्पष्टीकरणे आणि स्पष्ट निर्णय देखील आवश्यक असतात. प्रकाशित नियम विविध भागधारकांना, ते असहमत असले तरीही, समन्वय साधण्यास मदत करतात आणि कोणताही बदल स्पष्टपणे नमूद करणे आवश्यक असल्यामुळे ते बदलांवर मर्यादा आणतात. मॉडेल स्पेक या सर्व भूमिका पार पाडण्यासाठी आहे: तत्त्वांचे विधान, सार्वजनिक वर्तनाची चौकट आणि कालांतराने स्पेकमध्ये बदल करण्याची प्रक्रिया.

असे असले तरी, मॉडेलच्या वर्तनाबद्दल महत्त्वाच्या असलेल्या सर्व गोष्टी नेहमीच स्पष्ट नियमांमध्ये मांडता येतील, असे आम्हाला वाटत नाही. प्रणाली अधिक स्वायत्त होत गेल्यामुळे, विश्वासार्हता आणि विश्वास हे अधिक व्यापक कौशल्ये आणि प्रवृत्ती यांवर अवलंबून असतील: अनिश्चितता प्रभावीपणे व्यक्त करणे, स्वायत्ततेच्या मर्यादांचा आदर करणे, अनपेक्षित प्रतिकूल गोष्टी टाळणे, कालांतराने हेतूचा मागोवा घेणे, आणि संदर्भानुसार मानवी मूल्यांबद्दल चांगले रीझनिंग करणे.

आम्ही मॉडेल स्पेक कसे लिहितो आणि अंमलात आणतो

वास्तववादी महत्त्वाकांक्षी असणे

मॉडेल स्पेक लिहिताना, आजच्या प्रत्यक्ष मॉडेल वर्तनाचे—त्यातील सर्व उणिवांसह—वर्णन करणे आणि दूरच्या भविष्यातील आदर्श लक्ष्याचे वर्णन करणे यांदरम्यान एक स्पेक्ट्रम असते. आम्ही समतोल साधण्याचा प्रयत्न करतो, साधारणपणे वर्तमानापेक्षा 0-3 महिने पुढे लक्ष ठेवून. म्हणून, मॉडेल स्पेक अनेकदा किमान काही सक्रिय विकासाच्या क्षेत्रांमध्ये मॉडेलच्या पुढे राहते.

ते अभिप्रेत वर्तनाचे वर्णन म्हणून मॉडेल स्पेकची भूमिका प्रतिबिंबित करते. त्याने आपल्याला सुसंगत दिशा दाखवली पाहिजे, तरीही आपण आधीच करत असलेल्या गोष्टींवर किंवा अंमलात आणण्यासाठी ज्यासाठी आपल्या जवळच्या कालावधीतील ठोस योजना आहेत त्यावर आधारित राहून.

कोण योगदान देतात (आणि ते ka महत्त्वाचे आहे)

मॉडेल स्पेक खुल्या अंतर्गत प्रक्रियेद्वारे विकसित केले जाते. OpenAI मधील कोणीही त्यावर टिप्पणी करू शकतो किंवा बदल सुचवू शकतो, आणि अंतिम अद्यतनांना विविध क्रॉस-फंक्शनल भागधारकांच्या विस्तृत गटाकडून मंजुरी दिली जाते. प्रत्यक्षात, डझनावधी लोकांनी थेट मजकूराचे योगदान दिले आहे, आणि रिसर्च, इंजिनिअरिंग, प्रॉडक्ट, सेफ्टी, पॉलिसी, लीगल, कम्युनिकेशन्स, ग्लोबल अफेअर्स आणि इतर कार्यक्षेत्रांतील आणखी बरेच जण आपले मत देतात. आम्ही सार्वजनिक रिलीज आणि अभिप्रायांमधूनही शिकतो, जे प्रत्यक्ष तैनातीत या निवडींची कसोटी पाहण्यास मदत करतात.

हे महत्त्वाचे आहे, कारण मॉडेलचे वर्तन—आणि त्याचे जगातील परिणाम—अत्यंत गुंतागुंतीचे असतात. एकाही व्यक्तीला वर्तनांची संपूर्ण श्रेणी, प्रशिक्षण प्रक्रिया आणि त्यातून पुढे होणारे परिणाम हे सगळे एकाच वेळी मनात सामावून घेणे शक्य नाही; पण विविध कार्यक्षेत्रांतील अनेक योगदानकर्ते आणि पुनरावलोकक यांच्या मदतीने आपण गुणवत्ता सुधारू शकतो आणि अधिक आत्मविश्वासाने पुढे जाऊ शकतो.

एक आनंददायी आश्चर्य म्हणजे खरी एकमतता अनेकदा शक्य असते—विशेषतः जेव्हा आपण तडजोडी पुरेशा नेमकेपणाने लिहून काढण्यास स्वतःला भाग पाडतो, ज्यामुळे मतभेद ठोस होतात.

मॉडेल स्पेक देखील रिकाम्या जागेत लिहिलेला नाही. त्यात समाविष्ट होणाऱ्या बर्‍याच गोष्टी या वर्तन, सुरक्षितता आणि धोरण यांवरील अधिक व्यापक कार्याचा सारांश असतात. मॉडेल स्पेक-लेखनातील बराचसा भाग खरे तर भाषांतरच असतो: विद्यमान काम घेऊन त्याचा मूळ हेतू न गमावता ते अधिक सोपे, अधिक सुसंगत, अधिक सुव्यवस्थित आणि अधिक सुलभ बनवणे.

आम्ही अंतर कसे ओळखतो आणि अद्यतने कशी घडवून आणतो

अनेक कारणांमुळे आमची प्रॉडक्शन मॉडेल अजूनही मॉडेल स्पेक पूर्णपणे प्रतिबिंबित करत नाहीत.

मॉडेल प्रशिक्षण मॉडेल स्पेक अद्यतनांच्या मागे राहू शकते. हे ज्या दिशेने आम्ही काम करत आहोत त्या वर्तनाचे वर्णन करते. त्यामुळे, ते आमच्या नवीनतम मॉडेलला जे करण्यासाठी प्रशिक्षित केले गेले आहे त्यापेक्षा पुढे असू शकते.
प्रशिक्षण अनवधानाने मॉडेल स्पेकशी विसंगत वर्तन शिकवू शकते. हे टाळण्यासाठी आम्ही खूप प्रयत्न करतो, आणि जेव्हा असे घडते तेव्हा आम्ही त्याला गंभीर बग मानतो—वर्तन किंवा मॉडेल स्पेक यांपैकी एकामध्ये बदल करून त्यांना एकमेकांशी जुळवण्यासाठी काम करतो.
प्रशिक्षण सर्व संभाव्य वर्तनांच्या अवकाशाला कधीही पूर्णपणे व्यापू शकत नाही. प्रत्यक्ष वापरात संदर्भ आणि अपवादात्मक प्रकरणांची मोठी श्रेणी असते, जी फक्त मोठ्या प्रमाणावर समोर येते, आणि कोणतीही प्रशिक्षण प्रक्रिया सर्वकाही समाविष्ट करू शकत नाही.
सामान्यीकरण आमच्या अभिप्रेत उद्देशांपेक्षा वेगळे असू शकते. एखादे मॉडेल ट्रेनिंगमध्ये “योग्य” आउटपुट्स अनपेक्षित कारणांमुळे तयार करू शकते, ज्यामुळे ट्रेनिंगमध्ये पाहिलेल्या परिस्थितींपेक्षा वेगळ्या नवीन परिस्थितींमध्ये अनपेक्षित वर्तन होऊ शकते. विचार-विनिमय आधारित अलाइनमेंट⁠ यांसारखी तंत्रे मदत करतात, परंतु ती संपूर्ण उपाय नाहीत.

अधिक व्यापकपणे पाहता, मॉडेल स्पेक इच्छित वर्तनांची विस्तृत श्रेणी वर्णन करते, परंतु ती सर्व शिकवण्यासाठी एकच पद्धत असणे आवश्यक नाही. वर्तनाचे विविध पैलू—सूचनांचे पालन, सुरक्षिततेच्या सीमा, व्यक्तिमत्त्व, अनिश्चिततेची समतोल अभिव्यक्ती आणि इतर—यांसाठी अनेकदा वेगवेगळ्या तंत्रांची आवश्यकता असते आणि त्यांचे अयशस्वी होण्याचे प्रकारही वेगवेगळे असतात. मॉडेल स्पेकमुळे अपेक्षित वर्तन समजणे आणि त्याची चिकित्सा करणे अधिक सोपे होते, परंतु त्याची प्रभावी अंमलबजावणी करणे ही अजूनही एक कला आणि संशोधनाचे सक्रिय क्षेत्र आहे.

या पोस्टसोबत, आम्ही मॉडेल स्पेक मूल्यमापन⁠(नवीन विंडोमध्ये उघडेल) जारी करत आहोत: एक परिस्थिती-आधारित मूल्यमापन संच, जो कमी संख्येतील प्रतिनिधिक उदाहरणांच्या मदतीने मॉडेल स्पेकमधील शक्य तितकी जास्त विधाने समाविष्ट करण्याचा प्रयत्न करतो. यामुळे आम्हाला मॉडेलचे वर्तन आणि मॉडेल स्पेक कोठे एकमेकांशी संरेखित नाहीत हे ट्रॅक करता येते, आणि मॉडेल्स मॉडेल स्पेकचा आमच्या हेतूनुसार अर्थ लावत आहेत का हे तपासण्यासही मदत होते. हे evals व्यापक मूल्यांकन धोरणाचा केवळ एक भाग आहेत, ज्यामध्ये वर्तनाच्या अनेक आयामांमध्ये अधिक लक्षित मूल्यांकनांचाही समावेश आहे, ज्यात विशिष्ट सुरक्षा क्षेत्रे, सत्यता आणि आंधळी-संमती, व्यक्तिमत्त्व आणि शैली, तसेच क्षमता यांचा समावेश होतो.

कालांतराने OpenAI मॉडेल्ससाठी विभागनिहाय मॉडेल स्पेक अनुपालनाचा चार्ट. मूल्यांकनांबद्दल आणि त्यांचा अर्थ आपण कसा लावतो याबद्दल अधिक तपशीलांसाठी सहकारी ब्लॉग पोस्ट⁠(नवीन विंडोमध्ये उघडेल) पहा. थोडक्यात, आमचा विश्वास आहे की हे निकाल कालांतराने मॉडेल अलाइनमेंटमधील खऱ्या आणि व्यापक सुधारणा दर्शवतात—जरी ते अधिक अलीकडील धोरणांच्या तुलनेत जुन्या मॉडेल्सचे मोजमाप केल्यामुळे होणारा एक लहान परिणामही दर्शवतात.

प्रत्यक्षात, बहुतेक स्पेक अद्यतने वारंवार येणाऱ्या इनपुट्सच्या संचामुळे प्रेरित असतात:

सार्वजनिक मुद्दे आणि अभिप्राय. गोंधळ, विशेष प्रकरणे किंवा अयशस्वी होण्याचे प्रकार—मॉडेल स्पेकच्या भाषेत किंवा आमच्या मॉडेल्सच्या वर्तनात.
आतील समस्या. डेव्हलपमेंट आणि टेस्टिंग दरम्यान दिसणारे नमुने, ज्यामध्ये वेगवेगळ्या वाजवी अर्थलावण्यांमुळे वेगळे वर्तन घडते अशा अस्पष्टतेचा समावेश आहे.
वर्तन आणि सुरक्षा धोरण अद्यतन. उच्च-स्तरीय बंधने किंवा वचनबद्धता बदलल्यास, स्पेकने ती नवीन रचना स्पष्टपणे प्रतिबिंबित करणे आवश्यक आहे.
नवीन क्षमता आणि उत्पादने. जसे मॉडेल नवीन वर्तनांमध्ये अधिक सक्षम होत जातात आणि आम्ही नवीन उत्पादने प्रकाशित करतो, तसे आम्हाला मॉडेल स्पेकने आशय आणि व्याप्ती या दोन्ही बाबतीत अद्ययावत राहावे असे वाटते—उदाहरणार्थ, मल्टिमोडल परस्परसंवादांसाठी नियम⁠(नवीन विंडोमध्ये उघडेल), स्वायत्त एजंट्स⁠(नवीन विंडोमध्ये उघडेल), आणि अठरा वर्षांखालील वापरकर्ते⁠(नवीन विंडोमध्ये उघडेल) यांचा समावेश करून.

चांगली स्पेक सामग्री काय बनवते

काही डिझाइन तत्त्वे आम्ही मॉडेल स्पेक कसा लिहितो आणि सुधारित करतो याचे मार्गदर्शन करतात.

स्पष्टता आणि अचूकता. “प्रामाणिक रहा” हे एक चांगले मूल्य आहे, पण निर्णय घेण्यासाठीची संपूर्ण प्रक्रिया नाही. मॉडेल स्पेकने मतभेद अधिक स्पष्ट करायला हवेत, सहमतिदर्शक भाषेच्या आड ते लपवू नयेत. जिथे व्यावहारिकदृष्ट्या शक्य असेल तिथे, आपण नियमांमधील संभाव्य संघर्ष स्पष्टपणे नमूद करावेत आणि ते कसे सोडवावेत याबद्दल मार्गदर्शन किंवा उदाहरणे द्यावीत. उदाहरणार्थ, खोटे बोलू नका⁠(नवीन विंडोमध्ये उघडेल) हे आपुलकीने वागा⁠(नवीन विंडोमध्ये उघडेल) यांच्याशी संभाव्य संघर्ष अधोरेखित करते, आणि हे स्पष्ट करते की सहाय्यकाने नम्रतेच्या नियमांचे पालन करावे, परंतु आंधळी-संमती⁠(नवीन विंडोमध्ये उघडेल) ठरू शकतील आणि वापरकर्त्याच्या सर्वोत्तम हिताच्या विरोधात जाऊ शकतील अशा निरुपद्रवी खोटेपणापर्यंत जाऊ नये.
मूलभूत नियम. वाचकाला असा वास्तववादी प्रॉम्प्ट घेता आला पाहिजे आणि असे उत्तर तयार करता आले पाहिजे की दुसऱ्या वाचकाला ते स्पष्टपणे मर्यादांच्या आत आहे की बाहेर हे ओळखता येईल (जरी काठावरच्या बाबतीत निर्णयाधारित मतभेद असू शकतात).
सिग्नल-टू-गोंगाट जास्तीत जास्त वाढवणारी उदाहरणे. उच्च-गुणवत्तेचे स्पेक अद्यतन विकसित करण्यासाठी चांगली उदाहरणे बहुतेकदा मध्यवर्ती असतात. उदाहरणांनी मॉडेलच्या वर्तनाचे स्पेसिफिकेशन करण्यात असलेल्या अडचणींच्या मुळाशी पोहोचण्यास, कठीण संघर्ष पृष्ठभागावर आणण्यास आणि ते कसे सोडवायचे याबाबत स्पष्ट भूमिका घेण्यास मदत करावी. दुसरे म्हणजे, त्यांनी इच्छित टोन आणि शैलीचे आदर्श ठरण्याचा प्रयत्न केला पाहिजे, जे गद्यातून व्यक्त करणे कठीण असू शकते.
मजबुती. आम्ही अनावश्यक संदिग्धता किंवा गुंतागुंत असलेली उदाहरणे टाळतो, जेणेकरून मुख्य संघर्ष आणि अपेक्षित निराकरण स्पष्ट होईल.
सातत्य आणि स्पष्ट मांडणी. आम्ही मॉडेल स्पेकचे नियम एकमेकांशी आणि आमच्या अपेक्षित मॉडेल वर्तनाशी पूर्णपणे सुसंगत राहतील, तसेच दस्तऐवजाची एकूण मांडणी स्पष्ट आणि समजण्यास सोपी असेल, यासाठी प्रयत्न करतो.

पुढे काय

मॉडेल स्पेक असा दावा करत नाही की आपण प्रत्येक महत्त्वाच्या गोष्टीची नोंद करू शकतो किंवा मॉडेल नेहमीच अपेक्षित उद्दिष्ट गाठेल. हा असा दावा आहे की अभिप्रेत वर्तन पुरेसे महत्त्वाचे आहे की ते स्पष्ट, कृतीयोग्य आणि सुधारण्यायोग्य असावे.

यशाचे तीन निकष आम्ही त्याचा उत्क्रांती कसा करतो याचे मार्गदर्शन करतात.

वाचनीयता. OpenAI च्या आत आणि बाहेरील लोक वर्तनाबद्दल अचूक अपेक्षा तयार करू शकतात आणि जेव्हा वर्तन त्यांना अनपेक्षित वाटते तेव्हा ते मजकुराकडे निर्देश करू शकतात.
कृतीशीलता. मॉडेल स्पेकचा वापर मूल्यांकनांची रचना करण्यासाठी, घटनांचे निदान करण्यासाठी आणि सुसंगत उत्पादनविषयक निर्णय घेण्यासाठी केला जाऊ शकतो—केवळ मूल्ये व्यक्त करण्यासाठीच नाही.
सुधारणीयता. आम्ही शिकत असताना मॉडेल स्पेक विकसित होऊ शकतो, अस्थिर आणि सतत बदलणारे लक्ष्य न बनता.

मॉडेल आणि उत्पादने विकसित होत असताना, नवीन क्षमता आणि उपयोजन संदर्भांनुसार मॉडेल स्पेक विस्तारत जाईल आणि अधिक स्पष्ट होत जाईल, अशी आम्ही अपेक्षा करतो. उद्दिष्ट म्हणजे वर्तनविषयक तपशील सुसंगत, चाचणीयोग्य आणि AGI चा फायदा संपूर्ण मानवजातीला होईल याची खात्री करण्याच्या आमच्या ध्येयाशी संरेखित ठेवणे आहे.

लेखक

Jason Wolfe

वाचत राहा

सर्व पहा

GPT-Red: मजबुतीसाठी स्व-सुधारणा खुली करणे

सुरक्षितता१५ जुलै, २०२६

कोडिंग मूल्यमापनांमधून सिग्नल आणि गोंगाट वेगळे करणे

रिसर्च८ जुलै, २०२६

GeneBench-Pro सादर करत आहे

रिसर्च३० जून, २०२६