मुख्य मजकूराकडे जा
OpenAI

आम्ही GPT‑4 तयार केले आहे, जे OpenAI च्या सखोल शिक्षण विस्ताराच्या प्रयत्नातील ताजे महत्त्वाचे पाऊल आहे. GPT‑4 हा एक मोठा मल्टिमोडल मॉडेल आहे (जो इमेज आणि टेक्स्ट इनपुट स्वीकारतो आणि टेक्स्ट आउटपुट देतो). अनेक वास्तविक परिस्थितींमध्ये तो माणसांपेक्षा कमी सक्षम असला तरी, तो विविध व्यावसायिक आणि शैक्षणिक बेंचमार्कवर मानवी-स्तरीय परफॉर्मन्स दाखवतो. उदाहरणार्थ, हे चाचणी देणाऱ्यांच्या टॉप १०% मध्ये गुण मिळवून सिम्युलेटेड बार परीक्षा उत्तीर्ण करते; याउलट, GPT‑3.5 चे स्कोअर तळाच्या १०% च्या आसपास होता. आम्ही आमच्या अ‍ॅडव्हर्सरियल टेस्टिंग प्रोग्राम तसेच ChatGPT मधील धडे वापरून GPT‑4 ला पुनरावृत्ती पद्धतीने संरेखित करण्यासाठी 6 महिने घालवले, ज्यामुळे तथ्यात्मकता, स्टीअरेबिलिटी आणि गार्डरेल्सच्या बाहेर जाण्यास नकार देण्याबाबत आमचे सर्वोत्तम निकाल (परिपूर्ण नसले तरी) मिळाले आहेत.

गेल्या दोन वर्षांत आम्ही आमचा पूर्ण सखोल शिक्षण स्टॅक पुन्हा बांधला आणि Azure सोबत मिळून आमच्या कामाचा ताण साठी अगदी सुरुवातीपासून एक सुपरकंप्युटर तयार केला. एक वर्षापूर्वी, आम्ही GPT‑3.5 ला या सिस्टीमचा पहिला “टेस्ट रन” म्हणून ट्रेन केले. आम्हाला काही बग्स सापडले आणि आम्ही ते दुरुस्त केले तसेच आमची सैद्धांतिक पायाभरणी मजबूत केली. त्याचा परिणाम असा झाला की आमचा GPT‑4 ट्रेनिंग रन (किमान आमच्यासाठी!) अभूतपूर्व स्थिर ठरला, आणि तो आमचा पहिला मोठा मॉडेल ठरला ज्याच्या प्रशिक्षण कामगिरीचा आम्ही आधीच अचूक अंदाज लावू शकलो. जसजसे आम्ही विश्वसनीय स्केलिंगवर लक्ष केंद्रित करत आहोत, तसतसे आम्ही आमच्या पद्धती अधिक परिष्कृत करून भविष्यातील क्षमतांचा अधिक आधीच अंदाज लावता येईल आणि त्यासाठी तयारी करता येईल, हे आमच्या दृष्टीने सुरक्षिततेसाठी अत्यंत महत्त्वाचे आहे.

आम्ही GPT‑4 ची टेक्स्ट इनपुट क्षमता ChatGPT आणि API द्वारे ( प्रतीक्षा यादी सह) रिलीज करत आहोत. प्रतिमा इनपुट क्षमता अधिक व्यापक वापरासाठी तयार करण्यासाठी, आम्ही सुरुवातीला एका एकल भागीदार(नवीन विंडोमध्ये उघडेल) सोबत जवळून सहकार्य करत आहोत. आम्ही OpenAI Evals(नवीन विंडोमध्ये उघडेल) देखील ओपन-सोर्स करत आहोत, जे AI मॉडेलच्या कामगिरीचे स्वयंचलित मूल्यांकन करण्यासाठी आमचे फ्रेमवर्क आहे, ज्यामुळे कोणीही आमच्या मॉडेल्समधील कमतरता नोंदवू शकेल आणि पुढील सुधारणा करण्यास मदत होईल.

क्षमताएँ

सामान्य संभाषणात, GPT‑3.5 आणि GPT‑4 मधील फरक सूक्ष्म असू शकतो. जेव्हा कामाची गुंतागुंत एका ठराविक पातळीवर पोहोचते, तेव्हा फरक स्पष्ट होतो—GPT‑4 हा GPT‑3.5 पेक्षा अधिक विश्वासार्ह, सर्जनशील आणि अधिक सूक्ष्म सूचना हाताळू शकणारा आहे.

या दोन मॉडेल्समधला फरक समजण्यासाठी, आम्ही विविध बेंचमार्कवर टेस्ट केले, ज्यामध्ये मूळतः मानवांसाठी डिझाइन केलेल्या सिम्युलेटेड परीक्षांचाही समावेश होता. आम्ही सर्वात अलीकडील सार्वजनिकरित्या उपलब्ध असलेल्या चाचण्यांचा वापर करून (ऑलिंपियाड आणि एपी मोफत प्रतिसाद प्रश्नांच्या बाबतीत) किंवा 2022–2023 च्या सराव परीक्षांच्या आवृत्त्या खरेदी करून पुढे गेलो. या परीक्षांसाठी आम्ही कोणतेही विशिष्ट प्रशिक्षण केले नाही. परीक्षेतील काही समस्या प्रशिक्षणादरम्यान मॉडेलने पाहिल्या होत्या, परंतु आम्हाला विश्वास आहे की निकाल प्रातिनिधिक आहेत—तपशीलांसाठी आमचा तांत्रिक अहवाल(नवीन विंडोमध्ये उघडेल) पहा.

अंतर्गत संदर्भ 1

लोड होत आहे ...
लोड होत आहे ...

आम्ही GPT‑4 चे मशीन लर्निंग मॉडेल्ससाठी तयार केलेल्या पारंपरिक बेंचमार्कवरही मूल्यांकन केले. GPT‑4 विद्यमान मोठ्या भाषा मॉडेल्सपेक्षा आणि बहुतांश स्टेट-ऑफ-द-आर्ट (SOTA) मॉडेल्सपेक्षा लक्षणीय चांगली कामगिरी करतो, ज्यामध्ये बेंचमार्क-विशिष्ट क्राफ्टिंग किंवा अतिरिक्त प्रशिक्षण प्रोटोकॉल्स असू शकतात:

लोड होत आहे ...

विद्यमान बरेचसे ML बेंचमार्क इंग्रजीत लिहिलेले आहेत. इतर भाषांमध्ये क्षमतेची प्रारंभिक कल्पना मिळविण्यासाठी, आम्ही MMLU बेंचमार्कचे भाषांतर केले - 57 विषयांमधील 14,000 बहु-निवड समस्यांचा संच - Azure Translate वापरून विविध भाषांमध्ये अनुवादित केले ( परिशिष्ट पहा). तपासलेल्या 26 पैकी 24 भाषांमध्ये, GPT‑4 ने GPT‑3.5 आणि इतर LLMs (Chinchilla, PaLM) च्या इंग्रजी भाषेतील कामगिरीपेक्षा चांगली कामगिरी केली, ज्यामध्ये लॅटव्हियन, वेल्श आणि स्वाहिली सारख्या कमी संसाधन असलेल्या भाषांचा समावेश आहे:

लोड होत आहे ...

आम्ही GPT‑4 चा अंतर्गत वापरही करत आहोत, ज्याचा सपोर्ट, सेल्स, कंटेंट मॉडरेशन आणि प्रोग्रॅमिंगसारख्या कार्यांवर मोठा परिणाम झाला आहे. आमच्या संरेखन धोरणातील दुसऱ्या टप्प्याची सुरुवात करून, आम्ही एआय आउटपुटचे मूल्यांकन करण्यात मानवांना मदत करण्यासाठी देखील याचा वापर करत आहोत.

व्हिज्युअल इनपुट्स

GPT‑4 मजकूर आणि प्रतिमांचा प्रॉम्प्ट स्वीकारू शकतो, जो - केवळ मजकूर सेटिंगच्या समांतर - वापरकर्त्याला कोणतेही दृष्टी किंवा भाषा कार्य निर्दिष्ट करू देतो. विशेषतः, तो टेक्स्ट आणि प्रतिमांच्या मिश्र इनपुटवर आधारित टेक्स्ट आउटपुट्स (नॅचरल लँग्वेज, कोड, इ.) तयार करतो. मजकूर आणि छायाचित्रे, आकृत्या किंवा स्क्रीनशॉटसह दस्तऐवजांसह अनेक डोमेनमध्ये—GPT‑4 मजकूर-केवळ इनपुटवर समान क्षमता प्रदर्शित करते. याशिवाय, हे चाचणी-वेळ तंत्रांसह वाढविले जाऊ शकते जे केवळ मजकूर-आधारित भाषा मॉडेल्ससाठी विकसित केले गेले होते, ज्यात काही शॉट आणि चेन-ऑफ-थॉट(नवीन विंडोमध्ये उघडेल) प्रॉम्प्टिंगचा समावेश आहे. प्रतिमा इनपुट्स अजूनही रिसर्च पूर्वावलोकनामध्ये आहेत आणि सार्वजनिकरीत्या उपलब्ध नाहीत.

लोड होत आहे ...

आम्ही GPT‑4 ची परफॉर्मन्स एक संकुचित शैक्षणिक व्हिजन बेंचमार्क संचावर मूल्यांकन करून पूर्वावलोकन केले. मात्र, हे आकडे त्याच्या क्षमतांचा पूर्ण विस्तार दर्शवत नाहीत, कारण आम्ही सतत नवीन आणि रोचक काम शोधत आहोत जे मॉडेल हाताळू शकतो. आम्ही लवकरच पुढील विश्लेषण, मूल्यांकनाचे आकडे तसेच टेस्ट-टाइम तंत्रांच्या परिणामांचा सखोल अभ्यास प्रकाशित करण्याची योजना आखत आहोत.

अंतर्गत फूटनोटA

लोड होत आहे ...

स्टिअरेबिलिटी

आम्ही आमच्या पोस्टमध्ये नमूद केलेल्या योजनेच्या प्रत्येक पैलूवर काम करत आहोत, ज्यात एआयचे वर्तन परिभाषित केले गेले आहे, ज्यात स्टीयरेबिलिटीचा समावेश आहे. ठराविक शब्दबंबाळपणा, टोन आणि शैली असलेल्या पारंपरिक ChatGPT पर्सनॅलिटीऐवजी, डेव्हलपर्स (आणि लवकरच ChatGPT युजर्स) आता “सिस्टम” मेसेजमध्ये त्या दिशानिर्देशांचे वर्णन करून त्यांच्या AI ची शैली आणि टास्क ठरवू शकतात. सिस्टम संदेश API वापरकर्त्यांना त्यांच्या वापरकर्त्यांचा अनुभव मर्यादेत(नवीन विंडोमध्ये उघडेल) लक्षणीयरीत्या सानुकूलित करण्याची परवानगी देतात. आम्ही येथे सुधारणा करत राहू (आणि विशेषतः हे जाणतो की सिस्टम मेसेजेस हा सध्याच्या मॉडेलला “जेलब्रेक” करण्याचा सोपा मार्ग आहे, म्हणजेच बाउंड्सचे पालन परिपूर्ण नाही), पण आम्ही तुम्हाला ते वापरून पाहण्यास प्रोत्साहित करतो आणि तुमचे मत कळवण्याची विनंती करतो.

लोड होत आहे ...

मर्यादा

क्षमतांनंतरही, GPT‑4 ला आधीच्या GPT मॉडेल्सप्रमाणेच मर्यादा आहेत. सर्वात महत्त्वाचे म्हणजे, ते अद्याप पूर्णपणे विश्वासार्ह नाही (ते तथ्ये "भ्रमित" करते आणि तर्क त्रुटी करते). भाषा मॉडेल आउटपुट्स वापरताना, विशेषतः हाय-स्टेक्स परिस्थितींमध्ये, खूप काळजी घ्यावी, आणि विशिष्ट वापराच्या गरजेनुसार अचूक प्रोटोकॉल (जसे की मानवी पुनरावलोकन, अतिरिक्त संदर्भांसह ग्राउंडिंग, किंवा हाय-स्टेक्स वापर पूर्णपणे टाळणे) वापरला पाहिजे.

अजूनही हा खरा मुद्दा असला तरी, GPT‑4 ने मागील मॉडेल्सच्या तुलनेत हॅलुसिनेशन्स लक्षणीयरीत्या कमी केले आहेत (जे प्रत्येक आवृत्तीसह स्वतः सुधारत गेले आहेत). आमच्या अंतर्गत प्रतिकूल तथ्यात्मकता मूल्यांकनात GPT‑4 ने आमच्या नवीनतम GPT‑3.5 पेक्षा 40% जास्त गुण मिळवले आहेत:

लोड होत आहे ...

आम्ही TruthfulQA सारख्या बाह्य बेंचमार्क्सवर प्रगती केली आहे, जे मॉडेलची तथ्य आणि विरोधकांनी निवडलेल्या चुकीच्या विधानांमधील फरक ओळखण्याची क्षमता तपासते. या प्रश्नांना तथ्यात्मकदृष्ट्या चुकीच्या पण सांख्यिकीयदृष्ट्या आकर्षक अशा उत्तरांची जोड दिली जाते.

लोड होत आहे ...

GPT‑4 बेस मॉडेल हे GPT‑3.5 पेक्षा या कामात फक्त थोडेसे चांगले आहे; तथापि, RLHF पोस्ट-प्रशिक्षणानंतर (आम्ही GPT‑3.5 सोबत वापरलेली प्रक्रिया लागू करून) एक मोठी तफावत आहे. खालील काही उदाहरणे पाहता, GPT‑4 नेहमीच्या म्हणी निवडण्यापासून दूर राहतो (उदा. जुना कुत्रा नवे खेळ शिकू शकत नाही), तरीही तो सूक्ष्म तपशील चुकवू शकतो (उदा. एल्विस प्रेस्ली हा अभिनेत्याचा मुलगा नव्हता).

लोड होत आहे ...

मॉडेलच्या आउटपुटमध्ये विविध बायस असू शकतात—यामध्ये आम्ही काही प्रगती केली आहे, पण अजूनही बरंच काम करायचं आहे. आमच्या अलीकडील ब्लॉग पोस्टनुसार, आम्ही तयार केलेल्या एआय प्रणालींमध्ये वाजवी डीफॉल्ट वर्तन असावे जे वापरकर्त्यांच्या विस्तृत मूल्यांचे प्रतिबिंब करतात, त्या प्रणालींना विस्तृत मर्यादेत सानुकूलित करण्याची परवानगी द्यावी, आणि त्या मर्यादा काय असाव्यात यावर सार्वजनिक इनपुट मिळवावे.

GPT‑4 मध्ये सामान्यत: त्याचा बहुतेक डेटा कापल्यानंतर (सप्टेंबर 2021) झालेल्या कार्यक्रमांचे ज्ञानाचा अभाव आहे आणि तो आपल्या अनुभवातून शिकत नाही. कधीकधी तो साध्या तर्कशुद्ध चुका करू शकतो, ज्या त्याच्या विविध डोमेनमधील कौशल्याशी जुळत नाहीत, किंवा वापरकर्त्यांकडून आलेल्या स्पष्ट खोट्या विधानांवर खूपच सहज विश्वास ठेवू शकतो. आणि कधी कधी तो अवघड समस्यांमध्ये माणसांप्रमाणेच अपयशी होऊ शकतो, जसे की तो तयार केलेल्या कोडमध्ये सिक्युरिटी व्हल्नरेबिलिटीज आणणे.

GPT‑4 आपल्या प्रेडिक्शन्समध्ये आत्मविश्वासाने चुकीचा ठरू शकतो, म्हणजे चूक होण्याची शक्यता असताना तो डबल-चेक करण्याची काळजी घेत नाही. गंमतीशीर म्हणजे, बेस प्री-ट्रेन मॉडेल अत्यंत कॅलिब्रेटेड आहे (त्याच्या उत्तरातील प्रेडिक्टेड कॉन्फिडन्स साधारणपणे बरोबर असण्याच्या शक्यतेशी जुळतो). तथापि, आमच्या सध्याच्या प्रशिक्षण-पश्चात प्रक्रियेमुळे कॅलिब्रेशन कमी झाले आहे.

लोड होत आहे ...

धोके आणि निवारण

प्रशिक्षणाच्या सुरुवातीपासूनच आम्ही GPT‑4 अधिक सुरक्षित आणि संरेखित करण्यासाठी त्यावर पुनरावृत्ती करत आहोत, ज्यामध्ये प्रशिक्षणपूर्व डेटाची निवड आणि फिल्टरिंग, मूल्यांकन आणि तज्ञांचा सहभाग, मॉडेल सुरक्षा सुधारणा आणि देखरेख आणि अंमलबजावणी यांचा समावेश आहे.

GPT‑4 ला पूर्वीच्या मॉडेल्ससारखेच धोके आहेत, जसे की हानिकारक सल्ला तयार करणे, बग्गी कोड तयार करणे किंवा अचूक नसलेली माहिती देणे. तथापि, GPT‑4 च्या अतिरिक्त क्षमतांमुळे नवीन धोका निर्माण होतो. या धोके किती व्यापक आहेत हे समजून घेण्यासाठी, आम्ही AI संरेखन धोके, सायबरसिक्युरिटी, बायोरिस्क, ट्रस्ट अँड सेफ्टी, आणि आंतरराष्ट्रीय सुरक्षा यांसारख्या डोमेनमधील ५० हून अधिक तज्ज्ञांना मॉडेलचे विरोधी पद्धतीने परीक्षण करण्यासाठी सहभागी केले. त्यांच्या निष्कर्षांमुळे आम्हाला विशेषत: उच्च-जोखीम असलेल्या क्षेत्रात मॉडेल वर्तनाची चाचणी घेण्यास सक्षम केले गेले ज्याचे मूल्यांकन करण्यासाठी कौशल्य आवश्यक आहे. या तज्ज्ञांकडून मिळालेला अभिप्राय आणि डेटा आम्ही मॉडेलच्या निवारण आणि सुधारणा प्रक्रियेत समाविष्ट केला; उदाहरणार्थ, धोकादायक रसायने सिंथेसाइज करण्याच्या विनंत्या नाकारण्याची GPT‑4 ची क्षमता सुधारण्यासाठी आम्ही अतिरिक्त डेटा गोळा केला आहे.

GPT‑4 मध्ये RLHF प्रशिक्षणादरम्यान अतिरिक्त सुरक्षा बक्षीस सिग्नल समाविष्ट केला जातो ज्यामुळे मॉडेलला अशा सामग्रीच्या विनंत्या नाकारण्याचे प्रशिक्षण देऊन हानिकारक आउटपुट (आमच्या वापर मार्गदर्शक तत्त्वांनुसार(नवीन विंडोमध्ये उघडेल)) कमी होतात. रिवॉर्ड GPT‑4 झिरो-शॉट क्लासिफायरकडून दिला जातो, जो सेफ्टी-संबंधित प्रॉम्प्ट्सवर सेफ्टी बाउंडरीज आणि कम्प्लिशन स्टाईलचे मूल्यांकन करतो. मॉडेल वैध विनंत्या नाकारू नये म्हणून, आम्ही विविध स्रोतांमधून (उदा. लेबल केलेला उत्पादन डेटा, मानवी रेड-टीमिंग, मॉडेल-निर्मित प्रॉम्प्ट्स) एक वैविध्यपूर्ण डेटासेट गोळा करतो आणि परवानगी असलेल्या आणि नसलेल्या दोन्ही श्रेणींवर सुरक्षा बक्षीस सिग्नल (सकारात्मक किंवा नकारात्मक मूल्यांसह) लागू करतो. 

GPT‑3.5 च्या तुलनेत आमच्या निवारण उपायांमुळे GPT‑4 च्या अनेक सेफ्टी प्रॉपर्टीजमध्ये लक्षणीय सुधारणा झाली आहे. GPT‑3.5 च्या तुलनेत डिसअलाऊड कंटेंटच्या विनंत्यांना प्रतिसाद देण्याची मॉडेलची प्रवृत्ती आम्ही ८२% ने कमी केली आहे, आणि GPT‑4 आमच्या पॉलिसीनुसार सेंसिटिव्ह विनंत्यांना (उदा. वैद्यकीय सल्ला आणि सेल्फ-हार्म) २९% अधिक वेळा प्रतिसाद देतो.

लोड होत आहे ...
लोड होत आहे ...

एकूणच, आमच्या मॉडेल-लेव्हल हस्तक्षेपांमुळे वाईट वर्तन उत्तेजित करणारा करण्याची कठीणता वाढते, परंतु ते अजूनही शक्य आहे. याव्यतिरिक्त, आमच्या वापर मार्गदर्शक तत्त्वांचे उल्लंघन करणारी सामग्री निर्माण करण्यासाठी अजूनही "जेलब्रेक" अस्तित्वात आहेत. AI सिस्टीम्सचा “रिस्क पर token” वाढत असताना, या हस्तक्षेपांमध्ये अत्यंत उच्च स्तराची विश्वासार्हता साध्य करणे अत्यावश्यक होईल; आत्तासाठी या मर्यादा डिप्लॉयमेंट-टाइम सेफ्टी तंत्रांनी (उदा. गैरवापरासाठी मॉनिटरिंग) पूरक करणे महत्त्वाचे आहे.

GPT‑4 आणि त्यानंतरची मॉडेल्स समाजावर लक्षणीय प्रभाव टाकण्याची क्षमता ठेवतात—दोन्ही लाभदायक आणि हानिकारक मार्गांनी. भविष्यातील सिस्टीम्समध्ये उदयास येऊ शकणाऱ्या धोकादायक क्षमतांसाठी मूल्यांकन तयार करण्यासाठी, तसेच संभाव्य परिणाम समजून घेणे आणि त्याचे मूल्यांकन सुधारणे यासाठी आम्ही बाह्य संशोधकांसोबत सहकार्य करत आहोत. GPT‑4 आणि इतर AI सिस्टीम्सच्या संभाव्य सामाजिक आणि आर्थिक परिणामांबद्दल आमचे विचार आम्ही लवकरच शेअर करू.

ट्रेनिंग प्रक्रिया

मागील GPT मॉडेल्सप्रमाणेच, GPT‑4 बेस मॉडेलला एखाद्या दस्तऐवजामधील पुढचा शब्द प्रेडिक्ट करण्यासाठी ट्रेन केले गेले, आणि ते सार्वजनिकरीत्या उपलब्ध डेटा (उदा. इंटरनेट डेटा) तसेच आम्ही लायसन्स केलेल्या डेटाचा वापर करून ट्रेन केले गेले. हा डेटा वेब-स्केल कॉर्पस आहे ज्यात गणिती समस्यांचे योग्य आणि अयोग्य उपाय, कमजोर आणि मजबूत तर्क, स्वविरोधी आणि सुसंगत विधाने, तसेच विविध विचारसरणी आणि कल्पनांचे विस्तृत प्रतिनिधित्व समाविष्ट आहे.

म्हणून जेव्हा प्रश्न विचारला जातो तेव्हा बेस मॉडेल विविध प्रकारे प्रॉम्प्ट देऊ शकते जे वापरकर्त्याच्या हेतूपासून दूर असू शकते. रेलिंगमधील वापरकर्त्याच्या हेतूशी ते संरेखित करण्यासाठी, आम्ही मानवी अभिप्रायासह मजबुतीकरण शिक्षण वापरून मॉडेलचे वर्तन फाइन-ट्यून करतो (RLHF).

लक्षात ठेवा की मॉडेलच्या क्षमतांचा मुख्य स्त्रोत प्री-ट्रेनिंग प्रोसेस आहे—RLHF परीक्षेतील परफॉर्मन्स सुधारत नाही (सक्रिय प्रयत्नांशिवाय, तो उलट घसरतो). परंतु मॉडेलचे सुकाणू प्रशिक्षणोत्तर प्रक्रियेतून येते - बेस मॉडेलला प्रश्नांची उत्तरे दिली पाहिजेत हे जाणून घेण्यासाठी प्रॉम्प्ट इंजिनियरिंगची आवश्यकता असते.

प्रेडिक्टेबल स्केलिंग

GPT‑4 प्रोजेक्टचा मोठा फोकस म्हणजे प्रेडिक्टेबलरीत्या स्केल होणारा सखोल शिक्षण स्टॅक तयार करणे. यामागचं प्रमुख कारण म्हणजे, GPT‑4 सारख्या अतिशय मोठ्या प्रशिक्षण रनसाठी विस्तृत मॉडेल-स्पेसिफिक ट्युनिंग करणे व्यवहार्य नाही. आम्ही असे इन्फ्रास्ट्रक्चर आणि ऑप्टिमायझेशन विकसित केले आहे जे विविध स्केल्सवर अतिशय प्रेडिक्टेबल वर्तन दाखवतात. ही स्केलेबिलिटी पडताळण्यासाठी, आम्ही एकाच पद्धतीने प्रशिक्षित केलेल्या मॉडेल्समधून एक्स्ट्रापोलेट करून, परंतु 10,000 पट कमी कंप्यूट वापरून, आमच्या अंतर्गत कोडबेसवर (प्रशिक्षण संचाचा भाग नाही) GPT‑4 च्या अंतिम नुकसानाचा आगाऊ अचूक अंदाज लावला:

लोड होत आहे ...

आता आम्ही प्रशिक्षणदरम्यान ऑप्टिमाईज केलेला मेट्रिक (लॉस) अचूकपणे प्रेडिक्ट करू शकतो, त्यामुळे आम्ही अधिक समजण्यासारखे मेट्रिक्स प्रेडिक्ट करण्यासाठी पद्धती विकसित करण्यास सुरुवात करत आहोत. उदाहरणार्थ, आम्ही HumanEval(नवीन विंडोमध्ये उघडेल) डेटासेटच्या उपसमूहावर पास रेटचा यशस्वीरित्या अंदाज लावला, १,०००x कमी कंप्यूट असलेल्या मॉडेल्सवरून एक्स्ट्रापोलेट केले:

लोड होत आहे ...

काही क्षमता अजूनही प्रेडिक्ट करणे कठीण आहे. उदाहरणार्थ, इनव्हर्स स्केलिंग बक्षीस ही मॉडेल कंप्यूट वाढत असताना खराब होणारे मेट्रिक शोधण्यासाठी एक स्पर्धा होती आणि मागील दुर्लक्ष(नवीन विंडोमध्ये उघडेल) हे विजेत्यांपैकी एक होते. दुसऱ्या अलीकडील निकालाप्रमाणेच,(नवीन विंडोमध्ये उघडेल) GPT‑4 प्रवृत्ती उलटवतो:

लोड होत आहे ...

भविष्यातील मशीन लर्निंग क्षमतांचा अचूक अंदाज लावणे हा सेफ्टीचा एक महत्त्वाचा भाग आहे ज्याला त्याच्या संभाव्य परिणामांच्या तुलनेत पुरेसे लक्ष मिळत नाही (जरी आम्हाला अनेक संस्थांच्या प्रयत्नांमुळे प्रोत्साहन मिळाले आहे). भविष्यातील सिस्टीम्सकडून काय अपेक्षित आहे याबाबत समाजाला अधिक चांगले मार्गदर्शन देणाऱ्या पद्धती विकसित करण्यासाठी आम्ही आमचे प्रयत्न वाढवत आहोत, आणि हे या क्षेत्रातील एक सामान्य उद्दिष्ट बनेल अशी आमची आशा आहे.

OpenAI इव्हल्स

आम्ही ओपन-सोर्सिंग OpenAI इव्हल्स चे(नवीन विंडोमध्ये उघडेल) वापर करत आहोत, जे GPT‑4 सारख्या मॉडेल्सचे मूल्यांकन करण्यासाठी बेंचमार्क तयार करण्यासाठी आणि चालवण्यासाठी आमचे सॉफ्टवेअर फ्रेमवर्क आहे, तसेच त्यांच्या कामगिरीचे नमुन्यानुसार नमुन्याचे निरीक्षण करत आहे. आम्ही आमच्या मॉडेल्सच्या डेव्हलपमेंटला मार्गदर्शन करण्यासाठी इव्हल्स चा वापर करतो (कमतरता ओळखणे आणि रिग्रेशन टाळणे या दोन्हीसाठी), आणि आमचे वापरकर्ते मॉडेलच्या विविध आवृत्त्यांमधील कामगिरी ट्रॅक करण्यासाठी (जी आता नियमितपणे येणार आहेत) आणि प्रॉडक्ट इंटिग्रेशन्सच्या विकासासाठी याचा वापर करू शकतात. उदाहरणार्थ, Stripe ने त्यांच्या GPT‑पावर्ड डॉक्युमेंटेशन टूलची अचूकता मोजण्यासाठी इव्हॅल्स चा वापर करून त्यांच्या ह्युमन इव्हॅल्युएशन्सची पूर्तता केली आहे.

कोड सर्व ओपन-सोर्स असल्यामुळे, इव्हल्स सानुकूल मूल्यांकन लॉजिक(नवीन विंडोमध्ये उघडेल) लागू करण्यासाठी नवीन वर्ग लिहिण्यास सपोर्ट देते. आमच्या स्वत: च्या अनुभवात, तथापि, अनेक बेंचमार्क काही "टेम्पलेट्स" पैकी एकाचे अनुसरण करतात, म्हणून आम्ही आंतरिकरित्या सर्वात उपयुक्त ठरलेले टेम्पलेट्स देखील समाविष्ट(नवीन विंडोमध्ये उघडेल) केले आहेत ("मॉडेल-ग्रेडेड इव्हल्स" साठी टेम्पलेटसह - आम्हाला आढळले आहे की GPT‑4 स्वतःचे कार्य तपासण्यात आश्चर्यकारकपणे सक्षम आहे). सामान्यत: नवीन इव्हल तयार(नवीन विंडोमध्ये उघडेल) करण्याचा सर्वात प्रभावी मार्ग म्हणजे डेटा प्रदान करताना यापैकी एक टेम्पलेट तयार करणे. इतर लोक या टेम्प्लेट्ससह आणि एकूणच इव्हल्स सह काय तयार करतात हे पाहण्यासाठी आम्ही उत्सुक आहोत.

आम्ही अपेक्षा करतो की इव्हल्स बेंचमार्क्स शेअर करण्याचे आणि क्राउडसोर्स करण्याचे साधन बनेल, ज्यात शक्य तितक्या व्यापक प्रकारचे फेल्युअर मोड्स आणि अवघड कामाचे प्रतिनिधित्व असेल. अनुसरण करण्यासाठी एक उदाहरण म्हणून, आम्ही एक लॉजिक कोडे(नवीन विंडोमध्ये उघडेल) इव्हल तयार केला आहे ज्यामध्ये GPT‑4 अयशस्वी होतो असे दहा प्रॉम्प्ट्स आहेत. इव्हल्स विद्यमान बेंचमार्क्सच्या अंमलबजावणीसाठी देखील सुसंगत आहे; आम्ही शैक्षणिक बेंचमार्क्स अंमलात आणणारे अनेक नोटबुक्स(नवीन विंडोमध्ये उघडेल) आणि उदाहरण म्हणून CoQA(नवीन विंडोमध्ये उघडेल) चे समाकलन (लहान उपसंच) करण्याच्या काही प्रकारांचा समावेश केला आहे.

आम्ही प्रत्येकाला आमची मॉडेल्स टेस्ट करण्यासाठी आणि सर्वात रोचक उदाहरणे प्रस्तुत करण्यासाठी इव्हल्स वापरण्याचे आमंत्रण देतो. आम्हाला विश्वास आहे की इव्हल्स आमच्या मॉडेल्सच्या वापरासाठी आणि त्यावर बांधणी करण्याच्या प्रक्रियेचा एक अविभाज्य भाग असेल, आणि आम्ही थेट योगदान, प्रश्न, आणि अभिप्राय(नवीन विंडोमध्ये उघडेल) यांचे स्वागत करतो.

ChatGPT Plus

ChatGPT प्लस सदस्यांना chatgpt.com(नवीन विंडोमध्ये उघडेल) वर वापराची मर्यादेसह GPT‑4 प्रवेश मिळेल. मागणी आणि प्रत्यक्षात सिस्टम कामगिरीनुसार आम्ही अचूक वापर मर्यादा समायोजित करू, परंतु आम्हाला क्षमता गंभीरपणे मर्यादित राहण्याची अपेक्षा आहे (जरी आम्ही येत्या काही महिन्यांत वाढवू आणि ऑप्टिमायझ करू).

आम्हाला दिसणाऱ्या रहदारी पॅटर्ननुसार, आम्ही उच्च-व्हॉल्यूम GPT‑4 वापरासाठी एक नवीन सदस्यता लेव्हल सादर करू शकतो; आम्हाला अशी आशा आहे की कधीतरी काही प्रमाणात मोफत GPT‑4 क्वेरीज देऊ जेणेकरून सबस्क्रिप्शन नसलेले देखील ते वापरून पाहू शकतील.

API

GPT‑4 API मध्ये प्रवेश मिळविण्यासाठी (जो gpt-3.5-turbo सारखाच ChatCompletions API(नवीन विंडोमध्ये उघडेल) वापरतो), कृपया आमच्या प्रतीक्षा यादीसाठी साइन अप करा. आम्ही काही विकसकाना आजपासून आमंत्रण देऊ आणि हळूहळू स्केल अप करून क्षमता आणि मागणी यामध्ये संतुलन साधू. जर आपण एआय किंवा एआय संरेखन समस्यांच्या सामाजिक प्रभावाचा अभ्यास करणारे संशोधक असाल, तर आपण आमच्या संशोधक प्रवेश कार्यक्रमाद्वारे अनुदानित प्रवेशासाठी आवेदन करू शकता.

एकदा तुम्हाला ऍक्सेस मिळाल्यावर, तुम्ही फक्त टेक्स्टसाठी gpt-4 मॉडेलला विनंत्या करू शकता (प्रतिमा इनपुट्स अजूनही मर्यादित अल्फामध्ये आहेत), जे आम्ही वेळोवेळी नवीन आवृत्त्या तयार करत असताना आपोआप आमच्या शिफारस केलेल्या स्थिर मॉडेलमध्ये अपडेट करू. (तुम्ही सध्याची आवृत्ती gpt-4-0314 कॉल करून पिन करू शकता, ज्याला आम्ही १४ जूनपर्यंत सपोर्ट करू). किंमत $0.03 प्रति 1k प्रॉम्प्ट token आणि $0.06 प्रति 1k कम्प्लिशन token आहे. डीफॉल्ट रेट लिमिट्स प्रति मिनिट 40k टोकन्स आणि प्रति मिनिट 200 रिक्वेस्ट्स आहेत.

gpt-4 ची कॉन्टेक्स्ट लांबी 8,192 token आहे. आम्ही आमच्या 32,768–संदर्भ (सुमारे 50 पानांचा टेक्स्ट) व्हर्जन gpt-4-32k ला मर्यादित प्रवेश देत आहोत, ज्याला वेळोवेळी आपोआप अपडेट केले जाईल (सध्याचे व्हर्जन gpt-4-32k-0314 आहे, ज्याला 14 जूनपर्यंत सपोर्ट दिला जातो). किंमत $0.06 प्रति 1k प्रॉम्प्ट टोकन्स आणि $0.12 प्रति 1k कम्प्लिशन token आहे. आम्ही दीर्घ संदर्भासाठी मॉडेल क्वालिटी सुधारत आहोत आणि ते तुमच्या युज-केसमध्ये कसे काम करते यावर आम्हाला तुमचा अभिप्राय आवडेल. आम्ही 8K आणि 32K इंजिन्ससाठीच्या रिक्वेस्ट्स क्षमतेनुसार वेगवेगळ्या दराने प्रोसेस करत आहोत, त्यामुळे तुम्हाला त्यांना वेगवेगळ्या वेळांना ऍक्सेस मिळू शकतो.

निष्कर्ष

आम्हाला आशा आहे की GPT‑4 अनेक अनुप्रयोगांना शक्ती देऊन लोकांचे जीवन सुधारण्यासाठी एक मौल्यवान साधन बनेल. अजून खूप काम बाकी आहे, आणि या मॉडेलवर पुढे बांधणी करून, ते एक्सप्लोर करून आणि योगदान देऊन समुदायाच्या एकत्रित प्रयत्नांमुळे हे मॉडेल सुधारेल, अशी आम्ही अपेक्षा करतो.

परिशिष्ट

इतर भाषांमध्ये अनुवादित केलेल्या MMLU प्रश्नांचे उदाहरण. नोंद: आम्ही सुसंगत चॉइस token (A–D) वापरतो :

लोड होत आहे ...

फूटनोट्स

  1. A

    आम्ही हा बेंचमार्क चेन-ऑफ-थॉट प्रॉम्प्टिंग वापरून, प्रशिक्षण संचांमधील 4 उदाहरणांसह, इन-कॉन्टेक्स्ट मूल्यांकन करतो. विशिष्ट प्रॉम्प्ट व्हॅलिडेशन सेटवर ट्यून केले गेले.

संदर्भ

  1. 1

    P. Arredondo (Casetext/Stanford कोडेक्स), D. Katz (Stanford कोडेक्स), M. Bommarito (Stanford कोडेक्स), S. Gao (Casetext). पुढील विश्लेषण पेपरमध्ये(नवीन विंडोमध्ये उघडेल) उपलब्ध आहे.

लेखक

OpenAI