முக்கிய உள்ளடக்கத்திற்கு செல்க
OpenAI

ஆழ்ந்த கற்றலை விரிவுபடுத்தும் OpenAI இன் முயற்சியின் சமீபத்திய மைல்கல்லாக GPT‑4 ஐ நாங்கள் உருவாக்கியுள்ளோம். GPT‑4 என்பது பெரிய பல்வகைமை மாடல் (படம் மற்றும் உரை உள்ளீடுகளை ஏற்றுக்கொண்டு, உரை வெளியீடுகளை வழங்கும்) ஆகும். இது பல நிஜ உலக நிகழ்வுகளில் மனிதர்களைப் போல திறனுடையதல்ல என்றாலும், பல தொழில்முறை மற்றும் கல்வி முறைகளில் மனித அளவிலான செயல்திறனை வெளிப்படுத்துகிறது. உதாரணமாக, இது தேர்வு எழுதுபவர்களில் முதல் 10% பேரைச் சுற்றி மதிப்பெண் பெற்று உருவகப்படுத்தப்பட்ட பார் தேர்வில் தேர்ச்சி பெறுகிறது; மாறாக, GPT‑3.5 இன் மதிப்பெண் கீழ் 10% பேரைச் சுற்றியே இருந்தது. எங்கள் எதிர்மறையான சோதனைத் திட்டம் மற்றும் ChatGPT ஆகியவற்றிலுள்ள பாடங்களைப் பயன்படுத்தி GPT‑4 ஐ மீண்டும் மீண்டும் சீரமைக்க 6 மாதங்கள் செலவிட்டோம், இதன் விளைவாக உண்மைத்தன்மை, வழிநடத்துதல் மற்றும் பாதுகாப்புத் தடுப்புகளுக்கு வெளியே செல்ல மறுத்தல் ஆகியவற்றில் எங்களின் சிறந்த முடிவுகள் (சரியானவை அல்ல என்றாலும்) கிடைத்தன.

கடந்த இரண்டு ஆண்டுகளில், எங்கள் முழு ஆழ்ந்த கற்றல் அடுக்கை மீண்டும் கட்டியெழுப்பினோம், மேலும் Azure உடன் இணைந்து, எங்கள் பணிச்சுமைக்காக ஒரு சூப்பர் கம்ப்யூட்டரை புதிதாக வடிவமைத்தோம். ஒரு வருடத்திற்கு முன்பு, நாங்கள் சிஸ்டத்தின் முதல் "சோதனை ஓட்டமாக" GPT‑3.5 க்கு பயிற்சி அளித்தோம். நாங்கள் சில பிழைகளைக் கண்டறிந்து சரிசெய்தோம், எங்கள் கோட்பாட்டு அடித்தளங்களை மேம்படுத்தினோம். இதன் விளைவாக, எங்கள் GPT‑4 பயிற்சி ஓட்டம் (குறைந்தபட்சம் எங்களுக்கு!) முன்னெப்போதும் இல்லாத அளவுக்கு நிலையானதாக இருந்தது, எங்கள் முதல் பெரிய மாடலாக மாறியது, அதன் பயிற்சி செயல்திறனை முன்கூட்டியே துல்லியமாகக் கணிக்க முடிந்தது. நம்பகமான வளர்ச்சியில் நாங்கள் தொடர்ந்து கவனம் செலுத்துவதால், எதிர்கால திறன்களை முன்கூட்டியே கணித்து தயார்படுத்த உதவும் வகையில் எங்கள் வழிமுறையை மேம்படுத்துவதை நோக்கமாகக் கொண்டுள்ளோம் - இது பாதுகாப்பிற்கு முக்கியமானது என்று நாங்கள் கருதுகிறோம்.

நாங்கள் GPT‑4 இன் உரை உள்ளீட்டுத் திறனை ChatGPT மற்றும் API வழியாக ( காத்திருப்புப் பட்டியலுடன்) வெளியிடுகிறோம். பட உள்ளீட்டுத் திறனை பரந்த அளவில் கிடைக்கும்படி தயார்படுத்த, தொடங்குவதற்கு ஒரு கூட்டாளருடன்(புதிய சாளரத்தில் திறக்கும்) நெருக்கமாக இணைந்து பணியாற்றுகிறோம். கூடுதல் மேம்பாடுகளுக்கு வழிகாட்ட உதவும் வகையில், எங்கள் மாடல்களில் உள்ள குறைபாடுகள் குறித்து புகாரளிக்க எவரையும் அனுமதிக்க, AI மாடல் செயல்திறனின் தானியங்கி மதிப்பீட்டிற்கான எங்கள் கட்டமைப்பான OpenAI Evals ஐ(புதிய சாளரத்தில் திறக்கும்) நாங்கள் திறந்த மூலமாக பயன்படுத்துகிறோம்.

திறன்கள்

ஒரு சாதாரண உரையாடலில், GPT‑3.5 க்கும் GPT‑4 க்கு இடையிலான வேறுபாடு நுட்பமானதாக இருக்கலாம். பணியின் சிக்கலானது போதுமான வரம்பை அடையும் போதுதான் வேறுபாடு வெளிப்படுகிறது - GPT‑4 மிகவும் நம்பகமானது, ஆக்கப்பூர்வமானது மற்றும் GPT‑3.5 ஐ விட மிகவும் நுணுக்கமான வழிமுறைகளைக் கையாளக்கூடியது.

இந்த இரண்டு மாடல்களுக்கிடையேயான வித்தியாசத்தைப் புரிந்துகொள்ள, மனிதர்களுக்காக முதலில் வடிவமைக்கப்பட்ட தேர்வுகளை உருவகப்படுத்துதல் உட்பட, பல்வேறு அளவுகளில் சோதனை செய்தோம். சமீபத்திய பொதுவில் கிடைக்கும் தேர்வுகளைப் (ஒலிம்பியாட் மற்றும் AP இலவச பதில் கேள்விகள் எனில்) பயன்படுத்தி அல்லது 2022–2023 செய்முறைத் தேர்வுப் பதிப்புகளை வாங்கி நாங்கள் முன்னேறினோம். இந்தத் தேர்வுகளுக்காக நாங்கள் எந்த சிறப்புப் பயிற்சிகளும் பெறவில்லை. தேர்வுகளில் உள்ள சிக்கல்களில் ஒரு சிறிய பகுதியை பயிற்சியின் போது மாடல் பார்த்தது, ஆனால் முடிவுகள் வெளிப்படைய இருக்கும் என்று நாங்கள் நம்புகிறோம் - விவரங்களுக்கு எங்கள் தொழில்நுட்ப அறிக்கையைப்(புதிய சாளரத்தில் திறக்கும்) பார்க்கவும்.

உள் குறிப்பு 1

ஏற்றுகிறது...
ஏற்றுகிறது...

மெஷின் லெர்னிங் மாடல்களுக்காக வடிவமைக்கப்பட்ட பாரம்பரிய அளவுகோல்களிலும் GPT‑4 ஐ நாங்கள் மதிப்பிட்டோம். GPT‑4 தற்போதுள்ள பெரிய மொழி மாடல்களை விட குறிப்பிடத்தக்க முறையில் சிறப்பாக செயல்படுகிறது, மேலும் அளவுகோல்களுக்கு உரிய மாற்றங்கள் அல்லது கூடுதல் பயிற்சி நெறிமுறைகள் கொண்ட பல அதிநவீன (SOTA) மாடல்களையும் மிஞ்சுகிறது:

ஏற்றுகிறது...

தற்போதுள்ள பல ML அளவுகோல்கள் ஆங்கிலத்தில் எழுதப்பட்டுள்ளன. பிற மொழிகளில் திறன் குறித்த ஆரம்ப உணர்வைப் பெற, 57 பாடங்களை உள்ளடக்கிய 14,000 பல தேர்வு சிக்கல்களின் தொகுப்பான MMLU அளவுகோலை Azure Translate ஐப் பயன்படுத்தி பல்வேறு மொழிகளில் மொழிபெயர்த்தோம் ( பின் இணைப்பைப் பார்க்கவும்). சோதிக்கப்பட்ட 26 மொழிகளில் 24 மொழிகளில், GPT‑4, GPT‑3.5 மற்றும் பிற LLMகள் (Chinchilla, PaLM) ஆகியவற்றின் ஆங்கில செயல்திறனைவிட சிறப்பாக செயல்படுகிறது, அதில் குறைந்த வளமுள்ள மொழிகள் போல Latvian, Welsh மற்றும் Swahili மொழிகளும் அடங்கும்:

ஏற்றுகிறது...

நாங்கள் GPT‑4 ஐ உள்துறை பயன்பாட்டிற்காகவும் பயன்படுத்தி வருகிறோம், இது ஆதரவு, விற்பனை, உள்ளடக்கக் கட்டுப்பாடு மற்றும் நிரலாக்கம் போன்ற பணிகளில் பெரிய தாக்கத்தை ஏற்படுத்தியுள்ளது. நாங்கள் எங்கள் சீரமைப்பு உத்தியில் இரண்டாம் கட்டத்தைத் தொடங்குவதோடு, AI வெளியீடுகளை மதிப்பீடு செய்ய மனிதர்களுக்கு உதவவும் இதைப் பயன்படுத்துகிறோம்.

காட்சி உள்ளீடுகள்

GPT‑4 ஆல் உரை மற்றும் படங்களின் தூண்டுதலை ஏற்க முடியும், இது உரை மட்டுமுள்ள அமைப்பிற்கு இணையாக - பயனரை எந்தவொரு பார்வை அல்லது மொழிப் பணியையும் குறிப்பிட அனுமதிக்கிறது. குறிப்பாக, இடைப்பட்ட உரை மற்றும் படங்களைக் கொண்ட உள்ளீடுகள் கொடுக்கப்பட்ட உரை வெளியீடுகளை (இயற்கையான மொழி, குறியீடு, முதலியன) இது உருவாக்குகிறது. உரை மற்றும் புகைப்படங்களுடன் கூடிய ஆவணங்கள், வரைபடங்கள் அல்லது ஸ்க்ரீன்ஷாட்கள் போன்ற பல துறைகளில், உரை மட்டும் உள்ள உள்ளீடுகளில் காட்டும் திறன்களையே GPT‑4 காட்டுகிறது. மேலும், சில-ஷாட் மற்றும் சிந்தனைச் சங்கிலி(புதிய சாளரத்தில் திறக்கும்) தூண்டுதல் உள்ளிட்ட உரை மட்டும் உள்ள மொழி மாடல்களுக்காக உருவாக்கப்பட்ட சோதனை-நேர நுட்பங்களைப் பயன்படுத்தி இதை அதிகரிக்க முடியும். பட உள்ளீடுகள் இன்னும் ஆராய்ச்சி முன்னோட்டமாகவே உள்ளன, இவை பொதுவில் கிடைக்காது.

ஏற்றுகிறது...

நிலையான கல்விப் பார்வை அளவுகோல்களின் குறுகிய தொகுப்பில் அதை மதிப்பிடுவதன் மூலம் GPT‑4 இன் செயல்திறனை நாங்கள் முன்னோட்டம் பார்க்கிறோம். இருப்பினும், இந்த எண்ணிக்கைகள் அதன் முழு திறனையும் பிரதிபலிக்காது, ஏனெனில் மாடல் கையாளக்கூடிய புதிய மற்றும் சுவாரஸ்யமான பணிகளை நாங்கள் தொடர்ந்து கண்டுபிடித்து வருகிறோம். சோதனை நேர நுட்பங்களின் விளைவு குறித்த முழுமையான விசாரணை மூலம் மேலுமதிக் பகுப்பாய்வுகள் மற்றும் மதிப்பீட்டு எண்களை விரைவில் வெளியிட நாங்கள் திட்டமிட்டுள்ளோம்.

உள் அடிக்குறிப்புA

ஏற்றுகிறது...

வழிநடத்தும் திறன்

வழிநடத்துதல் உட்பட AI-களின் நடத்தையை வரையறுப்பது பற்றிய எங்கள் பதிவில் கோடிட்டுக் காட்டப்பட்டுள்ள திட்டத்தின் ஒவ்வொரு அம்சத்திலும் நாங்கள் பணியாற்றி வருகிறோம். நிலையான சொற்களஞ்சியம், தொனி மற்றும் பாணியுடன் கூடிய தனித்துவமான ChatGPT ஆளுமைக்குப் பதிலாக, டெவலப்பர்கள் (விரைவில் ChatGPT பயனர்கள்) இப்போது "சிஸ்டம்" செய்தியில் அந்த திசைகளை விவரிப்பதன் மூலம் தங்கள் AI இன் பாணியையும் பணியையும் பரிந்துரைக்கலாம். சிஸ்டத்தின் செய்திகள் API பயனர்கள் தங்கள் பயனர்களின் அனுபவத்தை எல்லைக்குள்(புதிய சாளரத்தில் திறக்கும்) கணிசமாகத் தனிப்பயனாக்க அனுமதிக்கின்றன. இந்த இடத்தில் தொடர்ந்து மேம்பாடுகளைச் செய்யவிருக்கிறோம் (முக்கியமாக, சிஸ்டத்தின் செய்திகள் தற்போதைய மாடலை “தடைநீக்கம்” செய்ய மிகவும் எளிய வழி என்பதை நாங்கள் அறிவோம், அதாவது, எல்லைகளுக்குள் பின்பற்றுதல் முழுமையாகவில்லை), ஆனால் இதை முயற்சித்துப் பார்த்து உங்கள் கருத்தை எங்களுக்கு தெரிவிக்குமாறு கேட்டுக்கொள்கிறோம்.

ஏற்றுகிறது...

வரம்புகள்

அதற்கு திறன்கள் இருந்தபோதிலும், GPT‑4 அதற்கு முந்தைய GPT மாடல்களைப் போலவே வரம்புகளையும் கொண்டுள்ளது. மிக முக்கியமாக, இது இன்னும் முழுமையாக நம்பகமானதல்ல (அது உண்மைகளைப் 'புனைந்து கூறுகிறது' மற்றும் காரணவிளக்கமளித்தல் பிழைகளைச் செய்கிறது). மொழி மாதிரி வெளியீடுகளைப் பயன்படுத்தும் போது, குறிப்பாக அதிக பங்குள்ள சூழல்களில், குறிப்பிட்ட பயன்பாட்டு நிகழ்வின் தேவைகளுக்குப் பொருந்தக்கூடிய சரியான நெறிமுறையுடன் (மனித மதிப்பாய்வு, கூடுதல் சூழலுடன் காரணமறிதல் அல்லது அதிக பங்குள்ள பயன்பாடுகளை முற்றிலுமாகத் தவிர்ப்பது போன்றவை) மிகுந்த கவனம் செலுத்தப்பட வேண்டும்.

GPT‑4 இன்னும் ஒரு உண்மையான பிரச்சினையாக இருந்தாலும், முந்தைய மாடல்களுடன் ஒப்பிடும்போது மாயத்தோற்றங்களைக் கணிசமாகக் குறைக்கிறது (இவை ஒவ்வொரு மறு செய்கையிலும் மேம்பட்டு வருகின்றன). எங்கள் உள்ளக எதிர்மறை உண்மை மதிப்பீடுகளில், GPT‑4 எங்கள் சமீபத்திய GPT‑3.5 ஐ விட 40% அதிக மதிப்பெண்களைப் பெற்றுள்ளது:

ஏற்றுகிறது...

TruthfulQA போன்ற வெளிப்புற அளவுகோல்களில் நாங்கள் முன்னேற்றம் அடைந்துள்ளோம், இது எதிர்மறையாக தேர்ந்தெடுக்கப்பட்ட தவறான அறிக்கைகளின் தொகுப்பிலிருந்து உண்மையைப் பிரிக்கும் மாடலின் திறனை சோதிக்கிறது. புள்ளிவிவர ரீதியாக சுவாரஸ்யமாகத் தோன்றும் உண்மைக்கு முரணான பதில்களுடன் இந்தக் கேள்விகள் இணைக்கப்பட்டுள்ளன.

ஏற்றுகிறது...

இந்தப் பணியில் GPT‑3.5 ஐ விட GPT‑4 அடிப்படை மாடல் சற்று சிறந்து விளங்குகிறது; ஆனால், RLHF பிந்தைய பயிற்சிக்குப் பிறகு (GPT‑3.5 உடன் நாங்கள் பயன்படுத்திய அதே செயல்முறையைப் பயன்படுத்தி) ஒரு பெரிய இடைவெளி உள்ளது. கீழே சில எடுத்துக்காட்டுகளைப் பார்த்தால், GPT‑4 பொதுவான சொற்றொடர்களைத் தேர்ந்தெடுக்கத் தவறுகிறது (உதாரணமாக, பழைய நாய்க்கு புதிய உத்தியைக் கற்பிக்க முடியாது), ஆனால் அதே சமயம் நுணுக்கமான விவரங்களை தவறவிடக்கூடும் (எல்விஸ் பிரெஸ்லி ஒரு நடிகரின் மகன் அல்ல).

ஏற்றுகிறது...

இந்த மாடல் அதன் வெளியீடுகளில் பல்வேறு சார்புகளைக் கொண்டிருக்கலாம், இவற்றில் நாங்கள் முன்னேற்றம் அடைந்துள்ளோம், ஆனால் இன்னும் செய்ய வேண்டியது ஏராளம் உள்ளது. எங்கள் சமீபத்திய வலைப்பதிவு இடுகையின் படி, நாங்கள் உருவாக்கும் AI அமைப்புகள் பயனர்களின் மதிப்புகளின் பரந்த அளவை பிரதிபலிக்கும் நியாயமான இயல்புநிலை நடத்தைகளைக் கொண்டிருப்பதை நோக்கமாகக் கொண்டுள்ளோம், அந்த அமைப்புகளை பரந்த எல்லைகளுக்குள் தனிப்பயனாக்க அனுமதிக்கின்றன, மேலும் அந்த எல்லைகள் என்னவாக இருக்க வேண்டும் என்பதற்கான பொது உள்ளீட்டைப் பெறுகின்றன.

GPT‑4 க்கு அதன் பெரும்பாலான தரவுகள் நிறுத்தப்பட்ட (செப்டம்பர் 2021) பின் நடந்த நிகழ்வுகள் பற்றிய அறிவு இல்லாமல் உள்ளது, மேலும் தனது அனுபவத்திலிருந்து கற்றுக்கொள்வதில்லை. பல துறைகளில் அது கொண்டுள்ள திறனுக்கு ஒத்துவராத எளிய காரணவிளக்கமளித்தல் பிழைகளை இது சில சமயங்களில் செய்யக்கூடும், அல்லது பயனரிடமிருந்து வரும் வெளிப்படையான தவறான கூற்றுகளை ஏற்றுக்கொள்வதில் அதிகப்படியான வெகுளித்தனத்துடன் காணப்படலாம். மேலும் சில நேரங்களில், மனிதர்களைப் போலவே கடினமான பிரச்சினைகளில் தோல்வியடையக்கூடும்—உதாரணமாக, இது உருவாக்கும் குறியீட்டில் பாதுகாப்பு குறைபாடுகளைச் சேர்த்துவிடலாம்.

GPT‑4 தனது கணிப்புகளில் சில நேரங்களில் மிகுந்த நம்பிக்கையுடன் தவறாக இருக்கக்கூடும், மேலும் பிழை செய்ய வாய்ப்பு இருந்தாலும் தனது பணியை மீண்டும் சரிபார்ப்பதில் கவனம் செலுத்தாது. சுவாரஸ்யம் என்னவென்றால், அடிப்படை முன்பயிற்சி செய்யப்பட்ட மாடல் மிகவும் துல்லியமாக ஒத்திசைக்கப்பட்டுள்ளது (ஒரு பதிலில் காட்டும் நம்பிக்கை அளவு, அது சரியானதாக இருப்பதற்கான சாத்தியத்துடன் பொதுவாக பொருந்துகிறது). இருப்பினும், எங்கள் தற்போதைய பயிற்சிக்குப் பிந்தைய செயல்முறையின் மூலம் அந்த ஒத்திசைவு குறைக்கப்படுகிறது.

ஏற்றுகிறது...

அபாயங்கள் மற்றும் தணிக்கும் நடவடிக்கைகள்

பயிற்சிக்கு முந்தைய தரவைத் தேர்ந்தெடுத்து வடிகட்டுதல், மதிப்பீடுகள் மற்றும் நிபுணர் ஈடுபாடு, மாதிரி பாதுகாப்பு மேம்பாடுகள் மற்றும் கண்காணிப்பு மற்றும் அமலாக்கம் உள்ளிட்ட முயற்சிகள் மூலம் பயிற்சியின் தொடக்கத்திலிருந்தே GPT‑4 ஐப் பாதுகாப்பானதாகவும் சீரமைக்கப்பட்டதாகவும் மாற்ற நாங்கள் மீண்டும் மீண்டும் முயற்சித்து வருகிறோம்.

GPT‑4 க்கு முந்தைய மாடல்களைப் போலவே பாதகமான ஆலோசனைகள், பிழைகளுடன் கூடிய குறியீடு, அல்லது தவறான தகவலை உருவாக்குவது போன்ற சில அபாயங்கள் உள்ளன. இருப்பினும், GPT‑4 இன் கூடுதல் திறன்கள் புதிய அபாய நிலைகளை உருவாக்குகின்றன. இந்த அபாயங்களின் அளவைப் புரிந்து கொள்ள, மாடலை எதிர்மறையாகச் சோதிக்க AI சீரமைப்பு அபாயங்கள், சைபர் பாதுகாப்பு, உயிரியல் ஆபத்து, நம்பிக்கை மற்றும் பாதுகாப்பு மற்றும் சர்வதேச பாதுகாப்பு போன்ற துறைகளைக் சேர்ந்த 50க்கும் மேற்பட்ட நிபுணர்களை நாங்கள் ஈடுபடுத்தினோம். மதிப்பீடு செய்ய நிபுணத்துவம் தேவைப்படும் அதிக ஆபத்துள்ள பகுதிகளில் மாடலின் நடத்தையை சோதிக்க அவர்களின் கண்டுபிடிப்புகள் எங்களுக்கு உதவின. இந்த நிபுணர்களிடமிருந்து கிடைத்த கருத்துகள் மற்றும் தரவுகள் எங்கள் மாடல் மேம்பாடுகள் மற்றும் தணிக்கும் நடவடிக்கைகளில் இணைக்கப்பட்டன; உதாரணமாக, ஆபத்தான இரசாயனங்களை உருவாக்கும் வழிகளைப் பற்றிய கோரிக்கைகளை மறுப்பதில் GPT‑4 இன் திறனை மேம்படுத்த கூடுதல் தரவுகளை சேகரித்துள்ளோம்.

RLHF பயிற்சியின் போது, தீங்கு விளைவிக்கும் வெளியீடுகளைக் குறைக்க (எங்கள் பயன்பாட்டு வழிகாட்டுதல்களால்(புதிய சாளரத்தில் திறக்கும்) வரையறுக்கப்பட்டுள்ளபடி) அத்தகைய உள்ளடக்கத்திற்கான கோரிக்கைகளை மறுக்க மாடலைப் பயிற்றுவிப்பதன் மூலம் கூடுதல் பாதுகாப்பு வெகுமதி சிக்னலை GPT‑4 ஒருங்கிணைக்கிறது. பாதுகாப்பு தொடர்பான ப்ராம்ப்ட்களின்படி பாதுகாப்பு எல்லைகள் மற்றும் நிறைவு பாணியை மதிப்பிடும் GPT‑4 ஜீரோ-ஷாட் வகைப்படுத்தியால் இந்த வெகுமதி வழங்கப்படுகிறது. செல்லுபடியாகும் கோரிக்கைகளை மாடல் நிராகரிப்பதைத் தடுக்க, பல்வேறு மூலங்களிலிருந்து (எ.கா., பெயரிடப்பட்ட உற்பத்தித் தரவு, மனித ரெட்-டீமிங், மாடல் உருவாக்கிய ப்ராம்ட்கள்) பல்வேறு தரவுத்தொகுப்பைச் சேகரித்து, அனுமதிக்கப்பட்ட மற்றும் அனுமதிக்கப்படாத வகைகளில் பாதுகாப்பு வெகுமதி சிக்னல்களை (நேர்மறை அல்லது எதிர்மறை மதிப்புடன்) பயன்படுத்துகிறோம். 

GPT‑3.5 உடன் ஒப்பிடும்போது எங்கள் தணிப்புகள் GPT‑4 இன் பல பாதுகாப்பு பண்புகளைக் கணிசமாக மேம்படுத்தியுள்ளன. GPT‑3.5 உடன் ஒப்பிடும்போது, அனுமதிக்கப்படாத உள்ளடக்கத்திற்கான கோரிக்கைகளுக்கு பதிலளிக்கும் மாடலின் போக்கை 82% குறைத்துள்ளோம், மேலும் எங்கள் கொள்கைகளின்படி GPT‑4 ஆனது 29% க்கும் அதிகமாக முக்கியமான கோரிக்கைகளுக்கு (எ.கா. மருத்துவ ஆலோசனை மற்றும் சுய தீங்கிழைத்தல்) பதிலளிக்கிறது.

ஏற்றுகிறது...
ஏற்றுகிறது...

மொத்தத்தில், எங்கள் மாடல்-அடிப்படையிலான தலையீடுகள் தீய நடத்தை வெளிப்படுத்துவதைக் கடினமாக்குகின்றன, ஆனால் அவ்வாறு செய்வது இன்னும் சாத்தியமாகவே உள்ளது. மேலும், எங்கள் பயன்பாட்டு வழிகாட்டுதல்களை மீறும் உள்ளடக்கத்தை உருவாக்க இன்னும் "தடை நிக்குதல்கள்" உள்ளன. AI அமைப்புகளின் "ஒரு டோக்கனுக்கான ஆபத்து" அதிகரிக்கும் போது, இந்தத் தலையீடுகளில் மிக உயர்ந்த அளவிலான நம்பகத்தன்மையை அடைவது மிக முக்கியமானதாக மாறும்; இப்போதைக்கு, துஷ்பிரயோகத்தைக் கண்காணித்தல் போன்ற வரிசைப்படுத்தல்-நேர பாதுகாப்பு நுட்பங்களுடன் இந்த வரம்புகளை பூர்த்தி செய்வது முக்கியமானதாகும்.

GPT‑4 மற்றும் அதன் அடுத்தடுத்த மாடல்கள், நன்மை மற்றும் தீமை ஆகிய இரு வழிகளிலும் சமுதாயத்தில் பெரிய தாக்கத்தை ஏற்படுத்தும் திறன் கொண்டவை. எதிர்கால சிஸ்டங்களில் உருவாகக்கூடிய அபாயகரமான திறன்களை மதிப்பிடவும், சாத்தியமான தாக்கங்களைப் புரிந்து மதிப்பிடும் முறைகளை மேம்படுத்தவும் நாங்கள் வெளிப்புற ஆராய்ச்சியாளர்களுடன் இணைந்து பணிபுரிகிறோம். GPT‑4 மற்றும் பிற AI சிஸ்டங்களின் சமூக மற்றும் பொருளாதார விளைவுகள் குறித்த எங்கள் பார்வைகளை விரைவில் இன்னும் அதிகமாக பகிரவிருக்கிறோம்.

பயிற்சி செயல்முறை

முந்தைய GPT மாடல்களைப் போலவே, GPT‑4 அடிப்படை மாடல் ஒரு ஆவணத்தில் அடுத்த வார்த்தையை கணிக்க பயிற்சியளிக்கப்பட்டது, மேலும் பொதுவாகக் கிடைக்கும் தரவுகள் (எ.கா., இணையத் தரவு) மற்றும் நாங்கள் உரிமம் பெற்ற தரவுகளைப் பயன்படுத்தி பயிற்சியளிக்கப்பட்டது. இந்த தரவு என்பது வெப் அளவிலான ஒரு காப்பகம் ஆகும், இதில் கணிதப் பிரச்சனைகளுக்கான சரியான மற்றும் தவறான தீர்வுகள், பலவீனமான மற்றும் வலுவான காரணவிளக்கங்கள், தனக்குள்ளேயே முரண்படும் மற்றும் ஒத்த கூற்றுகள் ஆகியவை உள்ளடக்கப்பட்டுள்ளன, மேலும் இது பல்வேறு சிந்தனைகள் மற்றும் கருத்துக்களைப் பிரதிபலிக்கிறது.

எனவே, ஒரு கேள்வி கொடுக்கப்படும் போது, அடிப்படை மாடல் பயனரின் நோக்கத்திலிருந்து மாறுபட்ட பல்வேறு வழிகளில் பதிலளிக்கக்கூடும். பாதுகாப்புத் தடுப்புகளுக்குள் பயனரின் நோக்கத்தை ஒத்திசைக்க, மனித பின்னூட்டத்துடன் கூடிய (RLHF) மீளுறுதிக் கற்றலைப் பயன்படுத்தி மாடலின் நடத்தையை நாங்கள் நன்றாகச் சீரமைக்கிறோம்.

மாடலின் திறன்கள் முக்கிய பயிற்சிக்கு முந்தைய செயல்முறையிலிருந்து வருவதாகத் தெரிகிறது என்பதை நினைவில் கொள்ளவும் - RLHF தேர்வு செயல்திறனை மேம்படுத்தாது (தீவிர முயற்சி இல்லாமல், அது உண்மையில் அதைக் குறைக்கிறது). ஆனால் மாடலின் திசைமாற்றம் பயிற்சிக்குப் பிந்தைய செயல்முறையிலிருந்து வருகிறது - அடிப்படை மாதிரி கேள்விகளுக்கு பதிலளிக்க வேண்டும் என்பதை அறிய உடனடி இயந்திரவியல் தேவைப்படுகிறது.

கணிக்கக்கூடிய அளவீடு

GPT‑4 திட்டத்தின் ஒரு பெரிய நோக்கம் என்னவென்றால் கணிக்கக்கூடிய அளவில் அளவிடக்கூடிய ஒரு ஆழமான கற்றல் அடுக்கை உருவாக்குவதாகும். முக்கிய காரணம் என்னவெனில், GPT‑4 போன்ற மிகப்பெரிய பயிற்சி இயக்கங்களுக்கு விரிவான மாடல்-அடிப்படையிலான ட்யூனிங் செய்வது சாத்தியமில்லை. பல்வேறு அளவுகளில் மிகவும் கணிக்கக்கூடிய நடத்தையை வெளிப்படுத்தும் கட்டமைப்பையும் மேம்பாட்டையும் நாங்கள் உருவாக்கினோம். இந்த அளவீட்டை உறுதிப்படுத்த, அதே முறைமையைப் பயன்படுத்தி ஆனால் 10,000 மடங்கு குறைந்த கணினி வளங்களுடன் பயிற்சி செய்யப்பட்ட மாடல்களிலிருந்து கணித்து, எங்கள் உள்ளக குறியீட்டுத்தளத்தில் (பயிற்சி தொகுப்பின் ஒரு பகுதி அல்ல) GPT‑4 இன் இறுதி இழப்பை நாங்கள் முன்கூட்டியே துல்லியமாக கணித்தோம்:

ஏற்றுகிறது...

பயிற்சியின் போது (இழப்பு) மேம்படுத்தும் அளவீட்டை இப்போது எங்களால் துல்லியமாகக் கணிக்க முடியும் என்பதால், மேலும் புரிந்துகொள்ளக்கூடிய அளவீடுகளைக் கணிக்கும் முறையை நாங்கள் உருவாக்கத் தொடங்குகிறோம். எடுத்துக்காட்டாக, 1,000 மடங்கு குறைவான கணக்கீடு கொண்ட மாடல்களிலிருந்து முன்னறிவிப்பு செய்து, HumanEval(புதிய சாளரத்தில் திறக்கும்) தரவுத்தொகுப்பின் துணைக்குழுவில் உள்ள தேர்ச்சி விகிதத்தை நாங்கள் வெற்றிகரமாக கணித்தோம்:

ஏற்றுகிறது...

சில திறன்கள் இன்னும் கணிக்க கடினமாக உள்ளன. உதாரணமாக, தலைகீழ் அளவீட்டுப் பரிசு என்பது மாதிரிக் கணக்கீடு அதிகரிக்கும் போது மோசமாகிவிடும் ஒரு அளவீட்டைக் கண்டுபிடிக்கும் போட்டியாகும், மேலும் பின்னோக்கிய புறக்கணிப்பு(புதிய சாளரத்தில் திறக்கும்) வெற்றியாளர்களில் ஒன்றாக இருந்தது. மற்றொரு சமீபத்திய முடிவைப் போலவே,(புதிய சாளரத்தில் திறக்கும்) GPT‑4 அந்தப் போக்கை மாற்றியுள்ளது:

ஏற்றுகிறது...

எதிர்கால மெஷின் லெர்னிங் திறன்களை துல்லியமாக கணிப்பது பாதுகாப்பின் ஒரு முக்கிய அம்சம் என்று நாங்கள் நம்புகிறோம், ஆனால் அதன் தாக்கத்தை ஒப்பிடும்போது இதற்கான கவனம் போதுமானதாக இல்லை (எனினும் பல நிறுவனங்களின் முயற்சிகள் எங்களை உற்சாகப்படுத்துகின்றன). எதிர்கால சிஸ்டம்களில் எதை எதிர்பார்க்கலாம் என்பதில் சமூகத்திற்கு சிறந்த வழிகாட்டுதலை வழங்கும் முறைகளை உருவாக்க எங்கள் முயற்சிகளை விரிவுபடுத்தி வருகிறோம், மேலும் இது துறையின் பொதுவான இலக்காக மாறும் என நம்புகிறோம்.

OpenAI Evals

நாங்கள் OpenAI Evals ஐ(புதிய சாளரத்தில் திறக்கும்) திறந்த மூலதனமாக்குகிறோம், இது GPT‑4 போன்ற மாடல்களை மதிப்பிடுவதற்கான வரையறைகளை உருவாக்கி இயக்குவதற்கான எங்கள் மென்பொருள் கட்டமைப்பாகும், அதே நேரத்தில் அவற்றின் செயல்திறன் மாதிரியை மாதிரியாக ஆய்வு செய்கிறோம். எங்கள் மாடல் மேம்பாட்டுக்கு வழிகாட்ட Evals ஐப் பயன்படுத்துகிறோம் (பிழைகளை கண்டறிதல், செயல்பாட்டுக் குறைபாடுகளைத் தவிர்த்தல் இரண்டிற்கும்), மேலும் எங்கள் பயனர்களால் இதைப் பயன்படுத்தி மாடல் பதிப்புகளுக்கு இடையிலான செயல்திறனை கண்காணிக்கவும் (இப்போது இது தொடர்ச்சியாக வெளியிடப்படப்படும்), மேம்படும் தயாரிப்பு ஒருங்கிணைப்புகளையும் பின்தொடரவும் முடியும். உதாரணமாக, Stripe தனது GPT அடிப்படையிலான ஆவணப்படுத்தல் கருவியின் துல்லியத்தை அளவிட, மனித மதிப்பீடுகளுக்கு இணையாக Evals ஐப் பயன்படுத்தியுள்ளது.

குறியீடு முற்றிலும் திறந்த மூலமாக இருப்பதால், தனிப்பயன் மதிப்பீட்டு தர்க்கத்தை(புதிய சாளரத்தில் திறக்கும்) செயல்படுத்த புதிய வகுப்புகளை எழுதுவதை Evals ஆதரிக்கிறது. இருப்பினும், எங்கள் சொந்த அனுபவத்தில், பல அளவுகோல்கள் ஒரு சில "டெம்பிளேட்களில்" ஒன்றைப் பின்பற்றுகின்றன, எனவே உள்ளுக்குள் மிகவும் பயனுள்ளதாக இருந்த டெம்பிளேட்களையும் நாங்கள் சேர்த்துள்ளோம்(புதிய சாளரத்தில் திறக்கும்) ("model-graded evals" க்கான டெம்பிளேட் உட்பட - GPT‑4 அதன் சொந்த வேலையைச் சரிபார்க்கும் திறன் கொண்டது என்பதை நாங்கள் கண்டறிந்துள்ளோம்). பொதுவாக, தரவை வழங்குவதோடு இந்த டெம்பிளேட்களில் ஒன்றை உருவாக்குவதே ஒரு புதிய eval ஐ உருவாக்குவதற்கான(புதிய சாளரத்தில் திறக்கும்) மிகவும் பயனுள்ள வழியாகும். இந்த டெம்பிளேட்களையும் Evals-யையும் பயன்படுத்தி மற்றவர்களால் எதை உருவாக்க முடியும் என்பதைப் பார்க்க நாங்கள் ஆர்வமாக உள்ளோம்.

Evals பல்வேறு தோல்வி மாதிரிகளையும் சிக்கலான பணிகளையும் பிரதிநிதித்துவப்படுத்தும், அளவுகோல்களைப் பகிர்ந்து, கூட்டுப்பங்களிப்பில் உருவாக்குவதற்கான ஒரு தளமாக மாறும் என்று நாங்கள் நம்புகிறோம். உதாரணமாக, அதைப் பின்பற்றுவதற்கு, GPT‑4 தோல்வியடையும் பத்து ப்ராம்ட்களைக் கொண்ட ஒரு லாஜிக் புதிர்கள்(புதிய சாளரத்தில் திறக்கும்) eval ஐ நாங்கள் உருவாக்கியுள்ளோம். Evals ஏற்கனவே உள்ள அளவுகோல்களை செயல்படுத்துவதிலும் இணக்கமானது; கல்வித் தர அளவுகோல்களை செயல்படுத்தும் பல குறிப்பேடுகளையும்(புதிய சாளரத்தில் திறக்கும்), CoQA(புதிய சாளரத்தில் திறக்கும்) (இன் சிறிய துணைக்குழுக்கள்) ஒருங்கிணைப்பின் சில மாறுபாடுகளையும் ஒரு எடுத்துக்காட்டாக நாங்கள் சேர்த்துள்ளோம்.

எங்கள் மாடல்களை சோதிக்கவும், சுவாரஸ்யமான எடுத்துக்காட்டுகளை சமர்ப்பிக்கவும் அனைவரையும் Evals ஐப் பயன்படுத்துமாறு அழைக்கிறோம். எங்கள் மாடல்களைப் பயன்படுத்துவதற்கும் கட்டமைப்பதற்கும் Evals ஒரு ஒருங்கிணைந்த பகுதியாக இருக்கும் என்று நாங்கள் நம்புகிறோம், மேலும் நேரடி பங்களிப்புகள், கேள்விகள் மற்றும் கருத்துக்களை(புதிய சாளரத்தில் திறக்கும்) நாங்கள் வரவேற்கிறோம்.

ChatGPT Plus

ChatGPT Plus சந்தாதாரர்கள் கட்டுப்பாடுடன் GPT‑4 அணுகலைப் பெறுவார்கள் chatgpt.com(புதிய சாளரத்தில் திறக்கும்) . நடைமுறையில் தேவை மற்றும் சிஸ்டத்தித்தின் செயல்திறனைப் பொறுத்து சரியான பயன்பாட்டு வரம்பை நாங்கள் சரிசெய்வோம், ஆனால் கடுமையான திறன் கட்டுப்படுத்தப்படும் என்று நாங்கள் எதிர்பார்க்கிறோம் (எனினும் வரவிருக்கும் மாதங்களில் நாங்கள் அளவை அதிகரித்து மேம்படுத்துவோம்).

நாங்கள் பார்க்கும் போக்குவரத்து முறைகளைப் பொறுத்து, அதிக அளவிலான GPT‑4 பயன்பாட்டிற்கு நாங்கள் ஒரு புதிய சந்தா நிலையை அறிமுகப்படுத்தலாம்; சந்தா இல்லாதவர்களும் அதை முயற்சிக்கக்கூடிய வகையில், சில சமயங்களில் சில இலவச GPT‑4 வினவல்களை வழங்குவோம் என்று நம்புகிறோம்.

API

GPT‑4 API க்கான அணுகலைப் பெற (இது gpt-3.5-turbo போன்ற அதே ChatCompletions API(புதிய சாளரத்தில் திறக்கும்) ஐப் பயன்படுத்துகிறது), தயவுசெய்து எங்கள் காத்திருப்புப் பட்டியலுக்குப் பதிவு செய்யவும். இன்று சில டெவலப்பர்களை அழைத்து, தேவைக்கும் திறனுக்கும் இடையில் சமநிலையை உருவாக்க படிப்படியாக விரிவாக்குவோம். நீங்கள் AI அல்லது AI சீரமைப்பு சிக்கல்களின் சமூக தாக்கத்தைப் பற்றிய ஆய்வுகளை மேற்கொள்ளும் ஆராய்ச்சியாளராக இருந்தால், எங்கள் ஆராய்ச்சியாளர் அணுகல் திட்டம் மூலம் மானியத்துடன் கூடிய அணுகலுக்கு நீங்கள் விண்ணப்பிக்கலாம்.

உங்களுக:கு அணுகல் கிடைத்தவுடன், நீங்கள் gpt-4 மாடலுக்கு உரை மட்டு பயன்படுத்தி கோரிக்கைகளை வைக்கலாம் (பட உள்ளீடுகள் இன்னும் குறைந்த அளவிலான ஆல்பா நிலையில்தான் உள்ளன). நாங்கள் காலப்போக்கில் புதிய பதிப்புகளை வெளியிடும் போதெல்லாம் பரிந்துரைக்கப்படும் நிலையான மாடலாக தானாகவே புதுப்பிக்கப்படும். நீங்கள் gpt-4-0314 ஐ அழைப்பதன் மூலம் தற்போதைய பதிப்பை பின் செய்யலாம், இதற்கு ஜூன் 14 வரை நாங்கள் ஆதரவு அளிப்போம் 1,000 ப்ராம்ப்ட் டோக்கன்களுக்கு $0.03 மற்றும் 1,000 கம்ப்ளீஷன் டோக்கன்களுக்கு $0.06 என்ற விலையில் உள்ளது. இயல்புநிலை விகித வரம்புகள் நிமிடத்திற்கு 40,000 டோக்கன்கள் மற்றும் நிமிடத்திற்கு 200 கோரிக்கைகள் ஆகும்.

gpt-4 இல் 8,192 டோக்கன்கள் சூழல் நீளம் உள்ளது. எங்கள் 32,768–சூழல் (சுமார் 50 பக்க உரை) பதிப்பான gpt-4-32k-க்கும் நாங்கள் வரையறுக்கப்பட்ட அணுகலை வழங்குகிறோம், இது காலப்போக்கில் தானாகவே புதுப்பிக்கப்படும் (தற்போதைய பதிப்பான gpt-4-32k-0314 ஜூன் 14 வரை ஆதரிக்கப்படும்). 1,000 ப்ராம்ப்ட் டோக்கன்களுக்கு $0.06 மற்றும் 1,000 கம்ப்ளீஷன் டோக்கன்களுக்கு $0.12 என்ற விலையில் உள்ளது. நீண்ட சூழலுக்கான மாடலின் தரத்தை நாங்கள் இன்னும் மேம்படுத்தி வருகிறோம், மேலும் உங்கள் பயன்பாட்டுச் சூழலில் இது எவ்வாறு செயல்படுகிறது என்பது குறித்த கருத்துகளை அறிய விரும்புகிறோம். திறன் அடிப்படையில் 8K மற்றும் 32K என்ஜின்களுக்கான கோரிக்கைகள் வேறுபட்ட விகிதங்களில் செயலாக்கப்படுகின்றன, எனவே அவற்றிற்கான அணுகலை நீங்கள் வேறு வேறு நேரங்களில் பெறலாம்.

முடிவு

பல பயன்பாடுகளுக்குத் திறனளிப்பதன் மூலம் மனிதர்களின் வாழ்க்கையை மேம்படுத்தும் ஒரு மதிப்புமிக்க கருவியாக GPT‑4 உருவாகும் என நாங்கள் எதிர்பார்க்கிறோம். இன்னும் நிறைய செய்ய வேண்டிய பணிகள் உள்ளன, மேலும் மாடலின் மீது உருவாக்கும், ஆராயும், பங்களிக்கும் சமூகத்தின் கூட்டு முயற்சிகள் மூலம் இந்த மாடலை மேம்படுத்துவோம் என்று நாங்கள் எதிர்பார்க்கிறோம்.

பின்இணைப்பு

பிற மொழிகளில் மொழிபெயர்க்கப்பட்ட MMLU கேள்விகளின் உதாரணம். குறிப்பாக, நாங்கள் ஒரே மாதிரியான தேர்வு டோக்கன்களையே (A–D) பயன்படுத்துகிறோம்:

ஏற்றுகிறது...

அடிக்குறிப்புகள்

  1. A

    சூழலில் அமைக்கப்பட்டுள்ள பயிற்சியிலிருந்து 4 எடுத்துக்காட்டுகளைக் கொண்டு, செயின்-ஆஃப்-தாட் ப்ராம்ப்டிங்கைப் பயன்படுத்தி இந்த அளவுகோலை நாங்கள் மதிப்பீடு செய்கிறோம். குறிப்பிட்ட ப்ராம்பட் சரிபார்ப்பு தொகுப்பில் டியூன் செய்யப்பட்டது.

குறிப்புகள்

  1. 1

    P. Arredondo (Casetext/Stanford CodeX), D. Katz (Stanford CodeX), M. Bommarito (Stanford CodeX), S. Gao (Casetext). மேலும் பகுப்பாய்வு ஆய்வுக் கட்டுரையில்(புதிய சாளரத்தில் திறக்கும்) கிடைக்கிறது.

ஆசிரியர்

OpenAI