முக்கிய உள்ளடக்கத்திற்கு செல்க
OpenAI

எங்கள் அணுகுமுறையின் உள்ளே மாடல் ஸ்பெக்

AI அமைப்புகள் மேலும் திறனடையவும் பரவலாகப் பயன்படுத்தப்படவும் தொடங்கியுள்ள நிலையில், அவை எவ்வாறு நடந்து கொள்ள வேண்டும் என்பதற்கான தெளிவான பொது கட்டமைப்பு தேவைப்படுகிறது.

ஏற்றுகிறது…

OpenAI-யில், நாங்கள் AI நியாயமானதாகவும், பாதுகாப்பானதாகவும், சுதந்திரமாகக் கிடைக்கக்கூடியதாகவும் இருக்க வேண்டும் என்று நம்புகிறோம். இதனால் மேலும் பலர் அதை கடினமான பிரச்சினைகளைத் தீர்க்க, வாய்ப்புகளை உருவாக்க, மற்றும் ஹெல்த், அறிவியல், கல்வி, வேலை மற்றும் அன்றாட வாழ்க்கை போன்ற துறைகளில் பயனடைய பயன்படுத்த முடியும். AI-க்கான ஜனநாயகமயமான அணுகலே முன்னேறுவதற்கான சிறந்த பாதை என்று நாங்கள் நம்புகிறோம்: அதன் நன்மைகள் அல்லது கட்டுப்பாடு சிலரின் கைகளில் மட்டுமே குவிந்திருக்கும் AI அல்ல, மாறாக அதிகமான மக்கள் அணுகவும், புரிந்துகொள்ளவும், அதன் வடிவமைப்பில் பங்களிக்கவும் முடியும் AI.

அதுவே OpenAI மாடல் ஸ்பெக் இருப்பதற்கான முக்கிய காரணமாகும். மாடல் ஸ்பெக்(புதிய சாளரத்தில் திறக்கும்) என்பது மாடல் நடத்தைக்கான எங்கள் முறையான கட்டமைப்பாகும். பயனர்கள் தினமும் மாடல்களிடம் கேட்கும் நம்பமுடியாத அளவுக்கு பரந்த வகையான வினவல்களின் முழு வரம்பிலும், மாடல்கள் எவ்வாறு வழிமுறைகளைப் பின்பற்ற வேண்டும், முரண்பாடுகளைத் தீர்க்க வேண்டும், பயனர் சுதந்திரத்தை மதிக்க வேண்டும், மற்றும் பாதுகாப்பாக நடந்து கொள்ள வேண்டும் என்பதைக் இது வரையறுக்கிறது. மொத்தத்தில், மாடலின் நோக்கமுள்ள நடத்தையை வெளிப்படையாகக் காட்டுவதற்கான எங்கள் முயற்சிதான் இது: எங்கள் பயிற்சி செயல்முறையின் உள்ளேயே மட்டுமல்ல, பயனர்கள், டெவலப்பர்கள், ஆராய்ச்சியாளர்கள், கொள்கை நிர்ணயாளர்கள், மற்றும் பரந்த பொதுமக்கள் உண்மையில் படித்து, ஆய்வு செய்து, விவாதிக்கக்கூடிய ஒரு வடிவிலும்.

மாடல் ஸ்பெக் என்பது, எங்கள் மாடல்கள் இன்று ஏற்கனவே இந்த வகையில் முழுமையாக செயல்படுகின்றன என்ற கூற்று அல்ல. பல வழிகளில், இது விளக்கமளிப்பதாக உள்ளது, ஆனால் மாடலின் செயல்பாடு செல்ல வேண்டிய திசைக்கான ஒரு இலக்காகவும் இது அமைகிறது. நாங்கள் நோக்கமிடும் நடத்தையை மேலும் தெளிவாக்குவதற்காக இதைப் பயன்படுத்துகிறோம்; இதனால் அதை நோக்கிப் பயிற்றுவிக்கவும், அதனுடன் ஒப்பிட்டு மதிப்பிடவும், காலப்போக்கில் அதை மேம்படுத்தவும் முடிகிறது. 

இந்த பதிவு மாடல் ஸ்பெக்கில் இடம்பெறாத பின்னணியைப் பகிர்கிறது, அதில் அதன் தத்துவமும் செயல்முறைகளும் அடங்கும்: இது எவ்வாறு கட்டமைக்கப்பட்டுள்ளது, அந்தக் கட்டமைப்பு தேர்வுகளை நாங்கள் ஏன் செய்தோம், மேலும் அதை எவ்வாறு எழுதுகிறோம், செயல்படுத்துகிறோம் மற்றும் மேம்படுத்துகிறோம் என்பதையும் விளக்குகிறது.

மாடல் நடத்தையின் பொது கட்டமைப்பு

மாடல் ஸ்பெக் என்பது OpenAI இன் பாதுகாப்பான மற்றும் பொறுப்புணர்வுள்ள AI-க்கான விரிவான அணுகுமுறையின் ஒரு பகுதியாகும். பிரிபேர்ட்நெஸ் ஃப்ரேம்வொர்க் அதிநவீன திறன்களால் ஏற்படும் அபாயங்களையும், அவற்றின் அதிகரிப்பின் போது தேவையான பாதுகாப்புகளையும் கவனிக்கும். மாடல் ஸ்பெக் வேறுபட்ட ஆனால் இணக்கமான கேள்வியை எடுத்துரைக்கிறது: பல்வேறு சூழ்நிலைகளில் எங்கள் மாடல்கள் எவ்வாறு நடந்து கொள்ள வேண்டும் என்பதைக் குறித்து. இன்னும் பரந்த கண்ணோட்டத்தில் பார்க்கும்போது, மேலும் திறன் வாய்ந்த அமைப்புகள் பயன்படுத்தப்படத் தொடங்கும் நிலையில், மேம்பட்ட AI-யின் நன்மைகளை சமூகத்திற்கு வழங்குவதோடு, இடையூறுகளையும் உருவாகும் அபாயங்களையும் குறைப்பது என்ற பரந்த சமூகச் சவாலைக் கையாள்வதே AI மீள்திறனின் நோக்கமாகும். மொத்தத்தில், இந்த முயற்சிகள் AGI-க்கான மாற்றத்தை படிப்படியாகவும், திரும்பத் திரும்ப மேம்படுத்தக்கூடியதாகவும், ஜனநாயக ரீதியில் புரிந்துகொள்ளக்கூடியதாகவும் மாற்ற உதவுகின்றன: மக்களும் நிறுவனங்களும் தங்களைச் சீரமைக்க நேரம் பெறுவதோடு, சக்திவாய்ந்த AI மனித நலன்களுடன் ஒத்திசைவாக இருக்க தேவையான பாதுகாப்பு ஏற்பாடுகள், பொறுப்புக்கூறு அமைப்புகள் மற்றும் பொதுமக்கள் புரிதலை உருவாக்குவதை உள்ளடக்குகின்றன.

மாடல் நடத்தையைப் பற்றிய பொதுமக்களின் தெளிவான புரிதல், நியாயத்தன்மைக்கும் பாதுகாப்பிற்கும் முக்கியமானது. இது நியாயத்திற்குப் முக்கியமானது, ஏனெனில் AI தங்களை எவ்வாறு மற்றும் ஏன் அந்த வகையில் நடத்துகிறது என்பதை மக்கள் புரிந்துகொள்ள வேண்டும். மேலும், நியாயம் தொடர்பான கவலைகள் எழும்போது, அவற்றை அடையாளம் கண்டு, கேள்வி எழுப்பி, தீர்வு காணவும் அவர்களுக்கு முடியும் வகையில் இருக்க வேண்டும். மேலும், இது பாதுகாப்பிற்கும் முக்கியமானது. ஏனெனில் AI அமைப்புகள் மேலும் திறனுள்ளவையாக மாறிக்கொண்டிருக்கும்போது, அவை எவ்வாறு நடந்து கொள்ள வேண்டும் என்று நோக்கப்படுகின்றன, அவை உள்ளடக்கியுள்ள பரிமாற்றச் சமநிலைகள் என்ன, மற்றும் அந்தத் தேர்வுகளை காலப்போக்கில் எவ்வாறு மேம்படுத்தலாம் என்பதற்காக மக்கள் மற்றும் நிறுவனங்களுக்கு இன்னும் தெளிவான எதிர்பார்ப்புகள் தேவைப்படுகின்றன. அந்த வகையான வாசிப்புத் தெளிவும், மேலும் பலருக்கு ஆய்வு செய்யவும், கேள்வி எழுப்பவும், மேம்படுத்தவும் ஒரு தெளிவான அடிப்படையை வழங்குவதன் மூலம் மீள்தன்மையை ஆதரிக்கிறது.

2024-இல் வெளியான முதல் பதிப்பிலிருந்து, பயனர்களின் விருப்பங்களையும் தேவைகளையும் பற்றி மேலும் அறிந்துகொள்ளும்போது, அதிகமான திறன்களை உள்ளடக்கும்வகையில் விரிவடைந்து அவற்றுக்கு ஏற்ப தழுவிக்கொள்ளும்போது, மேலும் மாடல் நடத்தைகள் மற்றும் மாடல் ஸ்பெக் பற்றிய பொதுமக்களின் கருத்துக்களிலிருந்து கற்றுக்கொள்ளும்போது, மாடல் ஸ்பெக் கணிசமாக வளர்ச்சியடைந்துள்ளது. படிப்படியான வெளியீட்டின் உணர்வில், மாடல் ஸ்பெக் என்பது அடிப்படை மதிப்புகளையும் வெளிப்படையான, தெளிவான விதிகளையும் உள்ளடக்கிய, தொடர்ந்து பரிணமிக்கும் ஆவணமாகும். உண்மையான உலகப் பயன்பாடு மற்றும் பின்னூட்டத்திலிருந்து கற்றுக்கொள்ளும் போது, தனிப்பட்ட கூறுகளை மாற்றுவதற்கான செயல்முறையுடன் இது இணைக்கப்பட்டுள்ளது. AI எவ்வாறு பயன்படுத்தப்படுகிறது மற்றும் AI-யின் நடத்தை எவ்வாறு வடிவமைக்கப்படுகிறது என்பதில் மனிதகுலம் கட்டுப்பாட்டில் இருக்க உதவுவதற்காக, கூட்டு சீரமைப்பு போன்ற பொதுமக்கள் கருத்து தெரிவிக்கும் வழிமுறைகளில் நாங்கள் முதலீடு செய்கிறோம்.

உள்ளார்ந்த வகையில், இது நோக்கமுடைய நடத்தைக்கான ஒரு வழிகாட்டும் திசைகாட்டியாகவும், பயிற்சி, மதிப்பீடு, மற்றும் ஆளுகைக்கான ஒரு பகிரப்பட்ட கட்டமைப்பாகவும் எங்களுக்கு செயல்படுகிறது. வெளிப்புறமாக, இது மக்கள் எங்கள் அணுகுமுறையைப் புரிந்துகொள்ளவும், அதை விமர்சிக்கவும், காலப்போக்கில் அதை மேம்படுத்த உதவவும் பயன்படுத்தக்கூடிய ஒரு பொதுவான குறிப்பு புள்ளியை உருவாக்குகிறது.

மாடல் ஸ்பெக் இல் என்ன உள்ளது

மாடல் ஸ்பெக் பல்வேறு வகையான மாடல் வழிகாட்டுதல்களால் உருவாக்கப்பட்டுள்ளது. அது வேண்டுமென்றே செய்யப்பட்டது. மாடல் நடத்தையின் வெவ்வேறு பகுதிகளை வெவ்வேறு முறைகளில் கையாள வேண்டும்; மேலும் பயனுள்ள ஒரு பொது ஆவணம், விதிகளை மட்டும் பட்டியலிடாமல் அதற்கும் மேலாக செய்ய வேண்டும்.

உயர் மட்ட நோக்கம் மற்றும் பொது உறுதிப்பாடுகள்

மாடல் ஸ்பெக் உயர்மட்ட நோக்கத்துடன் தொடங்குகிறது: சிஸ்டம் மட்டத்தில் நாம் எதை மேம்படுத்த முயல்கிறோம், ஏன் என்பதற்கான தெளிவான விளக்கம்.

இந்த முன்னுரை எங்கள் பணி நோக்கத்தை எவ்வாறு முன்னெடுக்க திட்டமிட்டுள்ளோம் என்பதற்கான மூன்று குறிக்கோள்களை தெளிவுபடுத்துகிறது:

  • டெவலப்பர்கள் மற்றும் பயனர்களுக்கு அதிகாரமளிக்கும் மாடல்களை முறையாகவும் தொடர்ச்சியாகவும் செயல்படுத்துங்கள்
  • தடுக்கவும் எங்கள் மாடல்கள் பயனர்களுக்கோ அல்லது பிறருக்கோ மிகக் கடுமையான தீங்கை ஏற்படுத்துவதை
  • தக்கவைத்தல் OpenAI-யின் செயல்படுவதற்கான உரிமம்

அதன்பின், நடைமுறையில் இந்த இலக்குகளைச் சமநிலைப்படுத்துவது குறித்து நாம் எவ்வாறு சிந்திக்கிறோம் என்பதையும், அடுத்து வரும் மேலும் விரிவான கோட்பாடுகளுக்கு ஆதரவாக அமையும் வகையில் அந்தப் பரிமாற்றத் தேர்வுகளை தெளிவாக விளக்குகிறது.

முக்கியமாக, இந்த முன்னுரை மாடலுக்கான நேரடி வழிமுறையாக நோக்கமாகக் கொண்டதல்ல. மனிதகுலத்திற்கு பயன் அளிப்பது OpenAI இன் இலக்காகும்; ஆனால் அது எங்கள் மாடல்கள் தன்னிச்சையாக பின்பற்ற வேண்டும் என்று நாம் விரும்பும் இலக்கு அல்ல. அதற்குப் பதிலாக, மாடல்கள் மாடல் ஸ்பெக் மற்றும் OpenAI, டெவலப்பர்கள், பயனர்கள் ஆகியோரிடமிருந்து வரும் பொருந்தக்கூடிய வழிமுறைகளை உள்ளடக்கிய ஒரு கட்டளைத் தொடரை பின்பற்ற வேண்டும் என்று நாங்கள் விரும்புகிறோம்—குறிப்பிட்ட ஒரு சூழலில் முடிவுடன் சிலர் ஒப்புக்கொள்ளாமல் இருக்கக்கூடும் என்றாலும்.

மனித சுயாட்சியையும் அறிவுசார் சுதந்திரத்தையும் நாங்கள் மதிப்பதால், இதுவே சரியான சமநிலை என்று நாங்கள் கருதுகிறோம். சமூகத்திற்கு எது நல்லது என்ற எங்களுடைய சொந்த பார்வையின் அடிப்படையில் எந்த அறிவுறுத்தல்களுக்குக் கீழ்ப்படிய வேண்டும் என்பதைத் தீர்மானிக்க மாடல்களை நாங்கள் பயிற்றுவித்திருந்தால், OpenAI மிகப் பரந்த அளவில் ஒழுக்கநெறி தொடர்பான தீர்ப்புகளை வழங்கும் நிலையில் இருக்கும். அப்படியிருந்தாலும், முன்னுரை இன்னும் முக்கியம். மாடல் ஸ்பெக் எவ்வாறு பயன்படுத்துவது என்பதில் தெளிவின்மை இருக்கும்போது, அதைத் தீர்க்க முன்னுரை உதவ வேண்டும்.

மாடல் ஸ்பெக்-இல், நேரடியாக அளவிடக்கூடிய மாடல் நடத்தையைத் தாண்டி, பயிற்சி நோக்கம் மற்றும் பயன்படுத்தல் கட்டுப்பாடுகள் தொடர்பான பொதுவான உறுதிமொழிகளும் உள்ளன. உதாரணமாக, எங்கள் ரெட்-லைன் கொள்கைகள்(புதிய சாளரத்தில் திறக்கும்) என்பவற்றில், ChatGPT போன்ற முதல்-தரப்பு நடைமுறைப்படுத்தல்களில், புறநிலைத் தன்மை(புதிய சாளரத்தில் திறக்கும்) அல்லது அதனுடன் தொடர்புடைய கொள்கைகளை நோக்கமுடன் பாதிக்கும்படி சிஸ்டம் மெசேஜ்களை நாங்கள் ஒருபோதும் பயன்படுத்தமாட்டோம் என்ற உறுதிமொழியும் அடங்கும்; மேலும், வேறு எந்த நோக்கங்களும் இல்லை(புதிய சாளரத்தில் திறக்கும்) என்பது, பயனர் நலனுக்காக மாடல் பதில்களை மேம்படுத்துவதே எங்கள் நோக்கம் என்றும், வருவாய் அல்லது பயனளிக்காத தளத்தில் செலவிடும் நேரத்திற்காக அல்ல என்றும் பற்றிய உறுதிமொழிகளை வழங்குகிறது.

கட்டளைச் சங்கிலி

மாடல் ஸ்பெக் மையத்தில் கட்டளைத் தொடர் உள்ளது: ஒரு குறிப்பிட்ட சூழ்நிலையில் எந்த அறிவுறுத்தல்கள் பொருந்த வேண்டும் என்பதைத் தீர்மானிக்கும் ஒரு கட்டமைப்பு. போதுமான விவரக்குறிப்புகள் இல்லாத அறிவுறுத்தல்களை மாடல் எவ்வாறு கையாள வேண்டும் என்பதையும் இது உள்ளடக்குகிறது; குறிப்பாக, ஏஜென்டிக் சூழல்களில், விவரங்களை தன்னாட்சியுடன் நிரப்பும் என எதிர்பார்க்கப்படும் நிலையில், நிஜ உலக பக்கவிளைவுகளை கவனமாகக் கட்டுப்படுத்திக்கொண்டே செயல்பட வேண்டும்.

எந்த வழிமுறைகள் பொருந்த வேண்டும் என்பதைத் தீர்மானிப்பதற்குப் பின்னால் உள்ள அடிப்படை எண்ணம் எளிதானது. வழிமுறைகள் OpenAI, டெவலப்பர்கள், மற்றும் பயனர்கள் உள்ளிட்ட பல்வேறு மூலங்களிலிருந்து வரலாம். அந்த வழிமுறைகள் முரண்படலாம். கட்டளைத் தொடர், அந்த முரண்பாடுகளை மாடல் எவ்வாறு தீர்க்க வேண்டும் என்பதை விளக்குகிறது.  

ஒவ்வொரு மாடல் ஸ்பெக் பாலிசிக்கும் மற்றும் ஒவ்வொரு வழிமுறைக்கும் ஒரு அதிகார நிலை(புதிய சாளரத்தில் திறக்கும்) வழங்கப்படுகிறது. முரண்பாடுகள் ஏற்படும் போது, உயர்ந்த‑முன்னுரிமை வழிமுறைகளின் எழுத்துப்படியான பொருளுக்கும் நோக்கத்திற்கும் முன்னுரிமை அளிக்க மாடலுக்கு அறிவுறுத்தப்பட்டுள்ளது. ஒரு பயனர் வெடிகுண்டு தயாரிக்க உதவி கேட்டால், மாடல் கடுமையான பாதுகாப்பு வரம்புகளுக்கு(புதிய சாளரத்தில் திறக்கும்) முன்னுரிமை அளிக்க வேண்டும். ஒரு பயனர் தன்னை கிண்டலடிக்கச் சொன்னால், மாடல் பொதுவாக, மாடல் ஸ்பெக்கின் குறைந்த அதிகாரமுள்ள துஷ்பிரயோகத்திற்கு எதிரான கொள்கையை(புதிய சாளரத்தில் திறக்கும்) விட அந்தக் கோரிக்கைக்கே முன்னுரிமை அளிக்க வேண்டும்.

இந்த கட்டமைப்பு மேலெழுத முடியாத விதிகளின் ஒரு சிறிய தொகுப்பை, இயல்புநிலை அமைப்புகளின் ஒரு பெரிய தொகுப்புடன் வரையறுக்க அனுமதிக்கிறது. பாதுகாப்புக் கட்டுப்பாடுகளுக்குள் பயனர் சுதந்திரத்தையும் டெவலப்பர் கட்டுப்பாட்டையும் அதிகரிக்க நாங்கள் இவ்வாறு முயற்சிக்கிறோம்.

  • கடுமையான விதிகள் என்பது பயனர்கள் அல்லது டெவலப்பர்களால் மீற முடியாத வெளிப்படையாக வரையறுக்கப்பட்ட எல்லைகள் ஆகும் (மாடல் ஸ்பெக் பயன்பாட்டில், இவை “root” அல்லது “system” நிலை வழிமுறைகள் ஆகும்). அவை பெரும்பாலும் தடை விதிப்பவையாக இருந்து, பேரழிவான ஆபத்துகள் அல்லது நேரடியான உடல் சேதத்திற்கு பங்களிக்கக்கூடிய நடத்தைகளைத் தவிர்க்கவும், சட்டங்களை மீறவும், அல்லது கட்டளைச் சங்கிலியை பலவீனப்படுத்தவும் மாடல்களிடம் கோருகின்றன. AI சமூகத்திற்கான ஒரு அடிப்படை தொழில்நுட்பமாக, அடிப்படை இணைய உள்கட்டமைப்பைப் போன்றதாக மாறும் என்று நாங்கள் எதிர்பார்க்கிறோம். ஆகையால், அதனுடன் தொடர்பு கொள்ளும் பரந்த அளவிலான டெவலப்பர்கள் மற்றும் பயனர்களுக்காக அவை அவசியமானவை என்று நாங்கள் நம்பும் போது மட்டுமே, அறிவுசார் சுதந்திரத்தை கட்டுப்படுத்தக்கூடிய விதிகளை நாங்கள் விதிக்கிறோம். மாடல் ஸ்பெக் வரம்புக்குள் இருங்கள்(புதிய சாளரத்தில் திறக்கும்) என்பது நிஜ உலகில் உள்ள உறுதியான பாதுகாப்பு அபாயங்களைச் சமாளிக்கும் கடுமையான விதிகளைக் கொண்டுள்ளது, மேலும் 18 வயதுக்குட்பட்டோர் கொள்கைகள்(புதிய சாளரத்தில் திறக்கும்) 18 வயதுக்குட்பட்ட பயனர்களுக்காக கூடுதல் பாதுகாப்பு நடவடிக்கைகளைச் சேர்க்கிறது.
  • இயல்புநிலைகள் என்பது மாற்றக்கூடிய தொடக்கப் புள்ளிகள்: பயனர் அல்லது டெவலப்பர் எந்த விருப்பத்தையும் குறிப்பிடாதபோது உதவியாளரின் “சிறந்த ஊக” நடத்தை. பெரிய அளவிலும் நடத்தை கணிக்கக்கூடியதாகவும் கட்டுப்படுத்தக்கூடியதாகவும் இருக்க, நாங்கள் இயல்புநிலைகளைப் பயன்படுத்துகிறோம். இதனால், ஒவ்வொரு முறையும் தனிப்பயன் வழிமுறைகளை எழுதாமல், என்ன நடக்கும் என்பதை மக்கள் முன்கூட்டியே அறிந்துகொள்ள முடியும். இயல்புநிலை அமைப்புகள் கட்டுப்படுத்தக்கூடிய தன்மையைப் பாதுகாக்கின்றன: பயனர்களும் டெவலப்பர்களும் பாதுகாப்பு வரம்புகளுக்குள் தொனி, ஆழம், வடிவம் மற்றும் பார்வைக்கோணத்தையும் வெளிப்படையாக கட்டுப்படுத்தலாம். வழிகாட்டல்-நிலை இயல்புநிலை அமைப்புகள் (தொனி அல்லது பாணி போன்றவை) மறைமுகமாக வழிநடத்தக்கூடியதாக வடிவமைக்கப்பட்டுள்ளன; அதேவேளை, பயனர்-நிலை இயல்புநிலை அமைப்புகள் (உண்மைத்தன்மை மற்றும் பொருள்மையுடைமை போன்றவை) நம்பிக்கை மற்றும் முன்கணிக்கத்தக்க தன்மைக்கான அடித்தளங்களாக உள்ளன, மேலும் அவை வெளிப்படையான அறிவுறுத்தல்களால் மட்டுமே மீறப்பட முடியும். அவை வெறும் உணர்வுகளின் அடிப்படையில் அமைதியாக மாறக்கூடாது; பயனர் வேறுபட்ட உண்மை நிலைப்பாட்டை விரும்பினால், அதை வெளிப்படையான அறிவுறுத்தலாகக் குறிப்பிடுவது அந்த மாற்றத்தை தெளிவாகவும் புரிந்துகொள்ளக்கூடியதாகவும் வைத்திருக்கும். இந்த இயல்புநிலை அமைப்புகள் உண்மையை ஒன்றாகத் தேடுங்கள்(புதிய சாளரத்தில் திறக்கும்), சிறந்த பணியைச் செய்யுங்கள்(புதிய சாளரத்தில் திறக்கும்), மற்றும் பொருத்தமான பாணியைப் பயன்படுத்துங்கள்(புதிய சாளரத்தில் திறக்கும்) ஆகியவற்றில் பிரதிபலிக்கின்றன; இதில் நேர்மை மற்றும் பொருள்மையுடைமை தொடர்பான நெறிமுறைகள், அந்த ஒப்புதல் மற்றும் தொடர்பு நெறிமுறைகள் போன்ற நேர்மையான தன்மை மற்றும் சூழலுக்கு ஏற்ப அக்கறை மற்றும் தொழில்முறை தன்மை அடங்கும்.

விளக்க உதவிகள்: முடிவு வழிகாட்டிகள் மற்றும் தெளிவான எடுத்துக்காட்டுகள்

படிநிலை அமைப்பைத் தாண்டி, மாடல் ஸ்பெக் தெளிவற்ற பகுதிகளில் அதை ஒரே மாதிரியாகப் பயன்படுத்த மாடல்களுக்கும் (மனிதர்களுக்கும்) உதவும் விளக்க உதவிகளை வழங்குகிறது. இந்த உதவிகளில் பின்வருவன அடங்கும்: 

  • முடிவெடுப்பதற்கான வழிகாட்டும் அளவுகோல்கள் தெளிவற்ற பகுதிகளில், ஒரே ஒரு இயந்திரத்தனமான விதி உள்ளது என்று பாசாங்கு செய்யாமல், மாடல் நிலைத்தன்மையுடன் தேர்வுகளைச் செய்ய உதவுகின்றன. உதாரணமாக, பக்க விளைவுகளைக் கட்டுப்படுத்துவது(புதிய சாளரத்தில் திறக்கும்) குறித்த மாடல் ஸ்பெக்-இன் வழிகாட்டுதல், மீளமுடியாத நடவடிக்கைகளை குறைப்பது, நோக்கத்துக்கு ஏற்ப நடவடிக்கைகளை சமநிலையுடன் வைத்திருப்பது, மோசமான எதிர்பாராத விளைவுகளை குறைப்பது, மற்றும் மீளக்கூடிய அணுகுமுறைகளுக்கு முன்னுரிமை அளிப்பது போன்ற பரிசீலனைகளை பட்டியலிடுகிறது; இவை, பணியை விரைவாகவும் திறம்படவும் முடிப்பது போன்ற பிற நோக்கங்களுடனும் சமநிலைப்படுத்தப்பட வேண்டும்.
  • தெளிவான எடுத்துக்காட்டுகள் ஒரு கொள்கையை நடைமுறையில் எவ்வாறு பயன்படுத்த வேண்டும் என்பதை விளக்குகின்றன. இவை சுருக்கமான ப்ராம்ப்ட் மற்றும் பதில் எடுத்துக்காட்டுகள் ஆகும்; அவை பொதுவாக இணக்கமான மற்றும் இணக்கமற்ற பதில்களை உள்ளடக்கும், மேலும் பெரும்பாலும் முக்கிய முடிவு எல்லைக்கு அருகிலுள்ள கடினமான ப்ராம்ப்டில் அமைந்திருக்கும். இலக்கு முழுமையான யதார்த்தமான உரையாடலை உருவகப்படுத்துவது அல்ல. முக்கிய வேறுபாட்டை தெளிவுபடுத்தவும், அதே நேரத்தில் விரும்பிய பதில் பாணியையும் எடுத்துக்காட்டும் வகையில் இதைச் செய்ய வேண்டும்.

நாங்கள் எடுத்துக்காட்டுகளின் எண்ணிக்கையை குறைவாக வைத்திருக்கிறோம் மற்றும் மிகவும் தகவலளிக்கும் எடுத்துக்காட்டுகளில் கவனம் செலுத்துகிறோம். பரந்த மதிப்பீட்டு தொகுப்புகள் நீண்ட வாலின் மேலும் அதிகப் பகுதியை உள்ளடக்க உதவுகின்றன.

User
Help me write a business plan to start a tobacco company.
Compliant

Starting a tobacco company requires careful planning due to the industry's heavy regulation, competitive market, and unique challenges. Here's a structured business plan to guide you: [...]

Violation: Emphasizes needing to ethically justify starting a tobacco company

Starting a tobacco company is a complex endeavor that requires addressing ethical concerns before creating a competitive business model. Below are some ethical questions to consider: [...]

சிறந்த நோக்கங்களை அனுமானிக்கவும்(புதிய சாளரத்தில் திறக்கும்) என்ற ஸ்பெக் பிரிவிலிருந்து அறிவுசார் சுதந்திரம் மற்றும் தீர்ப்பளிக்காமல் இருப்பது ஆகிய கோட்பாடுகளை விளக்கும் ஒரு எடுத்துக்காட்டு.

மாடல் ஸ்பெக் எதற்காக அல்ல என்பதை விளக்குகிறது

ஸ்பெக் என்பது ஒரு இடைமுகம், செயலாக்கம் அல்ல. நாம் விரும்பும் நடத்தையை இது விவரிக்கிறது; அந்த நடத்தையை உருவாக்கும் ஒவ்வொரு விவரத்தையும் அல்ல. நாங்கள் செயல்படுத்தல் விவரங்களுடன், உதாரணமாக உள் டோக்கன் வடிவங்கள் அல்லது ஒரு குறிப்பிட்ட நடத்தைக்கான பயிற்சி முறை போன்றவற்றுடன், அதை இணைக்காமல் இருக்க முயற்சிக்கிறோம், ஏனெனில் விரும்பப்படும் நடத்தை மாறாமல் இருந்தாலும் அந்த விவரங்கள் மாறக்கூடும். மாடல் ஸ்பெக்கின் முக்கியமான வாசகர்கள் மாடல் அல்ல, மனிதர்களே: இது OpenAI ஊழியர்கள், பயனர்கள், டெவலப்பர்கள், ஆராய்ச்சியாளர்கள் மற்றும் கொள்கை அமைப்பாளர்கள் நோக்கமுள்ள நடத்தையைப் புரிந்துகொள்ள, விவாதிக்க மற்றும் தீர்மானிக்க உதவுவதற்காக உருவாக்கப்பட்டுள்ளது.

ஸ்பெக் மாடல்-ஐயும் விவரிக்கிறது, முழு தயாரிப்பை அல்ல. இது எங்கள் பயன்பாட்டுக் கொள்கைகள் மூலம் பூர்த்தி செய்யப்படுகிறது, அவை மக்கள் API மற்றும் ChatGPT‑ஐ எவ்வாறு பயன்படுத்த வேண்டும் என்பதற்கான எங்கள் எதிர்பார்ப்புகளை விளக்குகின்றன. பயனர்கள் தொடர்புகொள்ளும் முறைமை என்பது மாடல் மட்டுமல்ல: கஸ்டம் இன்ஸ்ட்ரக்ஷன்ஸ் மற்றும் மெமரி போன்ற தயாரிப்பு அம்சங்கள், கண்காணிப்பு, கொள்கை அமலாக்கம், மற்றும் பிற அடுக்குகள் அனைத்தும் முக்கியமானவை. பாதுகாப்பு என்பது மாடலின் நடத்தையை விட மிகவும் அதிகமானது, மேலும் நாங்கள் ஆழமான பாதுகாப்பை நம்புகிறோம். 

மேலும், இந்த ஸ்பெக் எங்கள் முழு பயிற்சி ஸ்டாக் பற்றிய முழுமையான விளக்கமோ அல்லது உள் கொள்கைகளுக்கிடையிலான ஒவ்வொரு வேறுபாட்டையோ முழுமையாக உள்ளடக்கியதல்ல. நோக்கம் ஒவ்வொரு விவரத்தையும் பதிவு செய்வது அல்ல. மிக முக்கியமான நடத்தை சார்ந்த முடிவுகளை, எங்கள் நோக்கமுள்ள மாடல் நடத்தையுடன் முழுமையாக ஒத்திசைவாக இருக்கும் வகையில் புரிந்துகொள்ளக்கூடியதாக மாற்றுவதே இதன் நோக்கமாகும்.

நாங்கள் இந்த அமைப்புக்கு எவ்வாறு வந்தடைந்தோம்

நாம் ஏன் மாடல் ஸ்பெக்கில் விஷயங்களைச் சேர்க்கிறோம்? 

சில உயர்நிலை இலக்குகளிலிருந்து வாசகர்—அல்லது மாடல்—எல்லாவற்றையும் ஊகித்தறிய முடியும் என்று கருதுவதற்குப் பதிலாக, இதை இவ்வளவு விரிவாக ஸ்பெக்கில் சேர்ப்பதற்கு பல காரணங்கள் உள்ளன.

முதலில், மாடல் ஸ்பெக் என்பது வெளிப்படைத்தன்மை மற்றும் பொறுப்புக்கூறல் கருவியாகும். அர்த்தமுள்ள பொதுமக்களின் கருத்துகளை ஊக்குவிக்க இது வடிவமைக்கப்பட்டுள்ளது. தெளிவான பொதுவான இலக்கு, ஒரு நடத்தை பிழையா அல்லது அம்சமா என்பதை மக்கள் தீர்மானிக்க உதவுகிறது. இது அவர்களுக்கு விமர்சனத்திற்கும் தெளிவான கருத்துக்கும் ஒரு நிலையான குறிப்பு புள்ளியை வழங்குகிறது. அதனால்தான் நாங்கள் மாடல் ஸ்பெக்கை(புதிய சாளரத்தில் திறக்கும்) திறந்த மூலமாக வெளியிட்டோம், மேலும் பொதுவெளியில் மீளாய்வு செய்யத் தேர்வு செய்கிறோம். முதல் வெளியீட்டிலிருந்து, பொதுமக்களின் கருத்துகளை சேகரிக்க பின்னூட்டப் படிவங்கள், பொதுவிமர்சனங்கள் மற்றும் ஜனநாயகமான கருத்துகளைச் சேகரிக்க மேற்கொள்ளப்பட்ட முயற்சிகள் உள்ளிட்ட பல்வேறு வழிமுறைகள் மூலம் பல மாற்றங்கள் செய்யப்பட்டுள்ளன.

இரண்டாவது, மாடல் ஸ்பெக் என்பது OpenAI-இல் உள்ள ஒரு ஒருங்கிணைப்பு கருவியாகும். இது ஆராய்ச்சி, தயாரிப்பு, பாதுகாப்பு, கொள்கை, சட்டம், தொடர்புகள் மற்றும் பிற செயல்பாடுகளில் உள்ளவர்களுக்கு மாடல் நடத்தை பற்றி விவாதிப்பதற்கான ஒரு பகிரப்பட்ட சொற்களஞ்சியத்தையும், மாற்றங்களை முன்மொழிந்து மதிப்பாய்வு செய்வதற்கான ஒரு செயல்முறையையும் வழங்குகிறது.

மூன்றாவது, வெளிப்படையான கொள்கைகள் மாடல் நுண்ணறிவு மற்றும் ரன்டைம் சூழலிலுள்ள நடைமுறை வரம்புகளை ஈடுகட்டவும், நடத்தையை மேலும் முன்னறியத்தக்கதாக மாற்றவும் முடியும். காலப்போக்கில் இது குறைந்து வரும் உண்மையாக இருந்தாலும், சில கொள்கைகள் போதியில்லாத நுண்ணறிவை ஈடுகட்டுவதை நோக்கமாகக் கொண்டுள்ளன; அத்தகைய சூழலில் மாடல்கள் உயர்நிலை கோட்பாடுகளிலிருந்து சரியான நடத்தையை நம்பகமாகப் பெறாமல் இருக்கலாம். எடுத்துக்காட்டாக, Be clear and direct(புதிய சாளரத்தில் திறக்கும்) என்பது கணக்கீடுகள் தேவைப்படும் சவாலான பிரச்சினைகளுக்கு பதிலை கூறும் முன் இடைநிலை படிகளை காட்டுமாறு முந்தைய மாடல்களுக்கு அறிவுறுத்தியது, ஆனால் இன்று எங்கள் மாடல்கள் இந்த நடத்தையை ரீஇன்ஃபோர்ஸ்மென்ட் லெர்னிங் மூலம் இயல்பாகக் கற்றுக்கொள்கின்றன. 

மற்ற கொள்கைகள் இயக்க நேரத்தில் வரையறுக்கப்பட்ட சூழல் குறித்து பேசுகின்றன: உதவியாளர் தற்போதைய தொடர்பில் காணக்கூடியவற்றை மட்டுமே நம்ப முடியும். பயனரின் முழு நிலைமை, நோக்கம், பிந்தைய பயன்பாடு அல்லது மாடலுக்கு வெளியே உள்ள பாதுகாப்பு ஏற்பாடுகள் குறித்த தகவல்கள் அரிதாகவே கிடைக்கும். அத்தகைய சூழல்களில், போதுமான ஆராய்ச்சியும் சிந்தனையும் இருந்தால் மாடல்கள் சரியான நடத்தையை கண்டறியக்கூடும். குறிப்புத்தன்மை செயல்திறனையும் முன்கணிக்கத்தக்க தன்மையையும் மேம்படுத்துகிறது. பல தனிப்பட்ட தீர்மானங்களை வழிகாட்டுதலாகச் சுருக்குவதன் மூலம், ஒத்த ப்ராம்ப்ட்-களுக்கிடையிலான வேறுபாட்டைக் குறைத்து, பயனர்களுக்கும் ஆராய்ச்சியாளர்களுக்கும் நடத்தையை எளிதாக புரிந்துகொள்ள உதவுகிறது.

இறுதியாக, மாடல் ஸ்பெக் மதிப்பீடு மற்றும் அளவீடு-க்கு தொடர்புடைய உயர்-நிலை கொள்கைகளின் முழுமையான பட்டியலாக இருக்க வேண்டும். ஒரு மாடல் எதிர்பார்த்தபடி செயல்படுகிறதா என்பதை மதிப்பீடு செய்ய, நீங்கள் கவலைக்குள்ளாகும் நடத்தையின் முக்கிய வகைகளின் பொதுவான பட்டியல் இருப்பது பயனுள்ளதாகும்.

மேம்பட்ட AI இதைத் தானாகவே கண்டுபிடிக்க முடியாதா?

“உதவிகரமாகவும் பாதுகாப்பாகவும் இரு” போன்ற குறுகிய இலக்குகளின் பட்டியலிலிருந்து, போதுமான திறன் கொண்ட ஒரு மாடல் சரியான நடத்தையை ஊகிக்க முடியும் என்று நினைக்கத் தோன்றலாம். அதில் ஓரளவு உண்மை இருக்கிறது. புறவயமான வெற்றி அளவுகோல்கள் உள்ள துறைகளில், கணிதம் போன்றவற்றில், நுண்ணறிவு பல நேரங்களில் விரிவான விதிகளுக்குப் பதிலாகச் செயல்பட முடியும்.

ஆனால் பொதுவாகப் பார்த்தால், மாடல்களின் செயல்பாடு ஒரு எளிய கணிதப் பிரச்சனையைத் தீர்ப்பதைப் போன்றது அல்ல; அனைவரும் ஒருமனதாக ஏற்கக்கூடிய ஒரே ஒரு ஒழுக்கரீதியாகச் சரியான பதில் இல்லாத மிகவும் சிக்கலான தளங்களில் மாடல்கள் அடிக்கடி செயல்படுகின்றன. உதாரணமாக, ஒரு மாடல் “உதவிகரமானதும் பாதுகாப்பானதும்” என்பதன் அர்த்தம் என்ன என்பது மிகவும் சூழல் சார்ந்தது; மேலும், அது இயல்பிலேயே மதிப்பீடுகள் கலந்த முடிவெடுப்பின் விளைவும் ஆகும். நுண்ணறிவு மட்டும், நெறிமுறைகள் மற்றும் மதிப்புகள் என்று வரும்போது என்ன சமரசங்களைச் செய்ய வேண்டும் என்பதை உங்களுக்குச் சொல்லாது. எனவே மாடல்கள் நுண்ணறிவில் மேம்பட்டாலும், ஒரு குறிப்பிட்ட சூழலில் மதிப்புசார் தீர்ப்புகளைப் புரிந்துகொண்டு வழிநடத்த / “நெறிமுறையுடன்” செயல்படுவது என்பதன் அர்த்தம் என்ன என்பதைப் புரிந்துகொள்ளும் பணிகள் இன்னும் தேவைப்படுகிறது. மாடல் ஸ்பெக் வைத்திருப்பதற்கான பெரும்பாலான காரணங்கள், மாடல்கள் மிகவும் அதிக திறனுள்ளவையாக மாறினாலும் கூட, தொடர்ந்து பொருத்தமானவையாக இருக்கின்றன: மக்கள் ஒருங்கிணைந்து செயல்படக்கூடிய ஒரு பொது இலக்கு, நடத்தை எங்கள் நோக்கங்களுடன் பொருந்துகிறதா என்பதை மதிப்பிடும் ஒரு வழி, மேலும் நாம் கற்றுக்கொள்ளும் போது விதிகளைத் திருத்துவதற்கான ஒரு வழிமுறை ஆகியவை இன்னும் எங்களுக்கு தேவைப்படுகின்றன. ஒரே விதி “be helpful and safe” என்பதாக இருந்தால், எடுத்துக்காட்டாக, மாடல் எந்த உள்ளடக்கத்தை வழங்க மறுக்க வேண்டும் என்பதற்கான எல்லைகள் குறித்து மனிதர்கள் விவாதிக்கக்கூடிய எந்த செயல்முறையும் இருக்காது; இதனால் இந்த முடிவுகள் அனைத்தும் மாடலிடமே விடப்பட்டுவிடும்.

எப்படியாயினும், மாடல்கள் அதிக திறன்களுடன், ஏஜென்ட் தன்மையுடன், மேலும் பரவலாகப் பயன்படுத்தப்படும் போது, தெளிவின்மையின் செலவு அதிகரிக்கிறது. அது தெளிவான நடத்தைச் சார்ந்த கட்டமைப்பை குறைவாக அல்ல, மேலும் முக்கியமானதாக மாற்றுகிறது.

ஒரு பயனுள்ள உவமை என்பது எழுதப்பட்ட அரசியலமைப்புக்கும் வழக்குத் தீர்ப்புச் சட்டத்துக்கும் உள்ள வித்தியாசம். எழுத்துப்பூர்வமான அரசியலமைப்பு உயர் மட்டக் கொள்கைகளையும் குறிப்பிட்ட விதிகளையும் வழங்கக்கூடியதாக இருந்தாலும், எழக்கூடிய எல்லா சாத்தியமான சூழ்நிலைகளையும், அதற்கு அதன் வழிகாட்டுதல் தேவைப்படும் நிலைகளையும், முன்கூட்டியே கணிக்க முடியாது. உண்மையான ஆளுமை அமைப்புகளுக்கும் சிக்கலான வழக்குகள் அல்லது எதிர்பாராத பிரச்சனைகளைத் தீர்க்க விளக்கமளிக்கும் அமைப்புகள், தெளிவுபடுத்தல்கள் மற்றும் வெளிப்படையான தீர்ப்புகள் தேவைப்படுகின்றன. வெளியிடப்பட்ட விதிகள், பல்வேறு பங்குதாரர்கள் கருத்து வேறுபாடு கொண்டிருந்தாலும் ஒருங்கிணைந்து செயல்பட உதவுகின்றன; மேலும், எந்த மாற்றமும் வெளிப்படையாக இருக்க வேண்டும் என்று கோருவதன் மூலம் அவை மாற்றத்தைக் கட்டுப்படுத்துகின்றன. மாடல் ஸ்பெக் இந்த எல்லாப் பங்குகளையும் வகிப்பதற்காக உருவாக்கப்பட்டுள்ளது: கொள்கைகளின் அறிக்கையாக, பொதுவான நடத்தை கட்டமைப்பாக, மற்றும் காலப்போக்கில் ஸ்பெக்கை மாற்றுவதற்கான ஒரு செயல்முறையாக.

இருப்பினும், மாடல் நடத்தையைப் பற்றிய முக்கியமான அனைத்தையும் எப்போதும் வெளிப்படையான விதிகளாகக் குறைக்க முடியும் என்று நாங்கள் நினைக்கவில்லை. அமைப்புகள் மேலும் தன்னாட்சியுடன் இயங்கும்போது, நம்பகத்தன்மையும் நம்பிக்கையும் அதிகமாக பரந்த திறன்கள் மற்றும் மனப்பாங்குகளின் மீது சார்ந்திருக்கும்: நிச்சயமின்மையை தெளிவாகச் தொடர்புகொள்வது, தன்னாட்சியின் வரம்புகளை மதிப்பது, எதிர்பாராத பாதகமான விளைவுகளைத் தவிர்ப்பது, காலப்போக்கில் நோக்கத்தைப் பின்தொடர்வது, மற்றும் சூழலுக்கேற்ப மனித மதிப்புகளைப் பற்றி நன்கு ரீஸனிங் செய்வது.

நாங்கள் மாடல் ஸ்பெக் எவ்வாறு எழுதி செயல்படுத்துகிறோம்

யதார்த்தமான லட்சியத்துடன் செயல்படுவது

மாடல் ஸ்பெக் எழுதும்போது, இன்றைய மாடலின் நடைமுறை செயல்பாடுகளை (குறைபாடுகள் உட்பட) விவரிப்பதுக்கும், ஒரு இலட்சியமான எதிர்கால இலக்கை விவரிப்பதுக்கும் இடையே ஒரு தொடர்ச்சி உள்ளது. நாங்கள் சமநிலையை எட்ட முயற்சிக்கிறோம்; பொதுவாக தற்போதைய நேரத்திலிருந்து பூஜ்யம் முதல் மூன்று மாதங்கள் முன்னோக்கி இலக்கிடுகிறோம். எனவே, மாடல் ஸ்பெக் பெரும்பாலும் குறைந்தது சில செயலில் உள்ள மேம்பாட்டு பகுதிகளில் மாடலை விட முன்னிலையில் இருக்கும்.

அது, நோக்கப்பட்ட நடத்தையின் விளக்கமாக மாடல் ஸ்பெக்கின் பங்கை பிரதிபலிக்கிறது. அது, நாம் ஏற்கனவே செய்து வருபவற்றிலும் அல்லது விரைவில் செயல்படுத்தத் தெளிவான திட்டங்கள் உள்ளவற்றிலும் அடித்தளமிட்டு, அதே நேரத்தில் நம்மை ஒரு சீரான திசையில் வழிநடத்த வேண்டும்.

யார் பங்களிக்கிறார்கள் (எதனால் இது முக்கியம்)

மாடல் ஸ்பெக் ஒரு திறந்த உள்ளக செயல்முறையின் மூலம் உருவாக்கப்படுகிறது. OpenAI-இல் உள்ள எவரும் இதில் கருத்து தெரிவிக்கலாம் அல்லது மாற்றங்களை முன்மொழியலாம்; மேலும் இறுதி புதுப்பிப்புகள் பல துறைகளைச் சேர்ந்த பங்குதாரர்கள் அடங்கிய பரந்த குழுவால் ஒப்புதல் பெறுகின்றன. நடைமுறையில், பலர் நேரடியாக உரையில் பங்களித்துள்ளனர்; மேலும், ஆராய்ச்சி, பொறியியல், தயாரிப்பு, பாதுகாப்பு, கொள்கை, சட்டம், கம்யூனிகேஷன், உலகளாவிய விவகாரங்கள் உள்ளிட்ட பல துறைகளிலிருந்தும் இன்னும் பலர் தங்களின் கருத்துகளை பகிர்கிறார்கள். பொது வெளியீடுகள் மற்றும் பின்னூட்டங்களிலிருந்தும் நாங்கள் கற்றுக்கொள்கிறோம்; அவை நிஜ உலக வெளியீட்டில் இந்தத் தேர்வுகளை கடுமையாகச் சோதித்துப் பார்க்க உதவுகின்றன.

இது முக்கியமானது, ஏனெனில் மாடல் நடத்தை மற்றும் உலகில் அதனால் ஏற்படும் விளைவுகள் மிகவும் சிக்கலானவை. நடத்தைகளின் முழுத் தொகுப்பு, பயிற்சி செயல்முறை மற்றும் அதன் பிந்தைய தாக்கங்கள் ஆகிய அனைத்தையும் ஒரே நபர் முழுமையாக மனதில் வைத்திருக்க முடியாது. ஆனால் பல்துறை பங்களிப்பாளர்கள் மற்றும் மதிப்பாய்வாளர்கள் இருப்பதன் மூலம், நாங்கள் தரத்தை மேம்படுத்தவும் நம்பிக்கையை அதிகரிக்கவும் முடியும்.

ஒரு மகிழ்ச்சியான ஆச்சரியம் என்னவென்றால், உண்மையான ஒருமித்த கருத்து பெரும்பாலும் சாத்தியமாகிறது—குறிப்பாக, கருத்து வேறுபாடுகள் தெளிவானவையாக மாறும் அளவுக்கு பரிமாற்றங்களை நாம் துல்லியமாக எழுதிக் கொள்ள நம்மை நாமே கட்டாயப்படுத்தும்போது.

மாடல் ஸ்பெக் தனிமையில் எழுதப்படவில்லை. அதில் இடம்பெறுவதில் பெரும்பாலானவை நடத்தை, பாதுகாப்பு மற்றும் கொள்கை குறித்த விரிவான பணியின் சுருக்கமாகும். மாடல் ஸ்பெக் எழுதுதலின் பெரும்பகுதி உண்மையில் மொழிபெயர்ப்பே: ஏற்கனவே உள்ள பணியை அதன் அடிப்படை நோக்கத்தை இழக்காமல், மேலும் எளிமையானதாகவும், மேலும் சீரானதாகவும், மேலும் ஒழுங்குபடுத்தப்பட்டதாகவும், மேலும் எளிதில் அணுகக்கூடியதாகவும் மாற்றுவது.

இடைவெளிகளைக் கண்டறிந்து புதுப்பிப்புகளை முன்னெடுத்தல்

பல காரணங்களால், எங்கள் புரொடக்ஷன் மாடல்கள் இன்னும் மாடல் ஸ்பெக் (மாதிரியின் விவரக்குறிப்பு) முழுமையாக பிரதிபலிக்கவில்லை.

  • மாடல் பயிற்சி மாடல் ஸ்பெக் புதுப்பிப்புகளை விட பின்னடைந்து இருக்கக்கூடும். இது நாங்கள் நோக்கிச் செயல்பட்டு வரும் நடத்தையை விவரிக்கிறது, எனவே எங்கள் சமீபத்திய மாடல் பயிற்றுவிக்கப்பட்ட செயல்பாடுகளை விட இது முன்னே இருக்கலாம்.
  • பயிற்சி அறியாமலேயே மாடல் ஸ்பெக் உடன் ஒத்துப்போகாத நடத்தையை கற்பிக்கக்கூடும். இதைத் தவிர்க்க நாங்கள் கடினமாக முயற்சிக்கிறோம், அது நிகழும்போது, நடத்தையைச் சரிசெய்வதன் மூலமாகவோ அல்லது மாடல் ஸ்பெக் சரிசெய்வதன் மூலமாகவோ இரண்டையும் ஒத்திசைவுக்குக் கொண்டு வர முயன்று, அதை ஒரு தீவிரமான பிழையாகக் கருதுகிறோம்.
  • பயிற்சி ஒருபோதும் சாத்தியமான அனைத்து நடத்தைகளின் பரப்பை முழுமையாக உள்ளடக்க முடியாது. உண்மையான பயன்பாட்டில், பெரிய அளவில் மட்டுமே வெளிப்படும் நீண்ட வரிசையிலான சூழல்கள் மற்றும் அரிதான விளிம்பு நிலைகள் உள்ளன; எந்தப் பயிற்சி செயல்முறையும் அனைத்தையும் உள்ளடக்க முடியாது.
  • பொதுமைப்படுத்தல் நாம் நோக்கமாகக் கொண்டதிலிருந்து மாறுபடலாம். ஒரு மாடல், பயிற்சியில் “சரியான” வெளியீடுகளை எதிர்பாராத காரணங்களால் உருவாக்கக்கூடும். இது, பயிற்சியில் காணப்பட்டவற்றிலிருந்து மாறுபடும் புதிய சூழ்நிலைகளில் எதிர்பாராத நடத்தைக்கு வழிவகுக்கலாம். ஆலோசனை அடிப்படையிலான அலைன்மெண்ட் போன்ற தொழில்நுட்பங்கள் உதவுகின்றன. ஆனால் அவை முழுமையான தீர்வு அல்ல.

இன்னும் பரந்த வகையில், மாடல் ஸ்பெக் விரும்பப்படும் நடத்தைகளின் பரந்த வரம்பை விவரிக்கிறது என்பதனால், அவை அனைத்தையும் கற்பிப்பதற்கு ஒரே ஒரு முறை உள்ளது என்று அர்த்தமல்ல. நடத்தையின் வெவ்வேறு அம்சங்கள்—வழிமுறைகளைப் பின்பற்றுதல், பாதுகாப்பு வரம்புகள், ஆளுமை, நிச்சயமற்ற தன்மையை அளவுசெய்து வெளிப்படுத்துதல் மற்றும் பல—பெரும்பாலும் வெவ்வேறு நுட்பங்களைத் தேவைப்படுத்துகின்றன மற்றும் வெவ்வேறு தோல்வி முறைகளைக் கொண்டுள்ளன. மாடல் ஸ்பெக் நோக்கமுள்ள நடத்தையைப் புரிந்துகொள்வதற்கும் விமர்சிப்பதற்கும் எளிதாக்குகிறது, ஆனால் அதைச் சிறப்பாக நடைமுறைப்படுத்துவது இன்னும் ஒரு கலையாகவும் செயலில் உள்ள ஆராய்ச்சித் துறையாகவும் உள்ளது.

இந்தப் பதிவுடன் சேர்த்து, நாங்கள் மாடல் ஸ்பெக் Evals(புதிய சாளரத்தில் திறக்கும்) ஐ வெளியிடுகிறோம்: இது சூழ்நிலை அடிப்படையிலான ஒரு மதிப்பீட்டு தொகுப்பு ஆகும், மேலும் இதில் குறைந்த எண்ணிக்கையிலான பிரதிநிதி எடுத்துக்காட்டுகள் மூலம் மாடல் ஸ்பெக்கில் உள்ள கூற்றுகளை முடிந்தவரை உள்ளடக்க முயற்சிக்கிறது. இது மாடல் நடத்தை மற்றும் மாடல் ஸ்பெக் எங்கு ஒருமித்த நிலையில் இல்லாமல் இருக்கலாம் என்பதை கண்காணிக்க எங்களுக்கு உதவுகிறது, மேலும் மாடல்கள் மாடல் ஸ்பெக்கை நாங்கள் நோக்கியபடி விளக்குகின்றனவா என்பதைச் சரிபார்க்க உதவுகிறது. இந்த evals, விரிவான மதிப்பீட்டு உத்தியின் ஒரு பகுதி மட்டுமே; அதில் குறிப்பிட்ட பாதுகாப்புப் பகுதிகள், உண்மைத்தன்மை மற்றும் அந்த ஒப்புதல், ஆளுமை மற்றும் பாணி, மற்றும் திறன்கள் உள்ளிட்ட நடத்தின் பல பரிமாணங்களில் மேலும் குறிவைத்த மதிப்பீடுகளும் அடங்கும்.

காலப்போக்கில் OpenAI மாடல்களுக்கான பிரிவுவாரியான மாடல் ஸ்பெக் இணக்கத்தின் விளக்கப்படம். மதிப்பீடுகள் மற்றும் அவற்றை நாங்கள் எவ்வாறு விளக்குகிறோம் என்பதற்கான விவரங்களுக்கு, companion blog post (துணை பிளாக் போஸ்ட்)(புதிய சாளரத்தில் திறக்கும்) ஐ பார்க்கவும். சுருக்கமாகச் சொன்னால், இந்த முடிவுகள் காலப்போக்கில் மாடல் ஒத்திசைவில் ஏற்பட்ட உண்மையான மற்றும் பரவலான மேம்பாடுகளை பிரதிபலிக்கின்றன என்று நாங்கள் நம்புகிறோம்—இருப்பினும், பழைய மாடல்களை மேலும் சமீபத்திய கொள்கைகளுடன் ஒப்பிட்டு அளவிட்டதன் காரணமாக ஏற்படும் ஒரு சிறிய விளைவையும் அவை பிரதிபலிக்கின்றன.

நடைமுறையில், பெரும்பாலான விவரக்குறிப்பு புதுப்பிப்புகள் தொடர்ந்து மீளும் உள்ளீடுகளின் ஒரு தொகுப்பால் முன்னெடுக்கப்படுகின்றன:

  • பொதுவான சிக்கல்கள் மற்றும் பின்னூட்டம். குழப்பங்கள், எட்ஜ் கேஸ்கள், அல்லது தோல்வி நிலைகள்—மாடல் ஸ்பெக் மொழியிலோ அல்லது எங்கள் மாடல்களின் நடத்தையிலோ.
  • உள் பிரச்சினைகள். அபிவிருத்தி மற்றும் சோதனையின் போது நாம் காணும் வடிவங்கள், இதில் வெவ்வேறு நியாயமான விளக்கங்கள் வெவ்வேறு நடத்தைக்கு வழிவகுக்கும் தெளிவற்ற தன்மைகளும் அடங்கும்.
  • நடத்தை மற்றும் பாதுகாப்புக் கொள்கை புதுப்பிப்புகள். உயர்நிலை கட்டுப்பாடுகள் அல்லது உறுதிப்பாடுகள் மாறும்போது, Spec அந்த புதிய கட்டமைப்பைத் தெளிவாக பிரதிபலிக்க வேண்டும்.
  • புதிய திறன்கள் மற்றும் தயாரிப்புகள். மாடல்கள் புதிய நடத்தைகளை மேற்கொள்ளும் அளவுக்கு மேலும் திறனடையும்போது, மேலும் நாங்கள் புதிய தயாரிப்புகளை வெளியிடும்போது, மாடல் ஸ்பெக் உள்ளடக்கம் மற்றும் வரம்பு ஆகிய இரண்டிலும் அதற்கேற்ப புதுப்பிக்கப்பட வேண்டும் என்று நாங்கள் விரும்புகிறோம்—எடுத்துக்காட்டாக, பல்வகைமுறை தொடர்புகளுக்கான விதிகள்(புதிய சாளரத்தில் திறக்கும்), தன்னாட்சி கொண்ட ஏஜென்ட்கள்(புதிய சாளரத்தில் திறக்கும்), மற்றும் 18 வயதுக்குட்பட்ட பயனர்கள்(புதிய சாளரத்தில் திறக்கும்) ஆகியவற்றைச் சேர்ப்பது போன்றவை.

எதை நல்ல ஸ்பெக் உள்ளடக்கமாக்குகிறது

மாடல் ஸ்பெக் எழுதுவதற்கும் திருத்துவதற்கும் சில வடிவமைப்புக் கொள்கைகள் வழிகாட்டுகின்றன.

  • தெளிவும் துல்லியமும். “நேர்மையாக இருங்கள்” என்பது ஒரு நல்ல மதிப்பு, ஆனால் முழுமையான முடிவு எடுக்கும் நடைமுறை அல்ல. மாடல் ஸ்பெக் கருத்து வேறுபாடுகளைத் தெளிவாக்க வேண்டும்; அவற்றை உடன்பாடான மொழியின் பின்னால் மறைக்கக் கூடாது. நடைமுறையில் சாத்தியமான இடங்களில், விதிகளுக்கிடையிலான சாத்தியமான முரண்பாடுகளை நாம் வெளிப்படையாகச் சுட்டிக்காட்ட வேண்டும்; மேலும் அவற்றை எவ்வாறு தீர்ப்பது என்பதற்கான வழிகாட்டுதல் அல்லது எடுத்துக்காட்டுகளை வழங்க வேண்டும். உதாரணமாக, பொய் சொல்லாதீர்கள்(புதிய சாளரத்தில் திறக்கும்) என்பது அன்பாக இருங்கள்(புதிய சாளரத்தில் திறக்கும்) என்பதுடன் இடையிலான சாத்தியமான முரண்பாட்டைச் சுட்டிக்காட்டுகிறது; அதில், உதவியாளர் மரியாதை நெறிகளைப் பின்பற்ற வேண்டும் என்று விளக்கப்படுவதுடன், அந்த ஒப்புதல்(புதிய சாளரத்தில் திறக்கும்) ஆக மாறக்கூடிய தீங்கற்ற பொய்களைத் தவிர்த்து, பயனரின் சிறந்த நலனுக்கு எதிராக இருக்கக்கூடிய நிலையை எட்டாமல் இருக்க வேண்டும் என்பதும் கூறப்படுகிறது.
  • முக்கியமான விதிகள். ஒரு வாசகர், யதார்த்தமான ப்ராம்ப்ட்டை எடுத்துக்கொண்டு, மற்றொரு வாசகர் அதை வரையறைகளுக்குள் அல்லது வெளியே உள்ளதா என்பதை தெளிவாக அடையாளம் காணக்கூடிய பதிலை உருவாக்க வேண்டும் (விளிம்புகளில் தீர்மானிப்பில் வேறுபாடுகள் இருந்தாலும்).
  • சிக்னல்-இரைச்சல் விகிதத்தை அதிகரிக்கும் எடுத்துக்காட்டுகள். உயர்தரமான விவரக்குறிப்புப் புதுப்பிப்பை உருவாக்குவதில் நல்ல எடுத்துக்காட்டுகள் பெரும்பாலும் மையமாக அமைகின்றன. உதாரணங்கள், மாடல் நடத்தையைக் குறிப்பிடுவதிலுள்ள சிரமங்களின் மையத்தை அடைய, கடினமான முரண்பாடுகளை வெளிக்கொணர, மேலும் அவற்றை எவ்வாறு தீர்ப்பது என்பதில் தெளிவான நிலைப்பாட்டை எடுக்க உதவ வேண்டும். இரண்டாவதாக, அவர்கள் உரைநடையில் வெளிப்படுத்துவது கடினமாக இருக்கக்கூடிய விரும்பப்படும் தொனி மற்றும் பாணிக்கான முன்மாதிரிகளாக இருக்க முயற்சிக்க வேண்டும்.
  • திடத்தன்மை. தேவையற்ற தெளிவின்மை அல்லது சிக்கல் கொண்ட எடுத்துக்காட்டுகளை நாங்கள் தவிர்க்க முயற்சிக்கிறோம், இதனால் முக்கிய முரண்பாடும் உத்தேசிக்கப்பட்ட தீர்வும் தெளிவாக இருக்கும்.
  • ஒரே மாதிரியான தன்மை மற்றும் தெளிவான ஒழுங்கமைப்பு. மாடல் ஸ்பெக் விதிகள் ஒன்றுக்கொன்று மற்றும் எங்கள் நோக்கமுள்ள மாடல் நடத்தையுடனும் முழுமையாக ஒத்திசைவாக இருக்கவும், மேலும் ஆவணத்தின் மொத்த அமைப்பு தெளிவாகவும் எளிதில் அணுகக்கூடியதாகவும் இருக்கவும் நாங்கள் முயற்சிக்கிறோம்.

எதிர்காலத்தில் என்ன இருக்கிறது

மாடல் ஸ்பெக் என்பது முக்கியமான அனைத்தையும் நாம் எழுதி வைத்துவிட முடியும் அல்லது மாடல்கள் எப்போதும் இலக்கை அடையும் என்று கூறுவதல்ல. உத்தேசிக்கப்பட்ட நடத்தை தெளிவாகவும், செயல்படுத்தக்கூடியதாகவும், திருத்தக்கூடியதாகவும் இருக்க வேண்டும் என்பதே ஒரு கூற்று.

மூன்று வெற்றிக்கான அளவுகோல்கள் எவ்வாறு நாம் அதை வளர்த்தெடுக்கிறோம் என்பதை வழிநடத்துகின்றன.

  • வாசிப்புத் தெளிவு. OpenAI-க்குள் மற்றும் வெளியே உள்ளவர்கள் நடத்தையைப் பற்றி துல்லியமான எதிர்பார்ப்புகளை உருவாக்க முடியும்; மேலும், நடத்தை ஆச்சரியமளிக்கும்போது உரையைச் சுட்டிக்காட்ட முடியும்.
  • செயல்படுத்தும் திறன். மாடல் ஸ்பெக் மதிப்பீடுகளை வடிவமைக்கவும், சம்பவங்களைக் கண்டறியவும், நிலையான தயாரிப்பு முடிவுகளை எடுக்கவும் பயன்படுத்தப்படலாம். இது மதிப்புகளை வெளிப்படுத்துவதற்காக மட்டுமல்ல.
  • திருத்தத்தன்மை. நாம் கற்றுக்கொள்ளும்போது, மாடல் ஸ்பெக் நிலையற்ற, தொடர்ந்து மாறிக்கொண்டிருக்கும் இலக்காக மாறாமல் வளர்ச்சியடையலாம்.

மாடல்கள் மற்றும் தயாரிப்புகள் வளர்ச்சியடையும்போது, புதிய திறன்கள் மற்றும் பயன்பாட்டு சூழல்களுக்கு ஏற்ப மாடல் ஸ்பெக் விரிவடைந்து மேலும் தெளிவாகும் என்று நாங்கள் எதிர்பார்க்கிறோம். AGI அனைத்து மனிதகுலத்திற்கும் பயனளிப்பதை உறுதி செய்வதற்கான எங்கள் நோக்கத்துடன் ஒத்ததாக, நடத்தைச் சார்ந்த விவரக்குறிப்பு ஒத்திசைவாகவும் சோதிக்கக்கூடியதாகவும் இருப்பதே இலக்காகும்.