GPT‑oss ஐ அறிமுகப்படுத்துகிறோம்
gpt-oss-120b மற்றும் gpt-oss-20b open-weight reasoning மாதிரிகளின் எல்லைகளை விரிவாக்குகின்றன
நாம் gpt-oss-120b மற்றும் gpt-oss-20b—இரு முன்னணி திறன் கொண்ட open-weight மொழி மாதிரிகளை வெளியிடுகிறோம், இவை குறைந்த செலவில் வலுவான உலக செயல்திறனை வழங்குகின்றன. நெகிழ்வான Apache 2.0 உரிம அட்டையுடன் கிடைக்கும் இம்மாதிரிகள், அதே அளவிலான open மாதிரிகளை எண்ணவியல் பணிகளில் வெற்றி பெறச் செய்யும், வலுவான கருவிகள் பயன்படுத்தும் திறன் கொண்டவை மற்றும் consumer hardware இல் திறம்பட பயன்படுத்தத்தக்கவாறு சிறப்பாக அமைக்கப்பட்டுள்ளன. O3 மற்றும் பிற எல்லை அமைப்புகள் உள்ளிட்ட OpenAI இன் மிகவும் மேம்பட்ட உள் மாதிரிகளால் தெரிவிக்கப்பட்ட மீளுறுதிக் கற்றல் மற்றும் நுட்பங்களின் கலவையைப் பயன்படுத்தி அவர்கள் பயிற்சி பெற்றனர்.
gpt-oss-120b மாதிரி முக்கிய ரீஸனிங் பெஞ்ச்மார்க்குகளில் OpenAI o4-mini மாதிரிக்கு இணையாக செயல்படுகிறது, மேலும் ஒரு 80 GB GPU-ல் திறம்பட இயங்குகிறது. GPT‑oss‑20b மாதிரி பொதுவான அளவுகோல்களில் OpenAI o3‑mini க்கு ஒத்த முடிவுகளை வழங்குகிறது மற்றும் வெறும் 16 ஜிபி நினைவகத்துடன் விளிம்பு சாதனங்களில் இயங்க முடியும், இது சாதனத்தில் பயன்பாட்டு நிகழ்வுகள், உள்ளூர் அனுமானம் அல்லது விலையுயர்ந்த உள்கட்டமைப்பு இல்லாமல் விரைவான மறு செய்கைக்கு ஏற்றதாக அமைகிறது. இரு மாதிரிகளும் டூல் பயன்பாடு, ஃப்யூ-ஷாட் ஃபங்க்ஷன் கால் செய்வது, CoT (செயல்முறை சிந்தனை) காரணவிளக்கம் (Tau-Bench ஏஜென்டிக் மதிப்பீட்டு தொகுப்பில் காணப்படுவது போல) மற்றும் HealthBench-இல் வலுவாக செயல்படுகின்றன. மேலும், OpenAI o1 மற்றும் GPT‑4o போன்ற சொந்த மாதிரிகளை கூட மீறுகின்றன.
இந்த மாதிரிகள் எங்கள் பதில் API உடன்(புதிய சாளரத்தில் திறக்கும்) இணக்கமாக உள்ளன மற்றும் விதிவிலக்கான அறிவுறுத்தல்களைப் பின்பற்றுதல், வலை தேடல் அல்லது பைதான் குறியீடு செயல்படுத்தல் போன்ற கருவி பயன்பாடு மற்றும் பகுத்தறிவு திறன்கள் ஆகியவற்றுடன் முகவர் பணிப்பாய்வுகளுக்குள் பயன்படுத்த வடிவமைக்கப்பட்டுள்ளன - சிக்கலான பகுத்தறிவு மற்றும் / அல்லது மிகக் குறைந்த பதுங்குநிலை இறுதி வெளியீடுகளை இலக்காகக் கொள்ளாத பணிகளுக்கான பகுத்தறிவு முயற்சியை சரிசெய்யும் திறன் உட்பட. அவை முழுமையாக தனிப்பயனாக்கக்கூடியவை, முழுமையான சிந்தனைச் சங்கிலியை (CoT) வழங்குகின்றன, மேலும் கட்டமைக்கப்பட்ட வெளியீடுகளை(புதிய சாளரத்தில் திறக்கும்) ஆதரவளிக்கின்றன.
பாதுகாப்பு எங்கள் அனைத்து மாதிரிகளையும் வெளியிடும் முறையின் அடித்தளம் ஆகும், குறிப்பாக ஓப்பன் மாதிரிகளுக்கு இது மிகவும் முக்கியம். மாதிரிகளை விரிவான பாதுகாப்பு பயிற்சி மற்றும் மதிப்பீடுகள் மூலம் இயக்குவதோடு, எங்கள் தயார்நிலை கட்டமைப்பின்(புதிய சாளரத்தில் திறக்கும்) கீழ் gpt-oss-120b இன் எதிர்மறையாக நன்றாக டியூன் செய்யப்பட்ட பதிப்பை சோதிப்பதன் மூலம் கூடுதல் மதிப்பீட்டு அடுக்கை அறிமுகப்படுத்தினோம். GPT‑oss மாதிரிகள் உள் பாதுகாப்பு அளவுகோல்களில் எங்கள் எல்லை மாதிரிகளுடன் ஒப்பிடத்தக்க வகையில் செயல்படுகின்றன, உருவாக்குபவர்களுக்கு எங்கள் சமீபத்திய சொந்த மாதிரிகளைப் போலவே அதே பாதுகாப்பு தரநிலைகளை வழங்குகின்றன. அந்த வேலைக்கான முடிவுகளையும் கூடுதல் விவரங்களையும் ஒரு ஆராய்ச்சிக் கட்டுரை(புதிய சாளரத்தில் திறக்கும்) மற்றும் மாதிரி அட்டையில்(புதிய சாளரத்தில் திறக்கும்) பகிர்ந்து கொள்கிறோம். எங்கள் முறைகளை வெளி நிபுணர்கள் மதிப்பாய்வு செய்தனர், இது ஓப்பன்-வேட் மாதிரிகளுக்கான புதிய பாதுகாப்பு தரநிலைகளை அமைப்பதில் ஒரு முன்னேற்றமான படியாகும்.
தரவுப் பாதுகாப்பிற்காக இந்த மாதிரிகளை வளாகத்தில் ஹோஸ்ட் செய்வது முதல் சிறப்பு தரவுத்தொகுப்புகளில் அவற்றை நன்றாகச் சரிசெய்வது வரை, எங்கள் திறந்த மாதிரிகளின் நிஜ உலக செயலிகளைப் பற்றி அறிய, AI Sweden(புதிய சாளரத்தில் திறக்கும்), Orange(புதிய சாளரத்தில் திறக்கும்) மற்றும் Snowflake(புதிய சாளரத்தில் திறக்கும்) போன்ற ஆரம்பகால கூட்டாளர்களுடன் நாங்கள் பணியாற்றி வருகிறோம். தனிப்பட்ட டெவலப்பர்களிடமிருந்து பெரிய நிறுவனங்கள் மற்றும் அரசுகள் வரை, அனைவருக்கும் AI-ஐ தங்களது கட்டமைப்பில் இயக்கி தனிப்பயனாக்குவதற்காக இந்த முன்னணி ஓப்பன் மாதிரிகளை வழங்குவதில் நாங்கள் உற்சாகமாக இருக்கிறோம். எங்கள் API-இல் கிடைக்கும் மாதிரிகளுடன் இணைத்து, டெவலப்பர்கள் AI பணிச்சுழற்சிகளை இயக்க தேவையான செயல்திறன், செலவு மற்றும் லேட்டென்சியைத் தேர்வு செய்யலாம்.
GPT‑oss மாதிரிகள் எங்கள் மிக முன்னணி ப்ரீ-டிரெய்னிங் மற்றும் போஸ்ட்-டிரெய்னிங் நுட்பங்களைக் கொண்டு பயிற்சி பெற்றுள்ளன, இதில் ரீஸனிங், திறன் மற்றும் உண்மையான உலகில் பயன்பாட்டில் சிறந்த செயல்திறன் பெறுவதில் குறிப்பாக கவனம் செலுத்தப்பட்டுள்ளது, மேலும் பரவலான டிப்ளாய்மெண்ட் சூழல்களில் பயன்படுத்தக்கூடியவையாக வடிவமைக்கப்பட்டுள்ளன. Whisper மற்றும் CLIP போன்ற பிற மாதிரிகளை நாங்கள் வெளிப்படையாகக் கிடைக்கச் செய்திருந்தாலும், GPT‑2[1] க்குப் பிறகு GPT‑oss மாதிரிகள் எங்கள் முதல் திறந்த-எடை அறிவு மாதிரிகள் ஆகும்.
ஒவ்வொரு மாதிரியும் ஒரு டிரான்ஸ்ஃபார்மர் ஆகும், இது உள்ளீட்டை செயலாக்க தேவையான செயலில் உள்ள அளவுருக்களின் எண்ணிக்கையைக் குறைக்க நிபுணர்களின் கலவையை (MoE[2]) பயன்படுத்துகிறது. gpt-oss-120b ஒரு டோக்கனுக்கு 5.1B அளவுருக்களை செயல்படுத்துகிறது, அதே நேரத்தில் gpt-oss-20b 3.6B ஐ செயல்படுத்துகிறது. மாதிரிகள் முறையே 117b மற்றும் 21b மொத்த அளவுருக்களைக் கொண்டுள்ளன. இந்த மாதிரிகள் மாறி மாறி அடர்த்தியான மற்றும் உள்ளூர் பட்டையிடப்பட்ட சிதறிய கவன வடிவங்களைப் பயன்படுத்துகின்றன, இது GPT‑3[3] போலவே உள்ளது. அனுமானம் மற்றும் நினைவக செயல்திறனுக்காக, மாதிரிகள் குழு பல வினவல் கவனத்தையும் பயன்படுத்துகின்றன, குழு அளவு 8 ஆகும். நிலைப்படுத்தல் குறியாக்கத்திற்கு ரோட்டரி பொசிஷனல் உட்பொதிப்பு (RoPE[4]) ஐப் பயன்படுத்துகிறோம், மேலும் 128k வரை சூழல் நீளங்களை இயல்பாக ஆதரவளி.
மாடல் | லேயர்கள் | மொத்த அளவுருக்கள் | ஒவ்வொரு டோக்கனுக்கும் செயல்பாட்டில் இருக்கும் அளவுருக்கள் | மொத்த நிபுணர்கள் | ஒவ்வொரு டோக்கனுக்கும் செயல்பாட்டில் இருக்கும் நிபுணர்கள் | சூழல் நீளம் |
gpt-oss-120b | 36 | 117B | 5.1B | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
நாங்கள் பெரும்பாலும் ஆங்கிலத்தில் உள்ள, உரை மட்டமான டேட்டாசெட்டில் மாதிரிகளை பயிற்சி செய்தோம், இதில் STEM, கோடிங் மற்றும் பொது அறிவுக்கு முக்கிய கவனம் வழங்கப்பட்டது. OpenAI o4-mini மற்றும் GPT‑4o‑க்கு பயன்படுத்திய எங்கள் டோக்கனைசர் விரிவாக்கத்தின் (superset) மூலம் தரவை டோக்கனைஸ் செய்தோம்: o200k_harmony, இதையும் இன்று திறந்தவெளியில் வெளியிடுகிறோம்.
எங்கள் மாதிரிகளின் வடிவமைப்பு மற்றும் பயிற்சி குறித்து மேலும் அறிய, மாதிரி அட்டை(புதிய சாளரத்தில் திறக்கும்) படிக்கவும்.
மேற்பார்வை கொண்ட செம்மையாக்கல் நிலை மற்றும் உயர்-கணக்கீட்டு RL நிலை உட்பட o4-miniக்கு பயன்படுத்தப்படும் ஒத்த செயல்முறையைப் பயன்படுத்தி மாதிரிகள் பிந்தைய பயிற்சி பெற்றன. எங்கள் நோக்கம் OpenAI மாதிரி ஸ்பெக்(புதிய சாளரத்தில் திறக்கும்) உடன் மாதிரிகளை சீரமைத்து, அதன் பதிலை உருவாக்குவதற்கு முன் CoT காரணவிளக்கமளித்தல் மற்றும் கருவி பயன்பாட்டைப் பயன்படுத்த கற்பிப்பதாகும். எங்கள் SoTA தனியுரிம பகுத்தறிவு மாதிரிகளைப் போலவே அதே நுட்பங்களைப் பயன்படுத்துவதன் மூலம், மாதிரிகள் பயிற்சிக்குப் பிந்தைய காலத்திற்குப் பிறகு விதிவிலக்கான திறன்களை வெளிப்படுத்துகின்றன.
API-இல் உள்ள OpenAI o-சீரிஸ் ரீஸனிங் மாதிரிகளுக்கு ஒத்தாக, இந்த இரண்டு ஓப்பன்-வேட் மாதிரிகள் மூன்று ரீஸனிங் முயற்சிகளை ஆதரிக்கின்றன—லோ, மீடியம், மற்றும் ஹை—இதில் லேட்டென்சி மற்றும் செயல்திறன் இடையே சமன்வயம் செய்யப்படுகிறது. டெவலப்பர்கள் சிஸ்டம் மெசேஜில் ஒரு வாக்கியத்தால் காரண விளக்கமளிக்கும் முயற்சியை எளிதில் அமைக்க முடியும்.
gpt-oss-120b மற்றும் gpt-oss-20b மாதிரிகளை, மற்ற OpenAI ரீஸனிங் மாதிரிகள் (o3, o3‑mini மற்றும் o4-mini) உடன் ஒப்பிடுகையில், கோடிங், போட்டித் கணிதம், சுகாதாரம் மற்றும் ஏஜென்டிக் கருவி பயன்பாடு திறன்களை அளவிடும் வகையில் ஸ்டாண்டர்டு அகாடெமிக் பெஞ்ச்மார்க்குகளில் மதிப்பீடு செய்தோம்.
gpt-oss-120b, போட்டி குறியீட்டு முறை (Codeforces), பொது சிக்கல் தீர்க்கும் முறை (MMLU மற்றும் HLE) மற்றும் கருவி அழைப்பு (TauBench) ஆகியவற்றில் OpenAI o3‑mini ஐ விட சிறப்பாக செயல்படுகிறது மற்றும் OpenAI o4-mini உடன் பொருந்துகிறது அல்லது மிஞ்சுகிறது. மேலும் இது உடல்நலம் தொடர்பான கேள்விகள் (ஹெல்த்பெஞ்ச்) மற்றும் போட்டி கணிதம் (AIME 2024 & 2025) ஆகியவற்றில் o4-mini ஐ விட சிறப்பாக செயல்படுகிறது. gpt-oss-20b, அதன் சிறிய அளவு இருந்தபோதிலும், போட்டி கணிதம் மற்றும் ஆரோக்கியத்தில் கூட அதை விட சிறப்பாகச் செயல்படும் அதே சோதனைகளில் OpenAI o3‑mini உடன் பொருந்துகிறது அல்லது மிஞ்சுகிறது.
gpt-oss மாதிரிகள் மருத்துவ நிபுணரை மாற்றவோ, நோயறிதல் அல்லது சிகிச்சைக்காக உருவாக்கப்பட்டவை அல்ல
உதாரண வெளியீடுகள்
gpt-oss-120b உலாவல் கருவியைப் பயன்படுத்தி புதுப்பித்த தகவல்களை விரைவாக திரட்ட முடியும், இதில் அடுத்தடுத்த 10கள் அழைப்புகளை ஒன்றாக இணைப்பது உட்பட.
எங்கள் சமீபத்திய ஆராய்ச்சி ஒரு பகுத்தறிவு மாதிரியின் CoT ஐ கண்காணிப்பது தவறான நடத்தையைக் கண்டறிய உதவியாக இருக்கும் என்பதைக் காட்டுகிறது. இந்த பார்வை தொழில்துறையில் உள்ள மற்றவர்களாலும் பகிரப்படுகிறது(புதிய சாளரத்தில் திறக்கும்). OpenAI o1‑முன்னோட்டம் தொடங்கியதிலிருந்து எங்கள் கொள்கைகளுக்கு இணங்க, எங்கள் GPT‑oss மாதிரிகளுக்கான CoT இல் எந்த நேரடி மேற்பார்வையையும் நாங்கள் வைக்கவில்லை. மாதிரி தவறான நடத்தை, மோசடி மற்றும் தவறாக பயன்படுத்தலை கண்காணிப்பதில் இது முக்கியமானது என்று நாங்கள் நம்புகிறோம். நாங்கள் எதிர்பார்க்கும் நோக்கம், சூப்பர்வைசர் இல்லாத சென்-ஆப்-தோட் கொண்ட ஓப்பன் மாதிரியை வெளியிடுவதன் மூலம், டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்கள் தங்கள் சொந்த CoT கண்காணிப்பு அமைப்புகளை ஆராயவும், செயல்படுத்தவும் வாய்ப்பு பெறுவதாகும்.
டெவலப்பர்கள் தங்கள் செயலிகளில் CoTs-ஐ பயனர்களுக்கு நேரடியாக காட்ட கூடாது. இதில் கற்பனை செய்யப்பட்ட அல்லது தீங்கான உள்ளடக்கம் இருக்கக்கூடும், அதில் OpenAI-இன் தரநிலை பாதுகாப்பு கொள்கைகளை பிரதிபலிக்காத மொழி மற்றும் மாதிரிக்கு இறுதி வெளியீட்டில் சேர்க்க வேண்டாம் என்று தெளிவாக கேட்கப்பட்ட தகவலும் அடங்கக்கூடும்.
gpt-oss-120b அதன் வெளியீட்டில் உள்ள கணினி வழிமுறைகளை வலுவாகப் பின்பற்றுகிறது, ஆனால் பெரும்பாலும் அதன் CoT இல் உள்ள வழிமுறைகளை வெளிப்படையாக மீறும்.
GPT‑oss மாதிரிகள் பாதுகாப்பு பயிற்சிக்காக எங்கள் முன்னணி முறைகளை பயன்படுத்துகின்றன. முன் பயிற்சியின் போது, வேதியியல், உயிரியல், கதிரியக்க மற்றும் அணு (CBRN) தொடர்பான சில தீங்கு விளைவிக்கும் தரவுகளை நாங்கள் வடிகட்டினோம். பயிற்சிக்குப் பிந்தைய காலத்தில், பாதுகாப்பற்ற தூண்டிகளை மறுப்பதற்கும், தூண்டி ஊசிகளுக்கு எதிராக பாதுகாப்பதற்கும் மாதிரியை கற்பிக்க, நாங்கள் திட்டமிட்ட சீரமைப்பு மற்றும் அறிவுறுத்தல் படிநிலையை(புதிய சாளரத்தில் திறக்கும்) பயன்படுத்தினோம்.
ஒரு திறந்த எடை மாதிரி வெளியிடப்பட்டவுடன், எதிரிகள் தீங்கிழைக்கும் நோக்கங்களுக்காக மாதிரியை நன்றாக மாற்ற முடியும். சிறப்பு உயிரியல் மற்றும் சைபர் பாதுகாப்பு தரவுகளில் மாதிரியை நன்றாகச் சரிசெய்து, தாக்குபவர் செய்யும் விதத்தில் ஒவ்வொரு டொமைனுக்கும் ஒரு டொமைன்-குறிப்பிட்ட மறுக்காத பதிப்பை உருவாக்குவதன் மூலம் இந்த அபாயங்களை நாங்கள் நேரடியாக மதிப்பிட்டோம். பின்னர், இந்த மாதிரிகளின் திறன் நிலையை உள்ளக மற்றும் வெளிப்புற சோதனைகள் மூலம் மதிப்பீடு செய்தோம். இந்த சோதனை, எங்கள் இணைப்பட்ட பாதுகாப்பு ஆவணத்தில் விவரிக்கப்பட்டுள்ளபடி, OpenAI இன் துறையில் முன்னணி பயிற்சி அடுக்கைப் பயன்படுத்திய வலுவான நுண் இசைவிப்புடன் கூட, இந்த தீங்கிழைக்கும் வகையில் நுண் இசைவிக்கப்பட்ட மாதிரிகள் எங்கள் தயார்நிலை கட்டமைப்பின்படி உயர் திறன் நிலைகளை அடைய முடியவில்லை. இந்த தீங்கான ஃபைன்-டூனிங் முறையை மூன்று சுயாதீன நிபுணர் குழுக்கள் மதிப்பாய்வு செய்தனர், பயிற்சி செயல்முறை மற்றும் மதிப்பீடுகளை மேம்படுத்த பரிந்துரைகள் வழங்கினார்கள், இதில் பலவற்றை நாங்கள் ஏற்றுக்கொண்டோம். மாதிரி அட்டையில் இந்தப் பரிந்துரைகளை நாங்கள் விரிவாகக் கூறுகிறோம். இந்த செயல்முறைகள் திறந்த மாதிரி பாதுகாப்பிற்கான அர்த்தமுள்ள முன்னேற்றத்தைக் குறிக்கின்றன. இந்த கண்டுபிடிப்புகள் gpt-oss மாதிரிகளை வெளியிடும் எங்கள் முடிவுக்கு வழிகாட்டின. இந்த மாதிரிகள் தொழில்துறை முழுவதும் பாதுகாப்பு பயிற்சி மற்றும் சீரமைப்பு ஆராய்ச்சியை விரைவுபடுத்த உதவும் என்று நாங்கள் நம்புகிறோம்.
பாதுகாப்பான திறந்த மூல சூழலை உருவாக்க, உலகெங்கிலும் உள்ள ஆராய்ச்சியாளர்கள், உருவாக்குபவர்கள் மற்றும் ஆர்வலர்களை புதுமையான பாதுகாப்பு சிக்கல்களை அடையாளம் காண ஊக்குவிக்க, நாங்கள் ஒரு ரெட் டீமிங் சவாலைக்(புதிய சாளரத்தில் திறக்கும்) நடத்துகிறோம். இந்த சவால் $500,000 பரிசுத் தொகையை கொண்டுள்ளது, இது OpenAI மற்றும் பிற முன்னணி ஆய்வகங்களின் நிபுணர் குழுவின் மதிப்பீட்டின் அடிப்படையில் வழங்கப்படும். சவாலின் முடிவில், பரந்த சமூகம் உடனடியாகப் பயனடையக்கூடிய வகையில், சரிபார்க்கப்பட்ட கண்டுபிடிப்புகளின் அடிப்படையில் ஒரு அறிக்கையை வெளியிட்டு, மதிப்பீட்டுத் தரவுத் தொகுப்பைத் திறந்த மூலமாக்குவோம். மேலும் அறியவும் மற்றும் இங்கே(புதிய சாளரத்தில் திறக்கும்) பங்கேற்கவும்.
GPT‑oss‑120b மற்றும் gpt-oss-20b ஆகிய இரண்டிற்கான எடைகளும் Hugging Face இல் பதிவிறக்கம் செய்ய இலவசமாகக் கிடைக்கின்றன, மேலும் அவை MXFP4 இல் இயல்பாகவே அளவிடப்படுகின்றன. இதனால் gpt-oss-120B மாதிரி 80GB நினைவகத்தில் இயங்க முடியும், gpt-oss-20b மட்டும் 16GB நினைவகத்தையே தேவைப்படுகிறது.
இந்த மாதிரிகள் எங்கள் ஹார்மனி ப்ராம்ட் வடிவமைப்பில்(புதிய சாளரத்தில் திறக்கும்) பிந்தைய பயிற்சி பெற்றுள்ளன, மேலும் தத்தெடுப்பை எளிதாக்குவதற்கு பைதான் மற்றும் ரஸ்ட் இரண்டிலும் ஒரு ஹார்மனி ரெண்டரரை(புதிய சாளரத்தில் திறக்கும்) திறந்த மூலமாக்குகிறோம். மாதிரியை PyTorch மூலம் மற்றும் Apple-இன் Metal தளத்தில் இன்ஃபெரன்ஸ் இயக்குவதற்கான ரெஃபரென்ஸ் செயல்பாடுகளையும், மாதிரிக்கான உதாரண டூல்கள் தொகுப்பையும் நாங்கள் வெளியிடுகிறோம்.
இந்த மாதிரிகள் நெகிழ்வானதாகவும், எங்கும் இயங்க எளிதாகவும் இருக்கும் வகையில் வடிவமைத்துள்ளோம் - உள்ளூரில், சாதனத்தில் அல்லது மூன்றாம் தரப்பு அனுமான வழங்குநர்கள் மூலம். இதற்கு ஆதரவளிக்க, நாங்கள் Azure, Hugging Face, vLLM, Ollama, llama.cpp போன்ற முன்னணி வெளியீட்டு தளங்களுடன் தொடங்குவதற்கு முன்பே கூட்டாண்மை செய்தோம். LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare மற்றும் OpenRouter ஆகியவை மாதிரிகளை உருவாக்குபவர்களுக்கு பரவலாக அணுகக்கூடியதாகச் செய்கின்றன. ஹார்ட்வேர் பகுதி தொடர்பாக, NVIDIA, AMD, Cerebras, மற்றும் Groq போன்ற தொழில் முன்னணித் தலைவர்களுடன் இணைந்து, பல்வேறு சிஸ்டம்களில் சிறந்த செயல்திறன் (optimized performance) உறுதி செய்தோம்.
இன்றைய வெளியீட்டின் ஒரு பகுதியாக, Microsoft gpt-oss-20b மாதிரியின் GPU-optimized பதிப்புகளை Windows சாதனங்களுக்கு கொண்டு வருகிறது. ONNX Runtime மூலம் இயக்கப்படும் இந்த மாதிரிகள் உள்ளூர் இன்ஃபெரன்ஸ்-ஐ ஆதரிக்கின்றன மற்றும் Foundry Local மற்றும் VS Code-க்கு AI Toolkit மூலம் கிடைக்கின்றன, இதனால் Windows டெவலப்பர்கள் ஓப்பன் மாதிரிகளை பயன்படுத்தி கட்டமைக்க எளிதாகிறது.
முழுமையாக தனிப்பயனாக்கக்கூடிய மாதிரிகளை விரும்பும் டெவலப்பர்களுக்கு, அவர்கள் தங்கள் சொந்த சூழல்களில் நன்றாகச் சரிசெய்து பயன்படுத்தலாம், gpt-oss ஒரு சிறந்த பொருத்தம். மல்டிமாடல் ஆதரவு, உள்ளமைக்கப்பட்ட கருவிகள் மற்றும் எங்கள் தளத்துடன் தடையற்ற ஒருங்கிணைப்பு ஆகியவற்றை நாடுபவர்களுக்கு, எங்கள் API தளத்தின் மூலம் கிடைக்கும் மாதிரிகள் சிறந்த தேர்வாக இருக்கும். டெவலப்பர்கள் கருத்துக்களை நெருங்கிய முறையில் கேட்டு வருகிறோம், எதிர்காலத்தில் gpt-ossக்கு API ஆதரவை பரிசீலிக்கலாம்.
நீங்கள் மாதிரிகளை முயற்சிக்க விரும்பினால், எங்கள் open model Playground(புதிய சாளரத்தில் திறக்கும்)க்கு செல்லவும். வெவ்வேறு சூழல் வழங்குநர்களைப் பயன்படுத்தி மாதிரிகளை எவ்வாறு பயன்படுத்துவது அல்லது மாதிரிகளை நயமாக்குவது பற்றி மேலும் அறிய, எங்கள் வழிகாட்டிகளைப் பாருங்கள்(புதிய சாளரத்தில் திறக்கும்).
GPT‑oss‑120b மற்றும் gpt-oss-20b ஆகியவற்றை வெளியிடுவது திறந்த எடை மாதிரிகளுக்கு ஒரு குறிப்பிடத்தக்க முன்னேற்றத்தைக் குறிக்கிறது. இந்த அளவில், இந்த மாதிரிகள் ரீஸனிங் திறன்களிலும் பாதுகாப்பிலும் முக்கிய முன்னேற்றங்களை வழங்குகின்றன. ஓப்பன் மாதிரிகள் எங்கள் ஹோஸ்டட் மாதிரிகளை பூர்த்தி செய்து, டெவலப்பர்களுக்கு முன்னணி ஆராய்ச்சியை வேகப்படுத்த, புதுமையை ஊக்குவிக்க மற்றும் பரவலான பயன்பாடுகளில் பாதுகாப்பான, வெளிப்படையான AI மேம்பாட்டை சாத்தியம் செய்யும் விரிவான கருவிகள் தேர்வை வழங்குகின்றன.
இந்த ஓப்பன் மாதிரிகள் எழும் சந்தைகள், வளம் குறைந்த துறைகள் மற்றும் சொந்த மாதிரிகளை ஏற்க பட்ஜெட் அல்லது நெகிழ்வான தன்மை இல்லாத சிறிய நிறுவனங்களுக்கு தடைகளை குறைக்கின்றன. சக்திவாய்ந்த, எளிதில் பயன்படுத்தக்கூடிய கருவிகள் அவர்களின் கைகளில் இருக்கும் போது, உலகெங்கும் உள்ள மக்கள் தங்களுக்கும் பிறருக்கும் புதிய வாய்ப்புகளை கட்டமைக்க, புதுமை செய்ய, மற்றும் உருவாக்க முடியும். அமெரிக்காவில் உருவாக்கப்பட்ட இந்த திறமையான திறந்த எடை மாதிரிகளுக்கான பரவலான அணுகல், ஜனநாயக AI வழிகளைக் விரிவாக்க உதவுகிறது.
ஆரோக்கியமான open model சுற்றுச்சூழல் அமைப்பு என்பது AI ஐ பரவலாக அணுகக்கூடியதாகவும் அனைவருக்கும் பயனுள்ளதாகவும் மாற்ற உதவும் ஒரு பரிமாணமாகும். டெவலப்பர்கள் மற்றும் ஆராய்ச்சியாளர்களை இந்த மாதிரிகளை பயன்படுத்தி பரிசோதனை செய்ய, இணைந்து பணியாற்ற, மற்றும் சாத்தியமான எல்லைகளை விரிவாக்க அழைக்கிறோம். நீங்கள் என்ன கட்டமைக்கிறீர்கள் என்பதைப் பார்க்க நாங்கள் ஆவலுடன் காத்திருக்கிறோம்.
ஆசிரியர்
மேற்கோள்கள்
பங்களிப்பாளர்கள்
Zoran Martinovic, Zhuohan Li, Zhiqing Sun, Zach Johnson, Yu Yang, Yu Bai, Yang Song, Xin Wang, Wenting Zhan, Volodymyr Kyrylov, Vlad Fomenko, Tyler Bertao, Tong Mu, Timur Garipov, Tarun Gogineni, Suvansh Sanjeev, Steve Mostovoy, Song Mei, Shengjia Zhao, Sebastien Bubeck, Scott McKinney, Scott Lessans, Sandhini Agarwal, Sam Toizer, Sam Altman, Saachi Jain, Romain Huet, Rahul K. Arora, Philippe Tillet, Olivia Watkins, Nivedita Brett, Nikhil Vyas, Miles Wang, Michihiro Yasunaga, Michelle Pokrass, Mia Glaese, Max Schwarzer, Mark Chen, Mario Lezcano-Casado, Marat Dukhan, Lukas Gross, Ludovic Peran, Ludovic Peran, Lindsay McCallum, Lin Yang, Lily (Xiaoxuan) Liu, Leher Pathak, Lama Ahmad, Kristian Georgiev, Kristen Ying, Kimmy Richardson, Kevin Whinnery, Kevin Weil, Kevin Lu, Kevin Fives, Kendal Simon, Katia Gil Guzman, Karan Singhal, Karan Singhal, Kai Chen, Josh McGrath, Jordan Liss, Jongsoo Park, John Hallman, Johannes Heidecke, Jiancheng Liu, Ji Lin, Jason Kwon, Jason Ai, James Park Lennon, Jakub Pachocki, Jacob Huh, Jackie Hehir, Irina Kofman, Huida Qiu, Hongyu Ren, Harshit Sikchi, Hannah Wong, Haitang Hu, Haitang Hu, Haiming Bao, Hadi Salman, Guillaume Leclerc, Greg Brockman, Gideon Myles, Giambattista Parascandolo, Gaby Raila, Foivos Tsimpourlas, Filippo Raso, Eugene Brevdo, Eric Wallace, Enoch Cheung, Elizabeth Proehl, Elaine Ya Le, Edwin Arbus, Eddie Zhang, Dominik Kundel, Dmitry Pimenov, David Robinson, Dane Stuckey, Dana Palmie, Dan Cook, Cyril Zhang, Chris Lu, Chris Koch, Che Chang, Cedric Whitney, Casey Dvorak, Carolina Paz, Brian Zhang, Bowen Baker, Bob Rotsted, Boaz Barak, Ashley Pantuliano, Andy Applebaum, Amy Wendling, Ally Bennett, Alexander Neitz, Alex Paino, Alex Nichol, Alec Helyar, Aidan McLaughlin, Aidan Clark மற்றும் Adam Goucher


