gpt-oss পরিচিতি
gpt-oss-120b এবং gpt-oss-20b ওপেন-ওয়েট রিজনিং মডেল-এর সীমা আরও এগিয়ে নিয়ে যাচ্ছে
আমরা প্রকাশ করছি gpt-oss-120b এবং gpt-oss-20b—দুটি আধুনিকতম ওপেন-ওয়েট ল্যাংগুয়েজ মডেল, যা কম খরচে শক্তিশালী বাস্তব-জগতের পারফরম্যান্স দেয়. Apache 2.0 লাইসেন্স এর নমনীয় শর্তে উপলব্ধ এই মডেলগুলো অনুরূপ আকারের খোলা মডেলগুলোর চেয়ে যুক্তির কাজে ভালো ফলাফল দেখায়, শক্তিশালী হাতিয়ার ব্যবহার ক্ষমতা প্রদর্শন করে, এবং ভোক্তা হার্ডওয়্যারে দক্ষ স্থাপনার জন্য অপ্টিমাইজ করা হয়েছে. রিইনফোর্সমেন্ট লার্নিং এবং OpenAI-এর সবচেয়ে উন্নত অভ্যন্তরীণ মডেল, যেমন o3 এবং অন্যান্য ফ্রন্টিয়ার সিস্টেম থেকে প্রাপ্ত বিভিন্ন প্রযুক্তির মিশ্রণে এগুলোকে প্রশিক্ষিত করা হয়েছে.
gpt-oss-120b মডেল মূল রিজনিং বেঞ্চমার্কে OpenAI o4-mini-এর সঙ্গে প্রায় সমপর্যায়ে পৌঁছে এবং একটি 80 জিবি GPU-তে দক্ষতার সঙ্গে চলে. gpt-oss-20b মডেলটি সাধারণ বেঞ্চমার্কে OpenAI-এর o3‑mini‑এর মতোই ফলাফল প্রদান করে এবং এটি মাত্র 16 GB মেমরি-সম্পন্ন এজ ডিভাইসেও চালানো যায়. ফলে এটি অন-ডিভাইস ব্যবহারের ক্ষেত্র, স্থানীয় ইনফারেন্স বা ব্যয়বহুল অবকাঠামো ছাড়াই দ্রুত পরীক্ষণ ও উন্নয়নের জন্য আদর্শ. উভয় মডেলই টুল ইউজ, ফিউ-শট ফাংশন কলিং, CoT রিজনিং (Tau-Bench এজেন্টিক ইভ্যালুয়েশন সুইট এর ফলাফলেও যেমন দেখা যায়) এবং HealthBench-এ শক্তিশালী পারফরম্যান্স দেখায়—এমনকি OpenAI o1 ও GPT‑4o‑এর মতো প্রোপ্রায়েটারি মডেলকেও অতিক্রম করেছে.
এই মডেলগুলি আমাদের রেসপন্স API-এর(একটি নতুন উইন্ডোতে খোলে) সাথে সামঞ্জস্যপূর্ণ এবং ব্যতিক্রমী নির্দেশনা অনুসরণ, ওয়েব অনুসন্ধান বা Python কোড এক্সিকিউশনের মতো সরঞ্জাম ব্যবহার এবং যুক্তি ক্ষমতার সাথে এজেন্টিক ওয়ার্কফ্লোগুলির মধ্যে ব্যবহার করার জন্য ডিজাইন করা হয়েছে — যার মধ্যে জটিল যুক্তির প্রয়োজন হয় না এবং/অথবা খুব কম বিলম্ব চূড়ান্ত আউটপুটগুলির প্রয়োজন হয় না এমন কাজগুলির জন্য যুক্তি প্রচেষ্টা সামঞ্জস্য করার ক্ষমতা সহ. এগুলি সম্পূর্ণরূপে কাস্টমাইজযোগ্য, পুরোপুরি চেইন-অফ-থট (CoT) প্রদান করে এবং স্ট্রাকচার্ড আউটপুট(একটি নতুন উইন্ডোতে খোলে) সহায়তা করে.
আমাদের সব মডেল রিলিজ করার পদ্ধতির ভিত্তি হলো সুরক্ষা, এবং ওপেন মডেলগুলোর ক্ষেত্রে এটি বিশেষভাবে গুরুত্বপূর্ণ. বিস্তৃত সুরক্ষা প্রশিক্ষণ এবং মূল্যায়নের মাধ্যমে মডেলগুলি চালানোর পাশাপাশি, আমরা আমাদের প্রস্তুতি কাঠামোর(একটি নতুন উইন্ডোতে খোলে) অধীনে GPT‑oss‑120b‑এর প্রতিকূলভাবে সূক্ষ্ম-টিউনড সংস্করণ পরীক্ষা করে মূল্যায়নের একটি অতিরিক্ত স্তরও চালু করেছি. gpt-oss মডেলগুলি অভ্যন্তরীণ সুরক্ষা বেঞ্চমার্কে আমাদের ফ্রন্টিয়ার মডেলগুলির সাথে তুলনামূলকভাবে পারফর্ম করে, নির্মাতারা আমাদের সাম্প্রতিক মালিকানাধীন মডেলগুলির মতো একই সুরক্ষা মান প্রদান করে. আমরা সেই কাজের ফলাফল এবং আরও বিশদ একটি গবেষণা পত্রে(একটি নতুন উইন্ডোতে খোলে) এবং মডেল কার্ডে(একটি নতুন উইন্ডোতে খোলে) শেয়ার করে নিচ্ছি. আমাদের মেথডোলজি এক্সটার্নাল এক্সপার্টদের দ্বারা পর্যালোচনা করা হয়েছে এবং ওপেন-ওয়েট মডেলগুলোর জন্য নতুন সেফটি স্ট্যান্ডার্ড স্থাপনে এটি এক ধাপ অগ্রগতি নির্দেশ করে.
আমরা AI Sweden(একটি নতুন উইন্ডোতে খোলে), Orange(একটি নতুন উইন্ডোতে খোলে) এবং Snowflake(একটি নতুন উইন্ডোতে খোলে) আমাদের উন্মুক্ত মডেলগুলোর বাস্তব জীবনের প্রয়োগ সম্পর্কে জানতে — যেমন ডেটা নিরাপত্তার জন্য এই মডেলগুলোকে নিজস্ব সার্ভারে হোস্ট করা অথবা বিশেষায়িত ডেটাসেটে তাদের সূক্ষ্মভাবে প্রশিক্ষিত করা. আমরা উচ্ছ্বসিত এই বেস্ট-ইন-ক্লাস ওপেন মডেলগুলো সবাইকে ক্ষমতায়িত করার জন্য—স্বতন্ত্র ডেভেলপার থেকে বড় এন্টারপ্রাইজ, এমনকি সরকার পর্যন্ত—যাতে তারা তাদের নিজস্ব ইনফ্রাস্ট্রাকচারে AI চালাতে এবং কাস্টমাইজ করতে পারে. আমাদের API-তে উপলব্ধ মডেলের সঙ্গে মিলিয়ে, ডেভেলপাররা তাদের AI ওয়ার্কফ্লো চালাতে প্রয়োজনীয় পারফরম্যান্স, খরচ এবং ল্যাটেন্সি বেছে নিতে পারে.
gpt-oss মডেলগুলোকে আমাদের সবচেয়ে উন্নত প্রি-ট্রেনিং ও পোস্ট-ট্রেনিং টেকনিক ব্যবহার করে প্রশিক্ষিত করা হয়েছে, যেখানে রিজনিং, এফিশিয়েন্সি এবং বিস্তৃত ডিপ্লয়মেন্ট এনভায়রনমেন্ট জুড়ে বাস্তব জগতের ইউজেবিলিটিতে বিশেষ ফোকাস দেওয়া হয়েছে. যদিও আমরা Whisper এবং CLIP সহ অন্যান্য মডেল GPT‑oss মডেলগুলি GPT‑2[1] এরপর আমাদের প্রথম ওপেন-ওয়েট ভাষার মডেলগুলি উন্মুক্তভাবে উপলব্ধ করেছি.
প্রতিটি মডেল একটি ট্রান্সফরমার যা ইনপুট প্রক্রিয়াকরণের জন্য প্রয়োজনীয় সক্রিয় প্যারামিটারের সংখ্যা কমাতে মিক্সচার-অফ-এক্সপার্টস (MoE[2]) ব্যবহার করে. GPT‑oss‑120b প্রতি টোকেনে 5.1B প্যারামিটার সক্রিয় করে, যেখানে GPT‑oss‑20b 3.6B সক্রিয় করে. মডেলগুলির মোট প্যারামিটার যথাক্রমে 117b এবং 21b. মডেলগুলি GPT‑3[3]-এর মতো পর্যায়ক্রমে ঘন এবং স্থানীয়ভাবে ব্যান্ডেড স্পার্স মনোযোগের ধরন ব্যবহার করে. অনুমান এবং মেমরি দক্ষতার জন্য, মডেলগুলি 8 জনের গ্রুপ আকার সহ গ্রুপযুক্ত মাল্টি-কোয়েরি মনোযোগ ব্যবহার করে. আমরা অবস্থানগত এনকোডিংয়ের জন্য রোটারি পজিশনাল এমবেডিং (RoPE[4]) ব্যবহার করি এবং স্বাভাবিকভাবে 128k পর্যন্ত প্রসঙ্গ দৈর্ঘ্য সহায়তা করি.
মডেল | স্তরসমূহ | মোট প্যারামিটার সংখ্যা | প্রতি টোকেনে সক্রিয় প্যারামিটারের সংখ্যা | মোট বিশেষজ্ঞ | প্রতি টোকেন সক্রিয় বিশেষজ্ঞ | প্রসঙ্গের দৈর্ঘ্য |
gpt-oss-120b | 36 | 117 বিলিয়ন | 5.1B | 128 | 4 | 128k |
gpt-oss-20b | 24 | 21B | 3.6B | 32 | 4 | 128k |
আমরা মডেলগুলোকে প্রধানত ইংরেজি, শুধুমাত্র টেক্সট-ভিত্তিক ডেটাসেটে প্রশিক্ষিত করেছি, যেখানে STEM, কোডিং এবং সাধারণ জ্ঞানে বিশেষ ফোকাস ছিল. আমরা ডেটা টোকেনাইজ করেছি এমন একটি সুপারসেট টোকেনাইজারের ব্যবহার করে, যা OpenAI o4-mini এবং GPT‑4o‑তে ব্যবহৃত হয়েছিল: o200k_harmony—যেটি আমরা আজ ওপেন-সোর্সিং করছি.
আমাদের মডেলগুলির আর্কিটেকচার এবং প্রশিক্ষণ সম্পর্কে আরও জানতে মডেল কার্ড(একটি নতুন উইন্ডোতে খোলে) পড়ুন.
মডেলগুলোকে o4-mini এর জন্য ব্যবহৃত একই ধরনের প্রক্রিয়া ব্যবহার করে পোস্ট-ট্রেনিং করা হয়েছিল, যার মধ্যে একটি তত্ত্বাবধানে থাকা ফাইন-টিউনিং স্টেজ এবং একটি উচ্চ-কম্পিউট RL স্টেজ অন্তর্ভুক্ত ছিল. আমাদের উদ্দেশ্য ছিল মডেলগুলিকে OpenAI মডেল স্পেক(একটি নতুন উইন্ডোতে খোলে) এর সাথে সামঞ্জস্যপূর্ণ করা এবং উত্তর তৈরি করার আগে CoT যুক্তি এবং টুল ব্যবহারের প্রয়োগ শেখানো. আমাদের SoTA প্রোপ্রায়েটারি রিজনিং মডেলে ব্যবহৃত একই টেকনিক ব্যবহার করে, পোস্ট-ট্রেনিং এরপর মডেলগুলো অসাধারণ সক্ষমতা প্রদর্শন করে.
API-তে থাকা OpenAI o-series রিজনিং মডেলের মতো, এই দুই ওপেন-ওয়েট মডেল তিন ধরনের রিজনিং এফর্ট সাপোর্ট করে—লো, মিডিয়াম এবং হাই—যেখানে ল্যাটেন্সি বনাম পারফরম্যান্সে ট্রেড-অফ থাকে. ডেভেলপাররা সিস্টেম মেসেজে একটি বাক্যেই রিজনিং এফর্ট সহজেই সেট করতে পারেন.
আমরা gpt-oss-120b এবং gpt-oss-20b-কে স্ট্যান্ডার্ড একাডেমিক বেঞ্চমার্ক জুড়ে মূল্যায়ন করেছি যাতে তাদের কোডিং, প্রতিযোগিতামূলক গণিত, স্বাস্থ্য এবং এজেন্টিক টুল ব্যবহারের সক্ষমতা পরিমাপ করা যায় এবং সেগুলোকে OpenAI-এর অন্যান্য রিজনিং মডেল যেমন o3, o3‑mini এবং o4-mini-এর সঙ্গে তুলনা করেছি.
gpt-oss-120b কম্পিটিশন কোডিং (Codeforces), সাধারণ সমস্যা সমাধান (MMLU এবং HLE) এবং টুল কলিং (TauBench)-এ OpenAI o3‑mini‑কে অতিক্রম করে এবং OpenAI o4-mini-কে ম্যাচ করে বা ছাড়িয়ে যায়. এটি স্বাস্থ্য-সম্পর্কিত প্রশ্নাবলীতে (HealthBench) এবং প্রতিযোগিতামূলক গণিতে (AIME 2024 এবং 2025) o4-mini এর চেয়েও ভালো করে. gpt-oss-20b এই একই ইভ্যালসে OpenAI o3‑mini‑এর সাথে ম্যাচ করে বা তার চেয়ে বেশি, যদিও এর আকার ছোট, এমনকি প্রতিযোগিতামূলক গণিত এবং স্বাস্থ্যে এটিকে ছাড়িয়ে গেছে.
gpt-oss মডেল কোনো মেডিকেল প্রফেশনালের বিকল্প নয় এবং রোগ নির্ণয় বা চিকিৎসার জন্য উদ্দেশ্যপ্রণোদিত নয়
উদাহরণ রোলআউটস
gpt-oss-120b একটি ব্রাউজিং টুল ব্যবহার করে দ্রুত আপ-টু-ডেট তথ্য সংগ্রহ করতে সক্ষম, যার মধ্যে একসঙ্গে 10-টির বেশি ধারাবাহিক কল চেইন করা অন্তর্ভুক্ত.
আমাদের সাম্প্রতিক গবেষণায় দেখা গেছে যে একটি যুক্তি মডেলের CoT পর্যবেক্ষণ করা মিসবিহেভিয়ার সনাক্ত করতে সহায়ক হতে পারে যতক্ষণ না মডেলটি CoT সারিবদ্ধ করার জন্য সরাসরি তত্ত্বাবধানে প্রশিক্ষিত হয়নি. এই দৃষ্টিভঙ্গিটি ইন্ডাস্ট্রির অন্যরাও শেয়ার করেন(একটি নতুন উইন্ডোতে খোলে). OpenAI o1‑প্রিভিউ চালু করার পর থেকে আমাদের নীতির সাথে সামঞ্জস্য রেখে, আমরা GPT মডেলের জন্য CoT-এ কোনো সরাসরি তদারকি করিনি. আমরা বিশ্বাস করি মডেল মিসবিহেভিয়ার, ডিসেপশন এবং মিসইউজ মনিটর করতে এটি অত্যন্ত জরুরি. আমাদের আশা হলো একটি নন-সুপারভাইজড চেইন-অফ-থট সহ ওপেন মডেল রিলিজ করলে ডেভেলপার ও রিসার্চাররা নিজেদের CoT মনিটরিং সিস্টেম গবেষণা ও বাস্তবায়নের সুযোগ পাবেন.
ডেভেলপারদের তাদের অ্যাপ্লিকেশনে ইউজারদের সরাসরি CoTs দেখানো উচিত নয়. এগুলোতে হ্যালুসিনেটেড বা ক্ষতিকারক কনটেন্ট থাকতে পারে, যার মধ্যে এমন ভাষাও থাকতে পারে যা OpenAI-এর স্ট্যান্ডার্ড সেফটি নীতিমালা প্রতিফলিত করে না এবং এমন তথ্যও থাকতে পারে যা মডেলকে স্পষ্টভাবে ফাইনাল আউটপুটে অন্তর্ভুক্ত না করতে বলা হয়েছে.
gpt-oss-120b তার আউটপুটে সিস্টেম ইনস্ট্রাকশন শক্তভাবে ফলো করে, তবে প্রায়শই CoT-এ স্পষ্টভাবে ইনস্ট্রাকশন অমান্য করে.
gpt-oss মডেলগুলো সেফটি ট্রেনিং এর জন্য আমাদের স্টেট-অফ-দ্য-আর্ট অ্যাপ্রোচ ব্যবহার করে. প্রাক-প্রশিক্ষণের সময় আমরা রাসায়নিক, বায়োলজিক্যাল, রেডিওলজিক্যাল এবং নিউক্লিয়ার (CBRN) সম্পর্কিত কিছু ক্ষতিকারক তথ্য ফিল্টার করেছিলাম. প্রশিক্ষণ-পরবর্তী সময়ে, আমরা মডেলটিকে অনিরাপদ নির্দেশ প্রত্যাখ্যান করতে এবং বিভ্রান্তিকর নির্দেশনার বিরুদ্ধে প্রতিরক্ষা করতে শেখানোর জন্য ইচ্ছাকৃত সারিবদ্ধকরণ এবং নির্দেশাবলীর শ্রেণিবিন্যাস(একটি নতুন উইন্ডোতে খোলে) ব্যবহার করেছি.
একবার একটি ওপেন-ওয়েট মডেল রিলিজ হলে, প্রতিপক্ষরা সেটিকে বিদ্বেষপূর্ণ উদ্দেশ্যে ফাইন-টিউন করতে সক্ষম হতে পারে. আমরা এই ঝুঁকিগুলো সরাসরি মূল্যায়ন করেছি মডেলটিকে স্পেশালাইজড বায়োলজি এবং সাইবারসিকিউরিটি ডেটায় ফাইন-টিউন করে, প্রতিটি ডোমেইনের জন্য একটি ডোমেইন-স্পেসিফিক নন-রিফিউজিং ভার্সন তৈরি করে, যেভাবে একজন আক্রমণকারী করতে পারে. এরপর আমরা ইন্টারনাল ও এক্সটার্নাল টেস্টিং এর মাধ্যমে এই মডেলগুলোর সক্ষমতার স্তর মূল্যায়ন করেছি. আমাদের সাথে থাকা নিরাপত্তা পত্রে বিস্তারিতভাবে উল্লেখ করা এই পরীক্ষাটি ইঙ্গিত দেয় যে, OpenAI-এর শীর্ষস্থানীয় প্রশিক্ষণ স্ট্যাককে কাজে লাগিয়ে শক্তিশালী ফাইন-টিউনিং সত্ত্বেও, এই বিদ্বেষপূর্ণ ফাইন-টিউন করা মডেলগুলি আমাদের প্রস্তুতি কাঠামো অনুসারে উচ্চ ক্ষমতার স্তরে পৌঁছাতে অক্ষম ছিল. এই বিদ্বেষপূর্ণ ফাইন-টিউনিং পদ্ধতি তিনটি স্বতন্ত্র বিশেষজ্ঞ গ্রুপ দ্বারা পর্যালোচনা করা হয়েছিল, যারা প্রশিক্ষণ প্রক্রিয়া এবং ইভ্যালুয়েশন উন্নত করার জন্য সুপারিশ প্রদান করেছিল, যার অনেকগুলো আমরা গ্রহণ করেছি. আমরা এই রেকমেন্ডেশনগুলো মডেল কার্ডে বিস্তারিত দিয়েছি. এই প্রসেসগুলো ওপেন মডেল সেফটিতে একটি তাৎপর্যপূর্ণ অগ্রগতি নির্দেশ করে. এই ফাইন্ডিংগুলো gpt-oss মডেল রিলিজ করার আমাদের সিদ্ধান্তকে প্রভাবিত করেছে. আমরা আশা করি এই মডেলগুলো ইন্ডাস্ট্রি জুড়ে সেফটি ট্রেনিং ও অ্যালাইনমেন্ট রিসার্চ ত্বরান্বিত করতে সাহায্য করবে.
একটি নিরাপদ ওপেন সোর্স ইকোসিস্টেমে অবদান রাখার জন্য, আমরা বিশ্বজুড়ে গবেষক, নির্মাতা এবং উৎসাহীদের নতুন নিরাপত্তা সমস্যা চিহ্নিত করতে উৎসাহিত করার জন্য একটি রেড টিমিং চ্যালেঞ্জ(একটি নতুন উইন্ডোতে খোলে) আয়োজন করছি. এই চ্যালেঞ্জে $500,000 প্রাইজ ফান্ড রয়েছে, যা OpenAI এবং অন্যান্য শীর্ষ ল্যাবের এক্সপার্ট বিচারকদের প্যানেলের রিভিউয়ের ভিত্তিতে প্রদান করা হবে. চ্যালেঞ্জের শেষে, আমরা একটি প্রতিবেদন প্রকাশ করব এবং যাচাইকৃত ফলাফলের উপর ভিত্তি করে একটি মূল্যায়ন ডেটা সেট উন্মুক্ত করব, যাতে বৃহত্তর কমিউনিটি তাৎক্ষণিকভাবে উপকৃত হতে পারে. আরও জানুন এবং অংশগ্রহণ করুন এখানে(একটি নতুন উইন্ডোতে খোলে).
gpt-oss-120b এবং gpt-oss-20b-এর ওয়েট Hugging Face-এ ফ্রি ডাউনলোডের জন্য উপলব্ধ এবং এগুলো নেটিভলি MXFP4-এ কোয়ান্টাইজড অবস্থায় আসে. এর ফলে gpt-oss-120B মডেল 80GB মেমরিতে রান করতে পারে, আর gpt-oss-20b-এর মাত্র 16GB প্রয়োজন হয়.
মডেলগুলি আমাদের হারমনি নির্দেশ ফরম্যাটে(একটি নতুন উইন্ডোতে খোলে) পোস্ট-প্রশিক্ষিত হয়েছে এবং আমরা গ্রহণ সহজ করার জন্য Python এবং Rust উভয় ক্ষেত্রেই একটি হারমনি রেন্ডারার(একটি নতুন উইন্ডোতে খোলে) ওপেন-সোর্স করছি. আমরা PyTorch ও Apple-এর Metal প্ল্যাটফর্মে ইনফারেন্স চালানোর জন্য মডেলের জন্য কিছু এক্সাম্পল টুলের কালেকশনসহ রেফারেন্স ইমপ্লিমেন্টেশনও রিলিজ করছি.
আমরা এই মডেলগুলো এমনভাবে ডিজাইন করেছি যাতে সেগুলো ফ্লেক্সিবল হয় এবং লোকালি, অন-ডিভাইস অথবা থার্ড-পার্টি ইনফারেন্স প্রোভাইডারের মাধ্যমে—যেকোনো জায়গায় সহজে চালানো যায়. এতে সহায়তা করার জন্য, আমরা লঞ্চের আগে Azure, Hugging Face, vLLM, Ollama, llama.cpp এর মতো শীর্ষস্থানীয় ডিপ্লয়মেন্ট প্ল্যাটফর্মগুলির সাথে অংশীদারিত্ব করেছি. LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare এবং OpenRouter, এসব প্ল্যাটফর্মের মাধ্যমে ডেভেলপারদের জন্য মডেলগুলোকে ব্যাপকভাবে সহজলভ্য করা হচ্ছে. হার্ডওয়্যারের দিক থেকে বিভিন্ন সিস্টেমে অপ্টিমাইজড পারফরম্যান্স নিশ্চিত করতে আমরা NVIDIA, AMD, Cerebras এবং Groq-এর মতো ইন্ডাস্ট্রি লিডারদের সঙ্গে কাজ করেছি.
আজকের রিলিজের অংশ হিসেবে, Microsoft Windows ডিভাইসগুলোতে gpt-oss-20b মডেলের GPU-অপ্টিমাইজড ভার্সন আনছে. ONNX Runtime দ্বারা চালিত, এই মডেলগুলো লোকাল ইনফারেন্স সাপোর্ট করে এবং Foundry Local এবং AI Toolkit for VS Code-এর মাধ্যমে উপলভ্য, যা Windows ডেভেলপারদের জন্য ওপেন মডেল দিয়ে বিল্ড করা সহজ করে তোলে.
যেসব ডেভেলপার সম্পূর্ণ কাস্টমাইজযোগ্য মডেল চান, যেগুলো তারা ফাইন-টিউন ও নিজস্ব এনভায়রনমেন্টে ডিপ্লয় করতে পারেন, তাদের জন্য gpt-oss একটি দুর্দান্ত পছন্দ. যারা মাল্টিমোডাল সাপোর্ট, বিল্ট-ইন টুলস এবং আমাদের প্ল্যাটফর্মের সঙ্গে সিমলেস ইন্টিগ্রেশন চান, তাদের জন্য আমাদের API প্ল্যাটফর্মের মাধ্যমে উপলব্ধ মডেলগুলোই সেরা অপশন হিসেবে রয়ে গেছে. আমরা ডেভেলপার ফিডব্যাক মনোযোগ দিয়ে শুনছি এবং ভবিষ্যতে gpt-oss-এর জন্য API সাপোর্ট বিবেচনা করতে পারি.
আপনি যদি মডেলগুলি ব্যবহার করতে চান, তবে আমাদের ওপেন মডেল প্লেগ্রাউন্ড(একটি নতুন উইন্ডোতে খোলে) এ যান. বিভিন্ন ইকোসিস্টেম প্রোভাইডারের মাধ্যমে মডেলগুলি কীভাবে ব্যবহার করবেন বা কীভাবে মডেলগুলি ফাইন-টিউন করবেন সে সম্পর্কে আরও জানতে, আমাদের গাইডগুলি দেখুন(একটি নতুন উইন্ডোতে খোলে).
gpt-oss-120b এবং gpt-oss-20b রিলিজ করা ওপেন-ওয়েট মডেলগুলোর জন্য একটি গুরুত্বপূর্ণ অগ্রগতি চিহ্নিত করে. তাদের সাইজ অনুযায়ী, এই মডেলগুলো রিজনিং সক্ষমতা এবং সেফটি উভয় ক্ষেত্রেই তাৎপর্যপূর্ণ উন্নতি প্রদান করে. ওপেন মডেলগুলি আমাদের হোস্ট করা মডেলগুলির পরিপূরক, যা ডেভেলপারদের উন্নত গবেষণা ত্বরান্বিত করতে, উদ্ভাবনকে উৎসাহিত করতে এবং বিস্তৃত ব্যবহারের ক্ষেত্রে নিরাপদ, আরও স্বচ্ছ AI বিকাশ সক্ষম করার জন্য বিস্তৃত পরিসরের সরঞ্জাম দেয়.
এই উন্মুক্ত মডেলগুলি উদীয়মান বাজার, সম্পদ-সীমাবদ্ধ খাত এবং ছোট সংস্থাগুলির জন্য বাধাগুলিও কমিয়ে দেয় যাদের মালিকানাধীন মডেল গ্রহণের জন্য বাজেট বা নমনীয়তার অভাব থাকতে পারে. হাতে শক্তিশালী ও সহজলভ্য টুল থাকায়, সারা বিশ্বের মানুষ বিল্ড করতে পারে, ইনোভেট করতে পারে এবং নিজেদের ও অন্যদের জন্য নতুন সুযোগ তৈরি করতে পারে. মার্কিন যুক্তরাষ্ট্রে তৈরি এই সক্ষম ওপেন-ওয়েট মডেলগুলোতে বিস্তৃত অ্যাক্সেস গণতান্ত্রিক AI রেল বিস্তৃত করতে সাহায্য করে.
একটি স্বাস্থ্যকর ওপেন মডেল ইকোসিস্টেম হলো এমন এক দিক যা AI-কে সবার জন্য আরও অ্যাক্সেসযোগ্য ও উপকারী করতে সাহায্য করে. আমরা এই মডেলগুলো ব্যবহার করতে এক্সপেরিমেন্ট করতে, কোলাবোরেট করতে এবং সম্ভাবনার সীমা বাড়াতে ডেভেলপার ও গবেষকদের আমন্ত্রণ জানাই. আপনি কী বিল্ড করেন তা দেখার জন্য আমরা অধীর আগ্রহে অপেক্ষা করছি.
লেখক
সাইটেশনস
অবদানকারীগণ
Zoran Martinovic, Zhuohan Li, Zhiqing Sun, Zach Johnson, Yu Yang, Yu Bai, Yang Song, Xin Wang, Wenting Zhan, Volodymyr Kyrylov, Vlad Fomenko, Tyler Bertao, Tong Mu, Timur Garipov, Tarun Gogineni, Suvansh Sanjeev, Steve Mostovoy, Song Mei, Shengjia Zhao, Sebastien Bubeck, Scott McKinney, Scott Lessans, Sandhini Agarwal, Sam Toizer, Sam Altman, Saachi Jain, Romain Huet, Rahul K. Arora, Philippe Tillet, Olivia Watkins, Nivedita Brett, Nikhil Vyas, Miles Wang, Michihiro Yasunaga, Michelle Pokrass, Mia Glaese, Max Schwarzer, Mark Chen, Mario Lezcano-Casado, Marat Dukhan, Lukas Gross, Ludovic Peran, Ludovic Peran, Lindsay McCallum, Lin Yang, Lily (Xiaoxuan) Liu, Leher Pathak, Lama Ahmad, Kristian Georgiev, Kristen Ying, Kimmy Richardson, Kevin Whinnery, Kevin Weil, Kevin Lu, Kevin Fives, Kendal Simon, Katia Gil Guzman, Karan Singhal, Karan Singhal, Kai Chen, Josh McGrath, Jordan Liss, Jongsoo Park, John Hallman, Johannes Heidecke, Jiancheng Liu, Ji Lin, Jason Kwon, Jason Ai, James Park Lennon, Jakub Pachocki, Jacob Huh, Jackie Hehir, Irina Kofman, Huida Qiu, Hongyu Ren, Harshit Sikchi, Hannah Wong, Haitang Hu, Haitang Hu, Haiming Bao, Hadi Salman, Guillaume Leclerc, Greg Brockman, Gideon Myles, Giambattista Parascandolo, Gaby Raila, Foivos Tsimpourlas, Filippo Raso, Eugene Brevdo, Eric Wallace, Enoch Cheung, Elizabeth Proehl, Elaine Ya Le, Edwin Arbus, Eddie Zhang, Dominik Kundel, Dmitry Pimenov, David Robinson, Dane Stuckey, Dana Palmie, Dan Cook, Cyril Zhang, Chris Lu, Chris Koch, Che Chang, Cedric Whitney, Casey Dvorak, Carolina Paz, Brian Zhang, Bowen Baker, Bob Rotsted, Boaz Barak, Ashley Pantuliano, Andy Applebaum, Amy Wendling, Ally Bennett, Alexander Neitz, Alex Paino, Alex Nichol, Alec Helyar, Aidan McLaughlin, Aidan Clark, Adam Goucher


