১৭ মার্চ, ২০২৬

GPT‑5.4 mini এবং nano উপস্থাপন করা হচ্ছে

কোডিং এবং সাব-এজেন্টের জন্য অপ্টিমাইজ করা দ্রুত ও কার্যকর মডেল

লোডিং…

আজ আমরা GPT‑5.4 mini এবং nano রিলিজ করছি, যা এখন পর্যন্ত আমাদের সবচেয়ে সক্ষম ছোট মডেল. তারা GPT‑5.4‑এর বহু শক্তিমত্তা আরও দ্রুত, আরও কার্যকরী মডেলগুলিতে নিয়ে আসে, যা উচ্চ-মাত্রার ওয়ার্কলোডের জন্য ডিজাইন করা হয়েছে.

GPT‑5.4 mini কোডিং, যুক্তি, মাল্টিমোডাল বোঝাপড়া এবং টুল ব্যবহারের ক্ষেত্রে GPT‑5 mini-এর তুলনায় উল্লেখযোগ্যভাবে উন্নত, একই সঙ্গে দ্বিগুণ বেশি দ্রুত চলতে পারে. এটি SWE-Bench Pro এবং OSWorld-Verified সহ একাধিক মূল্যায়নে আরও বড় GPT‑5.4 মডেলের পারফরম্যান্সের কাছাকাছিও পৌঁছে যায়.

GPT‑5.4 nano হলো GPT‑5.4‑এর সবচেয়ে ছোট, সবচেয়ে সস্তা সংস্করণ, যেসব কাজে গতি এবং খরচ সবচেয়ে বেশি গুরুত্বপূর্ণ. এটি GPT‑5 nano-এর তুলনায়ও একটি উল্লেখযোগ্য আপগ্রেড. আমরা এটি শ্রেণিবিভাগ, ডেটা এক্সট্র্যাকশন, র‌্যাঙ্কিং এবং সহজ সহায়ক টাস্ক সামলায় এমন কোডিং সাব-এজেন্টদের জন্য সুপারিশ করি.

এই মডেল এমন ধরনের ওয়ার্কলোডের জন্য তৈরি যেখানে ল্যাটেন্সি সরাসরি প্রোডাক্ট অভিজ্ঞতাকে প্রভাবিত করে: এমন কোডিং অ্যাসিস্ট্যান্ট যেগুলো দ্রুত প্রতিক্রিয়া জানাতে পারে, দ্রুত সহায়ক কাজ সম্পন্ন করতে পারে সাব-এজেন্ট, স্ক্রিনশট ক্যাপচার করে ব্যাখ্যা করতে পারে এমন কম্পিউটার-ব্যবহারকারী সিস্টেম, এবং রিয়েল-টাইমে ছবির উপর যুক্তি করতে পারে এমন মাল্টিমোডাল অ্যাপ্লিকেশন. এই সেটিংসগুলোতে, সেরা মডেলটি প্রায়ই সবচেয়ে বড়টি নয়—এটি এমন একটি, যা দ্রুত প্রতিক্রিয়া জানাতে পারে, নির্ভরযোগ্যভাবে টুল ব্যবহার করতে পারে এবং তবুও জটিল পেশাদার কাজগুলোতে ভালো পারফর্ম করতে পারে.

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-Bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%
Toolathlon	54.6%	42.9%	35.5%	26.9%
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%

^{1 GPT‑5 mini-এর জন্য উপলব্ধ সর্বোচ্চ reasoning_effort হলো 'high'.}

এখানে দেখুন, তাদের ওয়ার্কফ্লোতে GPT‑5.4 mini এবং nano পরীক্ষা করার পর আমাদের গ্রাহকরা কী ভাবেন:

“GPT-5.4 mini এই শ্রেণির একটি মডেলের জন্য শক্তিশালী এন্ড-টু-এন্ড পারফরম্যান্স প্রদান করে. আমাদের মূল্যায়নে এটি অনেক কম খরচে বেশ কিছু আউটপুট টাস্ক এবং সাইটেশন রিকল-এর ক্ষেত্রে প্রতিযোগী মডেলগুলোর সমান বা তার চেয়েও ভালো ফলাফল প্রদর্শন করেছে. এটি বৃহত্তর GPT-5.4 মডেলের তুলনায় আরও বেশি এন্ড-টু-এন্ড পাস রেট এবং আরও শক্তিশালী সোর্স অ্যাট্রিবিউশনও অর্জন করেছে."

— আভাস শর্মা, Hebbia-এর প্রধান প্রযুক্তি কর্মকর্তা

কোডিং

GPT‑5.4 mini এবং nano কোডিং ওয়ার্কফ্লোতে বিশেষভাবে কার্যকর, যেখানে দ্রুত পুনরাবৃত্তি থেকে উপকার হয়. মডেলগুলো অত্যন্ত কম ল্যাটেন্সিতে নির্দিষ্ট পরিবর্তন, কোডবেস নেভিগেশন, ফ্রন্ট-এন্ড জেনারেশন এবং ডিবাগিং লুপ পরিচালনা করতে সক্ষম; যা এদেরকে দ্রুত গতিতে এবং কম খরচে কোডিং সম্পন্ন করার জন্য অত্যন্ত উপযোগী করে তুলেছে.

বেঞ্চমার্কের ক্ষেত্রে, GPT‑5.4 mini একই ধরনের ল্যাটেন্সিতে ধারাবাহিকভাবে GPT‑5‑mini‑এর চেয়ে উন্নত পারফরম্যান্স প্রদর্শন করে এবং এটি অনেক দ্রুত কাজ করার পাশাপাশি GPT‑5.4‑এর সমপর্যায়ের 'পাস রেট' অর্জনে সক্ষম; যা কোডিং ওয়ার্কফ্লোর জন্য ল্যাটেন্সি অনুযায়ী পারফরম্যান্সের একটি ইউনিক ভারসাম্য নিশ্চিত করে.

আমরা আমাদের মডেলগুলির প্রোডাকশন আচরণ দেখে লেটেন্সি অনুমান করি এবং এটি অফলাইনে সিমুলেট করি. লেটেন্সি অনুমান টুল কলের সময়কাল (কোড নির্বাহ সময়), স্যাম্পল করা টোকেন এবং ইনপুট টোকেনকে বিবেচনায় নেয়. বাস্তব জগতের লেটেন্সি ব্যাপকভাবে পরিবর্তিত হতে পারে এবং আমাদের সিমুলেশনে ধরা পড়েনি এমন অনেক বিষয়ের উপর নির্ভর করে. একইভাবে, এটি লেখার সময় এই মডেলগুলোর API মূল্যনির্ধারণের ভিত্তিতে খরচের অনুমান করা হয়েছে. খরচ ভবিষ্যতে পরিবর্তিত হতে পারে. রিজনিং low থেকে xhigh-এ উন্নীত করা হয়েছিল.

সাব-এজেন্ট

GPT‑5.4 mini এমন সিস্টেমের জন্যও একটি শক্তিশালী উপযোগী, যা বিভিন্ন আকারের মডেল একত্রে ব্যবহার করে. Codex-এ, উদাহরণস্বরূপ, GPT‑5.4‑এর মতো একটি বড় মডেল পরিকল্পনা, সমন্বয় এবং চূড়ান্ত সিদ্ধান্ত সামলাতে পারে, একই সময়ে GPT‑5.4 mini সাবএজেন্টদের কাছে দায়িত্ব অর্পণ করতে পারে, যারা সমান্তরালে আরও সীমিত সাবটাস্কগুলো সামলায়—যেমন একটি কোডবেসে সার্চ করা, একটি বড় ফাইল রিভিউ করা বা সহায়ক ডকুমেন্টগুলো প্রক্রিয়াকরণ করা. Codex-এ সাব-এজেন্ট কিভাবে কাজ করে, তা ডকস⁠(একটি নতুন উইন্ডোতে খোলে) থেকে জেনে নিন.

ছোট মডেলগুলো আরও দ্রুত এবং আরও সক্ষম হয়ে উঠলে, এই প্যাটার্নটি আরও কার্যকর হয়ে ওঠে. সবকিছুর জন্য একটি মডেল ব্যবহার করার বদলে, ডেভেলপাররা এমন সিস্টেম তৈরি করতে পারেন যেখানে বড় মডেলগুলো কী করতে হবে তা সিদ্ধান্ত নেয় এবং ছোট মডেলগুলো বৃহৎ পরিসরে দ্রুত কার্যকর করে. GPT‑5.4 mini হলো এই ধরনের ওয়ার্কফ্লোর জন্য এখন পর্যন্ত আমাদের সবচেয়ে শক্তিশালী মিনি মডেল.

কম্পিউটার ইউজ

GPT‑5.4 mini মাল্টিমোডাল টাস্কেও শক্তিশালী, বিশেষ করে কম্পিউটার ব্যবহারের সাথে সম্পর্কিত টাস্কগুলোতে. মডেলটি দ্রুত ঘন ইউজার ইন্টারফেসের স্ক্রিনশট ব্যাখ্যা করে গতি সহকারে কম্পিউটার ব্যবহার সংক্রান্ত কাজ সম্পন্ন করতে পারে. OSWorld-Verified-এ, GPT‑5.4 mini GPT‑5.4‑এর কাছাকাছি পৌঁছে, একইসঙ্গে GPT‑5 mini-কে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়.

উপলব্ধতা ও মূল্য নির্ধারণ

GPT‑5.4 mini আজ API, Codex এবং ChatGPT‑তে উপলব্ধ.

API-তে, GPT‑5.4 mini টেক্সট ও ইমেজ ইনপুট, টুল ব্যবহার, ফাংশন কলিং, ওয়েব সার্চ, ফাইল সার্চ, কম্পিউটার ব্যবহার এবং স্কিলস সমর্থন করে. এর চার লাখ কনটেক্সট উইন্ডো আছে এবং এক মিলিয়ন ইনপুট টোকেন প্রতি খরচ 0.75 ডলার এবং এক মিলিয়ন আউটপুট টোকেন প্রতি খরচ 4.50 ডলার.

Codex-এ, GPT‑5.4 mini Codex অ্যাপ, CLI, IDE এক্সটেনশন এবং ওয়েব জুড়ে উপলব্ধ. এটি GPT‑5.4 কোটার মাত্র 30% ব্যবহার করে, যা ডেভেলপারদের Codex-এ সহজ কোডিং কাজগুলো প্রায় এক-তৃতীয়াংশ খরচে দ্রুত সম্পন্ন করার সুযোগ দেয়. Codex GPT‑5.4 mini সাব-এজেন্টদের কাছেও দায়িত্ব অর্পণ করতে পারে, যাতে কম যুক্তি-নির্ভর কাজ অপেক্ষাকৃত সস্তা মডেলে চালানো যায়.

ChatGPT‑এ, GPT‑5.4 mini + মেনুতে থাকা “Thinking” ফিচারের মাধ্যমে ফ্রি এবং Go ব্যবহারকারীদের জন্য উপলব্ধ. অন্যান্য সকল ব্যবহারকারীর জন্য, GPT‑5.4 Thinking-এর রেট লিমিট ফুরিয়ে গেলে বিকল্প বা ফলব্যাক হিসেবে GPT‑5.4 mini ব্যবহার করা যাবে.

GPT‑5.4 nano কেবল API-তেই উপলব্ধ এবং প্রতি এক মিলিয়ন ইনপুট টোকেনের জন্য 0.20 ডলার এবং প্রতি এক মিলিয়ন আউটপুট টোকেনের জন্য 1.25 ডলার খরচ হয়.

মডেলগুলোর সুরক্ষা ব্যবস্থা সম্পর্কে আরও জানতে, আমাদের Deployment Safety Hub⁠(একটি নতুন উইন্ডোতে খোলে)-এ সিস্টেম কার্ড সংযোজনটি দেখুন.

Coding

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
SWE-bench Pro (Public)	57.7%	54.4%	52.4%	45.7%
Terminal-Bench 2.0	75.1%	60.0%	46.3%	38.2%

Tool-calling

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
MCP Atlas	67.2%	57.7%	56.1%	47.6%
Toolathlon	54.6%	42.9%	35.5%	26.9%
τ2-bench (telecom)	98.9%	93.4%	92.5%	74.1%

Intelligence

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
GPQA Diamond	93.0%	88.0%	82.8%	81.6%
HLE w/ tool	52.1%	41.5%	37.7%	31.6%
HLE w/o tools	39.8%	28.2%	24.3%	18.3%

MM / Vision / CUA

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OSWorld-Verified	75.0%	72.1%	39.0%	42.0%
MMMUPro w/ Python	81.5%	78.0%	69.5%	74.1%
MMMUPro	81.2%	76.6%	66.1%	67.5%
OmniDocBench 1.5 (no tools)² — lower is better	0.109	0.1263	0.2419	0.1791

Long context

	GPT-5.4 (xhigh)	GPT-5.4 mini (xhigh)	GPT-5.4 nano (xhigh)	GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K	86.0%	47.7%	44.2%	35.1%
OpenAI MRCR v2 8-needle 128K–256K	79.3%	33.6%	33.1%	19.4%
Graphwalks BFS 0K–128K	93.1%	76.3%	73.4%	73.4%
Graphwalks parents 0–128K (accuracy)	89.8%	71.5%	50.8%	64.3%