মূল কনটেন্টে যান
OpenAI

১৭ মার্চ, ২০২৬

কোম্পানিপ্রোডাক্ট

GPT‑5.4 mini এবং nano উপস্থাপন করা হচ্ছে

কোডিং এবং সাব-এজেন্টের জন্য অপ্টিমাইজ করা দ্রুত ও কার্যকর মডেল

লোডিং…

আজ আমরা GPT‑5.4 mini এবং nano রিলিজ করছি, যা এখন পর্যন্ত আমাদের সবচেয়ে সক্ষম ছোট মডেল. তারা GPT‑5.4‑এর বহু শক্তিমত্তা আরও দ্রুত, আরও কার্যকরী মডেলগুলিতে নিয়ে আসে, যা উচ্চ-মাত্রার ওয়ার্কলোডের জন্য ডিজাইন করা হয়েছে.

GPT‑5.4 mini কোডিং, যুক্তি, মাল্টিমোডাল বোঝাপড়া এবং টুল ব্যবহারের ক্ষেত্রে GPT‑5 mini-এর তুলনায় উল্লেখযোগ্যভাবে উন্নত, একই সঙ্গে দ্বিগুণ বেশি দ্রুত চলতে পারে. এটি SWE-Bench Pro এবং OSWorld-Verified সহ একাধিক মূল্যায়নে আরও বড় GPT‑5.4 মডেলের পারফরম্যান্সের কাছাকাছিও পৌঁছে যায়.

GPT‑5.4 nano হলো GPT‑5.4‑এর সবচেয়ে ছোট, সবচেয়ে সস্তা সংস্করণ, যেসব কাজে গতি এবং খরচ সবচেয়ে বেশি গুরুত্বপূর্ণ. এটি GPT‑5 nano-এর তুলনায়ও একটি উল্লেখযোগ্য আপগ্রেড. আমরা এটি শ্রেণিবিভাগ, ডেটা এক্সট্র্যাকশন, র‌্যাঙ্কিং এবং সহজ সহায়ক টাস্ক সামলায় এমন কোডিং সাব-এজেন্টদের জন্য সুপারিশ করি.

এই মডেল এমন ধরনের ওয়ার্কলোডের জন্য তৈরি যেখানে ল্যাটেন্সি সরাসরি প্রোডাক্ট অভিজ্ঞতাকে প্রভাবিত করে: এমন কোডিং অ্যাসিস্ট্যান্ট যেগুলো দ্রুত প্রতিক্রিয়া জানাতে পারে, দ্রুত সহায়ক কাজ সম্পন্ন করতে পারে সাব-এজেন্ট, স্ক্রিনশট ক্যাপচার করে ব্যাখ্যা করতে পারে এমন কম্পিউটার-ব্যবহারকারী সিস্টেম, এবং রিয়েল-টাইমে ছবির উপর যুক্তি করতে পারে এমন মাল্টিমোডাল অ্যাপ্লিকেশন. এই সেটিংসগুলোতে, সেরা মডেলটি প্রায়ই সবচেয়ে বড়টি নয়—এটি এমন একটি, যা দ্রুত প্রতিক্রিয়া জানাতে পারে, নির্ভরযোগ্যভাবে টুল ব্যবহার করতে পারে এবং তবুও জটিল পেশাদার কাজগুলোতে ভালো পারফর্ম করতে পারে.

GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-Bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Toolathlon54.6%42.9%35.5%26.9%
GPQA Diamond93.0%88.0%82.8%81.6%
OSWorld-Verified75.0%72.1%39.0%42.0%

1 GPT‑5 mini-এর জন্য উপলব্ধ সর্বোচ্চ reasoning_effort হলো 'high'.

এখানে দেখুন, তাদের ওয়ার্কফ্লোতে GPT‑5.4 mini এবং nano পরীক্ষা করার পর আমাদের গ্রাহকরা কী ভাবেন:

“GPT-5.4 mini এই শ্রেণির একটি মডেলের জন্য শক্তিশালী এন্ড-টু-এন্ড পারফরম্যান্স প্রদান করে. আমাদের মূল্যায়নে এটি অনেক কম খরচে বেশ কিছু আউটপুট টাস্ক এবং সাইটেশন রিকল-এর ক্ষেত্রে প্রতিযোগী মডেলগুলোর সমান বা তার চেয়েও ভালো ফলাফল প্রদর্শন করেছে. এটি বৃহত্তর GPT-5.4 মডেলের তুলনায় আরও বেশি এন্ড-টু-এন্ড পাস রেট এবং আরও শক্তিশালী সোর্স অ্যাট্রিবিউশনও অর্জন করেছে."
— আভাস শর্মা, Hebbia-এর প্রধান প্রযুক্তি কর্মকর্তা

কোডিং

GPT‑5.4 mini এবং nano কোডিং ওয়ার্কফ্লোতে বিশেষভাবে কার্যকর, যেখানে দ্রুত পুনরাবৃত্তি থেকে উপকার হয়. মডেলগুলো অত্যন্ত কম ল্যাটেন্সিতে নির্দিষ্ট পরিবর্তন, কোডবেস নেভিগেশন, ফ্রন্ট-এন্ড জেনারেশন এবং ডিবাগিং লুপ পরিচালনা করতে সক্ষম; যা এদেরকে দ্রুত গতিতে এবং কম খরচে কোডিং সম্পন্ন করার জন্য অত্যন্ত উপযোগী করে তুলেছে.

বেঞ্চমার্কের ক্ষেত্রে, GPT‑5.4 mini একই ধরনের ল্যাটেন্সিতে ধারাবাহিকভাবে GPT‑5‑mini‑এর চেয়ে উন্নত পারফরম্যান্স প্রদর্শন করে এবং এটি অনেক দ্রুত কাজ করার পাশাপাশি GPT‑5.4‑এর সমপর্যায়ের 'পাস রেট' অর্জনে সক্ষম; যা কোডিং ওয়ার্কফ্লোর জন্য ল্যাটেন্সি অনুযায়ী পারফরম্যান্সের একটি ইউনিক ভারসাম্য নিশ্চিত করে.

আমরা আমাদের মডেলগুলির প্রোডাকশন আচরণ দেখে লেটেন্সি অনুমান করি এবং এটি অফলাইনে সিমুলেট করি. লেটেন্সি অনুমান টুল কলের সময়কাল (কোড নির্বাহ সময়), স্যাম্পল করা টোকেন এবং ইনপুট টোকেনকে বিবেচনায় নেয়. বাস্তব জগতের লেটেন্সি ব্যাপকভাবে পরিবর্তিত হতে পারে এবং আমাদের সিমুলেশনে ধরা পড়েনি এমন অনেক বিষয়ের উপর নির্ভর করে. একইভাবে, এটি লেখার সময় এই মডেলগুলোর API মূল্যনির্ধারণের ভিত্তিতে খরচের অনুমান করা হয়েছে. খরচ ভবিষ্যতে পরিবর্তিত হতে পারে. রিজনিং low থেকে xhigh-এ উন্নীত করা হয়েছিল.

সাব-এজেন্ট

GPT‑5.4 mini এমন সিস্টেমের জন্যও একটি শক্তিশালী উপযোগী, যা বিভিন্ন আকারের মডেল একত্রে ব্যবহার করে. Codex-এ, উদাহরণস্বরূপ, GPT‑5.4‑এর মতো একটি বড় মডেল পরিকল্পনা, সমন্বয় এবং চূড়ান্ত সিদ্ধান্ত সামলাতে পারে, একই সময়ে GPT‑5.4 mini সাবএজেন্টদের কাছে দায়িত্ব অর্পণ করতে পারে, যারা সমান্তরালে আরও সীমিত সাবটাস্কগুলো সামলায়—যেমন একটি কোডবেসে সার্চ করা, একটি বড় ফাইল রিভিউ করা বা সহায়ক ডকুমেন্টগুলো প্রক্রিয়াকরণ করা. Codex-এ সাব-এজেন্ট কিভাবে কাজ করে, তা ডকস(একটি নতুন উইন্ডোতে খোলে) থেকে জেনে নিন.

ছোট মডেলগুলো আরও দ্রুত এবং আরও সক্ষম হয়ে উঠলে, এই প্যাটার্নটি আরও কার্যকর হয়ে ওঠে. সবকিছুর জন্য একটি মডেল ব্যবহার করার বদলে, ডেভেলপাররা এমন সিস্টেম তৈরি করতে পারেন যেখানে বড় মডেলগুলো কী করতে হবে তা সিদ্ধান্ত নেয় এবং ছোট মডেলগুলো বৃহৎ পরিসরে দ্রুত কার্যকর করে. GPT‑5.4 mini হলো এই ধরনের ওয়ার্কফ্লোর জন্য এখন পর্যন্ত আমাদের সবচেয়ে শক্তিশালী মিনি মডেল.

কম্পিউটার ইউজ

GPT‑5.4 mini মাল্টিমোডাল টাস্কেও শক্তিশালী, বিশেষ করে কম্পিউটার ব্যবহারের সাথে সম্পর্কিত টাস্কগুলোতে. মডেলটি দ্রুত ঘন ইউজার ইন্টারফেসের স্ক্রিনশট ব্যাখ্যা করে গতি সহকারে কম্পিউটার ব্যবহার সংক্রান্ত কাজ সম্পন্ন করতে পারে. OSWorld-Verified-এ, GPT‑5.4 mini GPT‑5.4‑এর কাছাকাছি পৌঁছে, একইসঙ্গে GPT‑5 mini-কে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়.

উপলব্ধতা ও মূল্য নির্ধারণ

GPT‑5.4 mini আজ API, Codex এবং ChatGPT‑তে উপলব্ধ.

API-তে, GPT‑5.4 mini টেক্সট ও ইমেজ ইনপুট, টুল ব্যবহার, ফাংশন কলিং, ওয়েব সার্চ, ফাইল সার্চ, কম্পিউটার ব্যবহার এবং স্কিলস সমর্থন করে. এর চার লাখ কনটেক্সট উইন্ডো আছে এবং এক মিলিয়ন ইনপুট টোকেন প্রতি খরচ 0.75 ডলার এবং এক মিলিয়ন আউটপুট টোকেন প্রতি খরচ 4.50 ডলার.

Codex-এ, GPT‑5.4 mini Codex অ্যাপ, CLI, IDE এক্সটেনশন এবং ওয়েব জুড়ে উপলব্ধ. এটি GPT‑5.4 কোটার মাত্র 30% ব্যবহার করে, যা ডেভেলপারদের Codex-এ সহজ কোডিং কাজগুলো প্রায় এক-তৃতীয়াংশ খরচে দ্রুত সম্পন্ন করার সুযোগ দেয়. Codex GPT‑5.4 mini সাব-এজেন্টদের কাছেও দায়িত্ব অর্পণ করতে পারে, যাতে কম যুক্তি-নির্ভর কাজ অপেক্ষাকৃত সস্তা মডেলে চালানো যায়.

ChatGPT‑এ, GPT‑5.4 mini + মেনুতে থাকা “Thinking” ফিচারের মাধ্যমে ফ্রি এবং Go ব্যবহারকারীদের জন্য উপলব্ধ. অন্যান্য সকল ব্যবহারকারীর জন্য, GPT‑5.4 Thinking-এর রেট লিমিট ফুরিয়ে গেলে বিকল্প বা ফলব্যাক হিসেবে GPT‑5.4 mini ব্যবহার করা যাবে.

GPT‑5.4 nano কেবল API-তেই উপলব্ধ এবং প্রতি এক মিলিয়ন ইনপুট টোকেনের জন্য 0.20 ডলার এবং প্রতি এক মিলিয়ন আউটপুট টোকেনের জন্য 1.25 ডলার খরচ হয়.

মডেলগুলোর সুরক্ষা ব্যবস্থা সম্পর্কে আরও জানতে, আমাদের Deployment Safety Hub(একটি নতুন উইন্ডোতে খোলে)-এ সিস্টেম কার্ড সংযোজনটি দেখুন.

Coding
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
SWE-bench Pro (Public)57.7%54.4%52.4%45.7%
Terminal-Bench 2.075.1%60.0%46.3%38.2%
Tool-calling
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
MCP Atlas67.2%57.7%56.1%47.6%
Toolathlon54.6%42.9%35.5%26.9%
τ2-bench (telecom)98.9%93.4%92.5%74.1%
Intelligence
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
GPQA Diamond93.0%88.0%82.8%81.6%
HLE w/ tool52.1%41.5%37.7%31.6%
HLE w/o tools39.8%28.2%24.3%18.3%
MM / Vision / CUA
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OSWorld-Verified75.0%72.1%39.0%42.0%
MMMUPro w/ Python81.5%78.0%69.5%74.1%
MMMUPro81.2%76.6%66.1%67.5%
OmniDocBench 1.5 (no tools)² — lower is better0.1090.12630.24190.1791
Long context
GPT-5.4 (xhigh)GPT-5.4 mini (xhigh)GPT-5.4 nano (xhigh)GPT-5 mini (high¹)
OpenAI MRCR v2 8-needle 64K–128K86.0%47.7%44.2%35.1%
OpenAI MRCR v2 8-needle 128K–256K79.3%33.6%33.1%19.4%
Graphwalks BFS 0K–128K93.1%76.3%73.4%73.4%
Graphwalks parents 0–128K (accuracy)89.8%71.5%50.8%64.3%

1 GPT‑5 mini-এর জন্য উপলব্ধ সর্বোচ্চ reasoning_effort হলো 'high'.

2 সামগ্রিক এডিট দূরত্ব. OmniDocBench চালানো হয়েছিল reasoning_effort-কে 'none' এ সেট করে, লো-কস্ট, লো-ল্যাটেন্সি পারফরম্যান্স প্রতিফলিত করতে.

লেখক

OpenAI