আজ আমরা GPT‑5.4 mini এবং nano রিলিজ করছি, যা এখন পর্যন্ত আমাদের সবচেয়ে সক্ষম ছোট মডেল. তারা GPT‑5.4‑এর বহু শক্তিমত্তা আরও দ্রুত, আরও কার্যকরী মডেলগুলিতে নিয়ে আসে, যা উচ্চ-মাত্রার ওয়ার্কলোডের জন্য ডিজাইন করা হয়েছে.
GPT‑5.4 mini কোডিং, যুক্তি, মাল্টিমোডাল বোঝাপড়া এবং টুল ব্যবহারের ক্ষেত্রে GPT‑5 mini-এর তুলনায় উল্লেখযোগ্যভাবে উন্নত, একই সঙ্গে দ্বিগুণ বেশি দ্রুত চলতে পারে. এটি SWE-Bench Pro এবং OSWorld-Verified সহ একাধিক মূল্যায়নে আরও বড় GPT‑5.4 মডেলের পারফরম্যান্সের কাছাকাছিও পৌঁছে যায়.
GPT‑5.4 nano হলো GPT‑5.4‑এর সবচেয়ে ছোট, সবচেয়ে সস্তা সংস্করণ, যেসব কাজে গতি এবং খরচ সবচেয়ে বেশি গুরুত্বপূর্ণ. এটি GPT‑5 nano-এর তুলনায়ও একটি উল্লেখযোগ্য আপগ্রেড. আমরা এটি শ্রেণিবিভাগ, ডেটা এক্সট্র্যাকশন, র্যাঙ্কিং এবং সহজ সহায়ক টাস্ক সামলায় এমন কোডিং সাব-এজেন্টদের জন্য সুপারিশ করি.
এই মডেল এমন ধরনের ওয়ার্কলোডের জন্য তৈরি যেখানে ল্যাটেন্সি সরাসরি প্রোডাক্ট অভিজ্ঞতাকে প্রভাবিত করে: এমন কোডিং অ্যাসিস্ট্যান্ট যেগুলো দ্রুত প্রতিক্রিয়া জানাতে পারে, দ্রুত সহায়ক কাজ সম্পন্ন করতে পারে সাব-এজেন্ট, স্ক্রিনশট ক্যাপচার করে ব্যাখ্যা করতে পারে এমন কম্পিউটার-ব্যবহারকারী সিস্টেম, এবং রিয়েল-টাইমে ছবির উপর যুক্তি করতে পারে এমন মাল্টিমোডাল অ্যাপ্লিকেশন. এই সেটিংসগুলোতে, সেরা মডেলটি প্রায়ই সবচেয়ে বড়টি নয়—এটি এমন একটি, যা দ্রুত প্রতিক্রিয়া জানাতে পারে, নির্ভরযোগ্যভাবে টুল ব্যবহার করতে পারে এবং তবুও জটিল পেশাদার কাজগুলোতে ভালো পারফর্ম করতে পারে.
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-Bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
1 GPT‑5 mini-এর জন্য উপলব্ধ সর্বোচ্চ reasoning_effort হলো 'high'.
এখানে দেখুন, তাদের ওয়ার্কফ্লোতে GPT‑5.4 mini এবং nano পরীক্ষা করার পর আমাদের গ্রাহকরা কী ভাবেন:
“GPT-5.4 mini এই শ্রেণির একটি মডেলের জন্য শক্তিশালী এন্ড-টু-এন্ড পারফরম্যান্স প্রদান করে. আমাদের মূল্যায়নে এটি অনেক কম খরচে বেশ কিছু আউটপুট টাস্ক এবং সাইটেশন রিকল-এর ক্ষেত্রে প্রতিযোগী মডেলগুলোর সমান বা তার চেয়েও ভালো ফলাফল প্রদর্শন করেছে. এটি বৃহত্তর GPT-5.4 মডেলের তুলনায় আরও বেশি এন্ড-টু-এন্ড পাস রেট এবং আরও শক্তিশালী সোর্স অ্যাট্রিবিউশনও অর্জন করেছে."
GPT‑5.4 mini এবং nano কোডিং ওয়ার্কফ্লোতে বিশেষভাবে কার্যকর, যেখানে দ্রুত পুনরাবৃত্তি থেকে উপকার হয়. মডেলগুলো অত্যন্ত কম ল্যাটেন্সিতে নির্দিষ্ট পরিবর্তন, কোডবেস নেভিগেশন, ফ্রন্ট-এন্ড জেনারেশন এবং ডিবাগিং লুপ পরিচালনা করতে সক্ষম; যা এদেরকে দ্রুত গতিতে এবং কম খরচে কোডিং সম্পন্ন করার জন্য অত্যন্ত উপযোগী করে তুলেছে.
বেঞ্চমার্কের ক্ষেত্রে, GPT‑5.4 mini একই ধরনের ল্যাটেন্সিতে ধারাবাহিকভাবে GPT‑5‑mini‑এর চেয়ে উন্নত পারফরম্যান্স প্রদর্শন করে এবং এটি অনেক দ্রুত কাজ করার পাশাপাশি GPT‑5.4‑এর সমপর্যায়ের 'পাস রেট' অর্জনে সক্ষম; যা কোডিং ওয়ার্কফ্লোর জন্য ল্যাটেন্সি অনুযায়ী পারফরম্যান্সের একটি ইউনিক ভারসাম্য নিশ্চিত করে.
আমরা আমাদের মডেলগুলির প্রোডাকশন আচরণ দেখে লেটেন্সি অনুমান করি এবং এটি অফলাইনে সিমুলেট করি. লেটেন্সি অনুমান টুল কলের সময়কাল (কোড নির্বাহ সময়), স্যাম্পল করা টোকেন এবং ইনপুট টোকেনকে বিবেচনায় নেয়. বাস্তব জগতের লেটেন্সি ব্যাপকভাবে পরিবর্তিত হতে পারে এবং আমাদের সিমুলেশনে ধরা পড়েনি এমন অনেক বিষয়ের উপর নির্ভর করে. একইভাবে, এটি লেখার সময় এই মডেলগুলোর API মূল্যনির্ধারণের ভিত্তিতে খরচের অনুমান করা হয়েছে. খরচ ভবিষ্যতে পরিবর্তিত হতে পারে. রিজনিং low থেকে xhigh-এ উন্নীত করা হয়েছিল.
GPT‑5.4 mini এমন সিস্টেমের জন্যও একটি শক্তিশালী উপযোগী, যা বিভিন্ন আকারের মডেল একত্রে ব্যবহার করে. Codex-এ, উদাহরণস্বরূপ, GPT‑5.4‑এর মতো একটি বড় মডেল পরিকল্পনা, সমন্বয় এবং চূড়ান্ত সিদ্ধান্ত সামলাতে পারে, একই সময়ে GPT‑5.4 mini সাবএজেন্টদের কাছে দায়িত্ব অর্পণ করতে পারে, যারা সমান্তরালে আরও সীমিত সাবটাস্কগুলো সামলায়—যেমন একটি কোডবেসে সার্চ করা, একটি বড় ফাইল রিভিউ করা বা সহায়ক ডকুমেন্টগুলো প্রক্রিয়াকরণ করা. Codex-এ সাব-এজেন্ট কিভাবে কাজ করে, তা ডকস(একটি নতুন উইন্ডোতে খোলে) থেকে জেনে নিন.
ছোট মডেলগুলো আরও দ্রুত এবং আরও সক্ষম হয়ে উঠলে, এই প্যাটার্নটি আরও কার্যকর হয়ে ওঠে. সবকিছুর জন্য একটি মডেল ব্যবহার করার বদলে, ডেভেলপাররা এমন সিস্টেম তৈরি করতে পারেন যেখানে বড় মডেলগুলো কী করতে হবে তা সিদ্ধান্ত নেয় এবং ছোট মডেলগুলো বৃহৎ পরিসরে দ্রুত কার্যকর করে. GPT‑5.4 mini হলো এই ধরনের ওয়ার্কফ্লোর জন্য এখন পর্যন্ত আমাদের সবচেয়ে শক্তিশালী মিনি মডেল.
GPT‑5.4 mini মাল্টিমোডাল টাস্কেও শক্তিশালী, বিশেষ করে কম্পিউটার ব্যবহারের সাথে সম্পর্কিত টাস্কগুলোতে. মডেলটি দ্রুত ঘন ইউজার ইন্টারফেসের স্ক্রিনশট ব্যাখ্যা করে গতি সহকারে কম্পিউটার ব্যবহার সংক্রান্ত কাজ সম্পন্ন করতে পারে. OSWorld-Verified-এ, GPT‑5.4 mini GPT‑5.4‑এর কাছাকাছি পৌঁছে, একইসঙ্গে GPT‑5 mini-কে উল্লেখযোগ্যভাবে ছাড়িয়ে যায়.
GPT‑5.4 mini আজ API, Codex এবং ChatGPT‑তে উপলব্ধ.
API-তে, GPT‑5.4 mini টেক্সট ও ইমেজ ইনপুট, টুল ব্যবহার, ফাংশন কলিং, ওয়েব সার্চ, ফাইল সার্চ, কম্পিউটার ব্যবহার এবং স্কিলস সমর্থন করে. এর চার লাখ কনটেক্সট উইন্ডো আছে এবং এক মিলিয়ন ইনপুট টোকেন প্রতি খরচ 0.75 ডলার এবং এক মিলিয়ন আউটপুট টোকেন প্রতি খরচ 4.50 ডলার.
Codex-এ, GPT‑5.4 mini Codex অ্যাপ, CLI, IDE এক্সটেনশন এবং ওয়েব জুড়ে উপলব্ধ. এটি GPT‑5.4 কোটার মাত্র 30% ব্যবহার করে, যা ডেভেলপারদের Codex-এ সহজ কোডিং কাজগুলো প্রায় এক-তৃতীয়াংশ খরচে দ্রুত সম্পন্ন করার সুযোগ দেয়. Codex GPT‑5.4 mini সাব-এজেন্টদের কাছেও দায়িত্ব অর্পণ করতে পারে, যাতে কম যুক্তি-নির্ভর কাজ অপেক্ষাকৃত সস্তা মডেলে চালানো যায়.
ChatGPT‑এ, GPT‑5.4 mini + মেনুতে থাকা “Thinking” ফিচারের মাধ্যমে ফ্রি এবং Go ব্যবহারকারীদের জন্য উপলব্ধ. অন্যান্য সকল ব্যবহারকারীর জন্য, GPT‑5.4 Thinking-এর রেট লিমিট ফুরিয়ে গেলে বিকল্প বা ফলব্যাক হিসেবে GPT‑5.4 mini ব্যবহার করা যাবে.
GPT‑5.4 nano কেবল API-তেই উপলব্ধ এবং প্রতি এক মিলিয়ন ইনপুট টোকেনের জন্য 0.20 ডলার এবং প্রতি এক মিলিয়ন আউটপুট টোকেনের জন্য 1.25 ডলার খরচ হয়.
মডেলগুলোর সুরক্ষা ব্যবস্থা সম্পর্কে আরও জানতে, আমাদের Deployment Safety Hub(একটি নতুন উইন্ডোতে খোলে)-এ সিস্টেম কার্ড সংযোজনটি দেখুন.
Coding
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Tool-calling
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Intelligence
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
MM / Vision / CUA
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools)² — lower is better | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Long context
| GPT-5.4 (xhigh) | GPT-5.4 mini (xhigh) | GPT-5.4 nano (xhigh) | GPT-5 mini (high¹) | |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K–128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K–256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K–128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0–128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
1 GPT‑5 mini-এর জন্য উপলব্ধ সর্বোচ্চ reasoning_effort হলো 'high'.
2 সামগ্রিক এডিট দূরত্ব. OmniDocBench চালানো হয়েছিল reasoning_effort-কে 'none' এ সেট করে, লো-কস্ট, লো-ল্যাটেন্সি পারফরম্যান্স প্রতিফলিত করতে.


