২৩ এপ্রিল, ২০২৬

GPT‑5.5 পরিচিত

বাস্তব কাজের জন্য এক নতুন শ্রেণির বুদ্ধিমত্তা

লোডিং…

24 এপ্রিল 2026 সালের আপডেট: GPT‑5.5 এবং GPT‑5.5 Pro এখন API-তে উপলভ্য. সিস্টেম কার্ড প্রযোজ্য অতিরিক্ত সুরক্ষা ব্যবস্থাগুলি ব্যাখ্যা করার জন্যও আপডেট করা হয়েছে.

আমরা GPT‑5.5 প্রকাশ করছি, যা ইতোমধ্যেই আমাদের সবচেয়ে স্মার্ট এবং ইন্টুইটিভ অর্থাৎ ব্যবহার করা সহজ এমন একটি মডেল, এবং কম্পিউটারে কাজ করার এক নতুন পদ্ধতির দিকে পরবর্তী পদক্ষেপ.

GPT‑5.5 আপনি কী করার চেষ্টা করছেন তা আরও দ্রুত বুঝতে পারে এবং নিজেই কাজের আরও বেশি অংশ সামলাতে পারে. এটি কোড লেখা ও ডিবাগিং করা, অনলাইনে রিসার্চ, ডেটা বিশ্লেষণ, ডকুমেন্ট ও স্প্রেডশিট তৈরি, সফটওয়্যার পরিচালনা, এবং কোনো কাজ শেষ না হওয়া পর্যন্ত বিভিন্ন টুলের মধ্যে কাজ করার জন্য অসাধারণ. প্রতিটি ধাপ সতর্কতার সঙ্গে পরিচালনা করার বদলে, আপনি GPT‑5.5‑কে যেকোনো অগোছালো ও বহুমুখী কাজ দিয়ে নিশ্চিন্ত থাকতে পারেন. এটি নিজেই পরিকল্পনা করা, টুল ব্যবহার করা, নিজের কাজ যাচাই করা, অস্পষ্টতা কাটিয়ে ওঠা এবং লক্ষ্য অর্জনে কাজ চালিয়ে যেতে সক্ষম.

এজেন্টিক কোডিং, কম্পিউটার ব্যবহার, জ্ঞানভিত্তিক কাজ এবং প্রাথমিক বৈজ্ঞানিক গবেষণায় অগ্রগতি বিশেষভাবে শক্তিশালী—যেসব ক্ষেত্রে অগ্রগতি নির্ভর করে বিভিন্ন প্রেক্ষাপটে যুক্তিবিচার করা এবং সময়ের সাথে পদক্ষেপ নেওয়ার ওপর. GPT‑5.5 গতির সাথে কোনো আপস না করেই বুদ্ধিমত্তার এই উত্তরণ ঘটিয়েছে: বড় এবং অধিক সক্ষম মডেলগুলো সাধারণত ধীরগতির হয়, কিন্তু GPT‑5.5 বাস্তবধর্মী সার্ভিংয়ের ক্ষেত্রে GPT‑5.4‑এর সমান পার-টোকেন লেটেন্সি বজায় রাখে এবং একই সাথে অনেক উচ্চতর বুদ্ধিমত্তার পরিচয় দেয়. এটি একই Codex টাস্ক সম্পন্ন করতে উল্লেখযোগ্যভাবে কম টোকেন ব্যবহার করে, ফলে অধিকতর দক্ষ হওয়ার পাশাপাশি এটি অনেক বেশি সক্ষম.

আমরা আমাদের এ যাবতকালের সবচেয়ে শক্তিশালী সুরক্ষা ব্যবস্থাসহ GPT‑5.5 প্রকাশ করছি, যা উপকারী কাজের সুযোগ অব্যাহত রেখে অপব্যবহার কমানোর জন্য তৈরি করা হয়েছে. আমরা আমাদের নিরাপত্তা এবং প্রস্তুতিমূলক ফ্রেমওয়ার্কের পূর্ণ সেটের মাধ্যমে এই মডেলটি মূল্যায়ন করেছি, অভ্যন্তরীণ ও বাহ্যিক রেডটিমারদের সাথে কাজ করেছি, উন্নত সাইবার নিরাপত্তা এবং বায়োলজি সক্ষমতার জন্য লক্ষ্যভিত্তিক টেস্টিং যুক্ত করেছি এবং প্রকাশের আগে প্রায় 200 জন বিশ্বস্ত আর্লি-অ্যাক্সেস পার্টনারের কাছ থেকে বাস্তব ব্যবহারের অভিজ্ঞতার ওপর ভিত্তি করে ফিডব্যাক সংগ্রহ করেছি.

আজ, ChatGPT ও Codex-এ Plus, Pro, Business এবং Enterprise ব্যবহারকারীদের জন্য GPT‑5.5 চালু করা হচ্ছে, এবং ChatGPT‑এ Pro, Business এবং Enterprise ব্যবহারকারীদের জন্য GPT‑5.5 Pro চালু করা হচ্ছে. API ডিপ্লয়মেন্টের ক্ষেত্রে ভিন্ন ধরনের সুরক্ষাব্যবস্থা প্রয়োজন, এবং বৃহৎ পরিসরে এটি সরবরাহ করার জন্য নিরাপত্তা ও সুরক্ষা-সংক্রান্ত প্রয়োজনীয়তা নিয়ে আমরা অংশীদার ও গ্রাহকদের সঙ্গে ঘনিষ্ঠভাবে কাজ করছি. আমরা খুব শীঘ্রই GPT‑5.5 এবং GPT‑5.5 Pro-কে API-তে নিয়ে আসব.

	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
টার্মিনাল-বেঞ্চ 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (অভ্যন্তরীণ)	73.1%	68.5%	-	-	-	-
GDPval (জয় বা সমান ফলাফল)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
OSWorld-ভেরিফায়েড	78.7%	75.0%	-	-	78.0%	-
Toolathlon	55.6%	54.6%	-	-	-	48.8%
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
FrontierMath স্তর এক–তিন	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
FrontierMath স্তর চার	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
CyberGym	81.8%	79.0%	-	-	73.1%	-

মডেলের সক্ষমতা

OpenAI এজেন্টিক AI-এর বৈশ্বিক অবকাঠামো তৈরি করছে, যার ফলে সারা বিশ্বের মানুষ ও ব্যবসা AI ব্যবহার করে কাজ সম্পন্ন করতে পারে. গত এক বছরে আমরা দেখেছি যে AI সফটওয়্যার ইঞ্জিনিয়ারিংয়ের গতিকে নাটকীয়ভাবে ত্বরান্বিত করেছে. Codex এবং ChatGPT‑এ GPT‑5.5‑এর মাধ্যমে, সেই একই রূপান্তর এখন বৈজ্ঞানিক গবেষণা এবং মানুষ কম্পিউটারে যে বিস্তৃত কাজ করে সেখানেও প্রসারিত হতে শুরু করেছে.

এই ক্ষেত্রগুলো জুড়ে, GPT‑5.5 শুধু আরও বুদ্ধিমানই নয়; এটি সমস্যাগুলোর মধ্য দিয়ে কাজ করার ক্ষেত্রেও আরও দক্ষ এবং প্রায়ই কম টোকেন ও কম রিট্রাই দিয়ে আরও উচ্চমানের আউটপুটে পৌঁছে যায়. Artificial Analysis-এর Coding Index-এ, GPT‑5.5 প্রতিযোগী অত্যাধুনিক কোডিং মডেলগুলোর তুলনায় অর্ধেক খরচে অত্যাধুনিক বুদ্ধিমত্তা প্রদান করে.

Artificial Analysis Intelligence Index⁠(একটি নতুন উইন্ডোতে খোলে) হলো একটি বহিঃস্থ পক্ষ দ্বারা পরিচালিত 10টি মূল্যায়ননের একটি ভারিত গড়: AA-LCR, AA-Omniscience, CritPt, GDPval-AA, GPQA Diamond, Humanity’s Last Exam, IFBench, SciCode, Terminal-Bench Hard এবং τ²-Bench Telecom.

এজেন্ট-ভিত্তিক কোডিং

GPT‑5.5 এখন পর্যন্ত আমাদের সবচেয়ে শক্তিশালী এজেন্টিক কোডিং মডেল. Terminal-Bench 2.0, যা পরিকল্পনা, পুনরাবৃত্তি এবং টুলের সমন্বয় প্রয়োজন এমন জটিল কমান্ড-লাইন ওয়ার্কফ্লো পরীক্ষা করে, এটি 82.7% এর একটি অত্যাধুনিক নির্ভুলতা অর্জন করেছে. SWE-Bench Pro-এ, যা বাস্তব জগতের GitHub ইস্যু সমাধান মূল্যায়ন করে, এটি 58.6%-এ পৌঁছায়, এবং পূর্ববর্তী মডেলগুলোর তুলনায় একক পাসে আরও বেশি কাজ এন্ড-টু-এন্ড সমাধান করে. দীর্ঘমেয়াদী কোডিং টাস্কের জন্য আমাদের অভ্যন্তরীণ অত্যাধুনিক মূল্যায়ন Expert-SWE-এ, যেখানে মানুষের কাজ সম্পন্ন করার আনুমানিক গড় সময় 20 ঘণ্টা—সেখানেও GPT‑5.5 মডেলটি GPT‑5.4‑এর চেয়ে ভালো পারফরম্যান্স প্রদর্শন করেছে.

তিনটি মূল্যায়নেই, GPT‑5.5 মডেলটি কম টোকেন ব্যবহার করে GPT‑5.4‑এর স্কোরের তুলনায় উন্নতি করেছে.

মডেলের কোডিং দক্ষতা Codex-এ বিশেষভাবে স্পষ্ট, যেখানে এটি ইমপ্লিমেন্টেশন, রিফ্যাক্টর, ডিবাগিং, টেস্টিং এবং ভ্যালিডেশনসহ বিভিন্ন ইঞ্জিনিয়ারিং কাজ সম্পাদন করতে পারে. প্রাথমিক টেস্টিং থেকে বোঝা যায় যে GPT‑5.5 বাস্তব ইঞ্জিনিয়ারিং কাজের জন্য প্রয়োজনীয় কার্যপদ্ধতিগুলোতে (Behavior) আরও দক্ষ, যেমন বিশাল সিস্টেম জুড়ে প্রেক্ষাপট ধরে রাখা, অস্পষ্ট ব্যর্থতাগুলোর পেছনে যুক্তি প্রয়োগ করা, টুলের মাধ্যমে অনুমান যাচাই করা এবং আশেপাশের কোডবেসে পরিবর্তনগুলো কার্যকর করা.

রেন্ডার করা ট্রাজেক্টরিতে Orion, Moon, এবং Sun-এর জন্য NASA/JPL Horizons ভেক্টর ডেটা ব্যবহার করা হয়েছে, এবং পড়তে সুবিধার জন্য ডিসপ্লে স্কেলিং প্রয়োগ করা হয়েছে.

Prompt: [attached image] Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.

বেঞ্চমার্কের বাইরেও, প্রথম দিকের পরীক্ষকরা বলেছেন যে GPT‑5.5 একটি সিস্টেমের সামগ্রিক কাঠামো বুঝতে আরও শক্তিশালী সক্ষমতা দেখায়: কেন কিছু ব্যর্থ হচ্ছে, কোথায় সংশোধনটি প্রয়োগ করতে হবে, এবং কোডবেসে আর কী কী প্রভাবিত হবে.

“আমার ব্যবহার করা প্রথম কোডিং মডেল যেটির গভীর ধারণাগত স্বচ্ছতা আছে.”

Dan Shipper, Every-এর প্রতিষ্ঠাতা ও CEO, GPT‑5.5‑কে "আমার ব্যবহার করা প্রথম কোডিং মডেল, যার ধারণাগত স্বচ্ছতা উল্লেখযোগ্য" বলে বর্ণনা করেছেন.

একটি অ্যাপ চালু করার পর, তিনি লঞ্চ-পরবর্তী একটি সমস্যা কয়েক দিন ধরে ডিবাগ করেন, তারপর সিস্টেমের একটি অংশ নতুন করে লিখতে তার সেরা ইঞ্জিনিয়ারদের একজনকে যুক্ত করেন. GPT‑5.5 পরীক্ষা করতে, তিনি কার্যত সময় পিছিয়ে দিলেন: মডেলটি কি ভাঙা অবস্থাটি দেখে প্রকৌশলী যে একই ধরনের পুনর্লিখন বেছে নিয়েছিলেন, তা তৈরি করতে পারে? GPT‑5.4 পারেনি. GPT‑5.5 পারতো.

“সত্যিই এমনটি মনে হয় যেন আমি উচ্চতর বুদ্ধিমত্তার সঙ্গে কাজ করছি, এবং প্রায় এক ধরনের শ্রদ্ধাবোধও কাজ করে.”

MagicPath-এর সিইও Pietro Schirano একইভাবে একটি বড় পরিবর্তন লক্ষ্য করেছিলেন যখন GPT‑5.5 কয়েকশ ফ্রন্টএন্ড এবং রিফ্যাক্টর পরিবর্তন সম্বলিত একটি ব্রাঞ্চকে এমন একটি মেইন ব্রাঞ্চের সাথে মার্জ করেছিল যা নিজেও উল্লেখযোগ্যভাবে পরিবর্তিত হয়েছিল, এবং প্রায় 20 মিনিটের মধ্যে এক চেষ্টাতেই কাজটি সম্পন্ন করেছিল।

যেসব সিনিয়র ইঞ্জিনিয়ার মডেলটি পরীক্ষা করেছিলেন, তারা বলেছেন যে GPT‑5.5 যুক্তি করার ক্ষমতা ও স্বায়ত্তশাসনের ক্ষেত্রে GPT‑5.4 এবং Claude Opus 4.7-এর তুলনায় লক্ষণীয়ভাবে বেশি শক্তিশালী ছিল. এটি আগেভাগেই সমস্যাগুলো শনাক্ত করতে এবং স্পষ্টভাবে প্রম্পট না দিলেও পরীক্ষা ও পর্যালোচনার প্রয়োজনীয়তা পূর্বানুমান করতে পারত. এক ক্ষেত্রে, একজন ইঞ্জিনিয়ার একে একটি কোলাবোরেটিভ মার্কডাউন এডিটরের কমেন্ট সিস্টেম পুনরায় ডিজাইন করার অনুরোধ জানান এবং পরে ফিরে এসে দেখেন যে 12টি ডিফের (diff stack) একটি সেট প্রায় সম্পন্ন হয়ে আছে. অন্যরা বলেছেন যে তাদের আশ্চর্যজনকভাবে খুব কম বাস্তবায়নগত সংশোধনের প্রয়োজন হয়েছে এবং GPT‑5.4‑এর তুলনায় GPT‑5.5‑এর পরিকল্পনার ওপর তারা বেশি আস্থা অনুভব করেছেন.

NVIDIA-এর একজন ইঞ্জিনিয়ার, যিনি মডেলটিতে আগাম অ্যাক্সেস পেয়েছিলেন, এমনকি বলেছিলেন: "GPT‑5.5‑এ অ্যাক্সেস হারানো এমন মনে হয়, যেন আমার শরীরের একটি অঙ্গ কেটে ফেলা হয়েছে."

“GPT-5.5 হলো GPT-5.4-এর তুলনায় লক্ষণীয়ভাবে স্মার্ট এবং জটিল সমস্যা সমাধানে অনেক বেশি অবিচল, যার কোডিং পারফরম্যান্স আরও শক্তিশালী এবং টুল ব্যবহারের ক্ষেত্রে এটি আরও বেশি নির্ভরযোগ্য। এটি মাঝপথে থেমে না গিয়ে উল্লেখযোগ্যভাবে দীর্ঘ সময় ধরে নির্দিষ্ট টাস্কে নিয়োজিত থাকে, যা আমাদের ব্যবহারকারীরা Cursor-এর ওপর যে জটিল এবং দীর্ঘমেয়াদী কাজগুলো ন্যস্ত করেন, সেগুলোর জন্য সবচেয়ে বেশি গুরুত্বপূর্ণ।”

— মাইকেল ট্রুয়েল, Cursor-এর সহ-প্রতিষ্ঠাতা ও সিইও

জ্ঞান সংক্রান্ত কাজ

যে একই শক্তিগুলো GPT‑5.5‑কে কোডিংয়ে দারুণ করে তোলে, সেগুলোই কম্পিউটারে প্রতিদিনের কাজের জন্যও এটিকে শক্তিশালী করে তোলে. মডেলটি ব্যবহারের উদ্দেশ্য আরও ভালোভাবে বুঝতে পারে বলে, এটি জ্ঞানভিত্তিক কাজের সম্পূর্ণ চক্রের মধ্য দিয়ে আরও স্বাভাবিকভাবে এগোতে পারে: তথ্য খুঁজে বের করা, কী গুরুত্বপূর্ণ তা বোঝা, টুল ব্যবহার করা, আউটপুট যাচাই করা, এবং প্রাথমিক উপাত্তকে ব্যবহারযোগ্য কিছুতে রূপান্তর করা.

Codex-এ, ডকুমেন্ট, স্প্রেডশিট এবং স্লাইড প্রেজেন্টেশন তৈরিতে GPT‑5.5 GPT‑5.4‑এর চেয়ে অধিক দক্ষ. আলফা টেস্টাররা বলেছেন, এটি অপারেশনাল রিসার্চ, স্প্রেডশিট মডেলিং, এবং বিশৃঙ্খল ব্যবসায়িক ইনপুটকে পরিকল্পনায় রূপান্তর করার মতো কাজে আগের মডেলগুলোর চেয়ে ভালো পারফর্ম করেছে. Codex-এর কম্পিউটার ব্যবহারের দক্ষতার সাথে যুক্ত হয়ে GPT‑5.5 আমাদের এমন একটি অনুভূতির কাছাকাছি নিয়ে আসে যে মডেলটি সত্যিই আপনার সাথে কম্পিউটার ব্যবহার করতে সক্ষম: স্ক্রিনে কী আছে তা দেখা, ক্লিক করা, টাইপ করা, ইন্টারফেস নেভিগেট করা এবং নিখুঁতভাবে বিভিন্ন টুলের মধ্যে কাজ করা.

OpenAI-এর টিমগুলো ইতিমধ্যেই বাস্তব ওয়ার্কফ্লোতে এই সক্ষমতাগুলো ব্যবহার করছে. আজ কোম্পানির 85%-এর বেশি ব্যবহারকারী বিভিন্ন কার্যক্ষেত্রে প্রতি সপ্তাহে Codex ব্যবহার করে, যার মধ্যে রয়েছে সফটওয়্যার ইঞ্জিনিয়ারিং, ফাইন্যান্স, কমিউনিকেশনস, মার্কেটিং, ডেটা সায়েন্স এবং প্রোডাক্ট ম্যানেজমেন্ট. Comms বিভাগে, টিম Codex-এ GPT‑5.5 ব্যবহার করে ছয় মাসের স্পিকিং রিকোয়েস্ট ডেটা বিশ্লেষণ করেছে, একটি স্কোরিং ও রিস্ক ফ্রেমওয়ার্ক তৈরি করেছে এবং একটি স্বয়ংক্রিয় Slack এজেন্ট যাচাই করেছে যাতে কম ঝুঁকিপূর্ণ অনুরোধগুলো স্বয়ংক্রিয়ভাবে সম্পন্ন করা যায় এবং উচ্চ ঝুঁকিপূর্ণ অনুরোধগুলো পর্যালোচনার জন্য মানুষের কাছে পাঠানো যায়। ফাইন্যান্স বিভাগে, দলটি 24,771টি K-1 কর ফর্ম পর্যালোচনা করতে Codex ব্যবহার করেছে, যার মোট পৃষ্ঠা সংখ্যা ছিল 71,637. তারা এমন একটি কার্যপদ্ধতি অনুসরণ করেছে যা ব্যক্তিগত তথ্য বাদ দিয়ে কাজ সম্পন্ন করেছে এবং গত বছরের তুলনায় এই কাজটি দুই সপ্তাহ আগেই সম্পন্ন করতে টিমকে সহায়তা করেছে. গো-টু-মার্কেট টিমে, একজন কর্মী সাপ্তাহিক ব্যবসায়িক প্রতিবেদন তৈরি করার কাজ স্বয়ংক্রিয় করেছেন, ফলে প্রতি সপ্তাহে 5-10 ঘণ্টা সময় সাশ্রয় হচ্ছে.

ChatGPT‑এ, GPT‑5.5 Thinking আরও কঠিন সমস্যায় দ্রুততর সহায়তা দেয়, এবং আরও স্মার্ট ও সংক্ষিপ্ত উত্তর দিয়ে আপনাকে জটিল কাজ আরও দক্ষতার সঙ্গে এগিয়ে নিতে সাহায্য করে. এটি কোডিং, রিসার্চ, তথ্য সংকলন ও বিশ্লেষণ, এবং ডকুমেন্ট-নির্ভর কাজের মতো পেশাদার কাজে অসাধারণ, বিশেষ করে প্লাগইন ব্যবহার করার সময়.

GPT‑5.5 Pro-এ, প্রথম দিকের পরীক্ষকরা দেখছেন যে ChatGPT যে কাজগুলো করতে পারে, সেগুলোর জটিলতা ও মান উভয় ক্ষেত্রেই উল্লেখযোগ্য অগ্রগতি এসেছে, পাশাপাশি লেটেন্সির উন্নতি এটিকে কঠিন কাজের জন্য অনেক বেশি ব্যবহারিক করে তুলেছে. GPT‑5.4 Pro-এর তুলনায়, পরীক্ষকরা দেখেছেন যে GPT‑5.5 Pro-এর উত্তরগুলো উল্লেখযোগ্যভাবে অধিক বিস্তৃত, সুসংগঠিত, নির্ভুল, প্রাসঙ্গিক এবং উপযোগী ছিল, বিশেষ করে ব্যবসা, আইন, শিক্ষা এবং ডেটা সায়েন্স ক্ষেত্রে এর পারফরম্যান্স ছিল খুবই শক্তিশালী.

GPT‑5.5 একাধিক বেঞ্চমার্ক জুড়ে স্টেট-অফ-দ্য-আর্ট পারফরম্যান্স অর্জন করে, যা এই ধরনের কাজকে প্রতিফলিত করে. GDPval⁠⁠-এ, যা 44-টি পেশা জুড়ে সুনির্দিষ্ট জ্ঞানভিত্তিক কাজ তৈরি করার ক্ষেত্রে এজেন্টদের সক্ষমতা পরীক্ষা করে, GPT‑5.5 84.9% স্কোর করে. OSWorld-Verified-এ, যা পরিমাপ করে একটি মডেল নিজে থেকেই বাস্তব কম্পিউটার এনভায়রনমেন্টে কাজ করতে পারে কি না, এটি 78.7%-এ পৌঁছায়. আর Tau2-bench Telecom-এ, যা জটিল গ্রাহক-সেবা কর্মপ্রবাহ পরীক্ষা করে, এটি প্রম্পট টিউনিং ছাড়াই 98.0%-এ পৌঁছে. GPT‑5.5 অন্যান্য জ্ঞানভিত্তিক কাজের বেঞ্চমার্কেও শক্তিশালী পারফর্ম করে: FinanceAgent-এ 60.0%, অভ্যন্তরীণ ইনভেস্টমেন্ট ব্যাংকিং মডেলিং কাজসমূহ-এ 88.5% এবং OfficeQA Pro-এ 54.1%.

Tau2-bench Telecom কোনো প্রম্পট টিউনিং ছাড়াই চালানো হয়েছে (এবং ইউজার মডেল হিসেবে GPT‑4.1 ব্যবহার করা হয়েছে). GPT‑5.5 কাজের উদ্দেশ্য আরও ভালোভাবে বোঝে এবং এর পূর্বসূরিদের তুলনায় টোকেন ব্যবহারে আরও দক্ষ.

“GPT-5.5 ভারি এক্সিকিউশন-নির্ভর কাজের জন্য প্রয়োজনীয় ধারাবাহিক পারফরম্যান্স প্রদান করে. NVIDIA GB200 NVL72 সিস্টেমে তৈরি এবং চালানো এই মডেলটি আমাদের দলগুলোকে প্রাকৃতিক ভাষার প্রম্পট থেকে এন্ড-টু-এন্ড বৈশিষ্ট্য সরবরাহ করতে, ডিবাগের সময় দিন থেকে ঘণ্টায় নামিয়ে আনতে, এবং জটিল কোডবেসে সপ্তাহব্যাপী পরীক্ষা-নিরীক্ষাকে রাতারাতি অগ্রগতিতে রূপান্তর করতে সক্ষম করে. “এটি শুধু দ্রুত কোডিংয়ের চেয়েও বেশি—এটি কাজ করার এক নতুন পদ্ধতি, যা মানুষকে মৌলিকভাবে ভিন্ন গতিতে কাজ করতে সহায়তা করে.”

— জাস্টিন বোইটানো, NVIDIA-এর Enterprise AI বিভাগের ভাইস প্রেসিডেন্ট

বৈজ্ঞানিক গবেষণা

GPT‑5.5 বৈজ্ঞানিক এবং কারিগরি গবেষণা কার্যপদ্ধতিতেও উন্নতি প্রদর্শন করেছে, যেগুলোতে কেবল একটি কঠিন প্রশ্নের উত্তর দেওয়ার চেয়েও বেশি কিছু প্রয়োজন হয়. গবেষকদের একটি ধারণা অন্বেষণ করতে, প্রমাণ সংগ্রহ করতে, অনুমান যাচাই করতে, ফলাফল ব্যাখ্যা করতে এবং পরবর্তীতে কী চেষ্টা করা হবে তা সিদ্ধান্ত নিতে হয়. অন্যান্য মডেলের তুলনায় GPT‑5.5 সেই লু্প জুড়ে দীর্ঘক্ষণ সক্রিয় থাকতে বা ধারাবাহিকতা বজায় রাখতে অধিক দক্ষ।

উল্লেখযোগ্যভাবে, GPT‑5.5 জেনেটিক্স এবং পরিমাণগত জীববিজ্ঞানে বহু-ধাপের বৈজ্ঞানিক ডেটা বিশ্লেষণের উপর কেন্দ্রীভূত একটি নতুন মূল্যায়ন GeneBench⁠(একটি নতুন উইন্ডোতে খোলে)-এ GPT‑5.4‑এর তুলনায় স্পষ্ট উন্নতি দেখায়. এই সমস্যাগুলোর জন্য মডেলগুলোকে ন্যূনতম তত্ত্বাবধানমূলক নির্দেশনা দিয়ে সম্ভাব্যভাবে দ্ব্যর্থক বা ত্রুটিপূর্ণ ডেটা সম্পর্কে যুক্তি করতে, গোপন কনফাউন্ডার বা QC ব্যর্থতার মতো বাস্তবসম্মত প্রতিবন্ধকতাগুলো মোকাবিলা করতে এবং আধুনিক পরিসংখ্যানগত পদ্ধতিগুলো সঠিকভাবে বাস্তবায়ন ও ব্যাখ্যা করতে হয়. এখানকার কাজগুলো প্রায়ই বৈজ্ঞানিক বিশেষজ্ঞদের জন্য বহু-দিনব্যাপী প্রকল্পের সমতুল্য—এই সত্যের পরিপ্রেক্ষিতে মডেলের পারফরম্যান্স উল্লেখযোগ্য.

একইভাবে, BixBench⁠(একটি নতুন উইন্ডোতে খোলে)-এ, যা বাস্তব-জগতের বায়োইনফরমেটিক্স এবং ডেটা বিশ্লেষণকে কেন্দ্র করে তৈরি একটি বেঞ্চমার্ক, GPT‑5.5 প্রকাশিত স্কোরযুক্ত মডেলগুলোর মধ্যে শীর্ষস্থানীয় পারফরম্যান্স অর্জন করেছে. মডেলের বৈজ্ঞানিক সক্ষমতা এখন এতটাই শক্তিশালী যে এটি একজন প্রকৃত কো-সায়েন্টিস্ট হিসেবে অত্যাধুনিক বায়োমেডিক্যাল গবেষণার অগ্রভাগে অগ্রগতিকে অর্থপূর্ণভাবে ত্বরান্বিত করতে পারে.

আরেকটি উদাহরণে, একটি কাস্টম হারনেসসহ GPT‑5.5‑এর একটি অভ্যন্তরীণ সংস্করণ কম্বিনেটরিক্সের অন্যতম কেন্দ্রীয় বিষয় Ramsey সংখ্যা সম্পর্কে একটি নতুন প্রমাণ⁠(একটি নতুন উইন্ডোতে খোলে) আবিষ্কার করতে সহায়তা করেছিল. কম্বিনেটরিক্স বিচ্ছিন্ন বস্তুগুলো কিভাবে একসঙ্গে মানানসই হয় তা অধ্যয়ন করে: গ্রাফ, নেটওয়ার্ক, সেট এবং প্যাটার্ন. Ramsey সংখ্যা মোটামুটিভাবে এই প্রশ্নটি করে: কোনো না কোনো ধরনের শৃঙ্খলা নিশ্চিতভাবে দেখা দেওয়ার আগে একটি নেটওয়ার্ক কত বড় হতে হবে. এই ক্ষেত্রে ফলাফল বিরল এবং প্রায়ই প্রযুক্তিগতভাবে অর্জন করা কঠিন. এখানে, GPT‑5.5 অফ-ডায়াগোনাল Ramsey সংখ্যাগুলো সম্পর্কে দীর্ঘদিনের একটি আসিম্পটোটিক সত্যের একটি প্রমাণ খুঁজে পেয়েছিল, যা পরে Lean-এ যাচাই করা হয়. এই ফলাফলটি GPT‑5.5‑এর শুধু কোড বা ব্যাখ্যাই নয়, বরং গবেষণার একটি মৌলিক ক্ষেত্রে একটি বিস্ময়কর ও উপযোগী গাণিতিক যুক্তি প্রদানে অবদান রাখার একটি সুস্পষ্ট উদাহরণ.

প্রাথমিক পরীক্ষাকারীরা ChatGPT‑তে GPT‑5.5 Pro-কে এককালীন উত্তর প্রদানকারী ইঞ্জিনের পরিবর্তে একজন গবেষণা সহযোগী হিসেবে বেশি ব্যবহার করেছেন: একাধিকবার পাণ্ডুলিপি পর্যালোচনা করা, কারিগরি যুক্তিগুলো যাচাই করা, বিশ্লেষণের প্রস্তাব দেওয়া এবং কোড, নোট ও PDF কনটেক্সট নিয়ে কাজ করা. মূল বিষয় হলো, GPT‑5.5 গবেষকদের প্রশ্ন থেকে পরীক্ষা হয়ে ফলাফলে অগ্রসর হতে আরও ভালোভাবে সহায়তা করে.

জ্যাকসন ল্যাবরেটরি ফর জিনোমিক মেডিসিন-এর ইমিউনোলজি বিষয়ের অধ্যাপক এবং গবেষক ডেরিয়া উনুতমাজ, 62টি স্যাম্পল এবং প্রায় 28,000টি জিন সম্বলিত একটি জিন-এক্সপ্রেশন ডেটাসেট বিশ্লেষণ করতে GPT‑5.5 Pro ব্যবহার করেছিলেন, যা একটি বিস্তারিত গবেষণা প্রতিবেদন তৈরি করেছে। এটি কেবল প্রাপ্ত ফলাফলগুলোকেই সারসংক্ষেপ করেনি বরং গুরুত্বপূর্ণ প্রশ্ন এবং অন্তর্দৃষ্টিগুলোও সামনে এনেছে—যে কাজটি সম্পন্ন করতে তার টিমের কয়েক মাস সময় লেগে যেত বলে তিনি জানিয়েছেন।

পোল্যান্ডের পজনানে অবস্থিত অ্যাডাম মিকিউইচ ইউনিভার্সিটির গণিতের সহকারী অধ্যাপক বার্তোজ নাসক্রেকস্কি, Codex-এ GPT‑5.5 ব্যবহার করে মাত্র 11 মিনিটে একটিমাত্র প্রম্পট থেকে একটি অ্যালজেব্রাইক-জিওমেট্রি অ্যাপ তৈরি করেছেন, যা কোয়াড্রাটিক সারফেসের ইন্টারসেকশন ভিজ্যুয়ালাইজ করে এবং প্রাপ্ত কার্ভটিকে একটি ওয়াইয়ারস্ট্রাস মডেলে রূপান্তর করে।

তিনি পরে অ্যাপটি আরও স্থিতিশীল সিঙ্গুলারিটি ভিজ্যুয়ালাইজেশন এবং সুনির্দিষ্ট সহগ দিয়ে সম্প্রসারিত করেন, যা ভবিষ্যতের কাজেও পুনর্ব্যবহার করা যেতে পারে. তার কাছে আরও বড় পরিবর্তন হলো, Codex এখন কাস্টম গাণিতিক ভিজ্যুয়ালাইজেশন এবং কম্পিউটার অ্যালজেবরা ওয়ার্কফ্লো বাস্তবায়নে সহায়তা করতে পারে, যার জন্য আগে বিশেষ টুলসের প্রয়োজন হতো. সমষ্টিগতভাবে, এই উদাহরণগুলো দেখায় যে GPT‑5.5 বিশেষজ্ঞদের উদ্দেশ্যকে কার্যকর গবেষণা টুল এবং বিশ্লেষণে রূপান্তর করছে.

ক্রেডিট: বার্তোজ নাসক্রেকস্কি⁠(একটি নতুন উইন্ডোতে খোলে)

Prompt: # Algebraic geometry surface intersection

Make an app which draws two quadratic surfaces and colors in red the intersection curve. Use computational Riemann-Roch theorem to convert this into Weierstrass curve.

## Main window

Two tinted surfaces with a slightly transparent shading, high quality rendering intersect along a red colored algebraic curve

Rotation with mouses in both directions, full pinch mechanism for zoom, haptic press to show the little menu with sliders for changing the coefficients of each surface; detection via Z-buffor level

## Side right window

Short Weierstrass equation (over Q or quadratic field extension) computed on the go via effective Riemann-Roch theorem formulas

## Ambient mode where all the controls are hidden and the user can admire the beauty of the shapes

## Specs

App is running in the browser, light-weight implementation with full stack newest libraries, portable, deployable

## Docs

Git repo, journal, plan (Markdown files)

“আমাদের হারনেসে OpenAI-এর নতুন GPT-5.5 মডেল ব্যবহার করা, এটিকে বিশাল বায়োকেমিক্যাল ডেটাসেট বিশ্লেষণ করে মানুষের ক্ষেত্রে ওষুধের ফলাফল পূর্বাভাস দিতে দেখা, এবং তারপর আমাদের সবচেয়ে কঠিন ওষুধ আবিষ্কারের মূল্যায়নগুলোতে এটিকে উল্লেখযোগ্য নির্ভুলতা বৃদ্ধি দিতে দেখা, এসবই অত্যন্ত উদ্দীপনাময়. “OpenAI যদি এভাবেই এগিয়ে যেতে থাকে, তাহলে বছরের শেষ নাগাদ ওষুধ আবিষ্কারের ভিত্তি বদলে যাবে.”

— ব্র্যান্ডন হোয়াইট, Axiom Bio-এর সহ-প্রতিষ্ঠাতা ও সিইও

পরবর্তী-প্রজন্মের সিদ্ধান্ত গ্রহণের দক্ষতা

GPT‑5.4‑এর সমপরিমাণ লেটেন্সিতে GPT‑5.5 প্রদান করার জন্য সিদ্ধান্ত গ্রহণকে কতগুলো বিচ্ছিন্ন অপ্টিমাইজেশন হিসেবে না দেখে একটি সমন্বিত সিস্টেম হিসেবে নতুন করে ভাবার প্রয়োজন ছিল. GPT‑5.5‑কে NVIDIA GB200 এবং GB300 NVL72 সিস্টেমের জন্য সহ-নকশা করা হয়েছে, সেগুলোর মাধ্যমে প্রশিক্ষণ দেওয়া হয়েছে এবং সেগুলোর মাধ্যমেই সেবা প্রদান করা হচ্ছে। Codex এবং GPT‑5.5 আমাদের কর্মক্ষমতার লক্ষ্য অর্জনে গুরুত্বপূর্ণ ভূমিকা পালন করেছে. Codex দলকে আইডিয়া থেকে বেঞ্চমার্কযোগ্য বাস্তবায়নে দ্রুত এগোতে সাহায্য করেছে, পদ্ধতির খসড়া তৈরি করে, পরীক্ষাগুলো সেট আপ করে, এবং কোন অপ্টিমাইজেশনগুলোতে আরও গভীর বিনিয়োগ সার্থক হবে তা শনাক্ত করতে সহায়তা করেছে. GPT‑5.5 স্ট্যাকের মধ্যেই মূল উন্নতিগুলো খুঁজে বের করতে এবং বাস্তবায়ন করতে সহায়তা করেছে. সহজ কথায়, মডেলটি সেই অবকাঠামোকে উন্নত করতে সাহায্য করেছে যার ওপর ভিত্তি করে এটি পরিচালিত হয়।

এ ধরনের একটি উন্নতি ছিল লোড ব্যালান্সিং এবং পার্টিশনিং হিউরিস্টিকস. GPT‑5.5‑এর আগে, আমরা কম্পিউটিং কোরগুলোর মধ্যে কাজের ভারসাম্য বজায় রাখতে অ্যাক্সিলারেটরের অনুরোধগুলোকে একটি নির্দিষ্ট সংখ্যক অংশে ভাগ করতাম, যাতে বড় ও ছোট অনুরোধ একই GPU-তে চলতে পারে. তবে, স্ট্যাটিক অংশের একটি পূর্বনির্ধারিত সংখ্যা সব ধরনের ট্র্যাফিক বিন্যাসের জন্য সর্বোত্তম নয়. GPU-গুলোকে আরও ভালোভাবে কাজে লাগাতে, Codex কয়েক সপ্তাহের প্রোডাকশন ট্র্যাফিকের প্যাটার্ন বিশ্লেষণ করেছে এবং কাজকে সর্বোত্তমভাবে ভাগ ও ভারসাম্যপূর্ণ করতে কাস্টম হিউরিস্টিক অ্যালগরিদম লিখেছে. এই প্রচেষ্টার প্রভাব ছিল ব্যাপক, যা টোকেন তৈরির গতি 20% এরও বেশি বাড়িয়ে দিয়েছে.

সবার নিরাপত্তার জন্য সাইবার নিরাপত্তার উন্নয়ন

নিরাপত্তা দুর্বলতা খুঁজে বের করা এবং সেগুলো সমাধান করতে অত্যন্ত দক্ষ মডেলগুলোর জন্য বিশ্বকে প্রস্তুত করা একটি সম্মিলিত প্রচেষ্টা. এর জন্য পুরো বাস্তুতন্ত্রকে কঠোর পরিশ্রম করতে হবে স্থিতিস্থাপকতা গড়ে তুলতে, যেখানে সাইবার প্রতিরক্ষার পরবর্তী যুগের জন্য মডেলের সহজলভ্যতা এবং ধাপে ধাপে ডিপ্লয়মেন্ট⁠ নিশ্চিত করা হবে.

অত্যাধুনিক মডেলগুলো সাইবার নিরাপত্তায় ক্রমশ আরও দক্ষ হয়ে উঠছে. সেই সক্ষমতাগুলি ব্যাপকভাবে ছড়িয়ে পড়বে এবং আমরা বিশ্বাস করি, এগিয়ে যাওয়ার সর্বোত্তম পথ হলো সেগুলো সাইবার প্রতিরক্ষা ত্বরান্বিত করতে এবং বাস্তুতন্ত্রকে শক্তিশালী করতে ব্যবহার করা.

GPT‑5.5 এমন একটি ক্রমবর্ধমান কিন্তু গুরুত্বপূর্ণ পদক্ষেপ যা AI-এর মাধ্যমে সাইবারসিকিউরিটির মতো বিশ্বের সবচেয়ে কঠিন কিছু চ্যালেঞ্জ সমাধান করতে পারে. ডিসেম্বরে GPT‑5.2‑এর সঙ্গে, আমরা আমাদের মডেলগুলোর মাধ্যমে সম্ভাব্য সাইবার অপব্যবহার সীমিত করতে প্রয়োজনীয় সাইবার সুরক্ষা ব্যবস্থা⁠ সক্রিয়ভাবে মোতায়েন করেছি. এখন GPT‑5.5‑এর সঙ্গে, আমরা সম্ভাব্য সাইবার ঝুঁকির জন্য আরও কঠোর ক্লাসিফায়ার মোতায়েন করছি, যা কিছু ব্যবহারকারীর কাছে শুরুতে বিরক্তিকর মনে হতে পারে, তবে সময়ের সঙ্গে সঙ্গে এগুলোকে টিউন করা হবে.

আমাদের মডেলগুলি ধাপে ধাপে উন্নত হওয়ার সঙ্গে সঙ্গে, এবং আমরা পুনরাবৃত্তিমূলকভাবে প্রশমন ব্যবস্থাগুলি তৈরি ও সামঞ্জস্য করার সময়, অর্থবহ সাইবারসিকিউরিটি সক্ষমতাসম্পন্ন মডেলগুলি দায়িত্বশীলভাবে রিলিজ করতে সক্ষম হওয়ার জন্য আমরা বহু বছর ধরে আমাদের প্রিপেয়ার্ডনেস ফ্রেমওয়ার্ক⁠(একটি নতুন উইন্ডোতে খোলে) -এ সাইবারসিকিউরিটিকে একটি বিভাগ হিসেবে চিহ্নিত করেছি.

এই স্তরের সাইবার সক্ষমতার জন্য আমরা শিল্পখাতে শীর্ষস্থানীয় সুরক্ষা ব্যবস্থা স্থাপন করছি.গত বছর আমরা GPT‑5.2⁠(একটি নতুন উইন্ডোতে খোলে)-এর মাধ্যমে প্রথম সাইবার-নির্দিষ্ট সুরক্ষা ব্যবস্থা প্রবর্তন করি, যা আমরা পরবর্তী মোতায়েনগুলোতে পরীক্ষা, পরিমার্জন এবং আরও উন্নত করে চলেছি. GPT‑5.5‑এর জন্য, আমরা উচ্চ-ঝুঁকিপূর্ণ কার্যকলাপ, সংবেদনশীল সাইবার অনুরোধের ক্ষেত্রে আরও কঠোর নিয়ন্ত্রণ ব্যবস্থা ডিজাইন করেছি এবং পুনরাবৃত্ত অপব্যবহারের বিরুদ্ধে অতিরিক্ত সুরক্ষা যোগ করেছি. মডেলের নিরাপত্তা, প্রমাণীকৃত ব্যবহার এবং অননুমোদিত ব্যবহারের পর্যবেক্ষণে আমাদের বিনিয়োগের মাধ্যমে ব্যাপক অ্যাক্সেস সম্ভব হয়েছে. এই সুরক্ষা ব্যবস্থাগুলোর দৃঢ়তা উন্নয়ন, পরীক্ষা এবং পুনরাবৃত্তিমূলকভাবে পরিমার্জনের জন্য আমরা কয়েক মাস ধরে বহিরাগত বিশেষজ্ঞদের সঙ্গে কাজ করে আসছি. GPT‑5.5‑এর মাধ্যমে, আমরা নিশ্চিত করছি যে ডেভেলপাররা সহজেই তাদের কোড সুরক্ষিত করতে পারেন, একই সঙ্গে সেই সাইবার ওয়ার্কফ্লোগুলোর উপর আরও শক্তিশালী নিয়ন্ত্রণ আরোপ করছি যেগুলো ক্ষতিকর ব্যবহারকারীদের দ্বারা অপব্যবহৃত হয়ে ক্ষতির কারণ হওয়ার সম্ভাবনা সবচেয়ে বেশি.
আমরা সব স্তরে সাইবার প্রতিরক্ষা ত্বরান্বিত করতে অ্যাক্সেস সম্প্রসারণ করছি. আমরা Trusted Access for Cyber⁠-এর মাধ্যমে সাইবারের জন্য কম-সীমাবদ্ধ মডেলগুলি উপলভ্য করছি, Codex দিয়ে শুরু করে, যা লঞ্চের সময় নির্দিষ্ট আস্থার সংকেত⁠(একটি নতুন উইন্ডোতে খোলে) পূরণকারী যাচাইকৃত ব্যবহারকারীদের জন্য GPT‑5.5‑এর উন্নত সাইবারসিকিউরিটি সক্ষমতায় কম সীমাবদ্ধতার সঙ্গে বর্ধিত অ্যাক্সেস অন্তর্ভুক্ত করে. যেসব প্রতিষ্ঠান গুরুত্বপূর্ণ অবকাঠামো রক্ষা⁠ -এর জন্য দায়ী, তারা সাইবার-পারমিসিভ মডেল যেমন GPT‑5.4‑Cyber‑এ অ্যাক্সেসের জন্য আবেদন করতে পারে এবং তাদের অভ্যন্তরীণ সিস্টেমগুলোকে সুরক্ষিত করার জন্য এসব মডেল ব্যবহার করতে কঠোর নিরাপত্তা-সংক্রান্ত শর্ত পূরণ সাপেক্ষে. এটি বৈধ নিরাপত্তা কাজের জন্য বিস্তৃত পরিসরের যাচাইকৃত প্রতিরক্ষাকারীদের আরও সক্ষম সরঞ্জাম দেয়, অপ্রয়োজনীয় বাধা কমিয়ে, যাতে আমরা গুরুত্বপূর্ণ প্রতিরক্ষামূলক সক্ষমতাগুলোতে প্রবেশাধিকারকে আরও ব্যাপকভাবে উন্মুক্ত করতে পারি. ব্যবহারকারীরা যাচাইকৃত প্রতিরক্ষামূলক কাজে GPT‑5.5 ব্যবহার করার সময় অপ্রয়োজনীয় প্রত্যাখ্যান কমাতে chatgpt.com/cyber⁠(একটি নতুন উইন্ডোতে খোলে) -এ Trusted Access-এর জন্য আবেদন করতে পারেন.
জনসাধারণের জন্য গুরুত্বপূর্ণ অবকাঠামো সুরক্ষায় সহায়তা করতে আমরা সরকারি অংশীদারদের সঙ্গে কাজ করছি.গুরুত্বপূর্ণ করদাতার তথ্য সুরক্ষিত রাখা ডিজিটাল সিস্টেম থেকে শুরু করে বিদ্যুৎ গ্রিড ও স্থানীয় সম্প্রদায়ের পানি সরবরাহ পর্যন্ত, কীভাবে উন্নত AI সেই বিশ্বস্ত কর্মকর্তাদের প্রতিরক্ষামূলক কাজকে সমর্থন করতে পারে, যারা মানুষের নির্ভরশীল সিস্টেমগুলোর জন্য দায়িত্বশীল, সেগুলো আমরা একসঙ্গে অন্বেষণ করছি.

আমরা আমাদের প্রিপেয়ার্ডনেস ফ্রেমওয়ার্ক⁠(একটি নতুন উইন্ডোতে খোলে)-এর অধীনে GPT‑5.5‑এর জৈবিক/রাসায়নিক এবং সাইবার নিরাপত্তা সক্ষমতাকে উচ্চ হিসেবে বিবেচনা করছি. যদিও GPT‑5.5 সাইবার নিরাপত্তা সক্ষমতার 'ক্রিটিক্যাল' স্তরে পৌঁছায়নি, আমাদের মূল্যায়ন ও পরীক্ষায় দেখা গেছে যে এর সাইবার নিরাপত্তা সক্ষমতা GPT‑5.4‑এর তুলনায় এক ধাপ এগিয়ে.

এছাড়াও, GPT‑5.5 রিলিজের আগে আমাদের পূর্ণাঙ্গ সেফটি ও গভর্ন্যান্স প্রক্রিয়ার মধ্য দিয়ে গেছে, যার মধ্যে ছিল প্রিপেয়ার্ডনেস ইভ্যালুয়েশন, ডোমেইন-স্পেসিফিক টেস্টিং, উন্নত বায়োলজি ও সাইবারসিকিউরিটি সক্ষমতার জন্য নতুন টার্গেটেড ইভ্যালুয়েশন এবং এক্সটার্নাল এক্সপার্টদের সঙ্গে শক্তিশালী টেস্টিং. আমরা GPT‑5.5 সিস্টেম কার্ডে⁠(একটি নতুন উইন্ডোতে খোলে) আরও বিস্তারিত শেয়ার করি.

এই কাজটি AI স্থিতিস্থাপকতা বিষয়ক আমাদের বিস্তৃত পদ্ধতিকে প্রতিফলিত করে, যা মডেলের সক্ষমতা উন্নত হওয়ার সাথে সাথে প্রয়োজন বলে আমরা মনে করি. আমরা চাই শক্তিশালী AI যেন সেইসব মানুষের কাছে সহজলভ্য হয় যারা সিস্টেম, প্রতিষ্ঠান এবং জনগণকে রক্ষা করতে এটি ব্যবহার করছেন. কার্যকর পথটি হলো বিশ্বস্ত অ্যাক্সেস, সক্ষমতার সাথে সামঞ্জস্যপূর্ণ শক্তিশালী সুরক্ষা ব্যবস্থা এবং গুরুতর অপব্যবহার শনাক্ত ও মোকাবিলা করার মতো পরিচালনাগত সক্ষমতা.

উপলব্ধতা ও মূল্য নির্ধারণ

আজ, ChatGPT এবং Codex-এ Plus, Pro, Business ও Enterprise ব্যবহারকারীদের জন্য GPT‑5.5 রোল আউট করা হচ্ছে; এবং ChatGPT‑এ Pro, Business ও Enterprise ব্যবহারকারীদের জন্য GPT‑5.5 Pro রোল আউট করা হচ্ছে. খুব শিগগিরই আমরা GPT‑5.5 এবং GPT‑5.5 Pro API-এ নিয়ে আসব.

ChatGPT‑তে Plus, Pro, Business এবং Enterprise ব্যবহারকারীদের জন্য GPT‑5.5 Thinking উপলভ্য রয়েছে। আরও কঠিন প্রশ্ন এবং আরও উচ্চ-নির্ভুলতার কাজের জন্য ডিজাইন করা GPT‑5.5 Pro, Pro, Business ও Enterprise ব্যবহারকারীদের জন্য উপলভ্য.

Codex-এ, 400K কনটেক্সট উইন্ডোসহ Plus, Pro, Business, Enterprise, Edu এবং Go প্ল্যানগুলোর জন্য GPT‑5.5 উপলভ্য রয়েছে. GPT‑5.5 এছাড়াও Fast mode-এ উপলভ্য, যা 2.5x খরচে 1.5x দ্রুততর টোকেন তৈরি করে.

API ডেভেলপারদের জন্য, gpt-5.5 শিগগিরই Responses API এবং চ্যাট কমপ্লিশন্স API-তে উপলব্ধ হবে, যার মূল্য $5 প্রতি এক মিলিয়ন ইনপুট টোকেন এবং $30 প্রতি এক মিলিয়ন আউটপুট টোকেন, সঙ্গে এক মিলিয়ন কনটেক্সট উইন্ডো. Batch এবং Flex প্রাইসিং স্ট্যান্ডার্ড API রেটের অর্ধেকে উপলব্ধ, আর Priority প্রসেসিং স্ট্যান্ডার্ড রেটের 2.5 গুণে উপলব্ধ. আমরা আরও বেশি নির্ভুলতার জন্য API-তে gpt-5.5-pro প্রকাশ করব, যার দাম $30 প্রতি এক মিলিয়ন ইনপুট টোকেন এবং $180 প্রতি এক মিলিয়ন আউটপুট টোকেন. সম্পূর্ণ বিবরণের জন্য মূল্য নির্ধারণ পৃষ্ঠা⁠ দেখুন.

GPT‑5.4‑এর তুলনায় GPT‑5.5‑এর মূল্য বেশি নির্ধারণ করা হলেও, এটি আরও বুদ্ধিমান এবং অনেক বেশি টোকেন-দক্ষ. Codex-এ, আমরা অভিজ্ঞতাটিকে এমনভাবে টিউন করেছি যাতে GPT‑5.5 অধিকাংশ ব্যবহারকারীর জন্য GPT‑5.4‑এর তুলনায় কম টোকেনে আরও ভালো ফলাফল প্রদান করে, পাশাপাশি সাবস্ক্রিপশন লেভেল জুড়ে উদার ব্যবহারের সুবিধা প্রদান অব্যাহত রাখা হয়েছে.

ইভ্যালুয়েশন

কোডিং

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
SWE-Bench Pro (Public) *	58.6%	57.7%	-	-	64.3%	54.2%
টার্মিনাল-বেঞ্চ 2.0	82.7%	75.1%	-	-	69.4%	68.5%
Expert-SWE (অভ্যন্তরীণ)	73.1%	68.5%	-	-	-	-

^*^{গবেষণাগারগুলো}^{এই মূল্যায়নে}⁠(একটি নতুন উইন্ডোতে খোলে)^{মুখস্থ করার প্রমাণ পেয়েছে}

পেশাদার

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GDPval (জয় বা সমান ফলাফল)	84.9%	83.0%	82.3%	82.0%	80.3%	67.3%
FinanceAgent v1.1	60.0%	56.0%	-	61.5%	64.4%	59.7%
ইনভেস্টমেন্ট ব্যাংকিং মডেলিং কাজসমূহ (অভ্যন্তরীণ)	88.5%	87.3%	88.6%	83.6%	-	-
OfficeQA Pro	54.1%	53.2%	-	-	43.6%	18.1%

কম্পিউটার ব্যবহার এবং ভিশন

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
OSWorld-ভেরিফায়েড	78.7%	75.0%	-	-	78.0%	-
MMMU Pro (টুলস নেই)	81.2%	81.2%	-	-	-	80.5%
MMMU Pro (টুলস সহ)	83.2%	82.1%	-	-	-	-

টুল ব্যবহার

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
BrowseComp	84.4%	82.7%	90.1%	89.3%	79.3%	85.9%
MCP Atlas**	75.3%	70.6%	-	-	79.1%	78.2%
Toolathlon	55.6%	54.6%	-	-	-	48.8%
Tau2-bench Telecom*** (মূল প্রম্পট)	98.0%	92.8%	-	-	-	-

^{** MCP Atlas: সর্বশেষ 2026 এপ্রিল আপডেটের পর Scale AI থেকে প্রাপ্ত ফলাফল.
*** Tau2-bench telecom: মূল প্রম্পটসহ, অর্থাৎ প্রম্পটে কোনো সমন্বয় ছাড়াই 5.5 এবং 5.4-এর ফলাফল. এতে প্রম্পট সমন্বয়সহ মূল্যায়ন করা হয়েছিল এমন অন্যান্য ল্যাবের ফলাফল অন্তর্ভুক্ত করা হয়নি.}

একাডেমিক

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
GeneBench	25.0%	19.0%	33.2%	25.6%	-	-
FrontierMath স্তর এক–তিন	51.7%	47.6%	52.4%	50.0%	43.8%	36.9%
FrontierMath স্তর চার	35.4%	27.1%	39.6%	38.0%	22.9%	16.7%
BixBench	80.5%	74.0%	-	-	-	-
GPQA ডায়মন্ড	93.6%	92.8%	-	94.4%	94.2%	94.3%
মানবতার শেষ পরীক্ষা (কোনো টুল নেই)	41.4%	39.8%	43.1%	42.7%	46.9%	44.4 %
মানবতার শেষ পরীক্ষা (টুলসহ)	52.2%	52.1%	57.2%	58.7%	54.7%	51.4%

সাইবারসিকিউরিটি

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Capture-the-Flags চ্যালেঞ্জ কাজসমূহ (অভ্যন্তরীণ)****	88.1%	83.7%	-	-	-	-
CyberGym	81.8%	79.0%	-	-	73.1%	-

^{**** সিস্টেম কার্ডে ব্যবহৃত সবচেয়ে কঠিন CTF-গুলোর একটি বিস্তৃত রূপ, যেখানে অতিরিক্ত আরও জটিল চ্যালেঞ্জ যুক্ত করা হয়েছে.}

লং-কনটেক্সট

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
Graphwalks BFS 256k f1	73.7%	62.5%	-	-	76.9%	-
Graphwalks BFS 1mil f1	45.4%	9.4%	-	-	41.2% (Opus 4.6)	-
Graphwalks parents 256k f1	90.1%	82.8%	-	-	93.6%	-
Graphwalks parents 1mil f1	58.5%	44.4 %	-	-	72.0% (Opus 4.6)	-
OpenAI MRCR v2 8-needle 4K–8K	98.1%	97.3%	-	-	-	-
OpenAI MRCR v2 8-needle 8K–16K	93.0%	91.4%	-	-	-	-
OpenAI MRCR v2 8-needle 16K-32K	96.5%	97.2%	-	-	-	-
OpenAI MRCR v2 8-needle 32K–64K	90.0%	90.5%	-	-	-	-
OpenAI MRCR v2 8-needle 64K-128K	83.1%	86.0%	-	-	-	-
OpenAI MRCR v2 8-needle 128K-256K	87.5%	79.3%	-	-	59.2%	-
OpenAI MRCR v2 8-needle 256K-512K	81.5%	57.5%	-	-	-	-
OpenAI MRCR v2 8-needle 512K-1M	74.0%	36.6%	-	-	32.2%	-

অবস্থানগত যুক্তি

ইভ্যাল	GPT‑5.5	GPT‑5.4	GPT‑5.5 Pro	GPT‑5.4 Pro	Claude Opus 4.7	Gemini 3.1 Pro
ARC-AGI-1 (Verified)	95.0%	93.7%	-	94.5%	93.5%	98.0%
ARC-AGI-2 (Verified)	85.0%	73.3%	-	83.3%	75.8%	77.1%

GPT‑এর Evals চালানো হয়েছিল যুক্তিপ্রয়োগ প্রচেষ্টা xhigh-এ সেট করে এবং গবেষণার পরিবেশে পরিচালিত হয়েছিল, যা কিছু ক্ষেত্রে প্রোডাকশন ChatGPT থেকে সামান্য ভিন্ন ফলাফল দিতে পারে.