মূল কনটেন্টে যান
OpenAI

১৩ নভেম্বর, ২০২৫

প্রোডাক্ট

ডেভেলপারদের জন্য GPT‑5.1 পরিচিতি

লোডিং…

আজ আমরা এপিআই প্ল্যাটফর্মে GPT‑5.1 প্রকাশ করছি, GPT‑5 সিরিজের পরবর্তী মডেল যা বিস্তৃত এজেন্টিক এবং কোডিং কাজের জন্য বুদ্ধি এবং গতির ভারসাম্য বজায় রাখে. GPT‑5.1 গতিশীলভাবে কাজের জটিলতার উপর ভিত্তি করে চিন্তাভাবনার সময় মানিয়ে নেয়, যা মডেলটিকে সহজ দৈনন্দিন কাজগুলোতে উল্লেখযোগ্যভাবে দ্রুত এবং আরও token-দক্ষ করে তোলে. GPT‑5.1 এর অগ্রগামী বুদ্ধিমত্তা বজায় রাখার সাথে সাথে গভীর চিন্তাভাবনার প্রয়োজন নেই এমন কাজগুলোতে দ্রুত প্রতিক্রিয়া জানাতে মডেলটিতে একটি “যুক্তিপ্রয়োগবিহীন” মোডও রয়েছে.

GPT‑5.1 কে আরও দক্ষ করার জন্য, আমরা 24 ঘণ্টা পর্যন্ত ক্যাশে ধরে রাখার জন্য বর্ধিত প্রম্পট ক্যাশিং প্রকাশ করছি, যা ফলোআপ প্রশ্নের জন্য দ্রুত প্রতিক্রিয়া প্রদান করবে এবং খরচ কমাবে. আমাদের অগ্রাধিকার প্রক্রিয়াকরণ(একটি নতুন উইন্ডোতে খোলে) গ্রাহকরা GPT‑5 এর তুলনায় GPT‑5.1 এর সাথে লক্ষণীয়ভাবে দ্রুত পারফরম্যান্স অনুভব করবেন.

কোডিংয়ের ক্ষেত্রে, আমরা GPT‑5.1 এর উন্নতির জন্য Cursor, Cognition, Augment Code, Factory এবং Warp-এর মতো স্টার্টআপগুলোর সাথে ঘনিষ্ঠভাবে কাজ করে কোডিং ব্যক্তিত্ব, নিয়ন্ত্রণযোগ্যতা এবং কোডের গুণমান. সাধারণভাবে, কোডিংয়ের জন্য GPT‑5.1 ব্যবহার করা আরও স্বজ্ঞাত মনে হয় এবং এটি ব্যবহারকারীর মুখোমুখি আপডেটগুলোর সাথে আরও যোগাযোগমূলক হয়ে কাজ সম্পন্ন করে.

অবশেষে, আমরা GPT‑5.1‑এর সাথে দুটি নতুন সরঞ্জাম চালু করছি: একটি apply_patch টুল যা কোডকে আরও নির্ভরযোগ্যভাবে সম্পাদনা করার জন্য ডিজাইন করা হয়েছে এবং একটি শেল টুল যা মডেলকে শেল কমান্ড চালানোর সুযোগ দেয়.

GPT‑5.1 হলো GPT‑5 সিরিজের পরবর্তী অগ্রগতি, এবং আমরা নির্মাতাদের নির্ভরযোগ্য এজেন্টিক ওয়ার্কফ্লো তৈরি করতে সহায়তা করার জন্য আরও বুদ্ধিমান এবং সক্ষম মডেলগুলোতে বিনিয়োগ জারি রাখার পরিকল্পনা করি.

বিভিন্ন কাজ জুড়ে দক্ষ যুক্তিপ্রয়োগ

অভিযোজনশীল যুক্তিপ্রয়োগ

GPT‑5.1 দ্রুততর করার জন্য, আমরা যেভাবে এতে চিন্তার প্রশিক্ষণ দিয়েছি তা পুনর্গঠন করেছি. সহজ কাজে, GPT‑5.1 চিন্তাভাবনায় কম token ব্যয় করে, দ্রুততর পণ্যের অভিজ্ঞতা এবং কম token বিল নিশ্চিত করে. অতিরিক্ত চিন্তাভাবনার প্রয়োজন এমন কঠিন কাজগুলোতে, GPT‑5.1 অবিচল থাকে, বিকল্প অন্বেষণ করে এবং নির্ভরযোগ্যতা সর্বাধিক করার জন্য তার কাজ পরীক্ষা করে.

Balyasny Asset Management(একটি নতুন উইন্ডোতে খোলে) বলেছে যে GPT‑5.1 "আমাদের পূর্ণ গতিশীল মূল্যায়ন স্যুটে GPT‑4.1 এবং GPT‑5 উভয়কেই ছাড়িয়ে গেছে, এবং GPT‑5 এর তুলনায় 2-3 গুণ দ্রুত চলেছে." তারা আরও বলেছে যে তাদের সরঞ্জাম-ভারী যুক্তিপ্রয়োগমূলক কাজগুলোতে, GPT‑5.1 "ধারাবাহিকভাবে শীর্ষস্থানীয় প্রতিযোগীদের তুলনায় অনুরূপ বা আরও ভাল মানের জন্য প্রায় অর্ধেক token ব্যবহার করেছে." একইভাবে, এআই ইনস্যুরেন্স বিপিও Pace(একটি নতুন উইন্ডোতে খোলে) মডেলটি পরীক্ষা করেছে এবং বলেছে যে তাদের এজেন্টগুলো "GPT‑5.1 এ 50% দ্রুত চলে এবং আমাদের মূল্যায়নগুলোতে GPT‑5 এবং অন্যান্য শীর্ষস্থানীয় মডেলের নির্ভুলতাকে ছাড়িয়ে যায়."

GPT‑5.1 তার চিন্তা করার সময়কে GPT‑5 এর চেয়ে আরও গতিশীলভাবে পরিবর্তন করে. ChatGPT কাজের একটি প্রতিনিধি বিতরণে, GPT‑5.1 সহজ কাজগুলোতে অনেক দ্রুত, এমনকি উচ্চ যুক্তিপ্রয়োগের প্রচেষ্টাতেও.

উদাহরণস্বরূপ, যখন জিজ্ঞাসা করা হয় "গ্লোবালি ইনস্টল করা প্যাকেজ তালিকাভুক্ত করার জন্য একটি npm কমান্ড দেখাও", GPT‑5.1 10 সেকেন্ডের পরিবর্তে 2 সেকেন্ডের মধ্যে উত্তর দেয়.

GPT-5 (মাঝারি) ~250 token নেয় (~10 সেকেন্ড)

show an npm command to list globally installed packages

npm list -g --depth=0

GPT-5.1 (Medium) ~50 token গ্রহণ করে (~2 সেকেন্ড)

show an npm command to list globally installed packages

You can list globally installed npm packages with:

  • Just package names: npm ls -g --depth=0
  • Including their install paths: npm ls -g

The first one is usually what you want.

নতুন “কোনো যুক্তিপ্রয়োগবিহীন” মোড

নির্মাতারা এখন reasoning_effort-কে 'none' এ সেট করে যুক্তিপ্রয়োগ ছাড়াই GPT‑5.1 ব্যবহার করতে পারবেন. এটি GPT‑5.1 এর উচ্চ বুদ্ধিমত্তা এবং কার্যকর টুল-কলিংয়ের অতিরিক্ত সুবিধা সহ বিলম্ব-সংবেদনশীল ব্যবহারের ক্ষেত্রে মডেলটিকে একটি অযুক্তিক মডেলের মতো আচরণ করতে সক্ষম করে. GPT‑5 এর 'ন্যূনতম' যুক্তিপ্রয়োগের তুলনায়, যুক্তি ছাড়াই GPT‑5.1 সমান্তরাল টুল কলিং (যা নিজেই এন্ড-টু-এন্ড কাজ সমাপ্তির গতি বাড়ায়), কোডিং কাজ, নির্দেশাবলী অনুসরণ এবং অনুসন্ধান সরঞ্জাম ব্যবহারে আরও দক্ষ—এবং আমাদের API প্ল্যাটফর্মে ওয়েব অনুসন্ধান(একটি নতুন উইন্ডোতে খোলে) সহায়তা করে. সিয়েরা(একটি নতুন উইন্ডোতে খোলে) শেয়ার করেছেন যে “যুক্তিপ্রয়োগবিহীন” মোডে GPT‑5.1 তাদের বাস্তব বিশ্বের মূল্যায়নে “GPT‑5 ন্যূনতম যুক্তির তুলনায় লো-লেটেন্সি টুল কলিং পারফরম্যান্সে 20% উন্নতি দেখিয়েছে”.

reasoning_effort মান হিসাবে 'none' প্রবর্তনের সাথে, নির্মাতাদের এখন তাদের ব্যবহার ক্ষেত্রে গতি, খরচ এবং বুদ্ধিমত্তার মধ্যে ভারসাম্য বজায় রাখার জন্য আরও নমনীয়তা এবং নিয়ন্ত্রণ রয়েছে. GPT‑5.1 এর ডিফল্ট 'none', যা ল্যাটেন্সি-সংবেদনশীল কাজের জন্য আদর্শ. আমরা নির্মাতাদের পরামর্শ দিই যে তারা উচ্চ জটিলতার কাজের জন্য 'কম' বা 'মাঝারি' এবং যখন বুদ্ধিমত্তা ও নির্ভরযোগ্যতা গতির চেয়ে বেশি গুরুত্বপূর্ণ, তখন 'উচ্চ' বেছে নিন.

বর্ধিত প্রম্পট ক্যাশিং

বর্ধিত ক্যাশিং আজ সমর্থিত কয়েক মিনিটের পরিবর্তে নির্দেশগুলো 24 ঘণ্টা পর্যন্ত ক্যাশে সক্রিয় থাকার অনুমতি দিয়ে যুক্তিপ্রয়োগ দক্ষতার উন্নতি করে. দীর্ঘতর ধরে রাখার উইন্ডোর মাধ্যমে আরও ফলো-আপ অনুরোধগুলো ক্যাশড প্রসঙ্গ ব্যবহার করতে পারে, যার ফলে মাল্টি-টার্ন চ্যাট, কোডিং সেশন বা জ্ঞান পুনরুদ্ধার ওয়ার্কফ্লো-এর মতো দীর্ঘস্থায়ী ইন্টারঅ্যাকশনগুলোর জন্য কম বিলম্ব, খরচ হ্রাস এবং মসৃণ কর্মক্ষমতা পাওয়া যায়.

নির্দেশ ক্যাশে মূল্যনির্ধারণ অপরিবর্তিত থাকে, যেখানে ক্যাশস্থিত ইনপুট token ৯০% সস্তা আনক্যাশড token-এর চেয়ে, এবং ক্যাশে লেখার বা স্টোরেজের জন্য কোনও অতিরিক্ত চার্জ নেই. GPT‑5.1 এর সাথে বর্ধিত ক্যাশিং ব্যবহার করতে, প্রতিক্রিয়া বা চ্যাট কমপ্লেশন এপিআইতে “prompt_cache_retention='24h'” প্যারামিটারটি যুক্ত করুন. বিস্তারিত জানার জন্য প্রম্পট ক্যাশিং ডকুমেন্টেশন(একটি নতুন উইন্ডোতে খোলে) দেখুন.

কোডিং

GPT‑5.1 GPT‑5 এর কোডিং ক্ষমতার উপর ভিত্তি করে তৈরি, যার মধ্যে রয়েছে আরও স্টিয়ারেবল কোডিং ব্যক্তিত্ব, কম অতিরিক্ত চিন্তাভাবনা, উন্নত কোডের মান, টুল কলের ক্রমগুলোর সময় আরও ভাল ব্যবহারকারী-লক্ষ্যযুক্ত আপডেট বার্তা (প্রিএম্বল) এবং আরও কার্যকরী ফ্রন্টএন্ড ডিজাইন—বিশেষ করে কম যুক্তিপ্রয়োগের প্রচেষ্টায়.

দ্রুত কোড সম্পাদনার মতো সহজ কোডিং কাজে, GPT‑5.1 এর দ্রুত গতি সামনে পিছনে পুনরাবৃত্তি করাকে সহজ করে তোলে. GPT‑5.1 এর সহজ কাজে দ্রুত গতি কঠিন কাজে কর্মক্ষমতা কমায় না. SWE-বেঞ্চ যাচাই করেছে, GPT‑5.1 GPT‑5 এর চেয়ে আরও দীর্ঘ সময় কাজ করে এবং 76.3% এ পৌঁছায়.

SWE-bench Verified⁠ এ, একটি মডেলকে একটি কোড সংগ্রহস্থল এবং ইস্যু বিবরণ দেওয়া হয়, এবং সমস্যাটি সমাধানের জন্য একটি প্যাচ উৎপন্ন করতে হবে. লেবেলগুলো যুক্তিপ্রয়োগের প্রচেষ্টা নির্দেশ করে. সকল 500 সমস্যার উপর সঠিকতার গড় করা হয়. সমস্ত মডেল জেসন-ভিত্তিক apply_patch টুলের সাথে একটি সাজ ব্যবহার করে.

আমরা কয়েকটি কোডিং কোম্পানির কাছ থেকে GPT‑5.1 সম্পর্কে প্রাথমিক প্রতিক্রিয়া পেয়েছি. এখানে তাদের ধারণা উপস্থাপন করা হলো:

  • Augment Code(একটি নতুন উইন্ডোতে খোলে) GPT‑5.1 কে “কম নষ্ট করা ক্রিয়া, আরও দক্ষ যুক্তি এবং আরও ভাল কাজের ফোকাস সহ আরও ইচ্ছাকৃত” বলে অভিহিত করেছে এবং তারা “আরও সঠিক পরিবর্তন, মসৃণ কাজের অনুরোধ এবং মাল্টি-ফাইল প্রকল্পগুলোতে দ্রুত পুনরাবৃত্তি” লক্ষ্য করছে.
  • Cline(একটি নতুন উইন্ডোতে খোলে) তাদের মূল্যায়নে শেয়ার করেছে , “GPT‑5.1 আমাদের ডিফ এডিটিং বেঞ্চমার্কে 7% উন্নতির সাথে SOTA অর্জন করেছে, যা জটিল কোডিং কাজের জন্য অসাধারণ নির্ভরযোগ্যতা প্রদর্শন করে.”
  • CodeRabbit(একটি নতুন উইন্ডোতে খোলে) GPT‑5.1 কে তার “PR পর্যালোচনার জন্য পছন্দের শীর্ষ মডেল” বলে অভিহিত করেছে.
  • Cognition(একটি নতুন উইন্ডোতে খোলে) বলে GPT‑5.1 “আপনি যা জিজ্ঞাসা করছেন তা বোঝার ক্ষেত্রে এবং এটি সম্পন্ন করার জন্য আপনার সাথে কাজ করার ক্ষেত্রে লক্ষণীয়ভাবে ভাল.”
  • Factory(একটি নতুন উইন্ডোতে খোলে) বলেছে, “GPT‑5.1 লক্ষণীয়ভাবে দ্রুত প্রতিক্রিয়া প্রদান করে এবং কাজের সাথে এর যুক্তিপ্রয়োগের গভীরতাকে খাপ খাইয়ে নেয়, অতিরিক্ত চিন্তাভাবনা কমায় এবং সামগ্রিক ডেভেলপার অভিজ্ঞতা উন্নত করে.”
  • Warp(একটি নতুন উইন্ডোতে খোলে) নতুন ব্যবহারকারীদের জন্য GPT‑5.1 কে ডিফল্ট হিসেবে নির্ধারণ করে বলেছে এটি “GPT‑5 সিরিজের প্রবর্তিত চিত্তাকর্ষক বুদ্ধিমত্তা অর্জনের উপর ভিত্তি করে তৈরি, এবং এটি একটি অনেক বেশি প্রতিক্রিয়াশীল মডেল.”
"GPT 5.1 কেবলই আরেকটি LLM নয়—এটি সত্যিই এজেন্টিক, সবচেয়ে স্বাভাবিকভাবে স্বায়ত্তশাসিত মডেল যা আমি কখনও পরীক্ষা করেছি. এটি আপনার মতো লেখে, আপনার মতো কোড করে, অনায়াসে জটিল নির্দেশাবলী অনুসরণ করে এবং ফ্রন্ট-এন্ড কাজগুলোতে শ্রেষ্ঠত্ব অর্জন করে, আপনার বিদ্যমান কোডবেসে সুন্দরভাবে মানিয়ে যায়. আপনি সত্যিই প্রতিক্রিয়া এপিআইতে এর সম্পূর্ণ সম্ভাবনা আনলক করতে পারেন এবং আমরা এটি আমাদের আইডিইতে যুক্ত করতে পেরে আনন্দিত. "
— ডেনিস শিরায়েভ, এআই ডেভটুলস ইকোসিস্টেমের প্রধান, JetBrains

GPT‑5.1‑এ নতুন টুল

আমরা প্রতিক্রিয়া এপিআই-তে ডেভেলপারদের মডেল থেকে সর্বাধিক সুবিধা পেতে GPT‑5.1 এর সাথে দুটি নতুন সরঞ্জাম চালু করছি: JSON এসকেপ প্রয়োজন ছাড়াই কোড সম্পাদনাকে আরও নির্ভরযোগ্য করার জন্য একটি ফ্রিফর্ম apply_patch সরঞ্জাম এবং একটি শেল সরঞ্জাম যা মডেলকে আপনার স্থানীয় মেশিনে চালানোর জন্য কমান্ড লিখতে দেয়.

Apply_patch টুল

ফ্রিফর্ম apply_patch টুলটি GPT‑5.1 কে কাঠামোগত diff ব্যবহার করে কোডবেসে ফাইল তৈরি করুন, আপডেট এবং মুছুন. শুধু সম্পাদনার পরামর্শ দেওয়ার পরিবর্তে, মডেলটি প্যাচ অপারেশন নির্গত করে যা একটি অ্যাপ্লিকেশন প্রয়োগ করে এবং পুনরায় রিপোর্ট করে, পুনরাবৃত্তিমূলক, বহু-ধাপের কোড সম্পাদনা কার্যপ্রবাহ সক্ষম করে.

প্রতিক্রিয়া API-তে apply_patch টুলটি ব্যবহার করতে, এটি "tools": [{“type”: “apply_patch”}] সহ টুলস অ্যারেতে অন্তর্ভুক্ত করুন এবং আপনার ইনপুটে ফাইলের বিষয়বস্তু অন্তর্ভুক্ত করুন অথবা আপনার ফাইল সিস্টেমের সাথে ইন্টারঅ্যাক্ট করার জন্য মডেলকে সরঞ্জাম দিন. মডেলটি আপনার ফাইল সিস্টেমে প্রয়োগ করার জন্য ডিফ-যুক্ত ফাইল তৈরি করা, আপডেট বা মুছার জন্য apply_patch_call আইটেম উৎপন্ন করবে. apply_patch টুলের সাথে কীভাবে ইন্টিগ্রেট করবেন সে সম্পর্কে আরও তথ্যের জন্য, আমাদের ডেভেলপার ডকুমেন্টেশন(একটি নতুন উইন্ডোতে খোলে) দেখুন.

শেল টুল

শেল টুলটি একটি নিয়ন্ত্রিত কমান্ড-লাইন ইন্টারফেসের মাধ্যমে স্থানীয় কম্পিউটারের সাথে মডেলকে যোগাযোগ করতে সক্ষম করে. মডেলটি শেল কমান্ড প্রস্তাব করে; একজন নির্মাতার ইন্টিগ্রেশন সেগুলো কার্যকর করে এবং আউটপুট প্রদান করে. এটি একটি সহজ পরিকল্পনা-সম্পাদন লুপ তৈরি করে যা মডেলগুলোকে সিস্টেম পরিদর্শন করতে, ইউটিলিটি চালাতে এবং কাজটি শেষ না হওয়া পর্যন্ত ডেটা সংগ্রহ করতে দেয়.

প্রতিক্রিয়া API-তে শেল টুলটি ব্যবহার করতে, নির্মাতারা এটিকে "tools": [{“type”: “shell”}] সহ tools অ্যারেতে অন্তর্ভুক্ত করতে পারেন. এপিআই "shell_call" আইটেম উৎপন্ন করবে যা কার্যকর করার জন্য শেল কমান্ডগুলো অন্তর্ভুক্ত করবে. ডেভেলপারগণ স্থানীয় পরিবেশে কমান্ডগুলো কার্যকর করেন এবং পরবর্তী API অনুরোধে "shell_call_output" আইটেমে এক্সিকিউশন ফলাফলগুলো ফেরৎ পাঠান. আমাদের নির্মাতা ডকুমেন্টেশনে(একটি নতুন উইন্ডোতে খোলে) আরও জানুন.

প্রাইসিং এবং অ্যাভেইলেবিলিটি

GPT‑5.1 এবং gpt-5.1-চ্যাট-latest এপিআই-এর সমস্ত প্রদত্ত স্তরে নির্মাতাদের জন্য উপলব্ধ. মূল্যনির্ধারণ এবং হারের সীমা(একটি নতুন উইন্ডোতে খোলে) GPT‑5 এর সমান. আমরা gpt-5.1-codex ও প্রকাশ করছি এবং API-তে gpt-5.1-codex-mini . যদিও GPT‑5.1 বেশিরভাগ কোডিং কাজেই উৎকৃষ্ট, GPT‑5.1‑codex মডেলগুলো কোডেক্স বা কোডেক্স-সদৃশ সাজে দীর্ঘমেয়াদী, এজেন্টিক কোডিং কাজগুলো জন্য অপ্টিমাইজ করা হয়েছে.

ডেভেলপারগণ আমাদের GPT‑5.1 ডেভেলপার ডকুমেন্টেশন(একটি নতুন উইন্ডোতে খোলে) এবং মডেল প্রম্পটিং গাইড(একটি নতুন উইন্ডোতে খোলে) ব্যবহার করে নির্মাণ শুরু করতে পারেন. আমরা বর্তমানে API-তে GPT‑5 অবলুপ্ত করার পরিকল্পনা করছি না এবং যদি এবং যখন আমরা এটি করার সিদ্ধান্ত নিই, তখন নির্মাতাদের আগাম নোটিশ দেব.

পরবর্তী পদক্ষেপ

আমরা বাস্তব এজেন্টিক এবং কোডিং কাজের জন্য সবচেয়ে সক্ষম, নির্ভরযোগ্য মডেল পুনরাবৃত্তিমূলকভাবে স্থাপন করতে প্রতিশ্রুতিবদ্ধ—এমন মডেল যা দক্ষতার সাথে চিন্তা করে, দ্রুত পুনরাবৃত্তি করে এবং জটিল কাজগুলো পরিচালনা করে ডেভেলপারদের প্রবাহে রাখে. অভিযোজিত যুক্তিপ্রয়োগ, শক্তিশালী কোডিং পারফরম্যান্স, পরিষ্কার ব্যবহারকারী-মুখী আপডেট এবং apply_patchshell এর মতো নতুন সরঞ্জামগুলোর সাথে, GPT‑5.1 আপনাকে স্বল্পায়াসে বিল্ড করতে সহায়তা করার জন্য ডিজাইন করা হয়েছে. এবং আমরা এখানে প্রচুর বিনিয়োগ জারি রাখছি: আপনি আগামী সপ্তাহ এবং মাসগুলোতে আরও সক্ষম এজেন্টিক এবং কোডিং মডেলগুলো আশা করতে পারেন.

পরিশিষ্ট: মডেল ইভ্যালুয়েশন

মূল্যায়ন

GPT‑5.1 (উচ্চ)

GPT‑5 (উচ্চ)

SWE-বেঞ্চ যাচাইকৃত
(সকল 500টি সমস্যা)

76.3%

72.8%

GPQA ডায়মন্ড
(কোনও সরঞ্জাম নেই)

88.1%

85.7%

AIME 2025
(কোনও সরঞ্জাম নেই)

94.0%

94.6%

ফ্রন্টিয়ারম্যাথ
(পাইথন টুল সহ)

26.7%

26.3%

MMMU

85.4%

84.2%

টাউ2-বেঞ্চ এয়ারলাইন

67.0%

62.6%

Tau2-বেঞ্চ টেলিকম*

95.6%

96.7%

টাউ2-বেঞ্চ খুচরা বিক্রয়

77.9%

81.1%

BrowseComp Long প্রসঙ্গ 128k

90.0%

90.0%

* টাউ2-বেঞ্চ টেলিকমের জন্য, আমরা GPT‑5.1 এর কর্মক্ষমতা উন্নত করতে একটি সংক্ষিপ্ত, সাধারণভাবে সহায়ক প্রম্পট দিয়েছি.