১২ ফেব্রুয়ারি, ২০২৬

উপস্থাপন করা হচ্ছে GPT‑5.3‑Codex‑Spark

Codex-এ রিয়েল-টাইম কোডিংয়ের জন্য একটি অতিদ্রুত মডেল.

লোডিং…

আজ আমরা GPT‑5.3‑Codex‑Spark‑এর একটি গবেষণা প্রিভিউ প্রকাশ করছি, যা GPT‑5.3‑Codex‑এর একটি ছোট সংস্করণ এবং রিয়েল-টাইম কোডিংয়ের জন্য ডিজাইন করা আমাদের প্রথম মডেল. Codex-Spark প্রায় তাৎক্ষণিক মনে হওয়ার জন্য অপ্টিমাইজ করা হয়েছে—বাস্তব জগতের কোডিং কাজের জন্য উচ্চ দক্ষতা বজায় রেখে 15 গুণ দ্রুত জেনারেশন গতি প্রদান করে.

Codex-Spark জানুয়ারিতে আমরা যে Cerebras-এর সঙ্গে অংশীদারিত্ব ঘোষণা করেছিলাম, তার প্রথম মাইলফলককে চিহ্নিত করছে. আমরা ChatGPT Pro ব্যবহারকারীদের জন্য Codex-Spark-কে একটি গবেষণা প্রিভিউ হিসেবে শেয়ার করছি, যাতে ডেভেলপাররা Cerebras-এর সাথে ডেটাসেন্টার সক্ষমতা বাড়ানো, এন্ড-টু-এন্ড অভিজ্ঞতাকে আরও শক্তিশালী করা এবং আমাদের বৃহত্তর অত্যাধুনিক মডেল ডিপ্লয় করার সময় আগেভাগে পরীক্ষা-নিরীক্ষা শুরু করতে পারেন.

আমাদের সর্বশেষ অত্যাধুনিক মডেলগুলি দীর্ঘমেয়াদী কাজ সম্পাদনে বিশেষ দক্ষতা প্রদর্শন করেছে, যা হস্তক্ষেপ ছাড়াই ঘণ্টার পর ঘণ্টা, দিন বা সপ্তাহ ধরে স্বয়ংক্রিয়ভাবে কাজ করতে সক্ষম. Codex-Spark আমাদের প্রথম মডেল, যা বিশেষভাবে Codex-এর সাথে রিয়েল-টাইমে কাজ করার জন্য ডিজাইন করা হয়েছে—লক্ষ্যভিত্তিক সম্পাদনা, লজিক পুনর্গঠন বা ইন্টারফেস পরিমার্জন করা এবং সঙ্গে সঙ্গে ফলাফল দেখা সম্ভব করে. Codex-Spark-এর সাথে, Codex পরিবার এখন দীর্ঘমেয়াদী উচ্চাভিলাষী কাজ এবং তাৎক্ষণিক কাজ সম্পন্ন করা—দুটোই সমর্থন করে. আমরা আশা করি ডেভেলপাররা এটি কিভাবে ব্যবহার করেন তা থেকে শিখব এবং অ্যাক্সেস সম্প্রসারণের সাথে সাথে প্রতিক্রিয়া অন্তর্ভুক্ত করব.

লঞ্চের সময়, Codex-Spark-এর 128 হাজার কন্টেক্সট উইন্ডো রয়েছে এবং এটি শুধুমাত্র টেক্সট-ভিত্তিক. গবেষণা প্রিভিউ চলাকালীন, Codex-Spark-এর নিজস্ব রেট সীমা থাকবে এবং এই ব্যবহারের জন্য স্ট্যান্ডার্ড রেট সীমার মধ্যে গণনা করা হবে না. তবে, যখন চাহিদা বেশি থাকে, তখন আমরা ব্যবহারকারীদের মধ্যে নির্ভরযোগ্যতা বজায় রাখার জন্য কাজ করার সময় আপনি ধীরগতির অ্যাক্সেস বা সাময়িকভাবে অপেক্ষমান সারিতে থাকতে পারেন.

গতি ও বুদ্ধিমত্তা

Codex-Spark ইন্টারঅ্যাকটিভ কাজের জন্য অপ্টিমাইজ করা হয়েছে যেখানে লেটেন্সি এবং বুদ্ধিমত্তা সমানভাবে গুরুত্বপূর্ণ. আপনি মডেলের সাথে অনেকটা রিয়েল-টাইম সহযোগীর মতো কাজ করতে পারেন—এটি কাজ করার সময় আপনি এটিকে বাধা দিতে বা পুনঃনির্দেশ করতে পারেন এবং রোলআউট সম্পূর্ণ হওয়ার জন্য অপেক্ষা না করে দ্রুত পুনরাবৃত্তি করতে পারেন. কারণ এটি গতির জন্য টিউন করা হয়েছে, Codex-Spark তার ডিফল্ট কাজের স্টাইল হালকা রাখে: এটি ন্যূনতম এবং লক্ষ্যভিত্তিক সম্পাদনা করে এবং আপনি না চাইলে স্বয়ংক্রিয়ভাবে পরীক্ষা চালায় না.

কোডিং

Codex-Spark একটি অত্যন্ত সক্ষম ছোট মডেল যা দ্রুত ইনফারেন্সের জন্য অপ্টিমাইজ করা হয়েছে. SWE-Bench Pro এবং Terminal-Bench 2.0, এজেন্টিক সফটওয়্যার ইঞ্জিনিয়ারিং সক্ষমতা মূল্যায়নের জন্য দুটি বেঞ্চমার্ক, GPT‑5.3‑Codex‑Spark GPT‑5.3‑Codex‑এর তুলনায় কম কার্যক্ষমতা প্রদর্শন করে, কিন্তু সময়ের একটি ভগ্নাংশে কাজটি সম্পন্ন করা সম্ভব.

সময়কাল অনুমান করা হয় (1) আউটপুট উৎপাদন সময় (আউটপুট টোকেন ÷ স্যাম্পলিং গতি), (2) প্রিফিল সময় (প্রিফিল টোকেন ÷ প্রিফিল গতি), (3) মোট টুল নির্বাহ সময়, এবং (4) মোট নেটওয়ার্ক ওভারহেডের যোগফল হিসেবে.

সব মডেলের জন্য লেটেন্সি উন্নতি

আমরা যখন Codex-Spark-কে প্রশিক্ষণ দিচ্ছিলাম, তখন এটা স্পষ্ট হয়ে উঠেছিল যে রিয়েল-টাইম সহযোগিতার জন্য মডেলের গতি কেবল সমীকরণের একটি অংশ—আমাদের পুরো অনুরোধ-প্রতিক্রিয়া পাইপলাইনে লেটেন্সি কমানোও প্রয়োজন ছিল. আমরা আমাদের হারনেসে এন্ড-টু-এন্ড লেটেন্সি উন্নতি করেছি, যা সব মডেলের জন্য উপকারী. অভ্যন্তরীণভাবে, আমরা ক্লায়েন্ট থেকে সার্ভার এবং পুনরায় ফিরে প্রতিক্রিয়াগুলোর স্ট্রিমলাইনিং করেছি, আমাদের ইনফারেন্স স্ট্যাকের মূল অংশগুলো পুনর্লিখন করেছি এবং সেশনগুলো কিভাবে ইনিশিয়ালাইজ হয় তা পুনর্গঠন করেছি যাতে প্রথম দৃশ্যমান টোকেন দ্রুত দেখা যায় এবং আপনি বারবার ইটারেট করার সময় Codex সাড়া দেয়. একটি স্থায়ী WebSocket সংযোগের প্রবর্তন এবং Responses API-এর অভ্যন্তরে লক্ষ্যভিত্তিক অপ্টিমাইজেশনের মাধ্যমে, আমরা প্রতি ক্লায়েন্ট/সার্ভার রাউন্ডট্রিপে ওভারহেড 80% কমিয়েছি, প্রতি-টোকেন ওভারহেড 30% কমিয়েছি, এবং প্রথম টোকেন পাওয়ার সময় 50% কমিয়েছি. আপনি যে মডেলই বেছে নিন না কেন, পুরো Codex অভিজ্ঞতা জুড়ে আপনি আরও ঘনিষ্ঠ লুপের অভিজ্ঞতা পাবেন.

Cerebras দ্বারা চালিত

Codex-Spark Cerebras-এর Wafer Scale Engine 3⁠(একটি নতুন উইন্ডোতে খোলে)-এ চলে—উচ্চ-গতির ইনফারেন্সের জন্য বিশেষভাবে তৈরি একটি AI অ্যাক্সিলারেটর, যা Codex-কে ল্যাটেন্সি-প্রথম সার্ভিং স্তর প্রদান করে. আমরা Cerebras-এর সাথে অংশীদারিত্ব করেছি যাতে আমাদের ফ্লিটের বাকি অংশের মতো একই প্রোডাকশন সার্ভিং স্ট্যাকে এই লো-ল্যাটেন্সি পথটি যোগ করা যায়, ফলে এটি Codex জুড়ে নির্বিঘ্নে কাজ করে এবং ভবিষ্যতের মডেলগুলিকে সমর্থন করার জন্য আমাদের প্রস্তুত করে.

“GPT-5.3-Codex-Spark নিয়ে আমাদের সবচেয়ে বেশি উত্তেজিত করে OpenAI এবং ডেভেলপার কমিউনিটির সাথে অংশীদারিত্ব করা, যাতে দ্রুত ইনফারেন্স কী কী সম্ভব করতে পারে তা আবিষ্কার করা যায়—নতুন ইন্টারঅ্যাকশন প্যাটার্ন, নতুন ব্যবহার ক্ষেত্র এবং একটি মৌলিকভাবে ভিন্ন মডেল অভিজ্ঞতা. এই প্রিভিউটি কেবল শুরু মাত্র.”

— শন লি, Cerebras-এর CTO এবং সহ-প্রতিষ্ঠাতা

GPU-গুলি আমাদের প্রশিক্ষণ এবং ইনফারেন্স পাইপলাইনগুলিতে ভিত্তিমূলক ভূমিকা পালন করে এবং বিস্তৃত ব্যবহারের জন্য সবচেয়ে খরচ-সাশ্রয়ী টোকেন প্রদান করে. Cerebras অত্যন্ত কম লেটেন্সি প্রয়োজন এমন ওয়ার্কফ্লোতে উৎকর্ষ প্রদর্শন করে সেই ভিত্তিকে পরিপূরক করে, এন্ড-টু-এন্ড লুপকে আরও শক্তিশালী করে তোলে যাতে আপনি পুনরাবৃত্তি করার সময় Codex আরও প্রতিক্রিয়াশীল মনে হয়.

সহজলভ্যতা এবং বিস্তারিত তথ্য

Codex-Spark আজ লেটেস্ট ভার্সনের Codex অ্যাপ, CLI এবং VS Code এক্সটেনশনে সব ChatGPT Pro ব্যবহারকারীর জন্য একটি গবেষণা প্রিভিউ হিসেবে চালু হচ্ছে. এটি বিশেষায়িত কম-লেটেন্সি হার্ডওয়্যারে চলে বলে, এর ব্যবহার একটি পৃথক রেট সীমার অধীনে নিয়ন্ত্রিত হয়, যা গবেষণা প্রিভিউ চলাকালীন চাহিদার ভিত্তিতে পরিবর্তিত হতে পারে. এছাড়াও, ডেভেলপাররা কিভাবে Codex-Spark তাদের পণ্যে একীভূত করতে চান তা বোঝার জন্য আমরা অল্প কিছু ডিজাইন পার্টনারের জন্য API-তে Codex-Spark উপলব্ধ করছি. আমরা বাস্তব কাজের চাপের অধীনে আমাদের ইন্টিগ্রেশন টিউনিং চালিয়ে যাওয়ার সাথে সাথে আগামী কয়েক সপ্তাহের মধ্যে অ্যাক্সেস বাড়াবো.

Codex-Spark বর্তমানে 128 হাজার কনটেক্সট উইন্ডোতে শুধুমাত্র টেক্সট-ভিত্তিক এবং এটি অতি-দ্রুত মডেলগুলোর একটি পরিবারের প্রথম. ডেভেলপার কমিউনিটির সাথে কোডিংয়ের জন্য দ্রুত মডেলগুলি কোথায় উজ্জ্বল হয় তা সম্পর্কে আমরা যত বেশি শিখি, ততই আমরা আরও বেশি সক্ষমতা উপস্থাপন করব–যার মধ্যে বৃহত্তর মডেল, দীর্ঘতর কন্টেক্সট দৈর্ঘ্য এবং মাল্টিমোডাল ইনপুট অন্তর্ভুক্ত.

Codex-Spark আমাদের মূলধারার মডেলগুলোর মতোই একই সুরক্ষা প্রশিক্ষণ অন্তর্ভুক্ত করে, যার মধ্যে সাইবার-সম্পর্কিত প্রশিক্ষণও অন্তর্ভুক্ত. আমরা আমাদের মানসম্মত মোতায়েন প্রক্রিয়ার অংশ হিসেবে Codex-Spark-কে মূল্যায়ন করেছি, যার মধ্যে সাইবার এবং অন্যান্য সক্ষমতার প্রাথমিক মূল্যায়ন অন্তর্ভুক্ত ছিল; এবং আমরা এই সিদ্ধান্তে পৌঁছেছি যে, সাইবার নিরাপত্তায় উচ্চ সক্ষমতার ক্ষেত্রে আমাদের 'প্রিপেয়ার্ডনেস ফ্রেমওয়ার্ক' (Preparedness Framework)-এর নির্ধারিত সীমা স্পর্শ করার মতো কোনো বাস্তবসম্মত সম্ভাবনা এই মডেলটির নেই.

পরবর্তী পদক্ষেপ

Codex-Spark হলো এমন একটি Codex-এর দিকে প্রথম পদক্ষেপ যাতে দুটি পরিপূরক মোড থাকবে: দীর্ঘমেয়াদী যুক্তিপ্রদান ও বাস্তবায়ন এবং দ্রুত পুনরাবৃত্তির জন্য রিয়েল-টাইম কোলাবরেশন বা তাৎক্ষণিক সহযোগিতা. সময়ের সাথে সাথে, মোডগুলো মিশে যাবে—Codex আপনাকে একটি টাইট ইন্টারঅ্যাকটিভ লুপে রাখতে পারে, একই সাথে ব্যাকগ্রাউন্ডে সাব-এজেন্টদের কাছে দীর্ঘমেয়াদী কাজ ডেলিগেট করতে পারে অথবা আপনি যখন ব্যাপ্তি ও গতি চান তখন অনেক মডেলে সমান্তরালে টাস্ক ছড়িয়ে দিতে পারে, যাতে শুরুতেই আপনাকে একটিমাত্র মোড বেছে নিতে না হয়.

মডেলগুলি আরও সক্ষম হওয়ার সাথে সাথে, ইন্টারঅ্যাকশনের গতি একটি স্পষ্ট বাধা হয়ে দাঁড়ায়. অতি-দ্রুত ইনফারেন্স সেই লুপটিকে আরও শক্ত করে, Codex ব্যবহারকে আরও স্বাভাবিক করে তোলে এবং যে কেউ একটি ধারণাকে কার্যকর সফটওয়্যারে রূপান্তর করতে চায় তাদের জন্য সম্ভাবনার পরিসর প্রসারিত করে.