ChatGPT‑এ হেলথ-ইন্টেলিজেন্সের উন্নতি
GPT‑5.5 Instant আমাদের মডেলের অগ্রগতি ও চিকিৎসক-নেতৃত্বাধীন মূল্যায়নের ভিত্তিতে আরও বেশি মানুষের কাছে অত্যাধুনিক হেলথ-ইন্টেলিজেন্স পৌঁছে দেয়.
মানুষ ChatGPT যেভাবে ব্যবহার করে, তার সবচেয়ে অর্থবহ ক্ষেত্রগুলোর একটি হলো স্বাস্থ্য. প্রতি সপ্তাহে 23 কোটিরও বেশি মানুষ স্বাস্থ্য ও সুস্থতা-সংক্রান্ত প্রশ্নে সহায়তার জন্য ChatGPT ব্যবহার করেন: স্বাস্থ্য-তথ্য বোঝা, ল্যাবের ফলাফল বুঝে নেওয়া, অ্যাপয়েন্টমেন্টের প্রস্তুতি, বীমা-সংক্রান্ত বিষয় সামলানো, স্বাস্থ্যকর অভ্যাস গড়ে তোলা, এবং এরপর কী জিজ্ঞাসা করা উচিত তা ঠিক করা.
GPT‑5.5 Instant-এর মাধ্যমে স্বাস্থ্য-সংক্রান্ত প্রশ্ন মডেলটি কীভাবে সামলায়, তাতে আমরা বড় অগ্রগতি দেখছি: কখন জরুরি চিকিৎসার প্রয়োজন হতে পারে তা শনাক্ত করা, প্রাসঙ্গিক প্রেক্ষাপট জানতে চাওয়া, অনিশ্চয়তা ব্যাখ্যা করা, এবং জটিল তথ্য সহজে বোঝানো—এসব ক্ষেত্রে উন্নতি হয়েছে. আমাদের সবচেয়ে কঠিন স্বাস্থ্য মূল্যায়নগুলোতে GPT‑5.5 Instant এখন আমাদের অত্যাধুনিক Thinking মডেলগুলোর কাছাকাছি পর্যায়ের পারফরম্যান্স দেখায়. ChatGPT‑এ এটি বিনামূল্যের ব্যবহারকারীদের জন্যও উপলভ্য হওয়ায় আরও বেশি মানুষ এসব উন্নতির সুফল পেতে পারেন. এর অর্থ হতে পারে স্বাস্থ্য-তথ্য আরও সহজে বোঝা, আরও ভালো প্রশ্ন করা, এবং পরবর্তী পদক্ষেপ পরিষ্কারভাবে জানা.
এই অগ্রগতি মডেলের সক্ষমতার উন্নতি এবং আমাদের স্বাস্থ্য মূল্যায়নের পেছনে চিকিৎসক-নেতৃত্বাধীন কাজ—দুটোকেই প্রতিফলিত করে. আমাদের বিভিন্ন উদ্যোগে, বাস্তব স্বাস্থ্য-পরিস্থিতিতে “ভালো” বলতে কী বোঝায় তা নির্ধারণে সারা বিশ্বের চিকিৎসকদের একটি নেটওয়ার্ক সহায়তা করে—তারা মডেলের উদাহরণস্বরূপ উত্তর পর্যালোচনা করেন, আদর্শ আচরণ বর্ণনা করেন, এবং ব্যর্থতার ধরন শনাক্ত করেন. চিকিৎসকদের সঙ্গে কাজ করার ফলে স্বাস্থ্যক্ষেত্রে অগ্রগতি মাপার এবং সময়ের সঙ্গে ChatGPT কীভাবে উত্তর দেয় তা উন্নত করার একটি উপায় আমরা পাই.
স্বাস্থ্যক্ষেত্রে অগ্রগতি মানে এমন উত্তর দেওয়া, যা সঠিক, বোধগম্য এবং সুবিবেচনার ওপর ভিত্তি করে: কখন আরও প্রেক্ষাপট দরকার তা বোঝা, আত্মবিশ্বাস অতিরঞ্জিত না করে অনিশ্চয়তা ব্যাখ্যা করা, এবং কখন চিকিৎসা নিতে হবে তা মানুষকে বুঝতে সাহায্য করা.
এই অগ্রগতি মাপতে আমরা HealthBench এবং HealthBench Professional-সহ স্বাস্থ্য-নির্দিষ্ট মূল্যায়ন ব্যবহার করি. এসব মূল্যায়নে বাস্তবসম্মত স্বাস্থ্য-আলাপ এবং চিকিৎসক-লিখিত রুব্রিক ব্যবহার করে নির্ভুলতা, নিরাপত্তা, যোগাযোগ, প্রেক্ষাপট-সচেতনতা, পূর্ণতা, এবং প্রয়োজনমতো উচ্চতর সহায়তার দিকে পাঠানোর মতো গুণাবলি যাচাই করা হয়.
স্বাস্থ্য মূল্যায়নের সমষ্টিগত ফলাফলে, HealthBench Professional-সহ, GPT‑5.5 Instant আমাদের সর্বশেষ সর্বাধুনিক মডেলগুলোর কাছাকাছি স্বাস্থ্য পারফরম্যান্সে পৌঁছেছে, যা GPT‑5.3 Instant থেকে উল্লেখযোগ্য উন্নতি. 5.5 Instant (মে 2026-এ প্রকাশিত) এবং 5.3 Instant (মার্চ 2026-এ প্রকাশিত) ChatGPT‑এর সব বিনামূল্যের ব্যবহারকারীর জন্য উপলভ্য (সীমা প্রযোজ্য), এবং 5.4 Thinking ও 5.5 Thinking-এর খরচ হিসাব করতে আমরা API মূল্য ব্যবহার করি.
আরেকটি তুলনা হিসেবে, আমরা চিকিৎসকদের প্রতিনিধিত্বমূলক স্বাস্থ্য-আলাপের জন্য উত্তর লিখতে বলেছিলাম, যেখানে সময়ের সীমা ছিল না এবং ইন্টারনেট ব্যবহারের সুযোগ ছিল (তবে AI ব্যবহারের সুযোগ ছিল না). এরপর চিকিৎসকদের একটি আলাদা প্যানেল সময়ের সঙ্গে Instant মডেলগুলোর উত্তরের সঙ্গে এসব চিকিৎসক-লিখিত উত্তর তুলনা করেন; বাস্তব পারস্পরিক যোগাযোগে যেসব গুণ গুরুত্বপূর্ণ—যেমন নির্ভুলতা, যোগাযোগ, পূর্ণতা, নির্দেশনা অনুসরণ, এবং স্বাস্থ্য-সিদ্ধান্তে সহায়কতা—সেগুলো পর্যালোচনা করা হয়, মোট 3500টি উত্তর দেখে.
এই মূল্যায়নে বিভিন্ন মাত্রায় GPT‑5.5 Instant-এর উত্তর চিকিৎসক-লিখিত এবং পুরোনো মডেলের উত্তরের চেয়ে বেশি রেটিং পেয়েছে.
চিকিৎসকরা মূল্যায়ন করেছেন যে GPT‑5.5 Instant-এর উত্তরে পুরোনো মডেল ও চিকিৎসকদের উত্তরের তুলনায় ব্যর্থতার ধরন কম ছিল. যেমন, পুরোনো মডেল ও চিকিৎসকদের তুলনায় GPT 5.5 Instant-এ স্থানীয় স্বাস্থ্যসেবা-প্রেক্ষাপট অনুযায়ী উত্তর না সাজানো, সতর্কসংকেত বা চিকিৎসাসেবার কাছে রেফার করার বিষয় বাদ দেওয়া, বা প্রয়োজন হলে ব্যবহারকারীর কাছ থেকে অতিরিক্ত প্রেক্ষাপট জানতে না চাওয়ার ঘটনা কম ছিল.
স্বাস্থ্যক্ষেত্রে আমাদের মডেলগুলোর ব্যবহার যে পরিসরে হচ্ছে, সাম্প্রতিক মডেল উন্নতি বোঝার আরেকটি উপায় হলো প্রোডাকশন ট্রাফিক মাপা. স্বাস্থ্য-সংক্রান্ত উত্তরে সম্ভাব্য তথ্যগত সমস্যা ট্র্যাক করতে আমরা প্রোডাকশন ট্রাফিকে গোপনীয়তা-সংরক্ষণকারী মনিটর ব্যবহার করি. স্বাস্থ্যক্ষেত্রে সাম্প্রতিক প্রোডাকশন ট্রাফিক—প্রতি সপ্তাহে শত শত কোটি বার্তা—তুলনা করে দেখা গেছে, অন্তত একটি চিহ্নিত তথ্যগত সমস্যা থাকা উত্তরের হার গত দুই মাসে 71% কমেছে.
বাস্তব স্বাস্থ্য-প্রশ্নে সময়ের ভিন্ন ভিন্ন মুহূর্তে মডেলগুলোর উত্তর তুলনা করলে দেখা যায়, স্বাস্থ্যক্ষেত্রে গুরুত্বপূর্ণ দিকগুলোতে ChatGPT কীভাবে উন্নত হয়েছে: কোনো পরিস্থিতিতে জরুরি নজরদারি দরকার হতে পারে তা শনাক্ত করা, আরও ভালো বিচারে অনিশ্চয়তা সামলানো, এবং এরপর কী করা উচিত সে বিষয়ে মানুষকে আরও পরিষ্কার ও কার্যকর দিকনির্দেশনা দেওয়া.
GPT-5.2 Instant
অতিরিক্ত মডেল উত্তর দেখতে মডেলের নামে ক্লিক করুন.
এই অগ্রগতি গড়ে উঠেছে চিকিৎসকদের সহায়তায়, যারা ChatGPT‑এ স্বাস্থ্য-সংক্রান্ত উত্তর সংজ্ঞায়িত, মাপা এবং উন্নত করতে আমাদের সাহায্য করেন.
OpenAI 60টি দেশ, 49টি ভাষা এবং 26টি চিকিৎসা-বিশেষত্বজুড়ে 260 জনেরও বেশি চিকিৎসকের একটি বৈশ্বিক নেটওয়ার্কের সঙ্গে কাজ করে. দৈনন্দিন সুস্থতা-সংক্রান্ত প্রশ্ন থেকে শুরু করে আরও জটিল ক্লিনিক্যাল পরিস্থিতি পর্যন্ত নানা ক্ষেত্রে স্বাস্থ্য-প্রশ্নে ChatGPT কীভাবে উত্তর দেয়, তাদের মতামত তা সমৃদ্ধ করে.
চিকিৎসকরা মডেলের উদাহরণস্বরূপ উত্তর পর্যালোচনা করেন এবং সেগুলো সঠিক, পরিষ্কার, পূর্ণাঙ্গ, যথাযথভাবে সতর্ক এবং কার্যকর কি না তা মূল্যায়ন করেন. তারা শনাক্ত করতে সাহায্য করেন কোথায় কোনো উত্তর গুরুত্বপূর্ণ প্রেক্ষাপট এড়িয়ে যেতে পারে, কোথায় তা অতিরিক্ত আত্মবিশ্বাসী শোনাতে পারে, কোথায় পরবর্তী পদক্ষেপ আরও পরিষ্কার হওয়া উচিত, বা কোথায় কাউকে চিকিৎসা নিতে আরও সরাসরি উৎসাহিত করা উচিত.
এ পর্যন্ত চিকিৎসকরা 700,000টিরও বেশি উদাহরণস্বরূপ মডেল উত্তর পর্যালোচনা করেছেন, যা বাস্তব দুনিয়ায় চিকিৎসক ও রোগীরা কীভাবে ChatGPT ব্যবহার করতে পারেন তা প্রতিফলিত করে. প্রতি কয়েক মিনিটে একজন চিকিৎসক একটি নতুন উত্তর পর্যালোচনা করেন. তাদের মতামত রুব্রিক ও মূল্যায়ন-মানদণ্ডে রূপ নেয়, যা গবেষকদের মাপতে সাহায্য করে বাস্তব স্বাস্থ্য-পরিস্থিতিতে উত্তরগুলো সঠিক, নিরাপদ, পরিষ্কার, পূর্ণাঙ্গ, যথাযথভাবে সতর্ক এবং কার্যকর কি না. এর ফলে আমরা আরও পরিষ্কারভাবে দেখতে পারি কোথায় মডেলগুলো উন্নত হচ্ছে এবং কোথায় এখনও কাজ বাকি.
এই কাজ স্বাস্থ্যক্ষেত্রে OpenAI-এর বৃহত্তর উদ্যোগকেও সহায়তা করে—যার মধ্যে আছে মানুষকে স্বাস্থ্য-তথ্য আরও ভালোভাবে বুঝতে ও ব্যবহার করতে সাহায্যকারী টুল, পাশাপাশি চিকিৎসকদের জন্য তৈরি টুল, যেমন চিকিৎসকদের জন্য ChatGPT এবং স্বাস্থ্যসেবার জন্য OpenAI; এগুলো ডকুমেন্টেশন, গবেষণা এবং চিকিৎসা-পরামর্শের মতো কাজে চিকিৎসা-পেশাজীবীদের সহায়তা করে.
মানুষের স্বাস্থ্য উন্নত করা AGI-এর সবচেয়ে ব্যক্তিগত ও স্পষ্ট প্রভাবগুলোর একটি হবে. আমাদের মডেলগুলো উন্নত হতে থাকলে, আমাদের লক্ষ্য হলো এসব গুরুত্বপূর্ণ মুহূর্তে ChatGPT‑কে আরও নির্ভুল, আরও সতর্ক এবং আরও কার্যকর করা—এবং সেই অগ্রগতি আরও বেশি মানুষের কাছে পৌঁছে দেওয়া.


