ChatGPT में स्वास्थ्य बुद्धिमत्ता को बेहतर बनाना
GPT‑5.5 Instant हमारी मॉडल प्रगति और चिकित्सक-नेतृत्व वाले मूल्यांकन से आकार लेकर अग्रणी स्वास्थ्य बुद्धिमत्ता को अधिक लोगों तक पहुँचाता है.
स्वास्थ्य उन सबसे अर्थपूर्ण तरीकों में से एक है जिनमें लोग ChatGPT का उपयोग करते हैं. हर हफ़्ते, 23 करोड़ से ज़्यादा लोग स्वास्थ्य और वेलनेस से जुड़े सवालों में मदद के लिए ChatGPT का रुख करते हैं: स्वास्थ्य जानकारी समझना, लैब नतीजों को जानना, अपॉइंटमेंट की तैयारी करना, बीमा समझना, स्वस्थ आदतें बनाना, और यह तय करना कि आगे क्या पूछना है.
GPT‑5.5 Instant के साथ, हम देख रहे हैं कि मॉडल स्वास्थ्य सवालों को संभालने में एक बड़ा कदम आगे बढ़ा है: कब तुरंत देखभाल की ज़रूरत हो सकती है यह पहचानने, प्रासंगिक संदर्भ पूछने, अनिश्चितता समझाने, और जटिल जानकारी को आसान बनाने में सुधार हुआ है. हमारे सबसे कठिन स्वास्थ्य मूल्यांकनों पर, GPT‑5.5 Instant अब हमारे अग्रणी Thinking मॉडल के बराबर स्तर पर प्रदर्शन करता है. क्योंकि यह ChatGPT में मुफ़्त उपयोगकर्ताओं के लिए उपलब्ध है, इसलिए इन सुधारों का लाभ ज़्यादा लोगों तक पहुँच सकता है. इसका मतलब हो सकता है ऐसी स्वास्थ्य जानकारी जो समझने में आसान हो, पूछने के लिए बेहतर सवाल हों, और अगले कदम साफ़ हों.
यह प्रगति मॉडल क्षमताओं में हुए सुधार और हमारे स्वास्थ्य मूल्यांकनों के पीछे चिकित्सकों के नेतृत्व में हुए काम, दोनों को दर्शाती है. हमारे प्रयासों में, चिकित्सकों का एक वैश्विक नेटवर्क वास्तविक स्वास्थ्य स्थितियों में “अच्छा” कैसा दिखता है यह तय करने में मदद करता है: उदाहरण मॉडल जवाबों की समीक्षा करके, आदर्श व्यवहार का वर्णन करके, और विफलता पैटर्न की पहचान करके. चिकित्सकों के साथ काम करने से हमें स्वास्थ्य में प्रगति मापने और समय के साथ ChatGPT के जवाबों को बेहतर बनाने का तरीका मिलता है.
स्वास्थ्य में प्रगति का मतलब ऐसे जवाब देना है जो सटीक, समझने योग्य और अच्छे विवेक पर आधारित हों: कब अधिक संदर्भ चाहिए यह पहचानना, भरोसा बढ़ा-चढ़ाकर बताए बिना अनिश्चितता समझाना, और लोगों को यह समझने में मदद करना कि देखभाल कब लेनी चाहिए.
उस प्रगति को मापने के लिए, हम HealthBench और HealthBench Professional सहित स्वास्थ्य-विशेष मूल्यांकनों का उपयोग करते हैं. ये मूल्यांकन सटीकता, सुरक्षा, संचार, संदर्भ की समझ, पूर्णता, और उचित रूप से आगे बढ़ाने जैसे गुणों को परखने के लिए वास्तविक स्वास्थ्य बातचीत और चिकित्सकों द्वारा लिखे गए रूब्रिक का उपयोग करते हैं.
GPT‑5.5 Instant स्वास्थ्य मूल्यांकनों के समग्र परिणाम पर, जिसमें HealthBench Professional भी शामिल है, हमारे नवीनतम अग्रणी मॉडल जैसा स्वास्थ्य प्रदर्शन हासिल करता है, और GPT‑5.3 Instant की तुलना में काफ़ी सुधार दिखाता है. 5.5 Instant (मई 2026 में जारी) और 5.3 Instant (मार्च 2026 में जारी) ChatGPT में सभी मुफ़्त उपयोगकर्ताओं के लिए उपलब्ध हैं (सीमाओं के अधीन), और हम 5.4 Thinking और 5.5 Thinking की लागत की गणना के लिए API मूल्य निर्धारण का उपयोग करते हैं.
एक और तुलना के रूप में, हमने चिकित्सकों से प्रतिनिधि स्वास्थ्य बातचीत के लिए जवाब लिखने को भी कहा, बिना समय-सीमा और इंटरनेट तक पहुँच के साथ (लेकिन AI के बिना). फिर चिकित्सकों के एक अलग पैनल ने समय के साथ इन चिकित्सक-लिखित जवाबों की तुलना Instant मॉडल से की, और वास्तविक बातचीत में मायने रखने वाले गुणों की समीक्षा की, जिनमें सटीकता, संचार, पूर्णता, निर्देशों का पालन और स्वास्थ्य निर्णय में उपयोगिता शामिल थे, कुल 3500 समीक्षा किए गए जवाबों में.
इस मूल्यांकन में GPT‑5.5 Instant के जवाबों को चिकित्सक-लिखित और पुराने मॉडल जवाबों की तुलना में सभी आयामों पर अधिक रेटिंग मिली.
चिकित्सकों ने GPT‑5.5 Instant के जवाबों में पुराने मॉडल और चिकित्सकों के जवाबों की तुलना में कम विफलता पैटर्न पाए. उदाहरण के लिए, पुराने मॉडल और चिकित्सकों, दोनों की तुलना में GPT 5.5 Instant में स्थानीय स्वास्थ्य सेवा संदर्भ के अनुसार जवाब न ढालने, चेतावनी संकेतों या देखभाल के लिए रेफ़रल को चूकने, या ज़रूरत पड़ने पर उपयोगकर्ता से अतिरिक्त संदर्भ न माँगने के मामले कम थे.
स्वास्थ्य में हमारे मॉडल के उपयोग के पैमाने को देखते हुए, हाल के मॉडल सुधारों को समझने का एक और तरीका लाइव उपयोग ट्रैफिक को मापना है. हम स्वास्थ्य जवाबों में संभावित तथ्यात्मकता समस्याओं को ट्रैक करने के लिए लाइव उपयोग ट्रैफिक पर गोपनीयता-संरक्षित मॉनिटर का उपयोग करते हैं. स्वास्थ्य में हाल के लाइव उपयोग ट्रैफिक की तुलना के आधार पर, जो हर हफ़्ते अरबों संदेशों का है, कम से कम एक चिह्नित तथ्यात्मकता समस्या वाले जवाबों की दर पिछले दो महीनों में 71% घट गई है.
वास्तविक स्वास्थ्य सवालों पर अलग-अलग समय के मॉडल के जवाबों की तुलना दिखाती है कि ChatGPT स्वास्थ्य के लिए मायने रखने वाले तरीकों से कैसे बेहतर हुआ है: कब किसी स्थिति पर तुरंत ध्यान देने की ज़रूरत हो सकती है यह पहचानना, अनिश्चितता को बेहतर विवेक के साथ संभालना, और लोगों को आगे क्या करना है इस बारे में अधिक स्पष्ट और उपयोगी मार्गदर्शन देना.
GPT-5.2 Instant
अतिरिक्त मॉडल जवाब देखने के लिए मॉडल के नाम पर क्लिक करें.
यह प्रगति उन चिकित्सकों से आकार लेती है जो ChatGPT में स्वास्थ्य जवाबों को परिभाषित, मापने और बेहतर बनाने में हमारी मदद करते हैं.
OpenAI 60 देशों, 49 भाषाओं और 26 चिकित्सा विशेषज्ञताओं में फैले 260 से अधिक चिकित्सकों के वैश्विक नेटवर्क के साथ काम करता है. उनकी प्रतिक्रिया यह दिशा देती है कि ChatGPT रोज़मर्रा के वेलनेस सवालों से लेकर अधिक जटिल क्लिनिकल स्थितियों तक, कई तरह के परिदृश्यों में स्वास्थ्य सवालों के जवाब कैसे देता है.
चिकित्सक उदाहरण मॉडल जवाबों की समीक्षा करते हैं और आकलन करते हैं कि वे सटीक, स्पष्ट, पूर्ण, उचित रूप से सावधान और उपयोगी हैं या नहीं. वे यह पहचानने में मदद करते हैं कि किसी जवाब में कहाँ महत्वपूर्ण संदर्भ छूट सकता है, कहाँ वह ज़रूरत से ज़्यादा आत्मविश्वासी लग सकता है, कहाँ अगले कदम अधिक स्पष्ट होने चाहिए, या कहाँ किसी को चिकित्सा देखभाल लेने के लिए अधिक सीधे प्रोत्साहित करना चाहिए.
अब तक, चिकित्सकों ने 700,000 से अधिक उदाहरण मॉडल जवाबों की समीक्षा की है, जो यह दर्शाते हैं कि वास्तविक दुनिया में क्लिनिशियन और मरीज़ ChatGPT का उपयोग कैसे कर सकते हैं. हर कुछ मिनट में, एक चिकित्सक किसी नए जवाब की समीक्षा करता है. उनकी प्रतिक्रिया रूब्रिक और मूल्यांकन मानदंडों में बदलती है, जो शोधकर्ताओं को यह मापने में मदद करते हैं कि वास्तविक स्वास्थ्य स्थितियों में जवाब सटीक, सुरक्षित, स्पष्ट, पूर्ण, उचित रूप से सावधान और उपयोगी हैं या नहीं. इससे हमें अधिक स्पष्ट रूप से देखने का तरीका मिलता है कि मॉडल कहाँ बेहतर हो रहे हैं और कहाँ अभी भी काम की ज़रूरत है.
यह काम स्वास्थ्य में OpenAI के व्यापक कार्य को भी समर्थन देता है, जिसमें ऐसे टूल शामिल हैं जो लोगों को स्वास्थ्य जानकारी बेहतर ढंग से समझने और नेविगेट करने में मदद करते हैं, साथ ही क्लिनिशियनों के लिए बनाए गए टूल भी, जैसे क्लिनिशियनों के लिए ChatGPT और स्वास्थ्य सेवा के लिए OpenAI, जो चिकित्सा पेशेवरों को दस्तावेज़ीकरण, शोध, और देखभाल परामर्श जैसे कामों में सहायता देते हैं.
मानव स्वास्थ्य को बेहतर बनाना AGI के सबसे निजी और ठोस प्रभावों में से एक होगा. जैसे-जैसे हमारे मॉडल बेहतर होते रहेंगे, हमारा लक्ष्य उन पलों में ChatGPT को अधिक सटीक, अधिक सावधान और अधिक उपयोगी बनाना है, और उस प्रगति को अधिक लोगों तक पहुँचाते रहना है.


