ChatGPT मधील हेल्थ बुद्धिमत्ता सुधारणे
GPT‑5.5 Instant हे आमच्या मॉडेल्समधील प्रगती आणि डॉक्टरांच्या नेतृत्वाखालील मूल्यमापन यांवर आधारित, हेल्थ क्षेत्रातील अत्याधुनिक बुद्धिमत्ता अधिक लोकांपर्यंत पोहोचवते.
हेल्थ हे ChatGPT चा वापर करण्याच्या सर्वात महत्त्वपूर्ण क्षेत्रांपैकी एक आहे. दर आठवड्याला 23 कोटींहून अधिक लोक हेल्थ आणि आरोग्याशी संबंधित प्रश्नांसाठी ChatGPT ची मदत घेतात; यामध्ये हेल्थविषयक माहिती समजून घेणे, प्रयोगशाळेतील चाचण्यांचे निष्कर्ष (लॅब रिपोर्ट्स) समजून घेणे, डॉक्टरांकडे जाण्यापूर्वीची तयारी करणे, विमा प्रक्रियेची माहिती घेणे, आरोग्यासाठी पूरक सवयी अंगीकारणे आणि पुढील पाऊल काय असावे हे ठरवणे यांसारख्या गोष्टींचा समावेश होतो.
GPT‑5.5 Instant मुळे, आरोग्यविषयक प्रश्नांना हाताळण्याच्या मॉडेलच्या क्षमतेत लक्षणीय प्रगती दिसून येत आहे. यामध्ये तातडीच्या वैद्यकीय मदतीची गरज ओळखणे, संबंधित पार्श्वभूमीची माहिती विचारणे, अनिश्चिततेबद्दल स्पष्टीकरण देणे आणि गुंतागुंतीची माहिती समजण्यास सोपी करणे यांसारख्या सुधारणांचा समावेश आहे. हेल्थआशी संबंधित सर्वात आव्हानात्मक चाचण्यांमध्ये, GPT‑5.5 Instant ची कामगिरी आता अत्याधुनिक 'थिंकिंग मॉडेल्स'च्या बरोबरीची झाली आहे. हे मॉडेल ChatGPT मध्ये मोफत वापरकर्त्यांसाठी उपलब्ध असल्याने, अधिकाधिक लोकांना या सुधारणांचा लाभ घेता येईल. याचा अर्थ असा की, हेल्थविषयक माहिती अधिक सहजपणे समजणे, योग्य प्रश्न विचारता येणे आणि पुढील कृतींबाबत स्पष्टता मिळणे शक्य होईल.
ही प्रगती मॉडेलच्या क्षमतांमधील सुधारणा आणि आमच्या हेल्थ मूल्यांकनांमागील डॉक्टरांच्या नेतृत्वाखालील कार्य या दोन्हींचे प्रतिबिंब आहे. आमच्या सर्व प्रयत्नांमध्ये, डॉक्टरांचे एक जागतिक नेटवर्क मॉडेलच्या प्रतिसादांची उदाहरणे तपासून, आदर्श वर्तनाचे वर्णन करून आणि अपयशाचे प्रकार ओळखून, वास्तविक आरोग्य परिस्थितींमध्ये 'चांगले' म्हणजे काय हे परिभाषित करण्यास मदत करते. डॉक्टरांसोबत काम केल्यामुळे आम्हाला आरोग्यामधील प्रगती मोजण्याचा आणि कालांतराने ChatGPT कसा प्रतिसाद देतो यात सुधारणा करण्याचा एक मार्ग मिळतो.
हेल्थ क्षेत्रातील प्रगती म्हणजे अचूक, समजण्यास सोपे आणि विवेकी निर्णयांवर आधारित प्रतिसाद देणे; यामध्ये अधिक तपशीलाची किंवा संदर्भाची गरज कधी आहे हे ओळखणे, अति-आत्मविश्वास न बाळगता अनिश्चिततेची स्पष्ट कल्पना देणे आणि वैद्यकीय मदत कधी घ्यावी हे समजून घेण्यास लोकांना मदत करणे यांचा समावेश होतो.
त्या प्रगतीचे मोजमाप करण्यासाठी, आम्ही HealthBench आणि HealthBench Professional यांसारख्या हेल्थ-विशिष्ट मूल्यांकनांचा वापर करतो. ही मूल्यांकने अचूकता, सुरक्षितता, संवाद, संदर्भाची जाणीव, परिपूर्णता आणि योग्य वेळी पुढील स्तरावर पाठवणे यांसारख्या गुणांचे मूल्यांकन करण्यासाठी वास्तववादी आरोग्य संभाषणे आणि डॉक्टरांनी लिहिलेल्या निकषांचा वापर करतात.
HealthBench Professional सह हेल्थविषयक विविध मूल्यमापनांच्या एकत्रित आकडेवारीनुसार, GPT‑5.5 Instant ची आरोग्यविषयक कामगिरी आमच्या अद्ययावत 'फ्रंटियर मॉडेल्स'च्या (अत्याधुनिक मॉडेल्सच्या) बरोबरीची आहे; ही GPT‑5.3 Instant च्या तुलनेत झालेली लक्षणीय सुधारणा आहे. 5.5 Instant (मे 2026 मध्ये प्रदर्शित) आणि 5.3 Instant (मार्च 2026 मध्ये प्रदर्शित) ही मॉडेल्स ChatGPT वरील सर्व मोफत वापरकर्त्यांसाठी उपलब्ध आहेत (मर्यादांच्या अधीन राहून), तसेच 5.4 Thinking आणि 5.5 Thinking च्या खर्चाची गणना करण्यासाठी आम्ही API दरांचा वापर करतो.
तुलनेचा आणखी एक भाग म्हणून, आम्ही डॉक्टरांना हेल्थविषयक प्रातिनिधिक संभाषणांसाठी उत्तरे लिहिण्यास सांगितले; यासाठी त्यांना इंटरनेटचा (पण AI चा नाही) वापर करण्याची आणि अमर्यादित वेळ घेण्याची मुभा होती. त्यानंतर, डॉक्टरांच्या एका स्वतंत्र समितीने या उत्तरांची तुलना 'इन्स्टंट' (Instant) मॉडेल्सच्या उत्तरांशी केली. त्यांनी एकूण 3500 उत्तरांचे परीक्षण करताना प्रत्यक्ष संवादात महत्त्वाच्या ठरणाऱ्या विविध पैलूंचा जसे की अचूकता, संवादशैली, माहितीची पूर्णता, सूचनांचे पालन आणि आरोग्यविषयक निर्णय घेण्यास मिळणारी मदत विचार केला.
या मूल्यमापनात, विविध निकषांच्या आधारे GPT‑5.5 च्या तत्काळ प्रतिसादांना, डॉक्टरांनी लिहिलेल्या आणि जुन्या मॉडेल्सच्या प्रतिसादांपेक्षा अधिक चांगली श्रेणी देण्यात आली.
जुने मॉडेल्स आणि प्रत्यक्ष डॉक्टर यांच्या तुलनेत, GPT‑5.5 Instant च्या प्रतिसादांमध्ये त्रुटींचे प्रमाण कमी असल्याचे डॉक्टरांनी नमूद केले. उदाहरणार्थ, स्थानिक आरोग्यसेवेच्या संदर्भाशी जुळवून न घेणे, धोक्याची महत्त्वाची लक्षणे किंवा उपचारांसाठी पुढील संदर्भ देण्याची गरज लक्षात न घेणे, अथवा आवश्यक असताना वापरकर्त्याकडून अतिरिक्त माहिती न मागणे अशा प्रकारच्या त्रुटी GPT‑5.5 Instant च्या बाबतीत जुन्या मॉडेल्स आणि डॉक्टरांच्या तुलनेत कमी प्रमाणात आढळल्या.
हेल्थ क्षेत्रात आमच्या मॉडेल्सच्या वापराची व्याप्ती पाहता, मॉडेल्समधील अलीकडील सुधारणा समजून घेण्याचा आणखी एक मार्ग म्हणजे प्रोडक्शन ट्रॅफिकचे मोजमाप करणे. आरोग्यविषयक प्रतिसादांमधील तथ्यात्मकतेच्या संभाव्य समस्यांचा मागोवा घेण्यासाठी आम्ही प्रोडक्शन ट्रॅफिकवर गोपनीयता-संरक्षक मॉनिटर्स वापरतो. हेल्थ आशी संबंधित अलीकडील उत्पादन ट्रॅफिकच्या तुलनेवर आधारित—दर आठवड्याला अब्जावधी संदेश—किमान एक चिन्हांकित तथ्यात्मकता समस्या असलेल्या प्रतिसादांचे प्रमाण गेल्या दोन महिन्यांत 71% ने कमी झाले आहे.
आरोग्याशी संबंधित वास्तविक प्रश्नांवर वेगवेगळ्या कालखंडांतील मॉडेल्सनी दिलेल्या प्रतिसादांची तुलना केल्यास, हेल्थच्या दृष्टीने महत्त्वाच्या अशा काही बाबींमध्ये ChatGPT मध्ये झालेली सुधारणा दिसून येते; उदाहरणार्थ - एखाद्या परिस्थितीत तातडीने लक्ष देण्याची गरज आहे हे ओळखणे, अनिश्चिततेच्या वेळी अधिक चांगल्या प्रकारे निर्णय घेणे आणि पुढील कृतीबाबत लोकांना अधिक स्पष्ट व उपयुक्त मार्गदर्शन करणे.
GPT-5.2 Instant
अतिरिक्त मॉडेल प्रतिसाद पाहण्यासाठी मॉडेलच्या नावावर क्लिक करा.
ChatGPT मधील हेल्थ प्रतिसाद परिभाषित, मोजून सुधारण्यात आम्हाला मदत करणाऱ्या डॉक्टरांमुळे ही प्रगती घडते.
OpenAI 60 देशांतील, 49 भाषांतील आणि 26 वैद्यकीय विशेषतांतील 260 पेक्षा अधिक डॉक्टरांच्या जागतिक जाळ्यासोबत काम करते. दैनंदिन वेलनेस प्रश्नांपासून अधिक गुंतागुंतीच्या क्लिनिकल परिस्थितींपर्यंत विविध प्रसंगांत हेल्थ प्रश्नांना ChatGPT कसे उत्तर देते, हे त्यांच्या अभिप्रायातून ठरते.
डॉक्टर मॉडेल उत्तरांचे पुनरावलोकन करतात आणि ती अचूक, स्पष्ट, परिपूर्ण, योग्य ती खबरदारी बाळगणारी आणि उपयुक्त आहेत का, याचे मूल्यांकन करतात. एखाद्या उत्तरात महत्त्वाचा संदर्भ राहून गेला आहे का, ते अति-आत्मविश्वासपूर्ण वाटत आहे का, पुढील पावलांबाबत अधिक स्पष्टतेची गरज आहे का, किंवा वैद्यकीय मदत घेण्याबाबत अधिक थेटपणे प्रोत्साहन दिले जावे का, या गोष्टी ओळखण्यास ते मदत करतात.
आतापर्यंत, डॉक्टरांनी 700,000 हून अधिक नमुना-प्रतिसादांचे परीक्षण केले आहे; हे प्रतिसाद प्रत्यक्ष व्यवहारात डॉक्टर आणि रुग्ण ChatGPT चा वापर कसा करू शकतील, हे दर्शवतात. दर काही मिनिटांनी एखादा डॉक्टर नवीन प्रतिसादाचे परीक्षण करतो. त्यांच्या अभिप्रायावरून असे निकष आणि मूल्यमापन पद्धती तयार होतात, ज्यांच्या आधारे संशोधक हे तपासू शकतात की हे प्रतिसाद अचूक, सुरक्षित, स्पष्ट, परिपूर्ण, योग्य ती खबरदारी बाळगणारे आणि प्रत्यक्ष हेल्थविषयक परिस्थितींमध्ये उपयुक्त आहेत की नाही. यामुळे, हे मॉडेल्स कोठे अधिक सुधारत आहेत आणि कोठे अजूनही सुधारणेची आवश्यकता आहे, हे समजणे आम्हाला अधिक स्पष्टपणे शक्य होते.
हे काम OpenAI च्या हेल्थ क्षेत्रातील व्यापक कामालाही पाठबळ देते; यात लोकांना हेल्थ माहिती अधिक चांगल्या प्रकारे समजून घेण्यास आणि तिचा मार्ग काढण्यास मदत करणारी साधने, तसेच चिकित्सकांसाठी तयार केलेली चिकित्सकांसाठी ChatGPT आणि आरोग्यसेवेसाठी OpenAI यांसारखी साधने समाविष्ट आहेत, जी वैद्यकीय व्यावसायिकांना दस्तऐवजीकरण, संशोधन आणि काळजीविषयक सल्लामसलत यांसारख्या कामांत मदत करतात.
मानवी हेल्थ सुधारणे हा AGI च्या सर्वात वैयक्तिक, मूर्त प्रभावांपैकी एक असेल. आमची मॉडेल्स जसजशी सुधारत आहेत, तसतसे आमचे ध्येय ChatGPT अधिक अचूक, अधिक काळजीपूर्वक आणि त्या क्षणांमध्ये अधिक उपयुक्त बनवणे आहे — आणि ती प्रगती अधिकाधिक लोकांपर्यंत पोहोचवत राहणे.


