تحسين الذكاء الصحي في ChatGPT
يجلب GPT‑5.5 Instant ذكاءً صحيًا متقدمًا إلى مزيد من الناس، بفضل تطور نماذجنا وتقييم يقوده الأطباء.
الصحة من أكثر الطرق التي يستخدم بها الناس ChatGPT أهمية. كل أسبوع، يلجأ أكثر من 230 مليون شخص إلى ChatGPT طلبًا للمساعدة في أسئلة الصحة والعافية: فهم المعلومات الصحية، واستيعاب نتائج التحاليل، والتحضير للمواعيد، والتعامل مع التأمين، وبناء عادات صحية أفضل، ومعرفة السؤال التالي الذي ينبغي طرحه.
مع GPT‑5.5 Instant، نرى تقدمًا كبيرًا في طريقة تعامل النموذج مع الأسئلة الصحية، من خلال تحسينات في التعرّف على الحالات التي قد تتطلب رعاية عاجلة، وطلب السياق ذي الصلة، وشرح مواضع عدم اليقين، وتبسيط المعلومات المعقدة. في أصعب تقييماتنا الصحية، يحقق GPT‑5.5 Instant الآن أداءً يضاهي مستوى نماذج Thinking المتقدمة لدينا. ولأنه متاح للمستخدمين المجانيين في ChatGPT، يمكن لعدد أكبر من الناس الاستفادة من هذه التحسينات. وقد يعني ذلك معلومات صحية أسهل فهمًا، وأسئلة أفضل لطرحها، وخطوات تالية واضحة.
يعكس هذا التقدم كلاً من التطورات في قدرات النموذج والعمل الذي يقوده الأطباء وراء تقييماتنا الصحية. وعبر جهودنا، تساعد شبكة عالمية من الأطباء في تحديد معنى أن تكون الاستجابة «جيدة» في المواقف الصحية الواقعية، من خلال مراجعة أمثلة على استجابات النموذج، ووصف السلوك المثالي، وتحديد أنماط الإخفاق. يتيح لنا العمل مع الأطباء طريقة لقياس التقدم في الصحة وتحسين كيفية استجابة ChatGPT بمرور الوقت.
في مجال الصحة، يعني التقدم تقديم استجابات دقيقة ومفهومة ومبنية على تقدير سليم: التعرّف على الحالات التي تحتاج إلى سياق إضافي، وشرح عدم اليقين من دون المبالغة في الثقة، ومساعدة الناس على فهم متى ينبغي طلب الرعاية.
ولقياس هذا التقدم، نستخدم تقييمات مخصصة للصحة، منها HealthBench وHealthBench Professional. تستخدم هذه التقييمات محادثات صحية واقعية ومعايير تقييم يكتبها الأطباء لتقييم سمات مثل الدقة والسلامة والتواصل والوعي بالسياق والشمولية والتصعيد المناسب.
يحقق GPT‑5.5 Instant أداءً صحيًا مشابهًا لأحدث نماذجنا المتقدمة في مجموع من التقييمات الصحية، بما في ذلك HealthBench Professional، مع تحسن كبير عن GPT‑5.3 Instant. يتوفر 5.5 Instant (أُطلق في مايو 2026) و5.3 Instant (أُطلق في مارس 2026) لجميع المستخدمين المجانيين في ChatGPT (وفقًا للقيود)، ونستخدم تسعير API لحساب تكلفة 5.4 Thinking و5.5 Thinking.
وللمقارنة أيضًا، طلبنا من أطباء كتابة ردود لمحادثات صحية تمثيلية، مع وقت غير محدود وإمكانية الوصول إلى الإنترنت (لكن من دون AI). ثم قارنت لجنة مستقلة من الأطباء هذه الردود التي كتبها الأطباء مع نماذج Instant عبر الزمن، وراجعت السمات المهمة في التفاعلات الحقيقية، بما في ذلك الدقة والتواصل والشمولية واتباع التعليمات ومدى المساعدة في اتخاذ القرارات الصحية، وذلك عبر 3500 استجابة تمت مراجعتها.
حصلت استجابات GPT‑5.5 Instant على تقييمات أعلى من الردود التي كتبها الأطباء ومن استجابات النماذج الأقدم عبر أبعاد هذا التقييم.
قيّم الأطباء استجابات GPT‑5.5 Instant بأنها تحتوي على أنماط إخفاق أقل من استجابات النماذج الأقدم والأطباء. على سبيل المثال، سجّل GPT 5.5 Instant حالات أقل من عدم التكيّف مع سياق الرعاية الصحية المحلي، أو تفويت علامات الإنذار أو الإحالة إلى الرعاية، أو الإخفاق في طلب سياق إضافي من المستخدم عند الحاجة، مقارنةً بكل من النماذج الأقدم والأطباء.
ونظرًا إلى حجم استخدام نماذجنا في الصحة، هناك طريقة أخرى لفهم التحسينات الأخيرة في النموذج، وهي قياس حركة الاستخدام الفعلية. نستخدم أدوات رصد تحافظ على الخصوصية في حركة الاستخدام الفعلية لتتبّع المشكلات المحتملة في صحة الحقائق ضمن الاستجابات الصحية. استنادًا إلى مقارنة لحركة الاستخدام الفعلية الحديثة في الصحة — مليارات الرسائل أسبوعيًا — انخفض معدل الاستجابات التي تتضمن مشكلة واحدة على الأقل مُعلَّمة في صحة الحقائق بنسبة 71% خلال الشهرين الماضيين.
تُظهر مقارنة استجابات النماذج في مراحل زمنية مختلفة عبر أسئلة صحية واقعية كيف تحسّن ChatGPT بطرق مهمة للصحة: التعرّف على الحالات التي قد تحتاج إلى اهتمام عاجل، والتعامل مع عدم اليقين بتقدير أفضل، وتقديم إرشادات أوضح وأكثر فائدة للناس حول ما ينبغي فعله بعد ذلك.
GPT-5.2 Instant
انقر على اسم النموذج لرؤية استجابات إضافية للنموذج.
يتشكل هذا التقدم بفضل أطباء يساعدوننا في تحديد الاستجابات الصحية في ChatGPT وقياسها وتحسينها.
تعمل OpenAI مع شبكة عالمية تضم أكثر من 260 طبيبًا في 60 دولة و49 لغة و26 تخصصًا طبيًا. تسهم ملاحظاتهم في توجيه كيفية استجابة ChatGPT للأسئلة الصحية عبر مجموعة واسعة من السيناريوهات، من أسئلة العافية اليومية إلى الحالات السريرية الأكثر تعقيدًا.
يراجع الأطباء أمثلة على استجابات النموذج ويقيّمون ما إذا كانت دقيقة وواضحة وكاملة وحذرة على نحو مناسب ومفيدة. ويساعدون في تحديد المواضع التي قد تغفل فيها الاستجابة سياقًا مهمًا، أو تبدو واثقة أكثر من اللازم، أو تحتاج إلى توضيح أكبر للخطوات التالية، أو إلى تشجيع الشخص بشكل مباشر أكثر على طلب الرعاية الطبية.
حتى اليوم، راجع الأطباء أكثر من 700,000 مثال لاستجابات النموذج تعكس كيفية استخدام الأطباء والمرضى لـ ChatGPT في العالم الحقيقي. كل بضع دقائق، يراجع طبيب استجابة جديدة. وتتحول ملاحظاتهم إلى معايير تقييم ومقاييس تساعد الباحثين على قياس ما إذا كانت الاستجابات دقيقة وآمنة وواضحة وكاملة وحذرة على نحو مناسب ومفيدة في المواقف الصحية الواقعية. وهذا يمنحنا طريقة أوضح لمعرفة المواضع التي تتحسن فيها النماذج والمواضع التي لا تزال بحاجة إلى عمل.
يدعم هذا العمل أيضًا جهود OpenAI الأوسع في الصحة، التي تشمل أدوات تساعد الناس على فهم المعلومات الصحية والتعامل معها على نحو أفضل، إلى جانب أدوات مخصصة للأطباء، مثل ChatGPT للأطباء وOpenAI للرعاية الصحية، والتي تدعم المهنيين الطبيين في مهام مثل التوثيق والبحث واستشارات الرعاية.
سيكون تحسين صحة الإنسان أحد أكثر آثار الذكاء الاصطناعي العام (AGI) شخصيةً وملموسية. ومع استمرار تحسن نماذجنا، يتمثل هدفنا في جعل ChatGPT أكثر دقة وحذرًا وفائدة في تلك اللحظات — ومواصلة إيصال هذا التقدم إلى عدد أكبر من الناس.


