Покращення інтелекту у сфері здоров’я в ChatGPT
GPT‑5.5 Instant надає більшій кількості людей доступ до передового інтелекту у сфері здоров’я завдяки розвитку наших моделей та оцінюванню під керівництвом лікарів.
Здоров’я — одна з найважливіших сфер, у яких люди використовують ChatGPT. Щотижня понад 230 мільйонів людей звертаються до ChatGPT по допомогу з питаннями здоров’я й добробуту: щоб розібратися в медичній інформації, зрозуміти результати аналізів, підготуватися до прийому, зорієнтуватися в страхуванні, сформувати здоровіші звички й визначити, про що запитати далі.
Із GPT‑5.5 Instant ми бачимо суттєвий крок уперед у тому, як модель опрацьовує питання про здоров’я: краще розпізнає ситуації, коли може знадобитися невідкладна допомога, запитує релевантний контекст, пояснює невизначеність і робить складну інформацію зрозумілішою. У наших найскладніших оцінюваннях у сфері здоров’я GPT‑5.5 Instant тепер демонструє рівень, порівнянний із нашими передовими моделями Thinking. Оскільки вона доступна безплатним користувачам у ChatGPT, більше людей можуть скористатися цими покращеннями. Це може означати зрозумілішу медичну інформацію, кращі запитання й чіткі наступні кроки.
Цей прогрес відображає як розвиток можливостей моделей, так і роботу над нашими оцінюваннями у сфері здоров’я, яку очолюють лікарі. У межах цієї роботи глобальна мережа лікарів допомагає визначати, що означає «добре» в реальних ситуаціях, пов’язаних зі здоров’ям: вони переглядають приклади відповідей моделі, описують ідеальну поведінку та виявляють типові помилки. Співпраця з лікарями дає нам змогу вимірювати прогрес у сфері здоров’я й поступово покращувати відповіді ChatGPT.
У сфері здоров’я прогрес означає надання відповідей, які є точними, зрозумілими й спираються на зважене судження: розпізнають, коли потрібен додатковий контекст, пояснюють невизначеність без перебільшення впевненості та допомагають людям зрозуміти, коли варто звернутися по медичну допомогу.
Щоб вимірювати цей прогрес, ми використовуємо спеціалізовані оцінювання для сфери здоров’я, зокрема HealthBench і HealthBench Professional. У цих оцінюваннях застосовуються реалістичні розмови про здоров’я та рубрики, написані лікарями, щоб оцінити такі якості, як точність, безпека, комунікація, врахування контексту, повнота й доречне спрямування до фахівця.
GPT‑5.5 Instant досягає ефективності у сфері здоров’я, подібної до наших найновіших передових моделей, за сукупністю оцінювань у сфері здоров’я, зокрема HealthBench Professional, суттєво покращившись порівняно з GPT‑5.3 Instant. 5.5 Instant (випущена в травні 2026 року) і 5.3 Instant (випущена в березні 2026 року) доступні всім безкоштовним користувачам у ChatGPT (з урахуванням обмежень), а для розрахунку вартості 5.4 Thinking і 5.5 Thinking ми використовуємо ціни API.
Для ще одного порівняння ми також попросили лікарів написати відповіді для репрезентативних розмов про здоров’я — без обмеження часу та з доступом до інтернету (але без ШІ). Потім окрема група лікарів порівнювала ці відповіді лікарів із відповідями моделей Instant у різні періоди, аналізуючи якості, важливі в реальних взаємодіях, зокрема точність, комунікацію, повноту, дотримання інструкцій і корисність для ухвалення рішень щодо здоров’я, загалом у 3500 перевірених відповідях.
У цьому оцінюванні відповіді GPT‑5.5 Instant отримали вищі оцінки за різними вимірами, ніж відповіді, написані лікарями, і відповіді старіших моделей.
Лікарі оцінили відповіді GPT‑5.5 Instant як такі, що мають менше типових помилок, ніж відповіді старіших моделей і лікарів. Наприклад, у GPT 5.5 Instant було менше випадків, коли відповідь не адаптувалася до місцевого контексту охорони здоров’я, пропускала тривожні ознаки чи потребу звернутися по допомогу або не запитувала в користувача додатковий контекст, коли це було потрібно, ніж у старіших моделей і лікарів.
З огляду на масштаби використання наших моделей у сфері здоров’я, ще один спосіб зрозуміти нещодавні покращення моделі — вимірювати продакшн-трафік. Ми використовуємо монітори продакшн-трафіку із захистом приватності, щоб відстежувати можливі проблеми з фактичною точністю у відповідях про здоров’я. За результатами порівняння нещодавнього продакшн-трафіку у сфері здоров’я — мільярдів повідомлень на тиждень — частка відповідей із принаймні однією позначеною проблемою фактичної точності за останні два місяці знизилася на 71%.
Порівняння відповідей моделей у різні моменти часу на реальні питання про здоров’я показує, як ChatGPT покращився в аспектах, важливих для здоров’я: розпізнає ситуації, які можуть потребувати невідкладної уваги, зваженіше працює з невизначеністю й дає людям чіткіші та корисніші поради щодо подальших дій.
GPT-5.2 Instant
Натисніть на назву моделі, щоб побачити додаткові відповіді моделі.
Цей прогрес формують лікарі, які допомагають нам визначати, вимірювати й покращувати якість відповідей ChatGPT щодо здоров’я.
OpenAI співпрацює з глобальною мережею з понад 260 лікарів у 60 країнах, 49 мовах і 26 медичних спеціальностях. Їхні відгуки впливають на те, як ChatGPT відповідає на питання про здоров’я в широкому спектрі сценаріїв — від повсякденних питань про добробут до складніших клінічних ситуацій.
Лікарі переглядають приклади відповідей моделі й оцінюють, чи є вони точними, зрозумілими, повними, належно обережними та корисними. Вони допомагають виявляти, де відповідь може не врахувати важливий контекст, де вона може звучати надто впевнено, де має чіткіше пояснювати наступні кроки або більш прямо заохочувати людину звернутися по медичну допомогу.
На сьогодні лікарі переглянули понад 700 000 прикладів відповідей моделі, що відображають, як клініцисти й пацієнти можуть використовувати ChatGPT у реальному світі. Кожні кілька хвилин лікар переглядає нову відповідь. Їхні відгуки стають рубриками та критеріями оцінювання, які допомагають дослідникам вимірювати, чи є відповіді точними, безпечними, зрозумілими, повними, належно обережними й корисними в реальних ситуаціях, пов’язаних зі здоров’ям. Це дає нам чіткіший спосіб бачити, у чому моделі стають кращими, а де над ними ще потрібно працювати.
Ця робота також підтримує ширші зусилля OpenAI у сфері здоров’я — від інструментів, які допомагають людям краще розуміти медичну інформацію та орієнтуватися в ній, до інструментів для клініцистів, як-от ChatGPT for Clinicians і OpenAI for Healthcare, що допомагають медичним фахівцям із такими завданнями, як документація, дослідження й консультації щодо медичної допомоги.
Покращення здоров’я людей стане одним із найбільш особистих і відчутних впливів AGI. У міру того як наші моделі й надалі вдосконалюються, наша мета — зробити ChatGPT точнішим, обережнішим і кориснішим у такі моменти та й далі доносити цей прогрес до більшої кількості людей.


