Унапређење здравствене интелигенције у услузи ChatGPT
GPT‑5.5 Instant доноси граничну здравствену интелигенцију већем броју људи, обликовану напретком наших модела и евалуацијом коју воде лекари.
Здравље је један од најзначајнијих начина на које људи користе ChatGPT. Сваке недеље више од 230 милиона људи обраћа се услузи ChatGPT за помоћ у вези са питањима о здрављу и добробити: како да разумеју здравствене информације, резултате лабораторијских анализа, да се припреме за прегледе, снађу у осигурању, изграде здравије навике и схвате шта следеће да питају.
Уз модел GPT‑5.5 Instant видимо значајан искорак у томе како модел обрађује здравствена питања, уз побољшања у препознавању ситуација када може бити потребна хитна нега, тражењу релевантног контекста, објашњавању неизвесности и поједностављивању сложених информација. На нашим најзахтевнијим здравственим евалуацијама, GPT‑5.5 Instant сада постиже ниво упоредив са нашим граничним моделима Thinking. Пошто је доступан бесплатним корисницима у услузи ChatGPT, више људи може да има користи од ових побољшања. То може да значи здравствене информације које је лакше разумети, боља питања која треба поставити и јасне следеће кораке.
Тај напредак одражава и унапређења способности модела и рад који су предводили лекари у оквиру наших здравствених евалуација. У свим нашим напорима, глобална мрежа лекара помаже да се дефинише како изгледа „добро” у стварним здравственим ситуацијама, прегледајући примере одговора модела, описујући идеално понашање и идентификујући начине на које одговори могу да подбаце. Рад са лекарима омогућава нам да меримо напредак у здравству и да временом побољшавамо начин на који ChatGPT одговара.
У здравству напредак значи пружање одговора који су тачни, разумљиви и засновани на доброј процени: препознавање када је потребно више контекста, објашњавање неизвесности без преувеличавања самопоуздања и помагање људима да разумеју када треба да потраже негу.
Да бисмо измерили тај напредак, користимо евалуације специфичне за здравство, укључујући HealthBench и HealthBench Professional. Ове евалуације користе реалистичне здравствене разговоре и рубрике које су написали лекари како би процениле квалитете као што су тачност, безбедност, комуникација, свест о контексту, потпуност и одговарајуће ескалације.
GPT‑5.5 Instant достиже здравствене перформансе сличне нашим најновијим граничним моделима на збирном скупу здравствених евалуација, укључујући HealthBench Professional, уз значајно побољшање у односу на GPT‑5.3 Instant. Модели 5.5 Instant (објављен у мају 2026) и 5.3 Instant (објављен у марту 2026) доступни су свим бесплатним корисницима у услузи ChatGPT (у оквиру ограничења), а цене API-ја користимо за израчунавање трошка за моделе 5.4 Thinking и 5.5 Thinking.
Као још једно поређење, замолили смо и лекаре да напишу одговоре за репрезентативне здравствене разговоре, уз неограничено време и приступ интернету (али не и AI). Затим је посебан панел лекара упоређивао те лекарске одговоре са моделима Instant током времена, прегледајући квалитете који су важни у стварним интеракцијама, укључујући тачност, комуникацију, потпуност, праћење упутстава и корисност за здравствене одлуке, у оквиру 3500 прегледаних одговора.
Одговори модела GPT‑5.5 Instant оцењени су оценом вишом од одговора које су написали лекари и одговора старијих модела у свим димензијама ове евалуације.
Лекари су оценили да одговори модела GPT‑5.5 Instant имају мање начина да подбаце него одговори старијих модела и лекара. Нпр. модел GPT 5.5 Instant је имао мање случајева неприлагођавања локалном здравственом контексту, пропуштања знакова за узбуну или упућивања на негу, као и пропуста да од корисника затражи додатни контекст када је потребан, у поређењу и са старијим моделима и са лекарима.
С обзиром на обим коришћења наших модела у здравству, још један начин да се разумеју недавна побољшања модела јесте мерење продукционог саобраћаја. Користимо мониторе који чувају приватност на продукционом саобраћају како бисмо пратили могуће проблеме са фактичком тачношћу у здравственим одговорима. На основу поређења недавног продукционог саобраћаја у здравству – милијарди порука недељно – стопа одговора са најмање једним означеним проблемом фактичке тачности пала је за 71% у последња два месеца.
Поређење одговора модела из различитих тренутака на стварна здравствена питања показује како је услуга ChatGPT побољшала на начине који су важни за здравље: препознаје када ситуација може захтевати хитну пажњу, боље процењује неизвесност и људима даје јасније, корисније смернице о томе шта да ураде следеће.
GPT-5.2 Instant
Кликните на назив модела да бисте видели додатне одговоре модела.
Овај напредак обликују лекари који нам помажу да дефинишемо, меримо и побољшавамо здравствене одговоре у услузи ChatGPT.
OpenAI сарађује са глобалном мрежом од више од 260 лекара у 60 земаља, на 49 језика и у 26 медицинских специјалности. Њихове повратне информације утичу на то како ChatGPT одговара на здравствена питања у широком распону сценарија, од свакодневних питања о добробити до сложенијих клиничких ситуација.
Лекари прегледају примере одговора модела и процењују да ли су тачни, јасни, потпуни, примерено опрезни и корисни. Они помажу да се утврди где одговор може да пропусти важан контекст, где може звучати превише самоуверено, где би требало јасније да наведе следеће кораке или директније да подстакне некога да потражи медицинску негу.
До сада су лекари прегледали више од 700.000 примера одговора модела који одражавају како клиничари и пацијенти могу да користе ChatGPT у стварном свету. На сваких неколико минута лекар прегледа нови одговор. Њихове повратне информације постају рубрике и критеријуми евалуације који помажу истраживачима да мере да ли су одговори тачни, безбедни, јасни, потпуни, примерено опрезни и корисни у стварним здравственим ситуацијама. То нам даје јаснији начин да видимо где модели постају бољи, а где им је и даље потребан рад.
Овај рад такође подржава шире напоре привредног друштва OpenAI у здравству, обухватајући алате који помажу људима да боље разумеју здравствене информације и снађу се у њима, као и алате направљене за клиничаре, као што су ChatGPT за клиничаре и OpenAI за здравство, који подржавају медицинске стручњаке у задацима као што су документација, истраживање и консултације о нези.
Унапређење људског здравља биће један од најличнијих и најопипљивијих утицаја AGI-ја. Како наши модели настављају да се побољшавају, наш циљ је да услуга ChatGPT буде тачнија, пажљивија и кориснија у тим тренуцима – и да тај напредак наставимо да доносимо већем броју људи.


