Veselības intelekta uzlabošana ChatGPT
GPT‑5.5 Instant nodrošina vadoša līmeņa veselības intelektu vairāk cilvēkiem, ko veido mūsu modeļu attīstība un ārstu vadīts novērtējums.
Veselība ir viens no nozīmīgākajiem veidiem, kā cilvēki izmanto ChatGPT. Ik nedēļu vairāk nekā 230 miljoni cilvēku vēršas pie ChatGPT pēc palīdzības veselības un labsajūtas jautājumos: lai izprastu veselības informāciju, saprastu analīžu rezultātus, sagatavotos vizītēm, orientētos apdrošināšanā, veidotu veselīgākus paradumus un noskaidrotu, ko jautāt tālāk.
Ar GPT‑5.5 Instant mēs redzam būtisku soli uz priekšu tajā, kā modelis risina veselības jautājumus: tas labāk atpazīst, kad var būt vajadzīga neatliekama aprūpe, uzdod jautājumus par būtisku kontekstu, skaidro nenoteiktību un sarežģītu informāciju padara vieglāk saprotamu. Mūsu sarežģītākajos veselības novērtējumos GPT‑5.5 Instant tagad sasniedz līmeni, kas ir salīdzināms ar mūsu vadošajiem Thinking modeļiem. Tā kā tas ir pieejams bezmaksas lietotājiem ChatGPT, no šiem uzlabojumiem var gūt labumu vairāk cilvēku. Tas var nozīmēt vieglāk saprotamu veselības informāciju, labākus jautājumus, ko uzdot, un skaidrus nākamos soļus.
Šis progress atspoguļo gan modeļu spēju attīstību, gan ārstu vadīto darbu, kas ir mūsu veselības novērtējumu pamatā. Visos mūsu centienos globāls ārstu tīkls palīdz noteikt, kā reālās veselības situācijās izskatās „labs” rezultāts: pārskata modeļa atbilžu piemērus, apraksta vēlamo rīcību un nosaka kļūmju veidus. Sadarbība ar ārstiem ļauj mums mērīt progresu veselības jomā un laika gaitā uzlabot ChatGPT atbildes.
Veselības jomā progress nozīmē sniegt atbildes, kas ir precīzas, saprotamas un balstītas labā spriedumā: atpazīt, kad vajadzīgs plašāks konteksts, skaidrot nenoteiktību, nepārspīlējot pārliecību, un palīdzēt cilvēkiem saprast, kad meklēt aprūpi.
Lai mērītu šo progresu, mēs izmantojam veselībai specifiskus novērtējumus, tostarp HealthBench un HealthBench Professional. Šajos novērtējumos izmanto reālistiskas sarunas par veselību un ārstu rakstītas rubrikas, lai vērtētu tādas īpašības kā precizitāte, drošums, komunikācija, konteksta izpratne, pilnīgums un atbilstoša eskalācija.
GPT‑5.5 Instant veselības sniegums veselības novērtējumu kopumā, tostarp HealthBench Professional, sasniedz mūsu jaunāko vadošo modeļu līmenim līdzīgus rezultātus, būtiski uzlabojoties salīdzinājumā ar GPT‑5.3 Instant. 5.5 Instant (izlaists 2026. gada maijā) un 5.3 Instant (izlaists 2026. gada martā) ir pieejami visiem ChatGPT bezmaksas lietotājiem (ievērojot ierobežojumus), un izmaksas 5.4 Thinking un 5.5 Thinking aprēķinām, izmantojot API cenas.
Kā vēl vienu salīdzinājumu mēs lūdzām ārstiem uzrakstīt atbildes reprezentatīvām sarunām par veselību, dodot neierobežotu laiku un piekļuvi internetam (bet ne AI). Pēc tam atsevišķa ārstu grupa salīdzināja šīs ārstu atbildes ar Instant modeļiem dažādos laika posmos, pārskatot reālās mijiedarbībās būtiskas īpašības, tostarp precizitāti, komunikāciju, pilnīgumu, norādījumu ievērošanu un palīdzību veselības lēmumu pieņemšanā, kopumā izvērtējot 3500 atbildes.
GPT‑5.5 Instant atbildes šajā novērtējumā dažādās dimensijās tika novērtētas augstāk nekā ārstu rakstītas un vecāku modeļu atbildes.
Ārsti novērtēja GPT‑5.5 Instant atbildes kā tādas, kurām ir mazāk kļūmju veidu nekā vecāku modeļu un ārstu atbildēm. Piemēram, GPT 5.5 Instant retāk nekā gan vecāki modeļi, gan ārsti nepielāgoja atbildes vietējam veselības aprūpes kontekstam, palaida garām brīdinājuma pazīmes vai nosūtīšanu uz aprūpi vai, kad vajadzīgs, necentās iegūt papildu kontekstu no lietotāja.
Ņemot vērā mūsu modeļu lietojuma mērogu veselības jomā, vēl viens veids, kā izprast nesenos modeļu uzlabojumus, ir mērīt reālās lietošanas datplūsmu. Mēs izmantojam privātumu saglabājošus monitorus reālās lietošanas datplūsmā, lai izsekotu iespējamām faktoloģiskām problēmām veselības atbildēs. Salīdzinot neseno reālās lietošanas datplūsmu veselības jomā — miljardiem ziņojumu nedēļā —, atbilžu īpatsvars ar vismaz vienu atzīmētu faktoloģisku problēmu pēdējo divu mēnešu laikā ir samazinājies par 71%.
Salīdzinot modeļu atbildes dažādos laika brīžos uz reāliem veselības jautājumiem, redzams, kā ChatGPT ir uzlabojies veselībai būtiskos veidos: tas atpazīst, kad situācijai var būt vajadzīga steidzama uzmanība, ar labāku spriedumu risina nenoteiktību un sniedz cilvēkiem skaidrākus, noderīgākus norādījumus par turpmāko rīcību.
GPT-5.2 Instant
Noklikšķiniet uz modeļa nosaukuma, lai skatītu papildu modeļa atbildes.
Šo progresu veido ārsti, kuri palīdz mums definēt, mērīt un uzlabot veselības atbildes ChatGPT.
OpenAI sadarbojas ar globālu tīklu, kurā ir vairāk nekā 260 ārstu 60 valstīs, 49 valodās un 26 medicīnas specialitātēs. Viņu atsauksmes palīdz veidot to, kā ChatGPT atbild uz veselības jautājumiem ļoti dažādos scenārijos — no ikdienas labsajūtas jautājumiem līdz sarežģītākām klīniskām situācijām.
Ārsti pārskata modeļa atbilžu piemērus un vērtē, vai tās ir precīzas, skaidras, pilnīgas, pietiekami piesardzīgas un noderīgas. Viņi palīdz noteikt, kur atbildē var trūkt svarīga konteksta, kur tā var izklausīties pārāk pārliecināta, kur tai vajadzētu skaidrāk norādīt nākamos soļus vai tiešāk mudināt cilvēku meklēt medicīnisku aprūpi.
Līdz šim ārsti ir pārskatījuši vairāk nekā 700 000 modeļa atbilžu piemēru, kas atspoguļo, kā klīnicisti un pacienti var izmantot ChatGPT reālajā pasaulē. Ik pēc dažām minūtēm ārsts pārskata jaunu atbildi. Viņu atsauksmes kļūst par rubrikām un vērtēšanas kritērijiem, kas palīdz pētniekiem mērīt, vai atbildes reālās veselības situācijās ir precīzas, drošas, skaidras, pilnīgas, pietiekami piesardzīgas un noderīgas. Tas mums dod skaidrāku veidu, kā redzēt, kur modeļi kļūst labāki un kur tiem vēl vajadzīgs darbs.
Šis darbs atbalsta arī OpenAI plašāko darbu veselības jomā — gan rīkus, kas palīdz cilvēkiem labāk saprast veselības informāciju un orientēties tajā, gan klīnicistiem veidotus rīkus, piemēram, ChatGPT klīnicistiem un OpenAI veselības aprūpei, kas palīdz medicīnas profesionāļiem tādos uzdevumos kā dokumentācija, pētniecība un aprūpes konsultācijas.
Cilvēku veselības uzlabošana būs viena no personiskākajām un taustāmākajām MVI ietekmēm. Mūsu modeļiem turpinot uzlaboties, mūsu mērķis ir padarīt ChatGPT precīzāku, piesardzīgāku un noderīgāku šādos brīžos — un turpināt nodrošināt šo progresu arvien vairāk cilvēkiem.


