Izboljševanje zdravstvene inteligence v ChatGPT
GPT‑5.5 Instant prinaša vrhunsko zdravstveno inteligenco več ljudem, oblikovano z napredkom naših modelov in evalvacijo pod vodstvom zdravnikov.
Zdravje je eno najpomembnejših področij, na katerih ljudje uporabljajo ChatGPT. Vsak teden se več kot 230 milijonov ljudi obrne na ChatGPT po pomoč pri vprašanjih o zdravju in dobrem počutju: pri razumevanju zdravstvenih informacij, razlagi laboratorijskih izvidov, pripravi na preglede, urejanju zavarovanja, oblikovanju bolj zdravih navad in odločanju, kaj vprašati naprej.
Z GPT‑5.5 Instant opažamo velik korak naprej pri tem, kako model obravnava zdravstvena vprašanja: bolje prepoznava, kdaj je morda potrebna nujna oskrba, sprašuje po ustreznem kontekstu, pojasnjuje negotovost in zapletene informacije naredi razumljivejše. Pri naših najzahtevnejših zdravstvenih evalvacijah GPT‑5.5 Instant zdaj dosega raven, primerljivo z našimi naprednimi modeli Thinking. Ker je v ChatGPT na voljo brezplačnim uporabnikom, lahko te izboljšave koristijo več ljudem. To lahko pomeni razumljivejše zdravstvene informacije, boljša vprašanja in jasne naslednje korake.
Ta napredek odraža tako izboljšave zmogljivosti modelov kot delo pod vodstvom zdravnikov, ki stoji za našimi zdravstvenimi evalvacijami. Pri naših prizadevanjih nam globalna mreža zdravnikov pomaga opredeliti, kaj pomeni »dobro« v resničnih zdravstvenih situacijah, tako da pregleduje primere odgovorov modelov, opisuje idealno vedenje in prepoznava načine odpovedi. Sodelovanje z zdravniki nam omogoča merjenje napredka na področju zdravja in izboljševanje odzivov ChatGPT skozi čas.
Na področju zdravja napredek pomeni zagotavljanje odgovorov, ki so točni, razumljivi in temeljijo na dobri presoji: prepoznajo, kdaj je potrebnega več konteksta, pojasnijo negotovost brez pretiranega poudarjanja zanesljivosti in ljudem pomagajo razumeti, kdaj naj poiščejo oskrbo.
Za merjenje tega napredka uporabljamo zdravstveno specifične evalvacije, vključno s HealthBench in HealthBench Professional. Te evalvacije uporabljajo realistične zdravstvene pogovore in ocenjevalne rubrike, ki so jih napisali zdravniki, da ocenijo lastnosti, kot so točnost, varnost, komunikacija, zavedanje konteksta, celovitost in ustrezno stopnjevanje.
GPT‑5.5 Instant pri skupku zdravstvenih evalvacij, vključno s HealthBench Professional, dosega zdravstveno uspešnost, podobno našim najnovejšim naprednim modelom, in se bistveno izboljšuje v primerjavi z GPT‑5.3 Instant. 5.5 Instant (izdan maja 2026) in 5.3 Instant (izdan marca 2026) sta na voljo vsem brezplačnim uporabnikom v ChatGPT (ob upoštevanju omejitev), za izračun stroškov za 5.4 Thinking in 5.5 Thinking pa uporabljamo cene API.
Kot dodatno primerjavo smo zdravnike prosili tudi, naj napišejo odgovore za reprezentativne zdravstvene pogovore, pri čemer so imeli neomejeno časa in dostop do interneta (vendar ne do AI). Ločena skupina zdravnikov je nato te zdravniške odgovore primerjala z modeli Instant skozi čas ter pri 3500 pregledanih odgovorih ocenjevala lastnosti, ki so pomembne v resničnih interakcijah, vključno s točnostjo, komunikacijo, celovitostjo, upoštevanjem navodil in koristnostjo pri zdravstvenih odločitvah.
Odgovori GPT‑5.5 Instant so bili v tej evalvaciji po različnih razsežnostih ocenjeni višje kot odgovori, ki so jih napisali zdravniki, in odgovori starejših modelov.
Zdravniki so ocenili, da imajo odgovori GPT‑5.5 Instant manj načinov odpovedi kot odgovori starejših modelov in zdravnikov. Na primer, GPT 5.5 Instant je imel manj primerov, ko odgovor ni bil prilagojen lokalnemu zdravstvenemu kontekstu, je spregledal opozorilne znake ali napotitev v oskrbo ali pa od uporabnika ni poiskal dodatnega konteksta, kadar je bil ta potreben, kot starejši modeli in zdravniki.
Glede na obseg uporabe naših modelov v zdravstvu je še en način razumevanja nedavnih izboljšav modelov merjenje produkcijskega prometa. Za spremljanje morebitnih težav s stvarno pravilnostjo v zdravstvenih odgovorih uporabljamo nadzorne mehanizme za produkcijski promet, ki varujejo zasebnost. Na podlagi primerjave nedavnega produkcijskega prometa na področju zdravja – milijard sporočil na teden – se je delež odgovorov z vsaj eno označeno težavo s stvarno pravilnostjo v zadnjih dveh mesecih zmanjšal za 71 %.
Primerjava odgovorov modelov v različnih časovnih obdobjih pri zdravstvenih vprašanjih iz resničnega sveta pokaže, kako se je ChatGPT izboljšal na načine, ki so za zdravje pomembni: prepoznava, kdaj lahko situacija zahteva nujno pozornost, negotovost obravnava z boljšo presojo in ljudem daje jasnejša, uporabnejša navodila o tem, kaj storiti naprej.
GPT-5.2 Instant
Kliknite ime modela, če želite videti dodatne odgovore modela.
Ta napredek oblikujejo zdravniki, ki nam pomagajo opredeljevati, meriti in izboljševati zdravstvene odgovore v ChatGPT.
OpenAI sodeluje z globalno mrežo več kot 260 zdravnikov iz 60 držav, v 49 jezikih in 26 medicinskih specialnostih. Njihove povratne informacije vplivajo na to, kako ChatGPT odgovarja na zdravstvena vprašanja v širokem naboru scenarijev, od vsakodnevnih vprašanj o dobrem počutju do bolj zapletenih kliničnih situacij.
Zdravniki pregledujejo primere odgovorov modelov in ocenjujejo, ali so točni, jasni, celoviti, ustrezno previdni in uporabni. Pomagajo prepoznati, kje lahko odgovor spregleda pomemben kontekst, kje lahko zveni preveč samozavestno, kje bi moral biti jasnejši glede naslednjih korakov ali bolj neposredno spodbuditi nekoga, naj poišče zdravniško oskrbo.
Do danes so zdravniki pregledali več kot 700.000 primerov odgovorov modelov, ki odražajo, kako lahko klinični strokovnjaki in pacienti uporabljajo ChatGPT v resničnem svetu. Vsakih nekaj minut zdravnik pregleda nov odgovor. Njihove povratne informacije postanejo rubrike in evalvacijska merila, ki raziskovalcem pomagajo meriti, ali so odgovori v resničnih zdravstvenih situacijah točni, varni, jasni, celoviti, ustrezno previdni in uporabni. To nam daje jasnejši način, da vidimo, kje se modeli izboljšujejo in kje še potrebujejo delo.
To delo podpira tudi širše delo OpenAI na področju zdravja, ki zajema orodja, s katerimi ljudje lažje razumejo zdravstvene informacije in se v njih znajdejo, ter orodja za klinične strokovnjake, kot sta ChatGPT za klinične strokovnjake in OpenAI za zdravstvo, ki zdravstvenim delavcem pomagajo pri nalogah, kot so dokumentacija, raziskave in posvetovanje o oskrbi.
Izboljšanje zdravja ljudi bo eden najbolj osebnih in oprijemljivih učinkov SUI. Ker se naši modeli še naprej izboljšujejo, je naš cilj, da bo ChatGPT v teh trenutkih točnejši, previdnejši in uporabnejši — ter da ta napredek še naprej prinašamo več ljudem.


