Poboljšanje inteligencije ChatGPT‑a u području zdravlja
GPT‑5.5 Instant donosi najnapredniju inteligenciju u području zdravlja većem broju ljudi, oblikovanu napretkom naših modela i evaluacijom koju vode liječnici.
Zdravlje je jedno od najvažnijih područja u kojima ljudi upotrebljavaju ChatGPT. Svakog se tjedna više od 230 milijuna ljudi obraća ChatGPT‑u za pomoć s pitanjima o zdravlju i dobrobiti: kako razumjeti zdravstvene informacije i nalaze laboratorijskih pretraga, pripremiti se za preglede, snaći se u osiguranju, izgraditi zdravije navike i shvatiti što pitati sljedeće.
Uz GPT‑5.5 Instant vidimo znatan iskorak u načinu na koji model obrađuje pitanja o zdravlju, uz poboljšanja u prepoznavanju situacija u kojima bi mogla biti potrebna hitna medicinska skrb, traženju relevantnog konteksta, objašnjavanju neizvjesnosti i objašnjavanju složenih informacija na razumljiviji način. Na našim najzahtjevnijim zdravstvenim evaluacijama GPT‑5.5 Instant sada postiže razinu usporedivu s našim najnaprednijim Thinking modelima. Budući da je dostupan korisnicima koji besplatno upotrebljavaju ChatGPT, više ljudi može imati koristi od tih poboljšanja. To može značiti zdravstvene informacije koje je lakše razumjeti, bolja pitanja koja treba postaviti i jasne sljedeće korake.
Taj napredak odražava i napredak u sposobnostima modela i rad na našim zdravstvenim evaluacijama koji vode liječnici. U našim nastojanjima globalna mreža liječnika pomaže definirati kako „dobar” odgovor izgleda u stvarnim zdravstvenim situacijama tako što pregledava primjere odgovora modela, opisuje idealno ponašanje i prepoznaje obrasce pogrešaka. Suradnja s liječnicima omogućuje nam da mjerimo napredak u području zdravlja i s vremenom poboljšavamo način na koji ChatGPT odgovara.
U području zdravlja napredak znači davati odgovore koji su točni, razumljivi i utemeljeni na dobroj prosudbi: prepoznati kada je potrebno više konteksta, objasniti neizvjesnost bez pretjerane sigurnosti i pomoći ljudima da razumiju kada trebaju potražiti liječničku skrb.
Kako bismo mjerili taj napredak, upotrebljavamo evaluacije posebno namijenjene zdravlju, uključujući HealthBench i HealthBench Professional. Te evaluacije upotrebljavaju realistične razgovore o zdravlju i ocjenjivačke rubrike koje su napisali liječnici kako bi procijenile aspekte poput točnosti, sigurnosti, komunikacije, uzimanja konteksta u obzir, potpunosti i primjerenog upućivanja na višu razinu skrbi.
GPT‑5.5 Instant postiže rezultate u području zdravlja slične našim najnovijim najnaprednijim modelima na objedinjenom skupu zdravstvenih evaluacija, uključujući HealthBench Professional, uz znatno poboljšanje u odnosu na GPT‑5.3 Instant. 5.5 Instant (objavljen u svibnju 2026.) i 5.3 Instant (objavljen u ožujku 2026.) dostupni su svim korisnicima koji besplatno upotrebljavaju ChatGPT (uz ograničenja), a za izračun troška za 5.4 Thinking i 5.5 Thinking upotrebljavamo cijene API-ja.
Kao još jednu usporedbu, zamolili smo liječnike da napišu odgovore za reprezentativne razgovore o zdravlju, uz neograničeno vrijeme i pristup internetu (ali ne i AI-ju). Zaseban panel liječnika zatim je uspoređivao te liječničke odgovore s Instant modelima tijekom vremena, pregledavajući kvalitete važne u stvarnim interakcijama, uključujući točnost, komunikaciju, potpunost, pridržavanje uputa i korisnost za zdravstvene odluke, u 3500 pregledanih odgovora.
Odgovori modela GPT‑5.5 Instant u ovoj su evaluaciji ocijenjeni bolje od odgovora koje su napisali liječnici i odgovora starijih modela u svim dimenzijama.
Liječnici su ocijenili da odgovori modela GPT‑5.5 Instant imaju manje obrazaca pogrešaka od odgovora starijih modela i odgovora liječnika. Primjerice, u odgovorima modela GPT‑5.5 Instant bilo je manje slučajeva neprilagođenosti lokalnom zdravstvenom kontekstu, propuštanja znakova za uzbunu ili potrebe za upućivanjem na medicinsku skrb te propuštanja traženja dodatnog konteksta od korisnika kada je to bilo potrebno nego u odgovorima starijih modela i liječnika.
S obzirom na razmjere upotrebe naših modela u području zdravlja, još jedan način razumijevanja nedavnih poboljšanja modela jest mjerenje prometa u produkciji. Na prometu u produkciji upotrebljavamo nadzorne mehanizme koji štite privatnost kako bismo pratili moguće probleme s činjeničnom točnošću u odgovorima o zdravlju. Na temelju usporedbe nedavnog prometa u produkciji u području zdravlja – milijardi poruka tjedno – stopa odgovora s barem jednim označenim problemom činjenične točnosti pala je za 71 % u posljednja dva mjeseca.
Usporedba odgovora modela iz različitih trenutaka na stvarna zdravstvena pitanja pokazuje kako se ChatGPT poboljšao u aspektima važnima za zdravlje: prepoznavanju situacija koje mogu zahtijevati hitnu medicinsku reakciju, razboritijem postupanju s neizvjesnošću te davanju jasnijih i korisnijih smjernica o tome što učiniti sljedeće.
GPT-5.2 Instant
Kliknite naziv modela za prikaz dodatnih odgovora modela.
Taj napredak oblikuju liječnici koji nam pomažu definirati, mjeriti i poboljšavati odgovore ChatGPT‑a na pitanja o zdravlju.
OpenAI surađuje s globalnom mrežom od više od 260 liječnika iz 60 zemalja, na 49 jezika i u 26 medicinskih specijalnosti. Njihove povratne informacije oblikuju način na koji ChatGPT odgovara na pitanja o zdravlju u širokom rasponu scenarija, od svakodnevnih pitanja o dobrobiti do složenijih kliničkih situacija.
Liječnici pregledavaju primjere odgovora modela i procjenjuju jesu li točni, jasni, potpuni, primjereno oprezni i korisni. Pomažu prepoznati u kojim slučajevima odgovor može propustiti važan kontekst, zvučati previše samouvjereno, biti nedovoljno jasan o sljedećim koracima ili nedovoljno izravno potaknuti osobu da potraži medicinsku skrb.
Do danas su liječnici pregledali više od 700.000 primjera odgovora modela koji odražavaju kako kliničari i pacijenti mogu upotrebljavati ChatGPT u stvarnom svijetu. Svakih nekoliko minuta liječnik pregleda novi odgovor. Njihove povratne informacije postaju ocjenjivačke rubrike i kriteriji evaluacije koji istraživačima pomažu mjeriti jesu li odgovori točni, sigurni, jasni, potpuni, primjereno oprezni i korisni u stvarnim zdravstvenim situacijama. To nam daje jasniji način da vidimo u čemu se modeli poboljšavaju i gdje je još potreban rad.
Taj rad podupire i širi rad tvrtke OpenAI u području zdravlja, koji obuhvaća alate koji ljudima pomažu bolje razumjeti i snalaziti se u zdravstvenim informacijama, kao i alate izrađene za kliničare, poput ChatGPT za kliničare i OpenAI za zdravstvo, koji medicinskim stručnjacima pomažu u zadacima poput dokumentacije, istraživanja i konzultacija o skrbi.
Poboljšanje ljudskog zdravlja bit će jedan od najosobnijih i najopipljivijih učinaka AGI-ja. Kako se naši modeli nastavljaju poboljšavati, cilj nam je učiniti ChatGPT točnijim, opreznijim i korisnijim u tim trenucima – i nastaviti donositi taj napredak većem broju ljudi.


