Terveysälyn parantaminen ChatGPT:ssä
GPT‑5.5 Instant tuo edistyksellisen terveysälyn yhä useammille malliemme kehityksen ja lääkärien johtaman arvioinnin muovaamana.
Terveys on yksi merkityksellisimmistä tavoista, joilla ihmiset käyttävät ChatGPT:tä. Joka viikko yli 230 miljoonaa ihmistä kääntyy ChatGPT:n puoleen saadakseen apua terveyteen ja hyvinvointiin liittyvissä kysymyksissä: terveystiedon tulkitsemisessa, laboratoriotulosten ymmärtämisessä, vastaanottokäynteihin valmistautumisessa, vakuutusasioiden selvittämisessä, terveellisempien tapojen rakentamisessa ja sen pohtimisessa, mitä kysyä seuraavaksi.
GPT‑5.5 Instantin myötä näemme merkittävän edistysaskeleen siinä, miten malli käsittelee terveyskysymyksiä: se tunnistaa paremmin tilanteet, joissa kiireellinen hoito voi olla tarpeen, kysyy olennaista taustatietoa, selittää epävarmuutta ja tekee monimutkaisesta tiedosta helpommin ymmärrettävää. Vaativimmissa terveysarvioinneissamme GPT‑5.5 Instant yltää nyt tasolle, joka on verrattavissa edistyneimpiin Thinking-malleihimme. Koska se on saatavilla ChatGPT:n maksuttomille käyttäjille, yhä useampi voi hyötyä näistä parannuksista. Se voi tarkoittaa helpommin ymmärrettävää terveystietoa, parempia kysymyksiä ja selkeitä seuraavia askelia.
Tämä edistys heijastaa sekä mallien kyvykkyyksien kehitystä että lääkärien johtamaa työtä terveysarviointiemme taustalla. Kaikessa työssämme maailmanlaajuinen lääkäriverkosto auttaa määrittelemään, miltä ”hyvä” näyttää tosielämän terveystilanteissa, arvioimalla esimerkkejä mallin vastauksista, kuvaamalla ihanteellista toimintaa ja tunnistamalla epäonnistumisen tapoja. Yhteistyö lääkärien kanssa antaa meille tavan mitata edistystä terveyden alueella ja parantaa ajan mittaan sitä, miten ChatGPT vastaa.
Terveyden alueella edistys tarkoittaa sitä, että vastaukset ovat tarkkoja, ymmärrettäviä ja perustuvat hyvään harkintaan: ne tunnistavat, milloin tarvitaan lisää taustatietoa, selittävät epävarmuuden liioittelematta varmuutta ja auttavat ihmisiä ymmärtämään, milloin hakeutua hoitoon.
Tämän edistyksen mittaamiseen käytämme terveyskohtaisia arviointeja, kuten HealthBenchiä ja HealthBench Professionalia. Näissä arvioinneissa käytetään realistisia terveyskeskusteluja ja lääkärien laatimia arviointiperusteita, joiden avulla tarkastellaan muun muassa täsmällisyyttä, turvallisuutta, viestintää, kontekstin huomioimista, kattavuutta ja asianmukaista ohjaamista jatkohoitoon.
GPT‑5.5 Instant saavuttaa terveyssuorituskyvyn, joka on lähellä uusimpia edistyneitä mallejamme terveysarviointien koosteessa, mukaan lukien HealthBench Professional, ja parantaa tulosta merkittävästi GPT‑5.3 Instantiin verrattuna. 5.5 Instant (julkaistu toukokuussa 2026) ja 5.3 Instant (julkaistu maaliskuussa 2026) ovat saatavilla kaikille ChatGPT:n maksuttomille käyttäjille (rajoitusten puitteissa), ja käytämme API-hinnoittelua kustannusten laskemiseen 5.4 Thinkingille ja 5.5 Thinkingille.
Toisena vertailukohtana pyysimme myös lääkäreitä kirjoittamaan vastauksia edustaviin terveyskeskusteluihin rajattomalla ajalla ja internetyhteydellä, mutta ilman AI:tä. Erillinen lääkäripaneeli vertasi sitten näitä lääkärien vastauksia Instant-malleihin eri ajankohtina ja arvioi todellisissa vuorovaikutustilanteissa merkityksellisiä ominaisuuksia, kuten täsmällisyyttä, viestintää, kattavuutta, ohjeiden noudattamista ja hyödyllisyyttä terveyspäätöksissä, yhteensä 3 500 arvioidussa vastauksessa.
GPT‑5.5 Instantin vastaukset arvioitiin tässä arvioinnissa eri ulottuvuuksilla paremmiksi kuin lääkärien kirjoittamat ja vanhempien mallien vastaukset.
Lääkärit arvioivat, että GPT‑5.5 Instantin vastauksissa oli vähemmän epäonnistumisen tapoja kuin vanhempien mallien ja lääkärien vastauksissa. Esimerkiksi GPT 5.5 Instantissa oli sekä vanhempia malleja että lääkäreitä vähemmän tapauksia, joissa vastausta ei sovitettu paikalliseen terveydenhuollon kontekstiin, varoitusmerkkejä tai hoitoon ohjaamista jäi huomaamatta tai käyttäjältä ei pyydetty tarvittaessa lisätietoa.
Koska mallejamme käytetään terveyteen liittyvissä kysymyksissä laajassa mittakaavassa, yksi tapa ymmärtää viimeaikaisia malliparannuksia on mitata tuotantoliikennettä. Käytämme tuotantoliikenteessä yksityisyyttä suojaavia seurantalaitteita mahdollisten faktuaalisuusongelmien seuraamiseen terveysvastauksissa. Viimeaikaisen terveyteen liittyvän tuotantoliikenteen vertailun perusteella – miljardeja viestejä viikossa – vähintään yhden merkityn faktuaalisuusongelman sisältävien vastausten osuus on laskenut 71 % viimeisten kahden kuukauden aikana.
Vertailemalla mallien vastauksia eri ajankohtina todellisiin terveyskysymyksiin nähdään, miten ChatGPT on parantunut terveyden kannalta olennaisilla tavoilla: se tunnistaa, milloin tilanne voi vaatia kiireellistä huomiota, käsittelee epävarmuutta paremmalla harkinnalla ja antaa ihmisille selkeämpää ja hyödyllisempää ohjausta siitä, mitä tehdä seuraavaksi.
GPT-5.2 Instant
Napsauta mallin nimeä nähdäksesi lisää mallin vastauksia.
Tätä edistystä muovaavat lääkärit, jotka auttavat meitä määrittelemään, mittaamaan ja parantamaan ChatGPT:n terveysvastauksia.
OpenAI tekee yhteistyötä maailmanlaajuisen, yli 260 lääkärin verkoston kanssa 60 maassa, 49 kielellä ja 26 lääketieteen erikoisalalla. Heidän palautteensa vaikuttaa siihen, miten ChatGPT vastaa terveyskysymyksiin monenlaisissa tilanteissa arkisista hyvinvointikysymyksistä monimutkaisempiin kliinisiin tilanteisiin.
Lääkärit arvioivat esimerkkejä mallin vastauksista ja tarkastelevat, ovatko ne täsmällisiä, selkeitä, kattavia, asianmukaisen varovaisia ja hyödyllisiä. He auttavat tunnistamaan, missä vastauksesta voi puuttua tärkeää kontekstia, missä se voi kuulostaa liian varmalta, missä sen pitäisi kertoa selkeämmin seuraavista askelista tai kannustaa suoremmin hakeutumaan hoitoon.
Tähän mennessä lääkärit ovat arvioineet yli 700 000 esimerkkiä mallin vastauksista, jotka kuvastavat sitä, miten kliinikot ja potilaat voivat käyttää ChatGPT:tä tosielämässä. Muutaman minuutin välein lääkäri arvioi uuden vastauksen. Heidän palautteensa muuttuu arviointirubrikeiksi ja -kriteereiksi, joiden avulla tutkijat voivat mitata, ovatko vastaukset täsmällisiä, turvallisia, selkeitä, kattavia, asianmukaisen varovaisia ja hyödyllisiä tosielämän terveystilanteissa. Tämä antaa meille selkeämmän tavan nähdä, missä mallit paranevat ja missä ne vaativat vielä työtä.
Tämä työ tukee myös OpenAI:n laajempaa terveystyötä, joka kattaa sekä työkalut, jotka auttavat ihmisiä ymmärtämään ja käyttämään terveystietoa paremmin, että kliinikoille rakennetut työkalut, kuten ChatGPT for Clinicians ja OpenAI for Healthcare, jotka tukevat terveydenhuollon ammattilaisia esimerkiksi dokumentoinnissa, tutkimuksessa ja hoitokonsultaatioissa.
Ihmisten terveyden parantaminen tulee olemaan yksi AGI:n henkilökohtaisimmista ja konkreettisimmista vaikutuksista. Kun mallimme kehittyvät edelleen, tavoitteemme on tehdä ChatGPT:stä täsmällisempi, huolellisempi ja hyödyllisempi näissä hetkissä – ja tuoda tämä edistys yhä useammille.


