Kuboresha akili ya afya katika ChatGPT
GPT‑5.5 Instant inaleta akili ya hali ya juu ya afya kwa watu zaidi, ikichangiwa na maboresho katika miundo yetu na tathmini zinazoongozwa na madaktari.
Afya ni mojawapo ya njia zenye maana zaidi ambazo watu hutumia ChatGPT. Kila wiki, zaidi ya watu milioni 230 hutumia ChatGPT kupata msaada kuhusu maswali ya afya na ustawi: kuelewa taarifa za afya, kufasiri matokeo ya vipimo vya maabara, kujiandaa kwa miadi, kushughulikia bima, kujenga mazoea bora ya afya, na kujua cha kuuliza baadaye.
Kwa GPT‑5.5 Instant, tunaona hatua kubwa mbele katika jinsi muundo unavyoshughulikia maswali ya afya, kwa maboresho katika kutambua wakati huduma ya dharura inaweza kuhitajika, kuuliza muktadha unaofaa, kueleza kutokuwa na uhakika, na kufanya taarifa tata ziwe rahisi kuelewa. Katika tathmini zetu ngumu zaidi za afya, GPT‑5.5 Instant sasa hufanya kazi kwa kiwango kinacholingana na miundo yetu ya kisasa ya Thinking. Kwa kuwa inapatikana kwa watumiaji wa bila malipo katika ChatGPT, watu zaidi wanaweza kufaidika na maboresho haya. Hilo linaweza kumaanisha taarifa za afya zilizo rahisi kuelewa, maswali bora ya kuuliza, na hatua zinazofuata zilizo wazi.
Maendeleo hayo yanaonyesha maboresho katika uwezo wa muundo na pia kazi inayoongozwa na madaktari iliyo nyuma ya tathmini zetu za afya. Katika juhudi zetu, mtandao wa kimataifa wa madaktari husaidia kufafanua “bora” inaonekana vipi katika hali halisi za afya kwa kukagua majibu ya mfano ya muundo, kueleza tabia bora, na kubaini aina za kushindwa. Kufanya kazi na madaktari hutupa njia ya kupima maendeleo katika afya na kuboresha jinsi ChatGPT inavyojibu kadiri muda unavyopita.
Katika afya, maendeleo humaanisha kutoa majibu sahihi, yanayoeleweka, na yaliyojengwa juu ya uamuzi mzuri: kutambua wakati muktadha zaidi unahitajika, kueleza kutokuwa na uhakika bila kuzidisha kujiamini, na kuwasaidia watu kuelewa wakati wa kutafuta huduma.
Ili kupima maendeleo hayo, tunatumia tathmini mahususi za afya, zikiwemo HealthBench na HealthBench Professional. Tathmini hizi hutumia mazungumzo halisi ya afya na rubriki zilizoandikwa na madaktari kupima sifa kama usahihi, usalama, mawasiliano, ufahamu wa muktadha, ukamilifu, na kuelekeza ipasavyo kwenye huduma ya juu zaidi.
GPT‑5.5 Instant inafikia utendaji wa afya unaofanana na miundo yetu mipya zaidi ya hali ya juu kwenye jumla ya tathmini za afya, zikiwemo HealthBench Professional, ikiwa imeboreshwa kwa kiasi kikubwa kutoka GPT‑5.3 Instant. 5.5 Instant (iliyotolewa Mei 2026) na 5.3 Instant (iliyotolewa Machi 2026) zinapatikana kwa watumiaji wote wa bila malipo katika ChatGPT (kwa kuzingatia vikomo), na tunatumia bei za API kukokotoa gharama ya 5.4 Thinking na 5.5 Thinking.
Kama ulinganisho mwingine, tuliwaomba pia madaktari waandike majibu kwa mazungumzo wakilishi ya afya, wakiwa na muda usio na kikomo na ufikiaji wa intaneti (lakini si AI). Kisha jopo tofauti la madaktari lililinganisha majibu haya ya madaktari na miundo ya Instant kadiri muda ulivyopita, likikagua sifa muhimu katika mawasiliano halisi, zikiwemo usahihi, mawasiliano, ukamilifu, kufuata maelekezo na manufaa katika maamuzi ya afya, katika majibu 3500 yaliyokaguliwa.
Majibu ya GPT‑5.5 Instant yalipewa alama za juu kuliko majibu yaliyoandikwa na madaktari na majibu ya miundo ya zamani katika vipengele mbalimbali vya tathmini hii.
Madaktari walikadiria majibu ya GPT‑5.5 Instant kuwa na aina chache za kushindwa kuliko yale ya miundo ya zamani na ya madaktari. Kwa mfano, GPT 5.5 Instant ilikuwa na visa vichache vya kutobadilisha jibu kulingana na muktadha wa huduma za afya za eneo husika, kukosa ishara za hatari au rufaa ya kupata huduma, au kushindwa kuomba muktadha wa ziada kutoka kwa mtumiaji inapohitajika, ikilinganishwa na miundo ya zamani na madaktari.
Kwa kuzingatia kiwango cha matumizi ya miundo yetu katika afya, njia nyingine ya kuelewa maboresho ya hivi karibuni ya muundo ni kupima trafiki ya matumizi halisi. Tunatumia vifuatiliaji vinavyolinda faragha kwenye trafiki ya matumizi halisi kufuatilia matatizo yanayoweza kutokea ya ukweli katika majibu ya afya. Kulingana na ulinganisho wa trafiki ya hivi karibuni ya matumizi halisi katika afya—mabilioni ya ujumbe kwa wiki—kiwango cha majibu yenye angalau tatizo moja la ukweli lililotiwa alama kimeshuka kwa 71% katika miezi miwili iliyopita.
Kulinganisha majibu kutoka kwa miundo katika nyakati tofauti kwenye maswali halisi ya afya kunaonyesha jinsi ChatGPT imeboreshwa kwa njia muhimu kwa afya: kutambua wakati hali inaweza kuhitaji kushughulikiwa haraka, kushughulikia kutokuwa na uhakika kwa uamuzi bora, na kuwapa watu mwongozo ulio wazi na wenye manufaa zaidi kuhusu cha kufanya baadaye.
GPT-5.2 Instant
Bofya jina la muundo ili kuona majibu ya ziada ya muundo.
Maendeleo haya yanachangiwa na madaktari wanaotusaidia kufafanua, kupima na kuboresha majibu ya afya katika ChatGPT.
OpenAI hufanya kazi na mtandao wa kimataifa wa zaidi ya madaktari 260 katika nchi 60, lugha 49, na taaluma 26 za matibabu. Maoni yao huelekeza jinsi ChatGPT inavyojibu maswali ya afya katika hali mbalimbali, kuanzia maswali ya kila siku ya ustawi hadi hali tata zaidi za kitabibu.
Madaktari hukagua majibu ya mfano ya muundo na kutathmini kama ni sahihi, wazi, kamili, yenye tahadhari inayofaa, na yenye manufaa. Husaidia kubaini pale jibu linapoweza kukosa muktadha muhimu, kuonekana kuwa na uhakika kupita kiasi, linapopaswa kuwa wazi zaidi kuhusu hatua zinazofuata, au kumhimiza mtu moja kwa moja zaidi kutafuta huduma ya matibabu.
Hadi sasa, madaktari wamekagua zaidi ya majibu 700,000 ya mfano ya muundo yanayoonyesha jinsi wahudumu wa afya na wagonjwa wanavyoweza kutumia ChatGPT katika ulimwengu halisi. Kila baada ya dakika chache, daktari hukagua jibu jipya. Maoni yao hugeuka kuwa rubriki na vigezo vya tathmini vinavyowasaidia watafiti kupima kama majibu ni sahihi, salama, wazi, kamili, yenye tahadhari inayofaa, na yenye manufaa katika hali halisi za afya. Hili hutupa njia iliyo wazi zaidi ya kuona mahali ambapo miundo inazidi kuwa bora na mahali ambapo bado inahitaji kuboreshwa.
Kazi hii pia inaunga mkono juhudi pana za OpenAI katika afya, zikijumuisha zana zinazowasaidia watu kuelewa na kushughulikia taarifa za afya kwa urahisi zaidi pamoja na zana zilizojengwa kwa ajili ya wahudumu wa kliniki, kama ChatGPT kwa Wahudumu wa Kliniki na OpenAI kwa Huduma za Afya, ambazo huwasaidia wataalamu wa matibabu katika kazi kama uandishi wa nyaraka, utafiti, na ushauri wa huduma.
Kuboresha afya ya binadamu kutakuwa mojawapo ya athari za AGI zilizo za binafsi zaidi na zinazoonekana wazi. Kadiri miundo yetu inavyoendelea kuboreshwa, lengo letu ni kuifanya ChatGPT iwe sahihi zaidi, makini zaidi, na yenye manufaa zaidi katika nyakati hizo — na kuendelea kuwafikishia watu zaidi maendeleo hayo.


