Përmirësimi i inteligjencës shëndetësore në ChatGPT
GPT‑5.5 Instant sjell inteligjencë shëndetësore avangardë te më shumë njerëz, të formësuar nga avancimet në modelet tona dhe vlerësimi i udhëhequr nga mjekë.
Shëndeti është një nga mënyrat më domethënëse se si njerëzit e përdorin ChatGPT. Çdo javë, më shumë se 230 milionë njerëz i drejtohen ChatGPT për ndihmë me pyetje rreth shëndetit dhe mirëqenies: për të kuptuar informacionin shëndetësor, rezultatet laboratorike, për t’u përgatitur për takime, për t’u orientuar në sigurime, për të ndërtuar zakone më të shëndetshme dhe për të ditur çfarë të pyesin më pas.
Me GPT‑5.5 Instant, po shohim një hap të rëndësishëm përpara në mënyrën se si modeli trajton pyetjet shëndetësore, me përmirësime në dallimin e rasteve kur mund të nevojitet kujdes urgjent, kërkimin e kontekstit përkatës, shpjegimin e pasigurisë dhe thjeshtimin e informacionit kompleks. Në vlerësimet tona më sfiduese për shëndetin, GPT‑5.5 Instant tani arrin një nivel të krahasueshëm me modelet tona më avangardë Thinking. Meqë është i disponueshëm për përdoruesit falas në ChatGPT, më shumë njerëz mund të përfitojnë nga këto përmirësime. Kjo mund të nënkuptojë informacion shëndetësor më të lehtë për t’u kuptuar, pyetje më të mira për t’u bërë dhe hapa të qartë vijues.
Ky përparim pasqyron si avancimet në aftësitë e modeleve, ashtu edhe punën e udhëhequr nga mjekë pas vlerësimeve tona shëndetësore. Në të gjitha përpjekjet tona, një rrjet global mjekësh ndihmon të përcaktohet si duket “e mira” në situata reale shëndetësore, duke shqyrtuar shembuj përgjigjesh të modelit, duke përshkruar sjelljen ideale dhe duke identifikuar mënyrat e dështimit. Puna me mjekë na jep një mënyrë për të matur përparimin në shëndet dhe për të përmirësuar me kalimin e kohës mënyrën se si përgjigjet ChatGPT.
Në shëndetësi, përparim do të thotë të japësh përgjigje të sakta, të kuptueshme dhe të mbështetura në gjykim të mirë: të dallosh kur nevojitet më shumë kontekst, të shpjegosh pasigurinë pa e tepruar me sigurinë dhe t’i ndihmosh njerëzit të kuptojnë kur duhet të kërkojnë kujdes mjekësor.
Për ta matur këtë përparim, përdorim vlerësime specifike për shëndetin, duke përfshirë HealthBench dhe HealthBench Professional. Këto vlerësime përdorin biseda realiste shëndetësore dhe rubrika të shkruara nga mjekë për të vlerësuar cilësi si saktësia, siguria, komunikimi, ndërgjegjësimi për kontekstin, plotësia dhe përshkallëzimi i duhur.
GPT‑5.5 Instant arrin performancë shëndetësore të ngjashme me modelet tona më të fundit avangardë në një përmbledhje vlerësimesh shëndetësore, duke përfshirë HealthBench Professional, me përmirësim të ndjeshëm nga GPT‑5.3 Instant. 5.5 Instant (lëshuar në maj 2026) dhe 5.3 Instant (lëshuar në mars 2026) janë të disponueshme për të gjithë përdoruesit falas në ChatGPT (sipas kufizimeve), dhe ne përdorim çmimet e API-së për të llogaritur koston për 5.4 Thinking dhe 5.5 Thinking.
Si një krahasim tjetër, u kërkuam edhe mjekëve të shkruanin përgjigje për biseda përfaqësuese shëndetësore, me kohë të pakufizuar dhe qasje në internet (por pa IA). Më pas, një panel i veçantë mjekësh i krahasoi këto përgjigje të mjekëve me modelet Instant me kalimin e kohës, duke shqyrtuar cilësi që kanë rëndësi në ndërveprime reale, duke përfshirë saktësinë, komunikimin, plotësinë, ndjekjen e udhëzimeve dhe dobishmërinë për vendime shëndetësore, në 3500 përgjigje të shqyrtuara.
Përgjigjet e GPT‑5.5 Instant u vlerësuan më lart se përgjigjet e shkruara nga mjekët dhe ato të modeleve më të vjetra në të gjitha dimensionet e këtij vlerësimi.
Mjekët i vlerësuan përgjigjet e GPT‑5.5 Instant si me më pak mënyra dështimi sesa ato nga modelet më të vjetra dhe nga mjekët. Për shembull, GPT 5.5 Instant pati më pak raste ku përgjigjja nuk përshtatej me kontekstin lokal të kujdesit shëndetësor, nuk kapte shenjat e alarmit ose nevojën për referim për kujdes, ose nuk kërkonte kontekst shtesë nga përdoruesi kur duhej, krahasuar si me modelet më të vjetra, ashtu edhe me mjekët.
Duke pasur parasysh shkallën e përdorimit të modeleve tona në shëndetësi, një mënyrë tjetër për të kuptuar përmirësimet e fundit të modeleve është matja e trafikut në prodhim. Ne përdorim monitorë që ruajnë privatësinë në trafikun e prodhimit për të gjurmuar çështje të mundshme faktike në përgjigjet shëndetësore. Bazuar në një krahasim të trafikut të fundit të prodhimit në shëndetësi—miliarda mesazhe në javë—përqindja e përgjigjeve me të paktën një çështje faktike të shënuar ka rënë me 71% në dy muajt e fundit.
Krahasimi i përgjigjeve nga modelet në periudha të ndryshme, në pyetje shëndetësore të botës reale, tregon se si ChatGPT është përmirësuar në aspekte që kanë rëndësi për shëndetin: të dallojë kur një situatë mund të kërkojë vëmendje urgjente, ta trajtojë pasigurinë me gjykim më të mirë dhe t’u japë njerëzve udhëzime më të qarta e më të dobishme për çfarë të bëjnë më pas.
GPT-5.2 Instant
Kliko emrin e modelit për të parë përgjigje shtesë të modelit.
Ky përparim formësohet nga mjekë që na ndihmojnë të përcaktojmë, matim dhe përmirësojmë përgjigjet shëndetësore në ChatGPT.
OpenAI punon me një rrjet global prej më shumë se 260 mjekësh në 60 vende, 49 gjuhë dhe 26 specialitete mjekësore. Reagimet e tyre ndikon në mënyrën se si ChatGPT u përgjigjet pyetjeve shëndetësore në një gamë të gjerë skenarësh, nga pyetjet e përditshme për mirëqenien deri te situatat klinike më komplekse.
Mjekët shqyrtojnë shembuj përgjigjesh të modelit dhe vlerësojnë nëse janë të sakta, të qarta, të plota, me kujdesin e duhur dhe të dobishme. Ata ndihmojnë të identifikohet ku një përgjigje mund të mos përfshijë kontekst të rëndësishëm, ku mund të tingëllojë tepër e sigurt, ku duhet të jetë më e qartë për hapat vijues ose të nxisë më drejtpërdrejt dikë të kërkojë kujdes mjekësor.
Deri më sot, mjekët kanë shqyrtuar më shumë se 700 000 shembuj përgjigjesh të modelit që pasqyrojnë se si klinicistët dhe pacientët mund ta përdorin ChatGPT në botën reale. Çdo pak minuta, një mjek shqyrton një përgjigje të re. Reagimet e tyre kthehen në rubrika dhe kritere vlerësimi që i ndihmojnë studiuesit të matin nëse përgjigjet janë të sakta, të sigurta, të qarta, të plota, me kujdesin e duhur dhe të dobishme në situata shëndetësore të botës reale. Kjo na jep një mënyrë më të qartë për të parë ku po përmirësohen modelet dhe ku ende kanë nevojë për punë.
Kjo punë mbështet gjithashtu punën më të gjerë të OpenAI në shëndetësi, që përfshin mjete që i ndihmojnë njerëzit ta kuptojnë dhe ta përdorin më mirë informacionin shëndetësor, si dhe mjete të ndërtuara për klinicistë, si ChatGPT për klinicistët dhe OpenAI për kujdesin shëndetësor, të cilat mbështesin profesionistët mjekësorë në detyra si dokumentimi, kërkimi dhe konsultimi për kujdesin.
Përmirësimi i shëndetit të njeriut do të jetë një nga ndikimet më personale dhe më të prekshme të AGI. Ndërsa modelet tona vazhdojnë të përmirësohen, synimi ynë është ta bëjmë ChatGPT më të saktë, më të kujdesshëm dhe më të dobishëm në ato momente — dhe të vazhdojmë ta sjellim këtë përparim te më shumë njerëz.


