Az egészségügyi intelligencia fejlesztése a ChatGPT‑ben
A GPT‑5.5 Instant a modelljeink fejlődésével és orvosok vezette értékeléssel formált, élvonalbeli egészségügyi intelligenciát tesz elérhetővé több ember számára.
Az egészség az egyik legfontosabb terület, ahol az emberek a ChatGPT‑t használják. Hetente több mint 230 millió ember fordul a ChatGPT‑hez egészséggel és jólléttel kapcsolatos kérdésekben: egészségügyi információk értelmezéséhez, laboreredmények megértéséhez, orvosi időpontokra való felkészüléshez, biztosítási ügyek intézéséhez, egészségesebb szokások kialakításához és annak eldöntéséhez, mit érdemes legközelebb megkérdezni.
A GPT‑5.5 Instanttal jelentős előrelépést látunk abban, ahogyan a modell kezeli az egészségügyi kérdéseket: jobban felismeri, mikor lehet sürgős ellátásra szükség, releváns kontextust kér, magyarázatot ad a bizonytalanságokra, és könnyebben érthetővé teszi az összetett információkat. A legnehezebb egészségügyi értékeléseinken a GPT‑5.5 Instant már az élvonalbeli Thinking modelljeinkhez mérhető szinten teljesít. Mivel a ChatGPT ingyenes felhasználói számára is elérhető, többen részesülhetnek ezekből a fejlesztésekből. Ez könnyebben érthető egészségügyi információkat, jobb kérdéseket és világos következő lépéseket jelenthet.
Ez az előrelépés egyszerre tükrözi a modell képességeinek fejlődését és az egészségügyi értékeléseink mögött álló, orvosok által vezetett munkát. Munkánk során orvosok globális hálózata segít meghatározni, hogyan néz ki a „jó” válasz valós egészségügyi helyzetekben: példa modellválaszokat tekintenek át, leírják az ideális viselkedést, és azonosítják a hibamódokat. Az orvosokkal végzett munka lehetővé teszi, hogy mérjük az egészségügyi területen elért haladást, és idővel javítsuk a ChatGPT válaszait.
Az egészségügyben a fejlődés olyan válaszokat jelent, amelyek pontosak, érthetők és jó ítélőképességen alapulnak: felismerik, mikor van szükség több kontextusra, túlzott magabiztosság nélkül magyarázzák el a bizonytalanságot, és segítenek az embereknek megérteni, mikor van szükség ellátásra.
Ennek a fejlődésnek a méréséhez egészségügyi területre szabott értékeléseket használunk, köztük a HealthBench és a HealthBench Professional értékelést. Ezek az értékelések valósághű egészségügyi beszélgetéseket és orvosok által írt értékelési szempontokat használnak olyan minőségek felmérésére, mint a pontosság, a biztonság, a kommunikáció, a kontextusérzékenység, a teljesség és a megfelelő eszkaláció.
A GPT‑5.5 Instant az egészségügyi értékelések összesített eredményein – köztük a HealthBench Professional értékelésen – a legújabb élvonalbeli modelljeinkhez hasonló egészségügyi teljesítményt ér el, és jelentősen javult a GPT‑5.3 Instanthoz képest. Az 5.5 Instant (2026 májusában jelent meg) és az 5.3 Instant (2026 márciusában jelent meg) a ChatGPT minden ingyenes felhasználója számára elérhető (korlátok mellett), az 5.4 Thinking és az 5.5 Thinking költségének kiszámításához pedig API-árazást használunk.
Egy másik összehasonlításként orvosokat is megkértünk, hogy írjanak válaszokat reprezentatív egészségügyi beszélgetésekre, korlátlan idővel és internet-hozzáféréssel (de AI nélkül). Ezután egy külön orvosi panel időben összehasonlította ezeket az orvosok által írt válaszokat az Instant modellekkel, 3500 áttekintett válaszon vizsgálva a valós interakciókban fontos jellemzőket, köztük a pontosságot, a kommunikációt, a teljességet, az utasításkövetést és az egészségügyi döntések támogatását.
Ebben az értékelésben a GPT‑5.5 Instant válaszai több szempont mentén magasabb értékelést kaptak, mint az orvosok által írt és a régebbi modellválaszok.
Az orvosok úgy értékelték, hogy a GPT‑5.5 Instant válaszaiban kevesebb hibamód fordul elő, mint a régebbi modellek és az orvosok válaszaiban. A GPT 5.5 Instantnál például ritkábban fordult elő, hogy a válasz nem igazodott a helyi egészségügyi kontextushoz, elmulasztotta a figyelmeztető jeleket vagy az ellátásba való átirányítást, illetve nem kért további kontextust a felhasználótól, amikor erre szükség lett volna – mind a régebbi modellekhez, mind az orvosokhoz képest.
Mivel modelljeinket az egészségügyben nagy léptékben használják, a közelmúltbeli modellfejlesztések megértésének egy másik módja az éles forgalom mérése. Az éles forgalomban adatvédelmet megőrző monitorokat használunk az egészségügyi válaszok esetleges tényszerűségi problémáinak nyomon követésére. Az egészségügyi témájú közelmúltbeli éles forgalom – heti több milliárd üzenet – összehasonlítása alapján az elmúlt két hónapban 71%-kal csökkent azoknak a válaszoknak az aránya, amelyekben legalább egy jelzett tényszerűségi probléma volt.
A különböző időpontokból származó modellválaszok valós egészségügyi kérdéseken történő összehasonlítása megmutatja, hogyan javult a ChatGPT az egészség szempontjából lényeges módokon: felismeri, ha egy helyzet sürgős figyelmet igényelhet, jobb ítélőképességgel kezeli a bizonytalanságot, és világosabb, hasznosabb útmutatást ad az embereknek arról, mit tegyenek ezután.
GPT-5.2 Instant
Kattints a modell nevére a további modellválaszok megtekintéséhez.
Ezt a fejlődést orvosok formálják, akik segítenek meghatározni, mérni és javítani a ChatGPT egészségügyi válaszait.
Az OpenAI több mint 260 orvosból álló globális hálózattal dolgozik együtt, 60 országban, 49 nyelven és 26 orvosi szakterületen. Visszajelzéseik befolyásolják, hogyan válaszol a ChatGPT egészségügyi kérdésekre a helyzetek széles körében, a mindennapi jólléti kérdésektől az összetettebb klinikai helyzetekig.
Az orvosok példa modellválaszokat tekintenek át, és értékelik, hogy azok pontosak, világosak, teljesek, kellően óvatosak és hasznosak-e. Segítenek azonosítani, hol hiányozhat egy válaszból fontos kontextus, hol tűnhet túl magabiztosnak, hol kellene világosabban megfogalmaznia a következő lépéseket, vagy közvetlenebbül bátorítania valakit arra, hogy orvosi ellátást kérjen.
Az orvosok eddig több mint 700 000 példa modellválaszt tekintettek át, amelyek azt tükrözik, hogyan használhatják a klinikusok és a páciensek a ChatGPT‑t a valóságban. Egy orvos néhány percenként új választ tekint át. Visszajelzéseikből értékelési szempontok és kritériumok lesznek, amelyek segítenek a kutatóknak mérni, hogy a válaszok pontosak, biztonságosak, világosak, teljesek, kellően óvatosak és hasznosak-e valós egészségügyi helyzetekben. Ez világosabb képet ad arról, hol javulnak a modellek, és hol van még szükség munkára.
Ez a munka támogatja az OpenAI szélesebb körű egészségügyi tevékenységét is: olyan eszközöket, amelyek segítenek az embereknek jobban megérteni és kezelni az egészségügyi információkat, valamint klinikusoknak készült eszközöket, például a ChatGPT klinikusoknak és az OpenAI az egészségügyben megoldást, amelyek dokumentációban, kutatásban és ellátási konzultációban támogatják az egészségügyi szakembereket.
Az emberi egészség javítása az AGI egyik legszemélyesebb és legkézzelfoghatóbb hatása lesz. Ahogy modelljeink tovább fejlődnek, célunk, hogy a ChatGPT ezekben a pillanatokban pontosabb, körültekintőbb és hasznosabb legyen – és hogy ezt a fejlődést egyre több emberhez juttassuk el.


