Millorem la intel·ligència de salut a ChatGPT
GPT‑5.5 Instant porta la intel·ligència de salut d’avantguarda a més persones, gràcies als avenços dels nostres models i a l’avaluació liderada per metges.
La salut és una de les maneres més significatives en què les persones fan servir ChatGPT. Cada setmana, més de 230 milions de persones recorren a ChatGPT per obtenir ajuda amb preguntes sobre salut i benestar: interpretar informació de salut, entendre resultats d’analítiques, preparar visites mèdiques, orientar-se amb l’assegurança, adquirir hàbits més saludables i decidir què cal preguntar després.
Amb GPT‑5.5 Instant, veiem un avenç substancial en la manera com el model gestiona les preguntes de salut, amb millores a l’hora de reconèixer quan pot caldre atenció urgent, demanar context rellevant, explicar la incertesa i fer que la informació complexa sigui més fàcil d’entendre. En les nostres avaluacions de salut més exigents, GPT‑5.5 Instant ja ofereix un rendiment comparable al dels nostres models Thinking d’avantguarda. Com que està disponible per als usuaris gratuïts de ChatGPT, més persones es poden beneficiar d’aquestes millores. Això pot significar informació de salut més fàcil d’entendre, millors preguntes per fer i passos següents clars.
Aquest progrés reflecteix tant els avenços en les capacitats del model com la feina liderada per metges que hi ha darrere de les nostres avaluacions de salut. En tots els nostres esforços, una xarxa global de metges ajuda a definir què vol dir fer-ho «bé» en situacions de salut del món real revisant exemples de respostes del model, descrivint el comportament ideal i identificant modes de fallada. Treballar amb metges ens dona una manera de mesurar el progrés en salut i de millorar com respon ChatGPT amb el temps.
En salut, progressar vol dir oferir respostes precises, entenedores i basades en un bon criteri: reconèixer quan cal més context, explicar la incertesa sense exagerar el grau de confiança i ajudar les persones a entendre quan han de buscar atenció mèdica.
Per mesurar aquest progrés, fem servir avaluacions específiques de salut, com HealthBench i HealthBench Professional. Aquestes avaluacions utilitzen converses de salut realistes i rúbriques escrites per metges per valorar qualitats com la precisió, la seguretat, la comunicació, la consciència del context, la completesa i l’escalat adequat.
GPT‑5.5 Instant assoleix un rendiment en salut similar al dels nostres models d’avantguarda més recents en un agregat d’avaluacions de salut, inclòs HealthBench Professional, amb una millora substancial respecte de GPT‑5.3 Instant. 5.5 Instant (llançat el maig de 2026) i 5.3 Instant (llançat el març de 2026) estan disponibles per a tots els usuaris gratuïts de ChatGPT (subjectes a límits), i fem servir els preus de l’API per calcular el cost de 5.4 Thinking i 5.5 Thinking.
Com a altra comparació, també vam demanar a metges que redactessin respostes per a converses de salut representatives, amb temps il·limitat i accés a internet (però no a AI). Després, un panell independent de metges va comparar aquestes respostes escrites per metges amb models Instant al llarg del temps, revisant qualitats que importen en interaccions reals, com ara la precisió, la comunicació, la completesa, el seguiment d’instruccions i la utilitat per prendre decisions de salut, en un total de 3500 respostes revisades.
Les respostes de GPT‑5.5 Instant van rebre puntuacions més altes que les respostes escrites per metges i les de models anteriors en totes les dimensions d’aquesta avaluació.
Els metges van valorar que les respostes de GPT‑5.5 Instant presentaven menys modes de fallada que les de models anteriors i les dels metges. Per exemple, GPT 5.5 Instant va tenir menys casos de manca d’adaptació al context sanitari local, d’omissió de senyals d’alarma o de derivació a l’atenció mèdica, o de no demanar context addicional a l’usuari quan calia, tant respecte dels models anteriors com dels metges.
Atesa l’escala d’ús dels nostres models en salut, una altra manera d’entendre les millores recents del model és mesurar el trànsit de producció. Fem servir monitors que preserven la privadesa sobre el trànsit de producció per fer seguiment de possibles problemes de factualitat en les respostes de salut. Segons una comparació del trànsit de producció recent en salut —milers de milions de missatges a la setmana—, la taxa de respostes amb almenys un problema de factualitat assenyalat ha baixat un 71% en els dos darrers mesos.
Comparar respostes de models en diferents moments sobre preguntes de salut del món real mostra com ChatGPT ha millorat en aspectes importants per a la salut: reconèixer quan una situació pot requerir atenció urgent, gestionar la incertesa amb més bon criteri i donar a les persones orientacions més clares i útils sobre què fer a continuació.
GPT-5.2 Instant
Fes clic al nom del model per veure respostes addicionals del model.
Aquest progrés està modelat per metges que ens ajuden a definir, mesurar i millorar les respostes de salut a ChatGPT.
OpenAI treballa amb una xarxa global de més de 260 metges de 60 països, 49 llengües i 26 especialitats mèdiques. Els seus comentaris orienten com ChatGPT respon a preguntes de salut en una gran varietat d’escenaris, des de consultes quotidianes sobre benestar fins a situacions clíniques més complexes.
Els metges revisen exemples de respostes del model i avaluen si són precises, clares, completes, prudentment cauteloses i útils. Ajuden a identificar on una resposta pot passar per alt context important, on pot sonar massa segura, on hauria de ser més clara sobre els passos següents o on hauria d’animar més directament algú a buscar atenció mèdica.
Fins ara, els metges han revisat més de 700.000 exemples de respostes del model que reflecteixen com els clínics i els pacients poden fer servir ChatGPT en el món real. Cada pocs minuts, un metge revisa una resposta nova. Els seus comentaris es converteixen en rúbriques i criteris d’avaluació que ajuden els investigadors a mesurar si les respostes són precises, segures, clares, completes, prudentment cauteloses i útils en situacions de salut del món real. Això ens dona una manera més clara de veure on els models milloren i on encara cal treballar.
Aquesta feina també dona suport al treball més ampli d’OpenAI en salut, que abasta eines que ajuden les persones a entendre i gestionar millor la informació de salut, així com eines creades per a clínics, com ara ChatGPT per a clínics i OpenAI per a l’atenció sanitària, que donen suport als professionals mèdics en tasques com la documentació, la recerca i la consulta assistencial.
Millorar la salut humana serà un dels impactes més personals i tangibles de l’AGI. A mesura que els nostres models continuen millorant, el nostre objectiu és fer que ChatGPT sigui més precís, més prudent i més útil en aquests moments, i continuar fent arribar aquest progrés a més persones.


