Migliorare l’intelligenza sanitaria in ChatGPT
GPT‑5.5 Instant porta a più persone un’intelligenza sanitaria di frontiera, plasmata dai progressi dei nostri modelli e da valutazioni guidate da medici.
La salute è uno degli ambiti più significativi in cui le persone usano ChatGPT. Ogni settimana, più di 230 milioni di persone si rivolgono a ChatGPT per ricevere aiuto su domande di salute e benessere: orientarsi tra le informazioni sanitarie, capire i risultati degli esami, prepararsi agli appuntamenti, gestire l’assicurazione, costruire abitudini più sane e capire che cosa chiedere dopo.
Con GPT‑5.5 Instant osserviamo un importante passo avanti nel modo in cui il modello gestisce le domande sulla salute, con miglioramenti nel riconoscere quando può essere necessaria assistenza urgente, nel chiedere il contesto rilevante, nello spiegare l’incertezza e nel rendere più comprensibili informazioni complesse. Nelle nostre valutazioni sanitarie più impegnative, GPT‑5.5 Instant raggiunge ora un livello paragonabile a quello dei nostri modelli Thinking di frontiera. Poiché è disponibile per gli utenti gratuiti in ChatGPT, più persone possono beneficiare di questi miglioramenti. Questo può significare informazioni sulla salute più facili da capire, domande migliori da porre e passaggi successivi chiari.
Questo progresso riflette sia i progressi nelle capacità dei modelli sia il lavoro guidato da medici alla base delle nostre valutazioni sanitarie. In tutte le nostre iniziative, una rete globale di medici ci aiuta a definire che cosa significhi “buono” nelle situazioni sanitarie del mondo reale, esaminando esempi di risposte dei modelli, descrivendo il comportamento ideale e individuando le modalità di errore. Lavorare con i medici ci permette di misurare i progressi nella salute e di migliorare nel tempo il modo in cui ChatGPT risponde.
Nella salute, progredire significa fornire risposte accurate, comprensibili e basate su un buon giudizio: riconoscere quando serve più contesto, spiegare l’incertezza senza esagerare la sicurezza e aiutare le persone a capire quando rivolgersi a un medico.
Per misurare questi progressi usiamo valutazioni specifiche per la salute, tra cui HealthBench e HealthBench Professional. Queste valutazioni usano conversazioni sanitarie realistiche e rubriche scritte da medici per valutare qualità come accuratezza, sicurezza, comunicazione, consapevolezza del contesto, completezza ed escalation appropriata.
GPT‑5.5 Instant raggiunge prestazioni sanitarie simili a quelle dei nostri più recenti modelli di frontiera su un aggregato di valutazioni sanitarie, tra cui HealthBench Professional, con un miglioramento sostanziale rispetto a GPT‑5.3 Instant. 5.5 Instant (rilasciato a maggio 2026) e 5.3 Instant (rilasciato a marzo 2026) sono disponibili per tutti gli utenti gratuiti in ChatGPT (soggetti a limiti), e usiamo i prezzi API per calcolare il costo di 5.4 Thinking e 5.5 Thinking.
Come ulteriore confronto, abbiamo anche chiesto a medici di scrivere risposte per conversazioni sanitarie rappresentative, con tempo illimitato e accesso a internet (ma non all’AI). Un gruppo separato di medici ha poi confrontato queste risposte scritte da medici con quelle dei modelli Instant nel tempo, esaminando qualità importanti nelle interazioni reali, tra cui accuratezza, comunicazione, completezza, rispetto delle istruzioni e utilità per le decisioni sanitarie, su 3500 risposte valutate.
Le risposte di GPT‑5.5 Instant hanno ottenuto valutazioni più alte rispetto alle risposte scritte da medici e a quelle dei modelli precedenti in tutte le dimensioni di questa valutazione.
I medici hanno valutato le risposte di GPT‑5.5 Instant come caratterizzate da meno modalità di errore rispetto a quelle dei modelli precedenti e dei medici. Per esempio, GPT 5.5 Instant ha mostrato meno casi di mancato adattamento al contesto sanitario locale, di mancato riconoscimento di segnali d’allarme o di invio alle cure, o di mancata richiesta di ulteriore contesto all’utente quando necessario, rispetto sia ai modelli precedenti sia ai medici.
Data la scala di utilizzo dei nostri modelli nella salute, un altro modo per comprendere i recenti miglioramenti dei modelli è misurare il traffico di produzione. Usiamo sistemi di monitoraggio che preservano la privacy sul traffico di produzione per tracciare possibili problemi di fattualità nelle risposte sulla salute. In base a un confronto del recente traffico di produzione sulla salute — miliardi di messaggi a settimana — il tasso di risposte con almeno un problema di fattualità segnalato è diminuito del 71% negli ultimi due mesi.
Confrontare le risposte di modelli in momenti diversi su domande sanitarie del mondo reale mostra come ChatGPT sia migliorato in aspetti importanti per la salute: riconoscere quando una situazione può richiedere attenzione urgente, gestire l’incertezza con un giudizio migliore e offrire alle persone indicazioni più chiare e utili su cosa fare dopo.
GPT-5.2 Instant
Fai clic sul nome del modello per vedere altre risposte del modello.
Questo progresso è plasmato dai medici che ci aiutano a definire, misurare e migliorare le risposte sulla salute in ChatGPT.
OpenAI collabora con una rete globale di oltre 260 medici in 60 paesi, 49 lingue e 26 specialità mediche. Il loro feedback orienta il modo in cui ChatGPT risponde alle domande sulla salute in un’ampia gamma di scenari, dalle domande quotidiane sul benessere a situazioni cliniche più complesse.
I medici esaminano esempi di risposte dei modelli e valutano se siano accurate, chiare, complete, adeguatamente prudenti e utili. Aiutano a individuare dove una risposta può trascurare un contesto importante, dove può suonare troppo sicura, dove dovrebbe essere più chiara sui passaggi successivi o incoraggiare in modo più diretto una persona a rivolgersi a un medico.
Finora, i medici hanno esaminato oltre 700.000 esempi di risposte dei modelli che riflettono come clinici e pazienti possono usare ChatGPT nel mondo reale. Ogni pochi minuti, un medico esamina una nuova risposta. Il loro feedback diventa rubriche e criteri di valutazione che aiutano i ricercatori a misurare se le risposte siano accurate, sicure, chiare, complete, adeguatamente prudenti e utili nelle situazioni sanitarie del mondo reale. Questo ci offre un modo più chiaro per capire dove i modelli stanno migliorando e dove serve ancora lavoro.
Questo lavoro sostiene anche l’impegno più ampio di OpenAI nella salute, che include strumenti pensati per aiutare le persone a comprendere e orientarsi meglio tra le informazioni sanitarie, oltre a strumenti creati per i clinici, come ChatGPT per i clinici e OpenAI per la sanità, che supportano i professionisti medici in attività come documentazione, ricerca e consulenze assistenziali.
Migliorare la salute umana sarà uno degli impatti più personali e tangibili dell’AGI. Man mano che i nostri modelli continuano a migliorare, il nostro obiettivo è rendere ChatGPT più accurato, più prudente e più utile in quei momenti, e continuare a portare questi progressi a più persone.


