Vai al contenuto principale
OpenAI

18 giugno 2026

Prodotto

Migliorare l’intelligenza sanitaria in ChatGPT

GPT‑5.5 Instant porta a più persone un’intelligenza sanitaria di frontiera, plasmata dai progressi dei nostri modelli e da valutazioni guidate da medici.

Caricamento in corso...

La salute è uno degli ambiti più significativi in cui le persone usano ChatGPT. Ogni settimana, più di 230 milioni di persone si rivolgono a ChatGPT per ricevere aiuto su domande di salute e benessere: orientarsi tra le informazioni sanitarie, capire i risultati degli esami, prepararsi agli appuntamenti, gestire l’assicurazione, costruire abitudini più sane e capire che cosa chiedere dopo.

Con GPT‑5.5 Instant osserviamo un importante passo avanti nel modo in cui il modello gestisce le domande sulla salute, con miglioramenti nel riconoscere quando può essere necessaria assistenza urgente, nel chiedere il contesto rilevante, nello spiegare l’incertezza e nel rendere più comprensibili informazioni complesse. Nelle nostre valutazioni sanitarie più impegnative, GPT‑5.5 Instant raggiunge ora un livello paragonabile a quello dei nostri modelli Thinking di frontiera. Poiché è disponibile per gli utenti gratuiti in ChatGPT, più persone possono beneficiare di questi miglioramenti. Questo può significare informazioni sulla salute più facili da capire, domande migliori da porre e passaggi successivi chiari.

Questo progresso riflette sia i progressi nelle capacità dei modelli sia il lavoro guidato da medici alla base delle nostre valutazioni sanitarie. In tutte le nostre iniziative, una rete globale di medici ci aiuta a definire che cosa significhi “buono” nelle situazioni sanitarie del mondo reale, esaminando esempi di risposte dei modelli, descrivendo il comportamento ideale e individuando le modalità di errore. Lavorare con i medici ci permette di misurare i progressi nella salute e di migliorare nel tempo il modo in cui ChatGPT risponde.

Misurare i progressi nella salute

Nella salute, progredire significa fornire risposte accurate, comprensibili e basate su un buon giudizio: riconoscere quando serve più contesto, spiegare l’incertezza senza esagerare la sicurezza e aiutare le persone a capire quando rivolgersi a un medico.

Per misurare questi progressi usiamo valutazioni specifiche per la salute, tra cui HealthBench e HealthBench Professional. Queste valutazioni usano conversazioni sanitarie realistiche e rubriche scritte da medici per valutare qualità come accuratezza, sicurezza, comunicazione, consapevolezza del contesto, completezza ed escalation appropriata.

GPT‑5.5 Instant raggiunge prestazioni sanitarie simili a quelle dei nostri più recenti modelli di frontiera su un aggregato di valutazioni sanitarie, tra cui HealthBench Professional, con un miglioramento sostanziale rispetto a GPT‑5.3 Instant. 5.5 Instant (rilasciato a maggio 2026) e 5.3 Instant (rilasciato a marzo 2026) sono disponibili per tutti gli utenti gratuiti in ChatGPT (soggetti a limiti), e usiamo i prezzi API per calcolare il costo di 5.4 Thinking e 5.5 Thinking.

Come ulteriore confronto, abbiamo anche chiesto a medici di scrivere risposte per conversazioni sanitarie rappresentative, con tempo illimitato e accesso a internet (ma non all’AI). Un gruppo separato di medici ha poi confrontato queste risposte scritte da medici con quelle dei modelli Instant nel tempo, esaminando qualità importanti nelle interazioni reali, tra cui accuratezza, comunicazione, completezza, rispetto delle istruzioni e utilità per le decisioni sanitarie, su 3500 risposte valutate.

Le risposte di GPT‑5.5 Instant hanno ottenuto valutazioni più alte rispetto alle risposte scritte da medici e a quelle dei modelli precedenti in tutte le dimensioni di questa valutazione.

I medici hanno valutato le risposte di GPT‑5.5 Instant come caratterizzate da meno modalità di errore rispetto a quelle dei modelli precedenti e dei medici. Per esempio, GPT 5.5 Instant ha mostrato meno casi di mancato adattamento al contesto sanitario locale, di mancato riconoscimento di segnali d’allarme o di invio alle cure, o di mancata richiesta di ulteriore contesto all’utente quando necessario, rispetto sia ai modelli precedenti sia ai medici.

Data la scala di utilizzo dei nostri modelli nella salute, un altro modo per comprendere i recenti miglioramenti dei modelli è misurare il traffico di produzione. Usiamo sistemi di monitoraggio che preservano la privacy sul traffico di produzione per tracciare possibili problemi di fattualità nelle risposte sulla salute. In base a un confronto del recente traffico di produzione sulla salute — miliardi di messaggi a settimana — il tasso di risposte con almeno un problema di fattualità segnalato è diminuito del 71% negli ultimi due mesi.

Come sono le risposte migliori

Confrontare le risposte di modelli in momenti diversi su domande sanitarie del mondo reale mostra come ChatGPT sia migliorato in aspetti importanti per la salute: riconoscere quando una situazione può richiedere attenzione urgente, gestire l’incertezza con un giudizio migliore e offrire alle persone indicazioni più chiare e utili su cosa fare dopo.

Why might a doctor recommend an MRI before a steroid injection for sciatica?

GPT-5.2 Instant

A doctor may recommend an MRI before a steroid injection for sciatica because the injection is more likely to be useful—and safer—when they know exactly what is compressing or irritating the nerve and where.

Common reasons include:

  • Confirming the cause of sciatica. Sciatica-like pain can come from a herniated disc, spinal stenosis, foraminal narrowing, spondylolisthesis, tumor, infection, fracture, or sometimes non-spine causes. MRI is the preferred imaging test for seeing discs, nerves, and soft tissue nerve compression. (emedicine.medscape.com)
  • Choosing the correct injection level and side. If symptoms suggest the L5 nerve root, for example, the MRI can show whether the problem is actually at L4–L5, L5–S1, or another level. This helps decide where to place the epidural or selective nerve-root injection.
  • Selecting the safest/most appropriate injection approach. Epidural steroid injections can be done by different routes—interlaminar, transforaminal, or caudal. Pre-procedure imaging helps the clinician plan the route and avoid anatomic issues that could increase risk. Many interventionalists consider advanced imaging a prerequisite because it helps optimize medication delivery and reduce risk to neural or vascular structures. (pmc.ncbi.nlm.nih.gov)
  • Checking for “red flags” or conditions where an injection may not be appropriate. MRI can help identify problems such as infection, cancer, severe stenosis, large disc extrusion, or other findings that might require urgent evaluation or a different treatment.
  • Determining whether surgery or another treatment should be considered instead. If there is severe nerve compression, progressive weakness, or certain structural problems, an injection may not be the best next step.
  • Avoiding a low-yield injection. If the MRI does not show nerve-root compression or inflammation that matches your symptoms, the doctor may reconsider whether a steroid injection is likely to help.

That said, MRI is not always required for every case of sciatica. In people without red flags, many cases improve with time, physical therapy, and medication. Some studies have questioned whether routine MRI before lumbar epidural steroid injection always improves outcomes, but guidelines and many clinicians still favor imaging when symptoms persist and an injection or surgery is being considered. (pmc.ncbi.nlm.nih.gov)

You should ask your doctor: “What are you looking for on the MRI, and how would the result change the injection plan?” That usually clarifies whether the MRI is for diagnosis, safety, targeting, or deciding whether an injection is appropriate at all.

Cited

  1. Lumbosacral Radiculopathy Workup: Imaging Studies, Other Tests, https://emedicine.medscape.com/article/95025-workup(si apre in una nuova finestra)
  2. Diagnostic and therapeutic spinal interventions: Epidural injections - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC5764532/(si apre in una nuova finestra)
  3. Should routine MRI of the lumbar spine be required prior to lumbar epidural steroid injection for sciatica pain? - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC4392534/(si apre in una nuova finestra)

"
" i don't know. "
" well, you're going to have to find out. "
" i'm not sure i can. "
" you 'll figure it out. "
" i hope so. "
" i'm going to go back to the office and see if i can get some more information on this. "
" okay. "
" i 'll be back in a few hours. "
" okay. "
" bye. "
" bye. "
i hung up the phone and looked at the clock. it was almost eleven o'clock. i had been sitting there for over an hour. i got up and went into the bathroom and washed my face. i didn't want to look like a slob. i put on some clean clothes and went back into the living room. i sat down on the couch and looked at the tv. i watched the news and then i heard a knock on the door. i jumped up and ran to the door.
" hello? " i called out.
" hi, i'm dr. peters. "
" oh, hi. " i smiled. " i'm sorry i

Fai clic sul nome del modello per vedere altre risposte del modello.

La competenza medica dietro il progresso

Questo progresso è plasmato dai medici che ci aiutano a definire, misurare e migliorare le risposte sulla salute in ChatGPT. 

OpenAI collabora con una rete globale di oltre 260 medici in 60 paesi, 49 lingue e 26 specialità mediche. Il loro feedback orienta il modo in cui ChatGPT risponde alle domande sulla salute in un’ampia gamma di scenari, dalle domande quotidiane sul benessere a situazioni cliniche più complesse.

I medici esaminano esempi di risposte dei modelli e valutano se siano accurate, chiare, complete, adeguatamente prudenti e utili. Aiutano a individuare dove una risposta può trascurare un contesto importante, dove può suonare troppo sicura, dove dovrebbe essere più chiara sui passaggi successivi o incoraggiare in modo più diretto una persona a rivolgersi a un medico.

Finora, i medici hanno esaminato oltre 700.000 esempi di risposte dei modelli che riflettono come clinici e pazienti possono usare ChatGPT nel mondo reale. Ogni pochi minuti, un medico esamina una nuova risposta. Il loro feedback diventa rubriche e criteri di valutazione che aiutano i ricercatori a misurare se le risposte siano accurate, sicure, chiare, complete, adeguatamente prudenti e utili nelle situazioni sanitarie del mondo reale. Questo ci offre un modo più chiaro per capire dove i modelli stanno migliorando e dove serve ancora lavoro.

Portare i miglioramenti nella salute a più persone

Questo lavoro sostiene anche l’impegno più ampio di OpenAI nella salute, che include strumenti pensati per aiutare le persone a comprendere e orientarsi meglio tra le informazioni sanitarie, oltre a strumenti creati per i clinici, come ChatGPT per i clinici e OpenAI per la sanità, che supportano i professionisti medici in attività come documentazione, ricerca e consulenze assistenziali.

Migliorare la salute umana sarà uno degli impatti più personali e tangibili dell’AGI. Man mano che i nostri modelli continuano a migliorare, il nostro obiettivo è rendere ChatGPT più accurato, più prudente e più utile in quei momenti, e continuare a portare questi progressi a più persone.

Autore

OpenAI