Îmbunătățirea inteligenței medicale a ChatGPT
GPT‑5.5 Instant aduce inteligență de vârf în sănătate către mai mulți oameni, bazată pe progresele modelelor noastre și pe evaluarea condusă de medici.
Sănătatea este unul dintre cele mai importante moduri în care oamenii folosesc ChatGPT. În fiecare săptămână, peste 230 de milioane de oameni apelează la ChatGPT pentru ajutor cu întrebări despre sănătate și bunăstare: să înțeleagă informații medicale, rezultate de laborator, să se pregătească pentru consultații, să gestioneze asigurările, să-și formeze obiceiuri mai sănătoase și să afle ce să întrebe mai departe.
Cu GPT‑5.5 Instant, vedem un progres substanțial în modul în care modelul gestionează întrebările despre sănătate, cu îmbunătățiri în recunoașterea situațiilor în care poate fi necesară îngrijire urgentă, solicitarea contextului relevant, explicarea incertitudinii și prezentarea informațiilor complexe într-un mod mai ușor de înțeles. În cele mai dificile evaluări ale noastre în domeniul sănătății, GPT‑5.5 Instant atinge acum un nivel comparabil cu modelele noastre Thinking de frontieră. Deoarece este disponibil pentru utilizatorii gratuiți în ChatGPT, mai mulți oameni pot beneficia de aceste îmbunătățiri. Asta poate însemna informații medicale mai ușor de înțeles, întrebări mai bune de pus și pași următori clari.
Acest progres reflectă atât evoluția capacităților modelului, cât și munca condusă de medici din spatele evaluărilor noastre în sănătate. În toate eforturile noastre, o rețea globală de medici ne ajută să definim cum arată un răspuns „bun” în situații reale de sănătate, analizând exemple de răspunsuri ale modelului, descriind comportamentul ideal și identificând modurile de eșec. Colaborarea cu medicii ne oferă o modalitate de a măsura progresul în sănătate și de a îmbunătăți în timp modul în care răspunde ChatGPT.
În sănătate, progresul înseamnă răspunsuri exacte, ușor de înțeles și bazate pe o judecată solidă: să recunoască atunci când este nevoie de mai mult context, să explice incertitudinea fără a exagera nivelul de încredere și să ajute oamenii să înțeleagă când să solicite îngrijire medicală.
Pentru a măsura acest progres, folosim evaluări specifice sănătății, inclusiv HealthBench și HealthBench Professional. Aceste evaluări folosesc conversații medicale realiste și rubrici scrise de medici pentru a aprecia calități precum acuratețea, siguranța, comunicarea, conștientizarea contextului, caracterul complet și escaladarea adecvată.
GPT‑5.5 Instant atinge o performanță în sănătate similară cu cele mai recente modele de vârf ale noastre pe un agregat de evaluări în sănătate, inclusiv HealthBench Professional, îmbunătățindu-se substanțial față de GPT‑5.3 Instant. 5.5 Instant (lansat în mai 2026) și 5.3 Instant (lansat în martie 2026) sunt disponibile pentru toți utilizatorii gratuiți în ChatGPT (în limitele aplicabile), iar noi folosim tarifele API pentru a calcula costul pentru 5.4 Thinking și 5.5 Thinking.
Ca altă comparație, le-am cerut și medicilor să scrie răspunsuri pentru conversații reprezentative despre sănătate, cu timp nelimitat și acces la internet (dar nu la AI). Apoi, un panel separat de medici a comparat aceste răspunsuri scrise de medici cu modelele Instant de-a lungul timpului, analizând calități importante în interacțiuni reale, inclusiv acuratețea, comunicarea, caracterul complet, respectarea instrucțiunilor și utilitatea pentru deciziile privind sănătatea, pe 3.500 de răspunsuri evaluate.
Răspunsurile GPT‑5.5 Instant au fost evaluate mai bine decât răspunsurile scrise de medici și cele ale modelelor mai vechi, pe toate dimensiunile acestei evaluări.
Medicii au evaluat răspunsurile GPT‑5.5 Instant ca având mai puține moduri de eșec decât cele ale modelelor mai vechi și ale medicilor. De exemplu, GPT 5.5 Instant a avut mai puține situații în care nu a adaptat răspunsul la contextul medical local, a omis semnale de alarmă sau trimiterea către îngrijire ori nu a cerut utilizatorului context suplimentar atunci când era necesar, comparativ atât cu modelele mai vechi, cât și cu medicii.
Având în vedere amploarea utilizării modelelor noastre în sănătate, o altă modalitate de a înțelege îmbunătățirile recente ale modelului este măsurarea traficului de producție. Folosim monitoare care protejează confidențialitatea pe traficul de producție pentru a urmări posibile probleme de factualitate în răspunsurile despre sănătate. Pe baza unei comparații a traficului recent de producție în sănătate — miliarde de mesaje pe săptămână — rata răspunsurilor cu cel puțin o problemă de factualitate semnalată a scăzut cu 71% în ultimele două luni.
Compararea răspunsurilor de la modele aflate în momente diferite în timp, pe întrebări reale despre sănătate, arată cum s-a îmbunătățit ChatGPT în aspecte importante pentru sănătate: recunoașterea situațiilor care pot necesita atenție urgentă, gestionarea incertitudinii cu o judecată mai bună și oferirea unor îndrumări mai clare și mai utile despre ce trebuie făcut în continuare.
GPT-5.2 Instant
Fă clic pe numele modelului pentru a vedea răspunsuri suplimentare ale modelului.
Acest progres este modelat de medicii care ne ajută să definim, să măsurăm și să îmbunătățim răspunsurile despre sănătate în ChatGPT.
OpenAI colaborează cu o rețea globală de peste 260 de medici din 60 de țări, care acoperă 49 de limbi și 26 de specialități medicale. Feedbackul lor influențează modul în care ChatGPT răspunde la întrebări despre sănătate într-o gamă largă de scenarii, de la întrebări cotidiene despre bunăstare până la situații clinice mai complexe.
Medicii analizează exemple de răspunsuri ale modelului și evaluează dacă sunt exacte, clare, complete, suficient de prudente și utile. Ei ajută la identificarea situațiilor în care un răspuns poate omite context important, poate suna prea sigur, ar trebui să fie mai clar cu privire la pașii următori sau să încurajeze mai direct pe cineva să solicite îngrijire medicală.
Până în prezent, medicii au analizat peste 700.000 de exemple de răspunsuri generate de model, care reflectă modul în care clinicienii și pacienții ar putea utiliza ChatGPT în situații reale. La fiecare câteva minute, un medic evaluează un nou răspuns. Feedbackul acestora este transformat în rubrici și criterii de evaluare care îi ajută pe cercetători să măsoare dacă răspunsurile sunt corecte, sigure, clare, complete, suficient de prudente și utile în contexte medicale reale. Acest proces ne oferă o imagine mai clară asupra aspectelor la care modelele se îmbunătățesc și a domeniilor în care mai este nevoie de progres.
Această activitate susține și eforturile mai ample ale OpenAI în sănătate, de la instrumente care îi ajută pe oameni să înțeleagă și să gestioneze mai bine informațiile medicale până la instrumente create pentru clinicieni, precum ChatGPT pentru clinicieni și OpenAI pentru asistență medicală, care îi sprijină pe profesioniștii din domeniul medical în sarcini precum documentarea, cercetarea și consultațiile medicale.
Îmbunătățirea sănătății umane va fi unul dintre cele mai personale și tangibile efecte ale AGI. Pe măsură ce modelele noastre continuă să se îmbunătățească, obiectivul nostru este să facem ChatGPT mai exact, mai atent și mai util în acele momente — și să aducem în continuare acest progres către mai mulți oameni.


