Ulepszamy sztuczną inteligencję dla ochrony zdrowia w ChatGPT
GPT‑5.5 Instant zapewnia najnowszą sztuczną inteligencję skupiającą się na ochronie zdrowia większej liczbie osób dzięki postępom w naszych modelach i ocenie prowadzonej przez lekarzy.
Zdrowie to jeden z najważniejszych obszarów, w których ludzie korzystają z ChatGPT. Co tydzień ponad 230 milionów osób zwraca się do ChatGPT z pytaniami o zdrowie i dobrostan: aby lepiej zrozumieć informacje medyczne, wyniki badań laboratoryjnych, przygotować się do wizyt, poruszać się po zawiłościach warunków ubezpieczeń, budować zdrowsze nawyki i ustalić, o co zapytać dalej.
W GPT‑5.5 Instant widzimy znaczący krok naprzód w tym, jak model obsługuje pytania dotyczące zdrowia: lepiej rozpoznaje sytuacje, w których może być potrzebna pilna pomoc, prosi o istotny kontekst, wyjaśnia niepewność i ułatwia zrozumienie złożonych informacji. W naszych najtrudniejszych ocenach dotyczących zdrowia GPT‑5.5 Instant osiąga obecnie poziom porównywalny z naszymi najnowocześniejszymi modelami Thinking. A ponieważ jest dostępny dla użytkowników bezpłatnych planów ChatGPT, z tych ulepszeń może skorzystać więcej osób. Może to oznaczać łatwiejsze do zrozumienia informacje o zdrowiu, lepsze pytania i jasne kolejne kroki.
Ten postęp odzwierciedla zarówno rozwój możliwości modeli, jak i pracę nad naszymi ocenami zdrowotnymi prowadzoną przez lekarzy. W ramach tych działań globalna sieć lekarzy pomaga określać, co oznacza „dobra” odpowiedź w rzeczywistych sytuacjach zdrowotnych: przegląda przykładowe odpowiedzi modelu, opisuje pożądane zachowanie i wskazuje tryby niepowodzeń. Współpraca z lekarzami pozwala nam mierzyć postępy w obszarze zdrowia i z czasem ulepszać sposób, w jaki odpowiada ChatGPT.
W zdrowiu postęp oznacza udzielanie odpowiedzi dokładnych, zrozumiałych i opartych na dobrym osądzie: rozpoznawanie, kiedy potrzebny jest dodatkowy kontekst, wyjaśnianie niepewności bez przesadnej pewności oraz pomaganie ludziom zrozumieć, kiedy powinni zgłosić się po opiekę.
Aby mierzyć ten postęp, korzystamy z ocen specyficznych dla zdrowia, w tym HealthBench i HealthBench Professional. Oceny te wykorzystują realistyczne rozmowy o zdrowiu oraz kryteria opracowane przez lekarzy, aby oceniać takie cechy jak dokładność, bezpieczeństwo, komunikacja, świadomość kontekstu, kompletność i właściwe kierowanie do pilniejszej pomocy.
GPT‑5.5 Instant osiąga wyniki w obszarze ochrony zdrowia podobne do naszych najnowszych modeli pionierskich w zagregowanym zestawie ocen dotyczących zdrowia, w tym HealthBench Professional, co oznacza znaczną poprawę względem GPT‑5.3 Instant. 5.5 Instant (wydany w maju 2026 r.) i 5.3 Instant (wydany w marcu 2026 r.) są dostępne dla wszystkich bezpłatnych użytkowników ChatGPT (z zastrzeżeniem limitów), a do obliczania kosztu 5.4 Thinking i 5.5 Thinking używamy cennika API.
Jako dodatkowe porównanie poprosiliśmy także lekarzy o napisanie odpowiedzi do reprezentatywnych rozmów dotyczących zdrowia, bez limitu czasu i z dostępem do internetu, ale bez użycia AI. Następnie osobny panel lekarzy porównał te odpowiedzi napisane przez lekarzy z modelami Instant w kolejnych okresach, oceniając cechy ważne w rzeczywistych interakcjach — w tym dokładność, komunikację, kompletność, stosowanie się do instrukcji i przydatność w podejmowaniu decyzji zdrowotnych — wśród 3500 przejrzanych odpowiedzi.
W tej ocenie odpowiedzi GPT‑5.5 Instant uzyskały wyższe oceny w różnych wymiarach niż odpowiedzi napisane przez lekarzy i odpowiedzi starszych modeli.
Lekarze ocenili, że odpowiedzi GPT‑5.5 Instant mają mniej trybów niepowodzeń niż odpowiedzi starszych modeli i lekarzy. Na przykład GPT 5.5 Instant rzadziej niż starsze modele i lekarze nie dostosowywał odpowiedzi do lokalnego kontekstu opieki zdrowotnej, pomijał sygnały alarmowe lub zalecenie skorzystania z opieki albo nie prosił użytkownika o dodatkowy kontekst, gdy było to potrzebne.
Biorąc pod uwagę skalę wykorzystania naszych modeli w obszarze zdrowia, innym sposobem zrozumienia ostatnich ulepszeń modelu jest pomiar ruchu produkcyjnego. W ruchu produkcyjnym używamy monitorów chroniących prywatność, aby śledzić możliwe problemy z rzeczowością odpowiedzi dotyczących zdrowia. Na podstawie porównania niedawnego ruchu produkcyjnego w obszarze zdrowia — miliardów wiadomości tygodniowo — odsetek odpowiedzi z co najmniej jednym oznaczonym problemem dotyczącym rzeczowości spadł w ostatnich dwóch miesiącach o 71%.
Porównywanie odpowiedzi modeli z różnych momentów na rzeczywiste pytania zdrowotne pokazuje, jak ChatGPT poprawił się w obszarach istotnych dla zdrowia: rozpoznawaniu sytuacji, które mogą wymagać pilnej uwagi, lepszym radzeniu sobie z niepewnością i udzielaniu ludziom jaśniejszych, bardziej użytecznych wskazówek, co zrobić dalej.
GPT-5.2 Instant
Kliknij nazwę modelu, aby zobaczyć dodatkowe odpowiedzi modelu.
Ten postęp kształtują lekarze, którzy pomagają nam definiować, mierzyć i ulepszać odpowiedzi dotyczące zdrowia w ChatGPT.
OpenAI współpracuje z globalną siecią ponad 260 lekarzy z 60 krajów, reprezentujących 49 języków i 26 specjalizacji medycznych. Ich opinie wpływają na to, jak ChatGPT odpowiada na pytania zdrowotne w szerokim zakresie scenariuszy — od codziennych pytań o dobrostan po bardziej złożone sytuacje kliniczne.
Lekarze przeglądają przykładowe odpowiedzi modelu i oceniają, czy są dokładne, jasne, kompletne, odpowiednio ostrożne i użyteczne. Pomagają wskazać, gdzie odpowiedź może pomijać ważny kontekst, brzmieć zbyt pewnie, wymagać jaśniejszego określenia kolejnych kroków albo bardziej bezpośrednio zachęcać do skorzystania z opieki medycznej.
Do tej pory lekarze przejrzeli ponad 700 000 przykładowych odpowiedzi modelu, które odzwierciedlają, jak klinicyści i pacjenci mogą korzystać z ChatGPT w rzeczywistych sytuacjach. Co kilka minut lekarz przegląda nową odpowiedź. Ich opinie stają się kryteriami oceny, które pomagają badaczom mierzyć, czy odpowiedzi są dokładne, bezpieczne, jasne, kompletne, odpowiednio ostrożne i użyteczne w rzeczywistych sytuacjach zdrowotnych. Daje nam to jaśniejszy sposób oceny, w czym modele stają się lepsze, a gdzie nadal wymagają pracy.
Ta praca wspiera również szersze działania OpenAI w obszarze zdrowia, obejmujące zarówno narzędzia pomagające ludziom lepiej rozumieć informacje zdrowotne i korzystać z nich, jak i narzędzia tworzone dla klinicystów, takie jak ChatGPT for Clinicians oraz OpenAI for Healthcare, które wspierają specjalistów medycznych w zadaniach takich jak dokumentacja, badania i konsultacje dotyczące opieki.
Poprawa zdrowia ludzi będzie jednym z najbardziej osobistych i namacalnych skutków AGI. W miarę jak nasze modele nadal się rozwijają, naszym celem jest, aby ChatGPT był w takich chwilach dokładniejszy, ostrożniejszy i bardziej użyteczny — oraz abyśmy mogli udostępniać ten postęp coraz większej liczbie osób.


