Melhorar a inteligência de saúde no ChatGPT
O GPT‑5.5 Instant leva inteligência de saúde de fronteira a mais pessoas, moldada por avanços nos nossos modelos e pela avaliação liderada por médicos.
A saúde é uma das formas mais importantes como as pessoas usam o ChatGPT. Todas as semanas, mais de 230 milhões de pessoas recorrem ao ChatGPT para obter ajuda com questões de saúde e bem-estar: interpretar informação de saúde, compreender resultados de análises, preparar consultas, lidar com seguros, criar hábitos mais saudáveis e perceber o que perguntar a seguir.
Com o GPT‑5.5 Instant, estamos a observar um avanço substancial na forma como o modelo lida com questões de saúde, com melhorias na identificação de situações em que podem ser necessários cuidados urgentes, na recolha de contexto relevante, na explicação da incerteza e na simplificação de informação complexa. Nas nossas avaliações de saúde mais exigentes, o GPT‑5.5 Instant tem agora um desempenho comparável ao dos nossos modelos Thinking de fronteira. Por estar disponível para utilizadores gratuitos no ChatGPT, mais pessoas podem beneficiar destas melhorias. Isto pode significar informação de saúde mais fácil de compreender, melhores perguntas a fazer e próximos passos claros.
Esse progresso reflete tanto avanços nas capacidades dos modelos como o trabalho liderado por médicos por detrás das nossas avaliações de saúde. Em todos os nossos esforços, uma rede global de médicos ajuda a definir o que é uma “boa” resposta em situações de saúde reais, analisando exemplos de respostas dos modelos, descrevendo o comportamento ideal e identificando modos de falha. Trabalhar com médicos dá-nos uma forma de medir o progresso em saúde e de melhorar a forma como o ChatGPT responde ao longo do tempo.
Na área da saúde, progredir significa dar respostas rigorosas, compreensíveis e assentes em bom julgamento: reconhecer quando é necessário mais contexto, explicar a incerteza sem exagerar a confiança e ajudar as pessoas a perceber quando devem procurar cuidados.
Para medir esse progresso, usamos avaliações específicas de saúde, incluindo o HealthBench e o HealthBench Professional. Estas avaliações usam conversas de saúde realistas e grelhas de avaliação escritas por médicos para avaliar qualidades como rigor, segurança, comunicação, consciência do contexto, completude e encaminhamento adequado.
O GPT‑5.5 Instant atinge um desempenho em saúde semelhante ao dos nossos mais recentes modelos de fronteira num agregado de avaliações de saúde, incluindo o HealthBench Professional, melhorando substancialmente face ao GPT‑5.3 Instant. O 5.5 Instant (lançado em maio de 2026) e o 5.3 Instant (lançado em março de 2026) estão disponíveis para todos os utilizadores gratuitos no ChatGPT (sujeitos a limites), e usamos os preços da API para calcular o custo do 5.4 Thinking e do 5.5 Thinking.
Como outro termo de comparação, também pedimos a médicos que escrevessem respostas para conversas de saúde representativas, com tempo ilimitado e acesso à internet (mas não a AI). Depois, um painel separado de médicos comparou estas respostas escritas por médicos com as dos modelos Instant ao longo do tempo, analisando qualidades importantes em interações reais, incluindo rigor, comunicação, completude, cumprimento de instruções e utilidade para decisões de saúde, num total de 3500 respostas revistas.
As respostas do GPT‑5.5 Instant foram classificadas acima das respostas escritas por médicos e das respostas de modelos mais antigos em todas as dimensões desta avaliação.
Os médicos classificaram as respostas do GPT‑5.5 Instant como tendo menos modos de falha do que as de modelos mais antigos e as dos médicos. Por exemplo, o GPT 5.5 Instant teve menos casos de falta de adaptação ao contexto local de cuidados de saúde, de sinais de alerta ou encaminhamento para cuidados não identificados, ou de não solicitar contexto adicional ao utilizador quando necessário, em comparação tanto com modelos mais antigos como com médicos.
Dada a escala de utilização dos nossos modelos na área da saúde, outra forma de compreender as melhorias recentes dos modelos é medir o tráfego em produção. Usamos monitores que preservam a privacidade no tráfego em produção para acompanhar possíveis problemas de factualidade nas respostas de saúde. Com base numa comparação do tráfego recente em produção na área da saúde — milhares de milhões de mensagens por semana — a taxa de respostas com pelo menos um problema de factualidade assinalado diminuiu 71% nos últimos dois meses.
Comparar respostas de modelos em diferentes momentos, em perguntas de saúde do mundo real, mostra como o ChatGPT melhorou em aspetos que importam para a saúde: reconhecer quando uma situação pode exigir atenção urgente, lidar com a incerteza com melhor julgamento e dar às pessoas orientação mais clara e útil sobre o que fazer a seguir.
GPT-5.2 Instant
Clique no nome do modelo para ver respostas adicionais do modelo.
Este progresso é moldado por médicos que nos ajudam a definir, medir e melhorar as respostas de saúde no ChatGPT.
A OpenAI trabalha com uma rede global de mais de 260 médicos em 60 países, 49 línguas e 26 especialidades médicas. O seu feedback orienta a forma como o ChatGPT responde a perguntas de saúde numa grande variedade de cenários, desde questões quotidianas de bem-estar até situações clínicas mais complexas.
Os médicos reveem exemplos de respostas dos modelos e avaliam se são rigorosas, claras, completas, devidamente cautelosas e úteis. Ajudam a identificar onde uma resposta pode não captar contexto importante, onde pode soar demasiado confiante, onde deve ser mais clara quanto aos próximos passos ou incentivar mais diretamente alguém a procurar cuidados médicos.
Até à data, os médicos já reviram mais de 700 000 exemplos de respostas dos modelos que refletem a forma como clínicos e pacientes podem usar o ChatGPT no mundo real. A cada poucos minutos, um médico revê uma nova resposta. O seu feedback transforma-se em grelhas de avaliação e critérios de avaliação que ajudam os investigadores a medir se as respostas são rigorosas, seguras, claras, completas, devidamente cautelosas e úteis em situações de saúde reais. Isto dá-nos uma forma mais clara de perceber onde os modelos estão a melhorar e onde ainda precisam de trabalho.
Este trabalho também apoia o trabalho mais amplo da OpenAI na área da saúde, abrangendo ferramentas que ajudam as pessoas a compreender melhor a informação de saúde e a orientar-se nela, bem como ferramentas criadas para clínicos, como ChatGPT for Clinicians e OpenAI for Healthcare, que apoiam profissionais de saúde em tarefas como documentação, investigação e consultas de cuidados.
Melhorar a saúde humana será um dos impactos mais pessoais e tangíveis da AGI. À medida que os nossos modelos continuam a melhorar, o nosso objetivo é tornar o ChatGPT mais rigoroso, mais cuidadoso e mais útil nesses momentos — e continuar a levar esse progresso a mais pessoas.


