메인 콘텐츠로 건너뛰기
OpenAI

2026년 6월 18일

제품

ChatGPT의 건강 인텔리전스 향상

GPT‑5.5 Instant는 모델 성능의 발전과 의사들이 주도한 평가를 바탕으로 향상된 최첨단 건강 인텔리전스를 더 많은 사람들에게 제공합니다.

로딩 중...

건강은 사람들이 ChatGPT를 활용하는 가장 의미 있는 분야 중 하나입니다. 매주 2억 3천만 명이 넘는 사람들이 건강 및 웰빙 관련 질문에 대한 도움을 얻기 위해 ChatGPT를 찾습니다. 건강 정보를 이해하고, 검사 결과를 해석하고, 진료를 준비하고, 보험 관련 절차를 파악하고, 더 건강한 생활 습관을 만들고, 다음에 어떤 질문을 해야 할지 알아보기 위해서입니다.

GPT‑5.5 Instant는 건강 관련 질문에 응답하는 방식에서 큰 발전을 이루었습니다. 긴급한 진료가 필요할 수 있는 상황을 더 잘 파악하고, 필요한 정보를 적절히 확인하며, 불확실성을 보다 명확하게 설명하고, 복잡한 정보를 이해하기 쉽게 전달하는 능력이 향상되었습니다. 가장 어려운 건강 분야 평가에서도 GPT‑5.5 Instant는 이제 최첨단 Thinking 모델에 필적하는 수준의 성능을 보입니다. 또한 ChatGPT 무료 사용자도 이용할 수 있기 때문에 더 많은 사람들이 이러한 개선의 혜택을 누릴 수 있습니다. 그 결과 건강 정보를 더 쉽게 이해하고, 더 적절한 질문을 하며, 다음에 무엇을 해야 할지 보다 명확하게 파악할 수 있습니다.

이러한 진전은 모델 역량의 발전과 의사들이 주도한 건강 평가 작업이 함께 만들어낸 결과입니다. OpenAI는 전 세계 의사 네트워크와 협력해 모델의 예시 응답을 검토하고, 이상적인 응답의 기준을 정의하며, 실패 유형을 식별하고 있습니다. 이를 통해 실제 건강 관련 상황에서 어떤 응답이 바람직한지에 대한 기준을 마련하고 있습니다. 의사들과의 협업은 건강 분야에서의 발전을 측정하고, 시간이 지남에 따라 ChatGPT의 응답 품질을 지속적으로 개선하는 데 도움이 됩니다.

건강 분야의 발전 측정

건강 분야에서 발전이란 정확하고 이해하기 쉬우며, 적절한 판단에 기반한 응답을 제공하는 것을 의미합니다. 여기에는 추가적인 정보가 필요한 시점을 파악하고, 불확실한 부분을 지나치게 단정하지 않고 설명하며, 언제 진료를 받아야 하는지 이해할 수 있도록 돕는 것이 포함됩니다.

이러한 발전을 측정하기 위해 OpenAI는 HealthBench와 HealthBench Professional을 포함한 건강 분야 전용 평가를 활용합니다. 이 평가들은 실제와 유사한 건강 관련 대화와 의사가 작성한 평가 기준을 바탕으로 정확성, 안전성, 의사소통 능력, 맥락 이해, 완전성, 그리고 적절한 진료 권고 여부 등을 평가합니다.

GPT‑5.5 Instant는 HealthBench Professional을 포함한 종합 건강 분야 평가에서 OpenAI의 최신 프런티어 모델과 유사한 수준의 성능을 보였으며, GPT‑5.3 Instant 대비 크게 향상되었습니다. 5.5 Instant(2026년 5월 출시)와 5.3 Instant(2026년 3월 출시)는 사용량 제한 내에서 모든 ChatGPT 무료 사용자에게 제공되며, 5.4 Thinking 및 5.5 Thinking의 비용은 API 요금을 기준으로 계산했습니다.

또 다른 비교를 위해 OpenAI는 의사들에게 인터넷은 자유롭게 사용할 수 있지만 AI는 사용하지 않은 상태에서 대표적인 건강 관련 대화에 대한 응답을 작성해 달라고 요청했습니다. 이후 별도의 의사 평가단이 총 3,500개의 응답을 검토하며 이러한 의사 응답과 Instant 모델의 응답을 비교했습니다. 평가에는 정확성, 의사소통 능력, 완전성, 지시 사항 준수, 그리고 건강 관련 의사결정에 얼마나 도움이 되는지 등 실제 상호작용에서 중요한 요소들이 포함되었습니다.

이 평가에서 GPT‑5.5 Instant 응답은 여러 차원에 걸쳐 의사가 작성한 응답 및 이전 모델 응답보다 더 높은 평가를 받았습니다.

의사들은 GPT‑5.5 Instant의 응답이 이전 모델과 의사 응답에 비해 실패 사례가 더 적다고 평가했습니다. 예를 들어 GPT‑5.5 Instant는 지역 의료 환경에 맞게 응답을 조정하지 못하거나, 위험 신호를 놓치거나 적절한 진료를 권고하지 못하는 경우, 또는 필요한 상황에서 사용자에게 추가 정보를 요청하지 못하는 경우가 이전 모델과 의사 응답보다 더 적었습니다.

건강 분야에서 OpenAI 모델이 사용되는 규모를 고려할 때, 최근 모델 성능이 얼마나 개선되었는지 파악하는 또 다른 방법은 실제 서비스 환경에서의 트래픽을 분석하는 것입니다. OpenAI는 개인정보를 보호하는 모니터링 시스템을 사용해 실제 서비스 환경에서 건강 관련 응답에 잠재적인 사실성 문제가 있는지 추적하고 있습니다. 최근 건강 분야의 실제 서비스 트래픽(주당 수십억 건의 메시지)을 분석한 결과, 하나 이상의 사실성 문제로 표시된 응답의 비율은 지난 두 달 동안 71% 감소했습니다.

더 나은 응답이란 무엇인가

실제 건강 관련 질문에 대해 서로 다른 시점의 모델 응답을 비교해 보면, ChatGPT가 건강 분야에서 중요한 방식으로 어떻게 발전해 왔는지 확인할 수 있습니다. 긴급한 대응이 필요할 수 있는 상황을 더 잘 인식하고, 불확실성을 보다 적절하게 다루며, 다음에 무엇을 해야 할지에 대해 더 명확하고 유용한 안내를 제공하게 되었습니다.

Why might a doctor recommend an MRI before a steroid injection for sciatica?

GPT-5.2 Instant

A doctor may recommend an MRI before a steroid injection for sciatica because the injection is more likely to be useful—and safer—when they know exactly what is compressing or irritating the nerve and where.

Common reasons include:

  • Confirming the cause of sciatica. Sciatica-like pain can come from a herniated disc, spinal stenosis, foraminal narrowing, spondylolisthesis, tumor, infection, fracture, or sometimes non-spine causes. MRI is the preferred imaging test for seeing discs, nerves, and soft tissue nerve compression. (emedicine.medscape.com)
  • Choosing the correct injection level and side. If symptoms suggest the L5 nerve root, for example, the MRI can show whether the problem is actually at L4–L5, L5–S1, or another level. This helps decide where to place the epidural or selective nerve-root injection.
  • Selecting the safest/most appropriate injection approach. Epidural steroid injections can be done by different routes—interlaminar, transforaminal, or caudal. Pre-procedure imaging helps the clinician plan the route and avoid anatomic issues that could increase risk. Many interventionalists consider advanced imaging a prerequisite because it helps optimize medication delivery and reduce risk to neural or vascular structures. (pmc.ncbi.nlm.nih.gov)
  • Checking for “red flags” or conditions where an injection may not be appropriate. MRI can help identify problems such as infection, cancer, severe stenosis, large disc extrusion, or other findings that might require urgent evaluation or a different treatment.
  • Determining whether surgery or another treatment should be considered instead. If there is severe nerve compression, progressive weakness, or certain structural problems, an injection may not be the best next step.
  • Avoiding a low-yield injection. If the MRI does not show nerve-root compression or inflammation that matches your symptoms, the doctor may reconsider whether a steroid injection is likely to help.

That said, MRI is not always required for every case of sciatica. In people without red flags, many cases improve with time, physical therapy, and medication. Some studies have questioned whether routine MRI before lumbar epidural steroid injection always improves outcomes, but guidelines and many clinicians still favor imaging when symptoms persist and an injection or surgery is being considered. (pmc.ncbi.nlm.nih.gov)

You should ask your doctor: “What are you looking for on the MRI, and how would the result change the injection plan?” That usually clarifies whether the MRI is for diagnosis, safety, targeting, or deciding whether an injection is appropriate at all.

Cited

  1. Lumbosacral Radiculopathy Workup: Imaging Studies, Other Tests, https://emedicine.medscape.com/article/95025-workup(새 창에서 열기)
  2. Diagnostic and therapeutic spinal interventions: Epidural injections - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC5764532/(새 창에서 열기)
  3. Should routine MRI of the lumbar spine be required prior to lumbar epidural steroid injection for sciatica pain? - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC4392534/(새 창에서 열기)

"
" i don't know. "
" well, you're going to have to find out. "
" i'm not sure i can. "
" you 'll figure it out. "
" i hope so. "
" i'm going to go back to the office and see if i can get some more information on this. "
" okay. "
" i 'll be back in a few hours. "
" okay. "
" bye. "
" bye. "
i hung up the phone and looked at the clock. it was almost eleven o'clock. i had been sitting there for over an hour. i got up and went into the bathroom and washed my face. i didn't want to look like a slob. i put on some clean clothes and went back into the living room. i sat down on the couch and looked at the tv. i watched the news and then i heard a knock on the door. i jumped up and ran to the door.
" hello? " i called out.
" hi, i'm dr. peters. "
" oh, hi. " i smiled. " i'm sorry i

모델 이름을 클릭하면 추가 응답을 확인할 수 있습니다.

이러한 발전을 뒷받침하는 의학적 전문성

이러한 발전의 배경에는 ChatGPT의 건강 관련 응답에 대한 기준을 마련하고, 이를 평가하며, 지속적으로 개선하는 데 함께하고 있는 의사들의 기여가 있습니다. 

OpenAI는 60개국, 49개 언어권, 26개 의료 전문 분야에 걸쳐 활동하는 260명 이상의 의사로 구성된 글로벌 네트워크와 협력하고 있습니다. 이들의 피드백은 일상적인 건강 및 웰빙 관련 질문부터 보다 복잡한 임상 상황에 이르기까지 다양한 상황에서 ChatGPT가 건강 관련 질문에 어떻게 응답해야 하는지를 결정하는 데 반영됩니다.

의사들은 모델의 예시 응답을 검토하며, 해당 응답이 정확하고 명확하며 완전한지, 적절한 수준의 신중함을 갖추고 있는지, 그리고 실제로 도움이 되는지를 평가합니다. 또한 응답이 중요한 맥락을 놓치고 있지는 않은지, 지나치게 단정적으로 들리지는 않는지, 다음 단계에 대한 안내가 충분히 명확한지, 또는 의료 서비스를 받아야 할 필요성을 더 분명하게 안내해야 하는지 등을 식별하는 데 도움을 줍니다.

지금까지 의사들은 실제 환경에서 의료진과 환자가 ChatGPT를 활용할 수 있는 다양한 상황을 반영한 70만 건 이상의 예시 응답을 검토했습니다. 현재도 몇 분마다 새로운 응답이 의사의 검토를 받고 있습니다. 이들의 피드백은 평가 기준과 루브릭으로 체계화되어, 연구자들이 실제 건강 관련 상황에서 응답이 정확하고 안전하며, 명확하고 완전한지, 적절한 수준의 신중함을 갖추고 있는지, 그리고 실제로 도움이 되는지를 평가하는 데 활용됩니다. 이를 통해 모델이 어떤 부분에서 개선되고 있는지, 또 어떤 부분에서 추가 개선이 필요한지를 보다 명확하게 파악할 수 있습니다.

건강 분야의 발전 혜택을 더 많은 사람들에게

이러한 노력은 사람들이 건강 정보를 더 잘 이해하고 활용할 수 있도록 돕는 도구부터, 의료 전문가의 문서 작성, 연구, 진료 자문 등의 업무를 지원하는 ChatGPT for CliniciansOpenAI for Healthcare 같은 도구에 이르기까지, OpenAI의 폭넓은 건강 분야 활동을 뒷받침합니다.

인류의 건강을 개선하는 것은 AGI가 가져올 가장 개인적이면서도 실질적인 영향 중 하나가 될 것입니다. OpenAI는 모델이 계속 발전함에 따라 ChatGPT가 건강 관련 상황에서 더욱 정확하고, 더욱 신중하며, 더욱 유용한 도움을 제공할 수 있도록 하는 동시에, 이러한 발전의 혜택을 더 많은 사람들에게 전달하는 것을 목표로 하고 있습니다.

작성자

OpenAI