ChatGPT’de sağlık zekâsını geliştirmek
GPT‑5.5 Instant, modellerimizdeki ilerlemeler ve hekimlerin yönettiği değerlendirmelerle şekillenen en gelişmiş sağlık zekâsını daha fazla kişiye ulaştırıyor.
Sağlık, insanların ChatGPT’yi kullandığı en anlamlı alanlardan biri. Her hafta 230 milyondan fazla kişi sağlık ve zindelikle ilgili sorularda yardım almak için ChatGPT’ye başvuruyor: sağlık bilgilerini anlamlandırmak, laboratuvar sonuçlarını yorumlamak, randevulara hazırlanmak, sigorta süreçlerinde yol almak, daha sağlıklı alışkanlıklar edinmek ve bundan sonra ne soracağını belirlemek için.
GPT‑5.5 Instant ile modelin sağlık sorularını ele alışında önemli bir ilerleme görüyoruz: acil bakım gerekebilecek durumları tanıma, ilgili bağlamı isteme, belirsizliği açıklama ve karmaşık bilgileri daha anlaşılır kılma alanlarında iyileşmeler var. En zorlu sağlık değerlendirmelerimizde GPT‑5.5 Instant artık en gelişmiş Thinking modellerimize yakın bir düzeyde performans gösteriyor. ChatGPT’de ücretsiz kullanıcılara sunulduğu için bu iyileştirmelerden daha fazla kişi yararlanabiliyor. Bu, daha anlaşılır sağlık bilgileri, sorulacak daha iyi sorular ve net sonraki adımlar anlamına gelebilir.
Bu ilerleme hem model becerilerindeki gelişmeleri hem de sağlık değerlendirmelerimizin arkasındaki hekim liderliğindeki çalışmayı yansıtıyor. Çalışmalarımız genelinde, küresel bir hekim ağı; örnek model yanıtlarını inceleyerek, ideal davranışı tanımlayarak ve hata türlerini belirleyerek gerçek dünyadaki sağlık durumlarında “iyi”nin nasıl göründüğünü tanımlamamıza yardımcı oluyor. Hekimlerle çalışmak, sağlık alanındaki ilerlemeyi ölçmemize ve ChatGPT’nin yanıtlarını zaman içinde iyileştirmemize olanak tanıyor.
Sağlıkta ilerleme; doğru, anlaşılır ve iyi muhakemeye dayanan yanıtlar sunmak demektir: daha fazla bağlam gerektiğini fark etmek, güven düzeyini abartmadan belirsizliği açıklamak ve insanların ne zaman sağlık hizmeti alması gerektiğini anlamasına yardımcı olmak.
Bu ilerlemeyi ölçmek için HealthBench ve HealthBench Professional dahil sağlığa özel değerlendirmeler kullanıyoruz. Bu değerlendirmeler; doğruluk, güvenlik, iletişim, bağlam farkındalığı, eksiksizlik ve uygun yönlendirme gibi nitelikleri ölçmek için gerçekçi sağlık konuşmaları ve hekimlerin yazdığı rubrikleri kullanıyor.
GPT‑5.5 Instant, HealthBench Professional dahil sağlık değerlendirmeleri toplamında en yeni gelişmiş modellerimize benzer sağlık performansına ulaşıyor ve GPT‑5.3 Instant’a göre belirgin biçimde iyileşiyor. 5.5 Instant (Mayıs 2026’da yayımlandı) ve 5.3 Instant (Mart 2026’da yayımlandı), ChatGPT’de tüm ücretsiz kullanıcıların erişimine açıktır (limitlere tabidir); 5.4 Thinking ve 5.5 Thinking için maliyeti hesaplamak üzere API fiyatlandırmasını kullanıyoruz.
Bir başka karşılaştırma olarak hekimlerden, sınırsız süre ve internet erişimiyle (ancak AI kullanmadan) temsili sağlık konuşmaları için yanıtlar yazmalarını da istedik. Ardından ayrı bir hekim paneli, bu hekim yanıtlarını zaman içindeki Instant modelleriyle karşılaştırdı; 3500 incelenmiş yanıt genelinde doğruluk, iletişim, eksiksizlik, yönergeleri izleme ve sağlık kararlarına yardımcı olma gibi gerçek etkileşimlerde önemli olan nitelikleri değerlendirdi.
Bu değerlendirmede GPT‑5.5 Instant yanıtları, tüm boyutlarda hekimlerin yazdığı yanıtlardan ve eski model yanıtlarından daha yüksek puan aldı.
Hekimler, GPT‑5.5 Instant yanıtlarında eski modellerin ve hekimlerin yanıtlarına kıyasla daha az hata türü bulunduğunu belirtti. Örneğin GPT 5.5 Instant’ta; yerel sağlık sistemi bağlamına göre uyarlama yapmama, uyarı işaretlerini veya sağlık hizmetine yönlendirmeyi kaçırma ya da gerektiğinde kullanıcıdan ek bağlam istememe örnekleri hem eski modellere hem de hekimlere kıyasla daha az görüldü.
Modellerimizin sağlık alanındaki kullanım ölçeği düşünüldüğünde, son model iyileştirmelerini anlamanın bir başka yolu da üretim trafiğini ölçmektir. Sağlık yanıtlarındaki olası olgusallık sorunlarını izlemek için üretim trafiğinde gizliliği koruyan izleyiciler kullanıyoruz. Sağlık alanındaki son üretim trafiğinin—haftada milyarlarca mesajın—karşılaştırmasına göre, en az bir işaretlenmiş olgusallık sorunu içeren yanıtların oranı son iki ayda %71 düştü.
Gerçek dünyadaki sağlık sorularında farklı zamanlardaki modellerin yanıtlarını karşılaştırmak, ChatGPT’nin sağlık açısından önemli yönlerde nasıl geliştiğini gösteriyor: bir durumun acil dikkat gerektirebileceğini fark etmek, belirsizliği daha iyi muhakemeyle ele almak ve insanlara bundan sonra ne yapacakları konusunda daha net, daha kullanışlı rehberlik sunmak.
GPT-5.2 Instant
Ek model yanıtlarını görmek için model adına tıklayın.
Bu ilerleme, ChatGPT’deki sağlık yanıtlarını tanımlamamıza, ölçmemize ve iyileştirmemize yardımcı olan hekimler tarafından şekillendiriliyor.
OpenAI, 60 ülke, 49 dil ve 26 tıbbi uzmanlık alanında 260’tan fazla hekimden oluşan küresel bir ağla çalışıyor. Geri bildirimleri, günlük zindelik sorularından daha karmaşık klinik durumlara kadar geniş bir senaryo yelpazesinde ChatGPT’nin sağlık sorularını nasıl yanıtladığını şekillendiriyor.
Hekimler örnek model yanıtlarını inceliyor ve bunların doğru, açık, eksiksiz, uygun ölçüde temkinli ve yararlı olup olmadığını değerlendiriyor. Bir yanıtın önemli bağlamı nerede kaçırabileceğini, nerede fazla kendinden emin görünebileceğini, sonraki adımlar konusunda nerede daha açık olması gerektiğini ya da birini tıbbi bakım almaya daha doğrudan teşvik etmesi gereken yerleri belirlemeye yardımcı oluyorlar.
Bugüne kadar hekimler, klinisyenlerin ve hastaların ChatGPT’yi gerçek dünyada nasıl kullanabileceğini yansıtan 700.000’den fazla örnek model yanıtını inceledi. Her birkaç dakikada bir hekim yeni bir yanıtı inceliyor. Geri bildirimleri, araştırmacıların yanıtların gerçek dünyadaki sağlık durumlarında doğru, güvenli, açık, eksiksiz, uygun ölçüde temkinli ve yararlı olup olmadığını ölçmesine yardımcı olan rubriklere ve değerlendirme ölçütlerine dönüşüyor. Bu da modellerin nerede geliştiğini ve nerelerde hâlâ çalışmaya ihtiyaç duyduğunu daha net görmemizi sağlıyor.
Bu çalışma aynı zamanda OpenAI’ın sağlık alanındaki daha geniş çalışmalarını da destekliyor: insanların sağlık bilgilerini daha iyi anlamasına ve bu bilgilerde yolunu bulmasına yardımcı olan araçlardan, Klinisyenler için ChatGPT ve Sağlık Hizmetleri için OpenAI gibi klinisyenler için geliştirilmiş, tıp profesyonellerini dokümantasyon, araştırma ve bakım konsültasyonu gibi görevlerde destekleyen araçlara kadar.
İnsan sağlığını iyileştirmek, AGI (genel yapay zeka)’nın en kişisel ve somut etkilerinden biri olacak. Modellerimiz gelişmeye devam ettikçe hedefimiz, ChatGPT’yi bu anlarda daha doğru, daha dikkatli ve daha yararlı kılmak ve bu ilerlemeyi daha fazla kişiye ulaştırmayı sürdürmek.


