Meningkatkan kecerdasan kesehatan di ChatGPT
GPT‑5.5 Instant menghadirkan kecerdasan kesehatan terdepan bagi lebih banyak orang, dibentuk oleh kemajuan model kami dan evaluasi yang dipimpin dokter.
Kesehatan merupakan salah satu aspek pemanfaatan ChatGPT yang paling bermakna bagi pengguna. Setiap minggu, lebih dari 230 juta orang menggunakan ChatGPT untuk mendapatkan bantuan terkait pertanyaan kesehatan dan kebugaran: memahami informasi kesehatan, memahami hasil laboratorium, mempersiapkan janji temu, mengurus masalah asuransi, membangun kebiasaan yang lebih sehat, dan mencari tahu apa yang perlu ditanyakan berikutnya.
Dengan GPT‑5.5 Instant, kami melihat langkah maju yang besar dalam cara model menangani pertanyaan kesehatan, dengan peningkatan dalam mengenali kapan perawatan mendesak mungkin diperlukan, meminta konteks yang relevan, menjelaskan ketidakpastian, dan membuat informasi kompleks lebih mudah dipahami. Dalam evaluasi kesehatan kami yang paling menantang, GPT‑5.5 Instant kini bekerja pada tingkat yang sebanding dengan model Thinking terdepan kami. Karena tersedia bagi pengguna gratis di ChatGPT, lebih banyak orang dapat merasakan manfaat peningkatan ini. Artinya, informasi kesehatan dapat menjadi lebih mudah dipahami, pertanyaan yang diajukan lebih baik, dan langkah berikutnya lebih jelas.
Kemajuan tersebut mencerminkan peningkatan kemampuan model sekaligus pekerjaan yang dipimpin dokter di balik evaluasi kesehatan kami. Di seluruh upaya kami, jaringan dokter global membantu mendefinisikan seperti apa respons yang “baik” dalam situasi kesehatan dunia nyata dengan meninjau contoh respons model, menggambarkan perilaku ideal, dan mengidentifikasi mode kegagalan. Bekerja sama dengan dokter memberi kami cara untuk mengukur kemajuan di bidang kesehatan dan meningkatkan respons ChatGPT dari waktu ke waktu.
Di bidang kesehatan, kemajuan berarti memberikan respons yang akurat, mudah dipahami, dan didasarkan pada penilaian yang baik: mengenali kapan konteks tambahan diperlukan, menjelaskan ketidakpastian tanpa melebih-lebihkan keyakinan, dan membantu orang memahami kapan perlu mencari perawatan.
Untuk mengukur kemajuan itu, kami menggunakan evaluasi khusus kesehatan, termasuk HealthBench dan HealthBench Professional. Evaluasi ini menggunakan percakapan kesehatan yang realistis dan rubrik yang ditulis dokter untuk menilai kualitas seperti akurasi, keamanan, komunikasi, kesadaran konteks, kelengkapan, dan eskalasi yang tepat.
GPT‑5.5 Instant mencapai performa kesehatan yang serupa dengan model terdepan terbaru kami pada agregat evaluasi kesehatan, termasuk HealthBench Professional, dengan peningkatan besar dibandingkan GPT‑5.3 Instant. 5.5 Instant (dirilis Mei 2026) dan 5.3 Instant (dirilis Maret 2026) tersedia untuk semua pengguna gratis di ChatGPT (dengan batasan), dan kami menggunakan harga API untuk menghitung biaya 5.4 Thinking dan 5.5 Thinking.
Sebagai perbandingan lain, kami juga meminta dokter menulis respons untuk percakapan kesehatan yang representatif, dengan waktu tak terbatas dan akses internet (tetapi bukan AI). Panel dokter terpisah kemudian membandingkan respons para dokter ini dengan model Instant dari waktu ke waktu, dengan meninjau kualitas yang penting dalam interaksi nyata, termasuk akurasi, komunikasi, kelengkapan, kepatuhan terhadap instruksi, dan kegunaan untuk keputusan kesehatan, di seluruh 3.500 respons yang ditinjau.
Respons GPT‑5.5 Instant dinilai lebih tinggi daripada respons yang ditulis dokter dan respons model lama di berbagai dimensi dalam evaluasi ini.
Dokter menilai respons GPT‑5.5 Instant memiliki lebih sedikit mode kegagalan dibandingkan respons dari model lama dan dokter. Misalnya, dibandingkan model lama maupun dokter, GPT 5.5 Instant lebih jarang tidak menyesuaikan respons dengan konteks layanan kesehatan setempat, melewatkan tanda bahaya atau rujukan untuk perawatan, atau gagal meminta konteks tambahan dari pengguna saat diperlukan.
Mengingat skala penggunaan model kami di bidang kesehatan, cara lain untuk memahami peningkatan model terbaru adalah dengan mengukur trafik produksi. Kami menggunakan pemantau yang menjaga privasi pada trafik produksi untuk melacak kemungkinan masalah faktualitas dalam respons kesehatan. Berdasarkan perbandingan trafik produksi terbaru di bidang kesehatan—miliaran pesan per minggu—tingkat respons dengan setidaknya satu masalah faktualitas yang ditandai telah turun 71% dalam dua bulan terakhir.
Membandingkan respons dari model pada berbagai waktu untuk pertanyaan kesehatan dunia nyata menunjukkan bagaimana ChatGPT telah meningkat dalam hal-hal yang penting bagi kesehatan: mengenali kapan suatu situasi mungkin memerlukan perhatian mendesak, menangani ketidakpastian dengan penilaian yang lebih baik, dan memberi orang panduan yang lebih jelas dan berguna tentang apa yang harus dilakukan berikutnya.
GPT-5.2 Instant
Klik nama model untuk melihat respons model tambahan.
Kemajuan ini dibentuk oleh para dokter yang membantu kami mendefinisikan, mengukur, dan meningkatkan respons kesehatan di ChatGPT.
OpenAI bekerja dengan jaringan global yang terdiri dari lebih dari 260 dokter di 60 negara, 49 bahasa, dan 26 spesialisasi medis. Masukan mereka membantu membentuk cara ChatGPT merespons pertanyaan kesehatan dalam beragam skenario, mulai dari pertanyaan kebugaran sehari-hari hingga situasi klinis yang lebih kompleks.
Dokter meninjau contoh respons model dan menilai apakah respons tersebut akurat, jelas, lengkap, cukup berhati-hati, dan berguna. Mereka membantu mengidentifikasi kapan suatu respons mungkin melewatkan konteks penting, terdengar terlalu yakin, perlu lebih jelas tentang langkah berikutnya, atau perlu lebih langsung mendorong seseorang untuk mencari perawatan medis.
Hingga saat ini, dokter telah meninjau lebih dari 700.000 contoh respons model yang mencerminkan bagaimana tenaga kesehatan dan pasien dapat menggunakan ChatGPT di dunia nyata. Setiap beberapa menit, seorang dokter meninjau respons baru. Masukan mereka menjadi rubrik dan kriteria evaluasi yang membantu peneliti mengukur apakah respons akurat, aman, jelas, lengkap, cukup berhati-hati, dan berguna dalam situasi kesehatan dunia nyata. Ini memberi kami cara yang lebih jelas untuk melihat di mana model semakin baik dan di mana model masih perlu ditingkatkan.
Pekerjaan ini juga mendukung upaya OpenAI yang lebih luas di bidang kesehatan, mencakup alat yang membantu orang lebih memahami dan menavigasi informasi kesehatan serta alat yang dibuat untuk tenaga kesehatan, seperti ChatGPT untuk Tenaga Kesehatan dan OpenAI untuk Layanan Kesehatan, yang membantu tenaga medis dengan tugas seperti dokumentasi, riset, dan konsultasi perawatan.
Meningkatkan kesehatan manusia akan menjadi salah satu dampak AGI yang paling personal dan nyata. Seiring model kami terus meningkat, tujuan kami adalah membuat ChatGPT lebih akurat, lebih berhati-hati, dan lebih berguna pada momen-momen tersebut — serta terus membawa kemajuan itu kepada lebih banyak orang.


