Langsung ke konten utama
OpenAI

26 Agustus 2025

KeselamatanProduk

Membantu orang-orang saat mereka membutuhkannya

Memuat…

Karena adopsi ChatGPT terus tumbuh di seluruh dunia, kami telah melihat orang-orang beralih ke ChatGPT bukan hanya untuk pencarian, koding, dan menulis—tetapi juga keputusan yang sangat personal yang meliputi saran terkait kehidupan(terbuka di jendela baru), pembinaan(terbuka di jendela baru), dan dukungan(terbuka di jendela baru).

Pada skala ini, kami terkadang bertemu dengan orang-orang yang sedang mengalami tekanan mental dan emosional. Kami menulis tentang ini beberapa minggu lalu dan sebelumnya berencana untuk menyampaikan lebih banyak setelah pembaruan besar berikutnya. Namun, kasus menyedihkan tentang orang-orang yang menggunakan ChatGPT di tengah-tengah krisis akut sangat mengguncang kami, dan kami percaya, sekarang adalah saat yang penting untuk menyampaikan lebih banyak.

Tujuan kami adalah agar alat-alat kami semaksimal mungkin membantu orang-orang—dan sebagai bagian dari hal ini, kami terus meningkatkan cara model-model kami mengenali dan merespons tanda-tanda gangguan mental dan emosional, serta menghubungkan orang-orang dengan layanan perawatan, dengan arahan dari masukan para ahli.

Saat dunia mengadaptasi teknologi baru ini, kami merasakan tanggung jawab mendalam untuk membantu mereka yang sangat membutuhkannya. Kami ingin menjelaskan tujuan desain ChatGPT, hal-hal yang dapat ditingkatkan pada sistem kami, dan upaya pengembangan yang kami rencanakan di masa depan.

Apa tujuan desain ChatGPT

Tujuan kami bukan merebut perhatian orang-orang. Alih-alih mengukur kesuksesan berdasarkan waktu yang dihabiskan atau jumlah klik, kami lebih peduli untuk benar-benar membantu. Saat percakapan menunjukkan bahwa seseorang sedang rentan dan berisiko, kami membangun serangkaian perlindungan berlapis dalam ChatGPT.

Mengenali dan menanggapi dengan empati.

Sejak awal 2023, model kami telah dilatih untuk tidak memberikan instruksi menyakiti diri sendiri, dan beralih ke bahasa yang suportif dan berempati. Misalnya, jika seseorang menulis bahwa mereka ingin menyakiti diri sendiri, ChatGPT dilatih untuk tidak menuruti permintaan tersebut, melainkan menghargai perasaan mereka dan mengarahkan mereka ke bantuan yang tepat.

Selain itu, sejalan dengan pendekatan pertahanan mendalam, respons yang melanggar pelatihan keselamatan model kami—sebagaimana diidentifikasi oleh pengklasifikasi kami—diblokir secara otomatis, dengan perlindungan yang lebih kuat bagi anak-anak dan pengguna yang tidak masuk ke akunnya. Hasil gambar menyakiti diri sendiri juga diblokir untuk semua orang, dengan perlindungan yang lebih kuat bagi anak di bawah umur.

Selama sesi yang sangat panjang, ChatGPT mengingatkan orang-orang untuk beristirahat.

Mengarahkan orang-orang kepada sumber daya dunia nyata.

Jika seseorang menunjukkan niat bunuh diri, ChatGPT dilatih untuk mengarahkan orang-orang mencari bantuan profesional. Di AS, ChatGPT mengarahkan orang-orang ke 988 (saluran siaga bunuh diri dan krisis), di Inggris Raya ke Samaritans, dan di negara lain ke findahelpline.com(terbuka di jendela baru). Logika ini dibangun dalam perilaku model.

Kami bekerja sama dengan lebih dari 90 dokter di lebih dari 30 negara—psikiater, dokter anak, dan dokter umum—dan kami mengumpulkan kelompok pakar penasihat di bidang kesehatan mental, pengembangan pemuda, dan interaksi antara manusia dan komputer untuk memastikan bahwa pendekatan kami mencerminkan penelitian terbaru dan praktik terbaik.

Mengeskalasi risiko bahaya fisik terhadap orang lain untuk ditinjau oleh staf manusia.

Saat kami mendeteksi pengguna yang berencana menyakiti orang lain, kami mengarahkan percakapan mereka ke saluran khusus di mana percakapan ditinjau oleh tim kecil yang mendapatkan pelatihan tentang kebijakan penggunaan dan yang diizinkan mengambil tindakan, termasuk menangguhkan akun. Jika peninjau manusia menentukan bahwa suatu kasus melibatkan ancaman bahaya fisik terhadap orang lain, kami dapat melaporkannya ke lembaga penegak hukum. Saat ini, kami tidak melaporkan kasus menyakiti diri sendiri kepada lembaga penegak hukum untuk menghormati privasi orang-orang karena sifat interaksi ChatGPT yang unik.

Kami terus meningkatkan cara model kami merespons dalam interaksi yang sensitif, dan saat ini sedang bekerja pada perbaikan keamanan yang ditargetkan di beberapa bidang, termasuk ketergantungan emosional, darurat kesehatan mental, dan sikap menjilat.

Di bulan Agustus, kami meluncurkan GPT‑5 sebagai model default yang mendukung ChatGPT. Secara keseluruhan, GPT‑5 menunjukkan peningkatan bermakna di berbagai bidang, seperti menghindari tingkat ketergantungan emosional yang tidak sehat, mengurangi sifat menjilat, dan mengurangi kemunculan tanggapan model non-ideal dalam keadaan darurat kesehatan mental sebesar lebih dari 25% dibandingkan dengan 4o. GPT‑5 juga membangun metode pelatihan keselamatan baru yang disebut penyelesaian aman, yang mengajarkan model agar membantu sekaligus tetap berada dalam batas-batas keselamatan. Hal itu mungkin berarti memberikan jawaban yang bersifat umum atau tingkat tinggi daripada detail yang berpotensi berbahaya.

Kekurangan sistem kami, alasannya, dan cara kami mengatasinya

Meskipun dengan perlindungan ini, ada beberapa momen di mana sistem kami tidak berlaku sebagaimana mestinya dalam situasi sensitif. Berikut adalah beberapa hal yang sedang kami tingkatkan.

Memperkuat perlindungan dalam percakapan panjang.

Perlindungan kami berjalan lebih andal dalam percakapan umum yang pendek. Seiring waktu, kami telah mempelajari bahwa perlindungan ini terkadang kurang dapat diandalkan dalam interaksi yang panjang: seiring dengan makin banyaknya percakapan, bagian dari pelatihan keamanan model dapat menurun. Misalnya, ChatGPT dapat mengarahkan ke saluran siaga bunuh diri, saat seseorang menyebutkan niat pertama kalinya, tetapi setelah ada banyaknya pesan dalam waktu yang lama, ChatGPT pada akhirnya dapat menawarkan jawaban yang bertentangan dengan perlindungan kami. Inilah kerusakan yang ingin kami cegah. Kami memperkuat langkah-langkah mitigasi ini agar tetap andal dalam percakapan yang panjang, dan kami sedang meneliti cara-cara untuk memastikan perilaku yang andal di seluruh percakapan yang berbeda. Dengan demikian, jika seseorang menunjukkan niat bunuh diri dalam satu obrolan dan kemudian memulai obrolan lain, model tersebut masih dapat memberikan tanggapan dengan tepat.

Menyempurnakan cara kami memblokir konten.

Kami telah melihat beberapa kasus di mana konten yang seharusnya diblokir tidak diblokir. Kesenjangan ini biasanya terjadi karena pengklasifikasi meremehkan keparahan hal yang dilihatnya. Kami mengubah ambang batas tersebut agar perlindungan dipicu pada saat yang tepat.

Prioritas utama kami adalah memastikan ChatGPT tidak membuat saat-saat sulit menjadi lebih parah.

Rencana kami di masa mendatang

Pekerjaan belum selesai dengan hanya memperbaiki hal-hal di atas. Kami juga berencana untuk: 

Memperluas intervensi bagi lebih banyak orang yang mengalami krisis.

Sementara mitigasi awal kami memprioritaskan kondisi melukai diri sendiri yang akut, beberapa orang mengalami bentuk tekanan mental lain. Misalnya, seseorang mungkin dengan semangat mengatakan kepada model bahwa mereka yakin bisa mengemudi 24/7 karena mereka menyadari bahwa mereka tak tergoyahkan setelah tidak tidur selama dua malam. Saat ini, ChatGPT tidak mengenali ini sebagai bahaya atau menyimpulkannya sebagai lelucon dan—dengan mengeksplorasinya penuh rasa ingin tahu—malah dapat mendorongnya secara halus.

Kami sedang mengupayakan pembaruan terhadap GPT‑5 yang dapat menyebabkan ChatGPT meredakan situasi dengan menyadarkan orang tersebut pada kenyataan. Dalam contoh ini, GPT‑5 akan menjelaskan bahwa kurang tidur sangat berbahaya dan menyarankan untuk istirahat sebelum melakukan tindakan apa pun.

Memudahkan untuk menghubungi layanan darurat dan mendapatkan bantuan dari ahli.

Saat ini, ketika orang menunjukkan niat untuk melukai diri sendiri, kami menyarankan mereka untuk mencari bantuan dan merujuk mereka ke sumber daya di dunia nyata. Kami telah memulai melokalkan sumber daya di A.S. dan Eropa, dan kami berencana untuk melakukan ekspansi ke pasar global lain. Kami juga akan meningkatkan aksesibilitas dengan akses satu klik ke layanan darurat.

Kami juga mengeksplorasi cara untuk melakukan intervensi lebih awal dan menghubungkan orang-orang ke ahli terapi bersertifikasi sebelum mengalami krisis akut. Ini berarti mengupayakan solusi di luar saluran siaga krisis dan mempertimbangkan cara membangun jaringan profesional berlisensi yang dapat dijangkau secara langsung oleh orang-orang melalui ChatGPT. Ini perlu waktu dan upaya saksama untuk disempurnakan.

Memungkinkan koneksi ke kontak tepercaya.

Selain layanan darurat, kami mengeksplorasi cara-cara untuk memudahkan orang-orang menghubungi kerabat terdekat mereka. Ini dapat mencakup pesan atau panggilan satu klik ke kontak darurat, teman, atau anggota keluarga yang disimpan, dengan bahasa yang disarankan agar memulai percakapan menjadi lebih mudah.

Kami juga sedang mempertimbangkan fitur yang memungkinkan pengguna untuk mendaftar agar ChatGPT dapat menghubungi kontak yang ditunjuk atas nama mereka dalam kasus-kasus darurat.

Memperkuat perlindungan bagi remaja.

Secara historis, kami menetapkan satu perilaku model ideal bagi semua pengguna kami; saat ChatGPT tumbuh, kami mulai menambahkan perlindungan tambahan saat kami tahu bahwa pengguna berusia di bawah 18 tahun. Kami terus mengembangkan dan meluncurkan perlindungan yang mengenali kebutuhan perkembangan remaja yang unik, dengan perlindungan yang lebih kuat di seputar konten sensitif dan perilaku berisiko.

Kami juga akan segera memperkenalkan pengawasan orang tua yang memberikan pilihan bagi orang tua untuk mendapatkan lebih banyak wawasan dan membentuk cara anak remaja mereka menggunakan ChatGPT. Kami juga mengeksplorasi kemungkinan bagi remaja (dengan pengawasan orang tua) untuk menetapkan kontak darurat tepercaya. Dengan demikian, dalam keadaan bahaya yang akut, ChatGPT dapat melakukan lebih banyak hal dari sekadar mengarahkan ke sumber daya; ChatGPT dapat membantu langsung menghubungkan remaja dengan seseorang yang dapat membantu.

Kami sangat menyadari bahwa perlindungan yang paling kuat hadir ketika setiap elemen berjalan sebagaimana mestinya. Kami akan terus melakukan peningkatan, dengan panduan pakar dan tetap bertanggung jawab kepada orang-orang yang menggunakan alat kami—dan berharap yang lain akan mengikuti jejak kami dalam memastikan teknologi ini melindungi orang-orang ketika mereka berada dalam keadaan rentan.