Ana içeriğe atla
OpenAI

26 Ağustos 2025

GüvenlikÜrün

İnsanlara en ihtiyaç duydukları anlarda yardımcı olmak

Yükleniyor...

Tüm dünyada ChatGPT’nin kullanımı artarken insanların sadece arama, kodlama ve yazma amaçlı değil, aynı zamanda son derece kişisel kararlarda da hayata dair tavsiyeler(yeni bir pencerede açılır), koçluk(yeni bir pencerede açılır) ve destek(yeni bir pencerede açılır) almak için ChatGPT’ye başvurduğunu görüyoruz.

Bu kapsamda bazen ciddi ruhsal ve duygusal sorunlar yaşayan insanlarla karşılaşıyoruz. Birkaç hafta önce bu konuda bir makale yazmıştık ve bir sonraki büyük güncellemenin ardından yeni bilgiler paylaşmayı planlamıştık. Ancak ağır kriz yaşayan kişilerin ChatGPT’yi kullanmalarıyla ilgili yakın zamanda yaşanan üzücü olaylar bizi endişelendirdi. Dolayısıyla, bu bilgileri şimdi paylaşmanın önemli olduğunu düşünüyoruz.

Araçlarımızın insanlara olabildiğince fayda sağlamasını amaçlıyoruz. Bu doğrultuda da modellerimizi, ruhsal ve duygusal sorunların işaretlerini fark edip bunlara tepki verecek ve uzman girdilerle insanları yardım almaya yönlendirecek şekilde sürekli geliştiriyoruz.

Dünya bu yeni teknolojiye uyum sağlarken, yardıma en fazla ihtiyaç duyan insanlara destek olmanın sorumluluğunu derinden hissediyoruz. ChatGPT’nin ne amaçla tasarlandığını, sistemlerimizin gelişime açık yönlerini ve gelecekte yapmayı planladığımız işleri açıklamak isteriz.

ChatGPT’nin tasarlanma amacı

Amacımız insanların ilgisini çekmek değildir. Başarıyı harcanan zaman veya tıklamayla ölçmüyor, gerçekten faydalı olmayı önemsiyoruz. Bir konuşma sırasında birinin hassas ve riskli durumda olduğunun anlaşılması ihtimaline karşı ChatGPT’ye katmanlı güvenlik önlemleri ekledik.

Farkına varmak ve empatiyle yanıt vermek.

2023’ün başlarından bu yana modellerimiz, insanlara kendilerine zarar verme talimatları sağlamadan destekleyici ve empatik bir dil kullanmaya geçmek üzere eğitildi. Örneğin birisi kendine zarar vermek istediğini yazdığında ChatGPT, bu durumu kabul etmek yerine kişinin duygularının farkına varıp onu yardım almaya yönlendirecek şekilde eğitildi.

Ayrıca, katmanlı savunma yaklaşımımız doğrultusunda, sınıflandırıcılarımız tarafından tanımlandığı şekliyle modellerimizin güvenlik eğitimiyle ters düşen yanıtlar otomatik olarak engelleniyor; reşit olmayan kişiler ve oturum açmadan kullanımlar için daha güçlü korumalar bulunuyor. Kendine zarar vermeye ilişkin görsel çıktıları ise herkes için engelleniyor ve reşit olmayanlar için daha güçlü korumalar bulunuyor.

Çok uzun süren oturumlarda ChatGPT, kullanıcılara mola vermeleri için hatırlatma yapıyor.

İnsanları gerçek dünyadaki kaynaklara yönlendirmek.

Birisi intihar etme niyetini ifade ederse ChatGPT, o kişiyi profesyonel yardım almaya yönlendirecek şekilde eğitildi. ChatGPT, kullanıcıları ABD’de 988’e (intihar ve kriz yardım hattı), Birleşik Krallık’ta Samaritans’a, başka yerlerde ise findahelpline.com(yeni bir pencerede açılır) web sitesine yönlendiriyor. Bu mantık, model davranışında yerleşik olarak bulunmaktadır.

30’dan fazla ülkede psikiyatristler, pediyatristler ve pratisyen hekimler dâhil 90’ı aşkın doktorla yakın çalışıyoruz. Ayrıca, yaklaşımımızın en yeni araştırmaları ve en iyi uygulamaları yansıtmasını sağlamak için akıl ve ruh sağlığı, gençlik gelişimi ve insan-bilgisayar etkileşimi alanlarındaki uzmanlardan oluşan bir danışmanlar grubu oluşturuyoruz.

Başkalarına fiziksel zarar vermeye yönelik riskleri incelenmek üzere uzman ekibe iletmek.

Başkalarına zarar vermeyi planlayan kullanıcıları tespit ettiğimizde onların konuşmalarını, incelenmek üzere uzman bir ekibe yönlendiriyoruz. Bu ekipteki kişiler, kullanım politikalarımız konusunda eğitimlidir ve hesapları yasaklamak dâhil gerekli tedbirleri almaya yetkilidir. İnceleme uzmanları, başkaları için ciddi fiziksel zarara yol açabilecek ve acil müdahale gerektiren bir durum tespit ederse konuyu kolluk kuvvetlerine iletebiliriz. ChatGPT etkileşimlerinin son derece özel olması nedeniyle ve insanların mahremiyetine saygı gereği, kendine zarar verme durumlarını şimdilik kolluk kuvvetlerine iletmiyoruz.

Hassas etkileşimlerde modellerimizin verdiği yanıtları sürekli geliştiriyoruz. Ayrıca duygusal bağımlılık, ruh sağlığıyla ilgili acil durumlar ve aşırı onaylayıcılık dâhil çeşitli alanlarda hedefli güvenlik iyileştirmeleri üzerine çalışmaya devam ediyoruz.

Ağustos ayında, ChatGPT’yi çalıştıran varsayılan modelimiz GPT‑5’i kullanıma sunduk. Genel olarak GPT‑5; sağlıksız seviyedeki duygusal bağımlılığı önleme ve aşırı onaylayıcılığı azaltma gibi alanlarda anlamlı bir iyileşme sergiledi; 4o ile kıyaslandığında, ruh sağlığıyla ilgili acil durumlarda ideal olmayan model yanıtlarının yaygınlığını %25’i aşan bir oranda azalttı. Ayrıca GPT‑5, güvenli tamamlamalar denilen yeni bir güvenlik eğitimi yöntemi içeriyor. Bu yöntemde modele, güvenlik sınırları dâhilinde olabildiğince yararlı olması öğretiliyor. Bu da güvenli olmayabilecek bir ayrıntı yerine kısmi veya yüksek seviyeli bir cevap sunma anlamına gelebiliyor.

Sistemlerimizin yetersiz kalabildiği durumlar, bunların nedenleri ve bu konuları ele almak için yaptığımız çalışmalar

Tüm güvenlik önlemlerine rağmen sistemlerimizin bazı hassas durumlarda beklendiği gibi davranmadığı zamanlar oldu. Aşağıda belirtilen konularda iyileştirmeler yapmak için çalışıyoruz.

Uzun süren konuşmalarda güvenlik önlemlerini güçlendirmek.

Güvenlik önlemlerimiz sıradan ve kısa sohbetlerde hatasız bir şekilde çalışıyor. Ancak uzun süren etkileşimlerde bu güvenlik önlemlerinin bazen daha az güvenilir olabildiğini zamanla öğrendik. Karşılıklı sohbet ilerledikçe modelin güvenlik eğitimin bazı kısımları etkisini kaybedebiliyor. Örneğin; birisi intihar niyetini ilk kez belirttiğinde ChatGPT, o kişiyi doğru bir biçimde intihar yardım hattına yönlendirebilir. Fakat uzun süre devam eden pek çok mesajın ardından, güvenlik önlemlerimize aykırı olan bir cevap sunabilir. İşte önlemeye çalıştığımız bozulma tam olarak bu. Uzun süren konuşmalarda da güvenilirliğini sağlamak için risk azaltma önlemlerini güçlendiriyoruz ve çoklu konuşmalarda etkili davranışı temin etmenin yollarını araştırıyoruz. Böylece bir kişi, bir sohbette intihar etme niyetinden bahsederse ve daha sonra başka bir sohbet başlatırsa model yine uygun şekilde yanıt verebilir.

İçerik engellemeyi iyileştirmek.

Bazı durumlarda engellenmesi gereken bir içeriğin engellenmediğini gördük. Bu tür açıklar genellikle, sınıflandırıcının gördüğü şeyin önem derecesini tam olarak tespit edememesinden kaynaklanıyor. Korumaların gerektiği anda devreye girmesi için bu eşik değerlerini ayarlıyoruz.

ChatGPT’nin zor bir durumu daha da zorlaştırmasını engellemek en büyük önceliğimizdir.

Gelecek için planlarımız

Yukarıdaki sorunları çözmekle iş bitmiyor. Şunları da planlıyoruz: 

Kriz yaşayan insanlara daha fazla müdahalede bulunmak.

Riski azaltmaya yönelik ilk önlemlerimiz, kişinin kendine ciddi zarar verme ihtimali olan durumlara öncelik verse de bazı insanlar farklı türde ruhsal sorunlar yaşayabiliyor. Örneğin birisi, iki geceyi uykusuz geçirdikten sonra çok dayanıklı olduğunu fark ettiği için 7/24 araç sürebileceğini büyük bir coşkuyla modele söyleyebilir. ChatGPT şu anda, bu durumun tehlikeli olduğunu anlamayabilir veya bunu oyun gibi algılayıp merakla tetkik ederek inceden inceye destekleyebilir.

GPT‑5 için bir güncelleme üzerinde çalışıyoruz. Bu güncellemeyle ChatGPT, kişiyi gerçekçi olmaya davet ederek durumun kontrolden çıkmasını engelleyebilecek. Mesela bu örnekte, uykusuz kalmanın tehlikeli olduğunu açıklayacak ve herhangi bir şey yapmadan önce dinlenmesini tavsiye edecek.

Acil durum servislerine erişimi ve uzmanlardan yardım almayı daha da kolaylaştırmak.

İnsanlar kendilerine zarar verme niyetinde olduklarını belirtirlerse onları yardım almaya teşvik ediyor ve gerçek dünyadaki kaynaklara yönlendiriyoruz. ABD ve Avrupa’daki kaynakları yerelleştirmeye başladık. Dünyadaki diğer pazarları da dâhil etmeyi planlıyoruz. Ayrıca, acil durum servislerine tek tıkla erişim sağlayarak erişilebilirliği artıracağız.

İnsanlara ciddi bir kriz yaşamadan önce daha erken müdahale etmenin ve onları sertifikalı terapistlerle bağlantıya geçirmenin yollarını araştırıyoruz. Kriz yardım hatlarının ötesine geçerek insanların ChatGPT üzerinden lisanslı uzmanlara doğrudan ulaşabileceği bir ağı nasıl kurabileceğimizi değerlendiriyoruz. Bunu doğru bir şekilde yapmak için zaman ve dikkatli çalışma gerekiyor.

Güvenilir kişilerle bağlantıya geçilmesini sağlamak.

Acil durum servislerine ek olarak, insanların yakınlarına ulaşmalarını nasıl kolaylaştırabileceğimizi de araştırıyoruz. Mesela kullanıcılar, acil durumlarda iletişime geçebilecekleri kayıtlı kişilere, arkadaşlarına veya aile üyelerine tek tıkla mesaj gönderebilir veya onları arayabilir. Önerilen ifadeleri kullanarak zorlu olabilecek bir konuşmayı daha rahat başlatabilirler.

Ayrıca ciddi durumlarda, ChatGPT’nin önceden belirlenmiş olan bir kişiye kullanıcı adına ulaşmasına onay vermesini sağlayacak özellikleri de değerlendiriyoruz.

Ergenler için korumaları güçlendirmek.

Geçmişte, tüm kullanıcılarımız için tek bir ideal model davranışı belirlemiştik. Ancak ChatGPT geliştikçe ve kullanıcının 18 yaş altı olduğunu bildiğimiz durumlar için ilave korumalar eklemeye başladık. Ergenlerin kendilerine özgü gelişimsel ihtiyaçlarını dikkate alan güvenlik önlemlerini geliştirmeye ve kullanıma sunmaya devam ediyoruz. Bunlar, hassas içerikler ve riskli davranışlara karşı daha güçlü koruyucu önlemler içeriyor.

Ayrıca yakında ebeveyn kontrollerini de kullanıma sunacağız. Bu kontroller sayesinde ebeveynler, ergen yaştaki çocuklarının ChatGPT’yi nasıl kullandığı hakkında daha fazla bilgi edinme ve kullanımı şekillendirme seçeneklerine sahip olacak. Ergenlerin acil durumlarda iletişime geçebilecekleri güvenilir bir kişiyi belirlemelerini (ebeveyn denetimiyle) mümkün kılmanın yollarını da araştırıyoruz. Böylece ciddi bir sorun yaşandığında ChatGPT, ergenleri sadece kaynaklara yönlendirmekle kalmayıp duruma müdahale edebilecek bir kişiye doğrudan ulaşmalarını sağlayabilir.

Güvenlik önlemlerinin ancak her bir unsurun düzgün çalışması durumunda etkili olduğunun farkındayız. Uzmanların rehberliğinde ve araçlarımızı kullanan insanlara olan sorumluluğumuzun bilinciyle iyileştirme çabalarımızı sürdüreceğiz. Bu teknolojinin, insanları en hassas anlarında korumasını sağlamak için başkalarının da bize katılmasını diliyoruz.