GPT‑5 सिस्टम कार्ड के लिए अडेंडम: सेंसिटिव बातचीतें
जब हमने GPT‑5 को लॉन्च किया, तो हमने सिस्टम कार्ड में बताया था कि हम बेहतर बेंचमार्क स्थापित करने व मेंटल और इमोशनल तनाव से जुड़े क्षेत्रों में मॉडल सेफ़्टी को मज़बूत करने के लिए काम कर रहे थे. 3 अक्टूबर को, हमने एक अपडेट(एक नई विंडो में खुलेगा) जारी किया जो उन कोशिशों को रिफ़्लेक्ट करता है, जिससे मुसीबत के पलों में लोगों को बेहतर ढंग से पहचानने और उन्हें सपोर्ट करने के लिए ChatGPT के डिफ़ॉल्ट मॉडल में सुधार हुआ. इस कोशिश में, हमने 170 से ज़्यादा मेंटल हेल्थ एक्सपर्ट्स के साथ काम किया, ताकि ChatGPT को तनाव के संकेतों को और ज़्यादा भरोसेमंद तरीके से पहचानने, ध्यान से जवाब करने, और लोगों को असली दुनिया के सपोर्ट की दिशा में गाइड करने में मदद मिल सके–जिससे हमारे मनचाहे व्यवहार से कम रहने वाले जवाब 65-80% तक घट गए.
हम एक संबंधित ब्लॉग पोस्ट पब्लिश कर रहे हैं जो इस काम के बारे में और ज़्यादा जानकारी देता है, और बेसलाइन सेफ़्टी इवैल्यूएशन्स शेयर करने के लिए GPT‑5 सिस्टम कार्ड के लिए ये अडेंडम भी पब्लिश कर रहा है. ये इवैल्यूएशन्स ChatGPT के डिफ़ॉल्ट मॉडल के 15 अगस्त वर्ज़न(एक नई विंडो में खुलेगा), जिसे GPT‑5 Instant के तौर पर भी जाना जाता है, की तुलना 3 अक्टूबर को लॉन्च किए गए अपडेटेड वर्ज़न से करते हैं.


