人們會使用 ChatGPT 學習新知、探索想法、解決問題,也會拿來思考個人層面的困惑。有時,這些對話會涉及某人正在掙扎或尋求支持的時刻。我們的目標是設計出能夠審慎回應敏感對話的系統,並在需要時鼓勵人們向現實生活中的支持系統尋求協助。
今天,我們開始推出可信任聯絡人,這是 ChatGPT 中一項可選用的安全功能,讓成年人可以指定一位自己信任的人,例如朋友、家人或照護者;若我們的自動化系統與受過訓練的審查人員偵測到已啟用此功能的使用者可能出現涉及嚴重安全疑慮的自我傷害言論,該聯絡人就可能會收到通知。可信任聯絡人的設計,是在 ChatGPT 已提供的在地化求助專線之外,再提供一層支持,幫助使用者在危機時刻聯繫自己信任的人。
可信任聯絡人建立在家長控制安全通知(在新視窗中開啟)的基礎上,當已連結的青少年帳戶使用者出現極度痛苦跡象時,家長或監護人便能收到提醒。如今我們也正擴展安全提醒選項,讓所有 18 歲以上的人都可以選擇新增自己信任的人作為可信任聯絡人。
專家指引(在新視窗中開啟)指出,社會連結是降低自殺風險最重要的保護因子之一。可信任聯絡人(在新視窗中開啟)旨在鼓勵使用者聯繫自己原本就信任的人。這項功能無法取代專業照護或危機服務,而是支持處於痛苦中的人之多層防護措施之一。ChatGPT 仍會在適當情況下鼓勵使用者聯繫危機專線或緊急服務。
「心理學研究一再顯示,社會連結是強而有力的保護因子,尤其在人們陷入情緒低潮時更是如此。幫助人們預先找出可信任的人,同時保有他們的選擇與自主權,能讓他們在最需要的時候,更容易向現實世界中的支持求助。」
- 使用者可在 ChatGPT 設定中新增一位成年人(全球為 18 歲以上,韓國則為 19 歲以上)作為可信任聯絡人。
- 可信任聯絡人會收到一份說明角色內容的邀請,且必須在一週內接受邀請,功能才會啟用。若可信任聯絡人拒絕,使用者可以選擇新增另一位成年人。
- 如果我們的自動監測系統偵測到使用者可能正以顯示嚴重安全疑慮的方式談論自我傷害,ChatGPT 會告知使用者我們可能通知其可信任聯絡人,並鼓勵使用者透過建議的開場方式主動聯繫可信任聯絡人。
- 接著,一小組受過專門訓練的人員會審查相關情況。如果這些審查人員判定對話可能顯示嚴重安全疑慮,ChatGPT 將以電子郵件或簡訊通知可信任聯絡人,或向擁有 ChatGPT 帳戶的聯絡人發送 App 內通知。
- 通知內容經過刻意限制處理。它會說明提及自我傷害的概括原因,以及其可能令人擔憂之處,並鼓勵可信任聯絡人主動關心。為保護使用者隱私,通知不會包含聊天細節或逐字稿。此外,通知中也會附上專家指引(在新視窗中開啟)連結,協助處理敏感對話。
- 使用者可隨時在設定中移除或編輯其可信任聯絡人,而可信任聯絡人也可隨時透過我們的說明中心(在新視窗中開啟)將自己移除。

雖然這類嚴重安全情況相當少見,但一旦發生,我們的系統便會支援即時審查與回應。雖然沒有任何系統是完美的,且發送給可信任聯絡人的通知未必總能完全反映某人的實際狀況,但每一則通知在送出前都會經過受過訓練的人員審查,而我們也致力於在一小時內完成這些安全通知的審查。
我們在開發可信任聯絡人時,獲得專精於心理健康與自殺預防的臨床醫師、研究人員與組織的指導。這項工作也參考了我們的全球醫師網絡;該網絡涵蓋來自 60 個國家、超過 260 位持照醫師,以及我們的身心靈健康與 AI 專家委員會。我們也與外部組織密切合作,包括美國心理學會。(在新視窗中開啟)
「AI 最重要的承諾之一,是促進真誠的人際連結,並提升心理安全感。ChatGPT 的可信任聯絡人功能讓我深受鼓舞,因為它朝向賦予人們力量邁進了一步,尤其是在脆弱時刻。」

除了可信任聯絡人之外,ChatGPT 也有防護措施,可在每個階段協助引導敏感對話。我們持續改進系統對對話中不同風險程度表達的回應方式:
- 支持現實世界中的協助:在敏感時刻,ChatGPT 可能會鼓勵人們聯繫緊急服務、危機求助專線、心理健康專業人士,或生活中值得信任的人。
- 以關懷回應:我們已與 170 多位心理健康專家合作,提升 ChatGPT 辨識並回應潛在痛苦跡象、緩和對話,以及在適當情況下引導人們獲得現實世界中的支持。
- 協助人們掌控自己的時間:在某些情況下,ChatGPT 可能會建議休息一下或暫時離開,以促進健康的科技使用習慣。
- 拒絕有害請求:ChatGPT 設計上不會提供自殺或自我傷害相關指示。當使用者要求這類資訊時,系統會拒絕請求,改為引導至更安全的回應,並顯示在地化危機資源。

可信任聯絡人是 OpenAI 更廣泛努力的一部分,旨在打造能夠在人們艱難時刻提供幫助的 AI 系統。我們將持續與臨床醫師、研究人員及政策制定者合作,改進 AI 系統在人們可能正經歷痛苦時的回應方式。我們的目標是確保 AI 系統不是孤立存在;相反地,它們應協助人們連結到最重要的現實世界照護、關係與資源。


