跳至主要內容
OpenAI

2025年9月2日

安全產品

持續完善 ChatGPT 體驗,為所有人提供更適宜的幫助

將敏感對話轉由推理模型處理,並在接下來一個月內推出家長監控功能。

載入中…

我們致力讓 ChatGPT 以最適切的方式提供幫助,這個目標一直都沒有改變,我們也會持續投注心力。我們看見許多人在人生中最難熬的時刻,選擇向 ChatGPT 求助。因此,我們參考相關領域的專家意見,持續改進模型辨別及回應心理與情緒困擾的方式。 

這項工作已經開始進行,我們想主動分享接下來 120 天的計畫,讓您在各項新功能推出前,先掌握我們的方向。在這 120 天後,計畫當然不會就此吿一段落,我們仍會持續努力,在今年盡可能推出更多改善內容。 

對於如何在使用者最需要的時候提供幫助,我們在上星期發布了四大方針:

  1. 在使用者身處危機時,擴大介入措施
  2. 提供更簡單的方式,供使用者迅速聯絡緊急服務或取得專業協助
  3. 協助使用者聯繫可信賴的聯絡人
  4. 加強對青少年的保護 

上述方針中,有部分可以火速實施,但也有部分需要更長時間研議開發。 

今天,我們要進一步說明 OpenAI 如何與專家合作,制訂未來努力的方向,瞭解如何運用推理模型處理敏感話題,以及針對四大方針之一,深入介紹更多細節:加強對青少年的保護 

與專家合作

AI 是持續發展的新技術,我們想確保團隊在推進技術的過程中,有身心健康領域的專業意見從旁指引。我們召集了身心健康與 AI 專業顧問團隊全球醫師網路 兩個單位,提供深厚的醫療專業知識,以及來自世界各地的多元觀點,從中汲取寶貴見解,據之調整我們的作法。在未來的 120 天計畫期間,我們會持續分享上述成果。

身心健康與 AI 專業顧問團隊

今年稍早,我們開始召集在青少年發展、心理健康與人機互動領域有專業背景的專家,此團隊的認識是以實證為基礎,建立明確願景,探討 AI 如何促進身心健康,並幫助使用者邁向更好的生活。

我們依循他們的建議,定義與衡量「身心健康」,釐清優先順序,並規劃各種安全機制,包括後續會不斷更新的家長監控功能。研發過程中,我們都會參考他們的最新研究成果。顧問團隊會針對我們的產品、研究和政策方向提供意見,但 OpenAI 仍對最終決策全權負責。 

全球醫師網路

上述顧問團隊與我們的全球醫師網路攜手合作,這個廣大的資源網路集結了超過 250 位醫師,匯聚他們在全球 60 個國家的臨床經驗。過去一年來,我們與這群醫師密切合作,建立了 HealthBench 評估準則,用以衡量 AI 系統在健康領域的應用能力。

在這個較大規模的網路中,已經有超過 90 名來自 30 國家的醫師參與我們的研究,包括精神科醫師、小兒科醫師與家醫科醫師,一起探討我們的模型在心理健康情境中應該如何表現。他們的回饋意見對於我們的安全研究、模型訓練和干預措施都有直接的影響,也讓我們在有需要的時候,能夠第一時間與合適的專家聯繫。

我們正持續擴展這個網路,納入更多臨床醫師與研究人員,包含在飲食障礙、藥物成癮和青少年健康等領域有深厚背景的專家。

在敏感情境中使用推理模型

我們的推理模型(例如 GPT‑5‑thinking 和 o3)在回應前會花更多時間根據上下文思考並推理。此類模型經過我們的「 Deliberative Alignment」訓練,而測試結果(在新視窗中開啟)顯示,推理模型在遵循及應用安全指引方面,表現更為一致,而且更能抵禦惡意提示

我們最近推出了「即時路由器」功能,可根據聊天語境,自動切換注重效率的聊天模型和推理模型。接下來,我們會將部分敏感對話交由推理模型處理比方說,當系統偵測到使用者處於急性壓力狀態時,就會改由 GPT‑5‑thinking 這類模型來回應,好提供更實用、更有幫助的回應,不受使用者一開始選擇的模型限制。我們會審慎地逐步調整這項作法。

強化青少年保護措施

許多年輕人已經開始使用 AI,他們是第一批所謂的「AI 原生世代」,成長過程中,已經習慣 AI 工具就是日常生活的一部分,就像先前的世代習慣有網路和智慧型手機一樣。在這樣的背景之下,確實創造出給予支援、鼓勵學習和發揮創意的契機,但與此同時,家庭成員與青少年在根據他們的年齡發展,制定健康使用規範時,也需要相關幫助。

家長監控功能

今年稍早,我們開始著手規劃更多方法,打造適合親子一同使用的 ChatGPT,並讓每個家庭根據自身狀況來決定適合的用法。接下來一個月內,家長就能:

  • 透過電子郵件邀請,將自己的帳號連結至青少年的帳號(必須年滿 13 歲)。
  • 設定 ChatGPT 要遵循適齡模型行為準則來回應,此準則預設開啟。
  • 管理要停用哪些功能,例如記憶和聊天紀錄。
  • 在系統偵測到青少年處於急性壓力狀態時收到通知。我們會徵詢專家意見來設計這項功能,幫助維繫家長與青少年之間的信任感。

除了上述監控功能之外,我們還會推出適用所有使用者的應用程式內提醒,在長時間聊天時跳出通知,提醒使用者要適度休息。

上述步驟都只是開始而已。我們會持續學習,在專家的引導之下,研擬更縝密的應對方式,目標是讓 ChatGPT 提供最適宜的幫助。很期待在接下來的 120 天繼續與您分享我們的進展。