我們更新了模型規範,這是一套書面規則、價值觀和行為期望,用以指導 AI 模型在在艱難或高風險情境中下的行為,並引入新的未滿 18 歲 (U18) 原則(在新視窗中開啟)。模型行為在影響人類與 AI 的互動上具有關鍵作用,而青少年的發展需求與成人有所差異。
U18 原則指導 ChatGPT 應如何為 13 至 17 歲青少年提供安全且符合年齡的使用體驗。此方法以發展科學為基礎,並優先強調預防、透明性與早期介入。在制定這些原則時,我們徵詢了外部專家的意見,其中包括美國心理學會,這是我們持續尋求建議以強化方法的一環。
雖然模型規範的原則同樣適用於成人與青少年使用者,但此更新進一步說明了在青少年情境下的具體適用方式,特別是在需要更重視涉及未成年人安全問題的情況。
U18 原則奠基於四項核心承諾:
- 優先保障青少年的安全,即便這與其他目標有所牴觸。
- 倡導現實世界的輔導,鼓勵青少年在現實生活中建立人際關係,並依靠可信賴的資源。
- 將青少年視為青少年,既不居高臨下說教,也不要將他們視為成年人。
- 保持透明,設定清晰的期望
這些原則契合我們的青少年安全藍圖,至今一直是我們青少年安全工作的依據,其中涵蓋了針對註冊時表明未滿 18 歲的使用者所施行的內容保護,以及透過家長監控機制所提供的安全保障。在此類情境下,我們已建立防護機制,確保模型在涉及高風險議題時能格外謹慎,包括自殘與自殺、涉及戀愛或性暗示的角色扮演、血腥或露骨內容、危險行為與物質、身體型象與飲食失調,以及隱匿不安全行為的要求。
美國心理學會在審閱 U18 模型規範早期草案時,提出了對長期發展的重要建議,並強調保護青少年的重要性:
「美國心理學會 (APA) 鼓勵 AI 開發者,針對青少年使用者提供符合其發展階段的適當防護措施,並對更年幼的使用者採取更具保護性的做法。在與人際互動保持平衡的情況下,兒童與青少年或能從 AI 工具獲益;科學研究已證實,人際互動對社會、心理、行為乃至生理發展皆具關鍵作用。青少年與 AI 的互動應在可信任成人的充分監督與討論下進行,以培養其對 AI 所提供資訊的批判性思維,並促進獨立思考能力與技能的發展。」
此更新也釐清當青少年出現安全問題時,助理應如何回應。這表示在觸及高風險議題時,青少年應能獲得更完善的防護、更安全的替代方案,並受到鼓勵去尋求可信賴的線下輔導。存在迫切風險時,將敦促青少年聯繫緊急服務或危機資源。
如同模型規範的其他內容,U18 反映了我們所期望的模型行為。我們將隨著新研究、專家意見以及真實世界的使用情境,持續加以完善這些原則。
除了更新模型規範之外,我們也採取了多層次的方法來強化青少年安全,範圍涵蓋產品防護、家庭輔導及專家指導。
自從推出家長控制(在新視窗中開啟)功能以來,我們已將保護措施擴展至新產品,包括群組對話、ChatGPT Atlas 瀏覽器和 Sora 應用程式。這些更新可協助家長在我們推出新產品和功能時,為青少年量身調整使用 ChatGPT 的體驗。
根據專家建議,我們鼓勵家長與青少年持續交流,一起討論整個家庭如何健康、負責任地使用 AI。為了促進這些交流,我們已在家長資源中心(在新視窗中開啟)新增經專家審核的資源,包括《家庭指南:協助青少年負責任地使用 AI》(在新視窗中開啟)及給家長的建議(在新視窗中開啟),以協助家長與子女討論 AI。上述資源均經 ConnectSafely 及我們身心靈健康與 AI 專家委員會成員審查。我們將持續增加更多資源。我們也在產品中直接支援健康的使用體驗,提供內建的休息提醒,讓使用者在長時間使用時,能確保自己意識到使用 ChatGPT 的時間並保持平衡。
我們在青少年安全方面的工作,仰賴與不同專業領域專家的密切合作。我們在十月成立了身心靈健康與 AI 專家委員會,以協助提供諮詢並界定不同年齡層與 AI 的健康互動模式。這項工作也成為家長控制和家長通知的指導依據。我們也透過全球醫師網引入臨床專業知識,以提供安全研究的依據並評估模型行為,其中涵蓋提升 ChatGPT 對困境的辨識能力,以及在適當時引導使用者尋求專業照護。我們在GPT‑5.2的基礎上進一步發展,並透過與 ThroughLine(在新視窗中開啟) 的合作,在 ChatGPT 與 Sora 中呈現本地化後的求助熱線,從而擴展使用者取得實際輔導的管道。
我們已開始在 ChatGPT 消費者方案中逐步導入年齡預測模型(在新視窗中開啟)。此舉將讓我們在認定帳戶屬於未成年使用者時,自動啟用青少年保護措施。若我們無法確定使用者年齡或資訊不足,系統將預設為未滿 18 歲的使用體驗,並提供成年人進行年齡驗證的途徑。
強化青少年安全是一項持續進行的工作。我們將持續完善家長監控與模型功能、拓展家長資源,並與組織、研究人員及專家夥伴合作,其中涵蓋身心靈健康委員會與全球醫師網。
我們致力於建立完善的青少年保護措施並持續改善,讓青少年和家庭能獲得更佳支援。


