OpenAI 與 Molecule.one 展示近乎自主的 AI 化學家如何使用 GPT-5.4 改善關鍵製藥反應,推進藥物化學研究。
LifeSciBench 是一套由專家撰寫與審查的基準,用於評估 AI 系統如何處理真實世界生命科學研究任務與決策。
AI 模型的輸出越來越常提到哥布林:解析 GPT-5 行為中由人格設定引發的怪癖,包括時間軸、原因與修正方式。
了解 OpenAI 的模型規格如何作為模型行為的公開框架,隨著 AI 系統持續演進,在安全、使用者自由與問責之間取得平衡。
OpenAI 如何透過思路鏈監控,研究內部程式碼編寫智慧體的行為錯位,並分析真實世界的部署案例,用來偵測風險並強化 AI 安全防護。
IH-Challenge 訓練模型優先遵循受信任的指令,藉此提升指令階層、安全可控性,以及抵禦提示注入攻擊的能力。
OpenAI 推出 CoT-Control,並發現推理模型難以控制自己的思路鏈,進一步強化可監控性在 AI 安全防護中的角色。