OpenAI と Molecule.one は、GPT-5.4 を活用する準自律型AI化学者が、医薬品合成における重要な反応を改善し、医薬化学研究を前進させた事例を紹介します。
LifeSciBench のご紹介。専門家が作成・レビューした、AI システムが現実のライフサイエンス研究タスクと意思決定にどう対応するかを評価するベンチマークです。
AI モデルで「goblin」を使った出力が広がった経緯を解説。GPT-5 の挙動に見られたパーソナリティ由来の癖について、その広がり方、根本原因、そして修正対応を紹介します。
OpenAI の Model Spec が、 AI システムの進歩に伴って、安全性、ユーザーの自由、説明責任のバランスを取りながら、モデルの振る舞いに関する公開フレームワークとしてどのように機能しているかをご覧ください。
OpenAI は、思考プロセスのモニタリングを通じて、社内のコーディングエージェントにおける不整合を研究しています。実環境での導入事例を分析し、リスクを検知して、AI の安全対策を強化しています。
IH-Challenge は、信頼できる指示を優先するようモデルを学習させることで、指示階層、安全性ステアラビリティ、プロンプトインジェクション攻撃への耐性を向上させます。