Các đầu ra “yêu tinh” lan rộng trong các mô hình AI như thế nào: dòng thời gian, nguyên nhân gốc rễ và các biện pháp khắc phục đằng sau những điểm khác thường do tính cách chi phối hành vi của GPT-5.
Tìm hiểu cách thông số kỹ thuật của mô hình của OpenAI đóng vai trò là một khuôn khổ công khai cho hành vi của mô hình, cân bằng giữa an toàn, quyền tự do của người dùng và trách nhiệm giải trình khi các hệ thống AI tiếp tục phát triển.
Cách OpenAI sử dụng giám sát chuỗi tư duy để nghiên cứu trường hợp sai lệch ở các tác nhân lập trình nội bộ—phân tích các hoạt động triển khai trong thế giới thực để phát hiện rủi ro và củng cố các biện pháp bảo vệ an toàn AI.
IH-Challenge huấn luyện các mô hình ưu tiên các hướng dẫn đáng tin cậy, cải thiện hệ thống phân cấp hướng dẫn, khả năng điều hướng an toàn và khả năng chống lại các cuộc tấn công chèn câu lệnh.
OpenAI giới thiệu CoT-Control và nhận thấy các mô hình suy luận gặp khó khăn trong việc kiểm soát các chuỗi tư duy của mình, củng cố khả năng giám sát như một biện pháp bảo vệ an toàn AI.
Bản in sẵn mới mở rộng biên độ tán xạ một helicity âm sang hạt hấp dẫn, với GPT-5.2 Pro giúp suy ra và xác minh các biên độ cây hạt hấp dẫn khác không trong hấp dẫn lượng tử.