GPT-5.6 is a new family of three models: Sol, our new flagship model; Terra, a capable lower-cost option; and Luna, our fastest and most cost-efficient model. The safeguards we have built for this launch – our most robust yet – are built to deliver these models safely and at scale, around the world.
OpenAI và Molecule.one cho thấy cách thức nhà hóa học AI gần như tự chủ sử dụng GPT-5.4 đã cải thiện một phản ứng điều chế thuốc then chốt, góp phần thúc đẩy nghiên cứu hóa dược.
Giới thiệu LifeSciBench, bộ đo chuẩn do chuyên gia viết và đánh giá, dùng để đo cách hệ thống AI xử lý nhiệm vụ và quyết định nghiên cứu khoa học sự sống thực tế.
Các đầu ra “yêu tinh” lan rộng trong các mô hình AI như thế nào: dòng thời gian, nguyên nhân gốc rễ và các biện pháp khắc phục đằng sau những điểm khác thường do tính cách chi phối hành vi của GPT-5.
Tìm hiểu cách thông số kỹ thuật của mô hình của OpenAI đóng vai trò là một khuôn khổ công khai cho hành vi của mô hình, cân bằng giữa an toàn, quyền tự do của người dùng và trách nhiệm giải trình khi các hệ thống AI tiếp tục phát triển.
Cách OpenAI sử dụng giám sát chuỗi tư duy để nghiên cứu trường hợp sai lệch ở các tác nhân lập trình nội bộ—phân tích các hoạt động triển khai trong thế giới thực để phát hiện rủi ro và củng cố các biện pháp bảo vệ an toàn AI.
IH-Challenge huấn luyện các mô hình ưu tiên các hướng dẫn đáng tin cậy, cải thiện hệ thống phân cấp hướng dẫn, khả năng điều hướng an toàn và khả năng chống lại các cuộc tấn công chèn câu lệnh.