12 tháng 9, 2024

Giới thiệu OpenAI o1‑preview

Một serie mô hình lý luận mới để giải quyết các vấn đề khó. Hiện đã có sẵn.

Đang tải…

Cập nhật ngày 17 tháng 9 năm 2024: Giới hạn hiện là 50 truy vấn mỗi tuần cho o1‑preview và 50 truy vấn mỗi ngày cho o1‑mini.

Chúng tôi đã phát triển một loạt mô hình AI mới được thiết kế để suy nghĩ lâu hơn trước khi phản hồi. Các mô hình này có thể suy luận thông qua các tác vụ phức tạp và giải quyết các vấn đề khó hơn so với các mô hình trước đây trong các lĩnh vực khoa học, lập trình và toán học.

Hôm nay, chúng tôi phát hành phần đầu tiên của serie mô hình này trên ChatGPT và API của mình. Đây là bản xem trước và chúng tôi dự kiến sẽ cập nhật và cải tiến thường xuyên. Trong lần phát hành này, chúng tôi cũng bao gồm các đánh giá cho bản cập nhật tiếp theo, hiện đang trong quá trình phát triển.

Cách thức hoạt động

Chúng tôi đã huấn luyện các mô hình này dành thêm thời gian suy nghĩ các vấn đề trước khi phản hồi, giống như con người vậy. Thông qua huấn luyện, các mô hình này học cách tinh chỉnh quá trình suy nghĩ, thử nghiệm nhiều chiến lược khác nhau và nhận ra lỗi sai của mình.

Trong các thử nghiệm của chúng tôi, bản cập nhật mô hình tiếp theo có hiệu suất tương tự như các nghiên cứu sinh bậc tiến sĩ trong các tác vụ tiêu chuẩn vật lý, hóa học và sinh học khó khăn. Chúng tôi cũng phát hiện thấy mô hình này giải toán và lập trình rất hiệu quả. Trong kỳ thi đầu vào Olympic Toán Quốc Tế (IMO), GPT‑4o chỉ giải đúng 13% số bài toán, trong khi mô hình lý luận giải đúng 83%. Khả năng lập trình của serie mô hình này được đánh giá trong nhiều cuộc thi và đạt mức phân vị thứ 89 trong các cuộc thi Codeforces. Bạn có thể tìm hiểu thêm trong bài đăng nghiên cứu kỹ thuật của chúng tôi.

Là một mô hình ban đầu, ChatGPT vẫn chưa có nhiều tính năng hữu ích như duyệt web để tìm thông tin và tải lên tệp và hình ảnh. Trong thời gian tới, GPT‑4o sẽ có khả năng tốt hơn đối với nhiều trường hợp phổ biến.

Tuy nhiên, đối với các tác vụ suy luận phức tạp, đây là một bước tiến đáng kể và thể hiện một cấp độ mới về khả năng của AI. Với điều này, chúng tôi sẽ thiết lập lại bộ đếm về 1 và đặt tên cho serie mô hình này là OpenAI o1.

An toàn

Trong quá trình phát triển các mô hình mới này, chúng tôi đã đưa ra phương pháp huấn luyện an toàn mới, tận dụng khả năng suy luận của bản thân các mô hình để tuân thủ các hướng dẫn về an toàn và sự phù hợp. Khi có thể lý suy luận các quy tắc an toàn trong bối cảnh cụ thể, chúng ta có thể áp dụng chúng hiệu quả hơn.

Một cách để chúng tôi đo lường mức độ an toàn là kiểm tra xem mô hình có tuân thủ tốt các quy tắc an toàn hay không nếu người dùng cố gắng vượt qua chúng (còn gọi là "bẻ khóa"). Ở một trong những bài kiểm tra bẻ khóa khó nhất của chúng tôi, GPT‑4o đạt 22 điểm (trong thang điểm từ 0-100) trong khi mô hình o1‑preview của chúng tôi đạt 84 điểm. Bạn có thể đọc thêm về bài kiểm tra này trong thẻ hệ thống và bài đăng nghiên cứu của chúng tôi.

Để phù hợp với khả năng mới của các mô hình này, chúng tôi đã đẩy mạnh công tác an toàn, quản trị nội bộ và hợp tác với chính quyền liên bang. Điều này bao gồm các cuộc thử nghiệm và đánh giá nghiêm ngặt bằng Khung Sẵn sàng⁠(mở trong cửa sổ mới), hoạt động mô phỏng tấn công tốt nhất và các quy trình đánh giá cấp hội đồng quản trị, bao gồm cả Ủy ban An toàn & Bảo mật của chúng tôi.

Để thúc đẩy cam kết của chúng tôi về an toàn AI, chúng tôi mới đây đã hợp thức hóa các thỏa thuận với Hoa Kỳ và Vương quốc Anh. Viện An Toàn AI. Chúng tôi đã bắt đầu triển khai các thỏa thuận này, bao gồm việc cấp cho các viện quyền truy cập sớm vào phiên bản nghiên cứu của mô hình này. Đây là bước quan trọng đầu tiên trong quan hệ đối tác của chúng tôi, giúp thiết lập quy trình nghiên cứu, đánh giá và thử nghiệm các mô hình tương lai trước và sau khi phát hành công khai.

Đối tượng phục vụ

Những khả năng suy luận nâng cao này có thể đặc biệt hữu ích nếu bạn đang giải quyết các vấn đề phức tạp trong lĩnh vực khoa học, lập trình, toán học và các lĩnh vực tương tự. Ví dụ: o1 có thể được các nhà nghiên cứu chăm sóc sức khỏe sử dụng để chú thích dữ liệu giải trình tự tế bào, các nhà vật lý học có thể sử dụng để tạo ra các công thức toán học phức tạp cần thiết trong quang học lượng tử và các nhà phát triển trong mọi lĩnh vực có thể sử dụng để xây dựng và thực hiện quy trình làm việc nhiều bước.

OpenAI o1-mini

Serie mô hình o1 có khả năng tạo và gỡ lỗi mã phức tạp một cách chính xác. Để cung cấp giải pháp hiệu quả hơn cho các nhà phát triển, chúng tôi cũng phát hành OpenAI o1‑mini, một mô hình lý luận nhanh hơn, rẻ hơn và đặc biệt hiệu quả trong việc lập trình. Vì là một mô hình nhỏ hơn, o1‑mini rẻ hơn 80% so với o1‑preview, khiến nó trở thành một mô hình mạnh mẽ, tiết kiệm cho các ứng dụng đòi hỏi khả năng suy luận nhưng không cần kiến thức rộng về thế giới.

Cách sử dụng OpenAI o1

Người dùng ChatGPT Plus và Team sẽ có thể truy cập các mô hình o1 trong ChatGPT từ hôm nay. Cả o1‑preview và o1‑mini đều có thể được chọn thủ công trong trình chọn mô hình và khi ra mắt, giới hạn hàng tuần sẽ là 30 tin nhắn cho o1‑preview và 50 tin nhắn cho o1‑mini. Chúng tôi đang nỗ lực để tăng các giới hạn đó và cho phép ChatGPT tự động chọn đúng mô hình cho một lời nhắc nhất định.

Hình ảnh menu thả xuống của ChatGPT mới hiển thị tùy chọn mô hình "o1-preview" mới trên nền trừu tượng màu vàng và xanh lam sáng màu

Người dùng ChatGPT Enterprise và Edu sẽ có quyền truy cập vào cả hai mô hình từ tuần tới.

Các nhà phát triển đủ điều kiện sử dụng API bậc 5⁠(mở trong cửa sổ mới) có thể bắt đầu tạo nguyên mẫu bằng cả hai mô hình trong API ngay hôm nay với giới hạn là 20 RPM. Chúng tôi đang cố gắng tăng các giới hạn này sau khi thử nghiệm thêm. API dành cho các mô hình này hiện không bao gồm chức năng gọi hàm, phát trực tuyến, hỗ trợ thông báo hệ thống và các tính năng khác. Để bắt đầu, hãy xem tài liệu API⁠(mở trong cửa sổ mới).

Chúng tôi cũng đang có kế hoạch cung cấp quyền truy cập o1‑mini cho tất cả người dùng ChatGPT Free.

Kế hoạch tiếp theo

Đây là bản xem trước sớm về các mô hình lý luận này trong ChatGPT và API. Ngoài các bản cập nhật dành cho mô hình, chúng tôi hy vọng sẽ bổ sung tính năng duyệt web, tải tệp và hình ảnh cùng nhiều tính năng khác để giúp chúng trở nên hữu ích hơn với mọi người.

Chúng tôi cũng có kế hoạch tiếp tục phát triển và phát hành các mô hình trong serie mô hình GPT, bên cạnh serie OpenAI o1 mới.

Tác giả

OpenAI