12 tháng 2, 2025

Chia sẻ Đặc tả mô hình mới nhất

Chúng tôi đã cập nhật Đặc tả mô hình dựa trên phản hồi bên ngoài và nghiên cứu liên tục của chúng tôi trong việc định hình hành vi mong muốn của mô hình.

Đọc Đặc tả mô hình

Đang tải…

Chúng tôi chia sẻ cập nhật quan trọng về Đặc tả mô hình, một tài liệu xác định các hành vi mà chúng tôi mong muốn từ các mô hình AI của mình. Bản cập nhật này củng cố cam kết của chúng tôi về khả năng tùy chỉnh, tính minh bạch và quyền tự do trí tuệ để khám phá, tranh luận và sáng tạo bằng AI mà không có bất kỳ hạn chế tùy ý nào, đồng thời đảm bảo duy trì các rào cản để giảm thiểu rủi ro gây hại thực sự. Giải pháp này được xây dựng dựa trên các nền tảng mà chúng tôi đã ra mắt vào tháng 5 năm ngoái, đúc kết từ kinh nghiệm áp dụng giải pháp này trong nhiều bối cảnh khác nhau, từ nghiên cứu về sự phù hợp cho đến phục vụ người dùng trên toàn thế giới.

Chúng tôi cũng chia sẻ một số kết quả ban đầu về việc xây dựng mô hình tuân thủ theo các nguyên tắc của Đặc tả mô hình trong nhiều tình huống khác nhau. Những phát hiện này nhấn mạnh sự tiến bộ theo thời gian, cũng như những lĩnh vực mà chúng ta vẫn có thể cải thiện. Đặc tả mô hình—giống như các mô hình của chúng tôi—sẽ tiếp tục phát triển khi chúng tôi áp dụng, chia sẻ và lắng nghe phản hồi từ các bên liên quan. Để hỗ trợ việc sử dụng rộng rãi và cộng tác, chúng tôi phát hành công khai phiên bản Đặc tả mô hình này theo giấy phép Creative Commons CC0. Điều này có nghĩa là các nhà phát triển và nhà nghiên cứu có thể tự do sử dụng, điều chỉnh và xây dựng dựa trên đặc tả trong công việc của mình.

Mục tiêu và nguyên tắc

Mục tiêu của OpenAI là tạo ra các mô hình hữu ích, an toàn và phù hợp với nhu cầu của người dùng và nhà phát triển, đồng thời thúc đẩy sứ mệnh đảm bảo trí tuệ nhân tạo tổng hợp mang lại lợi ích cho toàn thể nhân loại. Để đạt được mục tiêu này, chúng tôi cần triển khai tuần tự các mô hình trao quyền cho nhà phát triển và người dùng, ngăn chặn các mô hình gây hại nghiêm trọng cho người dùng hoặc những người khác, đồng thời duy trì giấy phép hoạt động của OpenAI.

Những mục tiêu này đôi khi có thể xung đột với nhau và Đặc tả mô hình cân bằng sự đánh đổi giữa chúng bằng cách hướng dẫn mô hình tuân theo chuỗi chỉ huy được xác định rõ ràng, cùng với các nguyên tắc bổ sung đặt ra ranh giới và hành vi mặc định cho nhiều tình huống khác nhau. Khung này ưu tiên quyền kiểm soát của người dùng và nhà phát triển trong khi vẫn duy trì ranh giới rõ ràng:

Chuỗi chỉ huy: Xác định thứ tự mô hình ưu tiên các hướng dẫn từ nền tảng (OpenAI), nhà phát triển và người dùng. Hầu hết Đặc tả mô hình đều bao gồm các hướng dẫn mà chúng tôi tin là hữu ích trong nhiều trường hợp, nhưng người dùng và nhà phát triển có thể ghi đè những hướng dẫn này. Điều này cho phép người dùng và nhà phát triển tùy chỉnh hoàn toàn hành vi của mô hình trong khuôn khổ các ranh giới được thiết lập bởi các quy tắc cấp nền tảng.
Cùng nhau tìm kiếm sự thật: Giống như một trợ lý có tính chính trực cao, các mô hình của chúng tôi sẽ trao quyền cho người dùng để họ có thể tự đưa ra quyết định tốt nhất. Điều này đòi hỏi phải cân bằng cẩn trọng giữa (1) tránh định hướng người dùng theo một luận điểm, áp dụng tính khách quan theo mặc định trong khi sẵn sàng khám phá bất kỳ chủ đề nào từ mọi góc độ và (2) nỗ lực để hiểu mục tiêu của người dùng, làm rõ các giả định và chi tiết không chắc chắn, và đưa ra phản hồi xây dựng khi thích hợp—những yêu cầu mà chúng tôi đã lắng nghe và cải thiện.
Đạt hiệu quả cao nhất: Đặt ra các tiêu chuẩn cơ bản về năng lực, bao gồm mức độ chính xác của thông tin, tính sáng tạo và khả năng sử dụng cho lập trình.
Duy trì giới hạn: Giải thích cách mô hình cân bằng quyền tự chủ của người dùng với các biện pháp phòng ngừa để tránh gây hại hoặc lạm dụng. Phiên bản mới này được thiết kế toàn diện, bao gồm đầy đủ mọi lý do mà chúng tôi muốn các mô hình của mình từ chối yêu cầu của người dùng hoặc nhà phát triển.
Dễ gần: Mô tả phong cách trò chuyện mặc định của mô hình—ấm áp, đồng cảm và hữu ích—và cách điều chỉnh phong cách này.
Sử dụng phong cách phù hợp: Cung cấp hướng dẫn mặc định về định dạng và cách trình bày. Cho dù là các dấu đầu dòng gọn gàng, đoạn mã ngắn gọn hay cuộc trò chuyện bằng giọng nói, mục tiêu của chúng tôi là đảm bảo tính rõ ràng và khả năng sử dụng.

Tôn trọng quyền tự do trí tuệ

Bản Đặc tả mô hình cập nhật tôn trọng quyền tự do trí tuệ - ý tưởng rằng AI nên trao quyền cho mọi người khám phá, tranh luận và sáng tạo mà không có bất kỳ hạn chế tùy ý nào - bất kể chủ đề đó có khó khăn hay gây tranh cãi đến đâu. Trong một thế giới mà các công cụ AI ngày càng có khả năng định hình diễn ngôn, việc trao đổi thông tin và quan điểm một cách tự do là điều cần thiết cho sự tiến bộ và đổi mới.

Triết lý này được lồng ghép trong các phần “Duy trì giới hạn” và “Cùng nhau tìm kiếm sự thật”. Ví dụ: mặc dù mô hình tuyệt đối không được cung cấp hướng dẫn chi tiết về cách chế tạo bom hay xâm phạm quyền riêng tư cá nhân, nhưng mô hình được khuyến khích đưa ra câu trả lời chu đáo cho các câu hỏi nhạy cảm về chính trị hoặc văn hóa mà không tuyên truyền bất kỳ luận điểm cụ thể nào. Về bản chất, chúng tôi đã củng cố nguyên tắc rằng không có ý tưởng nào bị cấm thảo luận, miễn là mô hình đó không gây ra tác hại đáng kể cho người dùng hoặc người khác (ví dụ: thực hiện hành vi khủng bố).

Đo lường tiến độ

Để hiểu rõ hơn về hiệu suất thực tế, chúng tôi đã bắt đầu tập hợp một bộ lời nhắc tỉ mỉ được thiết kế để kiểm tra mức độ tuân thủ của các mô hình đối với từng nguyên tắc trong Đặc tả mô hình. Những lời nhắc này được tạo ra bằng cách kết hợp giữa đầu ra do mô hình tạo và đánh giá của chuyên gia, đảm bảo bao quát được cả những tình huống điển hình và phức tạp hơn.

Biểu đồ thanh với các thanh màu trắng và vàng xen kẽ trên nền đen, thể hiện các phép so sánh dữ liệu. Các thanh màu vàng có họa tiết chấm bi, điểm thêm kết cấu cho hình ảnh trực quan.

Kết quả sơ bộ cho thấy sự cải thiện đáng kể trong việc tuân thủ Đặc tả mô hình so với hệ thống tốt nhất của chúng tôi vào tháng 5 năm ngoái. Mặc dù một số khác biệt này có thể là nhờ các điểm cập nhật trong chính sách, nhưng chúng tôi tin rằng phần lớn bắt nguồn từ mức độ phù hợp cao hơn. Mặc dù tiến triển này rất đáng khích lệ, nhưng chúng tôi nhận thấy vẫn còn nhiều cơ hội cải thiện.

Chúng tôi xem đây là sự khởi đầu của một quá trình liên tục. Chúng tôi có kế hoạch tiếp tục mở rộng bộ thử thách của mình bằng các ví dụ mới, đặc biệt là các trường hợp được phát hiện thông qua quá trình sử dụng thực tế, mà các mô hình và Đặc tả mô hình của chúng tôi vẫn chưa giải quyết được đầy đủ.

Trong quá trình định hình phiên bản Đặc tả mô hình này, chúng tôi đã kết hợp phản hồi từ phiên bản đầu tiên cũng như những bài học kinh nghiệm từ nghiên cứu về sự phù hợp và hoạt động triển khai thực tế. Trong tương lai, chúng tôi muốn thu được nhiều ý kiến đóng góp rộng rãi hơn nữa của công chúng. Để xây dựng các quy trình hướng đến mục đích đó, chúng tôi đã tiến hành nghiên cứu thí điểm với khoảng 1.000 cá nhân - mỗi người sẽ xem xét hành vi của mô hình, các quy tắc được đề xuất và chia sẻ suy nghĩ của họ. Mặc dù những nghiên cứu này chưa phản ánh quan điểm rộng rãi nhưng những thông tin thu được ban đầu đã trực tiếp dẫn đến một số thay đổi. Chúng tôi coi đây là một quá trình liên tục, lặp lại và luôn cam kết học hỏi và cải tiến cách tiếp cận của mình.

Cung cấp mã nguồn mở của Đặc tả mô hình

Chúng tôi phát hành công khai phiên bản mới này của Đặc tả mô hình theo giấy phép Creative Commons CC0. Điều này có nghĩa là các nhà phát triển và nhà nghiên cứu có thể tự do sử dụng, điều chỉnh hoặc xây dựng dựa trên Đặc tả mô hình trong công việc của họ. Chúng tôi cũng đang cung cấp mã nguồn mở của các lời nhắc đánh giá được sử dụng ở trên và đặt mục tiêu phát hành thêm mã, artifact và công cụ để đánh giá và điều chỉnh Đặc tả trong tương lai.

Bạn có thể tìm thấy những lời nhắc này và nguồn Đặc tả mô hình trong kho lưu trữ Github⁠(mở trong cửa sổ mới)mới, tại đó chúng tôi dự định sẽ thường xuyên xuất bản các phiên bản Đặc tả mô hình mới trong tương lai.

Kế hoạch tiếp theo là gì?

Trong quá trình phát triển hệ thống AI, chúng tôi sẽ tiếp tục áp dụng lại các nguyên tắc này, mời cộng đồng phản hồi và chia sẻ công khai tiến trình của mình. Trong tương lai, chúng tôi sẽ không xuất bản bài đăng blog cho mọi bản cập nhật của Đặc tả mô hình. Thay vào đó, bạn luôn có thể tìm và theo dõi các bản cập nhật mới nhất tại model-spec.openai.com⁠(mở trong cửa sổ mới).

Mục tiêu của chúng tôi là liên tục cho phép các trường hợp sử dụng mới một cách an toàn, phát triển phương pháp tiếp cận dựa trên nghiên cứu và đổi mới liên tục. Vai trò ngày càng tăng của AI trong cuộc sống hàng ngày khiến việc liên tục học hỏi, cải tiến và tương tác một cách cởi mở trở nên cần thiết. Cách tiếp cận này không chỉ phản ánh những gì chúng tôi đã học được cho đến nay mà còn thể hiện niềm tin của chúng tôi rằng việc điều chỉnh AI là một hành trình liên tục - một hành trình mà chúng tôi hy vọng bạn sẽ cùng tham gia. Nếu có phản hồi về bản Đặc tả này, bạn có thể chia sẻ tại đây.

Authors

OpenAI