Thúc đẩy nghiên cứu độc lập về căn chỉnh AI
Chúng tôi cam kết 7,5 triệu USD cho Dự án Alignment Project để tài trợ cho nghiên cứu độc lập nhằm phát triển các biện pháp giảm thiểu rủi ro về an toàn và an ninh từ AI không phù hợp.
Khi các hệ thống AI trở nên có năng lực hơn và tự chủ hơn, nghiên cứu về sự phù hợp cần vừa theo kịp vừa mở rộng tính đa dạng. Tại OpenAI, chúng tôi đầu tư mạnh mẽ vào nghiên cứu về sự phù hợp và an toàn tiên phong vì điều này rất quan trọng đối với sứ mệnh của chúng tôi. Chúng tôi cũng tin rằng việc đảm bảo AGI an toàn và có lợi cho tất cả mọi người không thể được thực hiện bởi bất kỳ tổ chức đơn lẻ nào và chúng tôi muốn hỗ trợ nghiên cứu độc lập cũng như các phương pháp tiếp cận khái niệm có thể được thực hiện bên ngoài các phòng thí nghiệm tiên phong. Chúng tôi tin rằng tương lai của AI sẽ không diễn ra chính xác như bất kỳ ai dự đoán, và rằng nhiều người hơn nữa nên có tiếng nói trong việc định hình kết quả.
Hôm nay, chúng tôi xin công bố khoản tài trợ trị giá 7,5 triệu USD cho The Alignment Project(mở trong cửa sổ mới), một quỹ toàn cầu dành cho nghiên cứu độc lập về sự đồng bộ do Viện An ninh AI Vương quốc Anh (UK AISI) thành lập. Renaissance Philanthropy đang hỗ trợ việc quản lý khoản tài trợ. Đóng góp này giúp biến The Alignment Project thành một trong những nỗ lực tài trợ chuyên biệt lớn nhất cho nghiên cứu điều chỉnh độc lập cho đến nay và củng cố hệ sinh thái độc lập rộng lớn hơn.
Các phòng thí nghiệm tiên phong như OpenAI đang ở một vị thế độc đáo để theo đuổi nghiên cứu về sự điều chỉnh, phụ thuộc vào việc tiếp cận các mô hình tiên phong và năng lực tính toán đáng kể—công việc mà các nhà nghiên cứu độc lập thường khó có thể khám phá. Chúng tôi dành nhiều nỗ lực căn chỉnh nội bộ để phát triển các phương pháp có thể mở rộng, nhằm đảm bảo tiến bộ về căn chỉnh theo kịp với tiến bộ về năng lực. Chúng tôi tin rằng triển khai lặp—từng bước tăng cường năng lực đồng thời củng cố các biện pháp bảo vệ—giúp phát hiện vấn đề sớm và cung cấp cho chúng tôi bằng chứng cụ thể về những gì hiệu quả trong thực tế, và rằng phát triển có trách nhiệm đòi hỏi sự căn chỉnh và công việc an toàn đáng kể được tích hợp chặt chẽ với việc xây dựng và triển khai mô hình.
Song song đó, lĩnh vực này được hưởng lợi từ việc đầu tư bền bỉ vào nghiên cứu độc lập và khám phá—có thể mở rộng không gian ý tưởng và tìm ra những hướng đi mới. Nghiên cứu độc lập vẫn là điều cần thiết; trong nhiều loại hình tìm hiểu hữu ích, các phòng thí nghiệm không giữ được lợi thế so sánh. Một hệ sinh thái điều chỉnh lành mạnh phụ thuộc vào các nhóm độc lập kiểm thử những giả định đa dạng, phát triển các khung thay thế và khám phá các ý tưởng mang tính khái niệm, lý thuyết và 'blue-sky' có thể không phù hợp gọn gàng với lộ trình của bất kỳ tổ chức nào.
Và vì tiến trình hướng tới AGI cuối cùng có thể phụ thuộc vào những đột phá nền tảng làm thay đổi bản chất của vấn đề điều chỉnh và những phương pháp nào là hữu ích nhất, nên điều quan trọng là phải hỗ trợ nghiên cứu có ý nghĩa ngay cả khi các phương pháp chủ đạo hiện nay rốt cuộc không mở rộng theo cách chúng ta kỳ vọng. Trong những thế giới đó, điều đặc biệt quan trọng là có một hệ sinh thái bên ngoài mạnh mẽ thực hiện công việc nền tảng, mang tính khái niệm và không tương quan. Vấn đề về sự phù hợp và an toàn của AI có tầm quan trọng chưa từng có, và chúng ta cần tất cả cùng chung tay vì chúng ta vẫn chưa biết cách tiếp cận nào sẽ chứng tỏ bền vững nhất khi năng lực tiếp tục tiến bộ.
Khoản tài trợ của chúng tôi—khoảng 5,6 triệu Bảng Anh theo tỷ giá hối đoái hiện tại—sẽ đồng tài trợ cho Dự án The Alignment Project (mở trong cửa sổ mới) cùng với các nhà tài trợ khác từ khu vực công, các tổ chức từ thiện và ngành công nghiệp. Tổng quỹ vượt quá 27 triệu Bảng Anh và được thiết kế để hỗ trợ một danh mục rộng các dự án nghiên cứu về sự liên kết trên toàn thế giới, bao trùm các chủ đề đa dạng như lý thuyết độ phức tạp tính toán, lý thuyết kinh tế và lý thuyết trò chơi, khoa học nhận thức, và lý thuyết thông tin và mật mã học. Các dự án riêng lẻ thường được tài trợ từ 50.000 Bảng Anh đến 1 triệu Bảng Anh, và cũng có thể nhận được tùy chọn truy cập vào tài nguyên tính toán và hỗ trợ chuyên gia.
Nguồn tài trợ của chúng tôi không tạo ra một chương trình hoặc quy trình lựa chọn mới, cũng không ảnh hưởng đến quy trình hiện có; mà làm tăng số lượng dự án(mở trong cửa sổ mới) chất lượng cao đã được thẩm định có thể được tài trợ trong vòng hiện tại.
UK AISI đang ở vị thế thuận lợi để chỉ đạo tài trợ điều chỉnh ở quy mô và phạm vi này. Nó mang đến một liên minh liên ngành đã được thiết lập, bao gồm chính phủ, giới học thuật, hoạt động từ thiện và ngành công nghiệp, cùng với một quy trình cấp tài trợ đã được khởi động và một lượng lớn các đề xuất đã trải qua sự đánh giá của chuyên gia. Là một tổ chức nghiên cứu của chính phủ Vương quốc Anh thuộc Bộ Khoa học, Đổi mới và Công nghệ (DSIT), tổ chức này cũng có nhiệm vụ tập trung vào các rủi ro nghiêm trọng liên quan đến AI và có kinh nghiệm trong việc triển khai các chương trình tài trợ nghiên cứu.
Vì tương lai của AI sẽ không diễn ra chính xác như bất kỳ ai dự đoán—và có thể tiến triển rất nhanh—chúng tôi tin rằng việc dân chủ hóa, “khả năng phục hồi của AI” và triển khai lặp lại là thiết yếu. Trong khi chúng tôi tiếp tục thúc đẩy nghiên cứu về sự liên kết và an toàn tiên phong tại OpenAI, tiến bộ sẽ được hưởng lợi từ một hệ sinh thái mạnh mẽ, đa dạng và độc lập theo đuổi các phương pháp tiếp cận bổ sung khi năng lực phát triển. Khoản tài trợ này là một bước tiến tới mục tiêu đó. Chúng tôi mong muốn tiếp tục hợp tác với cộng đồng nghiên cứu rộng lớn khi lĩnh vực này phát triển.