Thúc đẩy truy xuất nguồn gốc nội dung vì một hệ sinh thái AI an toàn hơn, minh bạch hơn
Giúp mọi người hiểu nguồn gốc của nội dung do AI tạo ra thông qua Xác thực nội dung (Content Credential), SynthID và một công cụ xác minh công khai giai đoạn đầu.
Nhà nhà đang hằng ngày sử dụng công cụ của OpenAI để tạo và chỉnh sửa hình ảnh, cũng như âm thanh, để việc trò chuyện mang nhiều biểu cảm hơn, hữu ích hơn và dễ tiếp cận hơn. Khi các công cụ này trở thành một phần trong cách mọi người xây dựng, tưởng tượng và chia sẻ, điều quan trọng là họ có thể hiểu và xác minh nguồn gốc của hình ảnh và âm thanh, từ đó tự tin diễn giải chúng hơn. Các tín hiệu nguồn gốc có thể giúp cung cấp ngữ cảnh về nguồn gốc nội dung, được tạo ra hoặc chỉnh sửa như thế nào, và liệu nó có đúng như những gì nó tự khẳng định hay không.
Hiện tại, chúng tôi đang củng cố cách tiếp cận của mình đối với nguồn gốc nội dung bằng một mô hình đa tầng, hướng đến hệ sinh thái, nhằm xây dựng lòng tin ở môi trường trực tuyến. Chúng tôi đang giúp các công cụ và nền tảng khác dễ nhận diện các tín hiệu nguồn gốc của mình hơn thông qua việc tuân thủ C2PA, bổ sung watermark SynthID bền vững và hoạt động trên nhiều nền tảng cho hình ảnh thông qua quan hệ hợp tác với Google. Đồng thời, chúng tôi chia sẻ bản xem trước của một công cụ mà công chúng có thể dùng để xác minh liệu hình ảnh có do OpenAI tạo hay không.
Những cập nhật này được xây dựng dựa trên nỗ lực trước đây của chúng tôi nhằm hỗ trợ các tiêu chuẩn mở, giúp nội dung do OpenAI tạo ra dễ được nhận diện hơn, cũng như hợp tác toàn ngành để hỗ trợ một hệ sinh thái thông tin đáng tin cậy hơn.
OpenAI đã tham gia vào việc phát triển và áp dụng các tiêu chuẩn về nguồn gốc từ năm 2024, khi chúng tôi bắt đầu thêm Xác thực nội dung (Content Credential) vào các hình ảnh được tạo bởi DALL·E 3(mở trong cửa sổ mới) và sau đó là ImageGen(mở trong cửa sổ mới) và Sora(mở trong cửa sổ mới). Chúng tôi cũng đã tham gia Ban Chỉ đạo của Coalition for Content Provenance and Authenticity (C2PA), nhóm liên ngành đứng sau tiêu chuẩn kỹ thuật mở về nguồn gốc nội dung. Cách tiếp cận kỹ thuật của C2PA sử dụng siêu dữ liệu và chữ ký mật mã để giúp thông tin về một nội dung hình ảnh/âm thanh có thể đi cùng chính nội dung đó một cách an toàn. Thông tin này bao gồm ngữ cảnh giúp các nhà báo đánh giá một nguồn tin, các nền tảng đưa ra quyết định về tính toàn vẹn và những người đang cố hiểu những gì họ thấy trên mạng.
Gần đây, chúng tôi đã thực hiện bước đưa OpenAI trở thành một Sản phẩm tạo nội dung tuân thủ quy chuẩn C2PA(mở trong cửa sổ mới). Bằng việc tuân thủ C2PA, chúng tôi đang mang đến cho các nền tảng một phương thức đáng tin cậy để đọc, lưu giữ và truyền tải thông tin nguồn gốc (provenance) mà chúng tôi gắn vào nội dung. Điều này rất quan trọng vì thông tin nguồn gốc (provenance) chỉ phát huy tác dụng khi nó có thể tồn tại và di chuyển qua nhiều nền tảng khác nhau, chứ không chỉ dừng lại ở nền tảng tạo ra nội dung ban đầu.Việc tuân thủ C2PA giúp điều đó trở nên khả thi.
Siêu dữ liệu C2PA là một nền tảng quan trọng cho nguồn gốc. Nó giúp nội dung mang theo thông tin về xuất xứ, được tạo ra hoặc chỉnh sửa như thế nào và ai đã ký xác nhận thông tin đó. Nhưng siêu dữ liệu không phải lúc nào cũng tuyệt đối đáng tin. Nó có thể bị xóa, bị mất trong quá trình tải lên và tải xuống, hoặc bị hỏng bởi các biến đổi như thay đổi định dạng tệp, đổi kích thước hoặc chụp màn hình.
Để làm cho nguồn gốc có khả năng chống chịu tốt hơn, chúng tôi đang áp dụng cách tiếp cận đa tầng và tích hợp watermark thông qua SynthID của Google DeepMind(mở trong cửa sổ mới), bắt đầu với các hình ảnh được tạo qua ChatGPT, Codex hoặc API OpenAI. SynthID nhúng một lớp watermark vô hình bổ trợ cho các cách tiếp cận dựa trên siêu dữ liệu C2PA.
Chúng tôi đặt điều này làm trọng tâm trong quá trình phát triển cũng một thời gian rồi. Chúng tôi đã sử dụng watermark nhìn được rõ trong Sora và watermark âm thanh trong Voice Engine, đồng thời tiếp tục thử nghiệm và nghiên cứu độ chính xác cũng như độ tin cậy theo thời gian. thông qua triển khai.
Hai hệ thống này củng cố lẫn nhau. C2PA giúp nội dung mang theo ngữ cảnh chi tiết; SynthID giúp giữ lại một tín hiệu khi siêu dữ liệu không còn tồn tại. Watermark có thể bền vững hơn trước các biến đổi như chụp màn hình, trong khi siêu dữ liệu có khả năng cung cấp nhiều thông tin hơn so với chỉ một watermark. Khi kết hợp lại, chúng giúp nguồn gốc có khả năng chống chịu tốt hơn so với khi chỉ dùng riêng theo từng tầng.
Siêu dữ liệu đáng tin cậy và hình mờ kháng chịu được hầu hết các chỉnh sửa mà có thể giúp các tín hiệu truy xuất nguồn gốc trở nên bền vững hơn. Nhưng cần có cách để phát hiện các tín hiệu này. Hiện chúng tôi đang giới thiệu bản xem trước của một công cụ xác minh công khai sẽ giúp mọi người xác minh liệu một hình ảnh được tải lên có được tạo trên ChatGPT, API OpenAI hay Codex hay không, bằng cách kiểm tra xem nó có chứa các tín hiệu nguồn gốc, bao gồm Xác thực nội dung (Content Credential) và SynthID, hay không.
Chúng tôi tin rằng nguồn gốc nên dễ để mọi người xác minh và diễn giải hơn, và công cụ của chúng tôi có thể giúp mọi người tham gia trả lời câu hỏi: “Nội dung này có được tạo bằng AI không?” thông qua việc tích hợp nhiều tín hiệu. Chúng tôi xây dựng dựa trên bài học từ bản xem trước nghiên cứu ban đầu của bộ phân loại phát hiện hình ảnh của chúng tôi vào năm 2024, đồng thời cho phép mọi người phát hiện một cách đáng tin cậy xem watermark SynthID xuất phát từ OpenAI có hiện diện trong nội dung hình ảnh/âm thanh hay không, đồng thời hiển thị siêu dữ liệu C2PA khi tìm thấy.

Không có phương pháp phát hiện nào là tuyệt đối đáng tin, vì vậy chúng tôi áp dụng cách tiếp cận thận trọng trong những trường hợp việc phát hiện thất bại. Ví dụ, nếu không phát hiện thấy siêu dữ liệu hoặc watermark, công cụ sẽ không đưa ra kết luận dứt khoát về việc liệu hình ảnh có được tạo bằng các công cụ của OpenAI hay không, vì trong một số trường hợp các tín hiệu nguồn gốc có thể bị xóa.
Khi ra mắt, công cụ này chỉ giới hạn ở nội dung do OpenAI tạo ra. Trong những tháng tới, chúng tôi đặt mục tiêu hỗ trợ các nỗ lực liên ngành để giúp việc xác minh trở nên khả thi trên nhiều nền tảng. Theo thời gian, chúng tôi cũng kỳ vọng sẽ hỗ trợ thêm nhiều loại nội dung mà mọi người có thể gặp trên mạng.
Không có một kỹ thuật truy xuất nguồn gốc nào là đủ nếu chỉ sử dụng riêng lẻ. Chúng tôi tin rằng một cách tiếp cận mạnh mẽ sẽ kết hợp các tiêu chuẩn chung, các tín hiệu watermark bền vững và xác minh công khai. Bằng việc tiếp tục hỗ trợ Xác thực nội dung (Content Credential) lâu dài, tuân thủ C2PA, áp dụng SynthID và giới thiệu công cụ xác minh công khai, chúng tôi hy vọng sẽ góp phần tạo ra một hệ sinh thái truy xuất nguồn gốc tương tác hơn trong dài hạn.


