사람들은 매일 OpenAI의 툴을 사용해 커뮤니케이션을 더욱 풍부하고, 유용하며, 접근하기 쉽게 만드는 방식으로 이미지와 오디오를 생성하고 편집하고 있습니다. 이러한 도구가 사람들이 만들고, 상상하고, 공유하는 방식의 일부가 되어감에 따라, 사람들이 미디어의 출처를 이해하고 확인해 더 확신을 갖고 해석할 수 있도록 하는 것이 중요합니다. 출처 신호는 콘텐츠가 어디서 왔는지, 어떻게 생성되거나 편집되었는지, 그리고 주장하는 바와 일치하는지를 보여주는 맥락을 제공해 이를 도울 수 있습니다.
오늘 OpenAI는 온라인에서의 신뢰 구축을 위해 다층적이고 에코시스템 중심적인 모델을 기반으로 콘텐츠 출처에 대한 접근 방식을 강화하고 있습니다. OpenAI는 C2PA 적합성을 통해 다른 도구와 플랫폼이 출처 신호를 더 쉽게 인식하도록 하고, Google과의 협력을 통해 이미지에 내구성 있는 크로스플랫폼 SynthID 워터마킹을 추가하며, 이미지가 OpenAI에서 왔는지 대중이 확인할 수 있는 도구의 미리보기도 공유합니다.
이러한 업데이트는 모두 개방형 표준을 지원하고, OpenAI가 생성한 콘텐츠를 더 쉽게 식별할 수 있게 하며, 더 신뢰할 수 있는 정보 생태계를 지원하기 위해 업계 전반과 협력해 온 OpenAI의 기존 작업을 바탕으로 합니다.
OpenAI는 2024년부터 출처 표준의 개발과 도입에 참여해 왔습니다. 이때부터 DALL·E 3(새 창에서 열기)로 생성된 이미지에 Content Credentials를 추가하기 시작했고, 이후 ImageGen(새 창에서 열기)과 Sora(새 창에서 열기)에도 이를 적용했습니다. OpenAI는 또한 콘텐츠 출처를 위한 개방형 기술 표준을 추진하는 범산업 단체인 Coalition for Content Provenance and Authenticity(C2PA)의 운영위원회에도 합류했습니다. C2PA의 기술적 접근 방식은 메타데이터와 암호학적 서명을 사용해 미디어에 관한 정보가 콘텐츠 자체와 함께 안전하게 이동하도록 돕습니다. 이 정보에는 출처를 평가하는 기자, 무결성 관련 결정을 내리는 플랫폼, 그리고 온라인에서 자신이 보고 있는 것을 이해하려는 사람들에게 도움이 되는 맥락이 포함됩니다.
OpenAI는 최근 C2PA 적합 생성 제품(새 창에서 열기)이 되었습니다. C2PA 적합성을 갖춤으로써 OpenAI는 플랫폼이 콘텐츠에 첨부된 출처 정보를 신뢰할 수 있는 방식으로 읽고, 보존하고, 전달할 수 있도록 지원합니다. 이는 콘텐츠 출처 정보가 콘텐츠가 처음 생성된 플랫폼을 넘어 유지되어야만 의미가 있으며, 적합성 준수가 이를 가능하게 하기 때문에 중요합니다.
C2PA 메타데이터는 출처의 중요한 기반입니다. 이는 콘텐츠가 어디서 왔는지, 어떻게 생성되거나 편집되었는지, 그리고 누가 그 정보에 서명했는지에 대한 정보를 담아 이동하도록 돕습니다. 하지만 메타데이터가 완벽한 것은 아닙니다. 메타데이터는 제거될 수 있고, 업로드와 다운로드 과정에서 사라질 수 있으며, 파일 형식 변경, 크기 조정, 스크린샷 같은 변환으로 손상될 수도 있습니다.
출처 정보를 더 탄탄하게 만들기 위해 OpenAI는 다층적 접근 방식을 취하고 있으며, Google DeepMind의 SynthID(새 창에서 열기)를 통한 워터마킹을 도입하고 있습니다. 이는 ChatGPT, Codex 또는 OpenAI API를 통해 생성된 이미지부터 시작됩니다. SynthID는 C2PA 메타데이터 기반 접근 방식을 보완하는 보이지 않는 워터마크 계층을 삽입합니다.
OpenAI는 한동안 이를 준비해 왔습니다. Sora에는 눈에 보이는 워터마크를, Voice Engine에는 오디오 워터마크를 사용했으며, 이러한 장치가 실제 배포 환경에서 시간이 지나도 정확성과 신뢰성을 유지하는지 계속 테스트하고 연구했습니다.
이 두 시스템은 서로를 보완합니다. C2PA는 콘텐츠가 자세한 맥락을 담도록 돕고, SynthID는 메타데이터가 유지되지 않을 때도 신호를 보존하도록 돕습니다. 워터마킹은 스크린샷 같은 변환에도 더 오래 유지될 수 있고, 메타데이터는 워터마크만으로는 제공할 수 없는 더 많은 정보를 제공할 수 있습니다. 이 둘을 함께 사용하면 각각을 단독으로 사용할 때보다 콘텐츠 출처 정보의 복원력이 더욱 강화됩니다.
대부분의 수정에도 견딜 수 있는 신뢰도 높은 메타데이터와 워터마크는 출처 신호로서 더 오래 유지될 수 있습니다. 하지만 이러한 신호가 포함되어 있는지 일반 사용자가 확인할 수 있는 방법도 필요합니다. OpenAI는 이를 위해 ChatGPT, OpenAI API, Codex에서 생성된 이미지인지 확인할 수 있도록 돕는 공개 검증 도구를 프리뷰 버전으로 선보입니다. 이 도구는 업로드된 이미지에 Content Credentials와 SynthID 등 출처 신호가 포함되어 있는지 확인합니다.
OpenAI는 사용자들이 콘텐츠의 출처 정보를 더 쉽게 검증하고 해석할 수 있어야 한다고 믿습니다. OpenAI의 도구는 여러 신호를 통합해 "이 콘텐츠는 AI로 생성되었는가?"라는 질문에 답하는 데 도움을 줄 수 있습니다. 이는 2024년 이미지 탐지 분류기 초기 연구 프리뷰에서 얻은 내용을 바탕으로 합니다. 이 도구를 사용하면 미디어에 OpenAI에서 비롯된 SynthID 워터마크가 있는지 안정적으로 감지할 수 있으며, C2PA 메타데이터가 발견될 경우 이를 함께 표시할 수 있습니다.

어떤 탐지 방법도 완벽하지 않기 때문에, OpenAI는 탐지가 실패하는 경우 신중한 접근 방식을 취합니다. 예를 들어 메타데이터나 워터마크가 탐지되지 않으면, 출처 신호가 경우에 따라 제거될 수 있으므로 이 도구는 해당 이미지가 OpenAI 도구로 생성되었는지에 대해 단정적인 결론을 내리지 않습니다.
출시 시점에 이 도구는 OpenAI가 생성한 콘텐츠로 제한됩니다. 앞으로 몇 달 안에 OpenAI는 플랫폼 전반에서 검증이 가능해지도록 범산업적 노력을 지원하는 것을 목표로 합니다. 시간이 지나면 OpenAI는 사람들이 온라인에서 접할 수 있는 더 많은 유형의 콘텐츠도 지원할 것으로 기대합니다.
어떤 단일 출처 기술도 그 자체만으로는 충분하지 않습니다. OpenAI는 강력한 접근 방식이 공통 표준, 오래 지속되는 워터마킹 신호, 그리고 공개 검증을 결합한다고 믿습니다. Content Credentials에 대한 오랜 지원을 바탕으로, C2PA 적합성을 갖추고, SynthID를 도입하며, 공개 검증 도구를 미리 선보임으로써 OpenAI는 장기적으로 더 상호운용 가능한 출처 생태계에 기여하기를 바랍니다.


