Avansarea provenienței conținutului pentru un ecosistem AI mai sigur și mai transparent
Ajutăm oamenii să înțeleagă originea conținutului generat de AI prin Content Credentials, SynthID și un instrument public timpuriu de verificare.
Oamenii folosesc zilnic instrumentele OpenAI pentru a crea și edita imagini și conținut audio în moduri care fac comunicarea mai expresivă, mai utilă și mai accesibilă. Pe măsură ce aceste instrumente devin parte din felul în care oamenii creează, își imaginează și distribuie, este important ca ei să poată înțelege și verifica de unde provine conținutul media, pentru a-l interpreta cu mai multă încredere. Semnalele de proveniență pot ajuta oferind oamenilor context despre de unde provine conținutul, cum a fost creat sau editat și dacă este ceea ce pretinde că este.
Astăzi ne consolidăm abordarea privind proveniența conținutului printr-un model multistrat, orientat spre ecosistem, pentru construirea încrederii online. Facem semnalele noastre de proveniență mai ușor de recunoscut de alte instrumente și platforme prin conformitatea C2PA, adăugăm filigranare durabilă SynthID pentru imagini pe mai multe platforme printr-un parteneriat cu Google și prezentăm o previzualizare a unui instrument pe care publicul îl poate folosi pentru a verifica dacă imaginile provin de la OpenAI.
Împreună, aceste actualizări se bazează pe munca noastră anterioară pentru a susține standarde deschise, a face conținutul generat de OpenAI mai ușor de identificat și a colabora la nivelul întregii industrii pentru a sprijini un ecosistem informațional mai demn de încredere.
OpenAI este implicată în dezvoltarea și adoptarea standardelor de proveniență din 2024, când am început să adăugăm Content Credentials imaginilor generate de DALL·E 3(se deschide într-o fereastră nouă) și ulterior de ImageGen(se deschide într-o fereastră nouă) și Sora(se deschide într-o fereastră nouă). Ne-am alăturat și Comitetului Director al Coalition for Content Provenance and Authenticity (C2PA), grupul interindustrial din spatele standardului tehnic deschis pentru proveniența conținutului. Abordarea tehnică a C2PA folosește metadate și semnături criptografice pentru a ajuta informațiile despre un element media să circule în siguranță împreună cu conținutul însuși. Aceste informații includ context care îi ajută pe jurnaliști să evalueze o sursă, platformele să ia decizii privind integritatea și oamenii să înțeleagă ce văd online.
Recent am făcut pasul de a transforma OpenAI într-un produs generator conform C2PA(se deschide într-o fereastră nouă). Devenind conformi cu C2PA, oferim platformelor o modalitate de încredere de a citi, păstra și transmite mai departe informațiile de proveniență pe care le atașăm conținutului nostru. Acest lucru contează deoarece proveniența funcționează doar dacă supraviețuiește dincolo de prima platformă unde este creat conținutul, iar conformitatea face acest lucru posibil.
Metadatele C2PA reprezintă o bază importantă pentru proveniență. Ele ajută conținutul să poarte informații despre de unde provine, cum a fost creat sau editat și cine a semnat aceste informații. Dar metadatele nu sunt infailibile. Ele pot fi eliminate, pierdute prin încărcări și descărcări sau compromise de transformări precum schimbarea formatului fișierului, redimensionarea ori capturile de ecran.
Pentru a face proveniența mai rezilientă, adoptăm o abordare multistrat și integrăm filigranarea prin SynthID de la Google DeepMind(se deschide într-o fereastră nouă), începând cu imaginile generate prin ChatGPT, Codex sau API-ul OpenAI. SynthID integrează un strat invizibil de filigranare care completează abordările C2PA bazate pe metadate.
Lucrăm de ceva timp în această direcție. Am folosit filigrane vizibile în Sora și un filigran audio în Voice Engine și am continuat să testăm și să cercetăm în timp acuratețea și fiabilitatea. prin implementare.
Aceste două sisteme se consolidează reciproc. C2PA ajută conținutul să poarte context detaliat; SynthID ajută la păstrarea unui semnal atunci când metadatele nu supraviețuiesc. Filigranarea poate fi mai durabilă în fața transformărilor precum capturile de ecran, în timp ce metadatele pot oferi mai multe informații decât un simplu filigran. Împreună, ele fac proveniența mai rezilientă decât ar fi oricare dintre aceste straturi de unul singur.
Metadatele de încredere și filigranele care rezistă majorității modificărilor pot face semnalele de proveniență mai durabile. Dar oamenii au nevoie de o modalitate de a detecta aceste semnale. Prezentăm acum o previzualizare a unui instrument public de verificare care îi va ajuta pe oameni să verifice dacă o imagine încărcată a fost generată în ChatGPT, prin API-ul OpenAI sau cu Codex, verificând dacă aceasta conține semnale de proveniență, inclusiv Content Credentials și SynthID.
Credem că proveniența ar trebui să fie mai ușor de verificat și interpretat de către oameni și că instrumentul nostru îi poate ajuta să joace un rol în a răspunde la întrebarea: „A fost generat cu AI?”, prin integrarea mai multor semnale. Acest lucru se bazează pe lecțiile învățate din previzualizarea inițială de cercetare a clasificatorului nostru de detectare a imaginilor din 2024 și le permite oamenilor să detecteze în mod fiabil dacă în conținut este prezent un filigran SynthID provenit de la OpenAI, precum și să afișeze metadatele C2PA atunci când acestea sunt găsite.

Nicio metodă de detectare nu este infailibilă, așa că adoptăm o abordare prudentă în cazurile în care detectarea eșuează. Dacă, de exemplu, nu este detectată nicio metadată sau niciun filigran, instrumentul nu va trage o concluzie definitivă despre dacă imaginea a fost generată cu instrumente OpenAI, deoarece semnalele de proveniență pot fi în unele cazuri eliminate.
La lansare, instrumentul este limitat la conținut generat de OpenAI. În lunile următoare, ne propunem să susținem eforturile la nivelul întregii industrii pentru a face posibilă verificarea pe toate platformele. În timp, ne așteptăm de asemenea să oferim suport pentru mai multe tipuri de conținut pe care oamenii le pot întâlni online.
Nicio tehnică unică de proveniență nu este suficientă de una singură. Credem că o abordare solidă combină standarde comune, semnale de filigranare durabile și verificare publică. Bazându-ne pe sprijinul nostru de lungă durată pentru Content Credentials, pe conformitatea cu C2PA, pe adoptarea SynthID și pe prezentarea unui instrument public de verificare, sperăm să contribuim pe termen lung la un ecosistem de proveniență mai interoperabil.


