Pereiti prie pagrindinio turinio
OpenAI

2026 m. gegužės 19 d.

Sauga

Turinio kilmės pažanga saugesnei ir skaidresnei DI ekosistemai

Padedame žmonėms suprasti DI sugeneruoto turinio kilmę pasitelkdami Content Credentials, SynthID ir ankstyvą viešo tikrinimo įrankį.

Įkeliama...

Žmonės kasdien naudoja OpenAI įrankius vaizdams ir garsui kurti bei redaguoti taip, kad bendravimas taptų išraiškingesnis, naudingesnis ir prieinamesnis. Šiems įrankiams tampant dalimi to, kaip žmonės kuria, įsivaizduoja ir dalijasi, svarbu, kad jie galėtų suprasti ir patikrinti, iš kur atsirado medija, kad galėtų ją vertinti užtikrinčiau. Kilmės signalai gali padėti, suteikdami žmonėms kontekstą apie tai, iš kur atsirado turinys, kaip jis buvo sukurtas ar redaguotas ir ar jis yra tai, kuo dedasi esąs.

Šiandien stipriname savo požiūrį į turinio kilmę, taikydami daugiasluoksnį, ekosistemos principais grindžiamą pasitikėjimo internete kūrimo modelį. Savo kilmės signalus darome lengviau atpažįstamus kitiems įrankiams ir platformoms per C2PA atitiktį, bendradarbiaudami su Google pridedame patvarų tarpplatforminį SynthID vandens ženklinimą vaizdams ir pristatome viešai prieinamo įrankio peržiūrą, kuriuo bus galima patikrinti, ar vaizdai atkeliavo iš OpenAI.

Šie atnaujinimai papildo mūsų ankstesnius darbus: palaikome atviruosius standartus, siekiame, kad „OpenAI“ sugeneruotas turinys būtų lengviau atpažįstamas, ir bendradarbiaujame su visu sektoriumi, kurdami patikimesnę informacinę ekosistemą.

Pasitikėjimo ekosistemos kūrimas per C2PA atitiktį

„OpenAI“ aktyviai prisideda prie turinio kilmės standartų kūrimo ir diegimo nuo 2024 m. Tada pradėjome pridėti turinio kredencialus (angl. „Content Credentials“) prie vaizdų, sugeneruotų naudojant „DALL-E 3“(atsidaro naujame lange), o vėliau – ir „ImageGen“(atsidaro naujame lange) bei „Sora“(atsidaro naujame lange). Taip pat prisijungėme prie Turinio kilmės ir autentiškumo koalicijos (angl. „Coalition for Content Provenance and Authenticity“, C2PA) valdymo komiteto. Ši įvairias sritis vienijanti grupė sukūrė atvirąjį techninį turinio kilmės standartą. C2PA techninis metodas pagrįstas metaduomenimis ir kriptografiniais parašais, todėl informacija apie mediją saugiai keliauja kartu su turiniu. Ši informacija suteikia kontekstą, kuris padeda žurnalistams vertinti šaltinius, platformoms – priimti sprendimus dėl turinio patikimumo, o žmonėms – suprasti, ką mato internete.

Neseniai žengėme dar vieną žingsnį – „OpenAI“ tapo C2PA reikalavimus atitinkančiu generavimo produktu (angl. „C2PA Conforming Generator Product“)(atsidaro naujame lange). Užtikrinę C2PA atitiktį, platformoms suteikiame patikimą būdą nuskaityti, išsaugoti ir perduoti kilmės informaciją, kurią susiejame su sugeneruotu turiniu. Tai svarbu, nes kilmės informacija naudinga tik tada, kai ji lydi turinį ir už jo kūrimo platformos ribų, o atitiktis standartams tai užtikrina.

Daugiasluoksnis požiūris į kilmę su Google SynthID vaizdams

C2PA metaduomenys yra svarbus kilmės pagrindas. Jie padeda turiniui išlaikyti informaciją apie tai, iš kur jis atsirado, kaip buvo sukurtas ar redaguotas ir kas pasirašė tą informaciją. Tačiau metaduomenys nėra neklystantys. Jie gali būti pašalinti, prarasti įkeliant ir atsisiunčiant arba sugadinti dėl transformacijų, tokių kaip failo formato keitimas, dydžio keitimas ar ekrano nuotraukos.

Siekdami didesnio kilmės informacijos atsparumo, taikome daugiasluoksnį metodą ir integruojame vandens ženklų technologiją pasitelkę „Google DeepMind“ sistemą „SynthID“(atsidaro naujame lange) – iš pradžių vaizduose, sugeneruotuose naudojant „ChatGPT“, „Codex“ ar „OpenAI“ API. „SynthID“ įterpia nematomą vandens ženklą, papildantį C2PA metaduomenimis pagrįstus metodus.

Tam ruošėmės jau kurį laiką. Modeliuose „Sora“ naudojome matomus vandens ženklus, o „Voice Engine“ – garso vandens ženklus. Taip pat nuolat tikrinome ir tyrėme jų tikslumą bei patikimumą iki pat diegimo etapo.

Šios dvi sistemos viena kitą sustiprina. C2PA padeda turiniui išlaikyti išsamų kontekstą; SynthID padeda išsaugoti signalą, kai metaduomenys neišlieka. Vandens ženklinimas gali būti patvaresnis po transformacijų, tokių kaip ekrano nuotraukos, o metaduomenys gali suteikti daugiau informacijos nei vien vandens ženklas. Kartu jie daro kilmę atsparesnę, nei bet kuris iš šių sluoksnių būtų atskirai.

Diagrama, kurioje lyginami du vaizdo kilmės signalai: C2PA prideda pasirašytus metaduomenis, kuriuos patikrinus patvirtinama, kad turinį išleido patikimas „OpenAI“ šaltinis, o „SynthID“ įterpia pikselių lygio signalą, padedantį nustatyti, ar vaizdą sugeneravo „OpenAI“.

Aptikimas ir mūsų viešo tikrinimo įrankio peržiūra

Patikimi metaduomenys ir daugumai modifikacijų atsparūs vandens ženklai užtikrina, kad kilmės signalai išliktų ilgiau. Tačiau žmonėms reikia būdo aptikti šiuos signalus. Šiuo metu pristatome viešos patikros priemonės bandomąją versiją. Ji padės žmonėms patikrinti, ar įkeltas vaizdas buvo sugeneruotas naudojant „ChatGPT“, „OpenAI“ API ar „Codex“, ir nustatyti, ar jame yra kilmės signalų, įskaitant turinio kredencialus bei „SynthID“.

Tikime, kad žmonėms turėtų būti lengviau patikrinti ir suprasti kilmės informaciją. Integravus kelis signalus, mūsų priemonė padės rasti atsakymą į klausimą, ar turinys sugeneruotas naudojant DI. Šis sprendimas paremtas patirtimi, įgyta 2024 m. pristačius bandomąją vaizdų atpažinimo klasifikatoriaus versiją. Žmonėms suteikiame galimybę patikimai nustatyti, ar medijos faile yra „OpenAI“ įterptas „SynthID“ vandens ženklas, o aptikus C2PA metaduomenis – juos peržiūrėti.

„OpenAI“ tinklalapis, kuriame rodomi įkelto vaizdo patikros rezultatai, patvirtinantys, kad vaizdas sugeneruotas „OpenAI“ priemonėmis, remiantis aptiktais „SynthID“ ir turinio kredencialų (angl. „Content Credentials“) signalais.

Nė vienas aptikimo metodas nėra neklystantis, todėl tais atvejais, kai aptikimas nepavyksta, laikomės atsargaus požiūrio. Pavyzdžiui, jei neaptinkama nei metaduomenų, nei vandens ženklo, įrankis nepateiks galutinės išvados, ar vaizdas buvo sugeneruotas naudojant OpenAI įrankius, nes kai kuriais atvejais kilmės signalai gali būti pašalinti.

Paleidimo metu įrankis apsiriboja OpenAI sugeneruotu turiniu. Artimiausiais mėnesiais siekiame remti tarpindustrines pastangas, kad tikrinimas būtų įmanomas įvairiose platformose. Laikui bėgant taip pat tikimės palaikyti daugiau turinio tipų, su kuriais žmonės gali susidurti internete.

Ateities perspektyvos

Nė vienos kilmės technikos savaime nepakanka. Manome, kad stiprus požiūris apjungia bendrus standartus, patvarius vandens ženklinimo signalus ir viešą tikrinimą. Remdamiesi savo ilgalaikiu Content Credentials palaikymu, tapdami suderinami su C2PA, pritaikydami SynthID ir pristatydami viešo tikrinimo įrankius, tikimės ilgainiui prisidėti prie labiau sąveikios kilmės ekosistemos.

Autorius

OpenAI