Preskočite na glavno vsebino
OpenAI

24. marec 2026

Varnost

Podpora razvijalcem, da bo uporaba umetne inteligence za najstnike varna

Predstavljamo nabor varnostnih pravil za najstnike, zapisanih kot pozivi za gpt-oss-safeguard

Nalaganje …

Danes predstavljamo varnostna pravila(odpre se v novem oknu), zapisana kot pozivi, s katerimi lahko razvijalci vzpostavijo zaščito, prilagojeno najstnikom. Zasnovana so za uporabo z našim varnostnim modelom z odprtimi utežmi gpt-oss-safeguard(odpre se v novem oknu) in omogočajo, da se varnostne zahteve prevedejo v konkretna pravila za delovanje sistemov v praksi.

Modele z odprtimi utežmi smo objavili, da bi razširili dostop do zmogljive umetne inteligence in spodbudili širši razvoj inovacij. Ob tem izhajamo iz tega, da morata varnost in inovacije napredovati usklajeno, zato morajo imeti razvijalci poleg zmogljivih modelov na voljo tudi ustrezna orodja in pravila za njihovo varno in odgovorno uporabo. Ta pravila smo pripravili, da razvijalcem pomagamo pri zaščiti mladih uporabnikov, pri čemer smo sodelovali z zaupanja vrednimi zunanjimi organizacijami, kot sta Common Sense Media(odpre se v novem oknu) in everyone.ai(odpre se v novem oknu).

Zavedamo se, da imajo najstniki drugačne potrebe kot odrasli in da potrebujejo dodatno zaščito. Pravila razvijalcem pomagajo te razlike upoštevati in oblikovati izkušnje, ki so za mlajše uporabnike ustrezne in hkrati spodbudne.

Nadaljevanje širših prizadevanj za zaščito mladih

Dolgo si prizadevamo razvijati umetno inteligenco, ki mladim odpira priložnosti, obenem pa skrbi za njihovo varnost. V okviru tega smo posodobili specifikacije modela(odpre se v novem oknu), ki določajo pričakovano delovanje OpenAI-jevih modelov, in vključili načela za uporabnike, mlajše od 18 let (U18)(odpre se v novem oknu). Uvedli smo tudi zaščitne mehanizme na ravni izdelkov, kot sta starševski nadzor in napoved starosti, da bi bolje zaščitili mlajše uporabnike. S pobudo Teen Safety Blueprint smo pozvali tudi k širšim zaščitnim ukrepom na ravni celotne panoge.

Današnja objava nadgrajuje ta prizadevanja. Varnostna pravila dajemo razvijalcem na voljo, da jim olajšamo uvajanje zaščit za najstnike in hkrati razširimo dostop v ekosistemu modelov z odprtimi utežmi.

Jasna in uporabna varnostna pravila

Čeprav lahko razvrščevalniki, kot je gpt-oss-safeguard, zaznajo škodljivo vsebino, potrebujejo jasno opredelitev, kaj taka vsebina sploh pomeni. V praksi je eden večjih izzivov oblikovati pravila, ki natančno zajamejo tveganja, značilna za najstnike, in jih je mogoče dosledno uporabljati v dejanskih sistemih.

Tudi izkušene ekipe pogosto težko pretvorijo splošne varnostne cilje v jasna in izvedljiva pravila, saj to zahteva tako poglobljeno razumevanje področja kot umetne inteligence. To lahko vodi do vrzeli v zaščiti, nedoslednega izvajanja ali preširokega filtriranja. Dobro opredeljena in jasno omejena pravila so temelj učinkovitega varnostnega sistema.

Podpora razvijalcem pri uvajanju zaščite za najstnike

Za reševanje tega izziva objavljamo nabor varnostnih pravil(odpre se v novem oknu), prilagojenih pogostim tveganjem, s katerimi se soočajo najstniki, in zasnovanih na podlagi temeljitega pregleda raziskav o njihovih razvojnih posebnostih. Pravila so zapisana kot pozivi, ki jih je mogoče neposredno uporabiti z gpt-oss-safeguard(odpre se v novem oknu) in drugimi modeli sklepanja, kar razvijalcem omogoča enostavnejšo in dosledno uporabo varnostnih standardov v njihovih sistemih.

Začetni nabor vključuje pravila, ki pokrivajo:

  • nazorno nasilno vsebino
  • nazorno spolno vsebino
  • škodljive telesne ideale in vedenja
  • nevarne aktivnosti in izzive
  • romantično ali nasilno igranje vlog
  • starostno omejene izdelke in storitve

Pravila je mogoče uporabljati za sprotno filtriranje vsebin in tudi za naknadno analizo vsebin, ki jih ustvarijo uporabniki.

Z zapisom pravil kot pozivov jih lahko razvijalci brez težav vključijo v obstoječe delovne tokove, jih prilagodijo svojim primerom uporabe in jih sčasoma nadgrajujejo.

Prikaz kategorij pravil za varnost najstnikov ter vsebin, povezanih z najstniki, ki se stekajo v zaščitni sistem gpt-oss-safeguard, ta pa na podlagi notranjega sklepanja sprejema odločitve.

V sodelovanju z zunanjimi strokovnjaki

Pri pripravi teh pravil smo sodelovali z zunanjimi organizacijami, kot sta Common Sense Media(odpre se v novem oknu) in everyone.ai(odpre se v novem oknu). Njihovo strokovno znanje je pomagalo določiti, katere vsebine zajeti, izboljšati zasnovo pozivov ter natančneje opredeliti mejne primere, ki jih je treba upoštevati pri ocenjevanju. 

To delo je del širših prizadevanj za sodelovanje s strokovnjaki in širšim okoljem z namenom izboljšati način, kako sistemi umetne inteligence podpirajo mlade.

»Ena največjih vrzeli pri varnosti umetne inteligence za najstnike je pomanjkanje jasnih, izvedljivih pravil, na katerih bi lahko razvijalci gradili. Velikokrat razvijalci začenjajo od samega začetka. Ta pravila, ki so zasnovana kot pozivi, postavljajo pomembno osnovo varnosti v celotnem ekosistemu, hkrati pa jih je zaradi odprtokodne objave mogoče sčasoma prilagajati in izboljševati. Spodbudno je videti, da so takšne rešitve široko dostopne, in upamo, da bodo spodbudile več skupnih izhodišč za zaščito mladih v celotni panogi.«

Robbie Torney, vodja za umetno inteligenco in digitalno vrednotenje, Common Sense Media

»Pobude, kot je ta, ki pravila za varnost mladih približujejo praktični uporabi, so dragocene, saj strokovno znanje pretvarjajo v smernice, uporabne v realnih sistemih. Pravila glede vsebin so pomemben prvi korak, hkrati pa odpirajo prostor za širše razumevanje, kako vedenje modelov skozi čas vpliva na tveganja za mlade.Na podlagi tega dela in lastnih raziskav je tudi everyone.ai(odpre se v novem oknu) pripravil začetni nabor vedenjskih pravil, osredotočenih na tveganja, kot sta izključevanje in pretirana odvisnost.«

Dr. Mathilde Cerioli, glavna znanstvenica pri everyone.AI

Izhodišče, ne dokončna rešitev

Ta pravila so izhodišče, ne celovita ali dokončna opredelitev oziroma zagotovilo varnosti za najstnike. Vsaka uporaba ima svoja tveganja, ciljne skupine in kontekst, zato razvijalci najbolje razumejo, kakšna tveganja lahko prinesejo njihove rešitve in vključevanje umetne inteligence. Zato razvijalcem priporočamo, da pravila prilagodijo in nadgradijo glede na svoje potrebe ter jih dopolnijo z drugimi zaščitnimi ukrepi, kot so premišljene odločitve pri zasnovi rešitev, nadzor uporabnikov, preglednost, prilagojena najstnikom, sistemi spremljanja in ustrezni odzivi glede na starost. 

Menimo, da je večplastni pristop k zaščiti ključen za varnejše sisteme umetne inteligence. Ta pravila temeljijo na naših internih izkušnjah, vendar ne predstavljajo celotnega obsega internih pravil ali zaščitnih mehanizmov OpenAI.

Kako naprej

Ta pravila objavljamo kot odprtokodno rešitev prek skupnosti ROOST Model Community(odpre se v novem oknu), da spodbudimo sodelovanje in nadaljnji razvoj. Za sodelovanje, povratne informacije ali deljenje dodatnih pravil za varnost najstnikov obiščite repozitorij RMC GitHub(odpre se v novem oknu).

Razvijalci in organizacije lahko ta pravila prilagodijo svojim rešitvam, jih prevedejo v druge jezike in razširijo na dodatna področja tveganj. Sčasoma pričakujemo, da bo to prispevalo k trdnejši in skupni osnovi za uvajanje varnostnih pravil v sistemih umetne inteligence.

Za začetek z gpt-oss-safeguard ga prenesite s platforme Hugging Face(odpre se v novem oknu).