Preskočite na glavni sadržaj
OpenAI

24. mart 2026.

Sigurnost

Pomoć programerima da izgrade sigurnija AI iskustva za tinejdžere

Predstavljamo skup pravila o sigurnosti tinejdžera oblikovanih kao upiti za gpt-oss-safeguard

Učitavanje…

Danas objavljujemo sigurnosne politike(otvara se u novom prozoru) zasnovane na upitima kako bismo pomogli programerima da kreiraju zaštite primjerene uzrastu za tinejdžere. Napravljena za rad s našim sigurnosnim modelom s otvorenim težinama, gpt-oss-safeguard(otvara se u novom prozoru), ova pravila pojednostavljuju način na koji programeri pretvaraju sigurnosne zahtjeve u upotrebljive klasifikatore za sisteme iz stvarnog svijeta.

Objavili smo modele s otvorenim težinama kako bismo demokratizirali pristup moćnoj vještačkoj inteligenciji i podržali široke inovacije. Istovremeno, vjerujemo da sigurnost i inovacije idu ruku pod ruku i da programeri trebaju imati pristup sposobnim modelima, kao i alatima i pravilima za njihovo sigurno i odgovorno uvođenje. Razvili smo ova pravila kako bismo podržali programere u njihovim sigurnosnim naporima da zaštite mlade korisnike, uz doprinos pouzdanih vanjskih organizacija, uključujući Common Sense Media(otvara se u novom prozoru) i everyone.ai(otvara se u novom prozoru).

Prepoznajemo da tinejdžeri i odrasli imaju različite potrebe i da tinejdžerima trebaju dodatne zaštite. Ove politike su osmišljene da pomognu programerima da uzmu u obzir te razlike i izgrade iskustva koja su i osnažujuća i prikladna mlađim korisnicima.

Nadovezujući se na naš širi rad na zaštiti mladih

Već dugo smo posvećeni izgradnji AI-a koji proširuje mogućnosti za mlade, istovremeno ih štiteći. Kao dio ovog rada, ažurirali smo našu Specifikaciju modela(otvara se u novom prozoru)— smjernice koje definiraju namjeravano ponašanje OpenAI-evih modela — kako bismo uključili Principe za mlađe od 18 godina (U18)(otvara se u novom prozoru), te uveli zaštitne mjere na nivou proizvoda kao što su roditeljski nadzor i predviđanje dobi kako bismo bolje zaštitili mlađe korisnike. Također smo pozvali na zaštite na nivou cijele industrije kroz naš Teen Safety Blueprint.

Današnje izdanje nadograđuje se na tu osnovu. Ove sigurnosne politike stavljamo na raspolaganje programerima kako bismo ih podržali u uvođenju sigurnosnih zaštita za tinejdžere i kako bismo pomogli da se pristup demokratizira širom ekosistema otvorenih težina.

Pretvaranje sigurnosti tinejdžera u jasne i primjenjive politike

Iako sigurnosni klasifikatori poput gpt-oss-safeguard mogu otkriti štetan sadržaj, oni ovise o jasnim definicijama toga šta taj sadržaj jeste. U praksi, jedan od najvećih izazova s kojima se programeri suočavaju jeste definisanje politika koje tačno obuhvataju rizike specifične za tinejdžere i koje se mogu dosljedno primjenjivati u stvarnim sistemima.

Čak i iskusni timovi često imaju poteškoća da sigurnosne ciljeve visokog nivoa pretoče u precizna, operativna pravila, posebno zato što to zahtijeva i stručnost u oblasti i duboko znanje o AI-u. To može dovesti do nedostataka u zaštiti, nedosljedne primjene ili preširokog filtriranja. Jasne, dobro definisane politike ključni su temelj za efikasne sigurnosne sisteme.

Pomažemo programerima da primijene sigurnost tinejdžera u praksi

Kako bismo odgovorili na ovaj izazov, objavljujemo skup sigurnosnih politika(otvara se u novom prozoru), prilagođenih uobičajenim rizicima s kojima se tinejdžeri suočavaju i zasnovanih na pažljivom pregledu postojećih istraživanja o jedinstvenim razvojnim razlikama tinejdžera. Ove politike su strukturirane kao upiti koji se mogu direktno koristiti s gpt-oss-safeguard(otvara se u novom prozoru) i drugim modelima rezonovanja, omogućavajući programerima da lakše primjenjuju dosljedne sigurnosne standarde u svojim sistemima.

Početno izdanje uključuje pravila koja obuhvataju:

  • Grafički nasilni sadržaj
  • Grafički seksualni sadržaj
  • Štetni tjelesni ideali i ponašanja
  • Opasne aktivnosti i izazovi
  • Romantično ili nasilno igranje uloga
  • Dobno ograničena roba i usluge

Ova pravila mogu se koristiti za filtriranje sadržaja u stvarnom vremenu, kao i za analizu sadržaja generisanog od strane korisnika u režimu van mreže.

Strukturiranjem politika kao upita, programeri ih mogu lakše integrirati u postojeće tokove rada, prilagoditi svojim slučajevima upotrebe i vremenom ih iterativno unapređivati.

Dijagram koji prikazuje kategorije politika sigurnosti tinejdžera i sadržaj povezan s tinejdžerima koji ulazi u GPT-OSS sistem zaštitnih mjera, koji pravi odluke o politikama zasnovane na internom rezonovanju.

Razvijeno uz doprinos spoljnih stručnjaka

Radili smo sa spoljnim organizacijama, uključujući Common Sense Media(otvara se u novom prozoru) i everyone.ai(otvara se u novom prozoru), kako bismo informisali razvoj ovih politika. Njihova stručnost pomogla je u oblikovanju opsega sadržaja koji treba obuhvatiti, jačanju strukture upita i usavršavanju rubnih slučajeva koje treba uzeti u obzir prilikom njihove procjene. 

Ovaj rad odražava kontinuirani napor da se sarađuje sa stručnjacima i širim ekosistemom kako bi se unaprijedio način na koji AI sistemi podržavaju mlade.

“Jedan od najvećih nedostataka u sigurnosti AI-a za tinejdžere bio je nedostatak jasnih, operativnih politika na kojima programeri mogu graditi. Često programeri počinju od nule. Ove politike zasnovane na upitima pomažu u uspostavljanju značajne osnovne razine sigurnosti u cijelom ekosistemu, a budući da su objavljene kao otvoreni kod, mogu se prilagođavati i unapređivati tokom vremena. „Ohrabruje nas što vidimo da ova vrsta infrastrukture postaje široko dostupna i nadamo se da će potaknuti više zajedničkih polazišta za sigurnost mladih u cijeloj industriji.”

Robbie Torney, voditelj odjela za vještačku inteligenciju i digitalne procjene u kompaniji Common Sense Media

„Napori poput ovog, koji politike sigurnosti mladih čine praktičnijim za primjenu, vrijedni su jer pomažu da se stručno znanje pretoči u smjernice koje se mogu koristiti u stvarnim sistemima. Politike sadržaja važan su prvi korak, a također otvaraju vrata širem radu na tome kako ponašanje modela može oblikovati rizike relevantne za mlade s vremenom. Inspirisan ovim radom i našim vlastitim istraživanjem, everyone.ai(otvara se u novom prozoru) je također kreirao početnu politiku ponašanja usmjerenu na rizike poput ekskluzivnosti i pretjeranog oslanjanja."

Dr. Mathilde Cerioli, glavna naučnica u everyone.AI

Početna tačka, a ne potpuno rješenje

Ove politike su zamišljene kao polazna tačka, a ne kao sveobuhvatna ili konačna definicija niti garancija sigurnosti tinejdžera. Svaka aplikacija ima jedinstvene rizike, publiku i kontekste, a programeri su u najboljoj poziciji da razumiju rizike koje njihovi proizvodi i AI integracije mogu predstavljati. Snažno potičemo programere da prilagode i prošire ove politike na osnovu svojih specifičnih potreba te da ih kombinuju s drugim zaštitnim mjerama kao što su odluke o dizajnu proizvoda, korisničke kontrole, transparentnost prilagođena tinejdžerima, sistemi za praćenje i promišljeni odgovori primjereni uzrastu. 

Vjerujemo da je slojeviti pristup dubinskoj odbrani⁠ ključan za izgradnju sigurnijih AI sistema. Ove politike proizlaze iz našeg internog iskustva, ali ne odražavaju u potpunosti cjelokupan opseg internih politika ili zaštitnih mjera OpenAI-a.

Put naprijed

Objavljujemo ove politike kao otvoreni kod putem ROOST Model Community(otvara se u novom prozoru) kako bismo potaknuli saradnju i iteracije. Da biste doprinijeli, dali povratne informacije ili podijelili dodatne politike o sigurnosti tinejdžera, posjetite RMC GitHub repozitorij.(otvara se u novom prozoru)

Programeri i organizacije mogu prilagoditi ove politike svojim specifičnim aplikacijama, prevesti ih na druge jezike i proširiti ih kako bi pokrile dodatna područja rizika. S vremenom se nadamo da će ovo doprinijeti jačem i zajedničkom temelju za primjenu sigurnosnih politika u AI sistemima.

Da započneš s gpt-oss-safeguard, preuzmi ga sa Hugging Face(otvara se u novom prozoru).