24. mart 2026.

Pomoć programerima da izgrade sigurnija AI iskustva za tinejdžere

Predstavljamo skup pravila o sigurnosti tinejdžera oblikovanih kao upiti za gpt-oss-safeguard

Učitavanje…

Danas objavljujemo sigurnosne politike⁠(otvara se u novom prozoru) zasnovane na upitima kako bismo pomogli programerima da kreiraju zaštite primjerene uzrastu za tinejdžere. Napravljena za rad s našim sigurnosnim modelom s otvorenim težinama, gpt-oss-safeguard⁠(otvara se u novom prozoru), ova pravila pojednostavljuju način na koji programeri pretvaraju sigurnosne zahtjeve u upotrebljive klasifikatore za sisteme iz stvarnog svijeta.

Objavili smo modele s otvorenim težinama kako bismo demokratizirali pristup moćnoj vještačkoj inteligenciji i podržali široke inovacije. Istovremeno, vjerujemo da sigurnost i inovacije idu ruku pod ruku i da programeri trebaju imati pristup sposobnim modelima, kao i alatima i pravilima za njihovo sigurno i odgovorno uvođenje. Razvili smo ova pravila kako bismo podržali programere u njihovim sigurnosnim naporima da zaštite mlade korisnike, uz doprinos pouzdanih vanjskih organizacija, uključujući Common Sense Media⁠(otvara se u novom prozoru) i everyone.ai⁠(otvara se u novom prozoru).

Prepoznajemo da tinejdžeri i odrasli imaju različite potrebe i da tinejdžerima trebaju dodatne zaštite. Ove politike su osmišljene da pomognu programerima da uzmu u obzir te razlike i izgrade iskustva koja su i osnažujuća i prikladna mlađim korisnicima.

Nadovezujući se na naš širi rad na zaštiti mladih

Već dugo smo posvećeni izgradnji AI-a koji proširuje mogućnosti za mlade, istovremeno ih štiteći. Kao dio ovog rada, ažurirali smo našu Specifikaciju modela⁠(otvara se u novom prozoru)— smjernice koje definiraju namjeravano ponašanje OpenAI-evih modela — kako bismo uključili Principe za mlađe od 18 godina (U18)⁠(otvara se u novom prozoru), te uveli zaštitne mjere na nivou proizvoda kao što su roditeljski nadzor⁠ i predviđanje dobi⁠ kako bismo bolje zaštitili mlađe korisnike. Također smo pozvali na zaštite na nivou cijele industrije kroz naš Teen Safety Blueprint⁠.

Današnje izdanje nadograđuje se na tu osnovu. Ove sigurnosne politike stavljamo na raspolaganje programerima kako bismo ih podržali u uvođenju sigurnosnih zaštita za tinejdžere i kako bismo pomogli da se pristup demokratizira širom ekosistema otvorenih težina.

Pretvaranje sigurnosti tinejdžera u jasne i primjenjive politike

Iako sigurnosni klasifikatori poput gpt-oss-safeguard mogu otkriti štetan sadržaj, oni ovise o jasnim definicijama toga šta taj sadržaj jeste. U praksi, jedan od najvećih izazova s kojima se programeri suočavaju jeste definisanje politika koje tačno obuhvataju rizike specifične za tinejdžere i koje se mogu dosljedno primjenjivati u stvarnim sistemima.

Čak i iskusni timovi često imaju poteškoća da sigurnosne ciljeve visokog nivoa pretoče u precizna, operativna pravila, posebno zato što to zahtijeva i stručnost u oblasti i duboko znanje o AI-u. To može dovesti do nedostataka u zaštiti, nedosljedne primjene ili preširokog filtriranja. Jasne, dobro definisane politike ključni su temelj za efikasne sigurnosne sisteme.

Pomažemo programerima da primijene sigurnost tinejdžera u praksi

Kako bismo odgovorili na ovaj izazov, objavljujemo skup sigurnosnih politika⁠(otvara se u novom prozoru), prilagođenih uobičajenim rizicima s kojima se tinejdžeri suočavaju i zasnovanih na pažljivom pregledu postojećih istraživanja o jedinstvenim razvojnim razlikama tinejdžera. Ove politike su strukturirane kao upiti koji se mogu direktno koristiti s gpt-oss-safeguard⁠(otvara se u novom prozoru) i drugim modelima rezonovanja, omogućavajući programerima da lakše primjenjuju dosljedne sigurnosne standarde u svojim sistemima.

Početno izdanje uključuje pravila koja obuhvataju:

Grafički nasilni sadržaj
Grafički seksualni sadržaj
Štetni tjelesni ideali i ponašanja
Opasne aktivnosti i izazovi
Romantično ili nasilno igranje uloga
Dobno ograničena roba i usluge

Ova pravila mogu se koristiti za filtriranje sadržaja u stvarnom vremenu, kao i za analizu sadržaja generisanog od strane korisnika u režimu van mreže.

Strukturiranjem politika kao upita, programeri ih mogu lakše integrirati u postojeće tokove rada, prilagoditi svojim slučajevima upotrebe i vremenom ih iterativno unapređivati.

Dijagram koji prikazuje kategorije politika sigurnosti tinejdžera i sadržaj povezan s tinejdžerima koji ulazi u GPT-OSS sistem zaštitnih mjera, koji pravi odluke o politikama zasnovane na internom rezonovanju.

Razvijeno uz doprinos spoljnih stručnjaka

Radili smo sa spoljnim organizacijama, uključujući Common Sense Media⁠(otvara se u novom prozoru) i everyone.ai⁠(otvara se u novom prozoru), kako bismo informisali razvoj ovih politika. Njihova stručnost pomogla je u oblikovanju opsega sadržaja koji treba obuhvatiti, jačanju strukture upita i usavršavanju rubnih slučajeva koje treba uzeti u obzir prilikom njihove procjene.

Ovaj rad odražava kontinuirani napor da se sarađuje sa stručnjacima i širim ekosistemom kako bi se unaprijedio način na koji AI sistemi podržavaju mlade.

“Jedan od najvećih nedostataka u sigurnosti AI-a za tinejdžere bio je nedostatak jasnih, operativnih politika na kojima programeri mogu graditi. Često programeri počinju od nule. Ove politike zasnovane na upitima pomažu u uspostavljanju značajne osnovne razine sigurnosti u cijelom ekosistemu, a budući da su objavljene kao otvoreni kod, mogu se prilagođavati i unapređivati tokom vremena. „Ohrabruje nas što vidimo da ova vrsta infrastrukture postaje široko dostupna i nadamo se da će potaknuti više zajedničkih polazišta za sigurnost mladih u cijeloj industriji.”

—Robbie Torney, voditelj odjela za vještačku inteligenciju i digitalne procjene u kompaniji Common Sense Media

„Napori poput ovog, koji politike sigurnosti mladih čine praktičnijim za primjenu, vrijedni su jer pomažu da se stručno znanje pretoči u smjernice koje se mogu koristiti u stvarnim sistemima. Politike sadržaja važan su prvi korak, a također otvaraju vrata širem radu na tome kako ponašanje modela može oblikovati rizike relevantne za mlade s vremenom. Inspirisan ovim radom i našim vlastitim istraživanjem, everyone.ai⁠(otvara se u novom prozoru) je također kreirao početnu politiku ponašanja usmjerenu na rizike poput ekskluzivnosti i pretjeranog oslanjanja."

—Dr. Mathilde Cerioli, glavna naučnica u everyone.AI

Početna tačka, a ne potpuno rješenje

Ove politike su zamišljene kao polazna tačka, a ne kao sveobuhvatna ili konačna definicija niti garancija sigurnosti tinejdžera. Svaka aplikacija ima jedinstvene rizike, publiku i kontekste, a programeri su u najboljoj poziciji da razumiju rizike koje njihovi proizvodi i AI integracije mogu predstavljati. Snažno potičemo programere da prilagode i prošire ove politike na osnovu svojih specifičnih potreba te da ih kombinuju s drugim zaštitnim mjerama kao što su odluke o dizajnu proizvoda, korisničke kontrole, transparentnost prilagođena tinejdžerima, sistemi za praćenje i promišljeni odgovori primjereni uzrastu.

Vjerujemo da je slojeviti pristup dubinskoj odbrani⁠⁠ ključan za izgradnju sigurnijih AI sistema. Ove politike proizlaze iz našeg internog iskustva, ali ne odražavaju u potpunosti cjelokupan opseg internih politika ili zaštitnih mjera OpenAI-a.

Put naprijed

Objavljujemo ove politike kao otvoreni kod putem ROOST Model Community⁠(otvara se u novom prozoru) kako bismo potaknuli saradnju i iteracije. Da biste doprinijeli, dali povratne informacije ili podijelili dodatne politike o sigurnosti tinejdžera, posjetite RMC GitHub repozitorij.⁠(otvara se u novom prozoru)

Programeri i organizacije mogu prilagoditi ove politike svojim specifičnim aplikacijama, prevesti ih na druge jezike i proširiti ih kako bi pokrile dodatna područja rizika. S vremenom se nadamo da će ovo doprinijeti jačem i zajedničkom temelju za primjenu sigurnosnih politika u AI sistemima.

Da započneš s gpt-oss-safeguard, preuzmi ga sa Hugging Face⁠(otvara se u novom prozoru).

Nastavite čitati

Prikažite sve

Sigurnost i usklađenost u eri dugoročnih modela

Sigurnost20. jul 2026.

Why teens deserve access to safe AI — card image

Zašto tinejdžeri zaslužuju pristup sigurnoj AI

Sigurnost16. jul 2026.

GPT-Red: Otključavanje samopoboljšanja za robusnost

Sigurnost15. jul 2026.