Пређите на главни садржај
OpenAI

24. март 2026.

Безбедност

Pomažemo programerima da prave bezbednija AI iskustva za tinejdžere

Predstavljamo skup politika bezbednosti za tinejdžere u formatu instrukcija za gpt-oss-safeguard

Учитавање…

Danas objavljujemo politike bezbednosti(отвара се у новом прозору) zasnovane na инструкцијама kako bismo pomogli programerima da naprave zaštitu primerenu uzrastu za tinejdžere. Napravljene da rade sa našim bezbednosnim modelom javne težine, gpt-oss-safeguard(отвара се у новом прозору), ove politike pojednostavljuju način na koji programeri pretvaraju bezbednosne zahteve u upotrebljive klasifikatore za sisteme iz stvarnog sveta.

Objavili smo modele javne težine da bismo demokratizovali pristup moćnoj AI i podržali široke inovacije. Istovremeno, verujemo da bezbednost i inovacije idu ruku pod ruku i da programeri treba da imaju pristup sposobnim modelima, kao i alatima i politikama za njihovo bezbedno i odgovorno uvođenje. Ove politike smo razvili da podržimo programere u njihovim naporima za bezbednost radi zaštite mladih korisnika, uz doprinos pouzdanih spoljnih organizacija, uključujući Common Sense Media(отвара се у новом прозору) i everyone.ai(отвара се у новом прозору).

Prepoznajemo da tinejdžeri i odrasli imaju različite potrebe i da su tinejdžerima potrebne dodatne zaštite. Ove politike su osmišljene da pomognu programerima da uzmu u obzir te razlike i izgrade iskustva koja su i osnažujuća i primerena mlađim korisnicima.

Nadovezivanje na naš širi rad na zaštiti mladih

Dugo smo posvećeni izgradnji AI koja mladima proširuje mogućnosti, a istovremeno ih čuva bezbednim. Kao deo tog rada, ažurirali smo naš Model Spec(отвара се у новом прозору) — smernice koje definišu očekivano ponašanje OpenAI modela — tako da uključuje principe za mlađe od 18 godina (U18)(отвара се у новом прозору), a uveli smo i zaštitne mere na nivou proizvoda kao što su roditeljske kontrole i predviđanje uzrasta radi bolje zaštite mlađih korisnika. Takođe smo pozvali na zaštitu na nivou cele industrije kroz naš Teen Safety Blueprint.

Današnje objavljivanje nadograđuje tu osnovu. Ove politike stavljamo na raspolaganje programerima da bismo ih podržali u uvođenju bezbednosnih zaštita za tinejdžere i pomogli demokratizaciju pristupa širom ekosistema javnih težina.

Pretvaranje bezbednosti tinejdžera u jasne, upotrebljive politike

Iako bezbednosni klasifikatori kao što je gpt-oss-safeguard mogu da otkriju štetan sadržaj, oni zavise od jasnih definicija toga šta taj sadržaj jeste. U praksi, jedan od najvećih izazova sa kojima se programeri suočavaju jeste definisanje politika koje tačno obuhvataju rizike specifične za tinejdžere i mogu dosledno da se primenjuju u stvarnim sistemima.

Čak i iskusni timovi često imaju poteškoće da visoke bezbednosne ciljeve pretoče u precizna, operativna pravila, posebno zato što to zahteva i stručnost u oblasti i duboko znanje o AI. To može dovesti do praznina u zaštiti, nedosledne primene ili preširokog filtriranja. Jasne i dobro ograničene politike predstavljaju ključnu osnovu za efikasne bezbednosne sisteme.

Pomažemo programerima da bezbednost tinejdžera sprovedu u praksi

Da bismo odgovorili na ovaj izazov, objavljujemo skup politika bezbednosti(отвара се у новом прозору), prilagođenih uobičajenim rizicima sa kojima se tinejdžeri suočavaju i zasnovanih na pažljivom pregledu postojećih istraživanja o jedinstvenim razvojnim razlikama kod tinejdžera. Ove politike su strukturisane kao instrukcije koje se mogu direktno koristiti sa gpt-oss-safeguard(отвара се у новом прозору) i drugim modelima rezonovanja, omogućavajući programerima da lakše primenjuju dosledne bezbednosne standarde u svojim sistemima.

Početno izdanje uključuje politike koje pokrivaju:

  • Eksplicitan nasilan sadržaj
  • Eksplicitan seksualni sadržaj
  • Štetne ideale i ponašanja vezana za telo
  • Opasne aktivnosti i izazove
  • Romantični ili nasilni roleplay
  • Robu i usluge sa starosnim ograničenjem

Ove politike se mogu koristiti za filtriranje sadržaja u realnom vremenu, kao i za oflajn analizu sadržaja koji generišu korisnici.

Strukturisanjem politika kao instrukcija, programeri ih lakše mogu integrisati u postojeće tokove rada, prilagoditi svojim slučajevima upotrebe i vremenom ih unapređivati.

Dijagram koji prikazuje kategorije politika bezbednosti za tinejdžere i sadržaj povezan sa tinejdžerima koji ulazi u GPT-OSS safeguard sistem, koji donosi odluke o politikama na osnovu internog rezonovanja.

Razvijeno uz doprinos spoljnih stručnjaka

Sarađivali smo sa spoljnim organizacijama, uključujući Common Sense Media(отвара се у новом прозору) i everyone.ai(отвара се у новом прозору), kako bismo informisali razvoj ovih politika. Njihova stručnost pomogla je da se oblikuje obim sadržaja koji treba obuhvatiti, ojača struktura instrukcija i dorade rubni slučajevi koje treba razmotriti pri njihovoj proceni. 

Ovaj rad odražava kontinuiran napor da sarađujemo sa stručnjacima i širim ekosistemom kako bismo poboljšali način na koji AI sistemi podržavaju mlade.

„Jedan od najvećih nedostataka u AI bezbednosti za tinejdžere bio je izostanak jasnih, operativnih politika od kojih programeri mogu da krenu. U mnogim slučajevima, programeri počinju od nule. Ove politike zasnovane na instrukcijama pomažu da se postavi smislen minimalni nivo bezbednosti širom ekosistema, a pošto su objavljene kao open source, mogu se prilagođavati i unapređivati tokom vremena. Ohrabruje nas što je ovakva infrastruktura široko dostupna i nadamo se da će podstaći više zajedničkih polaznih tačaka za bezbednost mladih širom industrije.”

Robbie Torney, rukovodilac za AI i digitalne procene, Common Sense Media

„Ovакви napori koji politike bezbednosti mladih čine operativnijim vredni su jer pomažu da se stručno znanje pretoči u smernice koje mogu da se koriste u stvarnim sistemima. Politike sadržaja su važan prvi korak, a takođe otvaraju vrata širem radu na tome kako ponašanje modela može da oblikuje rizike relevantne za mlade tokom vremena. Inspirisana ovim radom i našim sopstvenim istraživanjem, everyone.ai(отвара се у новом прозору) je takođe kreirala početnu bihejvioralnu politiku usmerenu na rizike kao što su ekskluzivnost i preterano oslanjanje."

Dr Mathilde Cerioli, glavna naučnica u everyone.AI

Polazna tačka, a ne potpuno rešenje

Ove politike su zamišljene kao polazna tačka, a ne kao sveobuhvatna ili konačna definicija, niti garancija bezbednosti tinejdžera. Svaka primena ima jedinstvene rizike, publiku i kontekste, a programeri su u najboljoj poziciji da razumeju rizike koje njihovi proizvodi i AI integracije mogu predstavljati. Snažno podstičemo programere da prilagode i prošire ove politike svojim specifičnim potrebama i kombinuju ih sa drugim zaštitnim merama kao što su odluke o dizajnu proizvoda, korisničke kontrole, transparentnost prilagođena tinejdžerima, sistemi nadzora i promišljeni odgovori primereni uzrastu. 

Verujemo da je slojevit pristup odbrane u dubini⁠ ključan za izgradnju bezbednijih AI sistema. Ove politike se oslanjaju na naše interno iskustvo, ali ne odražavaju puni obim internih politika ili zaštitnih mera kompanije OpenAI.

Put napred

Ove politike objavljujemo kao open source kroz ROOST Model Community(отвара се у новом прозору) kako bismo podstakli saradnju i iteraciju. Da biste doprineli, poslali povratne informacije ili podelili dodatne politike bezbednosti za tinejdžere, posetite RMC GitHub depo.(отвара се у новом прозору)

Programeri i organizacije mogu prilagoditi ove politike svojim konkretnim aplikacijama, prevesti ih na različite jezike i proširiti ih tako da obuhvate dodatne oblasti rizika. Vremenom se nadamo da će ovo doprineti snažnijoj i zajedničkoj osnovi za primenu politika bezbednosti u AI sistemima.

Da biste počeli sa gpt-oss-safeguard, preuzmite ga sa Hugging Face(отвара се у новом прозору).