Pāriet uz galveno saturu
OpenAI

2026. gada 24. marts

Drošība

Atbalsts izstrādātājiem, veidojot drošāku MI pieredzi pusaudžiem

Iepazīstinām ar pusaudžu drošības politikas kopumu uzvedņu formātā gpt-oss-safeguard vajadzībām

Notiek ielāde…

Šodien mēs izlaižam uz uzvednēm balstītu drošības politiku(atveras jaunā logā), lai palīdzētu izstrādātājiem izveidot vecumam atbilstošus aizsardzības pasākumus pusaudžiem. Radīta darbam ar mūsu atvērtā svara drošības modeli gpt-oss-safeguard(atveras jaunā logā), šī politika vienkāršo to, kā izstrādātāji drošības prasības pārvērš lietojamos klasifikatoros reālās pasaules sistēmām.

Mēs publicējām atvērtā svara modeļus, lai demokratizētu piekļuvi spēcīgam mākslīgajam intelektam un atbalstītu plašu inovāciju. Vienlaikus mēs uzskatām, ka drošība un inovācija iet roku rokā un ka izstrādātājiem vajadzētu būt piekļuvei spējīgiem modeļiem, kā arī rīkiem un politikai, lai tos ieviestu droši un atbildīgi. Mēs izstrādājām šo politiku, lai atbalstītu izstrādātājus viņu centienos aizsargāt gados jaunus lietotājus, iesaistot arī uzticamas ārējās organizācijas, tostarp Common Sense Media(atveras jaunā logā) un everyone.ai(atveras jaunā logā).

Mēs saprotam, ka pusaudžiem un pieaugušajiem ir atšķirīgas vajadzības un ka pusaudžiem ir nepieciešama papildu aizsardzība. Šī politika ir veidota, lai palīdzētu izstrādātājiem ņemt vērā šīs atšķirības un veidot tādu pieredzi, kas gan dod iespējas, gan ir piemērota jaunākiem lietotājiem.

Mūsu plašākā darba turpināšana jauniešu aizsardzībai

Mēs jau ilgu laiku esam apņēmušies veidot mākslīgo intelektu, kas paplašina iespējas jauniešiem, vienlaikus gādājot par viņu drošību. Šī darba ietvaros mēs atjauninājām savu modeļu specifikāciju(atveras jaunā logā) – vadlīnijas, kas nosaka OpenAI modeļu paredzēto uzvedību –, iekļaujot principus lietotājiem līdz 18 gadu vecumam (U18)(atveras jaunā logā), kā arī ieviesām produkta līmeņa aizsardzības pasākumus, piemēram, vecāku kontroli un vecuma prognozēšanu, lai labāk aizsargātu jaunākus lietotājus. Mēs esam arī aicinājuši ieviest nozares mēroga aizsardzības pasākumus, izmantojot mūsu Pusaudžu drošības plānu.

Šodienas izdevums balstās uz šo pamatu. Mēs padarām šo drošības politiku pieejamu izstrādātājiem, lai atbalstītu viņus pusaudžu drošības pasākumu ieviešanā un palīdzētu demokratizēt piekļuvi visā atvērto svaru ekosistēmā.

Pusaudžu drošības principu pārveidošana skaidrā un praktiski izmantojamā politikā

Lai gan drošības klasifikatori, piemēram, gpt-oss-safeguard, var noteikt kaitīgu saturu, to darbība ir atkarīga no skaidrām definīcijām par to, kas šis saturs ir. Praksē viens no lielākajiem izaicinājumiem, ar ko saskaras izstrādātāji, ir noteikt tādu politiku, kas precīzi aptver pusaudžiem raksturīgos riskus un ko var konsekventi piemērot reālās sistēmās.

Pat pieredzējušām komandām bieži ir grūti pārvērst augsta līmeņa drošības mērķus precīzos, praktiski īstenojamos noteikumos, jo tam nepieciešama gan padziļināta nozares kompetence, gan dziļas MI zināšanas. Tas var novest pie aizsardzības nepilnībām, nekonsekventas noteikumu piemērošanas vai pārāk plašas filtrēšanas. Skaidri formulēta un precīzi definēta politika ir būtisks pamats efektīvām drošības sistēmām.

Palīdzība izstrādātājiem pusaudžu drošības nodrošināšanā

Lai risinātu šo problēmu, mēs publicējam drošības politikas(atveras jaunā logā) kopumu, kas izstrādāts, ņemot vērā izplatītākos riskus, ar kuriem saskaras pusaudži, un balstīts uz rūpīgu esošo pētījumu izvērtējumu par pusaudžu unikālajām attīstības atšķirībām. Šī politika ir strukturēta kā uzvednes, kuras var tieši izmantot ar gpt-oss-safeguard(atveras jaunā logā) un citiem spriestspējas modeļiem, ļaujot izstrādātājiem vieglāk piemērot konsekventus drošības standartus visās savās sistēmās.

Sākotnējā versijā ir iekļauta politika, kas attiecas uz šādām tēmām:

  • Brutāls vardarbīgs saturs
  • Atklāts seksuāls saturs
  • Kaitīgi ķermeņa ideāli un uzvedība
  • Bīstamas darbības un izaicinājumi
  • Romantiska vai vardarbīga lomu spēle
  • Preces un pakalpojumi ar vecuma ierobežojumu

Šo politiku var izmantot reāllaika satura filtrēšanai, kā arī lietotāju ģenerēta satura analīzei bezsaistē.

Strukturējot politiku uzvedņu formā, tās var vieglāk integrēt esošajās darbplūsmās, pielāgot saviem lietošanas gadījumiem un laika gaitā pilnveidot.

Diagramma, kurā attēlotas pusaudžu drošības politikas kategorijas un ar pusaudžiem saistīts saturs, kas tiek ievadīts GPT-OSS aizsardzības pasākumu sistēmā, kura pieņem politikas lēmumus, ko pamato iekšējā spriestspēja.

Izstrādāts, ņemot vērā ārējo ekspertu ieteikumus

Mēs sadarbojāmies ar ārējām organizācijām, tostarp Common Sense Media(atveras jaunā logā) un everyone.ai(atveras jaunā logā), lai tās sniegtu ieteikumus šīs politikas izstrādē. To zināšanas palīdzēja definēt aptveramo saturu, stiprināt uzvedņu struktūru un precizēt robežgadījumus, kas jāņem vērā, politiku izvērtējot. 

Šis darbs atspoguļo pastāvīgus centienus sadarboties ar ekspertiem un plašāko ekosistēmu, lai uzlabotu to, kā MI sistēmas atbalsta jauniešus.

“Viens no lielākajiem trūkumiem MI drošības jomā pusaudžiem ir bijis tas, ka nav skaidras, praktiski īstenojamas politikas, uz kuras pamata izstrādātāji var veidot risinājumus. Daudzos gadījumos izstrādātāji sāk no nulles. Šī uzvedņu formāta politika palīdz ieviest jēgpilnu drošības pamatlīmeni visā ekosistēmā, un, tā kā tā ir publicēta kā atvērtā koda risinājums, laika gaitā to var pielāgot un uzlabot. Esam gandarīti, ka šāda veida infrastruktūra kļūst plaši pieejama, un ceram, ka tā veicinās vairāk kopīgu jauniešu drošības sākumpunktu visā nozarē."

Robijs Tornijs, Common Sense Media MI un digitālās vērtēšanas vadītājs

“Šādi centieni, kas padara jauniešu drošības politiku praktiski īstenojamu, ir vērtīgi, jo tie palīdz pārvērst ekspertu zināšanas par norādījumiem, ko var izmantot reālās sistēmās. Satura politika ir svarīgs pirmais solis, un tā arī paver ceļu plašākam darbam pie tā, kā modeļa uzvedība laika gaitā var ietekmēt jauniešiem būtiskos riskus. Iedvesmojoties no šī darba un mūsu pašu pētījumiem, everyone.ai(atveras jaunā logā) ir arī izveidojis sākotnēju uzvedības politiku, kas vērsta uz tādiem riskiem kā ekskluzivitāte un pārmērīga paļaušanās."

Dr. Matilde Čerioli, everyone.AI galvenā zinātniece

Sākumpunkts, nevis pilnīgs risinājums.

Politika ir paredzēta kā sākumpunkts, nevis kā visaptveroša vai galīga pusaudžu drošības definīcija vai garantija. Katrai lietojumprogrammai ir unikāli riski, auditorijas un konteksti, un izstrādātāji ir vislabākajā pozīcijā, lai izprastu riskus, ko var radīt viņu produkti un MI integrācijas. Mēs stingri aicinām izstrādātājus pielāgot un paplašināt šo politiku, pamatojoties uz savām konkrētajām vajadzībām, un apvienot to ar citiem drošības pasākumiem, piemēram, produkta projektēšanas lēmumiem, lietotāju vadības iespējām, pusaudžiem piemērotu pārredzamību, uzraudzības sistēmām un pārdomātām, vecumam atbilstošām reakcijām. 

Mēs uzskatām, ka drošāku MI sistēmu izveidē būtiska ir slāņaina padziļinātās aizsardzības pieeja. Šī politika balstās uz mūsu iekšējo pieredzi, taču neatspoguļo visu OpenAI iekšējās politikas vai aizsardzības pasākumu apjomu.

Turpmākais ceļš

Mēs publicējam šo politiku kā atvērtā pirmkoda resursus caur ROOST modeļu kopienu(atveras jaunā logā), lai veicinātu sadarbību un iterāciju. Lai piedalītos, sniegtu atsauksmes vai dalītos ar papildu pusaudžu drošības politiku, apmeklē RMC GitHub repozitoriju.(atveras jaunā logā)

Izstrādātāji un organizācijas var pielāgot šo politiku savām konkrētajām lietojumprogrammām, tulkot to dažādās valodās un paplašināt to, lai aptvertu papildu riska jomas. Mēs ceram, ka laika gaitā tas palīdzēs izveidot stabilāku un kopīgu pamatu drošības politikas ieviešanai MI sistēmās.

Lai sāktu lietot gpt-oss-safeguard, lejupielādē to no Hugging Face(atveras jaunā logā).