Siirry pääsisältöön
OpenAI

24. maaliskuuta 2026

Turvallisuus

Autamme kehittäjiä rakentamaan turvallisempia tekoälykokemuksia teini-ikäisille

Esittelyssä joukko nuorten turvallisuuskäytäntöjä gpt-oss-safeguardia varten kehotteiksi muotoiltuina

Ladataan...

Julkaisemme tänään kehotepohjaisia turvakäytäntöjä(avautuu uudessa ikkunassa), jotka auttavat kehittäjiä luomaan ikäryhmälle sopivia suojauksia teini-ikäisille. Rakennettu toimimaan rajoittamattoman turvallisuusmallimme gpt-oss-safeguard(avautuu uudessa ikkunassa) kanssa, nämä käytännöt yksinkertaistavat sitä, miten kehittäjät muuttavat turvallisuusvaatimukset käyttökelpoisiksi luokittelijoiksi todellisissa järjestelmissä.

Julkaisimme rajoittamattomat mallit, jotta tehokas tekoäly olisi kaikkien saatavilla ja jotta voimme tukea laaja-alaista innovaatiota. Samalla uskomme, että turvallisuus ja innovaatio kulkevat käsi kädessä ja että kehittäjillä tulisi olla käytettävissään kyvykkäitä malleja sekä työkalut ja käytännöt niiden turvalliseen ja vastuulliseen käyttöönottoon. Kehitimme nämä käytännöt tukeaksemme kehittäjiä heidän turvallisuustyössään nuorten käyttäjien suojelemiseksi luotettavien ulkopuolisten organisaatioiden, kuten Common Sense Median(avautuu uudessa ikkunassa) ja everyone.ai(avautuu uudessa ikkunassa):n, antaman palautteen pohjalta.

Tunnistamme, että nuorilla ja aikuisilla on erilaiset tarpeet ja että nuoret tarvitsevat lisäsuojaa. Nämä käytännöt on suunniteltu auttamaan kehittäjiä huomioimaan nämä erot ja luomaan käyttökokemuksia, jotka ovat sekä voimaannuttavia että nuoremmille käyttäjille sopivia.

Jatkamme laajempaa työtämme nuorten suojelemiseksi

Olemme jo pitkään sitoutuneet rakentamaan tekoälyä, joka laajentaa nuorten mahdollisuuksia ja pitää heidät turvassa. Osana tätä työtä päivitimme mallimääritystämme(avautuu uudessa ikkunassa)– ohjeistusta, joka määrittelee OpenAI:n mallien aiotun käyttäytymisen – sisällyttämällä siihen alle 18-vuotiaita (U18) koskevat periaatteet(avautuu uudessa ikkunassa) ja otimme käyttöön tuotetason suojauksia, kuten käytönvalvonnan ja iän ennustamisen, jotta voisimme suojata nuorempia käyttäjiä paremmin. Olemme myös vaatineet koko toimialan laajuisia suojatoimia Teen Safety Blueprint -suunnitelmamme kautta.

Tämänpäiväinen julkaisu rakentuu tämän perustan varaan. Tuomme nämä turvallisuuskäytännöt kehittäjien saataville, jotta voimme tukea heitä teini-ikäisten suojelutoimenpiteiden käyttöönotossa ja auttaa laajentamaan pääsyä rajoittamattomaan ekosysteemiin.

Nuorten turvallisuuden muuttaminen selkeiksi, käyttökelpoisiksi toimintaperiaatteiksi

Vaikka gpt-oss-safeguardin kaltaiset turvaluokittelijat voivat havaita haitallista sisältöä, ne ovat riippuvaisia siitä, että haitallisen sisällön määritelmät ovat selkeät. Käytännössä yksi kehittäjien kohtaamista suurimmista haasteista on määritellä käytäntöjä, jotka kuvaavat tarkasti nuorille ominaisia riskejä ja joita voidaan soveltaa johdonmukaisesti todellisissa järjestelmissä.

Jopa kokeneilla tiimeillä on usein vaikeuksia muuntaa yleisluontoiset turvallisuustavoitteet tarkoiksi toimintaperiaatteiksi, varsinkin kun se vaatii sekä alan asiantuntemusta että syvällistä tekoälyosaamista. Tämä voi johtaa aukkoihin suojauksessa, epäjohdonmukaiseen toimeenpanoon tai liian laajaan suodatukseen. Selkeät ja tarkasti rajatut toimintaperiaatteet ovat tehokkaiden turvallisuusjärjestelmien keskeinen perusta.

Autamme kehittäjiä nuorten turvallisuuden varmistamisessa

Vastataksemme tähän haasteeseen julkaisemme joukon turvallisuuskäytäntöjä(avautuu uudessa ikkunassa), jotka on räätälöity teini-ikäisten kohtaamiin yleisiin riskeihin ja jotka perustuvat huolelliseen tarkasteluun olemassa olevasta tutkimuksesta, joka käsittelee teini-ikäisten kehityksellisiä erityispiirteitä. Nämä käytännöt on jäsennetty kehotteiksi, joita voidaan käyttää suoraan gpt-oss-safeguardin(avautuu uudessa ikkunassa) ja muiden päättelymallien kanssa, mikä helpottaa kehittäjiä soveltamaan yhdenmukaisia turvallisuusstandardeja eri järjestelmissään.

Ensimmäisessä julkaisussa on mukana seuraavia käytäntöjä:

  • Graafista väkivaltaa sisältävä materiaali
  • Kuvallinen seksuaalinen sisältö
  • Haitalliset vartaloihanteet ja toimintatavat
  • Vaarallinen toiminta ja haasteet
  • Romanttinen tai väkivaltainen roolileikki
  • Ikärajoitetut tavarat ja palvelut

Näitä käytäntöjä voidaan käyttää reaaliaikaiseen sisällön suodattamiseen sekä käyttäjien tuottaman sisällön offline-analyysiin.

Jäsentämällä käytäntöjä kehotteiksi kehittäjät voivat helpommin integroida ne olemassa oleviin työnkulkuihin, mukauttaa niitä käyttötapauksiinsa ja kehittää niitä ajan myötä.

Kaavio, joka kuvaa teini-ikäisten turvallisuuskäytäntöjen luokkia ja teini-ikäisiin liittyvää sisältöä, jotka syötetään GPT-OSS-suojajärjestelmään ja joiden pohjalta tehdään käytäntöpäätöksiä sisäisen päättelyn perusteella.

Kehitetty ulkopuolisten asiantuntijoiden tuella

Teimme yhteistyötä ulkopuolisten organisaatioiden, kuten Common Sense Median(avautuu uudessa ikkunassa) ja everyone.ai:n(avautuu uudessa ikkunassa), kanssa näiden käytäntöjen kehittämisen tueksi. Heidän asiantuntemuksensa auttoi määrittämään käsiteltävän sisällön laajuuden, vahvistamaan kehotteiden rakennetta ja tarkentamaan arvioinnissa huomioitavia poikkeustapauksia. 

Tämä työ kuvastaa jatkuvaa pyrkimystä tehdä yhteistyötä asiantuntijoiden ja laajemman ekosysteemin kanssa parantaaksemme tekoälyjärjestelmien tapaa tukea nuoria.

”Yksi suurimmista puutteista teini-ikäisten tekoälyturvallisuudessa on ollut selkeiden, käytännössä sovellettavien toimintaperiaatteiden puute, joiden pohjalta kehittäjät voivat rakentaa. Monesti kehittäjät aloittavat tyhjästä. Nämä kehotepohjaiset käytännöt auttavat asettamaan merkityksellisen turvallisuuden vähimmäistason koko ekosysteemissä, ja koska ne julkaistaan avoimena lähdekoodina, niitä voidaan mukauttaa ja parantaa ajan myötä. ”On rohkaisevaa nähdä, että tällainen infrastruktuuri tulee laajasti saataville, ja toivomme sen vauhdittavan yhteisten nuorten turvallisuutta koskevien lähtökohtien syntymistä koko toimialalla.”

Robbie Torney, tekoälyn ja digitaalisten arviointien johtaja, Common Sense Media

”Tämän kaltaiset toimet, jotka tekevät nuorten turvallisuuskäytännöistä käytännössä sovellettavampia, ovat arvokkaita, koska ne auttavat muuttamaan asiantuntijatietoa ohjeistukseksi, jota voidaan käyttää todellisissa järjestelmissä. Sisältökäytännöt ovat tärkeä ensimmäinen askel, ja ne mahdollistavat laajemman työn sen parissa, miten mallikäyttäytyminen voi vaikuttaa nuoriin kohdistuviin riskeihin ajan mittaan. Tämän työn ja oman tutkimuksemme innoittamana everyone.ai(avautuu uudessa ikkunassa) on myös laatinut alustavan käyttäytymisohjeen, joka keskittyy esimerkiksi yksinoikeusvaatimuksiin ja liialliseen riippuvuuteen liittyviin riskeihin.”

Dr. Mathilde Cerioli, everyone.AI:n päätutkija

Lähtökohta, ei täydellinen ratkaisu

Käytännöt on tarkoitettu lähtökohdaksi, ei kattavaksi tai lopulliseksi määritelmäksi tai takeeksi nuorten turvallisuudesta. Jokaisella sovelluksella on omat riskinsä, kohdeyleisönsä ja käyttöyhteytensä. Kehittäjät ovat parhaassa asemassa ymmärtämään riskit, joita heidän tuotteensa ja tekoälyintegraationsa voivat aiheuttaa. Kannustamme kehittäjiä voimakkaasti mukauttamaan ja laajentamaan näitä käytäntöjä omien tarpeidensa mukaisesti sekä yhdistämään niihin muita suojatoimia, kuten tuotesuunnitteluratkaisuja, käyttäjän hallintatoimintoja, nuorille sopivaa avoimuutta, seurantajärjestelmiä sekä harkittuja ja ikään sopivia toimintatapoja. 

Uskomme, että syvyyteen ulottuva puolustus on olennaisen tärkeä turvallisempien tekoälyjärjestelmien kehittämisessä. Nämä ohjeet perustuvat sisäiseen kokemukseemme, mutta ne eivät kata kaikkia OpenAI:n sisäisiä ohjeita tai suojatoimia.

Tulevaisuuden suunta

Julkaisemme nämä käytännöt avoimena lähdekoodina ROOST Malli Communityn(avautuu uudessa ikkunassa) kautta edistääksemme yhteistyötä ja jatkuvaa kehittämistä. Jos haluat osallistua, antaa palautetta tai jakaa muita nuorten turvallisuutta koskevia käytäntöjä, käy RMC GitHub -repositoriossa.(avautuu uudessa ikkunassa)

Kehittäjät ja organisaatiot voivat mukauttaa näitä käytäntöjä omiin sovelluksiinsa, kääntää ne eri kielille ja laajentaa niitä kattamaan uusia riskialueita. Ajan myötä toivomme, että tämä edistää vahvemman ja yhteisen perustan luomista turvallisuuskäytäntöjen toteuttamiselle tekoälyjärjestelmissä.

Aloita gpt-oss-safeguardin käyttö lataamalla se Hugging Face(avautuu uudessa ikkunassa) -sivustolta.