24 martie 2026

Dezvoltatorii creează experiențe IA mai sigure pentru adolescenți

Îți prezentăm un set de politici de siguranță pentru adolescenți, formatate ca solicitări pentru gpt-oss-safeguard

Se încarcă…

Astăzi, lansăm politici de siguranță⁠(se deschide într-o fereastră nouă) bazate pe solicitări pentru a ajuta dezvoltatorii să creeze măsuri de protecție adecvate vârstei pentru adolescenți. Concepute pentru a funcționa cu modelul nostru de siguranță de tip open-weight, gpt-oss-safeguard⁠(se deschide într-o fereastră nouă), aceste politici simplifică modul în care dezvoltatorii transformă cerințele de siguranță în clasificatori utilizabili pentru sisteme reale.

Am lansat modele de tip open-weight pentru a democratiza accesul la IA puternică și a sprijini inovarea pe scară largă. În același timp, considerăm că siguranța și inovația sunt strâns legate, iar dezvoltatorii ar trebui să aibă acces la modele performante, precum și la instrumentele și politicile necesare pentru a le implementa în condiții de siguranță și în mod responsabil. Am elaborat aceste politici pentru a sprijini dezvoltatorii în eforturile lor privind siguranța, pentru a proteja utilizatorii tineri, cu contribuții din partea unor organizații externe de încredere, inclusiv Common Sense Media⁠(se deschide într-o fereastră nouă) și everyone.ai⁠(se deschide într-o fereastră nouă).

Recunoaștem că adolescenții și adulții au nevoi diferite și că adolescenții au nevoie de protecții suplimentare. Aceste politici sunt concepute pentru a ajuta dezvoltatorii să țină cont de aceste diferențe și să creeze experiențe care să fie atât eficiente, cât și potrivite pentru utilizatorii mai tineri.

În continuarea eforturilor noastre mai ample de a proteja tinerii

Ne-am angajat de mult timp să dezvoltăm IA care extinde oportunitățile pentru tineri, menținându-i în siguranță. Ca parte a acestei activități, am actualizat Specificațiile modelului⁠(se deschide într-o fereastră nouă) — ghidurile care definesc comportamentul intenționat al modelelor OpenAI — pentru a include Principii pentru persoanele sub 18 ani (U18)⁠(se deschide într-o fereastră nouă) și am introdus măsuri de protecție la nivel de produs, precum controale parentale⁠ și estimarea vârstei⁠, pentru a proteja mai bine utilizatorii mai tineri. De asemenea, am solicitat protecții la nivelul întregului domeniu prin intermediul Planului nostru pentru siguranța adolescenților⁠.

Lansarea de astăzi se bazează pe aceste fundamente. Punem aceste politici de siguranță la dispoziția dezvoltatorilor pentru a-i sprijini în implementarea protecțiilor de siguranță pentru adolescenți și pentru a contribui la democratizarea accesului în întregul ecosistem open weight.

Transformarea siguranței tinerilor în politici clare și ușor de folosit

Deși clasificatoarele de siguranță precum gpt-oss-safeguard pot detecta conținutul dăunător, ele depind de definiții clare ale acestui tip de conținut. În practică, una dintre cele mai mari provocări cu care se confruntă dezvoltatorii este definirea unor politici care surprind cu acuratețe riscurile specifice adolescenților și care pot fi aplicate în mod consecvent în sisteme reale.

Chiar și echipele cu experiență întâmpină adesea dificultăți în a transpune obiectivele de siguranță de nivel înalt în reguli precise, operaționale, mai ales pentru că acest lucru necesită atât cunoștințe în domeniu, cât și unele aprofundate despre IA. Acest lucru poate duce la deficiențe ale protecției, la o aplicare inconsecventă a măsurilor sau la o filtrare excesiv de extinsă. Politicile clare și bine definite reprezintă o bază esențială pentru sisteme de siguranță eficiente.

Ajutăm dezvoltatorii să implementeze siguranța adolescenților

Pentru a aborda această provocare, lansăm un set de politici de siguranță⁠(se deschide într-o fereastră nouă), adaptate riscurilor frecvente cu care se confruntă adolescenții și bazate pe o analiză atentă a cercetărilor existente despre particularitățile dezvoltării adolescenților. Aceste politici sunt structurate sub formă de solicitări care pot fi folosite direct cu gpt-oss-safeguard⁠(se deschide într-o fereastră nouă) și alte modele de raţionament, permițându-le dezvoltatorilor să aplice mai ușor standarde de siguranță consecvente în sistemele lor.

Lansarea inițială include politici care acoperă:

Conținut grafic violent
Conținut sexual explicit
Idealuri și comportamente corporale dăunătoare
Activități și provocări periculoase
Joc de rol romantic sau violent
Bunuri și servicii restricționate în funcție de vârstă

Aceste politici pot fi folosite pentru filtrarea în timp real a conținutului, dar și pentru analiza offline a conținutului creat de utilizatori.

Prin structurarea politicilor sub formă de solicitări, dezvoltatorii le pot integra mai ușor în fluxurile de lucru existente, le pot adapta la cazurile lor de utilizare și le pot îmbunătăți în timp.

Diagramă care prezintă categoriile de politici privind siguranța adolescenților și conținutul legat de adolescenți care sunt introduse într-un sistem de protecție GPT-OSS, care generează decizii privind politicile pe baza unui raționament intern.

Dezvoltate cu ajutorul experților externi

Am colaborat cu organizații externe, inclusiv Common Sense Media⁠(se deschide într-o fereastră nouă) și everyone.ai⁠(se deschide într-o fereastră nouă), pentru a contribui la elaborarea acestor politici. Competențele lor au contribuit la definirea domeniului de aplicare al conținutului care urma să fie acoperit, au consolidat structura solicitărilor și au rafinat cazurile limită care trebuiau luate în considerare la evaluarea acestora.

Acest demers reflectă un efort continuu de a colabora cu experți și cu ecosistemul mai larg pentru a îmbunătăți modul în care sistemele IA sprijină tinerii.

„Unul dintre cele mai mari decalaje în materie de siguranța IA pentru adolescenți a fost lipsa unor politici clare și operaționale, pe baza cărora dezvoltatorii să poată construi. De multe ori, dezvoltatorii încep de la zero. Aceste politici bazate pe solicitări ajută la stabilirea unui nivel de bază semnificativ în materie de siguranță la nivelul întregului ecosistem și, deoarece sunt publicate ca open source, pot fi adaptate și îmbunătățite în timp. Ne bucurăm să vedem că acest tip de infrastructură este pus la dispoziția publicului larg și sperăm că va stimula apariția mai multor inițiative comune în domeniul siguranței tinerilor în acest sector.”

—Robbie Torney, directorul departamentului de IA și evaluări digitale, Common Sense Media

„Eforturile de acest gen, care fac politicile de siguranță a tinerilor mai operaționale, sunt valoroase deoarece ajută la transformarea cunoștințelor de specialitate în îndrumări care pot fi utilizate în sisteme reale. Politicile de conținut reprezintă un prim pas important și, de asemenea, deschid calea către o cercetare mai amplă privind modul în care comportamentul modelelor poate determina riscurile relevante pentru tineri în timp. Inspirată de această activitate și de propriile noastre cercetări, compania everyone.ai⁠(se deschide într-o fereastră nouă) a creat, la rândul său, o politică comportamentală inițială axată pe riscuri precum exclusivitatea și dependența excesivă.”

—Dr. Mathilde Cerioli, director științific la everyone.ai

Un punct de plecare, nu o soluție completă

Politicile sunt gândite ca un punct de plecare, nu ca o definiție completă sau finală ori ca o garanție a siguranței adolescenților. Fiecare aplicație are riscuri, publicuri și contexte unice, iar dezvoltatorii sunt cel mai bine poziționați pentru a înțelege riscurile pe care le pot prezenta produsele și integrările lA. Încurajăm cu tărie dezvoltatorii să adapteze și extindă aceste politici în funcție de nevoile lor specifice și să le combine cu alte măsuri de protecție, cum ar fi decizii privind designul produsului, controale pentru utilizatori, transparență adaptată adolescenților, sisteme de monitorizare și răspunsuri bine gândite și adecvate vârstei.

Credem că o abordare stratificată de tip apărare în profunzime⁠⁠ este esențială pentru construirea unor sisteme IA mai sigure. Aceste politici se bazează pe experiența noastră internă, dar nu reflectă pe deplin politicile sau măsurile de protecție interne ale OpenAI.

Ce urmează

Publicăm aceste politici ca open source prin intermediul ROOST Model Community⁠(se deschide într-o fereastră nouă) pentru a încuraja colaborarea și iterația. Pentru a contribui, oferi feedback sau împărtăși politici suplimentare privind siguranța adolescenților, consultă depozitul GitHub RMC.⁠(se deschide într-o fereastră nouă)

Dezvoltatorii și organizațiile pot adapta aceste politici în funcție de necesitățile lor specifice, le pot traduce în diferite limbi și le pot extinde pentru a acoperi domenii de risc suplimentare. Sperăm ca, în timp, acest demers să contribuie la crearea unei baze mai solide și comune pentru implementarea politicilor de siguranță în sistemele IA.

Pentru a începe să folosești gpt-oss-safeguard, descarcă-l de pe Hugging Face⁠(se deschide într-o fereastră nouă).

Continuă să citești

Vezi toate

Siguranța și alinierea în era modelelor cu orizont lung

Siguranță20 iul. 2026

Why teens deserve access to safe AI — card image

De ce adolescenții merită acces la o IA sigură

Siguranță16 iul. 2026

GPT-Red: deblocarea autoîmbunătățirii robusteții

Siguranță15 iul. 2026