ప్రధాన కంటెంట్‌కి దాటండి
OpenAI

24 మార్చి, 2026

భద్రత

టీనేజర్ల కోసం మరింత సురక్షితమైన AI అనుభవాలను నిర్మించేందుకు డెవలపర్లకు సహాయపడుతూ

gpt-oss-safeguard కోసం ప్రాంప్ట్‌ల రూపంలో టీన్ సేఫ్టీ పాలసీల సమూహాన్ని పరిచయం చేస్తున్నాము.

లోడ్ అవుతోంది…

ఈ రోజు, డెవలపర్లు టీనేజర్ల కోసం వయస్సుకు తగిన రక్షణలను రూపొందించడంలో సహాయపడేందుకు ప్రాంప్ట్-ఆధారిత భద్రతా విధానాలు(కొత్త విండోలో తెరుచుకుంటుంది) విడుదల చేస్తున్నాం. మా ఓపెన్-వెయిట్ సేఫ్టీ మోడల్, gpt-oss-safeguard(కొత్త విండోలో తెరుచుకుంటుంది), తో పని చేసేలా రూపొందించిన ఈ పాలసీలు, వాస్తవ-ప్రపంచ సిస్టమ్‌ల కోసం డెవలపర్లు సేఫ్టీ అవసరాలను ఉపయోగించగల క్లాసిఫైయర్లుగా మార్చే విధానాన్ని సులభతరం చేస్తాయి.

శక్తివంతమైన AIకి ప్రాప్యతను ప్రజాస్వామ్యీకరించడానికి మరియు విస్తృత ఆవిష్కరణకు మద్దతు ఇవ్వడానికి మేము ఓపెన్ వెయిట్ మోడల్స్‌ను విడుదల చేశాము. అదే సమయంలో, భద్రత మరియు ఆవిష్కరణ చేతి చేతి కలిపి సాగుతాయని, అలాగే డెవలపర్‌లకు సామర్థ్యవంతమైన మోడల్‌కు యాక్సెస్‌తో పాటు వాటిని సురక్షితంగా మరియు బాధ్యతాయుతంగా అమలు చేయడానికి అవసరమైన టూల్స్ మరియు పాలసీలు కూడా అందుబాటులో ఉండాలని మేము నమ్ముతున్నాము. యువ వినియోగదారులను రక్షించేందుకు డెవలపర్‌లు చేస్తున్న భద్రతా ప్రయత్నాలకు మద్దతు ఇవ్వడానికి, Common Sense Media(కొత్త విండోలో తెరుచుకుంటుంది) మరియు everyone.ai(కొత్త విండోలో తెరుచుకుంటుంది) వంటి విశ్వసనీయ బాహ్య సంస్థల సూచనలతో మేము ఈ పాలసీలను అభివృద్ధి చేశాము.

టీనేజర్లు మరియు పెద్దవయస్కులకు విభిన్న అవసరాలు ఉన్నాయని, అలాగే టీనేజర్లకు అదనపు రక్షణలు అవసరమని మేము గుర్తిస్తున్నాము. ఈ విధానాలు డెవలపర్‌లు ఆ తేడాలను పరిగణనలోకి తీసుకోవడంలో మరియు చిన్న వయస్కులైన వినియోగదారులకు శక్తినిచ్చేలా, అలాగే వారికి తగిన అనుభవాలను రూపొందించడంలో సహాయపడేలా రూపొందించబడ్డాయి.

యువతను రక్షించడానికి మా విస్తృతమైన పనిని ఆధారంగా చేసుకోవడం

యువతకు అవకాశాలను విస్తరించడంతో పాటు వారిని సురక్షితంగా ఉంచే AIను అభివృద్ధి చేయడానికి మేము చాలా కాలంగా కట్టుబడి ఉన్నాము. ఈ పనిలో భాగంగా, మేము OpenAI యొక్క మోడల్స్ ఉద్దేశించిన ప్రవర్తనను నిర్వచించే మార్గదర్శకాలైన మా మోడల్ స్పెక్(కొత్త విండోలో తెరుచుకుంటుంది)ను 18 సంవత్సరాల లోపు (U18) సూత్రాలు(కొత్త విండోలో తెరుచుకుంటుంది) చేర్చేలా అప్‌డేట్ చేశాము, అలాగే చిన్న వయస్సు వినియోగదారులను మరింత మెరుగ్గా రక్షించడానికి పేరెంటల్ కంట్రోల్స్ మరియు వయస్సు అంచనా వంటి ఉత్పత్తి-స్థాయి రక్షణలను ప్రవేశపెట్టాము. మా టీన్ సేఫ్టీ బ్లూప్రింట్ ద్వారా పరిశ్రమవ్యాప్తంగా రక్షణల కోసం కూడా మేము పిలుపునిచ్చాము.

ఈ రోజు విడుదల ఆ ప్రాతిపదికపై నిర్మించబడింది. టీనేజర్ల కోసం భద్రతా రక్షణలను అమలు చేయడంలో డెవలపర్‌లకు మద్దతు ఇవ్వడానికి మరియు ఓపెన్ వెయిట్స్ ఎకోసిస్టమ్ అంతటా అందుబాటును ప్రజాస్వామ్యీకరించడంలో సహాయపడేందుకు మేము ఈ సేఫ్టీ పాలసీలను అందుబాటులోకి తీసుకువస్తున్నాం.

టీనేజర్ల భద్రతను స్పష్టంగా, అందరికీ ఉపయోగపడే విధానాలుగా మార్చడం

gpt-oss-safeguard వంటి సేఫ్టీ క్లాసిఫైయర్లు హానికరమైన కంటెంట్ను గుర్తించగలిగినా, ఆ కంటెంట్ అంటే ఏమిటో స్పష్టమైన నిర్వచనాలపై అవి ఆధారపడతాయి. ఆచరణలో, డెవలపర్లు ఎదుర్కొనే అతిపెద్ద సవాళ్లలో ఒకటి యువతకు ప్రత్యేకమైన ప్రమాదాలను ఖచ్చితంగా ప్రతిబింబించే మరియు వాస్తవ వ్యవస్థల్లో స్థిరంగా అమలు చేయగల విధానాలను నిర్వచించడం.

అనుభవజ్ఞులైన టీమ్‌లకు కూడా హై-లెవల్ సేఫ్టీ లక్ష్యాలను ఖచ్చితమైన ఆపరేషనల్ నియమాలుగా మార్చడం కష్టంగా ఉంటుంది, ముఖ్యంగా దీనికి విషయం నైపుణ్యం మరియు లోతైన AI పరిజ్ఞానం రెండూ అవసరం అవుతాయి. ఇది రక్షణలో లోపాలు, అస్థిరమైన అమలు, లేదా అతిగా విస్తృతమైన ఫిల్టరింగ్‌కు దారితీయవచ్చు. స్పష్టమైన, బాగా నిర్వచించబడిన విధానాలు సమర్థవంతమైన భద్రతా వ్యవస్థలకు అత్యంత కీలకమైన పునాది.

టీనేజర్ల భద్రతను అమలులోకి తీసుకురావడంలో డెవలపర్‌లకు సహాయపడటం

ఈ సవాలును ఎదుర్కొనేందుకు, టీనేజర్లు ఎదుర్కొనే సాధారణ ప్రమాదాలకు అనుగుణంగా రూపొందించబడిన మరియు టీనేజర్ల ప్రత్యేక అభివృద్ధి భేదాలపై ఉన్న ప్రస్తుత పరిశోధనను జాగ్రత్తగా సమీక్షించడం ద్వారా సమాచారం పొందిన భద్రతా విధానాల(కొత్త విండోలో తెరుచుకుంటుంది) సమితిని మేము విడుదల చేస్తున్నాం. ఈ పాలసీలు gpt-oss-safeguard(కొత్త విండోలో తెరుచుకుంటుంది) మరియు ఇతర రిజనింగ్ మోడళ్లతో నేరుగా ఉపయోగించగల ప్రాంప్ట్‌ల రూపంలో రూపొందించబడ్డాయి, తద్వారా డెవలపర్లు తమ సిస్టమ్‌ల అంతటా ఒకే విధమైన సేఫ్టీ ప్రమాణాలను మరింత సులభంగా అమలు చేయగలరు.

ప్రారంభ విడుదలలో ఈ క్రింది అంశాలను కవర్ చేసే విధానాలు కలిగి ఉంటాయి:

  • గ్రాఫిక్ హింసాత్మక కంటెంట్
  • గ్రాఫిక్ లైంగిక కంటెంట్
  • శరీరానికి సంబంధించిన హానికరమైన ఆదర్శాలు మరియు ప్రవర్తనలు
  • ప్రమాదకరమైన కార్యకలాపాలు మరియు చాలెంజ్‌లు
  • రొమాంటిక్ లేదా హింసాత్మక రోల్ ప్లే
  • వయస్సు పరిమితి ఉన్న వస్తువులు మరియు సేవలు

ఈ పాలసీలను రియల్-టైమ్ కంటెంట్ ఫిల్టరింగ్ కోసం, అలాగే వినియోగదారులు సృష్టించిన కంటెంట్ యొక్క ఆఫ్‌లైన్ విశ్లేషణ కోసం ఉపయోగించవచ్చు.

పాలసీలను ప్రాంప్ట్‌ల రూపంలో నిర్మించడం ద్వారా, డెవలపర్లు వాటిని ఇప్పటికే ఉన్న వర్క్‌ఫ్లోల్లో మరింత సులభంగా సమీకరించగలరు, తమ యూజ్ కేస్‌లకు అనుగుణంగా మార్చుకోగలరు, అలాగే కాలక్రమేణా వాటిని మెరుగుపరుచుకుంటూ పోగలరు.

యువత భద్రతా పాలసీ వర్గాలు మరియు యువతకు సంబంధించిన కంటెంట్ GPT-OSS సేఫ్‌గార్డ్ సిస్టమ్‌లోకి ఇన్పుట్‌గా వెళ్లి, అది అంతర్గత రిజనింగ్ ఆధారంగా పాలసీ నిర్ణయాలను ఉత్పత్తి చేస్తుందని చూపించే డయాగ్రామ్.

బాహ్య నిపుణుల సూచనలతో అభివృద్ధి చేయబడింది

ఈ విధానాల అభివృద్ధికి సమాచారం అందించడానికి మేము Common Sense Media(కొత్త విండోలో తెరుచుకుంటుంది) మరియు everyone.ai(కొత్త విండోలో తెరుచుకుంటుంది) సహా బాహ్య సంస్థలతో కలిసి పనిచేశాము. వారి నైపుణ్యం కవర్ చేయాల్సిన కంటెంట్ పరిధిని రూపుదిద్దడంలో, ప్రాంప్ట్‌ల నిర్మాణాన్ని బలోపేతం చేయడంలో, మరియు వాటిని మదింపు చేసే సమయంలో పరిగణించాల్సిన ఎడ్జ్ కేసులను మెరుగుపరచడంలో సహాయపడింది. 

ఈ పని AI వ్యవస్థలు యువతకు మద్దతు ఇచ్చే విధానాన్ని మెరుగుపరచడానికి నిపుణులు మరియు విస్తృతమైన ఎకోసిస్టమ్‌తో కలిసి పనిచేయాలనే కొనసాగుతున్న ప్రయత్నాన్ని ప్రతిబింబిస్తుంది.

“టీనేజర్ల కోసం AI భద్రతలో అత్యంత పెద్ద లోపాల్లో ఒకటి, డెవలపర్లు ఆధారంగా తీసుకుని నిర్మించగల స్పష్టమైన, ఆచరణాత్మక విధానాల లేమి. చాలా సార్లు, డెవలపర్లు మొదటి నుండి ప్రారంభిస్తున్నారు. ఈ ప్రాంప్ట్-ఆధారిత పాలసీలు ఎకోసిస్టమ్ అంతటా భద్రతకు ఒక అర్థవంతమైన కనీస స్థాయిని ఏర్పాటు చేయడంలో సహాయపడతాయి, మరియు అవి ఓపెన్ సోర్స్‌గా విడుదల చేయబడినందున, కాలక్రమేణా అనుకూలీకరించబడుతూ, మెరుగుపరచబడవచ్చు. “ఈ రకమైన మౌలిక సదుపాయాలు విస్తృతంగా అందుబాటులోకి రావడం చూడటం మాకు ప్రోత్సాహకరంగా ఉంది, మరియు ఇది పరిశ్రమ అంతటా యువత భద్రతకు సంబంధించిన మరిన్ని ఉమ్మడి ప్రారంభ పునాదులకు దోహదం చేస్తుందని మేము ఆశిస్తున్నాం.”

Robbie Torney, Common Sense Media వద్ద AI & డిజిటల్ అసెస్‌మెంట్స్ హెడ్

“యువత భద్రతా పాలసీలను మరింత కార్యాచరణయోగ్యంగా చేసే ఇలాంటి ప్రయత్నాలు విలువైనవి, ఎందుకంటే అవి నిపుణుల జ్ఞానాన్ని వాస్తవ వ్యవస్థల్లో ఉపయోగించగల మార్గదర్శకంగా అనువదించడంలో సహాయపడతాయి. కంటెంట్ పాలసీలు ఒక ముఖ్యమైన మొదటి అడుగు, అలాగే కాలక్రమేణా మోడల్ ప్రవర్తన యువతకు సంబంధించిన ప్రమాదాలను ఎలా ప్రభావితం చేయగలదనే విస్తృతమైన పనికి కూడా అవి మార్గం సుగమం చేస్తాయి. ఈ పని మరియు మా స్వంత పరిశోధనల నుంచి ప్రేరణ పొంది, everyone.ai(కొత్త విండోలో తెరుచుకుంటుంది) కూడా ఎక్స్‌క్లూజివిటీ మరియు ఓవర్‌రిలయన్స్ వంటి ప్రమాదాలపై దృష్టి సారించిన ఒక ప్రారంభ ప్రవర్తనా పాలసీని రూపొందించింది."

Dr. Mathilde Cerioli, everyone.AI వద్ద చీఫ్ సైంటిస్ట్

ప్రారంభ స్థానం, పూర్తిస్థాయి పరిష్కారం కాదు

ఈ విధానాలు టీనేజర్ల భద్రతకు పూర్తి నిర్వచనం లేదా హామీగా కాకుండా, ప్రారంభ స్థానం కోసం ఉద్దేశించబడ్డాయి. ప్రతి అప్లికేషన్‌కు ప్రత్యేకమైన ప్రమాదాలు, ప్రేక్షకులు మరియు సందర్భాలు ఉంటాయి. తమ ఉత్పత్తులు మరియు AI ఇంటిగ్రేషన్లు కలిగించవచ్చే ప్రమాదాలను అర్థం చేసుకోవడంలో డెవలపర్లు ఉత్తమ స్థితిలో ఉంటారు. డెవలపర్లు ఈ విధానాలను తమ ప్రత్యేక అవసరాలకు అనుగుణంగా సవరించి, విస్తరించేందుకు, అలాగే ప్రోడక్ట్ డిజైన్ నిర్ణయాలు, వినియోగదారు నియంత్రణలు, టీన్లకు అనుకూలమైన పారదర్శకత, పర్యవేక్షణ వ్యవస్థలు, మరియు ఆలోచనాత్మకమైన, వయస్సుకు తగిన ప్రతిస్పందనలు వంటి ఇతర రక్షణ చర్యలతో వాటిని కలిపి ఉపయోగించేందుకు మేము గట్టిగా ప్రోత్సహిస్తున్నాము. 

మరింత సురక్షితమైన AI వ్యవస్థలను నిర్మించడానికి బహుళ-స్థరాల డిఫెన్స్ ఇన్ డెప్త్ విధానం అత్యవసరమని మేము నమ్ముతున్నాము. ఈ విధానాలు మా అంతర్గత అనుభవాన్ని ఆధారంగా రూపొందించబడ్డాయి, కానీ అవి OpenAI యొక్క అంతర్గత విధానాలు లేదా రక్షణ చర్యల పూర్తి స్థాయిని ప్రతిబింబించవు.

ముందుకు సాగే దారి

సహకారం మరియు పునరావృతాన్ని ప్రోత్సహించడానికి, మేము ఈ పాలసీలను ROOST మోడల్ కమ్యూనిటీ(కొత్త విండోలో తెరుచుకుంటుంది) ద్వారా ఓపెన్ సోర్స్‌గా విడుదల చేస్తున్నాము. సహకరించడానికి, అభిప్రాయాన్ని అందించడానికి లేదా అదనపు టీన్ భద్రతా విధానాలను పంచుకోవడానికి, RMC GitHub రిపోజిటరీని సందర్శించండి.(కొత్త విండోలో తెరుచుకుంటుంది)

డెవలపర్లు మరియు సంస్థలు వారి నిర్దిష్ట అప్లికేషన్‌లకు అనుగుణంగా ఈ పాలసీలను సర్దుబాటు చేయవచ్చు, వాటిని వివిధ భాషల్లోకి అనువదించవచ్చు, అలాగే అదనపు రిస్క్ ప్రాంతాలను కవర్ చేసేలా వాటిని విస్తరించవచ్చు. కాలక్రమేణా, ఇది AI వ్యవస్థల్లో భద్రతా విధానాలను అమలు చేయడానికి మరింత బలమైన మరియు భాగస్వామ్య పునాదికి దోహదం చేస్తుందని మేము ఆశిస్తున్నాము.

gpt-oss-safeguard తో ప్రారంభించడానికి, దాన్ని Hugging Face(కొత్త విండోలో తెరుచుకుంటుంది) నుంచి డౌన్లోడ్ చేసుకోండి.