24 март 2026 г.

Помош за програмерите да создаваат побезбедни искуства со вештачка интелигенција за тинејџерите

Ви претставуваме збир мерки за безбедност на тинејџери, форматирани како промпт за gpt-oss-safeguard

Се вчитува...

Денес објавуваме безбедносни политики⁠(се отвора во нов прозорец) засновани на промпт за да им помогнеме на програмерите да создадат заштитни мерки соодветни на возраста за тинејџери. Создадени да работат со нашиот безбедносен модел со отворена тежина, gpt-oss-safeguard⁠(се отвора во нов прозорец), овие политики го поедноставуваат претворањето на безбедносните барања во употребливи класификатори за системи од реалниот свет.

Објавивме модел со отворени параметри за да го демократизираме пристапот до моќна вештачка интелигенција и да поддржиме широка иновација. Во исто време, веруваме дека безбедноста и иновацијата одат рака под рака и дека програмерите треба да имаат пристап до способни модели, како и до алатките и политиките за да ги применуваат безбедно и одговорно. Ги развивме овие политики за да ги поддржиме програмерите во нивните напори за безбедност за заштита на младите корисници, со придонес од доверливи надворешни организации, вклучувајќи ги Common Sense Media⁠(се отвора во нов прозорец) и everyone.ai⁠(се отвора во нов прозорец).

Свесни сме дека тинејџерите и возрасните имаат различни потреби и дека на тинејџерите им се потребни дополнителни мерки за заштита. Овие политики се осмислени за да им помогнат на програмерите да ги земат предвид тие разлики и да создадат искуства што ги оспособуваат корисниците и се соодветни за помладите корисници.

Продолжувајќи со нашата поширока работа за заштита на младите

Одамна сме посветени на изградба на вештачка интелигенција што ги проширува можностите за младите, истовремено одржувајќи ги безбедни. Како дел од оваа работа, ја ажуриравме нашата Спецификација на моделот⁠(се отвора во нов прозорец)- насоките што го дефинираат предвиденото однесување на моделите на OpenAI - за да вклучува Принципи за под 18 години (U18)⁠(се отвора во нов прозорец), и воведовме заштитни мерки на ниво на производ, како што се родителска контрола⁠ и предвидување на возраста⁠, за подобро да ги заштитиме помладите корисници. Исто така, повикавме на заштитни мерки на ниво на целата индустрија преку нашиот План за безбедност на тинејџерите⁠.

Денешната објава се надоврзува на таа основа. Ги правиме овие безбедносни политики достапни за програмерите за да ги поддржиме во воведувањето безбедносни мерки за тинејџери и да помогнеме во демократизацијата на пристапот низ екосистемот на отворени тежини.

Преточување на безбедноста на тинејџерите во јасни, применливи политики

Иако безбедносните класификатори како gpt-oss-safeguard можат да откријат штетна содржина, тие зависат од јасни дефиниции за тоа што претставува таа содржина. Во практика, еден од најголемите предизвици со кои се соочуваат програмерите на софтвер е дефинирањето на политики што точно ги опфаќаат ризиците специфични за тинејџерите и можат доследно да се применуваат во реални системи.

Дури и искусните тимови често имаат тешкотии да ги преточат безбедносните цели на високо ниво во прецизни, оперативни правила, особено затоа што тоа бара и експертиза во предметната област и длабоко познавање на вештачка интелигенција. Ова може да доведе до празнини во заштитата, неконзистентно спроведување или претерано широко филтрирање. Јасните, добро дефинирани политики се критична основа за ефективни системи за безбедност.

Им помагаме на програмерите да ја применат безбедноста на тинејџерите во практика

За да одговориме на овој предизвик, објавуваме збир безбедносни политики⁠(се отвора во нов прозорец), приспособени на вообичаените ризици со кои се соочуваат тинејџерите и засновани на внимателен преглед на постојните истражувања за нивните специфични развојни разлики. Овие политики се структурирани како промптови што може директно да се користат со gpt-oss-safeguard⁠(се отвора во нов прозорец) и други модели со расудување, со што им овозможуваат на програмерите полесно да применуваат доследни безбедносни стандарди во своите системи.

Првичното издание вклучува политики што опфаќаат:

Графичка содржина со насилство
Графичка сексуална содржина
Штетни телесни идеали и однесувања
Опасни активности и предизвици
Романтична или насилна игра на улоги
Стоки и услуги ограничени според возраста

Овие политики може да се користат за филтрирање на содржина во реално време, како и за офлајн анализа на содржина генерирана од корисници.

Со структурирање на политиките како промптови, програмерите можат полесно да ги интегрираат во постојните работни текови, да ги приспособат на нивните случаи на употреба и да ги усовршуваат со текот на времето.

Дијаграм што прикажува категории на политики за безбедност на тинејџери и содржина поврзана со тинејџери, кои се внесуваат во систем за заштита GPT-OSS и резултираат со одлуки за политики засновани на внатрешно расудување.

Развиено со придонес од надворешни експерти

Соработувавме со надворешни организации, како што се Common Sense Media⁠(се отвора во нов прозорец) и everyone.ai⁠(се отвора во нов прозорец), за да го информираме развојот на овие политики. Нивната експертиза помогна да се обликува опсегот на содржините што треба да се опфатат, да се зајакне структурата на промптовите и да се прецизираат граничните случаи за разгледување при нивната евалуација.

Оваа работа одразува постојан напор за соработка со експерти и поширокиот екосистем за подобрување на начинот на кој системите за вештачка интелигенција ги поддржуваат младите.

„Една од најголемите празнини во безбедноста на вештачката интелигенција за тинејџерите е недостигот од јасни, оперативни политики на кои можат да се потпрат програмерите. Честопати програмерите почнуваат од нула. Овие политики засновани на промпт помагаат да се постави значајно минимално ниво на безбедност низ целиот екосистем и, бидејќи се објавени како со отворен код, со текот на времето можат да се приспособуваат и подобруваат. „Охрабрени сме што гледаме дека овој вид инфраструктура станува широко достапен и се надеваме дека тоа ќе поттикне повеќе заеднички почетни основи за безбедноста на младите во целата индустрија.

-Роби Торни, Раководител на одделот за вештачка интелигенција и дигитални проценки, Common Sense Media

„Напорите како овој, кои ги прават политиките за безбедноста на младите поприменливи во практика, се вредни затоа што помагаат експертското знаење да се претвори во насоки што можат да се користат во реални системи. Политиките за содржина се важен прв чекор, а исто така ја отвораат вратата за поширока работа за тоа како однесувањето на моделот може со текот на времето да ги обликува ризиците релевантни за младите. Инспирирана од оваа работа и од нашето сопствено истражување, everyone.ai⁠(се отвора во нов прозорец) исто така создаде почетна политика за однесување фокусирана на ризици како ексклузивност и прекумерно потпирање."

-Д-р Матилде Чериоли, главен научник во everyone.AI

Почетна точка, а не целосно решение

Политиките се наменети како почетна точка, а не како сеопфатна или конечна дефиниција или гаранција за безбедноста на тинејџерите. Секоја апликација има уникатни ризици, публика и контексти, а програмерите се во најдобра позиција да ги разберат ризиците што нивните производи и интеграции со вештачка интелигенција може да ги претставуваат. Ги охрабруваме програмерите да ги приспособат и прошират овие политики врз основа на нивните специфични потреби и да ги комбинираат со други заштитни мерки, како што се одлуки за дизајнот на производот, кориснички контроли, транспарентност прилагодена за тинејџери, системи за следење и промислени одговори соодветни на возраста.

Веруваме дека слоевит пристап на одбрана во длабочина⁠ е од суштинско значење за создавање побезбедни системи со вештачка интелигенција. Овие политики се засноваат на нашето внатрешно искуство, но не го одразуваат целосниот опсег на внатрешните политики или заштитни мерки на OpenAI.

Патот пред нас

Ги објавуваме овие политики како отворен код преку ROOST Model Community⁠(се отвора во нов прозорец) за да поттикнеме соработка и повторување. За да придонесете, да дадете повратни информации или да споделите дополнителни политики за безбедност на тинејџерите, посетете го репозиториумот на RMC на GitHub.⁠(се отвора во нов прозорец)

Програмерите на софтвер и организациите можат да ги приспособат овие политики на нивните специфични апликации, да ги преведат на различни јазици и да ги прошират за да опфатат дополнителни области на ризик. Со текот на времето, се надеваме дека ова ќе придонесе за поцврста и заедничка основа за спроведување безбедносни политики во системите за вештачка интелигенција.

За да започнете со gpt-oss-safeguard, преземете го од Hugging Face⁠(се отвора во нов прозорец).

Продолжи да читаш

Види ги сите

Безбедност и усогласување во ера на модели со долг хоризонт

Безбедност20 јул. 2026 г.

Why teens deserve access to safe AI — card image

Зошто тинејџерите заслужуваат пристап до безбедна ВИ

Безбедност16 јул. 2026 г.

GPT-Red: самоподобрување за поголема робустност

Безбедност15 јул. 2026 г.