Օգնում ենք ծրագրավորողներին դեռահասների համար ԱԲ-ի ավելի անվտանգ փորձառություններ ստեղծել
Ներկայացնում ենք gpt-oss-safeguard-ի համար հարցման ձևաչափով կազմված դեռահասների անվտանգության քաղաքականությունների հավաքածու
Այսօր մենք հրապարակում ենք հարցումների վրա հիմնված անվտանգության քաղաքականություններ(բացվում է նոր պատուհանում), որպեսզի օգնենք մշակողներին ստեղծել դեռահասների համար տարիքին համապատասխան պաշտպանական միջոցներ։ Մեր բաց քաշի անվտանգության մոդելի՝ gpt-oss-safeguard(բացվում է նոր պատուհանում)-ի հետ աշխատելու համար ստեղծված այս քաղաքականությունները պարզեցնում են այն գործընթացը, որի ժամանակ ծրագրավորողներն անվտանգության պահանջները վերածում կիրառելի դասակարգիչների իրական աշխարհի համակարգերի համար։
Մենք թողարկել ենք բաց քաշի մոդելներ՝ հանրայնացնելու հասանելիությունը հզոր արհեստական բանականությանը և աջակցելու լայնամասշտաբ նորարարությանը։ Միևնույն ժամանակ, մենք համոզված ենք, որ անվտանգությունն ու նորարարությունը ձեռք ձեռքի տված են ընթանում, և որ ծրագրավորողները պետք է հասանելիություն ունենան ունակ մոդելների, ինչպես նաև գործիքների ու քաղաքականությունների՝ դրանք անվտանգ և պատասխանատու կերպով տեղակայելու համար։ Մենք մշակել ենք այս քաղաքականությունները՝ աջակցելու ծրագրավորողներին՝ երիտասարդ օգտատերերին պաշտպանելուն ուղղված իրենց ջանքերում, վստահելի արտաքին կազմակերպությունների, այդ թվում՝ Common Sense Media-ի(բացվում է նոր պատուհանում) և everyone.ai-ի(բացվում է նոր պատուհանում) մասնակցությամբ։
Մենք գիտակցում ենք, որ դեռահասներն ու մեծահասակները տարբեր կարիքներ ունեն, և որ դեռահասներին անհրաժեշտ է լրացուցիչ պաշտպանություն։ Այս քաղաքականություններն օգնում են մշակողներին հաշվի առնել այդ տարբերությունները և ստեղծել փորձառություններ, որոնք և՛ հզորացնող են, և՛ համապատասխան երիտասարդ օգտատերերի կարիքներին։
Մենք վաղուց ենք ստանձնել այնպիսի ԱԲ ստեղծելու պատասխանատվությունը, որն ընդլայնում է երիտասարդների հնարավորությունները՝ միաժամանակ ապահովելով նրանց անվտանգությունը։ Այս աշխատանքի շրջանակներում մենք թարմացրել ենք մեր մոդելի բնութագրերը(բացվում է նոր պատուհանում)՝ OpenAI-ի մոդելների նախատեսված վարքագիծը սահմանող ուղեցույցները, որպեսզի ներառենք մինչև 18 տարեկանների (U18) սկզբունքը(բացվում է նոր պատուհանում), և ներկայացրել ենք արտադրանքի մակարդակում ներդրված պաշտպանական միջոցներ, ինչպիսիք են ծնողական վերահսկողությունը և տարիքի կանխատեսումը, որպեսզի ավելի լավ պաշտպանենք ավելի երիտասարդ օգտատերերին։ Ինչպես նաև մեր «Դեռահասների անվտանգության ծրագրի» միջոցով կոչ ենք արել պաշտպանության միջոցների ներդրմանը ողջ ոլորտում։
Այսօրվա թողարկումը կանգնած է այդ հիմքի վրա։ Մենք այս անվտանգության քաղաքականությունները հասանելի ենք դարձնում ծրագրավորողներին՝ աջակցելու նրանց դեռահասների անվտանգության պաշտպանության միջոցներ ներդնելու և բաց քաշի էկոհամակարգում հասանելիությունն ավելի մասշտաբային դարձնելու գործում։
Թեև gpt-oss-safeguard-ի նման անվտանգության դասակարգիչները կարող են հայտնաբերել վնասակար բովանդակությունը, դրանք կախված են այդ բովանդակության հստակ սահմանումներից։ Գործնականում ծրագրավորողների առջև ծառացած ամենամեծ մարտահրավերներից մեկը քաղաքականությունների սահմանումն է, որոնք ճշգրտորեն կարտացոլեն դեռահասներին հատուկ ռիսկերը և կարող են հետևողականորեն կիրառվել իրական համակարգերում։
Նույնիսկ փորձառու թիմերը հաճախ դժվարանում են բարձր մակարդակի անվտանգության նպատակները վերածել ճշգրիտ, գործառնական կանոնների, հատկապես քանի որ դա պահանջում է ինչպես ոլորտի մասնագիտական փորձ, այնպես էլ ԱԲ-ի խորը գիտելիքներ։ Սա կարող է հանգեցնել պաշտպանության բացերի, ոչ հետևողական կիրառման կամ չափազանց խիստ զտման։ Հստակ և լավ սահմանված քաղաքականությունները կարևոր հիմք են արդյունավետ անվտանգության համակարգերի համար։
Այս խնդիրը լուծելու համար մենք հրապարակում ենք անվտանգության քաղաքականությունների(բացվում է նոր պատուհանում) մի շարք, որը համապատասխանեցված է տարածված ռիսկերին, որոնց բախվում են դեռահասները և հիմնված է դեռահասների զարգացման առանձնահատկությունների վերաբերյալ գոյություն ունեցող հետազոտությունների մանրակրկիտ ուսումնասիրության վրա։ Այս քաղաքականությունները կառուցված են հարցումների ձևաչափով, որոնք կարող են օգտագործվել անմիջապես gpt-oss-safeguard(բացվում է նոր պատուհանում) -ի և այլ հիմնավորման մոդելների հետ՝ հնարավորություն տալով ծրագրավորողներին ավելի հեշտությամբ կիրառել հետևողական անվտանգության չափանիշներ իրենց համակարգերում։
Նախնական թողարկումը ներառում է քաղաքականություններ, որոնք ընդգրկում են․
- Բացահայտ բռնի բովանդակությունը
- Բացահայտ սեռական բովանդակությունը
- Մարմնին վնաս պատճառող իդեալները և վարքագծերը
- Վտանգավոր գործողությունները և մարտահրավերները
- Ռոմանտիկ կամ բռնի դերախաղը
- Տարիքային սահմանափակում ունեցող ապրանքները և ծառայությունները
Այս քաղաքականությունները կարող են կիրառվել բովանդակության՝ իրական ժամանակում զտման, ինչպես նաև օգտատերերի կողմից ստեղծված բովանդակության անցանց վերլուծության նպատակով։
Քաղաքականությունները հարցումների տեսքով կառուցելով՝ ծրագրավորողները կարող են ավելի հեշտությամբ ինտեգրել դրանք գոյություն ունեցող աշխատանքային հոսքերի մեջ, հարմարեցնել դրանք իրենց օգտագործման դեպքերին և ժամանակի ընթացքում կատարելագործել։

Մենք համագործակցել ենք արտաքին կազմակերպությունների հետ՝ ներառյալ Common Sense Media-ն(բացվում է նոր պատուհանում) և everyone.ai-ը(բացվում է նոր պատուհանում), որպեսզի տեղեկացնենք այս քաղաքականությունների մշակման մասին։ Նրանց փորձն օգնեց ձևավորել ընդգրկվելիք բովանդակության շրջանակը, ամրապնդել հարցումների կառուցվածքը և ճշգրտել այն սահմանային դեպքերը, որոնք պետք է հաշվի առնել դրանք գնահատելիս։
Այս աշխատանքն արտացոլում է փորձագետների և ավելի լայն էկոհամակարգի հետ համագործակցելու շարունակական ջանքերը, որպեսզի բարելավենք աջակցությունը, որն արհեստական բանականության համակարգերը ցուցաբերում են երիտասարդներին։
«Դեռահասների համար ԱԲ-ի անվտանգության ոլորտում ամենամեծ բացերից մեկը եղել է հստակ, գործնականում կիրառելի քաղաքականությունների պակասը, որոնց հիման վրա ծրագրավորողները կարող են աշխատել։ Շատ հաճախ նրանք զրոյից են սկսում։ Հարցումների վրա հիմնված այս քաղաքականություններն օգնում են ամբողջ էկոհամակարգում սահմանել անվտանգության իմաստալից նվազագույն շեմ, և քանի որ դրանք հրապարակվում են որպես բաց աղբյուրներ, ժամանակի ընթացքում կարող են հարմարեցվել և բարելավվել։ Մենք ոգևորում ենք այն փաստից, որ այսպիսի ենթակառուցվածքները լայնորեն հասանելի են դառնում, և հույս ունենք, որ դա կխթանի ողջ ոլորտում երիտասարդների անվտանգության ապահովման ավելի շատ ընդհանուր հիմքերի ձևավորմանը»։
Ռոբի Թորնի, Common Sense Media-ի ԱԲ և թվային գնահատումների ղեկավար
«Նման նախաձեռնությունները, որոնք երիտասարդների անվտանգության քաղաքականությունները դարձնում են ավելի կիրառելի, արժեքավոր են, քանի որ դրանք օգնում են փորձագիտական գիտելիքը վերածել ուղեցույցների, որոնք կարող են կիրառվել իրական համակարգերում։ Բովանդակության քաղաքականությունները առաջին ու ամենակարևոր քայլն են և հիմք են ծառայում ավելի լայն ուսումնասիրությունների, թե ինչպես մոդելի վարքագիծը կարող է ժամանակի ընթացքում երիտասարդներին առնչվող ռիսկեր առաջացնել։ Այս աշխատանքից և մեր սեփական հետազոտություններից ոգեշնչված՝ everyone.ai-ը(բացվում է նոր պատուհանում) նույնպես մշակել է նախնական վարքագծային քաղաքականություն՝ կենտրոնացած այնպիսի ռիսկերի վրա, ինչպիսիք են օգտատիրոջ՝ ԱԲ-ի հետ բացառիկ կապի ձևավորումը և դրանից չափազանց մեծ կախվածությունը»։
Դոկտոր Մաթիլդա Սերիոլի, everyone.AI-ի գլխավոր գիտնական
Քաղաքականությունները մեկնարկային կետ են, ոչ թե դեռահասների անվտանգության համապարփակ կամ վերջնական սահմանում կամ էլ երաշխիք։ Յուրաքանչյուր հավելված ունի իրեն բնորոշ ռիսկեր, լսարաններ և համատեքստեր, և ծրագրավորողներն ամենալավը կարող են հասկանալ այն ռիսկերը, որոնք կարող են առաջացնել իրենց պրոդուկտները և ԱԲ ինտեգրումները։ Մենք խստիվ հորդորում ենք ծրագրավորողներին ներդնել և ընդլայնել այս քաղաքականությունները՝ ելնելով իրենց հատուկ կարիքներից, և դրանք համատեղել այլ պաշտպանական միջոցների հետ, ինչպիսիք են պրոդուկտի դիզայնի որոշումները, օգտատերերի վերահսկման գործիքները, դեռահասների համար հասկանալի թափանցիկությունը, մշտադիտարկման համակարգերը և մտածված, տարիքին համապատասխան արձագանքները։
Մենք հավատում ենք, որ շերտավոր խորքային պաշտպանության մոտեցումը էական է ավելի անվտանգ ԱԲ համակարգեր կառուցելու համար։ Այս քաղաքականությունները հիմնված են մեր ներքին փորձի վրա, սակայն դրանք լիովին չեն արտացոլում OpenAI-ի ներքին քաղաքականությունների կամ պաշտպանական միջոցների ողջ ծավալը։
Մենք այս քաղաքականությունները հրապարակում ենք բաց աղբյուրի տեսքով ROOST Model Community-ի(բացվում է նոր պատուհանում) միջոցով, որպեսզի խրախուսենք համագործակցությունն ու կատարելագործումը։ Ներդրում ունենալու, կարծիք հայտնելու կամ դեռահասների անվտանգությանը վերաբերող լրացուցիչ քաղաքականություններով կիսվելու համար այցելեք RMC GitHub պահոց։(բացվում է նոր պատուհանում)
Ծրագրավորողները և կազմակերպությունները կարող են հարմարեցնել այս քաղաքականությունները իրենց հատուկ կիրառություններին, թարգմանել դրանք տարբեր լեզուներով և ընդլայնել դրանք՝ լրացուցիչ ռիսկային ոլորտներ ընդգրկելու համար։ Հուսով ենք, որ ժամանակի ընթացքում սա կնպաստի ԱԲ համակարգերում անվտանգության քաղաքականությունների ներդրման համար ավելի ամուր և ընդհանուր հիմքի ձևավորմանը։
gpt-oss-safeguard-ի օգտագործումն սկսելու համար ներբեռնեք այն Hugging Face(բացվում է նոր պատուհանում) կայքից։


