24 მარტი, 2026

ვეხმარებით დეველოპერებს, რომ თინეიჯერებისთვის უფრო უსაფრთხო AI გამოცდილება შექმნან

თინეიჯერების უსაფრთხოების პოლიტიკების ნაკრები მოთხოვნების ფორმატში gpt-oss-safeguard-ისთვის

იტვირთება…

დღეს ვაქვეყნებთ მოთხოვნებზე დაფუძნებულ უსაფრთხოების პოლიტიკებს⁠(იხსნება ახალ ფანჯარაში), რათა დეველოპერებს დავეხმაროთ თინეიჯერებისთვის ასაკის შესაბამისი დაცვის მექანიზმების შექმნაში. ეს პოლიტიკები შექმნილია იმისთვის, რომ იმუშაოს ჩვენს ღია წონებიან უსაფრთხოების მოდელთან, gpt-oss-safeguard⁠(იხსნება ახალ ფანჯარაში)-თან, და ამარტივებს იმას, თუ როგორ გადააქვთ დეველოპერებს უსაფრთხოების მოთხოვნები რეალურ სისტემებში გამოსაყენებელ კლასიფიკატორებად.

ჩვენ ღია წონებიანი მოდელები გამოვაქვეყნეთ, რათა გავხადოთ ძლიერი AI-ზე წვდომა უფრო დემოკრატიული და ხელი შევუწყოთ ფართო ინოვაციას. ამავე დროს, გვჯერა, რომ უსაფრთხოება და ინოვაცია ერთმანეთთან მჭიდროდ არის დაკავშირებული და რომ დეველოპერებს უნდა ჰქონდეთ წვდომა როგორც ძლიერ მოდელებზე, ისე იმ ინსტრუმენტებსა და პოლიტიკებზე, რომლებიც მათ უსაფრთხოდ და პასუხისმგებლობით დანერგვაში დაეხმარება. ეს პოლიტიკები შევიმუშავეთ იმისთვის, რომ დეველოპერებს დავხმარებოდით ახალგაზრდა მომხმარებლების დაცვის უსაფრთხოების ძალისხმევაში, სანდო გარე ორგანიზაციების, მათ შორის Common Sense Media⁠(იხსნება ახალ ფანჯარაში)-სა და everyone.ai⁠(იხსნება ახალ ფანჯარაში)-ს, მონაწილეობით.

ვაღიარებთ, რომ თინეიჯერებსა და ზრდასრულებს განსხვავებული საჭიროებები აქვთ და რომ თინეიჯერებს დამატებითი დაცვა სჭირდებათ. ეს პოლიტიკები შექმნილია იმისთვის, რომ დეველოპერებმა ეს განსხვავებები გაითვალისწინონ და შექმნან გამოცდილებები, რომლებიც ერთდროულად გაძლიერებაზეც არის მიმართული და ახალგაზრდა მომხმარებლებისთვის შესაფერისიცაა.

ჩვენი უფრო ფართო საქმიანობის გაგრძელება ახალგაზრდების დასაცავად

ჩვენ დიდი ხანია ერთგულნი ვართ ისეთი AI-ის შექმნისა, რომელიც ახალგაზრდებისთვის შესაძლებლობებს აფართოებს და ამასთან უსაფრთხოდ იცავს მათ. ამ სამუშაოს ფარგლებში განვაახლეთ ჩვენი მოდელის სპეციფიკაცია⁠(იხსნება ახალ ფანჯარაში) — მითითებები, რომლებიც OpenAI-ის მოდელების სასურველ ქცევას განსაზღვრავს — რათა მასში შეგვეტანა 18 წლამდე (U18) პრინციპები⁠(იხსნება ახალ ფანჯარაში), და დავამატეთ პროდუქტის დონის დამცავი მექანიზმები, როგორიცაა მშობელთა კონტროლი⁠ და ასაკის პროგნოზირება⁠, რათა უკეთ დავიცვათ ახალგაზრდა მომხმარებლები. ასევე მოვუწოდეთ ინდუსტრიას მასშტაბური დაცვის მექანიზმების დანერგვისკენ ჩვენი Teen Safety Blueprint⁠-ის მეშვეობით.

დღევანდელი გამოშვება ამ საფუძველს ეყრდნობა. ამ უსაფრთხოების პოლიტიკებს დეველოპერებისთვის ხელმისაწვდომს ვხდით, რათა თინეიჯერებისთვის უსაფრთხოების მექანიზმების დანერგვაში დავეხმაროთ და ღია წონების ეკოსისტემაში წვდომის დემოკრატიზაციასაც შევუწყოთ ხელი.

თინეიჯერთა უსაფრთხოების გადაქცევა მკაფიო და გამოსადეგ პოლიტიკებად

მიუხედავად იმისა, რომ უსაფრთხოების კლასიფიკატორებს, როგორიცაა gpt-oss-safeguard, შეუძლიათ მავნე შინაარსის აღმოჩენა, ისინი დამოკიდებულია მკაფიო განსაზღვრებებზე იმისა, თუ რას წარმოადგენს ეს შინაარსი. პრაქტიკაში, ერთ-ერთი ყველაზე დიდი სირთულე, რომელსაც დეველოპერები აწყდებიან, არის ისეთი პოლიტიკების განსაზღვრა, რომლებიც ზუსტად ასახავს თინეიჯერებისთვის სპეციფიკურ რისკებს და რეალურ სისტემებში თანმიმდევრულად შეიძლება იქნას გამოყენებული.

გამოცდილ გუნდებსაც კი ხშირად უჭირთ მაღალი დონის უსაფრთხოების მიზნების ზუსტ, ოპერაციულ წესებად გარდაქმნა, განსაკუთრებით იმიტომ, რომ ამას როგორც საგნობრივი ექსპერტიზა, ისე AI-ის ღრმა ცოდნა სჭირდება. ამან შეიძლება გამოიწვიოს დაცვის ხარვეზები, არათანმიმდევრული აღსრულება ან ზედმეტად ფართო ფილტრაცია. მკაფიო და კარგად განსაზღვრული პოლიტიკები ეფექტიანი უსაფრთხოების სისტემების კრიტიკულად მნიშვნელოვანი საფუძველია.

დეველოპერებისთვის თინეიჯერთა უსაფრთხოების პრაქტიკაში დანერგვაში დახმარება

ამ გამოწვევის საპასუხოდ, ვაქვეყნებთ უსაფრთხოების პოლიტიკების⁠(იხსნება ახალ ფანჯარაში) ნაკრებს, რომელიც მორგებულია თინეიჯერების წინაშე არსებულ გავრცელებულ რისკებზე და ეყრდნობა არსებული კვლევის საფუძვლიან განხილვას თინეიჯერების უნიკალური განვითარების განსხვავებების შესახებ. ეს პოლიტიკები მოთხოვნების სახით არის სტრუქტურირებული და მათი პირდაპირ გამოყენება შესაძლებელია gpt-oss-safeguard⁠(იხსნება ახალ ფანჯარაში)-თან და სხვა მსჯელობის მოდელებთან, რაც დეველოპერებს საშუალებას აძლევს უფრო მარტივად გამოიყენონ თანმიმდევრული უსაფრთხოების სტანდარტები თავიანთ სისტემებში.

საწყისი გამოშვება მოიცავს პოლიტიკებს, რომლებიც ფარავს:

ძალიან გრაფიკულ ძალადობრივ შინაარსს
ძალიან გრაფიკულ სექსუალურ შინაარსს
საზიანო სხეულის იდეალებსა და ქცევებს
საშიშ აქტივობებსა და გამოწვევებს
რომანტიკულ ან ძალადობრივ როლურ თამაშს
ასაკობრივად შეზღუდულ საქონელსა და მომსახურებებს

ამ პოლიტიკების გამოყენება შესაძლებელია როგორც რეალურ დროში შინაარსის ფილტრაციისთვის, ასევე მომხმარებლის მიერ შექმნილი შინაარსის ოფლაინ ანალიზისთვის.

როდესაც პოლიტიკები მოთხოვნების სახით არის სტრუქტურირებული, დეველოპერებს შეუძლიათ ისინი უფრო მარტივად ჩასვან არსებულ სამუშაო პროცესებში, მოარგონ თავიანთ გამოყენების შემთხვევებს და დროთა განმავლობაში განავითარონ.

დიაგრამა, რომელიც ასახავს მოზარდების უსაფრთხოების პოლიტიკის კატეგორიებს და მოზარდებთან დაკავშირებულ კონტენტს, რომელიც მიეწოდება GPT-OSS safeguard სისტემას და წარმოქმნის შიდა მსჯელობაზე დაფუძნებულ პოლიტიკის გადაწყვეტილებებს.

შემუშავებულია გარე ექსპერტების მონაწილეობით

ამ პოლიტიკების შემუშავებისას ვიმუშავეთ გარე ორგანიზაციებთან, მათ შორის Common Sense Media⁠(იხსნება ახალ ფანჯარაში)-სა და everyone.ai⁠(იხსნება ახალ ფანჯარაში)-სთან. მათმა ექსპერტიზამ დაგვეხმარა დასაფარი შინაარსის მასშტაბის განსაზღვრაში, მოთხოვნების სტრუქტურის გამყარებაში და იმ სასაზღვრო შემთხვევების დახვეწაში, რომლებიც მათი შეფასებისას უნდა გავითვალისწინოთ.

ეს სამუშაო ასახავს მუდმივ ძალისხმევას, ვითანამშრომლოთ ექსპერტებთან და უფრო ფართო ეკოსისტემასთან, რათა გავაუმჯობესოთ, თუ როგორ უჭერენ AI სისტემები მხარს ახალგაზრდებს.

„თინეიჯერებისთვის AI უსაფრთხოებაში ერთ-ერთი ყველაზე დიდი ხარვეზი ის იყო, რომ დეველოპერებს არ ჰქონდათ მკაფიო, ოპერაციული პოლიტიკები, რომლებზეც ააგებდნენ თავიანთ სისტემებს. ხშირ შემთხვევაში, დეველოპერები ნულიდან იწყებენ. ეს მოთხოვნებზე დაფუძნებული პოლიტიკები ეკოსისტემის მასშტაბით უსაფრთხოების მნიშვნელოვან საწყის ზღვარს ამყარებს და, რადგან ისინი ღია წყაროს სახით ქვეყნდება, დროთა განმავლობაში მათი მორგება და გაუმჯობესება შესაძლებელია. გვახარებს, რომ ამგვარი ინფრასტრუქტურა ფართოდ ხელმისაწვდომი ხდება და ვიმედოვნებთ, რომ ეს მთელ ინდუსტრიაში ახალგაზრდების უსაფრთხოების უფრო მეტი საერთო საწყისი წერტილის შექმნას წაახალისებს.“

—Robbie Torney, AI-ისა და ციფრული შეფასებების ხელმძღვანელი, Common Sense Media

„ასეთი ძალისხმევა, რომელიც ახალგაზრდების უსაფრთხოების პოლიტიკებს უფრო ოპერაციულს ხდის, ფასეულია, რადგან იგი ეხმარება ექსპერტული ცოდნის გადატანას მითითებებად, რომელთა გამოყენებაც რეალურ სისტემებში შეიძლება. შინაარსის პოლიტიკები მნიშვნელოვანი პირველი ნაბიჯია და ამასთან ხსნის გზას უფრო ფართო მუშაობისთვის იმაზე, თუ როგორ შეიძლება მოდელის ქცევამ დროთა განმავლობაში ახალგაზრდებისთვის რელევანტური რისკები ჩამოაყალიბოს. ამ სამუშაოთი და ჩვენი საკუთარი კვლევით შთაგონებულმა everyone.ai⁠(იხსნება ახალ ფანჯარაში)-მაც შექმნა ქცევითი პოლიტიკის საწყისი ვერსია, რომელიც ისეთ რისკებზეა ფოკუსირებული, როგორიცაა ექსკლუზიურობა და ზედმეტი დამოკიდებულება.“

—Dr. Mathilde Cerioli, everyone.AI-ის მთავარი მეცნიერი

საწყისი წერტილი და არა სრული გადაწყვეტა

ეს პოლიტიკები განკუთვნილია როგორც საწყისი წერტილი და არა როგორც თინეიჯერთა უსაფრთხოების ამომწურავი ან საბოლოო განსაზღვრება თუ გარანტია. თითოეულ აპლიკაციას აქვს უნიკალური რისკები, აუდიტორიები და კონტექსტები, და სწორედ დეველოპერებს აქვთ საუკეთესო შესაძლებლობა გაიგონ, რა რისკები შეიძლება წარმოიშვას მათი პროდუქტებისა და AI ინტეგრაციებისგან. მკაცრად მოვუწოდებთ დეველოპერებს, რომ ეს პოლიტიკები თავიანთ სპეციფიკურ საჭიროებებს მოარგონ და გააფართოონ, ასევე შეუთავსონ სხვა დამცავ მექანიზმებს, როგორიცაა პროდუქტის დიზაინის გადაწყვეტილებები, მომხმარებლის კონტროლი, თინეიჯერებისთვის გასაგები გამჭვირვალობა, მონიტორინგის სისტემები და გააზრებული, ასაკის შესაბამისი რეაგირება.

გვჯერა, რომ უფრო უსაფრთხო AI სისტემების შესაქმნელად აუცილებელია დაცვის მრავალშრიანი სიღრმისეული დაცვა⁠⁠ მიდგომა. ეს პოლიტიკები ჩვენს შიდა გამოცდილებას ეყრდნობა, თუმცა ისინი არ ასახავს OpenAI-ის შიდა პოლიტიკებისა და დამცავი მექანიზმების სრულ მასშტაბს.

შემდეგი გზა

ჩვენ ამ პოლიტიკებს ღია წყაროს სახით ვაქვეყნებთ ROOST Model Community⁠(იხსნება ახალ ფანჯარაში)-ის მეშვეობით, რათა ხელი შევუწყოთ თანამშრომლობასა და გაუმჯობესებას. წვლილის შესატანად, უკუკავშირის მოსაწოდებლად ან თინეიჯერთა უსაფრთხოების დამატებითი პოლიტიკების გასაზიარებლად ეწვიეთ RMC GitHub რეპოზიტორიუმს.⁠(იხსნება ახალ ფანჯარაში)

დეველოპერებსა და ორგანიზაციებს შეუძლიათ ეს პოლიტიკები თავიანთ კონკრეტულ აპლიკაციებს მოარგონ, სხვადასხვა ენაზე თარგმნონ და დამატებითი რისკის სფეროებიც დაამატონ. დროთა განმავლობაში, იმედი გვაქვს, ეს ხელს შეუწყობს AI სისტემებში უსაფრთხოების პოლიტიკების დანერგვის უფრო მძლავრი და საერთო საფუძვლის შექმნას.

gpt-oss-safeguard-ით დასაწყებად, ჩამოტვირთეთ ის Hugging Face⁠(იხსნება ახალ ფანჯარაში)-დან.

განაგრძეთ კითხვა

ყველას ნახვა

უსაფრთხოება და თანხვდომილობა გრძელჰორიზონტიანი მოდელების ეპოქაში

უსაფრთხოება20 ივლ. 2026

Why teens deserve access to safe AI — card image

რატომ იმსახურებენ მოზარდები უსაფრთხო ხელოვნურ ინტელექტზე წვდომას

უსაფრთხოება16 ივლ. 2026

GPT-Red: თვითგაუმჯობესება სიმტკიცისთვის

უსაფრთხოება15 ივლ. 2026