Ділимося новинами про оновлення нашої специфікації моделі — письмового набору правил, цінностей та поведінкових очікувань, які визначають, як ми хочемо, щоб наші моделі ШІ поводилися, особливо у складних чи критичних ситуаціях, з новими принципами взаємодії з особами віком до 18 років (U18)(відкривається у новому вікні). Поведінка моделі є критично важливою для взаємодії людей з ШІ, а у підлітків потреби в розвитку відрізняються від дорослих.
Принципи U18 визначають, як ChatGPT повинен забезпечувати безпечний та відповідний віку досвід взаємодії для підлітків віком від 13 до 17 років. Цей підхід, заснований на науці про розвиток, приділяє пріоритетну увагу профілактиці, прозорості та ранньому втручанню. При розробці цих принципів ми попередньо переглядали їх разом із зовнішніми експертами, у тому числі з Американської психологічної асоціації, у рамках нашої постійної роботи з отримання даних для зміцнення нашого підходу.
Хоча принципи специфікації моделі продовжують застосовуватися як до дорослих, так і до користувачів підліткового віку, це оновлення уточнює, як ці принципи застосовуються в підліткових контекстах, особливо там, де міркування безпеки для неповнолітніх можуть бути більш чітко визначені.
Принципи U18 закріплені у чотирьох керівних зобов'язаннях:
- Ставити безпеку підлітків на перше місце, навіть якщо це може суперечити іншим цілям
- Просувати підтримку в реальному світі, заохочуючи офлайн-відносини та звернення до надійних ресурсів
- Ставитися до підлітків як до підлітків — не поблажливо, але й не як до дорослих
- Зберігати прозорість дій та встановлювати чіткі очікування
Відповідно до нашого Плану безпеки підлітків, ці принципи керували нашою роботою з безпеки підлітків до сьогодні, включаючи захист контенту, який ми застосовуємо до користувачів, які повідомляють нам, що їм менше 18 років під час реєстрування, а також через батьківський контроль. У цих контекстах ми впровадили засоби захисту, щоб спрямувати модель на особливу обережність при обговоренні більш ризикованих тем, включаючи самопошкодження та самогубство, романтичні або сексуалізовані рольові ігри, графічний або відвертий контент, небезпечні дії та речовини, образ тіла та розлади харчової поведінки, а також запити зберігати таємниці про небезпечну поведінку.
Американська психологічна асоціація, яка розглядала ранній проект специфікації моделі U18 та запропонувала важливі ідеї на довгострокову перспективу, чітко вказує на важливість захисту підлітків:
«APA закликає розробників ШІ пропонувати запобіжні заходи, що відповідають віку, для молодих користувачів їх продуктів, та застосовувати більш захищений підхід для більш юних користувачів. Діти та підлітки можуть отримати користь з інструментів ШІ, якщо вони будуть збалансовані з людськими взаємодіями, які, як показує наука, мають вирішальне значення для соціального, психологічного, поведінкового та навіть біологічного розвитку. Досвід використання ШІ у молодих людей має ретельно контролюватись та обговорюватися з довіреними дорослими: важливо заохочувати критичний аналіз того, що пропонують ШІ-боти, та сприяти розвитку у молодих людей незалежного мислення та навичок.»
У цьому оновленні також уточнюється, як помічник має реагувати, коли виникають питання безпеки підлітків. Це означає, що підлітки повинні стикатися з більш жорсткими обмеженнями, безпечнішими альтернативами та заохоченням звертатися за довіреною підтримкою офлайн, коли розмови переходять у зону підвищеного ризику. За наявності неминучої загрози підліткам рекомендується звертатися до екстрених служб або ресурсів допомоги в кризових ситуаціях.
Як і решта специфікації моделі, принципи U18 відображають передбачувану поведінку моделі. Ми продовжимо їх удосконалювати на основі результатів подальших досліджень, думок експертів та реальних практичних прикладів.
Крім оновлення специфікації моделі, ми застосували багаторівневий підхід до зміцнення безпеки для підлітків у ChatGPT, охоплюючи заходи безпеки продуктів, підтримку сімей та експертне керівництво.
З моменту впровадження батьківського контролю(відкривається у новому вікні) ми розширили захист на нові продукти, включаючи групові чати, браузер ChatGPT Atlas та програму Sora. Ці оновлення допомагають батькам адаптувати досвід роботи з ChatGPT для підлітків у міру впровадження нових продуктів і функцій.
Відповідно до рекомендацій експертів, ми заохочуємо регулярне обговорення теми здорового та відповідального використання ШІ між батьками та підлітками. Для допомоги в цих обговореннях ми додали нові ресурси, які пройшли перевірку експертами, до центру ресурсів для батьків(відкривається у новому вікні): сімейний посібник із відповідального використання ШІ для підлітків(відкривається у новому вікні) та поради для батьків(відкривається у новому вікні) про те, як говорити з дітьми про ШІ. Всі матеріали були перевірені ConnectSafely та учасниками нашої Експертної ради з благополуччя та штучного інтелекту. Згодом ми продовжимо додавати нові ресурси. Ми також забезпечуємо підтримку здорового використання безпосередньо в продукті, надаючи вбудовані нагадування про перерви під час тривалих сеансів, щоб допомогти зробити час, проведений з ChatGPT, усвідомленим та збалансованим.
Наша робота в галузі безпеки підлітків ґрунтується на тісній взаємодії з експертами різних дисциплін та експертизи. У жовтні ми створили Експертну раду з благополуччя та штучного інтелекту, щоб давати рекомендації та визначати, якою має бути здорова взаємодія з ШІ для різного віку. Ця робота послужила основою для рекомендацій щодо батьківського контролю та сповіщень для батьків. Ми також залучаємо клінічних експертів через нашу глобальну мережу лікарів для обґрунтування досліджень безпеки та оцінок поведінки моделі; наприклад, таким чином ми покращили те, як ChatGPT розпізнає ознаки стресу та заохочує людей звернутися за професійною допомогою, коли це дійсно необхідно. Ми розвинули ці основи у GPT‑5.2 і також розширили доступ до реальної підтримки, надаючи локалізовані гарячі лінії у ChatGPT та Sora через наше партнерство з ThroughLine(відкривається у новому вікні).
Ми знаходимося на ранніх стадіях впровадження моделі прогнозування віку(відкривається у новому вікні) у споживчі плани ChatGPT. Це допоможе нам автоматично застосовувати заходи безпеки для підлітків, коли ми вважаємо, що обліковий запис належить неповнолітньому. Якщо ми не впевнені у віці або ми не маємо повної інформації про користувача, ми за замовчуванням надаємо досвід роботи, передбачений для користувачів віком до 18 років, даючи дорослим можливість підтвердити свій вік.
Посилення безпеки для підлітків — це постійна робота. Ми продовжуватимемо покращувати якість батьківського контролю та можливості моделей, доповнювати розділ ресурсів для батьків, співпрацювати з організаціями, дослідниками та експертами, у тому числі з Радою з благополуччя та Глобальною мережею лікарів.
Ми прагнемо створити надійні заходи захисту підлітків та покращувати їх з часом для більш якісної підтримки підлітків та їхніх близьких.


