ChatGPT 소비자 요금제에서 연령 예측 기능을 출시하여 계정이 18세 미만 사용자에게 속할 가능성이 있는지 판단하고, 청소년에게 적절한 경험과 보호 조치를 적용하려고 합니다. 청소년 안전 청사진과 18세 미만을 위한 모델 행동 원칙에서 설명했듯이, 청소년은 기회를 확장하면서도 웰빙을 보호하는 기술을 누릴 자격이 있습니다.
연령 예측은 이미 마련된 보호 조치를 기반으로 합니다. 가입 시 18세 미만이라고 알린 청소년은 민감하거나 잠재적으로 유해한 콘텐츠에 대한 노출을 줄이기 위해 자동으로 추가 보호 조치를 받습니다. 이는 또한 안전을 전제로, 성인에게는 성인에 맞는 경험을 제공하고 원하는 방식으로 도구를 사용할 수 있게 해줍니다.
이전에 연령 예측에 대한 초기 계획을 공유한 바 있으며, 오늘 출시가 진행됨에 따라 더 자세한 내용을 공유하고자 합니다.
ChatGPT는 연령 예측 모델을 사용하여 계정이 18세 미만인지 여부를 추정합니다. 이 모델은 계정 생성 후 경과 기간, 주로 활동하는 시간대, 시간에 따른 사용 패턴, 사용자가 제공한 연령 등 행동 신호와 계정 수준 신호를 종합적으로 고려합니다. 연령 예측을 배포하면 어떤 신호가 정확도를 높이는지 학습할 수 있으며, 이러한 학습을 통해 시간이 지남에 따라 모델을 지속적으로 개선할 수 있습니다.
18세 미만 환경으로 잘못 분류된 사용자는 보안 신원 확인 서비스인 Persona를 통해 셀카로 연령을 빠르고 간단하게 확인하고 전체 액세스를 복구할 수 있습니다. 사용자는 설정 > 계정으로 이동하여 계정에 보호 조치가 추가되었는지 확인하고 언제든지 이 절차를 시작할 수 있습니다.
연령 예측 모델이 계정이 18세 미만일 가능성이 있다고 판단하면, ChatGPT는 다음과 같은 민감한 콘텐츠 노출을 줄이기 위한 추가 보호 조치를 자동으로 적용합니다.
- 노골적인 폭력 묘사 또는 유혈이 낭자한 콘텐츠
- 미성년자에게 위험하거나 해로운 행동을 부추길 수 있는 유행 챌린지
- 성적, 로맨틱, 또는 폭력적 역할극
- 자해 묘사
- 극단적인 미의 기준, 건강에 해로운 다이어트 또는 신체 비하를 조장하는 콘텐츠
이 접근 방식은 전문가의 자문을 바탕으로 하며 아동 발달 과학에 관한 학술 문헌에 근거하고, 위험 인식, 충동 조절, 또래 영향, 감정 조절에서 나타나는 청소년의 특성을 고려합니다. 이러한 콘텐츠 제한은 청소년의 민감한 자료 노출을 줄이는 데 도움이 되지만, 특히 보호 장치를 우회하려는 시도를 대응하기 위해 지속적으로 보호를 개선하는 데 집중하고 있습니다. 연령에 대해 확신이 없거나 정보가 불완전한 경우에는 더 안전한 경험을 기본값으로 적용합니다.
이러한 보호 조치 외에도 보호자는 ChatGPT를 사용할 수 없는 조용한 시간 설정, 메모리나 모델 학습과 같은 기능 제어, 급성 스트레스 징후가 감지될 경우 알림 수신 등 보호자 제어(새 창에서 열기)를 통해 청소년의 경험을 추가로 맞춤 설정할 수 있습니다.
우리는 초기 출시에서 얻은 학습을 바탕으로 연령 예측의 정확도를 지속적으로 개선하고 있습니다. 출시 과정을 면밀히 추적하고 해당 신호를 활용해 지속적인 개선을 진행할 것입니다.
EU에서는 지역별 요구사항을 반영하기 위해 앞으로 몇 주 안에 연령 예측 기능이 출시될 예정입니다. 자세한 내용은 도움말 페이지(새 창에서 열기)를 참고하세요.
이는 중요한 이정표이지만, 청소년 안전을 지원하기 위한 작업은 계속됩니다. 미국심리학회, ConnectSafely, Global Physicians Network를 포함한 전문가들과의 대화를 통해 진행 상황과 학습 내용을 계속 공유할 예정입니다.


