メインコンテンツにスキップ
OpenAI

2024年5月19日

製品

ChatGPTの音声はどのように選ばれたか

Asset > How the voices for ChatGPT were chosen

2024年5月22日更新:タイムラインに関する追加情報を提供するため、サムからヨハンソン氏への最初のオファーを含め、マイルストーンと日付を追加してタイムラインを更新しました。

当社の CEO、サム・アルトマンの声明、2024年5月20日:「Sky の声はスカーレット・ヨハンソン氏のものではなく、似せるつもりもありませんでした。ヨハンソン氏に接触する前に、Sky の声を担当する声優をキャスティングしました。ヨハンソン氏に対する敬意から、Sky の声を製品に使用することを中止しました。ヨハンソン氏にうまく伝えられなかったことを申し訳なく思っています」

Voice Mode は ChatGPT で最も愛されている機能の一つです。プロの声優、タレント事務所、キャスティングディレクター、業界アドバイザーが関与し、5か月間にわたる大規模なプロセスを経て、5つの個性的な声が厳選されました。声がどのように選ばれたかについて、さらに詳しくお伝えします。

2023年9月、当社はユーザーが ChatGPT と対話するための別の方法を提供するために音声機能を導入しました。それ以来、この機能や音声に対するユーザーの反応に私たちは勇気づけられています。Breeze、Cove、Ember、Juniper、Sky の各音声は、当社が提携した声優からサンプリングして作成したものです。

当社はクリエイティブなコミュニティを支援しており、声優業界と連携しました

当社はクリエイティブなコミュニティを支援しており、声優業界と緊密に連携することで、ChatGPT の声をキャスティングするための適切な手順を確実に実行できるようにしました。各声優は市場最高水準を上回る報酬を受け取っており、これは彼らの声が当社の製品に使用される限り継続されます。

AI の音声は有名人の特徴的な声を意図的に模倣すべきではないと私たちは考えています。Sky の声はスカーレット・ヨハンソンの真似ではなく、別のプロの女優のものであり、彼女自身の自然な話し声を使っています。プライバシー保護のため、声優の名前を公開することはできません。

受賞歴のあるキャスティングディレクターやプロデューサーと提携して声の基準を作成しました

2023年初頭、声優を選定するために、私たちは受賞歴のある著名なフリーランスのキャスティングディレクターやプロデューサーと提携する機会に恵まれました。彼らと協力し、それぞれの声のユニークな個性と世界中のオーディエンスへの魅力を慎重に検討し、ChatGPT の声の基準を作成しました。

その基準には次のような要素が含まれています。

  • 多様な背景を持つ、または複数の言語を話せる俳優
  • 時代に左右されない声
  • 信頼感を与える親しみやすい声
  • 温かみがあり、魅力的で、安心感のある、豊かなトーンのカリスマ的な声
  • 自然で聞きやすい

声優や映画俳優から400件以上の応募がありました

2023年5月10日、キャスティング代行会社と当社のキャスティングディレクターが人材の募集を開始しました。1週間も経たないうちに、声優や映画俳優から400件以上の応募がありました。オーディションの審査では、俳優に ChatGPT の応答の原稿が渡され、それを録音するように求められました。これらのサンプルは、マインドフルネスに関する質問に対する回答、旅行計画のブレインストーミング、ユーザーの一日の出来事に関する会話など、多岐にわたりました。

最終的に5つの声を選び、人間と AI のインタラクションに関する当社のビジョンと Voice Mode の目標について俳優たちと協議しました

2023年5月までに、キャスティングチームは独自に審査を行い、まず14人の俳優のリストを手作業で選びました。その後リストをさらに絞り込み、プロジェクトに最適な声を OpenAI に提示しました。

私たちは、人間と AI の音声による対話と OpenAI のビジョンについて各俳優と話し、テクノロジーの能力、限界、関連するリスク、そして私たちが実装した安全対策について話し合いました。重要なのは、各俳優がプロジェクトに参加する前に Voice Mode のスコープと意図を理解することでした。

OpenAI の社内チームが製品と研究の観点から声を審査し、慎重に検討した結果、最終的に Breeze、Cove、Ember、Juniper、Sky の音声が選択されました。

各俳優はレコーディングセッションのためにサンフランシスコに飛び、彼らの声は2023年9月に ChatGPT で公開されました

6月と7月にかけて、俳優たちをサンフランシスコに派遣し、レコーディングセッションや OpenAI の製品および研究チームとの直接ミーティングを行いました。

2023年9月11日、サムはヨハンソン氏とそのチームと話をし、Sky を含む他の5名の声優とともに、ChatGPT の6人目の声優として彼女が参加する可能性について協議しました。彼女は1週間後、エージェントを通じてその機会を丁重に辞退しました。

2023年9月25日、当社は彼らの声を ChatGPT に導入しました。

このプロセス全体は、俳優やキャスティングチームとの綿密な調整を伴い、5か月以上にわたって行われました。私たちは、俳優たちと引き続き連携しており、彼らは GPT‑4o の音声研究と新しい音声機能のための追加作業に貢献してくれています。

2024年5月10日、サムはヨハンソン氏のチームに連絡を取り、間近に迫った GPT‑4o のローンチについて知らせるとともに、ChatGPT の将来の追加の声優として参加することを再検討していただけないか打診しました。

GPT-4o に有料ユーザー向けの新しいVoice Modeが登場、新しい音声が追加されます

2024年5月13日、GPT‑4o をリリースしました。今後数週間以内に、ChatGPT Plus ユーザー向けにアルファ版の新しい GPT‑4o 用 Voice Mode(新しいウィンドウで開く) へのアクセスを提供する予定です。GPT‑4o⁠ を使用すると、自分の声を使って ChatGPT とより自然に対話できるようになります。GPT‑4o は、中断をスムーズに処理し、グループ会話の効果的な管理、バックグラウンドノイズの除去、トーンへの適応が可能です。

2024年5月15日以来、当社はヨハンソン氏のチームと Sky に関する懸念について話し合いを重ねてきました。彼女の懸念を尊重し、2024年5月19日をもって当社製品における Sky の使用を中止しました。

今後、ChatGPTでは、さらに多くのオプションをご利用いただけるよう、ユーザーの多様な関心や嗜好によりマッチした音声を導入していく予定です。

著者

OpenAI