Pasar al contenido principal
OpenAI

19 de mayo de 2024

Producto

Cómo se eligieron las voces de ChatGPT

Asset > How the voices for ChatGPT were chosen

Actualización del 22 de mayo de 2024: Queremos brindar más información sobre el calendario, por lo que lo hemos actualizado con hitos y fechas adicionales, incluido el contacto inicial de Sam con la Sra. Johansson.

Una declaración de nuestro director ejecutivo, Sam Altman realizada el 20 de mayo de 2024: “La voz de Sky no es la de Scarlett Johansson, y nunca pretendimos que se pareciera. Elegimos a la actriz de doblaje de la voz de Sky antes de tener algún contacto con la Sra. Johansson. Por respeto a la Sra. Johansson, hemos dejado de utilizar la voz de Sky en nuestros productos. Nos disculpamos con la Sra. Johansson por no haber tenido una mejor comunicación”.

El Modo de voz es una de las principales funciones de ChatGPT. Cada una de las cinco voces que se escuchan han sido cuidadosamente seleccionadas mediante un exhaustivo proceso de cinco meses con actores de doblaje profesionales, agencias de talentos, directores de reparto y asesores del sector. Compartimos más información sobre cómo se eligieron las voces.

En septiembre de 2023, presentamos funciones de voz para que los usuarios tuvieran otra forma de interactuar con ChatGPT. Desde entonces, nos alegra ver cómo los usuarios han respondido a esta función y a las voces individuales. Cada una de las voces, Breeze, Cove, Ember, Juniper y Sky, son muestras de actores de doblaje con los que colaboramos para crearlas.

Apoyamos a la comunidad creativa y colaboramos con el sector del doblaje

Apoyamos a la comunidad creativa y trabajamos en estrecha colaboración con el sector del doblaje para asegurarnos de que estábamos tomando las medidas adecuadas para elegir las voces de ChatGPT. Cada actor recibe una remuneración superior a la del mercado, y así seguirá mientras se utilicen sus voces en nuestros productos.

Creemos que las voces de IA no deben imitar intencionalmente la voz distintiva de un famoso: la voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a otra actriz profesional que utiliza su propia voz natural. No podemos compartir los nombres de nuestros actores para proteger su privacidad.

Trabajamos con directores de reparto y productores reconocidos para crear los criterios de las voces

A principios de 2023, para identificar a nuestros actores de doblaje, tuvimos el privilegio de trabajar con directores de reparto y productores independientes reconocidos y galardonados. Trabajamos con ellos con el fin de crear una serie de criterios para las voces de ChatGPT. Para ello, consideramos cuidadosamente la personalidad única de cada voz y su atractivo para el público a nivel mundial.

Estas fueron algunas de las características que se incluyeron:

  • Actores de diversos orígenes o que pudieran hablar varios idiomas.
  • Voces que se sintieran atemporales.
  • Voces cercanas que inspiraran confianza.
  • Voces cálidas, atractivas, carismáticas y que inspiraran confianza, con tonos claros.
  • Voces que fueran naturales y agradables de escuchar

Recibimos más de 400 solicitudes de actores de doblaje y de cine.

El 10 de mayo de 2023, la agencia de reparto y nuestros directores de reparto hicieron una convocatoria de talentos. En menos de una semana, recibieron más de 400 solicitudes de actores de doblaje y de cine. Para la audición, los actores recibieron un guion de respuestas de ChatGPT y se les pidió que las grabaran. Estas muestras abarcaban desde responder a preguntas sobre conciencia plena hasta aportar ideas sobre planes de viaje, e incluso entablar conversaciones sobre el día a día de un usuario.

Seleccionamos cinco voces finales y debatimos con los actores nuestra visión sobre las interacciones entre humanos y la IA y los objetivos del Modo de voz

Durante mayo de 2023, el equipo de reparto revisó de forma independiente y seleccionó cuidadosamente una lista inicial de 14 actores. Perfeccionaron aún más su lista antes de presentar a OpenAI sus principales voces para el proyecto.

Hablamos con cada uno de los actores sobre la visión de las interacciones de voz entre humanos y la IA y sobre OpenAI, y debatimos las capacidades, las limitaciones y los riesgos de la tecnología, así como las medidas de seguridad que implementamos. Para nosotros era importante que cada actor comprendiera el alcance y las intenciones del Modo de voz antes de comprometerse con el proyecto.

Un equipo interno de OpenAI revisó las voces desde el punto de vista del producto y de la investigación y, tras un cuidadoso examen, se seleccionaron finalmente las voces para Breeze, Cove, Ember, Juniper y Sky.

Cada actor voló a San Francisco para las sesiones de grabación y sus voces se lanzaron en ChatGPT en septiembre de 2023

Durante los meses de junio y julio, los actores volaron a San Francisco para asistir a las sesiones de grabación y a las reuniones en persona con los equipos de producto e investigación de OpenAI.

El 11 de septiembre de 2023, Sam habló con la Sra. Johansson y su equipo para analizar su posible participación como actriz para la sexta voz de ChatGPT, junto con las otras cinco voces, incluida Sky. Una semana más tarde, rechazó amablemente la propuesta a través de su agente.

El 25 de septiembre de 2023, lanzamos las voces en ChatGPT.

Todo este proceso supuso una amplia coordinación con los actores y el equipo de reparto, que se prolongó durante cinco meses. Seguimos colaborando con los actores, que han aportado mucho en la investigación de audio y las nuevas funciones de voz en GPT‑4o.

El 10 de mayo de 2024, Sam se puso en contacto con el equipo de la Sra. Johansson para informarles sobre nuestro próximo lanzamiento de GPT‑4o y le preguntó si podría reconsiderar sumarse al equipo como la sexta voz en ChatGPT.

GPT-4o incorpora un nuevo Modo de voz para los usuarios que pagan, con voces nuevas

El 13 de mayo de 2024 presentamos GPT‑4o. Tenemos previsto otorgar el acceso a un nuevo Modo de voz para GPT‑4o(se abre en una nueva ventana) como versión alfa a los usuarios de ChatGPT Plus en las próximas semanas. Con GPT‑4o, utilizar la voz para interactuar con ChatGPT es mucho más natural. GPT‑4o maneja las interrupciones sin problemas, gestiona las conversaciones en grupo con eficacia, filtra el ruido de fondo y se adapta al tono.

Desde el 15 de mayo de 2024, hemos mantenido conversaciones con el equipo de la Sra. Johansson para tratar sus inquietudes sobre Sky. Por respeto a sus inquietudes, hemos suspendido el uso de Sky en nuestros productos a partir del 19 de mayo de 2024.

De cara al futuro, los usuarios pueden esperar aún más opciones, ya que tenemos pensado introducir más voces en ChatGPT para ajustarnos mejor a los diversos intereses y preferencias de los usuarios.

Autores

OpenAI