Ir al contenido principal
OpenAI

19 de mayo de 2024

Producto

Cómo se escogieron las voces para ChatGPT

Asset > How the voices for ChatGPT were chosen

Actualización del 22 de mayo de 2024: queremos ofrecer información adicional sobre el marco temporal, por lo que hemos añadido hitos y fechas, incluido el contacto inicial de Sam con la Sra. Johansson.

Declaración de nuestro CEO, Sam Altman, el 20 de mayo de 2024: «La voz de Sky no es la de Scarlett Johansson y la intención nunca fue que se pareciera a la suya. Seleccionamos a la actriz de doblaje tras la voz de Sky antes de contactar con la Sra. Johansson. Por respeto hacia ella, hemos interrumpido el uso de la voz de Sky en nuestros productos. Lamentamos por ella que la comunicación no fuera mejor».

El modo de voz es una de las funciones más apreciadas de ChatGPT. Cada una de las cinco voces distintas que oyes ha sido seleccionada mediante un amplio proceso que duró cinco meses y en el que participaron actores profesionales de doblaje, agencias de contratación, directores de casting y asesores del sector. Te explicamos más sobre cómo se escogieron las voces.

En septiembre de 2023, incorporamos las funciones de voz para ofrecer a los usuarios otro modo de interactuar con ChatGPT. Desde entonces, estamos muy motivados por la forma en que los usuarios han reaccionado a esta función y a las voces en particular. Cada una de las voces, Breeze, Cove, Ember, Juniper y Sky, son muestras de los actores de doblaje con los que nos asociamos para crearlas.

Respaldamos a la comunidad creativa y colaboramos con el sector de la interpretación vocal

Respaldamos a la comunidad creativa y trabajamos en estrecha colaboración con el sector de la interpretación vocal para asegurarnos de que adoptábamos las medidas adecuadas a la hora de seleccionar las voces de ChatGPT. Cada actor recibe una remuneración que supera las mejores tarifas del mercado y esto continuará siendo así mientras sus voces se usen en nuestros productos.

Creemos que las voces de la IA no deberían simular a propósito la voz específica de una celebridad: la voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a otra actriz profesional que emplea su propio tono de voz natural. Por motivos de privacidad, no podemos compartir los nombres de nuestros talentos vocales.

Cooperamos con directores de casting y productores galardonados para crear los criterios de las voces

A principios de 2023, a fin de escoger a los actores de doblaje, tuvimos el honor de cooperar con directores de casting y productores independientes, célebres y premiados. Trabajamos con ellos para crear un conjunto de criterios para las voces de ChatGPT, prestando especial atención a la personalidad singular de cada voz y su atractivo para el público de todo el mundo.

Las siguientes eran algunas de estas características:

  • actores de diversos orígenes o que pudieran hablar varios idiomas
  • una voz que pareciera atemporal
  • una voz cercana que inspirara confianza
  • una voz cálida, entrañable, que inspirara confianza, carismática y de tono pleno
  • natural y fácil de escuchar

Recibimos más de 400 candidaturas de actores de doblaje y de cine

El 10 de mayo de 2023, la agencia y nuestros directores de casting publicaron una convocatoria de actores. En menos de una semana, recibimos más de 400 candidaturas de actores de doblaje y de cine. Para la audición, se entregó a los actores un guion de respuestas de ChatGPT y se les pidió que las grabaran. Estas muestras iban desde la respuesta a preguntas acerca de mindfulness hasta una lluvia de ideas sobre planes de viaje e, incluso, participar en conversaciones relativas al día de un usuario.

Seleccionamos las cinco voces finales y debatimos con los actores nuestra visión de las interacciones entre un humano y la IA, así como los objetivos del modo de voz

En mayo de 2023, el equipo de casting examinó y seleccionó de manera independiente una lista inicial de 14 actores. Siguieron puliendo la lista antes de presentar las mejores voces para el proyecto a OpenAI.

Hablamos con cada actor acerca de la idea de las interacciones vocales entre un humano y la IA y OpenAI, y debatimos las funciones de la tecnología, sus limitaciones y los riesgos que implica, así como las medidas de seguridad que hemos adoptado. Era importante para nosotros que todos los actores entendieran el alcance y los objetivos del modo de voz antes de comprometerse con el proyecto.

Un equipo interno de OpenAI examinó las voces desde el punto de vista del producto y la investigación y, tras un minucioso análisis, se seleccionaron finalmente las voces de Breeze, Cove, Ember, Juniper y Sky.

Los actores volaron a San Francisco para las sesiones de grabación y sus voces se integraron a ChatGPT en septiembre de 2023

Durante junio y julio, llevamos a los actores a San Francisco para las sesiones de grabación y las reuniones presenciales con los equipos de producto e investigación de OpenAI.

El 11 de septiembre de 2023, Sam habló con la Sra. Johansson y su equipo para analizar su posible participación como sexta actriz de doblaje para ChatGPT, junto con las otras cinco voces, incluida Sky. La Sra. Johansson rechazó educadamente la oportunidad una semana después a través de su agente.

El 25 de septiembre de 2023, incorporamos las voces a ChatGPT.

Todo el proceso implicó una amplia coordinación con los actores y el equipo de casting y duró cinco meses. Seguimos colaborando con los actores, que han contribuido con más trabajo en la investigación de audio y las nuevas funciones de voz de GPT‑4o.

El 10 de mayo de 2024, Sam contactó con el equipo de la Sra. Johansson para informarle de nuestro siguiente lanzamiento de GPT‑4o y pedirle que reconsiderara unirse como futura voz adicional en ChatGPT.

El nuevo modo de voz llega a GPT-4o para los usuarios de pago y se añaden nuevas voces

El 13 de mayo de 2024, presentamos GPT‑4o. Prevemos dar acceso a un nuevo modo de voz para GPT‑4o(se abre en una ventana nueva) en alfa a los usuarios de ChatGPT Plus durante las próximas semanas. Con GPT‑4o, usar tu voz para interactuar con ChatGPT es mucho más natural. GPT‑4o resuelve las interrupciones de forma más fluida, gestiona las conversaciones de grupo de manera eficiente, filtra el ruido ambiental y se adapta al tono.

Desde el 15 de mayo de 2024, hemos mantenido conversaciones con el equipo de la Sra. Johansson para debatir su preocupación por Sky. Dado que respetamos su inquietud, hemos interrumpido el uso de Sky en nuestros productos desde el 19 de mayo de 2024.

En el futuro, tendrás incluso más opciones, pues esperamos introducir voces adicionales en ChatGPT para satisfacer la diversidad de intereses y preferencias de nuestros usuarios.

Autores

OpenAI