How the voices for ChatGPT were chosen

Actualització del 22 de maig de 2024: Volem aportar informació addicional sobre la cronologia, així que l'hem actualitzada amb més fites i dates, inclòs el contacte inicial de Sam amb la Sra. Johansson.
Declaració del nostre CEO, Sam Altman, del 20 de maig de 2024: «La veu de Sky no és la de Scarlett Johansson, ni mai es va pretendre que s'assemblés a la seva. Vam contractar l'actriu de veu darrere de la veu de Sky abans de qualsevol contacte amb la Sra. Johansson. Per respecte a la Sra. Johansson, hem pausat l'ús de la veu de Sky als nostres productes. Demanem disculpes a la Sra. Johansson per no haver-nos comunicat millor.»
El mode de veu és una de les funcions més apreciades de ChatGPT. Cadascuna de les cinc veus distintives que sentiu ha estat seleccionada acuradament mitjançant un ampli procés de cinc mesos en què han participat actors de veu professionals, agències de talent, directors de càsting i assessors del sector. Compartim més detalls sobre com es van triar les veus.
El setembre de 2023, vam presentar capacitats de veu per oferir als usuaris una altra manera d'interactuar amb ChatGPT. Des de llavors, ens anima la manera com els usuaris han respost a la funció i a les veus individuals. Cadascuna de les veus —Breeze, Cove, Ember, Juniper i Sky— prové de mostres d'actors de veu amb qui vam col·laborar per crear-les.
Donem suport a la comunitat creativa i vam col·laborar amb la indústria de la interpretació de veu
Donem suport a la comunitat creativa i hem treballat estretament amb la indústria de la interpretació de veu per assegurar-nos que seguíem els passos adequats per seleccionar les veus de ChatGPT. Cada actor rep una compensació per sobre de les tarifes més altes del mercat, i això continuarà mentre les seves veus s'utilitzin als nostres productes.
Creiem que les veus d'IA no haurien d'imitar deliberadament la veu distintiva d'una celebritat: la veu de Sky no és una imitació de la de Scarlett Johansson, sinó que pertany a una altra actriu professional que utilitza la seva pròpia veu natural. Per protegir la seva privacitat, no podem compartir els noms dels nostres talents de veu.
Vam col·laborar amb directors de càsting i productors guardonats per crear els criteris de les veus
A principis de 2023, per identificar els nostres actors de veu, vam tenir el privilegi de col·laborar amb directors de càsting i productors independents, reconeguts i guardonats. Vam treballar amb ells per crear un conjunt de criteris per a les veus de ChatGPT, tenint en compte acuradament la personalitat única de cada veu i el seu atractiu per a audiències globals.
Algunes d'aquestes característiques incloïen:
- Actors de procedències diverses o que poguessin parlar diverses llengües
- Una veu amb caràcter atemporal
- Una veu propera que inspiri confiança
- Una veu càlida, atractiva, que inspiri confiança, carismàtica i amb un to ric
- Natural i fàcil d'escoltar
Vam rebre més de 400 candidatures d'actors de veu i de pantalla
El 10 de maig de 2023, l'agència de càsting i els nostres directors de càsting van fer una convocatòria de talent. En menys d'una setmana, van rebre més de 400 candidatures d'actors de veu i de pantalla. Per fer l'audició, els actors van rebre un guió de respostes de ChatGPT i se'ls va demanar que les enregistressin. Aquestes mostres anaven des de respondre preguntes sobre mindfulness fins a fer una pluja d'idees sobre plans de viatge, i fins i tot mantenir converses sobre el dia d'un usuari.
Vam seleccionar cinc veus finals i vam comentar amb els actors la nostra visió de les interaccions humà-IA i els objectius del mode de veu
Fins al maig de 2023, l'equip de càsting va revisar de manera independent i va seleccionar manualment una llista inicial de 14 actors. Després van refinar encara més la llista abans de presentar a OpenAI les veus principals per al projecte.
Vam parlar amb cada actor sobre la visió de les interaccions de veu entre humans i IA i sobre OpenAI, i vam comentar les capacitats de la tecnologia, les seves limitacions i els riscos que comporta, així com les salvaguardes que hem implementat. Per a nosaltres era important que cada actor entengués l'abast i les intencions del mode de veu abans de comprometre's amb el projecte.
Un equip intern d'OpenAI va revisar les veus des d'una perspectiva de producte i recerca i, després d'una consideració acurada, finalment es van seleccionar les veus de Breeze, Cove, Ember, Juniper i Sky.
Cada actor va viatjar a San Francisco per a sessions d'enregistrament i les seves veus es van llançar a ChatGPT el setembre de 2023
Durant el juny i el juliol, vam portar els actors a San Francisco per a sessions d'enregistrament i reunions presencials amb els equips de producte i recerca d'OpenAI.
L'11 de setembre de 2023, Sam va parlar amb la Sra. Johansson i el seu equip per comentar la seva possible participació com a sisena actriu de veu per a ChatGPT, juntament amb les altres cinc veus, inclosa Sky. Ella va rebutjar educadament l'oportunitat una setmana després a través del seu agent.
El 25 de setembre de 2023, vam llançar les seves veus a ChatGPT.
Tot aquest procés va requerir una coordinació extensa amb els actors i l'equip de càsting, i es va desenvolupar al llarg de cinc mesos. Continuem col·laborant amb els actors, que han aportat treball addicional per a la recerca d'àudio i noves capacitats de veu a GPT‑4o.
El 10 de maig de 2024, Sam va contactar amb l'equip de la Sra. Johansson per informar-los del nostre proper llançament de GPT‑4o i va preguntar si podria reconsiderar unir-se com a futura veu addicional a ChatGPT.
Nou mode de veu per a GPT-4o per a usuaris de pagament, i noves veus
El 13 de maig de 2024, vam presentar GPT‑4o. Tenim previst donar accés en fase alfa a un nou mode de veu per a GPT‑4o(s'obre en una finestra nova) als usuaris de ChatGPT Plus en les properes setmanes. Amb GPT‑4o, interactuar amb ChatGPT amb la veu és molt més natural. GPT‑4o gestiona les interrupcions amb fluïdesa, administra eficaçment les converses en grup, filtra el soroll de fons i s'adapta al to.
Des del 15 de maig de 2024, hem estat en conversa amb l'equip de la Sra. Johansson per comentar les seves preocupacions sobre Sky. Per respecte a les seves preocupacions, hem pausat l'ús de Sky als nostres productes des del 19 de maig de 2024.
De cara al futur, podeu esperar encara més opcions, ja que tenim previst presentar veus addicionals a ChatGPT per adaptar-nos millor als diversos interessos i preferències dels usuaris.