Salta al contingut principal
OpenAI

23 de desembre del 2022

Empresa

El poder de l’aprenentatge continu

Lilian Weng treballa a l’equip de Recerca d’IA Aplicada d’OpenAI.

Persona asseguda en un sofà davant d’una tauleta vermella en una habitació plena de plantes

Foto: Jake Stangel

S'està carregant…

Què és el que més t’il·lusiona del futur de la IA?

La intel·ligència artificial general (AGI) hauria de superar els humans en la major part de la feina econòmicament valuosa. Espero amb il·lusió veure com l’AGI ajuda la societat humana d’aquestes maneres:

  1. Automatitzar completament o reduir de manera significativa l’esforç humà en tasques repetitives i no innovadores. En altres paraules, l’AGI hauria d’impulsar dràsticament la productivitat humana.
  2. Accelerar molt el descobriment de nous avenços científics, incloent-hi, entre d’altres, facilitar el procés de presa de decisions humana proporcionant anàlisis i informació addicionals.
  3. Entendre i interactuar amb el món físic de manera efectiva, eficient i segura.

De quins projectes en què has treballat a OpenAI et sents més orgullosa?

Durant els meus primers 2,5 anys a OpenAI, vaig treballar a l’equip de Robòtica en una idea molt ambiciosa: volíem ensenyar a una única mà robòtica semblant a la humana a resoldre el cub de Rubik. Va ser una experiència tremendament emocionant, desafiadora i intensa. Vam resoldre el repte amb aprenentatge per reforç profund (RL), quantitats enormes d’aleatorització de domini i sense dades d’entrenament del món real. Més important encara, vam superar el repte com a equip.

Des de la simulació i l’entrenament amb RL fins a la percepció visual i el firmware del maquinari, vam col·laborar de manera molt estreta i cohesionada. Va ser un experiment increïble i, durant aquell temps, sovint pensava en el camp de distorsió de la realitat(s'obre en una finestra nova) de Steve Jobs: quan creus en alguna cosa amb tanta força i continues empenyent-la amb tanta persistència, d’alguna manera pots fer possible l’impossible.

Des de començaments de 2021, vaig començar a liderar l’equip de Recerca d’IA Aplicada. Gestionar un equip planteja un conjunt diferent de reptes i exigeix canvis en la manera de treballar. El que em fa sentir més orgullosa són diversos projectes relacionats amb la seguretat dels models de llenguatge dins d’IA Aplicada:

  1. Vam dissenyar i construir un conjunt de dades i tasques d’avaluació per avaluar la tendència dels models de llenguatge preentrenats a generar contingut d’odi, sexual o violent.
  2. Vam crear una taxonomia detallada i vam construir un classificador potent per detectar contingut no desitjat, així com la raó per la qual el contingut és inadequat.
  3. Estem treballant en diverses tècniques per fer que el model sigui menys propens a generar sortides insegures.

Com que l’equip d’IA Aplicada està posant en pràctica la millor manera de desplegar tècniques d’IA capdavanteres, com ara els grans models de llenguatge preentrenats, veiem com són de potents i útils per a tasques del món real. També som conscients de la importància de desplegar aquestes tècniques de manera segura, tal com es destaca a la nostra Carta.

Persona rient en una cadira en una habitació molt lluminosa amb una planta al fons

Foto: Jake Stangel

Els models actuals d’aprenentatge profund no són perfectes. S’entrenen amb una quantitat gegantina de dades creades per humans (p. ex., a Internet, seleccionades i de la literatura) i inevitablement absorbeixen molts defectes i biaixos que existeixen des de fa temps a la nostra societat. Per exemple, quan es demanava a DALL·E que representés una infermera, només generava personatges femenins, o per a un professor, només generava persones blanques. El model capta biaixos en les estadístiques del món real o biaixos en les nostres dades d’entrenament.

Em va motivar dissenyar un mètode per mitigar aquest tipus de biaix social i avaluar l’eficàcia del mètode. Amb l’equip, vam dissenyar una canalització per reduir aquest biaix, així com un flux de treball per dur a terme una avaluació amb humans al circuit. Reduir el biaix social no és un problema fàcil, ja que apareix en molts aspectes de les nostres vides i a vegades pot ser difícil de detectar. Però m’alegra que l’equip de DALL·E es prengui aquest problema seriosament i actuï en una etapa molt primerenca. El que tenim ara mateix és només un començament i continuarem avançant. Estic orgullosa de treballar en aquest àmbit i contenta de veure com, pas a pas, fem que la IA moderna sigui més segura i millor.

«Les idees de diferents temes o camps sovint poden inspirar noves idees i ampliar l’espai de solucions potencials.»

Com apliques les teves experiències personals i els teus valors a la feina que fas cada dia a OpenAI?

Crec en el poder d’aprendre i mai no és massa tard per fer-ho. Mantenir el meu blog personal és una bona manera de mantenir viva aquesta curiositat i d’aprendre regularment sobre els nous avenços de la comunitat de l’aprenentatge profund. També animo el meu equip a continuar aprenent, tant si està relacionat com si no amb els seus projectes actuals. Les idees de diferents temes o camps sovint poden inspirar noves idees i ampliar l’espai de solucions potencials.

També crec fermament en el treball en equip. Si cadascú destaca en el seu punt fort, aconseguirem que 1+1 > 2. Alhora, sovint ens podem trobar amb feina «bruta» i jo personalment estic molt disposada a assumir aquestes tasques, perquè mentre aquest sigui el principal obstacle o aquella tasca pugui aportar el valor més gran al projecte, res no s’hauria de considerar «brut» o «trivial». Animo les persones del meu voltant a fer el mateix: actuar com a membres de l’equip i treballar plegats per accelerar la productivitat de l’equip.

Parla’ns del teu blog! Per què el vas començar? Què esperes que inspiri?

Tot va començar com un conjunt de notes personals d’aprenentatge. No vaig entrar molt aviat en el camp de l’aprenentatge profund i encara em considerava una «principiant». Al principi, quan vaig començar a aprofundir en tants articles, em va fascinar el concepte de no dissenyar un algorisme per resoldre un problema, sinó d’entrenar un model perquè aprengui l’algorisme per resoldre’l. Com més llegia, més curiositat sentia. A la pràctica, es va fer molt difícil organitzar tots els articles que havia llegit i els nous conceptes que havia après. Així que vaig decidir començar un blog per documentar i organitzar les meves notes d’aprenentatge. També crec que la millor manera d’aprendre alguna cosa és assegurar-se que pots ensenyar aquest coneixement als altres de manera correcta i clara. Escriure m’ajuda a aconseguir-ho.

No esperava que es fes popular dins la comunitat de l’ML, però sempre que rebia un correu d’agraïment o algú em deia en persona que havia après molt llegint el meu blog, em sentia molt honorada i agraïda. Han passat gairebé 6 anys des que vaig començar el blog el 2017 i el continuaré mentre pugui.

Quin creus que és un dels reptes més urgents que la IA pot resoldre en la nostra societat?

La comunitat de la IA ha avançat moltíssim en els darrers anys. Els avenços en maquinari, arquitectura de model i dades fan possible entrenar models gegantins i, com a resultat, continuem veient capacitats cada cop més grans. Crec que anem pel bon camí cap a l’AGI, però l’escalat no és l’única recepta. En la meva opinió, els reptes més urgents ara mateix són l’alineació i la seguretat. Fins a cert punt, poden ser el mateix problema de controlabilitat o direccionabilitat.

En primer lloc, encara que ja tinguéssim a les mans un sistema d’IA extremadament potent, si no podem comunicar de manera eficient els nostres objectius i assegurar-nos que el model estigui alineat amb el que volem, no seria possible crear tant valor com necessitem. El model actual més potent aprèn a partir d’una quantitat gegantina de dades i el conjunt de dades inevitablement capta defectes i biaixos imperfectes del món real. En aquest sentit, els models desalineats comporten problemes de seguretat, ja que no són conscients del que s’hauria d’evitar.

«Crec que anem pel bon camí cap a l’AGI, però l’escalat no és l’única recepta. Ara mateix, els reptes més urgents són l’alineació i la seguretat.»

Quin és el millor consell que has rebut en la teva carrera a OpenAI?

Això no és cap consell concret que algú m’hagi donat, sinó que es basa en la meva experiència fins ara a OpenAI. És a dir, pensar en gran. Estem creant una cosa nova i hem de ser ambiciosos, valents i tenir prou perseverança per continuar amb l’esforç.

On trobes inspiració?

Llibres. Acostumo a llegir llibres fora del camp de l’aprenentatge profund i m’inspiro en una gran varietat d’àmbits; per exemple, com és de crític que un escriptor sigui persistent durant 50 anys, que un cirurgià sigui perfectament meticulós, i que un emprenedor tingui «idees boges».

La gent que m’envolta. És un honor treballar amb un gran grup de companys extraordinàriament talentosos a OpenAI. Tothom té alguna cosa brillant, inspiradora o digna de respecte, i gaudeixo aprenent d’ells.