23 de diciembre de 2022

El poder del aprendizaje continuo

Lilian Weng trabaja en el área de Investigación de IA Aplicada en OpenAI.

Una persona sentada en un sillón frente a una mesa de café color rojo en un cuarto lleno de plantas

Foto: Jake Stangel

Cargando...

¿Qué es lo que más te entusiasma del futuro de la IA?

La inteligencia artificial general (IAG) debería poder conseguir mejores resultados que los humanos en la mayoría de los trabajos de valor económico. Quisiera ver cómo la IAG ayuda a la humanidad de las siguientes formas:

Con la automatización total o parcial de las tareas repetitivas y reiterativas que hacemos los humanos. En otras palabras, quiero ver cómo la IAG aumenta radicalmente nuestra productividad.
Mediante la promoción de grandes avances y descubrimientos científicos, por ejemplo, al influenciar la toma de decisiones gracias a nuevos análisis e información disponible.
Ver cómo asimila el mundo físico e interactúa con él de forma eficaz, eficiente y segura.

¿Qué proyectos en los que hayas trabajado en OpenAI te han llenado de orgullo?

Los dos primeros años y medio en OpenAI, trabajé en el equipo de Robótica en una idea muy ambiciosa: enseñarle a una mano robótica, como la de los humanos, a resolver el cubo de Rubik. Fue una experiencia fascinante, compleja y emotiva. Resolvimos⁠ el problema con aprendizaje profundo por refuerzo (RL), una cantidad inimaginable de variables y dominios aleatorios y sin datos de entrenamiento del mundo real. Y lo más importante de todo, trabajo en equipo.

Colaboramos siempre codo a codo: tanto en las simulaciones y el entrenamiento del RL como en las capacidades de percepción de imágenes y el firmware del hardware. Fue un experimento maravilloso. En esa época, pensaba mucho en el concepto de campo de distorsión de la realidad⁠(se abre en una nueva ventana) acuñado por Steve Jobs, según el cual si crees en algo con profunda convicción, trabajas con ahínco y perseveras, sucede algo que te permite lograr lo imposible.

A comienzos de 2021, empecé a dirigir el equipo de Investigación de IA aplicada. Coordinar un equipo implica diversas exigencias y requiere plantear distintas formas de trabajo. Lo que más me enorgullece son varios proyectos relacionados con la seguridad de los modelos de lenguaje dentro del área de la IA aplicada:

Diseñamos y confeccionamos un conjunto de datos de evaluación y tareas para determinar la propensión de los modelos de lenguaje preentrenados a generar contenido ofensivo, sexual y violento.
Establecimos una clasificación detallada y creamos un sistema potente que detectara el contenido no deseado⁠ y también el motivo por el cual era inadecuado.
Trabajamos en varias técnicas para minimizar las probabilidades de que el modelo genere datos de salida inapropiados.

A medida que el equipo de IA Aplicada analiza la mejor forma de aplicar métodos de IA de última generación (como los grandes modelos de lenguaje preentrenados) vemos lo útiles y eficaces que son en las tareas del mundo real. También somos conscientes de la importancia de implementar procedimientos seguros, tal como recalcamos en nuestros estatutos⁠.

Mujer sentada riéndose en un cuarto con luz natural y una planta en el fondo

Foto: Jake Stangel

Los modelos de aprendizaje profundo actuales no son perfectos: están entrenados con una cantidad descomunal de datos creados por humanos (por ejemplo, internet, contenido seleccionado, bibliografía específica); pero indefectiblemente incorporan gran parte de los defectos y sesgos arraigados en nuestra sociedad. Por ejemplo, cuando se le pedía a DALL·E una imagen de alguien que especializado en enfermería, hacía a mujeres; o si se le pedía una imagen de alguien que se dedicara a la docencia, solo creaba imágenes de personas caucásicas. El modelo refleja los sesgos de las estadísticas del mundo real y los de los datos de entrenamiento.

Me motivaba la idea de idear un método que atenuara este tipo de sesgo social y poder evaluar su eficacia. Con el equipo, diseñamos un proyecto para neutralizar este tipo de sesgo y también un proceso de evaluación con supervisión humana. Minimizar un sesgo social no es nada fácil, ya que es algo que se manifiesta en muchos aspectos de la vida y, a veces, nos cuesta percatarnos de ello. Pero me alegra que el equipo de DALL·E trate el asunto con la seriedad que corresponde y actúe en esta etapa incipiente. El modelo actual es solo una versión preliminar. Seguiremos mejorándolo. Para mí, es un orgullo poder trabajar en esta área y ver cómo poco a poco perfeccionamos la IA para que funcione mejor y de forma más segura.

“Muchas veces, las ideas de distintos ámbitos o campos generan otras nuevas y amplían el potencial de las soluciones”.

¿Cómo vuelcas tus experiencias y valores personales en tu trabajo diario en OpenAI?

Creo en el poder que da el conocimiento y que nunca es tarde para empezar a aprender cosas nuevas. Escribir en mi blog personal es una excelente manera de estimular la curiosidad y aprender sobre los avances que se dan habitualmente en el ámbito del aprendizaje profundo. También recomiendo a mi equipo a aprender cosas nuevas, tengan o no que ver con los proyectos actuales de uno. Muchas veces, las ideas de distintos ámbitos o campos generan otras nuevas y amplían el potencial de las soluciones.

Creo fervientemente en el trabajo en equipo. Si todos dan lo mejor de sí en lo suyo, el resultado es 1+1 > 2. Puede que siempre haya algo de trabajo “sucio”, pero no considero que haya tareas “banales” o “insignificantes”. Yo, en particular, las hago con mucho gusto si eso quita un obstáculo del medio o hace una contribución importante al proyecto. A la gente que me rodea le recomiendo hacer eso mismo: colaborar y trabajar en equipo para agilizar la productividad colectiva.

¡Cuéntanos del blog! ¿Cuándo lo abriste? ¿Qué esperas que genere?

Lo abrí como una serie de apuntes personales para aprender. No fui de las primeras en incursionar en el campo del aprendizaje profundo. Es más, me consideraba una “novata”. En un principio, cuando empecé a leer más y más publicaciones, me sorprendió el concepto de entrenar un modelo para que aprendiera un algoritmo capaz de resolver problemas, en vez de diseñar el algoritmo en sí. Cuanto más leía, más curiosidad me daba. De hecho, me resultaba imposible organizar todos los trabajos que había leído y los conceptos nuevos que había aprendido; así que tomé la decisión de empezar un blog para registrar y organizar mis apuntes. Creo que la mejor forma de aprender algo es ser capaz de trasmitir el conocimiento a otras personas con claridad y precisión. Escribir me da esa facilidad.

No esperaba que se volviera popular en el mundo del aprendizaje automático, pero cuando me agradecen por correo electrónico o me dicen en persona que aprendieron un montón leyendo mi blog, me emociono y me siento honrada. Ya hace casi seis años desde que empecé el blog en 2017 y voy a seguir escribiendo todo lo que pueda.

En tu opinión, ¿cuáles son los problemas acuciantes que la IA puede resolver en la sociedad?

La comunidad de la IA ha evolucionado muchísimo en los últimos años. Los avances en el hardware, la arquitectura de los modelos y la calidad de los datos posibilitan el entrenamiento de modelos enormes y, como resultado, creamos herramientas cada vez mejores. Creo que estamos encaminados como para crear una IAG, pero una mayor capacidad de procesamiento no es la única respuesta. Para mí, los problemas actuales más urgentes son la adecuación y la seguridad. Hasta cierto punto, puede que suceda lo mismo con la controlabilidad y la maniobrabilidad.

Para empezar, podemos tener la IA más eficiente del mundo, pero si no podemos comunicar con claridad nuestros objetivos y garantizar que el modelo se adecúe a nuestras necesidades, no le sacaremos el provecho que podría darnos. El modelo actual más potente aprende de una cantidad de datos descomunal y el conjunto de datos indefectiblemente incorpora las fallas y los sesgos del mundo real. En este sentido, los modelos inadecuados acarrean problemas de seguridad, ya que no contemplan cuestiones que deberían evitar.

“Creo que estamos encaminados como para crear una IAG, pero una mayor capacidad de procesamiento no es la única respuesta. Para mí, los problemas actuales más urgentes son la adecuación y la seguridad”.

¿Cuál es el mejor consejo que te dieron en OpenAI?

No es un consejo en concreto que me hayan dado, sino que surge de mi experiencia en la empresa hasta ahora. Y es pensar en grande. Cuando creamos algo desde cero, es necesario esforzarse, emprender y perseverar lo suficiente hasta que dé frutos.

¿Qué te inspira?

Los libros. Por lo general, leo libros que no tienen nada que ver con el aprendizaje profundo y encuentro inspiración en diversos campos. Por ejemplo, pienso cuán importante es que los escritores insistan durante años y años, que los cirujanos sean extremadamente puntillosos, que los emprendedores tengan “ideas disparatadas”.

La gente que me rodea. Tengo el privilegio de poder trabajar con muchísima gente prodigiosa en OpenAI. Todos tienen chispa, te inspiran y te respetan. Me encanta aprender de ellos.

Explora las carreras profesionales en OpenAI