8 de enero de 2024

OpenAI y el periodismo

Apoyamos el periodismo, colaboramos con medios de comunicación y creemos que la demanda de The New York Times es improcedente.

Ilustración: Justin Jay Wang × DALL·E

Cargando...

Nuestro objetivo es crear herramientas de IA con las cuales la gente pueda⁠(se abre en una nueva ventana) resolver problemas que, de otro modo, no se podrían solucionar. Todo el mundo está usando nuestra tecnología para mejorar su vida cotidiana⁠(se abre en una nueva ventana). Millones de desarrolladores y más del 92 % de las empresas que integran la lista Fortune 500 recurren a nuestros productos.

Si bien no estamos de acuerdo con los argumentos de la demanda presentada por The New York Times, la consideramos una oportunidad para aclarar a qué nos dedicamos, qué intención tenemos y cómo creamos nuestra tecnología. Nuestra postura se puede resumir en estos cuatro fundamentos que desarrollamos más adelante:

Colaboramos con los medios de comunicación y estamos generando nuevas oportunidades.
El entrenamiento es legítimo, pero damos la opción de impedirlo porque es lo correcto.
La “regurgitación” es una falla técnica infrecuente que estamos tratando de erradicar
The New York Times solo dio su versión de los hechos

1. Colaboramos con los medios de comunicación y estamos generando nuevas oportunidades

Nos esforzamos mucho por diseñar una tecnología para asistir a los medios de comunicación. Nos reunimos con muchos de ellos, además de destacadas entidades del sector, como News/Media Alliance, para analizar oportunidades, despejar sus dudas y ofrecer soluciones. Nos proponemos aprender, informar, escuchar opiniones y adaptarnos.

Aspiramos a velar por la salud del ecosistema de medios, ser buenos colaboradores y generar oportunidades mutuamente beneficiosas. Con esa idea, nos asociamos con los medios de comunicación para lograr estos objetivos:

Implementar nuestros productos para beneficiar y asistir a los periodistas y redactores ayudándolos con tareas trabajosas, como analizar archivos públicos exhaustivos y traducir artículos.
Enseñarles a nuestros modelos de IA cómo es el mundo entrenándolos con contenidos históricos complementarios que no hayan sido publicados.
Mostrar en ChatGPT contenido en tiempo real con las debidas referencias, de modo que los editores tengan nuevas formas de ponerse en contacto con los lectores.

Nuestras primeras colaboraciones con Associated Press⁠(se abre en una nueva ventana), Axel Springer⁠(se abre en una nueva ventana), American Journalism Project⁠(se abre en una nueva ventana) y NYU⁠(se abre en una nueva ventana) dan una idea de nuestro método.

2. El entrenamiento es legítimo, pero damos la opción de impedirlo porque es lo correcto

Entrenar a los modelos de IA con materiales públicos de Internet es legítimo y se fundamenta en precedentes de larga tradición y amplio reconocimiento. Consideramos que este principio es legítimo para los creadores, necesario para los innovadores y esencial para la competitividad de EE. UU.

Dicho esto, el derecho legítimo nos importa menos que nuestro deber de ser buenos ciudadanos. Fuimos pioneros en el sector de la IA porque ofrecimos un simple proceso⁠(se abre en una nueva ventana) para que los editores impidan que nuestras herramientas obtengan acceso a sus sitios (y The New York Times lo siguió en agosto de 2023).

3. La “regurgitación” es una falla técnica infrecuente que estamos tratando de erradicar

Nuestros modelos fueron pensados y entrenados para aprender conceptos y aplicarlos a problemas nuevos⁠.

La memorización es una falla técnica infrecuente del proceso de aprendizaje en la que avanzamos de manera constante. Es más habitual cuando ciertos contenidos aparecen más de una vez en los datos de entrenamiento, por ejemplo si determinadas partes figuran en muchos sitios web públicos diferentes. Por eso, aplicamos medidas para limitar la memorización inadvertida y evitar la regurgitación en las respuestas de los modelos. Además, esperamos que los usuarios actúen con responsabilidad. La manipulación intencional de los modelos para obligarlos a regurgitar datos se considera un uso indebido de esta tecnología y constituye una infracción de los términos de uso.

Así como los humanos reciben una educación integral para aprender a resolver problemas nuevos, queremos que nuestros modelos de IA observen una variedad de información sobre el mundo, en todos los idiomas y de todas las culturas y sectores. Dado que los modelos aprenden del enorme conjunto de conocimientos humanos, cualquier sector en particular (por ejemplo, los medios de comunicación) es una parte ínfima de los datos generales de entrenamiento, y ninguna fuente de datos (entre ellas, The New York Times) influye de forma apreciable en el aprendizaje previsto del modelo.

4. The New York Times solo dio su versión de los hechos

Nuestros diálogos con The New York Times parecían estar avanzando de manera constructiva hasta la última comunicación, que tuvo lugar el 19 de diciembre. Las negociaciones giraban en torno a una valiosa colaboración para mostrar en ChatGPT contenido en tiempo real con las debidas referencias. Así, The New York Times contaría con una nueva vía para ponerse en contacto con sus lectores actuales y llegar a otros nuevos, y nuestros usuarios tendrían acceso a sus artículos. Le habíamos explicado a The New York Times que, tal como cualquier otra fuente en particular, su contenido no contribuía considerablemente al entrenamiento de nuestros modelos ni influiría demasiado a futuro. Su demanda el 27 de diciembre (de la cual nos enteramos leyendo su periódico) fue tan sorpresiva como decepcionante.

Mientras debatíamos, habían mencionado algunas regurgitaciones de su contenido, pero en reiteradas ocasiones se negaron a dar ejemplos, pese a nuestro compromiso de investigar y resolver cualquier problema que surgiera. Hemos demostrado la seriedad con que nos tomamos este tema, como sucedió en julio, cuando inhabilitamos una función de ChatGPT⁠(se abre en una nueva ventana) de inmediato tras descubrir que podía reproducir contenido en tiempo real de modos no deseados.

Curiosamente, las regurgitaciones provocadas por The New York Times parecen ser de artículos de hace muchos años que se multiplicaron por varios⁠(se abre en una nueva ventana) sitios⁠(se abre en una nueva ventana) web⁠(se abre en una nueva ventana) de terceros⁠(se abre en una nueva ventana). Parece que manipularon de forma intencional las solicitudes, muchas veces incluyendo fragmentos extensos de artículos, para lograr que el modelo regurgitara contenido. Incluso cuando se usan solicitudes de ese tipo, los modelos no suelen comportarse del modo que insinúa The New York Times, lo cual da a entender que le indicaron al modelo que lo hiciera o eligieron con cuidado sus ejemplos a partir de muchos intentos.

Pese a sus reclamos, este uso indebido no es típico ni está permitido, y no reemplaza el contenido de The New York Times. No obstante, tomamos medidas constantes para proteger nuestros sistemas de cualquier ataque que pretenda hacerlos regurgitar datos de entrenamiento, y hemos avanzado mucho con los modelos recientes.

Creemos que la demanda de The New York Times es improcedente. Aún así, tenemos la esperanza de entablar un vínculo constructivo con The New York Times y respetamos su larga trayectoria, que cuenta entre sus logros haber publicado un artículo sobre la primera red neuronal⁠(se abre en una nueva ventana) hace más de 60 años y defender las libertades instauradas en la Primera Enmienda.

Esperamos seguir colaborando con los medios de comunicación y ayudarlos a perfeccionar su capacidad para producir periodismo de calidad aprovechando el potencial transformador de la IA.

Autor

OpenAI