Ir al contenido principal
OpenAI

Escalar la investigación en ciencias sociales

Una nueva herramienta para ayudar a las personas que investigan a convertir datos cualitativos en cifras que puedan analizar.

Cargando…

Una parte fundamental de nuestro trabajo en OpenAI es ayudar a la comunidad científica a avanzar más rápido y a resolver problemas más complejos. Hoy, nuestro equipo de investigación económica presenta GABRIEL: un conjunto de herramientas de código abierto que utiliza GPT para convertir texto e imágenes no estructurados en mediciones cuantitativas. Está diseñado para que economistas, especialistas en ciencias sociales y científicos de datos puedan estudiar datos cualitativos a gran escala.

Los datos cualitativos cuentan las historias más completas sobre el mundo: lo que la gente dice, escribe, enseña, debate y experimenta. Abarcan desde programas de estudio y entrevistas hasta redes sociales y fotografías. Hay una cantidad enorme. Pero transformar ese tipo de datos en evidencia rigurosa requiere muchísimo tiempo. A menudo ni siquiera es viable. En demasiados casos, las personas que investigan en ciencias sociales se ven obligadas a renunciar a líneas de investigación importantes, no porque no existan datos, sino porque es imposible analizarlos.

GABRIEL está diseñado para hacer que los datos cualitativos sean mucho más accesibles. Permite a las personas que investigan describir lo que quieren medir con palabras cotidianas —por ejemplo, «¿hasta qué punto esta oferta de empleo es compatible con la vida familiar?»— y luego aplica esa misma pregunta de forma coherente a miles (o millones) de documentos, devolviendo una puntuación para cada uno. Así, quienes investigan pueden dedicar menos tiempo a etiquetar datos de forma repetitiva y más tiempo al trabajo que realmente requiere experiencia: decidir qué medir, validar los resultados y extraer conclusiones fundamentadas.

Por ejemplo, GABRIEL puede analizar una gran colección de artículos científicos para ver qué métodos concretos se utilizan y cómo evolucionan con el tiempo. Puede examinar programas de cursos para medir cuánta atención se presta a distintas materias o competencias. Puede extraer detalles históricos estructurados de cada pueblo de Europa, o analizar un gran volumen de reseñas de clientes y descubrir patrones en lo que la gente valora más. En nuestro artículo(se abre en una ventana nueva), evaluamos el rendimiento de GPT al etiquetar datos cualitativos en muchos casos de uso y comprobamos que es muy preciso.

Además de este tipo de mediciones, GABRIEL también ofrece herramientas prácticas que las personas que investigan suelen necesitar. Entre ellas se incluyen la fusión de conjuntos de datos incluso cuando las columnas no coinciden, la deduplicación inteligente, la codificación de fragmentos de texto, la generación de nuevas teorías científicas y la eliminación de información personal identificable de los textos para preservar la privacidad.

GABRIEL ya está disponible como una biblioteca de Python de código abierto(se abre en una ventana nueva), con un cuaderno de tutorial(se abre en una ventana nueva) para empezar a trabajar. Está diseñado para requerir unos conocimientos técnicos mínimos. Seguiremos mejorando GABRIEL con el tiempo a partir de los comentarios de la comunidad académica. Esperamos que esta herramienta ayude a más personas que investigan a incorporar la riqueza de los datos cualitativos y de las historias humanas a su trabajo.