Pular para o conteúdo principal
OpenAI

Ampliação da pesquisa em ciências sociais

Uma nova ferramenta para ajudar pesquisadores e pesquisadoras a transformar dados qualitativos em números que podem ser analisados.

Carregando…

Uma parte central do nosso trabalho na OpenAI é permitir que cientistas e pesquisadores avancem mais rápido e resolvam problemas mais complexos. Hoje, nossa equipe de pesquisa em economia está lançando GABRIEL: um kit de ferramentas de código aberto que usa GPT para transformar textos e imagens não estruturados em medidas quantitativas. O kit foi criado para que economistas, cientistas sociais e cientistas de dados possam examinar dados qualitativos em grande escala.

Dados qualitativos contam as histórias mais importantes sobre o mundo: o que as pessoas dizem, escrevem, ensinam, discutem e vivenciam. Eles abrangem planos de aula, entrevistas, redes sociais e fotografias. Existe uma enorme quantidade desse tipo de dado. No entanto, transformar esse material em evidência precisa consome tempo demais. Muitas vezes, simplesmente não é viável. Em muitos casos, cientistas sociais acabam abandonando linhas de pesquisa necessárias, não porque os dados não existem, mas porque é impossível analisá-los.

GABRIEL foi criado para tornar os dados qualitativos muito mais acessíveis. Ele permite que pesquisadores descrevam o que querem avaliar usando uma linguagem do dia a dia (como “esta vaga de emprego é adequada para uma família?”) e depois aplica a mesma pergunta de forma consistente a milhares (ou milhões) de documentos, retornando uma pontuação para cada um. Dessa forma, pesquisadores gastam menos tempo em rotulagem repetitiva e mais tempo no trabalho que realmente exige conhecimento: escolher o que avaliar, validar os resultados e tirar conclusões cautelosas.

GABRIEL pode, por exemplo, analisar um grande acervo de artigos científicos para ver quais métodos específicos são usados e como evoluem ao longo do tempo. Ele pode examinar planos curriculares de cursos para medir o nível de atenção dado a diferentes matérias ou habilidades. Ele pode extrair detalhes históricos estruturados para cada pequena cidade da Europa ou examinar um grande volume de resenhas de clientes e descobrir padrões no que as pessoas mais valorizam. Em nosso artigo(abre em uma nova janela), comparamos o desempenho do GPT na rotulagem de dados qualitativos em diversos casos de uso e constatamos que ele é altamente preciso.

Além desse tipo de medição, GABRIEL também oferece as ferramentas práticas de que pesquisadores costumam precisar, incluindo combinar conjuntos de dados mesmo quando as colunas não coincidem, eliminação inteligente de duplicação, codificação de trechos de texto, criação de novas teorias científicas e remoção de informações pessoais de textos para preservar a privacidade.

GABRIEL já está disponível como uma biblioteca Python de código aberto(abre em uma nova janela), com um tutorial(abre em uma nova janela) para começar. Esse kit foi projetado para exigir conhecimento técnico mínimo. Vamos continuar aprimorando GABRIEL ao longo do tempo com base no feedback da comunidade acadêmica. Esperamos que essa ferramenta ajude mais pesquisadores e pesquisadoras a colocar a riqueza dos dados qualitativos e das histórias das pessoas em seus trabalhos.