Ferramentas e Bases de Dados

Ferramentas e Bases de Dados elaboradas por pesquisador@s do NEB. Não deixe de referenciar o Núcleo de Estudos da Burocracia ao utilizar tais ferramentas e datasets. Seu uso é incentivado e recomendado para pesquisas acadêmicas e científicas das mais diversas naturezas, sendo gratuitas e abertas. A utilização das ferramentas e bases de dados é de exclusiva responsabilidade de quem adapta e manipula tais dados.

Ferramentas

  • [Planilha Automática] Raspagem (Web Scraping) de Lista de Grupos do Facebook sem Código, usando apenas Planilha, interessante para Netnografias: Planilha Automatizada que trata Listas de Grupos de Facebook para realizar mapeamentos e análises tal como netnografias. Basta colar o conteúdo referente à uma busca por termo de Grupos no Facebook e a planilha retornará a Lista de Grupos organizada em ordem alfabética a partir das seguintes colunas: 01.) Título: Título do Grupo; 02.) Link: Url; 03.) Tipo: Se é um Grupo Público ou Privado; 04.) Membros: Número de participantes; 05.) Posts (por Ano): Média de posts que o grupo tem por ano (o script ajusta as variações para indicar a média anual, mesmo que o Facebook aponte o valor diário, semanal ou mensal); e 06.) Descrição (se houver): Informações fornecidas pelos administradores do Grupo [Acessar].

  • [Planilha Automática] Para Iramuteq e demais Softwares de Análise de Conteúdo, Planilha de Tratamento de Texto Automatizada: Planilha Automatizada que trata conteúdos textuais para utilizar em Softwares de Análise de Conteúdo como o Iramuteq. Organizada a partir das seguintes colunas: 01.) Tópico: Um tópico que você deseja adicionar; 02.) Subtópico: Um subtópico que você deseja adicionar; 03.) Conteúdo Original (Input): Aqui você adiciona o conteúdo a ser tratado automaticamente, sendo o input; e 04.) Conteúdo Formatado (Saída): Aqui você extrai seu conteúdo formatado, sendo sua saída. Além disso, existem duas abas: 1.) Data (Entrada e Saída), que é mostrada acima; e 2.) Configurações de formatação, onde você pode adicionar ou remover regras de formatação como desejar (é originalmente configurado para uso no Iramuteq) [Acessar].

  • [Script em Python] Raspagem (Web Scraping) de Publicações e Conteúdos do Telegram, interessante para Netnografias: Este código tem como objetivo raspar dados de Canais, Grupos ou Chats do Telegram selecionados através da Biblioteca Telethon, integrando também a Biblioteca Gspread do Google e imprimindo os resultados em uma planilha do Google em tempo real. Em resumo, é possível definir ‘Períodos’ (data), ‘Palavras-chave’ (pesquisa) e ‘ID’ (Canais, Grupos ou Chats) para raspar todo o conteúdo desejado, retornando: ‘ID de Raspagem’, ‘Grupo’, ‘ID do autor’, ‘Conteúdo’, ‘Data’, ‘ID da mensagem’, ‘Autor’, ‘Visualizações’, ‘Reações’, ‘Compartilhamentos’, ‘Mídia’ e ‘Comentários’ em uma planilha do Google [Acessar].

Bases de Dados

  • [Base de Dados em Excel] Extração de todos as falas falsas de Bolsonaro (2019-2022) verificadas pela Agência de Checagem de Fatos ‘Aos Fatos’: Todas as Falas Falsas de Jair Messias Bolsonaro de 2019 a 2022 verificadas pelo Fact-Checking ‘Aos Fatos’, contendo todas as postagens em formato .xlsx organizadas a partir das seguintes colunas: 01.) ID: ID do controle interno; 02.) Citação: discurso falso proferido por Bolsonaro; 03.) Data: data de publicação no formato dd-mm-aaaa; 04.) Link: link para maiores informações sobre a fala e sobre a verificação da respectiva fala pela Agência de Verificação de Fatos ‘Aos Fatos’; 05.) Contexto: explicação do porque tal afirmação é falsa, pela Agência de Verificação ‘Aos Fatos’; 06.) Origem: fonte do discurso falso (ex: entrevista, live, pronunciamento); 07.) Temas: temas categorizados pela Agência de Verificação de Fatos ‘Aos Fatos’; e 8.) Repetições: número de vezes que foi repetida [Acessar].

  • [Base de Dados em Excel] Extração (Web Scraping) de Todas Postagens do Telegram de Bolsonaro (2021-2022): Todos os Posts do Telegram de Jair Messias Bolsonaro de 2021 a 2022, contendo todas as postagens no formato .xlsx organizadas a partir das seguintes colunas: 01.) Scraping ID: ID do controle interno; 02.) Grupo: nome do canal de origem; 03.) Author ID: ID do autor que publicou o post; 04.) Conteúdo: texto do post publicado; 05.) Data: data e hora da publicação no formato aaaa-mm-dd hh:mm:ss; 06.) Message ID: ID da mensagem interna do Telegram; 07.) Visualizações: número de visualizações que aquela mensagem teve (informação extraída em fevereiro de 2022); 08.) Reações: quantidade de reações que aquela mensagem teve, organizada por emojis em ordem decrescente (informação extraída em fevereiro de 2022); 09.) Shares: número de compartilhamentos que aquela mensagem teve (informação extraída em fevereiro de 2022); e 10.) Mídia: se houver mídia, é referenciada por link [Acessar].

  • [Base de Dados em Excel] Fake News sobre Eleições de 2018 a 2022 Verificadas pelo Consórcio de Verificadores de Fatos ‘Fato ou Boato’, do Tribunal Superior Eleitoral do Brasil: As Principais Fake News sobre Eleições e Urnas Eletrônicas de 2018 a 2022 Verificadas pelo Consórcio ‘Fato ou Boato’, do Tribunal Superior Eleitoral, contendo todas as postagens em formato .xlsx organizadas de as seguintes colunas: 01.) ID: ID do controle interno; 02.) Título: título da manchete que analisa as notícias falsas sobre urnas eletrônicas; 03.) Data: data de publicação no formato dd-mm-aaaa; 04.) Link: url para informações da justiça eleitoral brasileira sobre os demais órgãos que registraram fake news sobre o fato; 5.) Texto: manchete da fake news; e 6.) Detalhe: detalhes sobre a fake news, já incluindo o contexto elaborado pela justiça eleitoral brasileira [Acessar].