Estudo da EACH é premiado no XVII Simpósio Brasileiro de Sistemas de Informação

O trabalho: “Social bots detection in Brazilian presidential elections using natural language processing”, desenvolvido por alunos do curso de Sistemas de Informação da EACH/USP, ficou em segundo lugar na trilha principal dos projetos apresentados no XVII Simpósio Brasileiro de Sistemas de Informação.

Diante do crescimento da utilização das redes sociais nos últimos anos, bots (robôs) têm sido criados para disseminar notícias falsas e manipular opiniões principalmente no período eleitoral. O trabalho tem como objetivo apresentar abordagens de detecção de bots sociais utilizando dados de publicação de usuários do Twitter realizadas durante o período das eleições presidenciais brasileiras de 2018.

O estudo foi desenvolvido pelos alunos Gabriel Ferreira, Bianca Santos, Marcelo Torres, e Rafael Braz, todos do curso de bacharelado em Sistemas de Informação da EACH. O trabalho contou com a orientação do professor Luciano Digiampietri, também da EACH.

Saiba mais sobre o trabalho:

Nos últimos anos, estamos presenciando um enorme aumento no número de usuários participando de redes sociais. As redes sociais em geral têm se mostrado bastante efetivas em espalhar opiniões e influenciar pessoas, pois uma mensagem pode ser compartilhada com milhares de pessoas em poucos minutos. No entanto, esta capacidade vem sendo explorada de maneira negativa, para manipular opiniões, espalhar desinformação e divulgar notícias falsas. Um dos meios comuns de se fazer isso é pelo uso de bots, algoritmos de computador que imitam o comportamento humano, divulgando tópicos e notícias, demonstrando apoio ou rejeição a personalidades e interagindo entre si e até mesmo com usuários humanos, podendo impactar até mesmo nas discussões democráticas. Diante disto, o presente trabalho tem como objetivo apresentar abordagens de detecção de bots sociais utilizando dados de publicação de usuários do Twitter realizadas durante o período das eleições presidenciais brasileiras de 2018. Utilizando uma base de dados de usuários do Twitter rotulados entre bots e humanos, esta pesquisa aplica cinco técnicas de processamento de linguagem natural (PLN) para extrair características do conteúdo das mensagens dos usuários na rede social. Com o objetivo de analisar o impacto de características geradas através de PLN na tarefa de detecção de bots, foram testados cinco classificadores diferentes a partir das características geradas, incluindo técnicas de pré-processamento e seleção de atributos. Os melhores resultados foram alcançados pela união de todas as características geradas e utilizando o algoritmo de classificação Floresta Aleatória, conseguindo uma precisão de 0,91 para a classe bot e AUC de 0,83.

Facebook

Google+

Twitter

Tumblr

Posts Relacionados