Resumo: | As redes sociais podem ser utilizadas em ambiente de propaganda política ou eleições como canal de informação aos seus usuários. A rede social Twitter tem sido utilizada como plataforma política em diversas eleições por todo mundo e essas propagandas politicas são coordenadas por contas com utilizadores humanos ou não humanos. É fundamental discernir a atividade das contas normais de contas anômalas, pois a informação propagada pela rede pode ter diversos objetivos, incluindo a desinformação. A desinformação causada pelas contas anômalas possui maior probabilidade de alcance na rede social Twitter devido a elevada quantidade de contas que podem estar articuladas com este mesmo objetivo. Esta dissertação desenvolveu dois modelos de detecção de contas anômalas a partir dos algoritmos SVM one-class e Autoencoder Ensembles. O estudo utilizou como dados reais os tweets publicados no Twitter durante as eleições ocorridas no Brasil em 2018 e Portugal em 2019. As features da rede social Twitter foram importantes na análise do perfil do utilizador e foram selecionadas utilizando a técnica Recursive Feature Elimination. Foram utilizadas apenas informações de contas normais previamente conhecidas para treinar os modelos de aprendizagem não supervisionada, o que permite reutilizar os modelos em outras eleições para qualquer país, sendo esta uma inovação proposta por este trabalho. Os dois modelos permitiram detectar as contas anômalas nos dados de teste apresentando globalmente boa performance em seus resultados. O Autoencoder Ensembles foi desenvolvido pelo método de ensembles a partir do valor do erro de reconstrução com treinamento em sequência. A partir da detecção das contas anômalas foram criados clusters sendo possível verificar que existe diferença de discurso político publicado pelas contas anômalas através de tweets nas eleições ocorridas no Brasil e em Portugal. Os dados reais foram retirados da API desenvolvedora do Twitter, o que permitiu acessar as contas ativas durante o período eleitoral no ano de 2018 no Brasil e 2019 em Portugal. O objetivo desta dissertação foi contribuir para o crescente estudo no campo dos Sistemas de Informação que utilizam técnicas de machine learning e redes neurais para detecção de contas reais ou anômalas, além da visualização dos clusters gerados a partir destas últimas.
|