Classificação de emoções em redes sociais

Este trabalho foca-se na deteção automática de emoções em tweets escritos em língua portuguesa. Com o objetivo de classificar cada um dos tweets com presença ou ausência de cada uma de oito possíveis emoções, são utilizadas duas abordagens. Com vista a avaliar as abordagens propostas, foi criado um...

ver descrição completa

Detalhes bibliográficos
Autor principal: Filipe, Soraia Alexandra Cardoso (author)
Formato: masterThesis
Idioma:por
Publicado em: 2021
Assuntos:
Texto completo:http://hdl.handle.net/10071/22121
País:Portugal
Oai:oai:repositorio.iscte-iul.pt:10071/22121
Descrição
Resumo:Este trabalho foca-se na deteção automática de emoções em tweets escritos em língua portuguesa. Com o objetivo de classificar cada um dos tweets com presença ou ausência de cada uma de oito possíveis emoções, são utilizadas duas abordagens. Com vista a avaliar as abordagens propostas, foi criado um conjunto de 1000 tweets, manualmente anotado com a presença ou não das emoções consideradas. Na primeira abordagem, é aplicado um léxico existente e diferentes estratégias para refinar e melhorá-lo, por meio de tradução automática e incorporação de palavras alinhadas com as existentes. Os resultados sugerem que se pode obter um melhor desempenho tanto através da melhoria de um léxico, como pela tradução direta de tweets portugueses para inglês e depois aplicando um léxico inglês existente. Relativamente à abordagem supervisionada, pretende-se criar modelos que generalizem melhor, com base em grandes quantidades de informação. Inicialmente é feita a anotação dos tweets disponíveis com base no léxico de emoções. Seguidamente, os primeiros 5 milhões de tweets são usados para treinar um modelo para cada uma das emoções. Esses modelos são então utilizados para anotar 9 milhões de tweets, que por sua vez são filtrados com base na confiança do modelo. Os tweets com uma confiança acima de um dado threshold são usados para treinar modelos finais. Todos os modelos são avaliados com base nos dados de referência, revelando que o segundo modelo mostra em geral um maior sucesso na previsão de emoções do que o primeiro modelo. Esta abordagem apresenta melhores resultados face à primeira.