Summary: | Os meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”.
|