Dete??o de e-mails phishing aplicando machine learning ao conte?do

A engenharia social ? um conceito no qual ? aplicado a manipula??o psicol?gica para levar a v?tima a executar a??es em prol do ator malicioso. Uma das formas mais comuns de praticar atos de engenharia social ? o phishing. No mundo cibern?tico, o phishing ? usado para manipular os utilizadores para a...

ver descrição completa

Detalhes bibliográficos
Autor principal: Saraiva, Marco Ant?nio Carvalhosa (author)
Formato: masterThesis
Idioma:por
Publicado em: 2022
Assuntos:
Texto completo:http://hdl.handle.net/20.500.11960/2840
País:Portugal
Oai:oai:repositorio.ipvc.pt:20.500.11960/2840
Descrição
Resumo:A engenharia social ? um conceito no qual ? aplicado a manipula??o psicol?gica para levar a v?tima a executar a??es em prol do ator malicioso. Uma das formas mais comuns de praticar atos de engenharia social ? o phishing. No mundo cibern?tico, o phishing ? usado para manipular os utilizadores para a pr?tica de extors?o e roubo de dados sens?veis. Esta pr?tica ? cada vez mais usada, o que torna preocupante e alarmante a forma de como ? poss?vel ser alvo deste ataque. Relat?rios na ?rea revelam que os utilizadores est?o constantemente a ser alvo de e-mails que fingem ser leg?timos, mas que na verdade est?o a ser v?timas de um ataque phishing. O n?mero de sites e de campanhas de e-mail de phishing continua a crescer ano ap?s ano, sendo que, e a t?tulo de exemplo, no ano de 2021, os ataques phishing cresceram 200% devido ao aproveitamento da pandemia Covid-19 com campanhas de vacinas e tratamento para o v?rus. Existe uma grande preocupa??o da comunidade acad?mica e da ind?stria em mitigar o problema por?m os desafios s?o muitos. Tal deve-se em certa medida ao fato de que parte da solu??o passa pelo ser humano, desenvolvendo a capacidade do mesmo ter consci?ncia e tomar decis?es corretas para evitar que o ataque seja bem-sucedido. Endere?ar um problema como o do phishing requer a??es ao n?vel pessoas, procedimental e tecnol?gico (PPT). O lado humano tem sido alvo de constantes a??es de treino e consciencializa??o, mas mesmo assim o fen?meno n?o para de crescer. Neste trabalho propomos uma solu??o tecnol?gica para refor?ar a capacidade de mitigar ataques de phishing, ou seja, criar uma linha de defesa para que o utilizador final n?o tenha de lidar com e-mails phishing no dia a dia, de forma a evitar o erro humano e assim criar poss?veis estragos e preju?zos. A proposta apresentada envolve a cria??o de um dataset a partir de e-mails previamente classificados como sendo de phishing e n?o phishing. Para a cria??o do dataset foram considerados aspetos lingu?sticos do pr?prio e-mail. Para tal foi aplicada uma t?cnica de extra??o de informa??o automatizada, denominada de Named-entity Recognition (NER). Esta t?cnica retira do corpo do e-mail caracter?sticas que formam o conjunto de dados. O conjunto de dados resultado foi analisado, tratado e submetido a algoritmos de ML, mais propriamente a algoritmos de classifica??o A an?lise de resultados permite concluir que, atrav?s deste m?todo ? poss?vel determinar se um e-mail ? de phishing e ou com uma taxa de acerto de 91.13%. Foi ainda poss?vel concluir que a escolha das features para a fase de treino dos modelos de ML tem um papel preponderante para maximizar a taxa de acerto. Salienta-se que a proposta aqui apresentada para determinar se um e-mail ? de phishing ou n?o poder? de forma simples ser integrada com outras solu??es, melhorando assim a capacidade de detetar e evitar este tipo de ataques.