N3O : a NEAT expansion for improving classification and feature selection applied to microarray data

Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefa...

ver descrição completa

Detalhes bibliográficos
Autor principal: Grisci, Bruno Iochins (author)
Formato: masterThesis
Idioma:eng
Publicado em: 2020
Assuntos:
Texto completo:http://hdl.handle.net/10183/215349
País:Brasil
Oai:oai:www.lume.ufrgs.br:10183/215349
Descrição
Resumo:Microarranjos são uma das principais técnicas empregadas no estudo de expressão gênica, mas a identificação de padrões de expressão a partir de conjuntos de dados de microarranjo é um desafio significativo a se superar. Neste trabalho, além de revisar a aplicação de aprendizado de máquina nas tarefas de classificação de microarranjos e seleção de genes, uma nova técnica utilizando Neuroevolução, um campo do aprendizado de máquina que combina redes neurais e computação evolutiva, é proposta para simultaneamente classificar dados de microarranjo e automaticamente selecionar o subconjunto de genes mais relevantes. O algoritmo FS-NEAT foi adaptado através da adição de três novos operadores estruturais projetados para melhor explorar este espaço de busca de alta dimensionalidade. Um rigoroso protocolo de filtragem e preprocessamento foi empregado para selecionar conjuntos de dados de microarranjo de qualidade para os experimentos, selecionando 13 conjuntos de dados de três tipos diferentes de câncer (mama, colorretal e leucemia). Os resultados de diferentes experimentos mostram que o método proposto foi capaz de classificar amostras de microarranjos satisfatoriamente quando comparado com outras alternativas da literatura, incluindo FS-NEAT padrão e SVM, enquanto também encontrando subconjuntos de genes que podem ser generalizados para outros algoritmos e carregam informação biológica relevante. Esta abordagem detectou 177 genes capazes de diferenciar classes, dos quais 82 já foram associados aos seus respectivos tipos de câncer na literatura e 44 foram associados a outros tipos de câncer, tornando-se alvos em potencial a serem explorados como biomarcadores de câncer.