Reutilização de Processos de Descoberta de Conhecimento

Nesta dissertação é apresentada uma prova de conceito tendo como objetivo automatizar a adaptação de um processo de descoberta de conhecimento previamente definido, a uma nova fonte de dados. Um processo de descoberta de conhecimento pode usar uma ou mais fonte de dados e, na maioria das vezes neces...

ver descrição completa

Detalhes bibliográficos
Autor principal: Sousa, Ricardo Filipe Marques de (author)
Formato: masterThesis
Idioma:por
Publicado em: 2019
Assuntos:
Texto completo:http://hdl.handle.net/10400.22/11144
País:Portugal
Oai:oai:recipp.ipp.pt:10400.22/11144
Descrição
Resumo:Nesta dissertação é apresentada uma prova de conceito tendo como objetivo automatizar a adaptação de um processo de descoberta de conhecimento previamente definido, a uma nova fonte de dados. Um processo de descoberta de conhecimento pode usar uma ou mais fonte de dados e, na maioria das vezes necessita, de ajustes quando essas fontes são trocadas por outras pertencentes ao mesmo domínio, uma vez que as fontes de dados anteriores e as novas raramente possuem o mesmo esquema de dados associado. Esses ajustes por vezes fazem com que o analista dispense mais tempo a reformular a configuração do processo implementado anteriormente. As ferramentas de descoberta de conhecimento existentes permitem que seja executado o processo, mas em nenhuma delas é possível efetuar a troca da fonte de dados e, de uma forma automatizada, criar e ajustar os componentes para que possa ser usado o mesmo processo de descoberta de conhecimento, excetuando os casos em que os esquemas de ambas são rigorosamente iguais. Esta limitação levou à criação de uma solução que permite complementar as ações das ferramentas de descoberta de conhecimento e, desta forma, simplificar a atuação do analista. A solução desenvolvida foi implementada em C# e permite adaptar o esquema da nova fonte de dados ao processo de descoberta de conhecimento previamente definido, com base na fonte anterior, criando e utilizando os componentes especificados anteriormente. Esta nova solução permite uma maior rapidez no processo de reutilização de um processo de descoberta de conhecimento em novas fontes de dados pertencentes ao mesmo domínio.