Resumo: | Vivemos, atualmente, num mundo repleto de números e dados, que, sendo devidamente recolhidos, organizados e interpretados podem sustentar importantes decisões nos mais variados setores. Foi também com este propósito que este trabalho foi desenvolvido, de forma a poder auxiliar a comunidade médica a travar a principal causa de morbilidade e mortalidade neonatal - Sépsis. Assim, será descrito ao longo de todo este trabalho, um modelo com um boa capacidade preditiva do risco de Sépsis/ Meningite em Prematuros de muito baixo peso. A base de dados cuja análise está na base deste trabalho foi cedida pela Sociedade Portuguesa de Neonatologia e é composta pelos registos de 7506 indivíduos relativamente a 128 variáveis. Foram descartadas cerca de metade das variáveis (relacionadas com datas e registos associados a Transferência e Internamento) uma vez que não teriam qualquer impacto nos modelos que seriam construídos. Foi aplicado o método de imputação dos k-vizinhos mais próximos para o tratamento dos valores omissos e o método Stepwise para a escolha das variáveis a considerar nos modelos. Conseguiu-se reduzir a colinearidade dos dados pela análise dos fatores de inflação da variância (VIF) e melhorar, assim, a capacidade preditiva do modelo. Recorreu-se ao modelo de regressão logística uma vez que a variável resposta - Sépsis/Meningite é uma variável dicotómica e analisou-se, também, modelos de regressão por penalização - Lasso, Ridge e Elastic Net, de forma a tentar melhorar a capacidade preditiva dos modelos.
|