Desenvolvimento de Modelos Analíticos de Apoio à Gestão em Instituições do Ensino Superior, com Recurso a Data Mining

As instituições de ensino superior deparam‐se atualmente com grandes desafios, derivados da concorrência na captação de novos alunos, da globalização da educação e das diretrizes das recentes políticas educativas, quer nacionais quer da união europeia, que exigem intervenções acrescidas em prol do s...

Full description

Bibliographic Details
Main Author: Martins, Maria Prudência Gonçalves (author)
Format: doctoralThesis
Language:por
Published: 2021
Subjects:
Online Access:http://hdl.handle.net/10400.6/11132
Country:Portugal
Oai:oai:ubibliorum.ubi.pt:10400.6/11132
Description
Summary:As instituições de ensino superior deparam‐se atualmente com grandes desafios, derivados da concorrência na captação de novos alunos, da globalização da educação e das diretrizes das recentes políticas educativas, quer nacionais quer da união europeia, que exigem intervenções acrescidas em prol do sucesso educativo e da prevenção do abandono académico. Com o objetivo de contribuir para que essas instituições de ensino se transformem em organizações mais pró‐ativas, capazes de enfrentar os atuais desafios, propõem‐se, nesta tese, novos modelos analíticos de previsão, desenvolvidos com recurso a técnicas de data mining, que permitem estimar, com a devida antecedência, quer o nível de sucesso esperado no final do curso, quer a propensão do aluno para o abandono. Esses modelos vão permitir identificar quer os grupos de estudantes de maior risco, que venham a necessitar de uma maior atenção, quer os fatores que mais contribuam para o seu (in)sucesso, conhecimentos de importância primordial para que os agentes de gestão possam adotar as medidas e decisões estratégicas de promoção de sucesso académico mais adequadas. Para prever o sucesso académico global do aluno é proposto um modelo de regressão baseado no algoritmo random forest. Para estimar a sua propensão para o abandono é desenvolvido um modelo de classificação que combina três das mais importantes técnicas de data mining, como são os casos dos algoritmos random forest, máquinas de vetores de suporte e redes neuronais artificiais. Com o objetivo de avaliar e garantir que as metodologias desenvolvidas e os modelos propostos possam ser utilizados em contextos reais, usam‐se, como caso de estudo, os alunos de licenciatura duma instituição pública do ensino superior politécnico. Para além da elevada capacidade de previsão evidenciada pelos modelos desenvolvidos e da própria dimensão e diversidade dos dados analisados, destacam‐se, como contribuições diferenciadoras desta tese, os processos de seleção dos fatores explicativos do sucesso e do abandono académico. A tese também demonstra o potencial das técnicas de data mining quando aplicadas a bases de dados de grande dimensão provenientes de ambientes educacionais, podendo a abordagem metodológica seguida servir de guia a outras instituições de ensino, ajudando‐as a perceber de que forma o data mining as poderá auxiliar na extração de conhecimento útil que suporte melhores decisões.