Análise preditiva do desempenho acadêmico em ambientes virtuais de aprendizagem: uma abordagem com aprendizado de máquina otimizado

DSpace Repository

A- A A+

Análise preditiva do desempenho acadêmico em ambientes virtuais de aprendizagem: uma abordagem com aprendizado de máquina otimizado

Show simple item record

dc.contributor Universidade Federal de Santa Catarina
dc.contributor.advisor Cechinel, Cristian
dc.contributor.author Marcolino, Markson Rebelo
dc.date.accessioned 2025-08-28T23:31:57Z
dc.date.available 2025-08-28T23:31:57Z
dc.date.issued 2025
dc.identifier.other 393465
dc.identifier.uri https://repositorio.ufsc.br/handle/123456789/267754
dc.description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Campus Araranguá, Programa de Pós-Graduação em Tecnologias da Informação e Comunicação, Araranguá, 2025.
dc.description.abstract A evasão estudantil e o baixo desempenho acadêmico continuam sendo desafios persistentes na educação, frequentemente ocorrendo em taxas substanciais e apresentando dificuldades consideráveis para identificação e intervenção oportunas. Sistemas de gerenciamento de aprendizagem, como o Moodle, geram extensos conjuntos de dados que refletem as interações dos alunos e os padrões de matrícula, apresentando oportunidades para a aplicação de análise preditiva. Este estudo busca avançar na área de previsão de evasão e baixo desempenho acadêmico por meio da aplicação de inteligência artificial com metodologias de aprendizado de máquina. Em particular, empregamos o algoritmo CatBoost, treinado em registros de atividade estudantil da plataforma Moodle. Para mitigar os desafios impostos por um conjunto de dados limitado e desbalanceado, utilizamos técnicas sofisticadas de balanceamento de dados, como o Adaptive Synthetic Sampling (ADASYN), e realizamos otimização multiobjetivo de hiperparâmetros usando o Algoritmo Genético de Ordenação Não Dominada II (NSGA-II). Comparamos modelos treinados com dados semanais de logs com um único modelo treinado com dados de todas as semanas. O modelo proposto, treinado com os dados de todas as semanas, demonstrou desempenho superior, apresentando melhorias significativas nas pontuações F1 e recall, especialmente para a classe minoritária de alunos em risco. Por exemplo, o modelo obteve uma pontuação F1 média ao longo de múltiplas semanas de aproximadamente 0,8 no teste holdout. Esses achados destacam o potencial das abordagens de aprendizado de máquina direcionadas para facilitar a identificação precoce de alunos em risco, permitindo intervenções oportunas e melhorando os resultados educacionais.
dc.description.abstract Abstract: Student attrition and academic failure remain pervasive challenges in education, often occurring at substantial rates and posing considerable difficulties for timely identification and intervention. Learning management systems such as Moodle generate extensive datasets reflecting student interactions and enrollment patterns, presenting opportunities for predictive analytics. This study seeks to advance the field of dropout and failure prediction through the application of artificial intelligence with machine learning methodologies. In particular, we employed the CatBoost algorithm, trained on student activity logs from the Moodle platform. To mitigate the challenges posed by a limited and imbalanced dataset, we employed sophisticated data balancing techniques, such as Adaptive Synthetic Sampling (ADASYN), and conducted multi-objective hyperparameter optimization using the Non-dominated Sorting Genetic Algorithm II (NSGA-II). We compared models trained on weekly log data against a single model trained on all weeks' data. The proposed model trained with all weeks' data demonstrated superior performance, showing significant improvements in F1-scores and recall, particularly for the minority class of at-risk students. For example, the model got an average F1-score across multiple weeks of approximately 0.8 in the holdout test. These findings underscore the potential of targeted machine learning approaches to facilitate early identification of at-risk students, thereby enabling timely interventions and improving educational outcomes. en
dc.format.extent 94 p.| il., gráfs., tabs.
dc.language.iso por
dc.subject.classification Tecnologia da informação e da comunicação
dc.subject.classification Evasão escolar
dc.subject.classification Aprendizado do computador
dc.subject.classification Moodle (Programa de computador)
dc.title Análise preditiva do desempenho acadêmico em ambientes virtuais de aprendizagem: uma abordagem com aprendizado de máquina otimizado
dc.type Dissertação (Mestrado)


Files in this item

Files Size Format View
PTIC0201-D.pdf 2.651Mb PDF View/Open

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Browse

My Account

Statistics

Compartilhar