MINERAÇÃO DE DADOS EDUCACIONAIS E MACHINE LEARNING PARA ANÁLISE E PREVENÇÃO DA EVASÃO ESCOLAR EM UM CURSO DE GRADUAÇÃO
Mineração de dados educacionais, Machine Learning, Random Forest, Self-organizing Maps, SHapley Additive exPlanations
As universidades enfrentam o desafio de como transformar uma grande quantidade de dados de seus estudantes em informações que possam gerar conhecimento para aprimorar a gestão acadêmica e diminuir os índices de evasão escolar no ensino superior. Uma abordagem promissora para identificar os fatores que influenciam o desempenho acadêmico é a mineração de dados educacionais (MDE) e Machine Learning (ML). Esta dissertação busca explorar os dados do curso de Bacharelado em Ciência e Tecnologia (BC&T) na Universidade Federal do Rio Grande do Norte (UFRN), considerando os alunos ingressantes entre os anos de 2014 a 2023. com objetivo de desenvolver modelos analíticos capazes de identificar características de intervenção que contribuam para o desenvolvimento acadêmico dos estudantes. Por meio de uma revisão da literatura, foram identificados algoritmos de ML adequados para uma abordagem híbrida, combinando o Random Forest (classificação) e Self-Organizing Maps (clustering), com análises de explicabilidade SHapley Additive exPlanations, o processo incluiu Knowledge Discovery in Databases adaptado com etapas (coleta de dados, pré-processamento, mapeamento de características, treinamento e teste, análise de explicabilidade). Como resultado, espera-se desenvolver um modelo preditivo capaz de identificar um conjunto de características explicáveis e ao mesmo tempo, aprimorar o poder preditivo do modelo. É por fim, desenvolver um Minimum Viable Product (MVP) como prova de conceito para demonstrar o resultado das predições, explicabilidade das descobertas, com análises descritivas e preditivas dos padrões que podem influenciar na permanência dos alunos no curso.