Banca de DEFESA: ANDERSON COSTA LIMA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : ANDERSON COSTA LIMA
DATA : 25/07/2024
HORA: 14:00
LOCAL: Videoconferência: https://meet.google.com/crr-guwr-mrq
TÍTULO:

MINERAÇÃO DE DADOS EDUCACIONAIS E MACHINE LEARNING PARA ANÁLISE E PREVENÇÃO DA EVASÃO ESCOLAR EM UM CURSO DE GRADUAÇÃO


PALAVRAS-CHAVES:

Evasão escolar, Análise preditiva, Random Forest, Self-organizing Maps, SHapley Additive exPlanations


PÁGINAS: 108
RESUMO:

As universidades enfrentam o desafio de como transformar uma grande quantidade de dados
de seus estudantes em informações que possam gerar conhecimento para aprimorar a gestão
acadêmica e diminuir os índices de evasão escolar no ensino superior. Uma abordagem
promissora para identificar os fatores que influenciam o desempenho acadêmico é a
mineração de dados educacionais (MDE) e Machine Learning (ML). Objetiva-se com essa
pesquisa desenvolver um método que permita encontrar as principais características
relacionadas à evasão no curso de Interdisciplinar em Ciência e Tecnologia (C&T) na
Universidade Federal do Rio Grande do Norte (UFRN), considerando os alunos ingressantes
entre os anos de 2014 a 2023. Por meio de uma revisão da literatura, foram identificados
algoritmos de ML adequados para uma abordagem híbrida, combinando o Random Forest
(classificação) e Self-Organizing Maps (clustering), com análises de explicabilidade SHapley
Additive exPlanations (SHAP), o processo incluiu Knowledge Discovery in Databases
adaptado com etapas (coleta de dados, pré-processamento, mapeamento de características,
treinamento e teste, análise de explicabilidade). Como resultados, tem-se um modelo
preditivo com o Random Forest que alcançou uma acurácia inicial de 93% na identificação
de alunos em risco de evasão, e posteriormente acurácia de 91% e 89% para dados
desconhecidos, mostrando consistência e capacidade de generalização. A pesquisa ainda
revelou que a evasão escolar no curso é influenciada por diversos fatores, incluindo aspectos
curriculares, socioeconômicos e demográficos. A análise com Self-Organizing Maps permitiu
criar um mapa de características que mostra a relação entre diversos atributos e a situação
educacional dos alunos. A combinação com SHAP possibilitou entender de forma abrangente
a influência dos atributos nas previsões do modelo, destacando a importância de variáveis
como desempenho acadêmico, idade de ingresso, cidade de origem e condição
socioeconômica. Por fim, desenvolveu-se um Minimum Viable Product (MVP) como prova
de conceito para demonstrar os resultados das predições e a explicabilidade das descobertas,
com análises descritivas e preditivas dos padrões que podem influenciar na permanência dos
alunos no curso.


MEMBROS DA BANCA:
Presidente - 1943220 - ORIVALDO VIEIRA DE SANTANA JUNIOR
Interno - 1753067 - EFRAIN PANTALEON MATAMOROS
Externa ao Programa - 2321426 - KELLY KALIANE REGO DA PAZ RODRIGUES - UFRNExterno à Instituição - ANDRÉ LAGE FREITAS - UFAL
Notícia cadastrada em: 25/07/2024 14:42
SIGAA | Superintendência de Tecnologia da Informação - (84) 3342 2210 | Copyright © 2006-2024 - UFRN - sigaa13-producao.info.ufrn.br.sigaa13-producao