KDD, EDM, mineração de dados educacionais, evasão, claasificação com classes desbalanceadas.
No presente documento corresponde à proposta de tese de doutorado, cujo objetivo principal é a proposição de um método baseado na metodologia de Extração de conhecimento (também conhecido como processo KDD, do inglês knowledge-discovery in data-bases ) para o contexto de Dados Educacionais com ênfase no problema da evasão escolar. Para isto, são investigadas e propostas o emprego de técnicas estatísticas, mineração de dados e visualização, a fim de definir um método baseado nas fases do KDD com o objetivo de gerar um modelo com uma melhor predição de evasão no contexto educacional. A preocupação pela evasão se dá pelo fato que esse fenômeno representa oportunidades de mudança de vida desperdiçadas, menos mão-de-obra qualificada no mercado de trabalho, menor chance de mobilidade social, principalmente em um país com índices de desigualdades sociais como o Brasil. Entretanto, foi verificado que esse problema é algo complexo e contextualizado. Portanto, desenvolver um método para detecção de evasão pode possibilitar a prevenção do desligamento do aluno com a instituição de educação de acordo com o contexto escolar, ao invés do desenvolvimento de um modelo geral e complexo, que pode comprometer a qualidade de predição. Em termos estatísticos, ele é considerado como um problema de classes desbalanceadas, necessitando-se, assim, se utilizar métricas apropriadas como recall e matriz de confusão, a fim de gerar modelos com predições confiáveis. Para validação do método proposto, são utilizados dados educacionais de alunos dos cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN). Os resultados preliminares obtidos mostram que os atributos de caracterização social influenciam na predição da evasão escolar, mas não são fatores determinantes para evasão do aluno, tal como as notas nas disciplinas (desempenho escolar). Porém, essas duas informações quando utilizadas em conjunto, produzem um bom modelo preditivo.