Banca de QUALIFICAÇÃO: DENIS JOSÉ SOUSA DE ALBUQUERQUE

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : DENIS JOSÉ SOUSA DE ALBUQUERQUE
DATA : 28/03/2019
HORA: 14:00
LOCAL: DIMAp, Auditório I
TÍTULO:


Identificação de dificuldades e questões de interesse de desenvolvedores de aplicações para Big Data com o framework Apache Spark


PALAVRAS-CHAVES:

Big Data, Apache Spark, modelagem de tópicos probabilística, Latent Dirichlet Allocation (LDA), Stack Overflow, taxonomia.


PÁGINAS: 83
RESUMO:

Este trabalho de pesquisa busca identificar e classificar as principais dificuldades e questões de interesse dos desenvolvedores de aplicações para o processamento de Big Data utilizando o framework Apache Spark. Nesse sentido, utilizamos o algoritmo Latent Dirichlet Allocation para realizar uma modelagem probabilística de tópicos em informações extraídas do Stack Overflow, uma vez que não é viável a inspeção manual de todo o conjunto de dados. A partir do estudo compreensivo de trabalhos relacionados, estabelecemos e aplicamos uma metodologia, bem como construímos uma aplicação Spark para execução das tarefas, utilizando as bibliotecas Spark SQL e MLlib (para de aprendizagem de máquina). Análises sobre os resultados obtidos foram realizadas por um grupo composto por 5 pesquisadores: dois professores doutores, um aluno doutorando e dois alunos mestrandos. A partir da análise semântica dos rótulos atribuídos a cada um dos tópicos identificados, uma taxonomia de interesses e dificuldades foi construída.


MEMBROS DA BANCA:
Presidente - 1495704 - UMBERTO SOUZA DA COSTA
Interno - 1221251 - MARTIN ALEJANDRO MUSICANTE
Externo ao Programa - 1066308 - MARCUS ALEXANDRE NUNES
Notícia cadastrada em: 19/03/2019 08:51
SIGAA | Superintendência de Informática - (84) 3215-3148 | Copyright © 2006-2019 - UFRN - sigaa10-producao.info.ufrn.br.sigaa10-producao