Portal de Programas de Pós-Graduação (UFRN)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPgSC/UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO ADMINISTRAÇÃO DO CCET Teléfono/Ramal: (84)3342-2225/115 E-mail: ppgsc@ppgsc.ufrn.br https://posgraduacao.ufrn.br/ppgsc

Banca de QUALIFICAÇÃO: DENIS JOSÉ SOUSA DE ALBUQUERQUE

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : DENIS JOSÉ SOUSA DE ALBUQUERQUE
DATA : 28/03/2019
HORA: 14:00
LOCAL: DIMAp, Auditório I
TÍTULO:

Identificação de dificuldades e questões de interesse de desenvolvedores de aplicações para Big Data com o framework Apache Spark

PALAVRAS-CHAVES:

Big Data, Apache Spark, modelagem de tópicos probabilística, Latent Dirichlet Allocation (LDA), Stack Overflow, taxonomia.

PÁGINAS: 83
RESUMO:

Este trabalho de pesquisa busca identificar e classificar as principais dificuldades e questões de interesse dos desenvolvedores de aplicações para o processamento de Big Data utilizando o framework Apache Spark. Nesse sentido, utilizamos o algoritmo Latent Dirichlet Allocation para realizar uma modelagem probabilística de tópicos em informações extraídas do Stack Overflow, uma vez que não é viável a inspeção manual de todo o conjunto de dados. A partir do estudo compreensivo de trabalhos relacionados, estabelecemos e aplicamos uma metodologia, bem como construímos uma aplicação Spark para execução das tarefas, utilizando as bibliotecas Spark SQL e MLlib (para de aprendizagem de máquina). Análises sobre os resultados obtidos foram realizadas por um grupo composto por 5 pesquisadores: dois professores doutores, um aluno doutorando e dois alunos mestrandos. A partir da análise semântica dos rótulos atribuídos a cada um dos tópicos identificados, uma taxonomia de interesses e dificuldades foi construída.

MEMBROS DA BANCA:
Presidente - 1495704 - UMBERTO SOUZA DA COSTA
Interno - 1221251 - MARTIN ALEJANDRO MUSICANTE
Externo ao Programa - 1066308 - MARCUS ALEXANDRE NUNES

Notícia cadastrada em: 19/03/2019 08:51