Portal de Programas de Pós-Graduação (UFRN)

SIGAA - Sistema Integrado de Gestão de Atividades Acadêmicas

PPgSC/UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO ADMINISTRAÇÃO DO CCET Phone: (84)3342-2225/115 E-mail: ppgsc@ppgsc.ufrn.br https://posgraduacao.ufrn.br/ppgsc

Banca de DEFESA: DENIS JOSÉ SOUSA DE ALBUQUERQUE

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : DENIS JOSÉ SOUSA DE ALBUQUERQUE
DATA : 27/09/2019
HORA: 08:00
LOCAL: DIMAp, Auditório I
TÍTULO:

Identificação de dificuldades e questões de interesse de desenvolvedores de aplicações para Big Data com o framework Apache Spark

PALAVRAS-CHAVES:

Big Data, Apache Spark, modelagem de tópicos probabilística, Latent Dirichlet Allocation (LDA), Stack Overflow, taxonomia.

PÁGINAS: 115
RESUMO:

Este trabalho de pesquisa busca identificar e classificar as principais dificuldades e questões de interesse dos desenvolvedores de aplicações para o processamento de Big Data utili- zando o framework Apache Spark. Nesse sentido, utilizamos o algoritmo Latent Dirichlet Allocation para realizar a modelagem probabilística de tópicos em informações extraí- das do Stack Overflow, uma vez que não é viável a inspeção manual de todo o conjunto de dados. A partir do conhecimento obtido pelo estudo abrangente de trabalhos relacionados, estabelecemos e aplicamos uma metodologia baseada nas práticas usualmente empregadas. Construímos aplicações Spark para execução automatizada das tarefas, tais como a seleção e preparação dos dados, o agrupamento de tópicos – aplicação do algoritmo de modelagem probabilista para várias configurações – e a computação de métricas. Análises sobre os resultados obtidos foram conduzidas por um grupo composto por 5 pesquisadores: dois professores doutores, um aluno doutorando e dois alunos mestrandos. A partir da análise semântica dos rótulos atribuídos para cada um dos tópicos identificados, uma taxonomia de interesses e dificuldades foi construída. Por fim, estabelecemos um ranqueamento dos temas mais importantes de acordo com as várias métricas calculadas e comparamos os métodos e resultados de nosso estudo com os apresentados em outro trabalho.

MEMBROS DA BANCA:
Presidente - 1495704 - UMBERTO SOUZA DA COSTA
Interno - 1221251 - MARTIN ALEJANDRO MUSICANTE
Externo ao Programa - 1066308 - MARCUS ALEXANDRE NUNES
Externo à Instituição - PLACIDO ANTONIO DE SOUZA NETO - IFRN

Notícia cadastrada em: 12/09/2019 17:27