Banca de QUALIFICAÇÃO: DIEGO SOARES DOS SANTOS

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE : DIEGO SOARES DOS SANTOS
DATA : 28/03/2018
HORA: 14:00
LOCAL: B109
TÍTULO:

Uma plataforma distribuída de aprendizado de máquina para Big Data: um estudo de caso aplicado à Secretaria de Tributação do Rio Grande do Norte


PALAVRAS-CHAVES:

Mineração de texto, Aprendizado de Máquina, Big Data, Data Warehouse


PÁGINAS: 75
RESUMO:

O volume de dados armazenados e acessados diariamente vem crescendo em escala geométrica. Todos os dias são gerados cerca de 2,5 quintilhões de bytes (2,5 bilhões de gigabytes). Além disso, 90% dos dados no mundo foram produzidos nos últimos dois anos. Muitos termos têm sido utilizados para descrever esse volume gigante de dados armazenados de forma estruturada ou não. Big Data é um dos desses termos. Para muitos pesquisadores, Big Data é o fenômeno em que os dados são produzidos em vários formatos e armazenados por uma grande quantidade de dispositivos e equipamentos. Muito também tem sido feito para oferecer  ferramentas e frameworks open sources que, possam lidar ou oferecer funcionalidades capazes de manipular esse enorme volume de dados. Contudo, como a natureza dos dados é bastante diversa, escolher ou desenvolver ferramentas necessárias para lidar com esses dados se torna um problema nada trivial. Além disso, poucas ferramentas disponibilizam pacotes ou bibliotecas de técnicas de mineração de dados. Isso torna difícil manipular dados com características muito específicas, tais como a descrição de um produto, principalmente por ser totalmente flexível e sem validação. Por essa razão, em certos domínios de problema, é necessário aplicar técnicas de mineração de dados em atributos constituídos por livre texto para extrair valores padronizados. O objetivo principal deste trabalho é propor uma plataforma distribuída de aprendizado de máquina para a Secretaria de Tributação do Rio Grande do Norte, que possa armazenar, acessar, manipular e analisar grande volume de dados. Além disso, as características dos dados a serem manipulados (notas fiscais eletrônicas) exigem o uso de técnicas de aprendizado de máquina que possam extrair dados de atributos textuais.


MEMBROS DA BANCA:
Presidente - 4351681 - JOAO CARLOS XAVIER JUNIOR
Interno - 2859562 - LEONARDO CESAR TEONACIO BEZERRA
Externo ao Programa - 1363515 - ANDRE MAURICIO CUNHA CAMPOS
Externo à Instituição - ALBERTO SIGNORETTI - UERN
Notícia cadastrada em: 12/03/2018 16:20
SIGAA | Superintendência de Informática - | | Copyright © 2006-2020 - UFRN - sigaa20-producao.info.ufrn.br.sigaa20-producao