Banca de DEFESA: JHOSEPH KELVIN LOPES DE JESUS

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : JHOSEPH KELVIN LOPES DE JESUS
DATA : 21/09/2018
HORA: 08:30
LOCAL: Auditório I DIMAp
TÍTULO:

Abordagens baseadas em Teoria da Informação para Seleção Automatizada de Atributos


PALAVRAS-CHAVES:

seleção de atributos, teoria da informação


PÁGINAS: 100
RESUMO:

 

Um dos principais problemas dos algoritmos de aprendizado de máquina é a maldição da dimensionalidade. Com o rápido crescimento de dados complexos em cenários do mundo real, a seleção de atributos se torna uma etapa de pré-processamento obrigatória em qualquer aplicação para reduzir a complexidade dos dados e o tempo computacional. Com base nisso, vários trabalhos foram produzidos para desenvolver métodos eficientes para realizar essa tarefa. A maioria dos métodos de seleção de atributos selecionam os melhores atributos baseado em alguns critérios específicos. Além disso, estudos recentes têm construído com sucesso modelos para selecionar atributos considerando as particularidades dos dados, assumindo que amostras similares devem ser tratadas separadamente. Embora algum avanço tenha sido feito, uma má escolha de um único algoritmo ou critério para avaliar a importância dos atributos, e a escolha arbitrária dos números de atributos feita pelo usuário podem levar a uma análise deficiente. A fim de superar algumas dessas questões, este trabalho apresenta o desenvolvimento de algumas duas vertentes de abordagens de seleção de atributos automatizadas. A primeira são métodos de fusão de múltiplos algoritmos de seleção de atributos, que utilizam estratégias baseadas em ranking e comitês de classificadores para combinar algoritmos de seleção de atributos em termos de dados (Fusão de Dados) e de decisão (Fusão de Decisão), permitindo aos pesquisadores considerar diferentes perspectivas na etapa de seleção de atributos. O segundo método (PF-DFS) traz uma melhoria de um algoritmo de seleção dinâmico (DFS) usando a ideia da otimização multiobjetivo pela fronteira de pareto, que nos permite considerar perspectivas distintas da relevância dos atributos e definir automaticamente o número de atributos para selecionar. As abordagens propostas foram testadas usando mais de 15 bases de dados reais e artificiais e os resultados mostraram que, quando comparado com métodos de seleção individuais, como o próprio DFS original, o desempenho de um dos métodos propostos é notavelmente superior. De fato, os resultados são promissores, uma vez que as abordagens propostas também alcançaram desempenho superiores quando comparados a métodos consagrados da redução de dimensionalidade, e ao usar os conjuntos de dados originais, mostrando que a redução de atributos ruidosos e/ou redundantes pode ter um efeito positivo no desempenho de tarefas de classificação.

 

MEMBROS DA BANCA:
Presidente - 1350250 - ANNE MAGALY DE PAULA CANUTO
Interno - 2212166 - BENJAMIN RENE CALLEJAS BEDREGAL
Externo ao Programa - 1669545 - DANIEL SABINO AMORIM DE ARAUJO
Externo à Instituição - ANDRÉ CARLOS PONCE DE LEON FERREIRA DE CARVALHO - USP
Notícia cadastrada em: 10/09/2018 10:58
SIGAA | Superintendência de Informática - (84) 3215-3148 | Copyright © 2006-2019 - UFRN - sigaa02-producao.info.ufrn.br.sigaa02-producao