FiberNet: um modelo de Rede Neural Convolucional simples e eficiente
Rede Neural Convolucional, classificação de imagens, planta Agave Sisalana.
Com o crescente aumento na geração de dados a cada ano, uma ampla variedade de tecnologias tem emergido com o objetivo de transformar essas informações em insights úteis. No entanto, muitas vezes, os custos financeiros e computacionais associados aos softwares utilizados nesse processo os tornam inacessíveis para a maioria das pessoas. Um exemplo notável é o requisito de hardware específico, como os processadores Graphics Processing Unit (GPU) e Tensor Processing Unit (TPU), que são altamente avançados em termos tecnológicos, mas também são notavelmente caros.
Esses desafios de acessibilidade se refletem em várias áreas da computação, incluindo a aplicação de redes neurais convolucionais (CNNs), que desempenham um papel crucial na área de visão computacional. As CNNs são altamente eficazes para extrair informações significativas de imagens e identificar objetos. No entanto, o alto custo associado a recursos de ponta, como GPUs e TPUs, pode limitar a adoção generalizada dessas redes poderosas. Isso torna imperativo explorar alternativas que permitam a construção e implantação de modelos eficazes com recursos mais acessíveis, sem comprometer a qualidade dos resultados obtidos.
Nesse contexto, apresentamos nossa pesquisa, na qual desenvolvemos um algoritmo que se diferencia dos demais modelos existentes em termos de tamanho, quantidade de parâmetros treináveis e velocidade de inferência. Apesar de ser compacto, o algoritmo mantém uma alta acurácia e capacidade de processar grandes volumes de dados.
A arquitetura proposta, chamada FiberNet em referência à palmeira do sisal, é uma CNN pequena e simples. O objetivo principal é oferecer um modelo de baixo custo viável financeiramente para classificar imagens de Agave Sisalana e suas fibras. A FiberNet possui um número reduzido de parâmetros treináveis, resultando em alta velocidade de inferência. Para alcançar esse resultado, utilizamos uma camada especializada que reduz a dimensão dos dados de entrada antes das camadas de convolução.
O objetivo principal desta pesquisa é reduzir o custo computacional sem comprometer o desempenho do algoritmo. Para avaliar a viabilidade do método proposto, realizamos uma análise empírica na qual nosso modelo alcançou uma precisão de 96,25% com a base Sisal e 74,9% com a base CIFAR10, utilizando apenas 754.345 parâmetros treináveis. Além disso, aplicamos o método proposto a um conjunto de dados de imagens amplamente reconhecido, obtendo resultados promissores. Esses resultados reforçam a eficácia e a aplicabilidade do nosso modelo na prática.