Promovendo a Relevância da Pesquisa: Um Modelo Baseado em Processamento de Linguagem Natural para Identificação de Publicações Acadêmicas Alinhadas aos ODS
Objetivos de Desenvolvimento Sustentável, Classificação Multi-rótulo, Aprendizado Profundo, Processamento de Linguagem Natural, Scientometrics.
Em 2015, as Nações Unidas estabeleceram os 17 Objetivos de Desenvolvimento Sustentável (ODS) para promover o cuidado ambiental, o avanço econômico e a equidade social. Dentro desse contexto, a pesquisa científica desempenha um papel fundamental na abordagem dos desafios abrangidos pelos ODS. Uma ferramenta exemplar, o SciVal, facilita a correlação dos resultados científicos com os ODS por meio de análises especializadas. No entanto, a fim de mitigar a dependência de conhecimento especializado e oferecer uma solução autônoma, este projeto propõe um modelo de classificação multi-alvo baseado em processamento de linguagem natural, aprendizado profundo de máquina, técnicas de interpretabilidade e boas práticas para o desenvolvimento e análise de fluxos de dados. O objetivo é mapear efetivamente as publicações acadêmicas aos ODS. Ao empregar esse modelo proposto, o imenso potencial da pesquisa acadêmica pode ser explorado, alinhando-o diretamente à agenda global para o desenvolvimento sustentável. Pesquisadores, formuladores de políticas e organizações podem navegar habilmente pelo extenso campo de artigos de pesquisa e identificar aqueles que se harmonizam com suas áreas de interesse específicas dentro do quadro dos ODS. Mais de um milhão de publicações científicas foram utilizadas para treinar e avaliar o modelo. O corpus compreendeu títulos de publicações extraídas do banco de dados Scopus, acessado por meio da ferramenta SciVal, e anotadas com relação a 16 dos 17 ODS. Para comprovar a eficácia do modelo proposto, ele foi aplicado para associar as publicações do Congresso Brasileiro de Automação (CBA 2020) aos ODS, mensurando assim a contribuição dos esforços científicos na automação para o alcance dos ODS. Os resultados no contexto do CBA 2020 revelaram temas predominantes relacionados aos ODS 7 e 9, que dizem respeito à energia limpa e à inovação industrial, respectivamente. Considerando o amplo conjunto de dados de treinamento e a abrangência dos ODS abordados, o modelo pode ser aplicado com confiança para relacionar a produção acadêmica de diversas áreas aos ODS.