Exploração e Consulta em Linguagem Natural de Asset Administration Shells com Recuperação Semântica e Retrieval-Augmented Generation
Asset Administration Shell; AASX; busca semântica; embeddings; Retrieval-Augmented Generation; Indústria 4.0.
O padrão Asset Administration Shell (AAS) desempenha um papel relevante na representação de ativos industriais. Entretanto, seu uso prático ainda é limitado pela complexidade estrutural dos pacotes AASX e pela dispersão de informações entre conteúdos estruturados, como arquivos XML, e artefatos não estruturados embarcados, como documentos PDF. Além disso, observa-se uma lacuna na disponibilidade de ferramentas que permitam organizar, explorar e consultar ativos AAS de forma simples e acessível, especialmente para usuários sem conhecimento técnico especializado.
Este trabalho propõe uma metodologia e uma arquitetura de referência para simplificar o acesso, a exploração e a consulta de dados AAS por meio de linguagem natural, combinando extração estruturada, indexação vetorial e Retrieval-Augmented Generation (RAG) com rastreabilidade explícita de evidências. A abordagem integra conteúdos estruturados e não estruturados dos pacotes AASX em uma representação orientada a consultas e à recuperação semântica da informação, realiza a segmentação e indexação semântica dos dados em uma base vetorial e gera respostas fundamentadas no contexto recuperado, acompanhadas das respectivas fontes e metadados de origem.
A validação é conduzida sobre um conjunto de amostras públicas de múltiplos fabricantes, e a qualidade das respostas é estimada por avaliação automatizada baseada em modelos de linguagem de grande escala (LLM-as-a-judge), com critério orientado à correção factual em relação a respostas de referência. Os resultados indicam que a metodologia proposta viabiliza consultas em linguagem natural com rastreabilidade e transparência, facilita o acesso às informações contidas nos pacotes AAS e sugere potencial para tornar sua exploração mais acessível, ao mesmo tempo em que preserva a aderência ao conteúdo original e os princípios de padronização e interoperabilidade do AAS.