Um pipeline Híbrido de Structure-from-Motion e Vision Transformer para Medição Rápida e Precisa de Feridas Crônicas
Reconstrução 3D, Feridas Crônicas, Structure from Motion
(SfM), Redes Neurais Profundas, Smartphones, Visão Computacional, Fotogrametria, Imagens Biomédicas, Tecnologias de Saúde Acessíveis
A medição precisa de feridas crônicas é essencial para o monitoramento
clínico; contudo, métodos manuais carecem de precisão, e a fotogrametria
3D convencional — especialmente o Multi-View Stereo (MVS) — é computa-
cionalmente onerosa para aplicações móveis e pouco robusta em superfícies
cutâneas com baixa textura. Para contornar essas limitações, este trabalho
propõe um pipeline híbrido de reconstrução tridimensional (3D) que combina
o Structure-from-Motion (SfM) com uma rede neural profunda baseada em
Vision Transformers (ViT), o DepthAnythingV2. A densificação via MVS
é substituída por inferência de profundidade monocular, com recuperação
de escala métrica baseada em marcadores e fusão volumétrica TSDF, asse-
gurando coerência geométrica e estabilidade da reconstrução em diferentes
condições de aquisição.
A abordagem foi comparada a um pipeline SfM+MVS otimizado por
Otimização Bayesiana. Resultados com fantomas sintéticos e imagens clínicas
mostram que o método híbrido alcança MAE de 1,85 cm2 (erro relativo médio
de 10%), enquanto o SfM+MVS apresenta MAE de 1,50 cm2 e erro relativo
de 8,2%, indicando desempenho próximo. O teste de Wilcoxon não apontoudiferença estatisticamente significativa ao nível de 5% (p = 0, 0923). Além
disso, o método proposto reduz o tempo de processamentos, favorecendo sua
adoção em cenários de acompanhamento longitudinal de feridas, ampliando o
potencial de uso contínuo em dispositivos móveis convencionais.