中文題目:基于關系約束的膠囊圖網絡非剛體形狀匹配
論文題目:Relation Constrained Capsule Graph Neural Networks for Non-rigid Shape Correspondence
錄用期刊:ACM Transactions on Intelligent Systems and Technology(中科院大類4區,JCR Q1)
原文DOI:https://doi.org/10.1145/3688851
作者列表:
1) 連遠鋒 中國石油大學(北京)人工智能學院 智能科學與技術系 教師
2) 裴守爽 中國石油大學(北京)人工智能學院 計算機科學與技術專業 碩20
3) 陳夢琪 中國石油大學(北京)人工智能學院 計算機科學與技術專業 碩21
4) 華 璟 美國韋恩州立大學 計算機科學系
摘要:
三維動態形狀之間的精確對應關系是分析和量化形變的關鍵任務。針對非剛性三維形狀匹配易受拓撲結構變化影響而導致精度降低的問題,提出基于關系約束的膠囊圖網絡(RC-CGNet),構建嵌入特征空間與輸入形狀幾何特征之間的關系約束,依托函數映射框架,實現三維形狀匹配。首先,設計了擴散圖注意力網絡(DGANet)對三維形狀進行語義分割,并對分割結果采樣,獲得奇點。然后,構建奇點間測地距離最小生成樹(minimum spanning tree, MST)作為關系約束,計算正方向和對稱方向上的等距匹配關系。為提高算法的收斂速度和匹配精度,提出一種基于Nesterov加速梯度算法(NAG)的優化殘差網絡結構提取局部特征,并利用圖卷積結構提取全局特征。此外,提出了輕量級門控注意力模塊來融合全局特征和局部特征,以獲得更豐富的特征表示。由于膠囊網絡比傳統卷積神經網絡具有更好的空間推理能力,文中提出了基于路由注意力融合模塊(RAFB)的雙路由膠囊網絡,通過利用語義部分的幾何層次關系過濾低區分度膠囊。在公開數據集上的實驗結果表明,該方法具有良好的準確性和廣泛的適應性。
背景與動機:
非剛性三維形狀匹配是計算機視覺領域的研究熱點,被廣泛應用于形狀分析、量化、形狀檢索和可視化等領域。傳統形狀匹配算法首先提取三維形狀的局部特征描述符或測地距離等幾何特征,通過迭代優化匹配關系,獲得最終匹配結果。這類方法提取的三維形狀描述符魯棒性較差,因此存在匹配精度較低的問題。深度學習形狀匹配算法能夠自動提取描述符特征,通過優化函數映射矩陣求得三維形狀逐點對應關系,有效提升了匹配精度。近年來,基于深度學習的形狀匹配算法取得眾多研究成果,但這類方法通常僅提取形狀的全局特征,忽略了形狀的局部特征與空間幾何關系,當模型拓撲結構發生變化時,匹配精度會降低。
設計與實現:
圖1給出了本文算法的詳細結構。首先通過DGANet對三維模型曲面進行語義分割;然后對分割后的模型采樣進而生成奇點;接下來計算奇點間測地距離的最小生成樹并生成測地距離矩陣;然后將測地距離矩陣轉化為函數映射框架中的關系約束項,計算三維形狀的等距匹配關系。最后,通過度量測地線最小生成樹中每個點的嵌入特征和輸入形狀幾何特征之間的相似性,構建關系約束損失函數的正則化項,構建關系約束損失函數,實現網絡模型的端到端訓練。
圖1 RC-CGNet網絡結構
實驗結果及分析:
將DGANet在SHREC數據集上的語義分割結果可視化,如圖2所示。通過放大局部細節,與DiffusionNet對比,DGANet的語義分割精度高于DiffusionNet,細節更加準確,更接近真實分割結果,證明DGANet具有較強的魯棒性。進一步,圖3第一行、第二行分別展示了KIDS與TOSCA數據集的分割結果??梢钥闯?,對于不同姿勢的三維人體模型,本章方法均取得良好的語義分割效果,表現出較強的魯棒性。
圖2 人體模型數據集分割結果對比
圖3 本文方法在KIDS和TOSCA數據集上的分割結果
為了更好地展示對比,圖4展示了本文方法與CA-CGNet、MGCN和FMNet在重采樣的KIDS和SCAPE數據集上的形狀匹配結果??梢钥闯?,在重采樣的KIDS和SCAPE測試集上,本文方法的性能優于其他三種方法,證明本文方法具有更強的魯棒性。圖5展示了本文方法與CA-CGNet、MGCN在重采樣的TOSCA數據集上的測地線誤差。實驗結果表明,該方法在姿態變化較大的人體模型和非人體模型上均取得了更好的形狀匹配精度,表明RC-CGNet具有良好的泛化性。
圖4 各種方法在KIDS和SCAPE數據集上的形狀匹配結果可視化
圖5 不同方法中人體模型和非人體模型測地線誤差可視化
結論:
本文以奇點間測地曲線的最小生成樹作為關系約束,依托函數映射框架,提出了一種嵌入特征空間和輸入形狀空間的形狀匹配網絡。通過將關系約束損失整合為正則化項進一步提高形狀匹配性能。在未來的研究中,考慮將膠囊網絡擴展到形狀的局部表示,并探索關系感知路由機制。
作者簡介:
連遠鋒,教授。研究方向為圖像處理與虛擬現實、機器視覺與機器人、深度學習與數字孿生。