中文題目:基于多種圖神經網絡和Transformer的車輛軌跡預測方法
論文題目:Multiple Graph Neural Networks and Transformers for Vehicle Trajectory Prediction
錄用期刊/會議:中國自動化大會 (CAA A類會議)
錄用時間:2024.9.18
作者列表:
1) 楊 潔 中國石油大學(北京)人工智能學院 控制科學與工程 研22級
2) 劉建偉 中國石油大學(北京)人工智能學院 自動化系 教師
摘要:
在復雜的交通場景中,根據周圍道路使用者的行為合理規劃自己的前進路線對于自動駕駛汽車十分重要。為了更好的解決這一問題,本文提出了一種新穎的基于多種圖神經網絡和Transformer的車輛軌跡預測模型(MGNformer)。MGNformer中用于提取時空特征的編碼器主要由空間交互感知模塊(SIPM)和時間依賴感知模塊(TDPM)構成,其中SIPM中包含多尺度超圖神經模塊(MHM)和圖注意力模塊(GAM),可以從不同維度上捕獲軌跡數據中的空間交互特征,TDPM中通過使用可變形自注意力機制可以捕捉軌跡數據中時間維度上的長距離依賴關系??紤]到車輛意圖對于未來軌跡的影響,本文額外設計了意圖-軌跡融合模塊,將車輛的意圖概率與軌跡特征向量相融合來獲取具有更加豐富信息的融合嵌入,將其饋入解碼器中生成未來軌跡,以此提高軌跡預測的準確性。我們在兩個公開的真實車輛軌跡數據集上對MGNformer進行了評估。實驗結果表明,MGNformer在NGSIM數據集和HighD數據集上的RMSE降低了5.49%/16.67%,達到了預期結果。
背景與動機:
近年來,智能化的自動駕駛汽車因其無需駕駛員操縱的特點,在很大程度上緩解了交通擁堵的問題,減輕了駕駛員的駕駛負擔,提高了駕駛安全。然而,真實的行車環境往往是復雜多變的,這對自動駕駛汽車的安全性提出了很高的要求。例如,當周圍有其他車輛駛入,自動駕駛汽車應當及時減速以避免碰撞。自動駕駛車輛需要具備預測未來交通狀況的能力,從而像人類駕駛員一樣在行駛的過程中做出合理的決策規劃。由于道路使用者之間存在著強烈的相互作用,并且這種相互作用是未知的,這使得準確建模和預測目標車輛的未來軌跡面臨許多挑戰。在過去的幾年中,越來越多的研究人員開始使用LSTM等神經網絡處理軌跡預測問題,預測精度得到了明顯提升,但仍然存在著一些局限。首先,LSTM作為目前處理軌跡預測任務的主要方法,其工作原理是按順序處理時間序列數據,以表征車輛的速度、方向和運動模式。在工作過程中LSTM需要不斷地將自身上一刻的輸出當作輸入的反饋循環,這會為模型帶來很高的計算成本,特別是對于處理時間跨度較大的預測問題仍然具有明顯的局限性。其次,目前在軌跡預測問題上對注意力機制的應用過于簡單,還無法細致地模擬出車輛之間的互動。最后,現有研究大多是將軌跡預測和車輛換道意圖分別進行研究,建立兩個預測模型,這樣難免會忽略車輛換道意圖于未來軌跡之間的內在聯系,進而犧牲了準確性。
主要內容:
本文模型主要由編碼器、意圖-軌跡融合模塊、解碼器三部分組成,如圖2所示。編碼器中包含空間交互感知模塊(SIPM)和時間依賴感知模塊(TDPM),可以提取軌跡數據中的時空特征,進而獲得意圖特征向量和軌跡特征向量。意圖-軌跡融合模塊將車輛的意圖概率與軌跡特征向量相融合獲得具有更加豐富信息的融合嵌入。最后,解碼器根據意圖-軌跡的融合嵌入生成更加準確的軌跡。
SIPM由多尺度超圖模塊(MHM)和圖注意力模塊(GAM)構成。其中,MHM通過數據驅動的方式學習超圖拓撲結構,從多個智能體軌跡中捕獲成對和分組的交互,從而學習到更能表示空間交互信息的嵌入表示,結構如圖3所示。GAM通過在節點之間引入注意力機制使得模型能夠更好地捕捉節點之間的關系和和特征信息。MHM對于處理群體性的交互更具有優勢,GAM則更擅長捕捉局部關鍵節點關系,將二者提取到的空間特征進行融合,可以獲得更加全面的特征表示。TDPM主要是由可變形注意力機制、前饋神經網絡、殘差連接和歸一化層組成的。意圖-軌跡融合模塊可以在軌跡特征饋入解碼器生成未來軌跡之前,首先預測車輛的換道意圖,并將意圖概率與歷史軌跡嵌入、軌跡特征向量進行融合,將此包含更豐富信息的嵌入饋入到解碼器中,確保模型能夠更加全面地理解場景動態,進而輸出更為精確的車輛未來軌跡預測結果。解碼器結構與TDPM結構類似,主要由可變形注意力層、前饋神經網絡、殘差連接和歸一化層組成。
圖2. MGNformer模型架構圖
圖3 MHM結構圖
結論:
本文提出了一種基于多種圖神經網絡和Transformer的車輛軌跡預測方法使用多尺度超圖神經網絡和圖注意力網絡提取不同維度上軌跡數據的空間特征,使用可變形注意力機制捕捉軌跡數據中時間維度上的長距離依賴關系,進而得到高質量的軌跡時空特征。為了描述車輛意圖與未來軌跡之間的相關性,本文額外設計意圖分類任務,將車輛的意圖概率與軌跡特征融合,從而生成更加準確的未來軌跡。實驗結果表明,MGNformer在單模態預測和多模態預測上都明顯優于其他最先進的方法目前,本工作僅在高速公路場景中驗證了預測模型的效果,在未來的研究中我們將把模型的應用擴展到更廣泛的應用場景中,以彰顯實用價值。
作者簡介:
劉建偉,教師,學者。發表學術研究論文280多篇。