中文題目:RAY-Net:一種融合了輔助修正的摩托車頭盔檢測方法
論文題目:RAY-Net: A Motorcycle Helmet Detection Method Integrated Auxiliary Correction
錄用會議:The 2024 Twentieth International Conference on Intelligent Computing (CCF C)
作者列表:
1) 劉志強 中國石油大學(北京)人工智能學院 碩23
2) 王智廣 中國石油大學(北京)人工智能學院 計算機科學與技術系 教師
3) 李曉雪 中國石油大學(北京)人工智能學院 碩23
4) 祝留宇 中國石油大學(北京)人工智能學院 碩23
5) 胡思潁 中國石油大學(北京)人工智能學院 碩22
6) 魯 強 中國石油大學(北京)人工智能學院 智能科學與技術系 教師
經過六個月的工作,本文收集了多個城市道路中包括白天、夜間、多云和雨天等場景的數據。本文通過在北京市和山東省濟南市合理地設置了多個采樣點,利用攝像機拍攝收集有關摩托車的交通數據。通過對實際情況的分析以及對模型訓練效果的考慮,本文在完成數據采集工作后,進一步完成了以下三種數據的清洗工作:
本文通過對所有數據的檢查和清洗工作后,獲得了265個有效視頻片段,共計440分鐘。我們從這265個視頻片段中以每秒2幀的速率提取出52800張圖像。如表1所示,白天、夜間、雨天和陰天這四種主要場景分別占整個數據集的17.05%、59.09%、9.09%和14.77%。圖1展示了該數據集中不同場景的圖像。
圖1:EMHDD中各種場景數據的展示。(a)白天;(b)夜間;(c)雨天;(d)陰天。
本文提出的摩托車頭盔檢測算法RAY-Net由檢測器和識別器組成。如圖2所示,上部分表示檢測器,下部分表示識別器。我們分別訓練這兩個獨立的網絡模塊,利用檢測器檢測出行駛中的摩托車并利用識別器識別摩托車駕駛員的頭盔佩戴情況。
本文在檢測階段增加了一個輔助校正模塊。對于檢測任務,檢測器首先檢測輸入圖像中三種類別的對象:運動中的摩托車(Driving)、人(Person)和摩托車(Motorcycle)。輔助校正模塊使用人(Person)和摩托車(Motorcycle)兩個類別校正檢測結果,該模塊通過人和摩托車的邊界框之間的交并比(IoU)評估它們的相關性,保留具有高相關性的組合以校正檢測結果。識別器對校正后的檢測結果進行識別,并判斷摩托車駕駛員是否佩戴頭盔。
圖2 RAY-Net模型的結構
該輔助校正算法的流程在Algorithm 1中給出。
實驗結果及分析:
我們在HELMET和EMHDD數據集上進行了充分的實驗,將本文使用的檢測器和識別器與其他現有的最先進的方法進行比較。如表2和表3所示,本文提出的集成了輔助校正模塊的檢測器與其他方法相比具有更高的精度,這證明本文所提出的檢測器能夠有效地防止行人和路邊停放的摩托車被誤識別為目標物體。同時我們使用的識別器也同樣具有優勢。
值得注意的是,兩個階段的所有模型在EMHDD上的準確性與HELMET上的準確性相比,都有明顯的下降趨勢。這是因為本文自建的EMHDD數據集包括了極具挑戰性的場景,如夜間和雨天,如果不進行數據預處理,模型的準確性將受到嚴重影響。這進一步說明了未來研究需要關注更復雜的場景,同時也證明了本文自建的EMHDD數據集的全面性。
2.消融實驗:
本文對檢測器的輔助校正模塊進行了消融分析,在HELMET、HD、UMD和自建的EMHDD數據集上進行了全面的實驗,以展示本文所提出的輔助校正模塊的有效性。
如表4所示,集成了輔助校正模塊后,檢測器的精度有明顯提升。改進后的模型在開源數據集HELMET和UMD以及我們自建的EMHDD數據集上表現更好,僅在HD上的性能幾乎相同,這表明我們提出的輔助校正模塊是有效的。這是因為輔助校正模塊能夠篩除被錯誤檢測為目標對象的數據,從而提高檢測階段的準確性。
結論:
由于目前的開源數據集都存在不足,本文收集了兩個城市中不同街道的數據,并構建了一個更復雜、更全面的數據集EMHDD。本文提出的RAY-Net是一個由檢測器和識別器組成的兩階段模型,它們協同工作以提高系統的整體效率。在檢測階段,本文使用RetinaNet作為基礎模型,并添加輔助校正模塊。檢測器在檢測行駛中的摩托車的同時,還要檢測人和摩托車這兩種類別的物體作為輔助校正依據以校正檢測結果。實驗結果表明,該方法可以有效地篩除行人和路邊停放的摩托車,從而更準確地檢測出行駛中的摩托車。輔助校正模塊能夠提高系統的整體精度,并減少識別器的工作負載。在識別階段,本文使用YOLOv8作為基礎模型。實驗結果表明本文在識別階段使用的方法優于其他方法。在未來的研究中,我們將進一步考慮如何預處理不同場景的數據,以提高系統整體的準確性。
王智廣,教授,博士生導師,北京市教學名師。中國計算機學會(CCF)高級會員,全國高校實驗室工作研究會信息技術專家指導委員會委員,全國高校計算機專業(本科)實驗教材與實驗室環境開發專家委員會委員,北京市計算機教育研究會常務理事。長期從事分布式并行計算、三維可視化、計算機視覺、知識圖譜方面的研究工作,主持或承擔國家重大科技專項子任務、國家重點研發計劃子課題、國家自然科學基金、北京市教委科研課題、北京市重點實驗室課題、地方政府委托課題以及企業委托課題20余項,在國內外重要學術會議和期刊上合作發表學術論文70余篇,培養了100余名碩士博士研究生。