RAY-Net：一種融合了輔助修正的摩托車頭盔檢測方法-科研動態-中國石油大學（北京）人工智能學院

學校主頁

您所在的位置：首頁 - 科學研究 - 科研動態

科研動態

RAY-Net：一種融合了輔助修正的摩托車頭盔檢測方法

日期：2024-07-29 | 訪問量：

中文題目：RAY-Net：一種融合了輔助修正的摩托車頭盔檢測方法

論文題目：RAY-Net: A Motorcycle Helmet Detection Method Integrated Auxiliary Correction

錄用會議：The 2024 Twentieth International Conference on Intelligent Computing (CCF C)

作者列表：

1）劉志強中國石油大學（北京）人工智能學院碩23

2）王智廣中國石油大學（北京）人工智能學院計算機科學與技術系教師

3）李曉雪中國石油大學（北京）人工智能學院碩23

4）祝留宇中國石油大學（北京）人工智能學院碩23

5）胡思潁中國石油大學（北京）人工智能學院碩22

6）魯強中國石油大學（北京）人工智能學院智能科學與技術系教師

摘要:

在城市交通安全監測領域，檢測行駛中的摩托車的駕駛員是否佩戴頭盔是一項至關重要且具有實際意義的任務，然而這一任務目前面臨兩大挑戰。首先，該領域缺乏涵蓋夜間和雨天等挑戰性場景的開源數據集。其次，行人和路邊停放的摩托車通常會干擾行駛中的摩托車的檢測任務，從而影響檢測結果的準確性。為了解決上述兩個問題，本文收集并注釋了夜間等具有挑戰性的場景的圖像，得到了52800張注釋圖像，構建了一個更為全面的數據集，并將其命名為增強型摩托車頭盔檢測數據集（EMHDD）。此外，本文還提出了一種集成了輔助校正功能的兩階段檢測模型RAY-Net。該模型包括檢測階段和識別階段。在檢測階段，該模型通過輔助校正解決了路邊行人和停放的摩托車造成的檢測結果不理想的問題。隨后，識別階段對檢測階段的結果進行識別，并確定駕駛員是否佩戴頭盔。

設計與實現:

EMHDD

經過六個月的工作，本文收集了多個城市道路中包括白天、夜間、多云和雨天等場景的數據。本文通過在北京市和山東省濟南市合理地設置了多個采樣點，利用攝像機拍攝收集有關摩托車的交通數據。通過對實際情況的分析以及對模型訓練效果的考慮，本文在完成數據采集工作后，進一步完成了以下三種數據的清洗工作：

長時間沒有摩托車出現的視頻片段。
摩托車未完全出現于圖像中的視頻片段。
摩托車距離攝像機很遠的視頻片段。

本文通過對所有數據的檢查和清洗工作后，獲得了265個有效視頻片段，共計440分鐘。我們從這265個視頻片段中以每秒2幀的速率提取出52800張圖像。如表1所示，白天、夜間、雨天和陰天這四種主要場景分別占整個數據集的17.05%、59.09%、9.09%和14.77%。圖1展示了該數據集中不同場景的圖像。

圖1：EMHDD中各種場景數據的展示。(a)白天；(b)夜間；(c)雨天；(d)陰天。

本文提出的摩托車頭盔檢測算法RAY-Net由檢測器和識別器組成。如圖2所示，上部分表示檢測器，下部分表示識別器。我們分別訓練這兩個獨立的網絡模塊，利用檢測器檢測出行駛中的摩托車并利用識別器識別摩托車駕駛員的頭盔佩戴情況。

本文在檢測階段增加了一個輔助校正模塊。對于檢測任務，檢測器首先檢測輸入圖像中三種類別的對象：運動中的摩托車（Driving）、人（Person）和摩托車（Motorcycle）。輔助校正模塊使用人（Person）和摩托車（Motorcycle）兩個類別校正檢測結果，該模塊通過人和摩托車的邊界框之間的交并比（IoU）評估它們的相關性，保留具有高相關性的組合以校正檢測結果。識別器對校正后的檢測結果進行識別，并判斷摩托車駕駛員是否佩戴頭盔。

圖2 RAY-Net模型的結構

該輔助校正算法的流程在Algorithm 1中給出。

實驗結果及分析:

1.對比實驗：

我們在HELMET和EMHDD數據集上進行了充分的實驗，將本文使用的檢測器和識別器與其他現有的最先進的方法進行比較。如表2和表3所示，本文提出的集成了輔助校正模塊的檢測器與其他方法相比具有更高的精度，這證明本文所提出的檢測器能夠有效地防止行人和路邊停放的摩托車被誤識別為目標物體。同時我們使用的識別器也同樣具有優勢。

值得注意的是，兩個階段的所有模型在EMHDD上的準確性與HELMET上的準確性相比，都有明顯的下降趨勢。這是因為本文自建的EMHDD數據集包括了極具挑戰性的場景，如夜間和雨天，如果不進行數據預處理，模型的準確性將受到嚴重影響。這進一步說明了未來研究需要關注更復雜的場景，同時也證明了本文自建的EMHDD數據集的全面性。

2.消融實驗：

本文對檢測器的輔助校正模塊進行了消融分析，在HELMET、HD、UMD和自建的EMHDD數據集上進行了全面的實驗，以展示本文所提出的輔助校正模塊的有效性。

如表4所示，集成了輔助校正模塊后，檢測器的精度有明顯提升。改進后的模型在開源數據集HELMET和UMD以及我們自建的EMHDD數據集上表現更好，僅在HD上的性能幾乎相同，這表明我們提出的輔助校正模塊是有效的。這是因為輔助校正模塊能夠篩除被錯誤檢測為目標對象的數據，從而提高檢測階段的準確性。

結論:

由于目前的開源數據集都存在不足，本文收集了兩個城市中不同街道的數據，并構建了一個更復雜、更全面的數據集EMHDD。本文提出的RAY-Net是一個由檢測器和識別器組成的兩階段模型，它們協同工作以提高系統的整體效率。在檢測階段，本文使用RetinaNet作為基礎模型，并添加輔助校正模塊。檢測器在檢測行駛中的摩托車的同時，還要檢測人和摩托車這兩種類別的物體作為輔助校正依據以校正檢測結果。實驗結果表明，該方法可以有效地篩除行人和路邊停放的摩托車，從而更準確地檢測出行駛中的摩托車。輔助校正模塊能夠提高系統的整體精度，并減少識別器的工作負載。在識別階段，本文使用YOLOv8作為基礎模型。實驗結果表明本文在識別階段使用的方法優于其他方法。在未來的研究中，我們將進一步考慮如何預處理不同場景的數據，以提高系統整體的準確性。

作者簡介:

王智廣，教授，博士生導師，北京市教學名師。中國計算機學會（CCF）高級會員，全國高校實驗室工作研究會信息技術專家指導委員會委員，全國高校計算機專業（本科）實驗教材與實驗室環境開發專家委員會委員，北京市計算機教育研究會常務理事。長期從事分布式并行計算、三維可視化、計算機視覺、知識圖譜方面的研究工作，主持或承擔國家重大科技專項子任務、國家重點研發計劃子課題、國家自然科學基金、北京市教委科研課題、北京市重點實驗室課題、地方政府委托課題以及企業委托課題20余項，在國內外重要學術會議和期刊上合作發表學術論文70余篇，培養了100余名碩士博士研究生。