中文題目:高效的兩輪車違法駕駛行為檢測模型
論文題目:Efficient Detection Model of Illegal Driving Behavior in Two-Wheeled Vehicles
錄用期刊/會議:The 2024 Twentieth International Conference on Intelligent Computing (CCF C類會議)
作者列表:
1) 祝留宇 中國石油大學(北京)人工智能學院 計算機科學與技術專業 碩 23
2) 王智廣 中國石油大學(北京)人工智能學院 計算機科學與技術系教師
3) 劉志強 中國石油大學(北京)人工智能學院 計算機科學與技術專業 碩 23
4) 李曉雪 中國石油大學(北京)人工智能學院 計算機科學與技術專業 碩 23
5) 李 珅 中國石油大學(北京)人工智能學院 計算機技術系 碩23
文章簡介:
隨著現代智能交通系統的快速發展,兩輪車違法駕駛行為的智能化檢測成為了提升交通管理效率與安全性的關鍵環節。然而,這一領域的研究與實踐面臨著兩大核心挑戰:數據集的稀缺性與檢測模型性能的不盡如人意。針對這些挑戰,本文開展了一系列創研究工作。
摘要:
兩輪車違法駕駛行為的智能化檢測是構建現代智能交通監管系統的一個重要部分。然而,在這個領域的智能化檢測面臨著兩個主要問題:第一個問題是缺乏相關的開源數據集,第二個問題是當前主流的目標檢測模型在兩輪車違法駕駛行為檢測任務上的精度和速度不夠理想。針對以上問題,本文構建了一個兩輪車違法駕駛行為檢測數據集(TIDBD dataset),并且提出了適用于兩輪車違法駕駛行為檢測任務的高效模型YOLOv8_VanillaBlock。
背景與動機:
目前,關于兩輪車違法駕駛行為檢測領域的開源數據集極為稀缺,僅有的幾個開源數據集標注類別也較為單一,無法推動該領域的研究發展。此外,主流的目標檢測模型在兩輪車違法駕駛行為檢測任務上表現并不理想,需要做進一步的改進。
主要內容:
1、TIDBD 數據集構建
我們構建了專門用于兩輪車違法駕駛行為檢測的數據集TIDBD(Two-wheeled vehicle Illegal Driving Behavior Detection)。我們采集數據的方式有兩種,第一種方式是使用水平相機在城市內部道路固定路口持續拍攝。然后對拍攝的視頻進行幀提取。第二種方式是在國道、省道以及城市內部道路上,利用高架攝像頭進行抓拍。我們主要標注了使用手機、正/逆向行駛、非法加裝改裝、是否佩戴頭盔等10種駕駛行為。最終,我們得到了3637張真實采集且詳細標注的圖片。TIDBD 數據集的數據分布如表1所示。
表1 不同采集方式和采集地點在TIDBD數據集中所占的比例
(1) VanillaBlock
我們借鑒Vanillanet的思想設計出了VanillaBlock。圖1展示了我們所設計的VanillaBlock的結構,其由兩個卷積層和兩個池化層組成,中間有一個激活函數。VanillaBlock模塊的最后一個組成部分是由n個激活函數組成的序列激活函數。
圖1 VanillaBlock結構圖示意圖
為了證明我們所提出的VanillaBlock的計算復雜度相對于C2f模塊有所減少,我們對C2f模塊和VanillaBlock中各個組件的計算復雜度進行了估算,并給出了如下公式。
以YOLOv8l骨干網絡的最后一個C2f模塊和YOLOv8_VanillaBlock_l骨干網絡的最后一個VanillaBlock為例,
。由于
遠遠小于
,故可以忽略不計,則C2f和VanillaBlock的計算復雜度之比
。
(2) YOLOv8_VanillaBlock
為了提升YOLOv8在GPU上的檢測速度,我們在VanillaBlock的基礎之上,搭建了一種新的骨干網絡Yolov8_VanillaBlock,其整體結構圖如圖2所示。
圖2 YOLOv8_VanillaBlock骨干網絡結構示意圖
實驗結果及分析:
1、檢測準確率和FLOPs對比分析
我們在TIDBD數據集上使用較大尺寸的YOLOv8l和YOLOv8_VanillaBlock_l模型進行實驗,以平衡檢測精度和模型大小。以平均精度(AP50)為評價標準對兩種模型進行比較。實驗結果表明(圖3所示),我們提出的YOLOv8_VanillaBlock_l在“use phone”、“canopy”等檢測類別上顯著優于原始的YOLOv8l。
圖3 YOLOv8_VanillaBlock_l與YOLOv8l在TIDBD數據集上不同檢測類別AP50的對比
表2 YOLOv8_VanillaBlock與YOLOv8準確率及計算量對比
表2顯示,與尺寸為n、s、m、l、x的YOLOv8模型相比,我們提出的具有相應尺寸的YOLOv8_VanillaBlock模型的FLOPs分別降低了18.5%、21.8%、30.2%、26.7%和37.5%,mAP50分別提高了1.45%、0.5%、0.18%、1.31%和2.2%。這些結果表明,我們所提出的YOLOv8_VanillaBlock模型相對于原來的YOLOv8模型在FLOPs有所降低的同時獲得了更高的準確率。
2、檢測速度與實時性比較
我們測試了當輸入圖片分別縮放到320、640以及1088時的檢測時間和FPS,檢測時間測試結果見圖4,FPS測試結果見表3。
圖4 不同尺寸的YOLOv8_VanillaBlock與YOLOv8在不同大小的圖片上檢測時間的對比
表3 YOLOv8_VanillaBlock與YOLOv8在不同尺寸的輸入圖片下的FPS
從圖4可以看出,在相同的輸入圖像尺寸下,YOLOv8_VanillaBlock模型的檢測時間始終低于相應尺寸的原始YOLOv8模型。當輸入圖像大小為1088時,檢測速度的提高尤為明顯。從表3可以看出,對于相同大小的輸入圖像,YOLOv8_VanillaBlock模型每秒處理的幀數始終高于YOLOv8模型。當輸入圖像為1088時,YOLOv8_VanillaBlock的FPS分別比對應尺寸的YOLOv8高14.2%、3.9%、13.7%、16.1%、30.2%。結果表明,我們提出的方法可以顯著提高YOLOv8的檢測速度。
結論:
本文構建了專門用于兩輪車違法駕駛行為檢測的數據集TIDBD,解決了相關領域開源數據集稀缺的問題。在此基礎上,提出了YOLOv8_VanillaBlock這一專門用于兩輪車違法駕駛行為檢測的模型。實驗結果證明,我們所提出的模型在檢測精度和檢測速度上都優于基線模型。
通訊作者簡介:
王智廣,教授,博士生導師,北京市教學名師。中國計算機學會(CCF)高級會員,全國高校實驗室工作研究會信息技術專家指導委員會委員,北京市計算機教育研究會常務理事。長期從事分布式并行計算、三維可視化、計算機視覺、知識圖譜方面的研究工作,主持或承擔國家重大科技專項子任務、國家重點研發計劃子課題、國家自然科學基金、北京市教委科研課題、北京市重點實驗室課題、地方政府委托課題以及企業委托課題20余項,在國內外重要學術會議和期刊上合作發表學術論文70余篇,培養了100余名碩士博士研究生。