中文題目:基于類內類間優化元學習的小樣本故障診斷
論文題目:Meta-Learning With Intraclass and Interclass Optimization for Few-Shot Fault Diagnosis
錄用期刊/會議:IEEE Transactions on Industrial Informatics (中科院大類1區,CAA A+類期刊)
原文DOI:10.1109/TII.2024.3458091
原文鏈接:https://ieeexplore.ieee.org/abstract/document/10704056
錄用/見刊時間:2024年
作者列表:
1)李 康 中國石油大學(北京)人工智能學院 自動化系教師
2)葉 昊 清華大學 信息科學技術學院 自動化系教師
3)高小永 中國石油大學(北京)人工智能學院 自動化系教師
4)張來斌 中國石油大學(北京)安全與海洋工程學院 安全工程系教師
摘要:
本文提出了一種類內類間優化元學習(Meta-Learning with Intraclass and Interclass Optimization)方法,旨在解決小樣本工業系統故障診斷問題。所提MLIIO通過設計類內聚集損失(IAL)和類間判別損失 (IDL),優化了特征空間中同類樣本的緊湊性和異類樣本的分離度。IAL通過拉近樣本與其類別中心的距離來增強類內緊湊性,而IDL則通過最大化不同類別間的距離來提升類間可分性。該方法采用情景訓練機制,通過多個輔助任務來訓練模型,使其能夠快速適應新任務。在公開的滾動軸承數據集和實際的鐵路轉轍機數據集上進行的實驗表明,MLIIO在小樣本故障診斷任務上優于多種代表性方法,具有更好的泛化能力和診斷性能。這項研究為工業設備的安全和可靠運行提供了一種有效的智能診斷工具。
背景與動機:
隨著工業自動化和信息化的快速發展,故障診斷技術對于保障工業系統安全、可靠運行至關重要。然而,在實際工業應用中,由于故障發生的低頻性和采集難度,收集到的故障數據往往十分有限,這限制了傳統數據驅動方法的應用。針對這一挑戰,本文提出了一種類內類間優化元學習方法,旨在利用有限的故障數據訓練出有效的故障分類器。MLIIO通過優化類內聚集損失和類間判別損失,增強了特征空間中同類樣本的緊湊性和異類樣本的分離度,從而提升了模型的泛化能力。這種方法不僅能夠應對數據稀缺的問題,還能適應新的故障場景,對于提高工業系統的智能化水平具有重要意義。
設計與實現:
本文提出MLIIO方法通過結合類內聚集損失(IAL)和類間判別損失(IDL)來優化模型的特征學習過程。IAL負責拉近同一類別內樣本特征與類別中心的距離,以增強類內的緊湊性,而IDL則通過最大化不同類別間的距離來提升類間的可分性。MLIIO采用了情景訓練機制,每個episode由支撐集和查詢集組成,其中支撐集用于生成類別原型,查詢集用于評估模型性能。在每個episode中,模型通過最小化綜合損失函數來更新參數,該損失函數是IAL和IDL的加權和,其中權重系數λ用于平衡兩個損失函數的貢獻。這種方法使得模型能夠在有限的樣本下快速適應新任務,提升了模型對新故障場景的識別能力。在實驗部分,選擇了公開的滾動軸承數據集和實際的鐵路轉轍機數據集來驗證MLIIO方法的有效性,并通過與多種代表性方法比較,證明了MLIIO在小樣本故障診斷任務上具有優越的性能。該方法不僅有助于解決實際工業應用中的樣本稀缺問題,也提高了故障診斷的準確性和魯棒性。
圖1 小樣本故障診斷典型優化場景
如上圖所示,上圖a中,錨點樣本與其對應的正樣本之間的距離比最近的負樣本之間的距離更近,這種情況是容易處理的情況。但是在圖b中,盡管與正樣本之間的距離更近,但是距離卻很遠這種情況下,模型可能難以準確學習到類別之間的區分邊界,因為錨點樣本的特征表示可能不如其類別原型那樣具有代表性。因此,本文提出MILO方法,結合IAL和IDL兩個關鍵損失函數優化模型的訓練過程,最終學習到一個具有更好泛化性的模型。
主要內容:
一、類間判別損失(Interclass Discriminative Loss)
類間判別損失旨在使得每個類別內部的樣本特征盡可能靠近該類別的原型,同時確保不同類別的原型之間的距離足夠大,以此來提高模型在特征空間中的分類能力。
上方類間判別損失的計算方法是將錨點樣本的特征表示到類別原型的距離減去最小類間距離,并加上一個強迫的邊界。
然后對每個類的損失函數求和得到總類間判別損失,通過最小化總類間判別損失,使得模型在樣本有限的情況下,也能學習到具有較好區分度的特征表示。
二、類內聚集損失(Intraclass Aggregation Loss)
類內聚集損失旨在提高同一類別樣本特征的聚合,使得同一類別的樣本在特征空間中更加緊湊,減少樣本特征與其對應類別原型之間的距離,從而增強同一類別內樣本的相似性。
上方類內聚集損失的計算方法是對查詢集中每個樣本的特征表示與其原型之間的距離求平均,此平均值反映了類內樣本特征與其原型之間的緊密程度。
然后對每個類的損失函數求和得到總類內聚集損失,通過最小化總類內聚集損失將有助于將同一類別的樣本特征拉向它們的中心原型,在特征空間中形成更加緊湊的類別簇。最終提高模型泛化能力。
三、基于MLIIO的小樣本故障診斷流程
在訓練階段,根據總損失函數采用情景訓練方式學習MLIIO模型。
在測試階段,利用新類故障樣本的支撐集對模型進行微調,然后測試詢問集樣本的故障類型。
實驗結果及分析:
一、CWRU數據集
為驗證所提方法的有效性,在公開CWRU軸承數據集上對比了多種代表性方法(MAML、RN、PN、CLPN和MLCTL),結果表明所提出的元學習方法在小樣本故障診斷的平均診斷精度方面更加出色。在3-way 5-shot設置下,所有方法的平均診斷準確率超過了90%,這表明即使在樣本數量有限的情況下,MLIIO方法也能學習到有效的特征表示。在其他設置下,平均準確率也大多在80%到90%之間,顯示了該方法在少樣本學習問題上的魯棒性。
表1 不同方法采用不同設置時的故障診斷對比結果
從表2中可以看出,MLIIO方法在變工況場景下都能保持較高的診斷準確率,表明該方法具有良好的泛化能力。
表2 變工況場景下不同方法采用不同設置時的故障診斷對比結果
此外,圖2給出了 t-SNE特征可視化結果,表明MLIIO方法具有更好的特征判別能力,也驗證了類內聚集損失和類間判別損失的有效性。
圖2 不同方法所學特征的t-SNE可視化效果. (a) MAML. (b) RN. (c) PN. (d) CLPN. (e) MLCTL.(f) MLIIO.
二、高鐵道岔轉轍機數據集
高鐵道岔轉轍機電流數據集記錄了108 S700K型道岔轉換設備的三相電流數據,每個樣本由三相電流數據組成,每個相位包含120-150個采樣點,采樣頻率為25 Hz,為了確保輸入樣本具有統一的維度,較短的曲線被零填充至200個采樣點,三相電流數據被連接起來形成一個600維的輸入樣本。類似地,我們對比了所提MLIIO方法與5種代表性方法的故障診斷表現。如表3所示,相較于代表性方法,MLIIO方法的平均故障診斷準確率更高,性能更優。
表3 不同方法采用不同設置時的故障診斷對比結果
結論:
本論文提出了一種類內類間優化元學習方法,旨在解決實際工業應用中因數據稀缺而導致的故障診斷難題。通過在類內聚集損失和類間判別損失的聯合優化下,所提方法能夠有效地學習區分不同故障類別的特征表示,即便在樣本數量有限的情況下也表現出色。在CWRU軸承數據集和高速鐵路道岔數據集上的實驗結果表明,MLIIO方法在多種少樣本故障診斷場景下均優于代表性方法,這些結果不僅證明了MLIIO在不同工作條件下的泛化能力,也展示了其在跨場景故障診斷中的穩定性和可靠性。此外,通過t-SNE特征可視化和混淆矩陣分析,進一步驗證了MLIIO在提高故障診斷準確性和區分容易混淆故障類型方面的優勢。
MLIIO方法為少樣本故障診斷領域提供了一種有效的解決方案,尤其適用于工業場景中數據難以獲取的情況。未來的工作將集中在設計更精細的機制來處理難以診斷的故障類型,并嘗試將過程機制知識融入模型訓練中,以減少對大量高質量支撐集的依賴,進一步提升模型的診斷性能。這項研究不僅推動了故障診斷技術的發展,也為工業智能化和預測性維護提供了有力的技術支持。
作者簡介:
李康,師資博士后,博士,中國石油大學(北京)人工智能學院自動化系教師,主要研究方向為故障診斷與容錯控制。