中文題目:基于離散元方法及可解釋機器學習框架的礫巖水力裂縫擴展研究
論文題目:Investigation of hydraulic fracture propagation in conglomerate rock using discrete element method and explainable machine learning framework
錄用期刊/會議:Acta Geotechnica(中科院大類一區 Top期刊;JCR Q1)
原文DOI:https://doi.org/10.1007/s11440-024-02317-9
原文鏈接:https://link.springer.com/article/10.1007/s11440-024-02317-9
錄用/見刊時間:2024年4月5日
作者列表:
1)申屠俊杰 中國石油大學(北京)信息科學與工程學院/人工智能學院 科研助理
2)林伯韜 中國石油大學(北京)信息科學與工程學院/人工智能學院 教師
3)金 衍 中國石油大學(北京)石油工程學院 教師
4)Jeoung Seok Yoon DynaFrax UG 研究員
文章簡介:
本文提出了一種基于離散元方法(DEM)以及可解釋機器學習框架(XGBoost-SHAP)的裂縫形態預測模型。首先,采用Voronoi網格結構實現礫巖中礫石與基質的幾何構建,建立了真實、精細的礫巖DEM數字模型。其次,考慮礫巖組分強度、滲透率、地應力及壓裂液性質多種影響因素,開展參數敏感性分析,并為機器學習模型提供訓練資料。最后,基于模擬結果訓練XGBoost-SHAP,實現高精度裂縫形態預測并提供預測依據。
摘要:
礫巖油氣藏作為重要的非常規油氣資源,具有低孔、低滲等特點,通常需要配合大規模水力壓裂技術實現增產,但其強非均質性會引發水力裂縫不規則擴展,增大裂縫形態預測及壓裂方案部署的難度。為進一步探究礫巖中水力裂縫擴展機制并指導裂縫形態預測,本文提出了一種基于離散元方法(DEM)以及可解釋機器學習框架(XGBoost-SHAP)的裂縫形態預測模型。此外,本文采用Voronoi網格結構描述礫巖的幾何特征,建立了更真實、精細的三維礫巖DEM數字模型。在考慮到巖石基質-界面-礫石結構的前提下,研究了多種因素(包括各組分強度和滲透率、地應力、壓裂液性質等)對裂縫擴展和誘發微地震事件點的影響,總結了穿礫及繞礫兩種擴展行為。最后,本文討論了不同裂縫行為的機理,揭示了多因素的協同影響機制,并采用了由XGBoost和SHAP組成的可解釋的機器學習框架,在模擬數據上訓練后可實現高精度裂縫形態預測,并為預測結果提供全面解釋,為實際工程決策提供支持。
背景與動機:
在礫巖儲層水力壓裂過程中,其非均質性強化了裂縫擴展機制的復雜性,增加了裂縫形態預測難度。傳統的礫巖水力裂縫擴展規律研究大多展示定性的分析結果,無法對實際工況進行預測。本文針對此不足,提出了基于離散元方法(DEM)以及可解釋機器學習框架(XGBoost-SHAP)的裂縫形態預測模型,從而實現高精度裂縫形態預測,并為預測結果提供解釋及依據。
設計與實現:
本文首先建立了基于Voronoi網格結構的DEM礫巖數字模型及流固耦合壓裂算法,其次針對多種影響因素開展了參數分析,為機器學習模型提供訓練資料,最后利用XGBoost-SHAP給出高精度的裂縫形態預測結果并提供預測依據。主要內容如下:
1.基于Voronoi網絡結構的三維DEM礫巖數字模型
三維Voronoi網格結構表現為填充整個模型空間的三維多面體的集合,多面體間不存在重疊或間隙,且三維多面體可充分體現礫石的幾何特征,是構建礫巖等類多晶材料的理想構型。此外,利用三維Voronoi網格結構可構建任意礫石含量的礫巖模型,彌補了傳統隨機生成礫石方法的不足。圖1為不同礫石含量DEM礫巖數字模型。
(a) (b) (c)
圖1 礫石含量(a)25%;(b)50%;(c)75%的DEM礫巖數字模型
2.三維DEM流固耦合壓裂算法
水力壓裂中的水力裂縫擴展被認為是一個復雜的流體-巖石相互作用過程,因此在模擬時需考慮流固耦合作用。本文提出了基于三維DEM的流固耦合壓裂算法,其主要原理如圖2所示。根據DEM顆粒分布實施Delaunay三角剖分并生成流體網絡,其基本單元為四面體。流體網絡中的單元代表巖石中的孔隙,兩個相鄰的四面體由流體通道連接,當相鄰單元間存在壓差時,流體通道中的流體運移速率由Hagen–Poiseuille方程表示:
(1)
其中,μ為流體粘度,△P為相鄰單元間壓差,和
分別為流體通道的長度和半徑。
圖2 三維DEM流固耦合壓裂模型示意圖
3.XGBoost-SHAP可解釋機器學習框架
XGBoost是一種集成學習算法,由多個決策樹子模型組成,這些子模型按順序構建并逐步縮小預測值與實際值之間的差距。樣本i在經過t次優化后的預測值為:
(2)
其中,為第t-1棵決策樹的預測值,
為第t棵決策樹的預測結果。因此XGBoost的優化目標可表示為:
(3)
其中,為樣本i的實際值與預測值之差,
為一正則化項,其計算所有t棵決策樹的計算復雜度從而防止模型過擬合。
基于DEM礫巖數字壓裂模擬結果,本文選取了對裂縫形態影響顯著的6個因素,并重新組合形成4個特征作為XGBoost模型輸入,分別為界面抗拉強度/礫石抗拉強度、界面滲透率、水平地應力差+垂向地應力差及壓裂液粘度×排量。此外,根據模擬結果將XGBoost設置為二元分類模型,其預測結果為0(繞礫)或1(穿礫),以表征裂縫遇礫行為。訓練數據集包含79組數據,其中50組由DEM模擬產生,29組來自參考文獻。由于數據集規模較小,因此采用10組不同的隨機種子分割數據集(90%訓練集,10%測試集),形成80組測試數據。其次,本文通過SHAP模型對XGBoost模型的預測結果進行解釋,給出預測依據。SHAP通過博弈論中的Shapley值計算每個輸入特征對最終預測結果的貢獻值:
(4)
其中,g為解釋模型,M為輸入特征的數量,為特征j的Shapley值,定義為某特征值對模型預測的邊際貢獻,是所有可能特征值組合的加權及總和,表示為:
(5)
其中val(*)為待解釋模型,S為輸入特征的子集,為不含
的特征集合。
實驗結果及分析:
一、DEM礫巖壓裂模擬結果
基于Voronoi網絡結構的三維DEM礫巖數字模型與流固耦合壓裂算法相結合能實現精準的裂縫擴展過程計算。圖3為礫巖壓裂模擬結果與實驗結果對比圖,兩者均體現了穿礫及繞礫兩種遇礫擴展模式。
(a) (b)
圖3 礫巖水力壓裂結果:(a)室內實驗;(b)三維DEM模擬
此外,開展多種因素(各組分強度和滲透率、地應力、壓裂液性質等)對裂縫擴展和誘發微地震事件點的影響研究,揭示了不同因素對裂縫形態的影響機制,并為機器學習提供了先驗知識(如輸入特征選取依據及訓練數據集構建等)。
二、XGBoost裂縫形態預測結果
根據DEM模擬獲取的先驗知識,選取對裂縫形態影響較大的6個因素并重組形成4個輸入特征,分別為界面抗拉強度/礫石抗拉強度、界面滲透率、水平地應力差+垂向地應力差及壓裂液粘度×排量,并將預測設置為二元分類任務,輸出結果為0(繞礫)或1(穿礫)。預測結果如表1所示,在80組測試數據中,XGBoost的整體準確率達到了80%。
表1 五種模型在測試集上的評估指標
Actual value |
Predicted value |
Count |
Deflection |
Deflection |
40 |
Penetration |
Penetration |
24 |
Deflection |
Deflection |
8 |
Penetration |
Penetration |
8 |
三、SHAP解釋結果
在XGBoost完成預測后,采用SHAP對預測結果進行解釋。圖4展示了訓練集數據的SHAP值,其中Feature value表示相應特征的輸入值,SHAP值為正的特征值有利于穿礫,而SHAP值為負的特征值有利于繞礫,可看出較高的界面滲透率和強度差會促進裂縫遇礫偏轉,而較高的地應力差、粘度和排量會促進穿礫。
圖4 訓練集數據SHAP值分布示意圖
此外,SHAP可對所有輸入特征的貢獻值進行綜合分析,計算每個特征的平均SHAP值并獲取宏觀貢獻值。如圖5所示,地應力差值對預測結果的影響程度最高。
圖5 輸入特征平均SHAP值
四、案例分析
利用XGBoost-SHAP可解釋機器學習框架,可實現對單獨案例的裂縫形態預測及結果解釋,并生成特征對抗圖以輔助理解。本文從參考文獻中選取了6組案例,并將相應特征值輸入預訓練的XGBoost生成預測結果,如表2所示,可看出XGBoost對6組案例均做出了正確預測。進一步地,利用SHAP對每個案例的預測結果進行解釋并生成特征對抗圖,如圖6所示。圖中f(x)為所有輸入特征的累計貢獻值,當f(x)高于基準值(base value)時,代表預測結果為穿礫,反之當f(x)低于基準值(base value)時,代表預測結果為繞礫。特征顏色為紅色時表示其有利于穿礫,為藍色時表示其有利于繞礫,且特征條長度體現其貢獻程度。
表2 五種模型在測試集上的評估指標
No. |
Strength ratio (dimensionless) |
Interface permeability (mD) |
Sum of stress difference (MPa) |
Viscosity injection rate (′10-10N?m) |
Fracture behavior |
Predicted behavior |
1 |
1.04 |
200 |
25 |
360 |
Penetration |
Penetration |
2 |
0.6 |
100 |
15 |
360 |
Deflection |
Deflection |
3 |
0.1 |
0.1 |
18 |
4 |
Penetration |
Penetration |
4 |
0.1 |
0.1 |
10 |
4 |
Deflection |
Deflection |
5 |
0.09 |
100 |
20 |
1′104 |
Penetration |
Penetration |
6 |
0.05 |
100 |
0 |
1′104 |
Deflection |
Deflection |
圖6 研究案例特征對抗示意圖
結論:
1. 基于Voronoi網絡結構的三維DEM礫巖數字模型能準確體現礫巖的幾何及力學特征,與流固耦合壓裂算法配合實現精準的裂縫擴展過程計算。
2. 在從模擬結果中獲取的先驗知識指導下,通過優選輸入特征,使得XGBoost在小樣本數據集上取得較高的預測精度。
3. SHAP可對XGBoost的預測結果進行定量化解釋,不僅可對整個數據集進行宏觀解釋,還可針對某個特定案例給出微觀解釋,從而為壓裂方案制定提供有力指導。
通訊作者簡介:
林伯韜, 博士,中國石油大學(北京)信息科學與工程學院/人工智能學院計算智能教學與研究中心教授/博導。主要研究方向為智能石油工程、工業數字孿生和智慧能源金融。