中文題目:基于改進高斯聚類算法的原油采購與調和集成優化加速求解方法
論文題目:An Improved Gaussian Clustering Algorithm to Accelerate the Solving of Integrated Optimization of Crude Oil Procurement and Blending
錄用期刊/會議: Industrial & Engineering Chemistry Research (中科院大類3區,CAA B類期刊)
原文DOI:https://doi.org/10.1021/acs.iecr.4c03924
原文鏈接:https://pubs.acs.org/doi/full/10.1021/acs.iecr.4c03924
錄用/見刊時間:2025年3月18日
作者列表:
1)鄭萬鵬 中國石油大學(北京)自動化系 博19
2)高小永 中國石油大學(北京)自動化系 教師
3)潘 輝 中國石油獨山子石化分公司
4)左 信 中國石油大學(北京)自動化系 教師
5)黃德先 清華大學自動化系 教師
6)張歆瞳 中國石油大學(北京)自動化系 博22
7)黃付宇 中國石油大學(北京)自動化系 碩20
文章簡介:
本文提出了一種改進的高斯混合模型(GMM)算法,用于加速原油采購與調和集成優化問題的求解。針對原油采購與調和過程中原油種類過多導致模型難以求解的問題,文章通過引入改進的GMM算法進行原油預篩選,有效縮小了搜索空間,從而顯著提高了求解效率。
摘要:
原油采購與調和工藝是煉油企業生產運營的核心環節,其集成優化對保障調和油性質穩定至關重要。然而,當候選原油種類過多時,集成模型將變得難以甚至無法求解。針對這一問題,本文提出一種改進的高斯聚類算法,通過預先篩選合適的原油參與集成優化,從而大幅壓縮求解空間并提升計算效率。首先,本文詳細介紹了用于原油聚類的改進GMM算法,并提出了帶有價格補償函數的期望最大化(EM)算法,以減少原油價格波動對聚類結果的影響。隨后,通過實際案例和對比實驗驗證了改進GMM算法的有效性。結果顯示,改進后的GMM算法將求解時間縮短了約90%。改進后的GMM算法可以顯著提高求解效率,而帶有價格補償函數的EM算法則能有效降低原油價格波動對聚類結果的影響。最后,本文提出的基于原油預選的優化方法為現場應用奠定了基礎并提供了可能性。
背景與動機:
煉油企業的原油采購與調和過程是生產和運營的核心環節,其集成優化對于保證調和油性質的穩定具有至關重要的意義。隨著全球原油市場的日益復雜和多樣化,煉油企業面臨著越來越多的原油選擇。然而,候選原油種類的增加給集成優化模型的求解帶來了巨大的挑戰。一方面,原油的性質差異顯著,包括硫含量、氮含量、重金屬含量、收率等多個維度,這些因素都直接影響著原油的調和效果和煉油過程的經濟性。另一方面,傳統的優化算法在處理大規模變量和約束時,往往計算復雜度高,求解效率低,難以滿足實際生產的需求。
在此背景下,本文提出了基于改進高斯聚類算法的原油預選方法,旨在通過預先篩選出合適的原油種類,大幅度縮小集成優化模型的搜索空間,從而提高求解效率。這一方法的提出,不僅解決了傳統優化算法在處理大規模原油數據庫時的局限性,也為煉油企業的原油采購與調和集成優化提供了新的思路和解決方案。
設計與實現:
在對原油數據庫進行聚類任務時,經典高斯混合模型得到的聚類結果往往加劇了調和原油目標產率優化后的波動性。在極端情況下,這種波動性可能超過預設的可接受范圍。經過深入分析,已確定該問題的根源在于原油價格數據維度與各蒸餾組分產率數據維度之間的相關性干擾。原油價格與餾分產率之間的相互作用會導致經典GMM算法的下聚類效果不佳。為了有效解決上述問題,本文提出了一種改進的GMM算法,該算法在EM算法的M步中加入了價格補償函數,以提高GMM的聚類性能。這種改進方法的核心思想是利用原油價格數據與其他相關數據之間的互信息來修改原始的對數似然函數。通過這一改進策略,GMM算法可以更好地捕捉數據之間的復雜關系,從而獲得更準確和穩定的聚類結果。改進的GMM算法的相關公式推導過程將簡要概述如下:
1. 高斯混合模型的概率密度函數
GMM模型假設所有的n個數據點都是由k個高斯分布生成的,每個高斯分布稱為一個成分。對于這k個高斯成分,每個成分的概率密度函數如方程(3.1)所示。
2. 潛變量與完整數據的對數似然函數
引入潛在變量,其中
=1表示第i個數據點
屬于第j個高斯成分,而
=0則表示不屬于。包含潛在變量的完整數據的對數似然函數如式(3.2)所示。其中,
表示第j個成分的權重,且所有成分的權重之和為1,即
。
給定,對數似然函數(3.2)可以進一步簡化為方程(3.3):
當在EM算法中融入價格補償函數時,方程(3.3)需要修改為方程(3.4)。其中,ρ為補償因子,當原油價格較高且目標餾分產率也較高時,ρ取負值,且原油價格越高,ρ值越??;反之,當原油價格較高但目標餾分產率較低時,ρ取正值,且原油價格越高,ρ值越大。
3. E步:計算期望值
在E步中,根據當前參數估計值 和潛在變量的后驗分布,計算完整數據對數似然的期望值,如方程(3.5)所示:
設該后驗分布表示為。然后,按照方程(3.6)所示計算期望值:
引入一個期望公式,期望的計算可以簡化為方程(3.7):
4. M步:最大化期望
在EM算法中,在M步通過最大化Q(θ, θ^((t)))來更新參數θ,如方程(3.8)所示:
在M步中可以添加一個價格補償函數,以選擇與不完整數據密切相關的缺失數據,從而降低缺失數據的不確定性。假設X是與原油價格數據相關的離散隨機變量,Z是與原油蒸餾餾分產率相關的離散隨機變量,p(x,z)是它們的聯合概率分布,p(x)和p(z)分別是它們的邊緣概率分布。那么,價格補償函數由方程(3.9)表示。在這里,條件熵H(X∣Z)用于量化在給定Z的條件下X的平均不確定性;而價格補償函數PRC(X;Z)則衡量了Z對X不確定性的影響程度。如果Z與X之間不存在相關性,則價格補償函數PRC(X;Z)的值為0。
基于修改后的對數似然函數,即方程(3.4),方程(3.8)需要修改為方程(3.10):
其中,的公式由方程(3.11)給出:
實驗結果及分析:
為驗證改進的高斯混合模型(GMM)算法在解決實際生產案例中的有效性,我們基于一個以燃料為導向的裝置案例進行了仿真。以案例1的仿真結果為例,表1列出了基于聚類結果優化求解得到的調和原油性質。
Table 1. Properties of the blended crude oils in Case 1.
基于表1所示結果,使用改進GMM算法求解得到的調和原油性質與理想狀態的差距明顯小于使用經典GMM算法求解得到的數據,這表明使用改進GMM算法求解所得調和原油的性質更為穩定,變化范圍更小。同時,使用改進GMM算法求解得到的目標餾分中調和原油的收率相較于初始產品的提升均高于使用經典GMM算法求解得到的結果,這表明使用改進GMM算法求解所得調和原油在目標蒸餾餾分中的收率提升更大,展現出更好的加工性能。
此外,為證明所提出的改進GMM算法能夠解決原油采購與調和過程集成優化問題的挑戰,本文分析了案例1-3中集成優化模型中的關鍵指標,詳見表2。其中,Case1、2和3表示在直接基于初始原油數據庫進行優化求解時的統計結果,而Case 1*、2*和3*則表示先使用改進GMM算法對原油數據庫進行聚類再進行優化求解的結果?;诒?結果可知,使用改進GMM算法后,變量數量、約束數量以及求解時間均大幅減少。因此,本文提出的改進GMM算法解決了在大規模原油數據庫下集成優化求解困難的問題。通過利用聚類算法對原油數據庫進行初步篩選,可有效排除明顯不可行的解,從而顯著縮小了求解空間。
Table 2. Number of variables and constraints for Cases 1–3.
結論:
本文提出了一種改進的GMM算法,并將其應用于原油采購與調和調度的集成優化問題中。首先,通過在EM算法中添加價格補償函數,提出了GMM算法的改進策略,以解決原油價格波動對聚類結果的干擾。通過實際案例驗證了改進GMM算法在解決集成優化問題時的有效性。仿真結果表明,改進GMM算法能夠有效縮小集成優化模型規模,解決了因原油種類過多而導致的集成優化問題求解難題。然而,改進GMM算法仍需人工設定K值,不合理的K值在很大程度上會影響聚類結果。因此,如何對原油數據進行有效處理,并通過結合深度學習的聚類算法實現更高精度的原油聚類,是未來工作的研究方向。
通訊作者簡介:
高小永,人工智能學院副院長,教授,博士生導師,石大學者,校青年拔尖人才,自動化專業及控制科學與工程學科建設負責人,擔任北京自動化學會常務理事、中國自動化學會過程控制專業委員會委員、中國自動化學會教育工作委員會委員、中國化工學會信息技術應用專業委員會副秘書長、中國系統工程學會過程系統工程專業委員會委員等。研究領域為復雜石油石化工業過程智能制造,主要方向有:機理與數據驅動的故障診斷、復雜工業過程建模與優化控制、工業過程計劃與調度優化等。主持國家自然科學基金項目2項、北京市自然科學基金面上項目1項、校企聯合項目30多項,發表SCI/EI等各類論文50多篇。
Email:x.gao@cup.edu.cn