- 回首頁
- 機械工業雜誌
- 當期雜誌
當期雜誌
購物提醒:當您要離開或跳轉頁面時,請先將您想要購買的文章加入購物車,以便快速紀錄完成購買流程!
LLM輔助維護日誌資訊萃取技術
作者
徐家瑋、吳鴻材
刊登日期:2025/04/30
摘要
目前業界於廠務與製程設備管理中,因設備種類繁多及系統複雜性高,面臨異常排查耗時、專業知識管理不易、數據未能有效發揮價值等痛點。因此,工研院機械所提出結合文字資料與感測數據的方法,通過大型語言模型建立關鍵資訊擷取模組,並搭配以深度神經網路為核心的故障識別模組,實現對故障原因的快速判定及維護建議,除了實現領域知識數位化,也將有效協助提升運維效率。
Abstract
Currently, in the field of facility and process equipment management, the industry faces challenges such as time-consuming anomaly troubleshooting, difficulty in managing specialized knowledge, and the inability to fully leverage data value due to the variety of equipment and high system complexity. To address these issues, the Mechanical and Mechatronics Systems Research Laboratories of ITRI have proposed a method that integrates textual and sensor data. This approach establishes a key information extraction module using large language models and incorporates a fault data diagnostic module based on deep neural networks. By doing so, it enables rapid fault cause identification and maintenance suggestion generation, effectively improving operational efficiency and achieving the digitalization of domain knowledge.
前言
在廠務與製程設備管理中,由於設備種類繁多且系統架構複雜,當異常突發時,往往需要投入大量人力與時間進行問題排查與故障排除。目前多數設備雖然配有
SCADA(Supervisory control and data acquisition,資料擷取與監控系統),但該系統僅能提供初步的警告訊息(如潤滑油溫異常),卻無法直接指出真正的故障原因,因為這類異常往往涉及多種潛在故障源,維護人員需要經過繁瑣的測試才能準確判定,甚至因誤判,導致無效維修,進一步延長設備停機時間。另一方面,由於系統高度複雜且維修細節繁多,新進人員難以迅速熟悉各項操作與維修流程,在缺乏完善的知識管理與技術支援下,新手維修人員在故障排查與修復的效率上遠不及資深技術人員,造成更長的設備停機時間並增加人力成本。
綜合以上因素可知,故障肇因判定與維修經驗傳承是當前廠務與製程設備管理所面臨的重大挑戰,這些問題導致維修時間難以有效控管;一旦設備停機,不僅影響產能,還會衍生一系列額外成本,包括人工成本、停機損失、交期延遲等,對企業營運與生產效率造成不小的影響。
目前許多企業,累積了大量的維修紀錄與設備運行的SCADA數據,這些資料可用於了解設備好發問題、平均故障間隔、處置方式、資源需求等重要資訊,但由於資料龐大、內容複雜,且缺乏有效的分析方法而未能被妥善利用,導致維護人員難以快速從過去的經驗獲取有效資訊。
鑒於維修紀錄、操作手冊等文字資料含有豐富維運資訊,SCADA數據則可客觀的反映設備運行狀態,本研究整合這兩類數據,提出一套開發設備維護建議系統的方法,首先透過大型語言模型(Large Language Model , LLM),建立關鍵資訊擷取模組,對維修紀錄的文字資訊進行歸納、建構維修知識庫,另外透過深度神經網路建立故障識別模組,對SCADA數據進行分析;該方法能快速定位故障原因,並提供即時且準確的維護建議,顯著提升維運工作的效率與準確性。目前的技術困境與系統導入後的效益比較,如
圖1所示。
數據整合架構
近年來,隨著大型語言模型(LLM)的快速發展,許多聊天機器人的應用逐漸引入設備運維產業,這些應用透過問答互動的方式,協助使用者查詢維修方法、推測故障原因;然而,問答的形式很大程度上依賴問題的準確性,也就是說,提問者需具備一定的相關知識,才能藉由問答系統獲得理想的答案。此外,針對設備狀態的判斷,如振動幅度或溫升頻率等,這些細微的數據變化,通常無法透過人為察覺或進行客觀描述;因此,相關描述難以準確反映當前設備的運行狀態,進而影響問答系統的判斷效果。基於上述因素,本研究將設備運行的多維數據與大型語言模型相結合,透過分析設備的運行數據來判斷當前的最佳解決方案,而非僅依賴問答,這種方法有望實現更精確的維修判斷,提升設備維護的效率與準確性。
目前許多廠務設備配有SCADA系統,相當適合發展多感測數據融合的故障識別技術,這種技術能透過深度神經網路捕捉到多種數據間的變化,快速分析並定位故障原因。然而,在實際應用中,由於數據來源的有限性以及缺乏足夠的標籤數據進行神經網路訓練,導致故障識別模組的開發與實現面臨挑戰。本文將利用LLM的關鍵資訊擷取技術,獲得文字資料中的重要訊息並整理成維修知識庫,同時自動生成訓練神經網路的故障標籤,彌補標籤數據的不足,為故障識別模組提供更完整的數據支持,從而提升模組的準確性與效能[1],這種方式也能促進發展故障識別與維護建議系統的自動化與智能化。
圖2為文字資料與感測數據進行整合的流程架構圖,串聯包含設備維修紀錄、SCADA數據蒐集模組、關鍵資訊擷取模組及故障識別模組等。設備維修紀錄中除了記錄異常的停機時間,也對每次異常的處理流程做了詳細記錄,這些處理流程可透過關鍵資訊擷取模組中的三個步驟,故障類別歸納、故障類別整合、故障類別標記進行統整與歸納,並生成該則維修紀錄對應的故障標籤,隨後透過維修紀錄中的停機時間,則可尋找到SCADA中的關聯數據,這些數據將與該異常現象有最直接的關聯。數據經過前處理後,則可輸入至CNN (Convolutional neural network)神經網路,並與關鍵資訊擷取模組產生的故障標籤作為一對組合,形成鑑別式AI的訓練模式。最後,透過維修紀錄與SCADA數據的共同分析,當故障識別模組,識別出當前設備的異常類型時,不僅可得知當前的故障現象,也可同時獲得對應的維護建議,實現故障識別建議系統。
更完整的內容歡迎訂購
2025年05月號
(單篇費用:參考材化所定價)