::: 前往中央內容區塊
:::

歷史雜誌

購物提醒:當您要離開或跳轉頁面時,請先將您想要購買的文章加入購物車,以便快速紀錄完成購買流程!

基於大型語言模型之智慧機器人製造單元助理

作者 施志軒林宛昀

刊登日期:2025/07/29

摘要

近年來,大型語言模型(LLMs)在文本生成、機器翻譯與教育輔助等多元應用中展現出卓越的表現。然而,當其應用於現實環境,特別是涉及實體互動場域時,效能常受限制。主要的挑戰包括:模型無法即時取得現場資料、對實務故障排除流程理解不足,以及對機器人動作中隱含的複雜性掌握有限。為解決上述問題,本研究提出一種基於Server-Client架構、整合多代理大型語言模型的控制框架,以提升機器人製造工作站之穩定性、擴展性與作業效率。開發智慧機器人製造單元AI助理,採用TCP(Transmission Control Protocol)通訊協定並以JSON格式進行訊息交換,實現跨平台整合。本系統相較於傳統人工處理方式,展現出更佳效能,特別在以下三項關鍵任務中表現亮眼:自然語言生成機器人控制程式、文字轉換為SQL(Structured Query Language)查詢指令,以及基於RAG(Retrieval-Augmented Generation)技術的語意型故障診斷。實驗結果顯示,本系統不僅提升了機器人控制的準確性與生產資料查詢能力,更將故障處理時間縮短47.6%,顯著強化維修效率與決策支援能力。

Abstract

Large language models (LLMs) have recently demonstrated impressive capabilities in diverse applications such as text generation, machine translation, and educational assistance. However, when applied to real-world scenarios, particularly those involving physical interactions, their performance is often limited. This limitation is primarily due to their lack of access to on-site data, insufficient understanding of practical troubleshooting procedures, and limited comprehension of the complexities inherent in robotic actions. Hence, this article proposes a Server-Client control framework augmented with a multi-agent LLM to enhance the robustness, scalability, and efficiency of robotic manufacturing workcells. Our system develops an AI assistant that outperforms traditional manual methods by using a centralized TCP (Transmission Control Protocol)-based protocol with JSON messages for cross-platform integration. It excels in three tasks: robot code generation from natural language, text-to-SQL (Structured Query Language, SQL) query, and fault diagnosis retrieval using a RAG (Retrieval-Augmented Generation)-based semantic search. Experiments show improved robot control, accurate production data queries, and a 47.6% reduction in fault handling time, boosting maintenance efficiency and decision support.

前言

根據國際機器人聯合會(IFR)統計,於2021年全球工廠安裝了52.6萬台的工業機器人數量,創下歷史新高,並與同期相比成長35 %[1]。預估在2026年全球工業機器人市場規模將達到750億美元。亞洲國家為製造生產據點所安裝機器人數量占全球數量的74 %,主要市場在中國、日本。在COVID-19疫情影響下,缺工問題更加嚴峻,勞動力老化、勞動力成本升高、臨時急單與供應鏈斷裂等情況都是加速「機器人復興時代」(Robot Renaissance)的開端[2]。2023年臺灣金屬製品產業產值為新臺幣13,365億元,占整體製造業的7.5 %,為臺灣重要創匯要角,出口比例達46.1 %,締造外銷佳績,無論是水五金、手工具、扣件、模具與自行車等,於全球皆有舉足輕重的地位;臺灣金屬製品產業廠商家數共22,646家,占整體製造業的25 %,在製造業中排名位居第1位;就業人數約為39.6萬人,占整體製造業的13.7 %,僅次於電子零組件產業[3]。臺灣金屬製品產業以中小企業為主,擁有完整產業鏈、上中下游分工細密且群聚性強之優勢,於國內形成具有特色的產業聚落,其中包括中部手工具、彰化大村自行車、彰化頂番婆水五金、高雄岡山扣件等,如圖1所示。

傳統工業機器人的系統結構僵化,任何修改與重新配置都需要專業技術人員參與[4]。舉例來說,若需讓系統適應新的產品型號或執行不同操作需求,通常需投入大量人力重新設計並實作所需的功能。這一過程常因多項挑戰而受到阻礙,包括對複雜設備的深入理解,以及將使用者需求轉換為可執行程式所需的繁瑣工作。此外,當機器人系統發生故障時,也往往需要專業工程師進行人工診斷,由於缺乏標準化流程,診斷時常發生延遲、判斷結果不一致等問題,進一步增加了停機時間與成本。儘管透過工業 4.0 的物聯網(IoT)系統,可即時將生產線數據蒐集至 SQL 資料庫,但這些資料往往未能即時查詢與應用,導致無法有效支援製程優化。因此,傳統工業自動化系統不僅缺乏彈性,亦伴隨高成本與低效率,難以快速因應市場變化與新興需求。近年來大型語言模型(Large Language Models, LLMs),如 Codex [5]、LLaMA [6]、GPT-4[7],展現出作為智慧助手整合至不同生活應用的顛覆性潛力。這些模型已在文本生成、機器翻譯與教育輔助等任務中展現卓越表現。然而,由於其輸入主要侷限於純文字形式,導致與實體世界的互動能力有限,此落差主要源於其對物理現象、環境狀況及機器人執行行為的理解不足。相對而言,強化學習(Reinforcement Learning)雖可透過模擬學習來彌補上述不足,卻須設計繁瑣的獎勵函數並建立大量資料集,實作成本高昂且耗費大量人力[8]。因此,如何為機器人系統提供精確、高效的程式補全能力,仍是當前一大挑戰。近年來,有研究開始將視覺–語言模型(Vision-Language Models, VLMs)應用於程式生成核心技術[9],成為新興解方之一,結合視覺與語言提示,讓模型學會在多樣化的操作任務中生成泛化能力強的策略。

 

「如欲訂購單篇,請至 「華藝線上圖書館」

更完整的內容歡迎訂購 2025年08月號 (單篇費用:參考材化所定價)

3篇450元

NT$450
訂閱送出

10篇1200元

NT$1,200
訂閱送出