論文《Generative AI for Self-Adaptive Systems: State of the Art and Research Roadmap》的作者包括來自早稻田大學博士及研究助理 李家隆、西南大學講師 張明悅、中關村國家實驗室助理研究員 李念語(通訊作者)、魯汶大學教授 Danny Weyns、北京大學教授 金芝以及東京工業大學長聘副教授 Kenji Tei。
- 論文地址:https://dl.acm.org/doi/10.1145/3686803
- GenAI4SAS 論文列表:https://github.com/545659928/GenAI4SAS
自適應系統在動態和不確定的環境中具有關鍵作用,廣泛應用於自動駕駛、智慧製造、網路安全和智慧醫療等領域。例如,無人駕駛系統需要實時感知環境變化並調整策略以確保安全與效率;智慧製造生產線根據需求變化或裝置故障自動調整;網路安全系統則透過自動檢測和適應新威脅來應對不斷變化的攻擊方式。這些系統透過自我調整機制,實現自我管理和最佳化。
圖 具有 MAPE-K 反饋迴圈的自適應系統
自適應系統依賴反饋迴路,無需人為干預即可實現自動調整,核心功能包括:監控環境和系統狀態、分析情況、制定調整計劃並執行。其優勢在於根據外部環境和內部狀態的變化,維持系統穩定和高效執行。
生成式人工智慧(GenAI)透過 AI 技術從資料中學習模式,生成與原始資料相似的新資料。Transformer 技術的突破使得 GenAI 在多個領域廣泛應用,尤其是大型語言模型(LLMs)在語言理解和邏輯推理方面表現突出,為自適應系統提供了新的可能性。
GenAI 與自適應系統的核心功能相結合,能夠顯著增強系統的自適應能力。例如,GenAI 可以分析並規劃系統策略,自動調整配置以應對環境變化。儘管已有一些研究探索了 GenAI 在自適應系統中的應用,但該領域尚缺乏系統性和深入的研究。因此,本論文旨在為研究人員和從業者提供生成式人工智慧(GenAI)在自適應系統中的應用潛力及面臨挑戰的全面概覽。
GenAI 在自適應系統中的應用潛力
我們從 2017 年至 2024 年 6 月的頂級會議中篩選出 5874 篇文獻,最終篩選出 219 篇與 GenAI 和自適應系統相關的研究。篩選後的文獻從兩種視角展開分析:第一個視角聚焦於 GenAI 在增強自適應系統功能和自主性方面的潛力,探討其在監控、分析、規劃、執行等核心模組中的應用及知識共享。第二個視角探討了在 “人類監督自適應系統”(HOTL)中,GenAI 如何改善人與系統的互動。雖然自適應系統原本希望減少人為干預,但引入人類決策可以提高系統的可信度和效率。重點關注使用者偏好獲取、系統透明度和人機協作,以提升使用者滿意度、系統解釋性和效率。
圖:GenAI 在自適應系統中的應用潛力概覽
監控功能:GenAI,特別是 LLMs,在上下文理解和預測方面顯著增強了自適應系統的監控能力。LLMs 可將監控收集的非結構化資料進行結構化處理,輔助異常檢測;在上下文預測方面,基於 LLM 和擴散模型的時間序列和事件序列預測可識別潛在的目標違規風險。
分析和規劃功能:GenAI 在自適應系統的分析和規劃中有巨大潛力。LLMs 支援架構和需求驅動的適應,擴充套件了系統處理自然語言和非結構化資料的能力。LLMs 和 Diffusion 模型還能生成先驗知識,提升模型效能並降低成本。新興的規劃方法包括:基於 Transformer 的規劃適合離線學習和大規模系統;集體智慧模式促進多智慧體協作;經驗積累模式支援自我反思和進化;擴散模型支援複雜約束的高維規劃。
執行功能:雖然自適應系統的執行通常較簡單,但 LLMs 在複雜情況下的執行轉換中仍有潛力,尤其是在機器人領域中,LLMs 展現了在不確定環境下成功執行規劃的能力。
知識管理:LLMs 有兩個主要優勢:一是利用其廣泛的知識構建模型,儘管這些模型可能需要透過反饋調整以貼近現實;二是透過 LLMs 的翻譯能力將自然語言轉化為專用領域建模語言(DSML),大幅減少手動建模成本。
偏好獲取:LLMs 透過其常識和語言理解能力,能夠從使用者反饋或行為歷史中推斷出硬性約束、效用函式或個性化需求。然而,如何處理多目標環境下的偏好衝突(如成本與效率的平衡)仍需進一步探索。
透明性:LLMs 具有解釋程式碼、決策模型和系統日誌的潛力,並能生成更直觀的視覺化展示。目前程式碼動態行為的解釋較為有限,改進方向包括為不同型別的決策模型提供適當上下文資訊,並利用執行結果提高解釋的準確性。LLMs 還可用於模型解釋性研究,如使用決策樹作為代理模型解釋複雜的深度學習模型,輔助特徵選擇和重要性分析。
協作:LLMs 初步應用於任務分配、協作行為和使用者糾正,推斷使用者意圖並規劃協作模式。未來的研究可以深入探索高階意圖推斷、多模態輸入輸出,以及分析使用者參與的影響,以最佳化人機協作的自適應能力。
圖:路線圖展示了自適應系統中的軟體工程關鍵點(左側)與 LLMs 在自適應系統中的應用挑戰(中間)之間的對應關係,以及這些挑戰與自適應系統關鍵功能(右側)的對映關係。
當前研究的不足和未來的發展方向:
設計時方法應用於執行時:設計時方法側重初始設計,依賴歷史資料和專家知識;執行時則需實時調整線上資料,並要求 GenAI 做出自主決策。改進提示工程、明確任務與上下文、驗證模型穩健性是解決方案。
LLM 即服務(LLMaaS):LLMaaS 將 LLMs 作為按需提供針對特定領域的雲服務。自適應系統需要將 LLMs 作為系統元件進行整合和管理,類似於 API 和微服務。其次,由於 LLMs 的輸出具有機率性,可能對相同輸入產生不同結果,如何在適應過程中管理這些不確定性成為關鍵問題。
觀察和表示:自適應系統透過監控收集資料,並進行概念化、儲存和利用。多模態 LLMs 處理多種資料,但其複雜性增加了設計難度。不同格式(如 HTML、XML、JSON)的表示效果差異,需要在語境質量與推理成本之間找到平衡。
LLM 增強的分散控制:LLMs 在多代理系統(LLM-MAS)中可提升集體智慧,但代理間的經驗共享不足影響效率,且隨代理數量增加,通訊成本升高。未來需開發高效的通訊協議和多代理協作技術。
自適應與個性化互動:LLMs 可幫助定製化互動介面,深入理解使用者偏好,增強人類在迴路(HOTL)的應用,但仍需解決使用者知識差異和互動能力不足的問題。
倫理與責任:隨著 GenAI 自主性增強,責任歸屬變得模糊,特別是在自適應系統和自動決策中,如何界定 GenAI 與人類責任是未來的研究重點。
評估工件:評估工件(如資料集、基準和示例)對自適應系統研究至關重要,但現有示例(如 DeltaIoT、DARTSim)在評估 LLM 時面臨兩大挑戰:觀察空間與 LLM 需求不匹配,且缺乏知識模組。未來示例應保留 LLM 所需的觀察空間並模組化知識元件。雖然 LLM 可作為端到端模型使用,但通常作為模組整合,評估面臨提示魯棒性和輸出質量等問題,需專門的評估工具。
自我測試:自我測試在自適應系統中面臨兩個挑戰:複雜的配置和無法預見的執行時變化。雖然傳統離線測試部分緩解問題,但線上、執行時和現場測試正逐步探索。LLMs 已用於故障定位、漏洞檢測、生成測試用例和模糊測試,但應用於自適應系統仍有限。Ceprot 是唯一相關研究,自動更新過時測試用例。自我測試可視為 MAPE-K 迴圈的一部分,LLMs 的能力有望推動其進一步發展。
自我進化:軟體進化指持續更新軟體以修復問題或提升效能。現有研究多利用 LLMs 進行漏洞修復和自動化程式修復,但自適應系統中的自動化進化研究有限。LLMs 可以透過集體智慧(如 metaGPT 自動化開發流程)以及自主學習(學習新技能以應對執行時的變化)實現自我進化。同時,系統的自我進化可能會伴隨專用領域建模語言(DSML)的演進,以便更有效地描述系統的新特性。未來的研究應重點關注這種系統進化與 DSML 進化的協同關係。