用LLM做半導體設計,IBM&MIT提出受神經啟發的LLM推理網路SOLOMON

ScienceAI發表於2025-03-18
圖片

編輯丨coisini

儘管大型語言模型(LLM)擅長複雜推理,但在適應特定領域時仍面臨挑戰,尤其是在需要空間推理和解決結構化問題的領域。半導體佈局設計就是一個典型例子,AI 工具必須理解幾何約束並確保元件的精確佈局。

基於此,來自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智慧實驗室的研究人員提出了一種受神經啟發的 LLM 推理網路 ——SOLOMON,旨在增強領域特定的適應性。與傳統方法不同,SOLOMON 採用多智慧體推理系統,動態處理空間約束和幾何關係。

圖片

論文地址:https://arxiv.org/pdf/2502.04384

SOLOMON 框架整合了思維評估機制,透過迭代最佳化輸出,提高解決問題的準確性。SOLOMON 利用提示工程(prompt engineering)來引導 LLM 生成解決方案,使其能夠以最少的重新訓練適應半導體佈局任務。

如下圖所示,SOLOMON 架構受到兩種理論的啟發:類腦通用人工智慧(Brain-like AGI)和自由能原理(Free Energy Principle, FEP)。

圖片

類腦通用人工智慧啟發研究團隊利用多個大型語言模型(LLM)的思維池來發現最佳推理計劃。研究團隊還應用了自由能原理的核心觀點,即人類注意力集中於最小化目標與感知之間的差異,從而選擇相關資訊並避免常見陷阱。

SOLOMON 的關鍵元件包括:

思維生成器(Thought Generators):由一組多樣化的大型語言模型(LLMs)組成,負責為目標任務生成多種思維。思維生成器透過「思維樹(Tree-of-Thoughts)」構建了一個高效的並行搜尋引擎,並作為思維評估器(Thought Assessor)的自適應檢索增強生成(RAG)系統。

思維評估器(Thought Assessor):一個基於 LLM 的系統,用於分析提出的「思維」以生成精煉的輸出。它對思維生成器的輸出進行上下文學習,並遵循自由能原理。

導向子系統(Steering Subsystem):一個由人工操作的元件,用於控制思維生成器和思維評估器的注意力。

與微調不同,SOLOMON 架構無需持續重新訓練,在專業應用中更為高效。

為了評估 SOLOMON 的有效性,研究團隊在 25 個半導體佈局任務上進行了實驗,採用五個基線 LLM 進行了比較,包括 GPT-4o、Claude-3.5-Sonnet 和 Llama-3 等,旨在評估模型在生成幾何結構時保持空間準確性的能力。SOLOMON 在減少執行時錯誤和擴充套件不準確性方面表現出改進,展示了更好的空間推理能力,提高了佈局精度並減少了生成設計中的錯誤。

圖片

總的來說,SOLOMON 的一個關鍵優勢在於其能夠糾正幾何設計中的邏輯不一致和算術錯誤。SOLOMON 為將 AI 應用於特定領域問題解決(尤其是半導體佈局設計)提供了一種結構化且高效的方法。

圖片

感興趣的讀者可以閱讀論文原文,瞭解更多研究內容。

相關報導:https://www.marktechpost.com/2025/02/16/this-ai-paper-from-ibm-and-mit-introduces-solomon-a-neuro-inspired-reasoning-network-for-enhancing-llm-adaptability-in-semiconductor-layout-design/

相關文章