場景描述:哈佛大學的研究者,通過將 AI 技術引入建築的設計流程,為生成建築的圖紙規劃提供了更合理和多樣式的選擇,為人工智慧在建築設計行業的發展,帶來了進一步的嘗試和探索。
關鍵詞: GANs 建築設計 學科融合
本文轉載自公眾號「讀芯術」 ID:AI_Discovery
撰文 | Stanislas Chaillou (哈佛設計學院)
編譯 | 吳夢涵、盧佳琦
通讀全文預計用時 13 分鐘
GAN 生成的總體規劃圖
作為一門學科,人工智慧已經滲透到了無數領域,可以應用到各行各業之前未能解決的挑戰之上。之前有篇文章寫道, AI 在建築領域中的運用雖仍處於起步階段,但卻大有前景,甚至會重塑建築學科。
那麼,這個論斷到底對不對?本文打算將 AI 應用於建築環境之中來證實這個預言的準確性。
具體來說,我們打算將 AI 應用於建築平面圖的分析與生成。最終的目標分為三個方面:
1. 生成建築平面圖,如優化大量且高度多元的平面圖設計的生成;
2. 挑選合格的建築平面圖,如提供適當的分類方法;
3. 允許使用者「瀏覽」生成的設計選項。
我們方法主要來源於兩種直覺:1. 雖然包含了標準優化技術,但是建立建築平面圖確是一項非凡的技術挑戰;2. 空間設計是一個連續的過程,需要橫跨不同規模(城市規模、建築規模與單位規模)的連續設計步驟。
為了利用以上兩點,我們選擇了嵌入式生成對抗神經網路( Generative Adversarial Neural Networks )。該模型能讓我們在所遇到的建築平面圖中捕捉到更多的複雜性,並且通過連續的步驟來解決問題以分解這些複雜性。每個步驟都對應一個給定模型,且專門針對該特定任務進行訓練,整個過程最終可以證實人機互動的可能性。
平面圖實際上是一個高維度問題,處於可量化技術與定性屬性的交叉口。研究建築先例往往是一個危險的過程,在分析不夠嚴謹的情況下,忽視了現有資源數量的豐富性。我們的方法受當前資料科學方法的啟發,旨在確定優質的建築平面圖。通過建立 6 個指標,我們提出了一個可捕獲平面圖建築相關引數的框架。 一方面,佔地、朝向、厚度與材質這三個指標可用於捕捉給定平面圖風格的本質;另一方面,計劃、連通性和流通性則旨在描述平面圖組織的本質。
簡而言之,機器曾是鉛筆的延伸,如今卻可用於繪製建築知識,並通過訓練來幫助我們建立可行的設計選擇。
一. 框架
我們的工作處於建築與人工智慧的交匯處。前者是話題,後者是方法。兩者都已簡化成清晰且可操作的類別。
「建築」在這裡可理解為風格與組織的交集物。一方面,我們認為建築物是具有文化意義的載體,通過幾何學、分類學、型別學與裝飾來表達某種風格——巴洛克、羅馬、哥特、現代與當代,仔細研究平面圖便可找到許多建築風格;另一方面,建築物則是工程與科學的產物,遵循嚴格的框架與規則——建築規範、人體工程學、能量效率、出口與程式等——這些都可以在我們閱讀平面圖時找到。這種組織要求會幫助我們完成對「建築」的定義,並且推動我們的研究。
框架矩陣
我們將會用到人工智慧的兩個主要研究領域—— Analytics 和生成對抗網路,以作為研究工具。
首先,我們將深入探討「生成」這一主題。我們會使用 GANs 來將我們自己的人工智慧系統運用於建築設計之中。我們假設人工智慧的使用可以增強建築學科的實踐。該領域是一個全新的領域,還處於試驗階段,並且已經得到了令人驚訝的結果。我們希望能夠訓練人工智慧來繪製真實的建築平面圖。
然後我們會提出一個強大的分析框架來挑選與分類生成的平面圖。最終,我們的目標是組織 GANs 的結果,使使用者能夠無縫瀏覽各種建立的設計選項。為此,資料科學所提供的工具的數量和普遍性將會證明我們的研究是有價值的。
通過這種雙重設計,在風格與組織、挑選與生成的交叉口,我們制定了一個框架來安排建築與人工智慧的相遇。
二. 生成
設計建築平面圖是建築實踐的核心。掌握平面圖的設計是該學科的黃金標準。從業者加班加點、不斷嘗試通過技術的手段來提高這項實踐。在第一部分中,我們深入探討了應用於平面圖生成的人工智慧的潛力,以進一步推動這一領域的發展。
為了解決平面圖的風格與組織問題,在下文中,我們會運用框架來探討基於人工智慧的空間規劃潛能。我們的目標是提供一套可靠強大的工具來證明這種方法的潛能並驗證我們的假設。
存在三個方面的挑戰:1. 選擇正確的工具集;2. 分離正確的現象來展示給機器;3. 確保機器正確地“學習”。
人工智慧與生成對抗神經網路
生成對抗神經網路( GANs )是我們選擇的武器。在人工智慧領域,神經網路是重要的研究領域。最近,生成對抗神經網路的出現證明了這種模型的創造能力。作為機器學習模型,GAN 能在給定的資料中學習統計重要的現象。然而,它們的結構代表著一個重大突破:GAN 由生成器與判別器這兩個關鍵模型組成,可以利用這兩個模型之間的反饋迴圈來提高生成相關影象的能力。判別器用於從資料中識別影象。經過適當的訓練,該模型能夠區分從資料集中提取出來的真實影象和資料集不熟悉的“假”影象。然而,生成器則是用於建立影象,這些影象與來自相同資料集中的影象相似。當生成器生成影象時,判別器會向它反饋其輸出的質量。作為迴應,生成器會採納這些反饋,以生成更加逼真的影象。通過這個反饋迴圈,GAN 慢慢建立了建立相關合成影象的能力,將在資料中發現的現象考慮在內。
生成對抗神經網路的結構
呈現與學習
如果 GANs 為我們帶來了巨大的機會,那麼知道向它們展示什麼是至關重要的。我們有機會讓模型直接從建築平面圖中學習。通過格式化影象,我們可以控制模型學習的資訊型別。比如,將地塊形狀與相關建築佔地展示給我們的模型就會得到一個新的模型,它能夠根據地塊的形狀來建立典型的建築佔地。為了確保輸出的質量,我們將運用我們的“建築感”來組織訓練集的內容:每個模型的好壞取決於建築師所提供的資料。
A. 風格轉變
現代到巴洛克風格的轉變
在建築平面圖中,可以通過牆壁的形狀與圖形平面來判定其“風格”。典型的巴洛克教堂以厚重的柱子與圓形凹痕為特徵,Mies van der Rohe 的現代別墅則以又薄又平的牆壁為特徵。GAN 能夠識別牆壁表面的鋸齒形狀。通過展示這兩幅影象並且將其中一幅作為平面圖線框,另一幅作為實際的牆結構,我們可以根據建築風格建立一定數量的機器直覺。
該部分展示了模型學習巴洛克風格的成果圖。我們繼續風格轉換,將給定建築平面圖的厚牆壁磨平(A),然後再賦予其新的牆壁風格(B)。
風格轉變結果:公寓單元 現代到巴洛克風格的轉變
B. 佈局輔助
佈局輔助 分步驟流程
在本節中,我們準備了一份多步驟的流程圖,包含了繪製建築平面圖的所有必要步驟。它能根據不同建築規模模仿建築師繪製平面圖,並且將每個步驟壓縮至一個特定模型之中,用於執行給定操作。從地塊到建築佔地圖,從建築佔地圖到標明牆壁和開窗的房間圖,從房間圖到精裝平面圖,每一步都經過精心設計、訓練與測試。
生成流程 (模型 I to III)
同時,通過將整個流程分成幾個單獨的步驟,該系統考慮到了每個模型之間的使用者干擾。通過選擇與編輯模型輸出,使用者可以在輸出進入下個模型之前控制設計過程。它的輸入決定了模型的決策,從而能夠實現預期的人機互動。
1. 佔地
周邊 | 地塊 (輸入)| 生成佔地 (輸出)
流程的第一步解決了根據給定地塊幾何建立適當的建築佔地圖的挑戰。為了訓練這個模型,我們使用了波士頓建築佔地圖的廣泛資料庫,並且建立了一系列模型,每個都能匹配某種特定的房產型別:商業房、住宅、公寓與工業房等。
每個模型都能根據給定的地塊建立一組相關建築佔地圖,其大小與風格都類似於訓練中的型別。下圖是使用住宅模型的 9 個示例:
結果: 生成佔地 (住宅)
2. 房間分割與開窗
佔地| 開口 & 陽臺 (輸入) | 計劃 & 開窗 (輸出)
下一步自然是建築佔地圖中房間的佈局了。能夠分割給定的建築平面圖,並且保留有意義的銜接、正常的房間尺寸與適當的開窗是一項挑戰。GANs能夠迎刃而解,並且產生令人驚訝的結果。
通過使用含有大約700個帶註釋的建築平面圖的資料集,我們能夠訓練出各種模型。每個都面向特定的房間數,並且一旦用於空白的建築佔地圖就能產生意想不到的相關結果。下圖展示了一些典型的結果:
結果:生成計劃&開窗
3. 配置傢俱
計劃 (輸入, 選項 1) | 傢俱位置 (輸入, 選項 2)| 配置傢俱的單元 (輸出)
最後一步將生成原理帶到了最細微的層面:往空間裡新增傢俱。為此,我們首先訓練模型來一次性完成整個公寓的傢俱配置。
該網路能基於各個房間的計劃、空間裡傢俱的相關佈置以及各個元素的大小來學習。結果如下圖所示:
結果: 配置傢俱的單元
這些結果能讓我們大致瞭解可能的傢俱佈局,但是成果圖的質量仍然太模糊了。為了進一步提高輸出質量,我們為各個房間型別(客廳、臥室與廚房等)額外訓練了一組模型。每個模型只能將平面圖上的色塊轉變為精心繪製的傢俱,傢俱型別用顏色程式碼編號。各模型結果如圖所示:
配置房間傢俱模型的結果 | 浴室 / 廚房 / 客廳 / 臥室
4. 再進一步
如果能運用技術實現標準公寓的生成,那麼下一步自然是進一步挑戰模型的極限。實際上,GANs 具有顯著的靈活性以解決看似困難重重的問題。在建築平面圖的佈局中,由於建築佔地圖的大小與形狀有變,人工劃分與裝飾空間是一個極具挑戰的過程。在這種情況下,我們的模型非常“聰明”,能夠適應變化的限制條件,證明如下:
GAN下的空間佈局
我們可以控制建築單元的入口和門窗,加上模型非常靈活,因此能夠超越單個建築單元,解決更大規模的空間規劃問題,在下圖的示例中,我們將技術應用擴充套件到了整個建築物之中。
GAN生成的實驗總體規劃圖
三.挑選合格的平面圖
無法命名則增加了世界的混亂。
——Albert Camus
為了平衡我們生成建築平面圖的能力,找到適當的框架,對生成的設計選項進行組織、排序和分類至關重要。建築平面圖的好壞取決於我們對生成選項資料庫的駕馭能力。通過借用建築概念,我們希望將常見的建築用語轉化為可量化的指標。
為此我們建立了 6 個關鍵指標來形容建築平面圖設計的 6 個重要方面:佔地、計劃、朝向、厚度與質地、連通性與流通性。
6 個指標
這些指標組成了一個綜合框架,可解決建築平面圖的風格與組織問題。每個指標都是一種演算法,並且經過了全面測試。
A. 佔地
建築物形狀是用於確定建築物風格的最簡單的也是最直觀的指標。「佔地」這個指標可分析建築物平面圖周邊的形狀,並將其轉化為直方圖。
該描述符號能在對建築物形狀進行編碼的情況下,將建築師口中常用的形容詞——如「薄」、「笨重」與「對稱」等——轉化為數字資訊,以便於與計算機交流關於建築形狀的資訊。
佔地圖
從技術層面來說,該指標運用極凸性將給定輪廓轉變為一組離散值(向量),然後將其與其它建築平面圖進行比較。我們運用來自平面圖中心的極線陣列來提取平面圖區域,這些區域由空間切片捕捉而成。如下圖所示,事實證明,該方法能夠取得不錯的成果。該技術同樣也可用來確定室內空間形狀與建築物周邊的形狀。
運用佔地指標的典型建築平面圖 (左: query , 右: results )
B. 計劃
建築物計劃,換句話說也就是所含房間的型別,是內部組織的主要驅動要素。瞭解這一點對我們的方法來說至關重要。為了描述房間組合,我們用顏色為給定建築平面圖的各個房間進行編碼。這些顏色組合就變成了描述建築物計劃的指標。它充當模板,融合了建築平面圖的房間數量和計劃質量。這一指標對人類來說看起來很直觀,它也可以轉換成機器能夠理解的可靠的編碼技術。
運用計劃指標的典型建築平面圖 (左: query , 右: results)
從技術層面上來說,通過運用顏色組合,我們可以計算任意給定建築平面圖之間的計劃相似性和差異性。為了視覺化結果,每個平面圖都既是彩色建築平面圖,又是計劃的一維顏色向量。
運用計劃指標的典型建築平面圖(左: query , 右: results , 底部: results’ program )
C. 朝向
平面圖中牆壁朝向能夠提供重要資訊。它既能描述平面圖的封閉性(牆壁朝向所造成空間封閉性),也能描述其風格。事實上,只需提取牆壁朝向的直方圖,我們就可以運用這個指標輕鬆區分現代房屋與哥特式大教堂。
朝向圖
從技術層面上來說,“朝向”提取了給定建築平面圖中的牆壁,沿著各個空間方向(從 0 到 360 度)來總結其長度。評估平面圖總體朝向,然後得出一組數值。該指標可用於獲取單個描述符號,也可當作向量來比較各個平面圖。
運用朝向指標的典型建築平面圖 (左: plan, 右: orientation)
D. 厚度與材質
「厚度與材質」這個指標確定了平面圖的「肥瘦」:牆壁厚度與厚度變化。在不同風格的平面圖中,牆壁厚度與牆體材質差異巨大。在學院派風格的大廳中可以看見厚柱子與參差不齊的厚牆壁,但是在 Mies van der Rohe 的別墅中則只能看到呈直線型的薄牆壁。該指標能夠輕鬆掌握這些特徵(如下圖所示):
厚度與材質
從技術層面上來說,該指標能分離給定平面圖中的所有牆壁,並輸出有關牆壁厚度的直方圖。同時,該演算法也可計算牆壁厚度的變化,以更好地描述牆壁材質(如平坦的牆壁與豎框)。
運用厚度與材質指標的典型建築平面圖分析(左: plan , 右: resulting diagrams )
E. 連通性
「連通性」這個指標解決了房間鄰接的問題。房間之間彼此的接近程度是建築平面圖中的重要指標。另外,房間之間通過門與走廊來連線,這決定了房間之間彼此的連線。“連通性”將房間連線當作標準圖表,以此來研究連線的數量和質量。
連通性與鄰接矩陣
從技術層面上來說,通過平面圖中的開窗,我們可以推斷出房間之間現有的關係圖。然後“連通性”會建立矩陣圖來呈現這些連線。最終有關房間連線的圖表就生成了。通過這個圖表,我們可以比較不同的建築平面圖,考慮它們房間連線的相似性。
運用連通性指標的典型建築平面圖分析(左: connectivity graph , 右: plan adjacencies )
F. 流通性
建築平面圖中的流通性描述了人們在空間中的移動。通過提取流通性的骨架,換句話說也就是流通網路的線框,我們可以量化與確定人們在建築平面圖中的移動。
流通性
從技術層面上來說,「流通性」提取了給定建築平面圖的流通程度,並且沿著空間各個方向(從 0 到 360 度)來總結其長度。所得直方圖評估了該流通網路形狀,可用於比較不同建築平面圖的流通性。
運用流通性指標的典型建築平面圖分析 (左: circulation graph , 右: diagram )
四. 繪製與瀏覽
比較平面圖得到的相似的平面圖
回顧我們的 GAN 模型,每個模型都在生成流程的各個步驟輸出了多個選項。隨後,設計師需要「挑選」出心儀的選項,並且在需要的時候改進該選項,然後再進入下一步。然而,瀏覽生成選項實則是個既難受又耗時的過程。為此,「挑選合格的平面圖」章節中所描述的 6 個指標在這兒可以發揮它們的所有潛力,補充我們的生成流程。使用者可將它們用作過濾器來縮小選擇範圍,在幾秒鐘內找到相關設計選項。生成過濾器的雙重性在於我們的工作價值得到了更多的證明:我們提供了一個完整的框架,並且在普通使用者力所能及的範圍內利用了人工智慧。
一旦模型根據給定標準(佔地、計劃、朝向、厚度與材質、連通性與流通性)進行過濾,我們就會為使用者提供一幅樹狀圖來呈現他/她的選擇。選定選項在樹狀圖中央,周圍是最接近使用者選擇標準的選項。然後使用者可以縮小搜尋範圍,尋找最理想的設計選項,或是選擇樹狀圖裡的其他選項,來重新計算圖形。
建築平面圖的相似樹狀圖
五. 總結
人工智慧很快就會大力幫助建築師進行日常實踐了。隨著這種潛能即將得到證實,我們參與了概念的驗證,我們的框架提供了討論的契機。我們邀請建築師參與人工智慧,建議資料科學家將建築作為研究領域。但是今天我們的工作可以總結為以下四個方面:
首先,從概念上來說,我們相信設計概念的統計方法決定了人工智慧在建築方面的潛能。它的不確定性和全面性無疑為我們的領域創造了機會。依靠它們來提取重要品質,並在整個設計過程中模仿它們,而不是利用機器來優化變數,是一種正規化上的轉變。
其次,我們堅信,正確設計流程的能力將推動人工智慧成為新的建築工具。我們選擇了 Andrew Witt 教授在 Log 中引入的「灰盒測試」,有可能會得到最佳的潛在結果。「灰盒測試」與「黑盒測試」相反,後者只允許使用者提前輸入資訊,在流程結束時才能得到設計選項,無法控制連續的生成步驟。相反,通過將整個流程分解成單獨的步驟,「灰盒測試」允許使用者隨時干預。對機器的嚴格控制是對設計過程質量的最終保證。
第三,在技術層面上,我們認為應用程式的順序性會提高其可管理性,並且會促進其發展。能夠在整個生成過程中進行干預是非常重要的:該流程的各個步驟代表著建築專業知識的不同板塊,每個模型都可以獨立訓練,這有利於未來的重大改進與實驗。實際上,從頭到尾改進整個流程可能是一項漫長而繁瑣的任務,但是逐步改進卻是可管理的過程,並且是在業內大多數建築師和工程師的能力範圍之內的。
最後,我們希望我們的框架能夠解決模型(不管是需要訓練的模型還是生成流程中的模型)的無限廣度和複雜性的問題。我們相信,在諸多選項中,像我們那樣處理地塊-佔地-房間分割等是一種可行的方法。要想概括空間規劃的必要步驟,關鍵在於原則而非方法。隨著獲取建築資料變得愈加容易,我們鼓勵大家開放思想,進一步進行研究與實驗。
我們並不是將人工智慧視作建築領域的新教條,而是將其看作一項充滿潛力和希望的新挑戰。在這裡我們有可能取得豐碩的成果,這將豐富我們的實踐,並且解決我們學科中的一些盲點。