無需數學就能寫AI，MIT提出AI專用程式語言Gen

机器之心發表於2019-06-27

原文網址 : https://www.jiqizhixin.com/articles/2019-06-27-8

近日，在提交程式語言設計與實現大會（PLDI）的一篇論文中，MIT 研究人員介紹了一種全新的概率程式設計系統 Gen。從計算機視覺到機器人和統計，使用者可以通過 Gen 為應用 AI 技術的多個領域編寫模型和演算法，且無需處理方程式或手動編寫高效能程式碼。此外，Gen 還允許研究人員編寫用於預測任務的複雜模型和推理演算法，這在之前是不可能做到的。

例如，3-D 人體姿態是一項困難的計算機視覺推理任務，在自動系統、人機互動和擴增實境（AR）中均有應用。在論文中，研究人員展示了簡短的 Gen 程式如何推理 3-D 人體姿態。

看起來十分簡單，但在後臺，該程式包括執行圖形渲染、深度學習和概率模擬型別的元件。與一些研究人員所開發的早期系統相比，這些不同技術的結合可以提高這項任務的準確性和速度。

無需數學就能寫AI，MIT提出AI專用程式語言Gen

論文圖 6：人體姿態推理任務的建模、推理程式碼以及評估結果。模型使用靜態 DSL 編寫，呼叫圖形引擎從姿態引數中渲染深度影像。自定義提議結合靜態 DSL 和 TensorFlow DSL，通過深度神經網路來傳遞觀察到的深度影像，並提出姿態引數。

研究人員表示，由於其簡單性，從新手到專家，Gen 可以被任何人輕鬆使用。「這項工作的一個動機是讓電腦科學或數學專業知識較少的人更容易做自動化人工智慧，」論文第一作者、電氣工程和電腦科學系博士生 Marco Cusumano-Towner 說。「我們還希望它能提高生產力，這意味著專家可以更輕鬆地快速迭代 AI 系統，做出原型。」

研究人員還展示了 Gen 通過使用其他 Gen 程式簡化資料分析的能力，該程式可自動生成通常由專家用於分析、解釋和預測資料中基礎模式的複雜統計模型。這種能力建立在研究人員先前工作的基礎上，也就是讓使用者可以編寫幾行程式碼來發現對金融趨勢、航空旅行、投票模式以及疾病傳播的洞見。但不同的是，早期系統需要大量的手動編碼才能進行準確的預測。

「Gen 是第一個足以涵蓋計算機視覺和資料科學中不同案例的靈活、自動化、高效的系統，且效能非常好。」MIT 腦與認知科學系（Department of Brain and Cognitive Sciences）的研究員 Vikash K. Mansinghka 說，他負責執行概率計算專案。

集自動化、靈活性和速度優勢於一身

2015 年，谷歌開源 TensorFlow 以來，它已經成為了最為流行的深度學習框架。然而，即使 TensorFlow 足夠自動化和高效，但它只側重於深度學習模型，對範圍更廣的人工智慧而言，這些模型既昂貴又有限。

如今，業內已經有大量的 AI 技術，例如統計和概率模型、模擬引擎等。一些概率程式設計系統雖然足夠靈活，可以覆蓋到多種 AI 技術，但執行不夠高效。

研究人員尋求的是集其所長於一身：自動、靈活、快速。Mansinghka 說，「如果我們能做到這一點，或許就能向 TensorFlow 對深度學習那樣，有助於民主化更廣泛的模型和推理演算法。」

在概率性 AI 中，推理演算法會對資料執行操作，並基於新資料連續地調整概率，從而最終做出預測。

借鑑了早期概率程式設計系統 Church 中的概念，研究人員將幾種自定義建模語言結合到 Julia 中，每種建模語言都對不同型別的 AI 建模方法進行優化，使其更加通用。利用優化、變分推理、某些概率方法以及深度學習等各種方法，Gen 還為推理任務提供了高階基礎結構。

外部機構就 Gen 與 MIT 展開合作

外部使用者已經在尋找利用 Gen 進行 AI 研究的方法。例如，英特爾與 MIT 合作，將 Gen 用於機器人和 AR 系統，尤其內部基於深度感知攝像頭的 3D 姿態估計。MIT 林肯實驗室（Lincoln Laboratory）也在合作開發 Gen 在人道主義救援和災害應對空中機器人中的應用。

在 MIT 追求人工智慧的環境下，Gen 開始被用於野心勃勃的 AI 專案中。例如，Gen 對 MIT-IBM 沃森人工智慧實驗室以及美國國防部先進研究專案局（Department of Defense』s Defense Advanced Research Projects Agency）正在進行的「機器常識」專案極為重要，該專案旨在建模 18 個月大嬰兒水平的人類常識知識庫。Mansinghka 是該專案的主要研究者之一。

Mansinghka 表示：「藉助於 Gen，研究人員首次得以很容易地整合大量不同的 AI 技術。」

優步首席科學家和 AI 副總裁、劍橋大學教授 Zoubin Ghahramani 表示：「自深度學習出現以來，概率程式設計是最有潛力的前沿人工智慧領域之一。Gen 代表了這一領域的重大進展，並將有助於概率推理 AI 系統的可擴充套件和實際實現。」

谷歌研究主管 Peter Norvig 也非常讚賞這項工作，他說：「Gen 允許使用者使用概率程式設計解決問題，因此對各種問題有更具原則性的方法，且不受限於概率程式設計系統設計上的一些缺陷。通用程式語言之所以能成功，是因為它們能令程式設計師更容易完成任務，Gen 對於概率程式設計的意義同樣在此。」

舉個例子

研究人員編寫了一個簡短的 Gen 程式來做貝葉斯線性迴歸：給定（x, y）平面上的一組資料點，他們想找出一條能很好擬合這些資料點的線。

典型的 Gen 程式通常包含三個主要元件。

首先，定義一個生成模型：利用額外語句擴充套件的 Julia 函式，即從概念上模擬一個假資料集。下面的模型對 slope 和 intercept 引數進行取樣，然後 x 軸上的引數可以作為輸入，且對相應 y 軸進行取樣。他們將所做的隨機選擇命名為 @trace，這樣就可以在推理程式中引用這些選擇。

using Gen@gen function my_model(xs::Vector{Float64}) slope = @trace(normal(0, 2), :slope) intercept = @trace(normal(0, 10), :intercept) for (i, x) in enumerate(xs) @trace(normal(slope * x + intercept, 1), "y-$i") endend

其次，研究人員編寫了一個推理程式，用於操縱模型的 Execution Traces。推理程式是常規的 Julia 程式碼，並利用 Gen 的標準推理庫。

下面的推理程式會輸入資料集，並迭代地執行 MCMC 演算法，以擬合 slope 和 intercept 引數：

function my_inference_program(xs::Vector{Float64}, ys::Vector{Float64}, num_iters::Int) # Create a set of constraints fixing the  # y coordinates to the observed y values constraints = choicemap() for (i, y) in enumerate(ys) constraints["y-$i"] = y end  # Run the model, constrained by `constraints`, # to get an initial execution trace (trace, _) = generate(my_model, (xs,), constraints)  # Iteratively update the slope then the intercept, # using Gen's metropolis_hastings operator. for iter=1:num_iters (trace, _) = metropolis_hastings(trace, select(:slope)) (trace, _) = metropolis_hastings(trace, select(:intercept)) end  # From the final trace, read out the slope and # the intercept. choices = get_choices(trace) return (choices[:slope], choices[:intercept])end

最後，研究人員在一些資料上執行推理，得到下面的結果：

xs = [1., 2., 3., 4., 5., 6., 7., 8., 9., 10.]ys = [8.23, 5.87, 3.99, 2.59, 0.23, -0.66, -3.53, -6.91, -7.24, -9.90](slope, intercept) = my_inference_program(xs, ys, 1000)println("slope: $slope, intercept: $intercept")

論文：Gen: A General-Purpose Probabilistic Programming System with Programmable Inference

無需數學就能寫AI，MIT提出AI專用程式語言Gen

摘要：概率建模和推理對於很多領域都是極為重要的。概率程式語言得到更廣泛採用的關鍵挑戰在於設計靈活且效能良好的系統。本文介紹的新概率程式設計系統 Gen 具有可用於建模以及終端使用者自定義和推理優化的全新語言結構。Gen 使得能夠解決多領域問題的概率程式編寫變得切實可行。Gen 程式能夠結合 Julia 編寫的生成模型、TensorFlow 中的神經網路以及基於 Monte Carlo 可擴充套件庫的推理演算法和數值優化方法。

本文還介紹了一些能夠結合 Gen 靈活性和效能的方法：

生成函式介面，一種封裝概率和/或可微計算的抽象
具有自定義編譯器的特定領域語言，對不同的靈活性/效能進行權衡
能夠編碼條件獨立性和重複計算常見模式的連結符，支援快取加速
標準推理庫，支援在 Gen 中編寫作為程式的自定義建議分佈

本文研究表明，在處理非線性狀態空間建模、現實世界時序資料結構學習、魯棒迴歸以及基於深度影像的 3D 人體姿態估計等問題上，Gen 的效能優於當前最佳的概率程式設計系統，有時超出多個數量級。

參考連結：

http://news.mit.edu/2019/ai-programming-gen-0626

https://probcomp.github.io/Gen/

https://github.com/probcomp/Gen

https://dspace.mit.edu/bitstream/handle/1721.1/119255/MIT-CSAIL-TR-2018-020.pdf

不停PUA大模型「寫更好點」，無需其它花哨技術就能讓AI程式碼水平暴增
2025-01-11
大模型AI
無需語言的數學證明，值得收藏！
2018-11-02
程式設計是更像數學還是人類語言？- MIT News
2020-12-16
程式設計MIT
谷歌、OpenAI學者談AI：語言模型正在努力「攻克」數學
2022-11-01
谷歌OpenAI模型
谷歌大腦提出AutoML-Zero，只會數學運算就能找到AI演算法 | 開源
2020-03-13
谷歌TOMLAI演算法
下一gen AI Bus指南
2023-12-14
AI
用 PHP 寫一個"程式語言"
2018-12-21
PHP
大語言模型的應用探索—AI Agent初探！
2024-07-08
模型AI
用於數學的 10 個優秀程式語言
2018-03-07
如何讓AI理解數學？Facebook神經網路透過「語言翻譯」求解數學難題
2020-07-01
AI神經網路
咳兩聲就能鎖定新冠！MIT收集20萬咳嗽樣本，用AI辨別無症狀感染者，準確率100%
2020-11-05
MITAI
AI透過語言遊戲進行無限制的蘇格拉底式學習
2024-12-01
AI遊戲
用AI創造AI，人工智慧無程式碼時代來臨
2019-04-17
AI人工智慧
用AI回憶起曾被忘卻的語言
2023-03-27
AI
為 AI 而生的程式語言「GitHub 熱點速覽」
2024-04-02
AIGithub
C 語言寫得比 Codex 還要好的 AI 開源了！
2022-03-18
AI
只需初中數學知識就能理解人工智慧大語言模型
2024-10-29
人工智慧模型
專訪 | 德國大神Hans Uszkoreit：語言才是AI的關鍵，深度學習無法解決NLP的核心問題
2019-02-18
AI深度學習
智譜開源 CogAgent-9B，讓 AI「看懂」螢幕；Anthropic：大多數任務無需複雜 AI 智慧體
2024-12-27
AI智慧體
Deepseek兩項關鍵發現：無需人類專家SFT、有自己專家語言DSL
2025-01-30
無聲的AI：昇騰AI如何用大模型破解手語學習的難題？
2022-07-13
AI大模型
AI繪畫線上生成網站，無需下載直接線上生成ai美圖
2022-12-27
AI網站
無直接資料可用，AI怎麼學會「幹活」？微軟團隊揭秘AI從語言到行動的進化之路
2025-01-21
AI微軟
DataGPT：一個用自然語言來分析資料的AI Agent
2024-11-15
GPTAI
AI影片語音轉寫文字工具：AI Transcription for Mac中文版
2024-02-02
AIMac
因 AI 而設計的語言 LISP
2020-01-19
AILisp
用「圖靈測試」檢驗AI尤其是大語言模型，真的科學嗎？
2024-08-30
圖靈AI模型
無需等待Vue Release釋出，就能在專案中體驗最新版
2024-10-24
Vue
阿里如何用 AI 寫程式碼？
2020-02-20
阿里AI
PHP 程式設計師學會了 Go 語言就能唬住面試官嗎？
2024-09-09
PHP程式設計師Go面試
可信賴AI時代與無需換軌的京東
2019-10-23
AI
JavaScript函數語言程式設計無痛入門
2019-05-05
JavaScript函數程式設計
JavaScript函數語言程式設計學習
2018-06-13
JavaScript函數程式設計
硬核觀察 #795 首個可以翻譯無文字語言的口語翻譯 AI
2022-10-20
AI
幽默：儘量用領域語言編寫程式碼
2022-02-21
What-If 工具：無需寫程式碼，即可測試機器學習模型
2018-10-10
機器學習模型
Mistral AI兩連發：7B數學推理專用、Mamba2架構程式碼大模型
2024-07-17
AI架構大模型
Gen-AI：人工智慧和工作的未來
2024-04-20
AI人工智慧

無需數學就能寫AI，MIT提出AI專用程式語言Gen

相關文章