MIT開源高效能自動微分框架Enzyme：速度提升4.5倍

機器之心發表於2021-01-03

原文網址 : https://www.jiqizhixin.com/articles/2021-01-03-6

當前，PyTorch、TensorFlow 等機器學習框架已經成為了人們開發的重要工具。計算反向傳播、貝葉斯推理、不確定性量化和機率程式設計等演算法的梯度時，我們需要把所有的程式碼以微分型寫入框架內。這對於將機器學習引入新領域帶來了問題：在物理模擬、遊戲引擎、氣候模型中，原領域元件不是由機器學習框架的特定領域語言（DSL）編寫的。因此在將機器學習引入科學計算時，重寫需求成為了一個挑戰。

為了解決這一問題，現在的發展趨勢包含構建新的 DSL，讓重寫過程變得簡單，或者在程式設計時直接進行構建。這些方法可以讓我們獲得有效的梯度，但是仍然需要使用 DSL 或可微分的程式語言進行重寫。

開發者們自然會希望使用機器學習框架以外的程式碼重用已有工具，或在一種語言裡寫好損失函式，然後為其用例提供更簡單的抽象。儘管目前已經出現了一些針對不同語言的反向自動微分框架（AD），但我們很難在 ML 框架外的程式碼上自動使用它們，因為其仍需要重寫，且對於跨語言 AD 和庫的支援有限。

為了方便開發者，來自 MIT 的研究者開源了 Enzyme，一種用於 LLVM 編譯器框架的高效能自動微分（AD）編譯器外掛。該外掛能夠合成以 LLVM 中間表示（IR）表示的靜態可分析程式的梯度。Enzyme 能夠合成任何以面向 LLVM IR 編譯器為語言編寫的程式的梯度，包括 C、C ++、Fortran、Julia、Rust、Swift、MLIR 等，從而提供這些語言的本機 AD 功能。

據作者介紹，與傳統的源到源和 operator-overloading 工具不同，Enzyme 在最佳化的 IR 上執行 AD。

在包括微軟 ADBench 在內的以機器學習為重點的基準套件上，經過最佳化的 IR 上的 AD 的幾何平均速度比未經過最佳化的 IR 上 AD 的幾何平均速度提高了 4.5 倍，這使得 Enzyme 達到了最高的效能。

此外，Enzyme 方便使用，在 PyTorch 和 TensorFlow 上都有程式包，可讓開發者便捷訪問具有最新效能的外來程式碼梯度，從而使外來程式碼可直接合併到現有的機器學習工作流程中。

專案網頁：https://enzyme.mit.edu/
專案地址：https://github.com/wsmoses/Enzyme

作者表示，Enzyme 可提供這些工具和能力：

Enzyme，一種用於 LLVM 的編譯器外掛，可以合成可靜態微分的 LLVM IR 的快速梯度。包括 C、C ++、Fortran、Rust、Swift 等編譯器前端生成的中間表示（IR）。
PyTorch-Enzyme/TensorFlow-Enzyme，一個外部功能介面，允許機器學習研究者使用 PyTorch 和 TensorFlow 使用以 LLVM 編譯語言編寫的外部程式碼。
Enzyme.jl，一個 Julia 包，透過動態高階語言編寫的程式碼，僅使用低層資訊獲得梯度。
透過連結時最佳化（LTO）支援了多來源 AD 和靜態庫支援。
研究表明最佳化後執行 AD，在標準機器學習基準測試上可獲得顯著效能提升，並達到 SOTA 水平。

MIT開源高效能自動微分框架Enzyme：速度提升4.5倍

上圖為 relu(pow(x,3)) 的梯度合成示例。左側為 LLVM IR 上的原始計算。左側註釋中展示了將新增到前向傳遞中的活動變數的影子分配。右側則是 Enzyme 將生成的反向傳遞。完整的合成梯度函式將結合使用這些函式（新增影子分配），將 if.end 中的返回替換為 reverse_if.end 的分支。

Enzyme 專案概述

Enzyme 專案是一個用於可靜態分析 LLVM IR 的反向模式自動微分（AD）工具。它允許開發者可以自動建立基於原始碼的梯度，而無需更多額外工作。

double foo(double);double grad_foo(double x) {    return __enzyme_autodiff(foo, x);}

透過最佳化微分後的程式碼，Enzyme 可以比現有的最佳化工具提供更快的微分速度：

MIT開源高效能自動微分框架Enzyme：速度提升4.5倍

元件

Enzyme 工具主要由四部分組成：

可選的預處理階段，該階段執行對 AD 有用的較小轉換。
一種新的過程間型別分析，可推斷出記憶體位置的基礎型別。
活動分析，確定哪些指令或值會影響導數計算（在現有 AD 系統中很常見）。
最佳化遍歷可建立任何必需的派生函式，用生成的函式替換對__enzyme_autodiff 的呼叫。

更多詳細介紹，可檢視 MIT 研究者們提交的 NeurIPS 2020 論文：

MIT開源高效能自動微分框架Enzyme：速度提升4.5倍

論文地址：https://arxiv.org/pdf/2010.01709.pdf

Pytorch 自動微分
2020-12-24
PyTorch
狂攬兩千星，速度百倍提升，高效能Python編譯器Codon開源
2022-12-12
Python編譯
美國「返利網」開源sk-dist框架將sklearn訓練速度提升數倍
2019-10-04
框架
React測試框架之enzyme
2018-11-07
React框架
開源專案 pyqt 軟體自動更新框架
2022-08-13
QT框架
【開源公告】H5、小程式自動化測試框架FAutoTest正式開源
2018-09-29
H5框架
深度學習利器之自動微分(2)
2021-10-14
深度學習
深度學習利器之自動微分(1)
2021-10-12
深度學習
阿里雲通義開源長文字模型及推理框架，百萬Tokens處理速度提升近7倍
2025-01-27
阿里模型框架
C# 開源瀏覽器效能提升，體驗Chrome級速度
2024-09-25
C#瀏覽器Chrome
Sight——殺手級提升Laravel開發速度的元件現在開源了！
2020-10-11
Laravel元件
AI 回答物理學問題，MIT 開發自動繪製材料相圖機器學習框架
2024-05-27
AIMIT機器學習框架
自動識別最佳分子，降低合成成本，MIT開發分子設計決策演算法框架
2024-06-21
MIT演算法框架
ASP.NET Core 修改開源協議為MIT，.NET全平臺 MIT協議開源了
2021-08-25
ASP.NET協議MIT
Go 語言，開源服務端程式碼自動生成框架 – EasyGoServer
2019-03-02
Go服務端框架Server
laravel開啟opcache提升載入速度
2021-06-09
Laravelopcache
強強聯手！福特與MIT開啟自動駕駛特殊研究
2018-03-15
MIT自動駕駛
自研分散式高效能RPC框架及服務註冊中心ApiRegistry實踐筆記【原創】【開源】
2022-12-15
分散式RPC框架API筆記
速度超快！位元組跳動開源序列推理引擎LightSeq
2020-12-18
網站開啟速度慢應該怎麼提升載入速度？
2021-11-09
網站
如何提升網站速度
2018-12-27
網站
Dewdrop：開源事件源框架
2022-07-21
事件框架
數值計算：前向和反向自動微分(Python實現)
2022-12-28
Python
EDP .Net開發框架--自動化日誌
2024-05-21
框架
淺談自動化測試框架開發
2021-07-29
框架
Game AI SDK 開源釋出：基於影像的遊戲場景自動化框架
2020-09-14
GAMAI遊戲框架
Kornia開源可微分計算機視覺庫，基於Pytorch
2020-11-14
計算機視覺PyTorch
DeepMind丟掉了歸一化，讓影像識別訓練速度提升了8.7倍 | 已開源
2021-02-18
.NET 開源高效能 MQTT 類庫
2024-09-27
MQQT
測試開發之自動化篇-自動化測試框架設計
2021-10-28
框架
[原始碼解析]深度學習利器之自動微分(3) --- 示例解讀
2021-10-16
原始碼深度學習
重磅丨科技教育公司“好未來”正式對外開源高效能PHP框架Fend
2020-08-14
PHP框架
6 個開源的家庭自動化工具
2018-03-05
微軟開源 Python 自動化神器 Playwright
2020-12-28
微軟Python
Game AI SDK開源版本釋出：基於影像的遊戲場景自動化框架
2020-09-14
GAMAI遊戲框架
phpGrace開源PHP框架
2021-04-12
PHP框架
Java動態編譯優化——提升編譯速度（N倍）
2018-12-06
Java編譯優化
全自動化的抖音啟動速度測試
2020-02-12

MIT開源高效能自動微分框架Enzyme：速度提升4.5倍

相關文章