網易易盾AI工程師出席ICME 2019 展示int8量化新演算法

網易易盾發表於2019-07-17
上週,全球計算機多媒體頂級會議ICME 2019(國際多媒體與博覽會議)在上海圓滿結束,網易易盾深度學習資深研發工程師姚益武受邀出席會議,展示了網易易盾在深度卷積神經網路int8量化演算法上的最新研究成果。
網易易盾AI工程師出席ICME 2019 展示int8量化新演算法
ICME簽到處

ICME由 IEEE 下設的計算機學會、電路與系統學會、通訊學會、訊號處理學會聯合舉辦,始於 2000 年,至今已經連續舉辦了 19 屆,是計算機多媒體領域最重要的國際會議之一。ICME是學術界交流多媒體領域最近研究成果的旗艦論壇,也是工業界展示最新產品或系統的平臺,涵蓋文字分析、圖形影像、影片、語音音訊等多媒體資料的處理、傳輸、分析與應用等主題。


在本次會議上,網易易盾深度學習資深研發工程師姚益武發表了題為《Efficient Implementation of Convolutional Neural Networks with End to End Integer Only Dataflow》的學術論文,展示了有助於構建端到端的純整數運算通路的int8量化新演算法。


姚益武表示,Int8量化由於精度損失低,能夠實現4倍壓縮比,且相容於現有的整數運算單元,在產業界已經獲得廣泛應用,包括TensorFlow-Lite與TensorRT涉及的int8量化演算法。


他指出,TensorFlow-Lite中的in8量化屬於線性量化方法,但是為了執行量化卷積或矩陣乘法運算,需要提供額外的浮點乘因子,因而所構建的量化網路並非純整數運算通路,並且該量化演算法需要藉助重訓練以恢復精度損失。


“TensorRT中的線性int8量化方法,能夠在NVIDIA平臺上提供高吞吐、低延遲的推理效能,深度網路的權重按非閾值方式對映到int8區間,啟用輸出則按照閾值方式完成int8量化,每一層的實現方式相對簡單。然而當前層的整數結果需要還原回浮點實數,方能傳遞至下一層,因此也不能構建端到端的純整數運算通路。”


姚益武在ICME 2019上提出的int8量化新演算法有助於構建端到端的純整數運算通路,且統一表示層的設計簡化了網路結構的拓撲設計,因此非常適合在現有硬體平臺上實現,包括CPU/GPU/FPGA等通用計算平臺。另外,所提出的int8量化演算法,在複雜分類網路與目標檢測模型上獲得了與TensorRT相接近的推理精度,工業應用潛力比較大。


“應用於易盾內容安全影像識別上,在確保業務模型推理精度的前提下,其服務的響應時間能得到顯著降低。”姚益武進一步解釋了int8量化演算法在網易易盾業務上的應用潛力。


參會的第三方專家點評網易易盾這一研究成果時表示,該方法可以保持相對較高的準確性,有效解決TensorRT的問題。而另外個專家則更進一步指出,int8量化新演算法能夠簡化CNNs中的運算,並讓精度損失顯得微不足道。


據悉,姚益武為網易易盾實驗室成員,該實驗室在2018年還研發出了一種對多視角多模態特徵資訊進行有效融合的自編碼器神經網路,在準確率、NMI、Purity、ARI等各項效能指標上,較當下多項國際先進的多視角多模態資訊融合技術有顯著性的領先。


網易易盾實驗室成立於2016年,隸屬於網易安全部,目前擁有數十名AI演算法專家、安全研究員、政策法規研究專員等。實驗室目前專注探索人工智慧技術在安全領域的應用,以及安全相關法規、社會責任等研究。



相關文章