深度學習,如何用去噪自編碼器預測原始資料?
去噪自編碼器(denoising autoencoder, DAE)是一類接受損壞資料作為輸入,並訓練來預測原始未被損壞資料作為輸出的自編碼器。
去噪自編碼器代價函式的計算圖。去噪自編碼器被訓練為從損壞的版本~x 重構乾淨資料點x。這可以通過最小化損失L = -log pdecoder(x|h = f(~x)) 實現,其中~x 是樣本x 經過損壞過程C(~x| x) 後得到的損壞版本。
得分匹配是最大似然的代替。它提供了概率分佈的一致估計,促使模型在各個資料點x 上獲得與資料分佈相同的得分(score)。
對一類採用高斯噪聲和均方誤差作為重構誤差的特定去噪自編碼器(具有sig-moid 隱藏單元和線性重構單元)的去噪訓練過程,與訓練一類特定的被稱為RBM 的無向概率模型是等價的。
將訓練樣本x 表示為位於低維流形(粗黑線)附近的紅叉。我們用灰色圓圈表示等概率的損壞過程C(~x|x)。灰色箭頭演示瞭如何將一個訓練樣本轉換為經過此損壞過程的樣本。
由去噪自編碼器圍繞1 維彎曲流形學習的向量場,其中資料集中在2 維空間中。每個箭頭與重構向量減去自編碼器的輸入向量後的向量成比例,並且根據隱式估計的概率分佈指向較高的概率。向量場在估計的密度函式的最大值處(在資料流形上)和密度函式的最小值處都為零。例如,螺旋臂形成區域性最大值彼此連線的1維流形。區域性最小值出現在兩個臂間隙的中間附近。當重構誤差的範數(由箭頭的長度示出)很大時,在箭頭的方向上移動可以顯著增加概率,並且在低概率的地方大多也是如此。自編碼器將這些低概率點對映到較高的概率重構。在概率最大的情況下,重構變得更準確,因此箭頭會收縮。
目前僅限於去噪自編碼器如何學習表示一個概率分佈。更一般的,我們可能希望使用自編碼器作為生成模型,並從其分佈中進行取樣。
去噪自編碼器代價函式的計算圖。去噪自編碼器被訓練為從損壞的版本~x 重構乾淨資料點x。這可以通過最小化損失L = -log pdecoder(x|h = f(~x)) 實現,其中~x 是樣本x 經過損壞過程C(~x| x) 後得到的損壞版本。
得分匹配是最大似然的代替。它提供了概率分佈的一致估計,促使模型在各個資料點x 上獲得與資料分佈相同的得分(score)。
對一類採用高斯噪聲和均方誤差作為重構誤差的特定去噪自編碼器(具有sig-moid 隱藏單元和線性重構單元)的去噪訓練過程,與訓練一類特定的被稱為RBM 的無向概率模型是等價的。
將訓練樣本x 表示為位於低維流形(粗黑線)附近的紅叉。我們用灰色圓圈表示等概率的損壞過程C(~x|x)。灰色箭頭演示瞭如何將一個訓練樣本轉換為經過此損壞過程的樣本。
由去噪自編碼器圍繞1 維彎曲流形學習的向量場,其中資料集中在2 維空間中。每個箭頭與重構向量減去自編碼器的輸入向量後的向量成比例,並且根據隱式估計的概率分佈指向較高的概率。向量場在估計的密度函式的最大值處(在資料流形上)和密度函式的最小值處都為零。例如,螺旋臂形成區域性最大值彼此連線的1維流形。區域性最小值出現在兩個臂間隙的中間附近。當重構誤差的範數(由箭頭的長度示出)很大時,在箭頭的方向上移動可以顯著增加概率,並且在低概率的地方大多也是如此。自編碼器將這些低概率點對映到較高的概率重構。在概率最大的情況下,重構變得更準確,因此箭頭會收縮。
目前僅限於去噪自編碼器如何學習表示一個概率分佈。更一般的,我們可能希望使用自編碼器作為生成模型,並從其分佈中進行取樣。
相關文章
- 用深度卷積自編碼器在10分鐘內降低影像噪聲卷積
- 聲網深度學習時序編碼器的資源預測實踐丨Dev for Dev 專欄深度學習dev
- 深度學習--資料預處理深度學習
- 【資料處理】使用深度學習預測未來銷量深度學習
- 深度學習——資料預處理篇深度學習
- 理解深度學習:神經網路的雙胞胎兄弟-自編碼器(上)深度學習神經網路
- 深度學習(一)深度學習學習資料深度學習
- Spring原始碼學習之:ClassLoader學習(5)-自測Spring原始碼
- 如何用LSTM自編碼器進行極端事件預測?(含Python程式碼)事件Python
- 為了預測股票,我用TensorFlow深度學習了股市資料深度學習
- 厲害了,我用“深度學習”寫了個老闆探測器(附原始碼)深度學習原始碼
- 從統計學角度來看深度學習(2):自動編碼器和自由能深度學習
- 【編測編學】如何做好大資料測試大資料
- 深度學習中的資料預處理方法深度學習
- 預測電影偏好?如何利用自編碼器實現協同過濾方法
- 深度學習資料深度學習
- DeepETA:優步如何使用深度學習預測到達時間?深度學習
- 利用深度學習和機器學習預測股票市場(附程式碼)深度學習機器學習
- 如何學習 PHP 原始碼 – 從編譯開始PHP原始碼編譯
- 深度學習煉丹-資料預處理和增強深度學習
- 深度學習讀書筆記之AE(自動編碼AutoEncoder)深度學習筆記
- 感測器噪聲
- [原始碼解析]深度學習利器之自動微分(3) --- 示例解讀原始碼深度學習
- 深度學習資料集深度學習
- 深度學習論文和開原始碼深度學習原始碼
- 深度學習03-sklearn.LinearRegression 原始碼學習深度學習原始碼
- 除了檢查語法,用上深度學習的編輯器也能自動優化程式碼深度學習優化
- Netty 框架學習 —— 預置的 ChannelHandler 和編解碼器Netty框架
- 資料的採集,清洗,資料機器自動標註及轉化為深度學習格式深度學習
- 深度學習研究的新變化:教計算機如何編碼深度學習計算機
- 用深度學習自動生成HTML程式碼深度學習HTML
- 《Python機器學習手冊:從資料預處理到深度學習》Python機器學習深度學習
- 深度學習預測蛋白質-蛋白質相互作用深度學習
- 基於自編碼器的表徵學習:如何攻克半監督和無監督學習?
- 如何用深度學習處理結構化資料?深度學習
- 手把手:教你如何用深度學習模型預測加密貨幣價格深度學習模型加密
- 拯救深度學習:標註資料不足下的深度學習方法深度學習
- Netty原始碼深度解析(九)-編碼Netty原始碼