機器學習的未來——深度特徵融合

【方向】發表於2018-03-07

即使是最敏銳的技術佈道師也無法預測大資料對數字革命的影響。因為他們最初的關注點都聚焦在了擴大基礎設施以構建現有服務上。
在提高對現有資料的處理能力時,許多的新技術被提出。關於機器學習的概念最早誕生於科幻小說中,它的新功能很快被人們發現並應用,但隨之而來的是無法避免的侷限性。

機器學習的侷限性

當資料被恰當地概念化時,複雜的AI演算法可以做出最細緻巧妙的洞察。一個能夠訪問正確資料的演算法看上去是無所不知的。但事實上,在真實環境中的輸出並不總能輕鬆為這些演算法依賴的資料型別所處理。
機器學習的核心是資料。遺憾的是,一些定性資料並不容易被轉換成可用格式。相比於被寄希望取代人類的AI演算法,能夠理解不易分解的變數間的細微差別是我們自身的優勢。而為我們所稱讚的人工智慧尚未掌握這一概念。
驅動人工智慧的二進位制語言自最初設想以來已有半個多世紀沒有發生變化,並且在未來也不可能很快發生改變。這意味著所有機器學習都必須以數字輸入為中心。
AI如何掌握聲學、光波和其他現實應用中的細微差異呢?有關這些系統的資訊必須經過處理並轉換為二進位制語言。這不是不可能的,但有幾件事情必須完成:
  • 系統工程師必須開發出精確的系統來測量這些輸入。這對於某些應用來說可能非常困難。通過分辨顏色的微小差異,人類可以輕鬆觀察到光波之間的差異。但對於AI來說,通過光學感測器以足夠的精度發現差異並傳達是一件非常困難的任務。
  • 這些輸入必須被分解並翻譯為二進位制程式碼。
  • 必須對AI進行程式設計以瞭解並響應這些輸入。

123FormBuilder的創始人指出,當資料科學家需要模擬人類行為時,這可能極具挑戰性。同時,這是監控線上參與的關鍵。


“量化人類行為非常複雜,尤其是因為不同的人口統計資料反應不同。由於原始的機器學習演算法的缺陷,處理來自熱力圖和其他報告的輸入是一項具有挑戰性的任務。“

機器學習必須在此之前得到發展。深度特徵融合是一項可以克服這些障礙新技術,它為新的機器學習開啟了複習的大門。

深度特徵融合將會用一種令人著迷的方式發展機器學習

深度特徵融合是一種新的解決方案,可以處理複雜的資料並將其分解為數字元件。2014年,兩位麻省理工學院的工程師開發了深度特徵融合。然而直到最近,這項技術還處於起步階段,資料科學家才開始研究其在機器學習中的應用。

Donnelly表示,機器學習演算法必須克服的最大技術障礙是依賴於處理資料才能工作。他們只能根據資料做出預測,而這些資料由相關變數組成,稱為”特徵“。如果計算的特徵不能清晰地顯示預測的訊號,那麼偏置就不會將模型帶到下一個層次。提取這些數字特徵的過程稱為“特徵工程”。

深度特徵合成的關鍵優勢:

  • 單個資料集中資料點之間的關係可以推斷出重要的特徵
  • 資料可以很容易地在不同的資料集之間合成
  • 識別不同個體之間的關係可以幫助獲得新特徵

數十款阿里雲產品限時折扣中,趕緊點選領劵開始雲上實踐吧!

以上為全部譯文

作者資訊:

Ryan Kh, Octocs科技執行長

本文由北郵@愛可可-愛生活老師推薦,阿里云云棲社群組織翻譯。

文章原標題Deep Feature Synthesis Is the Future of Machine Learning,譯者:Anchor C.,審閱:虎說八道。

文章為簡譯,更多內容請檢視原文


相關文章