機器學習到底是什麼?
http://blog.itpub.net/31137683/viewspace-2168747/
關於機器學習最簡單的定義來自於Berkeley所表述的:機器學習是AI的一個分支,它探索了讓計算機根據經驗提高效率的方法。
為了更深刻的理解這一定義,接下來我們將對其進行拆分分析。
AI的分支:人工智慧是一種能夠使得計算機及其系統能夠成功完成通常需要人類智慧行為才能完成的任務的研究和開發。機器學習是訓練計算機完成上述任務的技術和過程,是其必不可少的一部分。
探索方法:現階段機器學習技術仍在不停地湧現,雖然一些用於訓練計算機的模型已經被識別和使用,但由於不同的業務問題需要不同的模型,在訓練計算機時也可以使用不同的模型,隨著時間的推移將會開發出更多模型。
幫助計算機以提高其效能:大多數情況下,要讓計算機完成人工智慧的任務,它需要藉助於人工幫助去練習和適應。
以經驗為基礎:提供具有經驗的AI的另一種說法—為其提供資料。隨著更多資料被輸入系統,計算機可以更準確地對它以及將遇到的未來資料做出響應。
機器學習如何運作?
讓我們來看看機器學習是如何運作的:
收集:機器學習取決於資料,第一步是確保按照你要解決的問題的要求擁有適合的資料。
清理:資料可以由不同的源生成,包含在不同的檔案格式中,並以不同的語言表示。可能需要在資料集中新增或刪除資訊,因為某些例項可能缺少資訊,而其他例項可能包含不需要的或無關的條目。它的準備工作將影響其可用性和結果的可靠性。
拆分:根據資料集的大小,可能只需要一部分。從所選樣本中,應將資料分為兩組:一組用於訓練演算法,另一組用於評估演算法。
訓練:這個階段主要是為了找到準確完成所選目標的函式。根據所使用的模型型別,採用不同的訓練形式:如,在簡單的線性迴歸模型中擬合一條線、生成隨機森林演算法的決策樹。為了更好地理解我們拿神經網路來說,一般演算法碰到資料集的一部分時,將會嘗試處理資料。測量其自身的效能並自動調整其引數(也稱為反向傳播),直到它能不斷產生期望的結果具有足夠的可靠性。直到它能不斷產生期望的結果,並具有足夠的可靠性。
評估:一旦演算法在訓練資料上表現良好,它將再次使用沒有見過的資料進行測量。此過程允許你防止過度擬合,但這種情況僅發生在學習演算法執行良好同時又與你的訓練資料相關的情況下。
最佳化:該模型針對目標應用程式內的整合進行了最佳化,以確保其效率。
是否有不同型別的機器學習?
在機器學習中可以使用許多不同的模型,但它們通常被分為三種不同的學習型別:監督、無監督和強化。根據要完成的任務,有些模型比其他模型更合適、效能更好。
監督學習:其特點是在訓練模型時明確標記每個資料點的正確結果,以便找它們之間的關係,確保在引入未分配的資料點時,可以正確的做出預測或分類。
如在對股票價格的研究中,分析資料點之間的關係,可以用迴歸學習演算法對下個資料點做出預測。
無監督學習:該類學習的特徵是演算法在訓練模型時期不對結果進行標記,而直接在資料點之間找有意義的關係,它的價值在於發現模式以及相關性。如,一個喜歡這瓶酒的人也喜歡這一個。
強化學習:這種型別的學習是有監督學習和無監督學習的結合。它通常用於解決更復雜的問題。在實踐中,該類學習型別可應用於控制機器人手臂、找到最有效的電機組合、機器人導航等領域。同時邏輯遊戲也很適合強化學習如撲克等。強化學習的其他應用在物流、日程安排和任務的戰略規劃中也很常見。
機器學習可以應用到哪裡?
企業需要考慮機器學習開發的三個階段及其應用。這三個階段是指:描述性階段,預測性階段和規範性階段。
描述性階段是指記錄和分析歷史資料增強商業智慧。向管理者提供描述性資訊,並更好地理解過去行動和決策的結果和後果。這個過程現在已成為全球大多數大型企業的常規工作。
應用機器學習的第二階段是預測。收集資料並使用它來預測特定結果可以提高反應性,使其更高效地做出決策。
最後一個規範性階段是最先進的機器學習階段,該階段已被應用與企業活動中,並且在新興企業的推動下不斷向前發展。在針對有效和高效的業務實踐時瞭解原因、動機和背景是最佳決策的先決條件,而只預測行為或結果是不夠的。具體地說,當人和機器結合起來時,這個階段是可能的。機器學習用於找到有意義的關係並預測結果,而資料專家則充當翻譯者,以瞭解關係存在的原因。這樣,就可以更精確地作出決策。
此外,除了預測性洞察之外,感興趣的朋友還可以瞭解一下另一個機器學習應用程式:流程自動化。這裡是關於這兩個概念的介紹和對比。
以下是機器學習可以解決的問題的一些示例。
物流和生產:
-
Rethink Robotics使用機器學習來訓練機器人手臂並提高生產速度;
-
Jaybridge Robotics可實現工業級車輛自動化,以實現更高效的運營;
-
 Nanotronics自動化光學顯微鏡以改進檢查;
-
Netflix和Amazon根據使用者需求最佳化資源分配;
-
其他例子包括:預測ERP/ERM需要;預測資產故障和維護,提高質量保證,提高生產線效能。
銷售和營銷:
-
6sense預測哪種鉛更容易被買,哪個時間更容易被買入;
-
Salesforce Einstein幫助預測銷售機會並自動完成任務;
-
 Fusemachines透過AI助手自動完成銷售任務;
-
AirPR提供了提高公關績效的洞察力;
-
Retention Science建議跨渠道行動以推動參與;
-
其他示例包括:預測客戶的生命週期價值,提高客戶細分準確度,檢測客戶購物模式以及最佳化使用者的應用內體驗。
人力資源:
-
Entelo幫助招聘人員識別和鑑定候選人;
-
hiQ協助管理人員進行人才管理。
金融:
-
Cerebellum Capital和Sentient利用機器學習驅動的軟體增強投資管理決策;
-
Dataminr可以透過提供有關社交趨勢和突發新聞的早期警報來協助實時財務決策;
-
其他例子包括:檢測欺詐行為和預測股票價格。
衛生保健:
-
Atomwise使用預測模型來減少藥物生產時間;
-
Deep6 Analytics確定符合條件的患者進行臨床試驗;
-
其他例子包括:更準確地診斷疾病,改善個性化護理和評估健康風險。
你可以在Sam DeBrule彙集的精彩列表中找到更多機器學習和人工智慧以及其他相關資源的示例。
本文由北郵@愛可可-愛生活 老師推薦,阿里云云棲社群組織翻譯。
文章原標題《Understanding Machine Learning》
作者:Charles A.R
譯者:烏拉烏拉,審校:袁虎。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2199186/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 機器學習中的正則化到底是什麼意思?機器學習
- ? babel到底是什麼❓Babel
- 資料科學、機器學習、人工智慧的區別到底是什麼?資料科學機器學習人工智慧
- 機器學習到底是什麼?一篇文章帶你瞭解透徹機器學習
- 理解DOM到底是什麼
- Java到底是什麼呢Java
- 什麼是機器學習機器學習
- Spring Aware 到底是什麼?Spring
- 件斷點到底是什麼?斷點
- 區塊鏈到底是什麼區塊鏈
- Spring IoC 到底是什麼Spring
- 閉包函式到底是什麼?有什麼用?函式
- 何謂機器學習 機器學習能做些什麼?機器學習
- Java到底是什麼?學習java可以做什麼呢?Java
- Python到底是什麼?為什麼要學Python?Python
- 區塊鏈EOS到底是什麼?區塊鏈
- RDD到底是什麼?RDD的APIAPI
- 大資料到底是什麼鬼大資料
- Android Context 到底是什麼?AndroidContext
- 企業架構到底是什麼?架構
- 什麼是機器學習治理?機器學習
- 機器學習不能做什麼?機器學習
- 為什麼range不是迭代器?range到底是什麼型別?型別
- 【一探究竟】Flutter到底是什麼?Flutter
- __name__ == '__main__' 到底是什麼意思AI
- Spark RPC 到底是個什麼鬼?SparkRPC
- 事件迴圈Event loop到底是什麼事件OOP
- Android:JNI 與 NDK到底是什麼?Android
- JS中裝飾器到底是什麼?JS
- SQLSERVER 阻塞之 PFS 頁到底是什麼?SQLServer
- 自動化框架到底是什麼?框架
- 阿里雲到底是幹什麼的阿里
- JS 的 new 到底是幹什麼的?JS
- 機器學習--要學點什麼機器學習
- 漫畫:什麼是機器學習機器學習
- 國外遊戲文案到底是幹什麼的?遊戲
- SRE工程師到底是做什麼的?工程師
- 【入門必看】比特幣到底是什麼?比特幣