機器學習工具總覽

dicksonjyl560101發表於2019-05-21


https://www.toutiao.com/a6692693205818802696/


機器學習工具總覽

豐富的機器學習工具

當談到訓練計算機在沒有明確程式設計的情況下采取行動時,存在大量來自機器學習領域的工具。學術界和行業專業人士使用這些工具在MRI掃描中構建從語音識別到癌症檢測的多種應用。這些工具可在網上免費獲得。如果您感興趣,我已經編制了這些的排名(請參閱本頁底部)以及一些區分它們的重要功能的概述。其中,從主頁網站獲取每種工具的描述,關注機器學習中的特定範例以及學術界和工業界的一些顯著用途。

研究人員可以一次使用許多不同的庫,編寫自己的庫,或者不引用任何特定的工具,因此很難量化每種庫的相對採用。相反,搜尋排名反映了5月份谷歌搜尋每個工具的相對大小。該分數並不反映廣泛採用,但為我們提供了一個很好的指示,表明正在使用哪些。注意*像“Caffe”這樣的模糊名稱被評為“Caffe機器學習”,不那麼含糊。

機器學習工具總覽

機器學習工具總覽

我已經將兩個機器學習子領域Deep和Shallow Learning區分開來,這已成為過去幾年中的一個重要分支。深度學習負責影像分類和語音識別的記錄結果,因此由Google,Facebook和百度等大型資料公司牽頭。相反,淺層學習方法包括各種不太前沿的分類,聚類和提升技術,如支援向量機。淺層學習方法仍然廣泛應用於自然語言處理,腦計算機介面和資訊檢索等領域。

機器學習包和庫的詳細比較

此表還包含有關使用GPU的特定工具支援的資訊。 GPU介面已經成為機器學習工具的一個重要特性,因為它可以加速大規模矩陣運算。這對深度學習方法的重要性是顯而易見的。例如,在2015年5月初的GPU技術大會上,機器學習下的45個演講中有39個是關於GPU加速的深度學習應用程式,這些應用程式來自31家主要的科技公司和8所大學。這一吸引力反映了Deep Networks對GPU輔助培訓的巨大速度提升,因此是一項重要功能。

還提供了有關通過Hadoop或Spark在叢集中分配計算的工具能力的資訊。這已成為適合分散式計算的淺學習技術的重要論述點。同樣,Deep Networks的分散式計算也成為一個討論點,因為已經為分散式訓練演算法開發了新技術。

最後,附上一些關於學術界和工業界對這些工具的不同使用的補充說明。通過搜尋機器學習出版物,簡報和分散式程式碼收集了哪些資訊。 Google,Facebook和甲骨文的研究人員也支援了一些資訊,非常感謝Greg Mori,Adam Pocock和Ronan Collobert。

這項研究的結果表明,目前有許多工具正在使用,目前還不確定哪種工具能夠贏得獅子會在工業界或學術界的使用份額。

機器學習工具總覽

機器學習工具總覽

機器學習工具總覽

機器學習工具總覽

幫助我們建立神經系統處理器的橋樑

Knowm Inc專注於開發像kT-RAM這樣的神經系統處理器。 像傑弗裡·辛頓這樣的機器學習先驅者非常清楚,機器學習從根本上與計算能力有關。 我們稱之為自適應電源問題,為了解決這個問題,我們需要新的工具來引領下一波智慧機器。 雖然GPU(最終!)使我們能夠展示在某些任務上接近人類水平的學習演算法,但它們的能量和空間效率仍比生物學低100億到10億倍。 我們正把這個差距縮小到零。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2645015/,如需轉載,請註明出處,否則將追究法律責任。

相關文章