本文翻譯自Medium上的一篇文章: The 6 most useful Machine Learning projects of the past year (2018),原文地址:towardsdatascience.com/the-10-most…
對於人工智慧和機器學習而言,過去的一年是非常重要的一年。許多最新的具有很大影響力的機器學習應用開發出來並得到應用,特別是在醫療保健、金融、語音識別、擴增實境,以及更復雜的3D和視訊等領域。
我們已經看到了更多的應用驅動型研究,而不是理論研究。雖然這可能有其缺點,但它暫時產生了一些巨大的積極影響,推動了可以迅速轉化為商業和客戶價值的新研發。這一趨勢很大程度反映在大部分開源機器學習專案中。
讓我們來看看過去一年中前6個最實用的機器學習專案。這些專案釋出了程式碼和資料集,允許個體開發人員和小型團隊學習並立即創造價值。它們可能不是理論上最具開創性的作品,但它們適用且實用。
Fast.ai
Fast.ai庫使用現代最佳實踐,簡化了訓練快速且準確的神經網路的程式碼編寫。它抽象出了在實踐中實施深度神經網路可能涉及的所有細節工作。它非常易於使用,並且按從業者的應用程式構建思維模式進行設計。最初它是為Fast.ai課程的學生而建立的,該庫以簡潔易懂的方式編寫在易於使用的Pytorch庫之上。他們的文件也是一流的。
Detectron
Detectron是Facebook AI進行物體檢測和例項分割研究的研究平臺,用Caffe2編寫。它包含各種物件檢測演算法的實現,包括:
- Mask R-CNN: 使用Faster R-CNN結構的物件檢測和例項分割
- RetinaNet: 基於特徵金字塔的網路,採用獨特的Focus Loss,可處理很複雜的場景。
- Faster R-CNN: 物件檢測網路最常見的結構
所有網路都可以使用以下幾種可選的分類網路之一:
- ResNeXt{50,101,152}
- ResNet{50,101,152}
- Feature Pyramid Networks (with ResNet/ResNeXt)
- VGG16
更重要的是,它們都帶有COCO資料集上的預訓練模型,因此您可以立即使用它們!他們已經在Detectron model zoo中使用標準評估指標進行了測試。
FastText
另一項來自Facebook的研究,fastText庫專為文字表示和分類而設計。它配備了預先訓練的150多種語言的單詞向量模型。這些單詞向量可用於許多工,包括文字分類、摘要和翻譯。
AutoKeras
Auto-Keras是一個用於自動機器學習(AutoML)的開源軟體庫。 它由Texas A&M大學的DATA實驗室和社群貢獻者開發。AutoML的最終目標是為具有有限資料科學或機器學習背景的領域專家提供易於訪問的深度學習工具。Auto-Keras提供自動搜尋深度學習模型的最佳架構和超引數的功能。
Dopamine
Dopamine是由Google建立的強化學習演算法快速原型設計的研究框架。它旨在靈活且易於使用,實現了標準RL演算法、指標和基準。
根據Dopamine的文件,他們的設計原則是:
- 易於試驗:幫助新使用者執行基準實驗
- 靈活的開發:為新使用者提供新的創新想法
- 緊湊和可靠:為一些較舊和更流行的演算法提供實現
- 可重複:確保結果可重複
vid2vid
vid2vid專案是Nvidia最先進的視訊到視訊合成演算法的公開Pytorch實現。視訊到視訊合成的目標是學習從輸入源視訊(例如,一系列語義分割掩模)到精確描繪源視訊內容的擬真視訊輸出的對映函式。
這個庫的好處在於它的可選項:它提供了幾種不同的vid2vid應用程式,包括自動駕駛/城市場景、人臉和人體姿勢。它還附帶了豐富的指令和功能,包括資料集載入、任務評估、訓練功能和多GPU!
其它值得關注的專案
- ChatterBot:用於對話引擎和建立聊天機器人的機器學習
- Kubeflow:Kubernetes的機器學習工具包
- imgaug:用於深度學習的影象增強
- imbalanced-learn:scikit下的python包專門用於修復不平衡資料集
- mlflow:用於管理ML生命週期的開源平臺,包括實驗,可重複性和部署。
- AirSim:基於虛幻引擎/ Unity的自動駕駛汽車模擬器,來自Microsoft AI & Research