你不應該忽略的五個機器學習專案

dicksonjyl560101發表於2019-07-18

原文網址 : http://blog.itpub.net/29829936/viewspace-2650916/

https://www.toutiao.com/a6714177288671330829/

摘要：本文介紹5個新的機器學習專案，這些專案你可能還沒有聽說過，但確實對專案開發有所幫助，感興趣的讀者可以動手實踐一下。

隨著人工智慧和深度學習的興起，網路上存在的學習資源以及開源專案也越來越多。本文精選了的五個專案，都含有潛在新的機器學習想法，且全都是用Python實現。下面簡單介紹

下這五個專案，感興趣的可以自己上手復現一下，說不定會對自己的專案產生一些新的想法。

1.實時損失曲線圖（Live Loss Plot）

___你不應該忽略的五個機器學習專案

在訓練模型的時候最好不要只關注最終的結果，耐心觀察整個訓練過程，檢視每個epoch的訓練結果，弄清楚模型的訓練曲線是否正常，是否出現過擬合等現象。

PiotrMigdał等人開發了一個Python原始碼包，可以為Keras，PyTorch和其他框架提供實時訓練損失的曲線。

當使用的是Keras深度學習框架時，實時損失曲線圖可以簡單地通過以下回撥函式呼叫：

___你不應該忽略的五個機器學習專案

2.Parfit

該專案由Jason Carpenter開發，他是舊金山大學資料科學專業的碩士，目前是Manifold的機器學習實習生。

該專案是用於並行化Sklearn機器學習模型的擬合和靈活評分的資料包，具有視覺化的功能。一旦匯入該資料包，就可以自由使用bestFit()或其他功能。

___你不應該忽略的五個機器學習專案

程式碼示例：

___你不應該忽略的五個機器學習專案

3.Yellowbrick

Yellowbrick是一款促進機器學習模型選擇的視覺分析和診斷工具。具體來說，Yellowbrick是一套名為“展示臺（Visualizers）”的視覺診斷工具，它擴充套件了scikit-learn API，以便人為地指導模型選擇過程。簡而言之，Yellowbrick將scikit-learn與matplotlib結合在一起，且具有模型生成視覺化的效果。

4.textgenrnn

textgenrnn為文字生成任務帶來了一個額外的抽象層，目的是用幾行程式碼就可以輕鬆地在任何文字資料集上訓練任意大小和複雜的文字生成神經網路。

該專案建在Keras深度學習框架之上，擁有以下選擇功能：

1、一種現代神經網路架構，利用新技術作為注意力加權和跳躍嵌入來加速培訓並* 提高模型質量；

2、能夠在字元級或字級上訓練並生成文字；

3、能夠配置RNN大小，RNN層數量以及是否使用雙向RNN；

4、能夠訓練任何通用輸入文字檔案，包括比較大的檔案；

5、能夠在GPU上訓練模型，然後可以用CPU生成文字；

6、能夠在GPU上訓練時利用強大的CuDNN實現RNN，與典型的LSTM實現相比，大大加快了訓練時間；

Textgenrnn非常容易啟動和執行，程式碼如下：

___你不應該忽略的五個機器學習專案

___你不應該忽略的五個機器學習專案

可以在Github上找到更多資訊和示例。

5.Magnitude

Magnitude是一個快速、簡單的向量嵌入實用程式庫。它也是一種功能豐富的Python軟體包和向量儲存檔案格式。通過Plasticity以快速、高效的方式開發機器學習模型。它主要是為Gensim提供一個更簡單、更快捷的替代方案，但也可以用作NLP之外域的通用關鍵向量儲存。

該專案提供了各種流行的嵌入模型的連結，這些嵌入模型已經以.magnitude格式準備好以供使用，還包括將任何其他文字嵌入檔案轉換為相同格式的說明。

使用以下程式碼可以將其匯入：

___你不應該忽略的五個機器學習專案

此外，Github上有更多的資訊，包括熟悉的用於使用預先訓練的簡化庫的起步和執行的所有資訊。

以上是五個器學習或機器學習相關的專案簡介，你可能還沒有聽說過，但可能要考慮要動手實踐一下，部分專案可能會對你此時的專案有所幫助。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/29829936/viewspace-2650916/，如需轉載，請註明出處，否則將追究法律責任。

相關文章

關於機器學習，你應該知道的3個熱門專業術語
2018-10-15
機器學習
你不應該忽略《雙人成行》真正的閃光點
2021-04-25
機器學習專案失敗的9個原因，你中招了嗎？
2018-08-08
機器學習
【機器學習】超詳細！上線一個機器學習專案你需要哪些準備？
2018-04-26
機器學習
機器學習者都應該知道的五種損失函式！
2018-06-19
機器學習函式
10個豐富自我的機器學習專案
2020-11-16
機器學習
五個常用的機器學習python庫!
2021-06-21
機器學習Python
在機器學習專案中該如何選擇最佳化器
2020-08-21
機器學習
做機器學習專案的checklist
2020-01-21
機器學習
你的專案應該如何分層？
2019-03-11
2022年你應該掌握這些機器學習演算法
2021-12-10
機器學習演算法
機器學習入門系列(2)--如何構建一個完整的機器學習專案(一)
2019-01-26
機器學習
開源一個機器學習文字分析專案
2018-06-01
機器學習
2018年最實用的6個機器學習專案
2019-01-05
機器學習
10 個你應該知道的 PHP 比特幣開源專案
2018-09-25
PHP比特幣
8 個你應該瞭解的環保開源專案
2019-05-04
學習Mysql 你應該懂得
2024-05-04
MySql
實戰 | 如何上線一個機器學習專案？
2018-05-08
機器學習
一個完整的機器學習專案在Python中演練（四）
2018-10-11
機器學習Python
一個完整的機器學習專案在Python中演練（三）
2018-06-04
機器學習Python
[譯] 機器學習專案清單
2019-02-18
機器學習
ETL專業人員應該學習Hadoop的5個理由
2022-01-09
Hadoop
如何建立複雜的機器學習專案？
2019-02-10
機器學習
機器學習專案經歷的若干感想
2021-07-05
機器學習
你的專案應該如何正確分層？
2019-03-03
經驗&教訓分享：我的第一個機器學習專案
2020-01-06
機器學習
舉兩個栗子：如何正確建立個人的機器學習專案集
2018-12-13
機器學習
大學學計算機應該選哪個專業呢？
2021-02-18
計算機
應該不會誤人子弟的Java虛擬機器個人理解
2020-10-27
Java虛擬機
一個完整的機器學習專案在Python中的演練（三）
2018-10-11
機器學習Python
一個完整的機器學習專案在Python中的演練（二）
2018-10-11
機器學習Python
一個完整的機器學習專案在Python中的演練（一）
2018-10-11
機器學習Python
C# 中 10 個你真的應該學習（和使用！）的功能
2019-11-04
C#
我們該如何學習機器學習中的數學
2018-08-04
機器學習
2020年度最佳的23個的機器學習專案（附原始碼）
2020-08-13
機器學習原始碼
機器學習專案是如何開發和部署的？
2020-05-28
機器學習
五個給機器學習和資料科學入門者的學習建議
2019-09-16
機器學習資料科學
機器學習專案中不可忽視的一個密辛 - 大數定理
2018-09-02
機器學習