25種Java機器學習工具和庫

banq發表於2018-12-17

這是25種Java機器學習工具和庫的列表。
  1. Weka擁有一系列用於資料探勘任務的機器學習演算法。演算法可以直接應用於資料集,也可以從您自己的Java程式碼呼叫。Weka包含用於資料預處理,分類,迴歸,聚類,關聯規則和視覺化的工具。
  2. 大規模線上分析(MOA)是一種流行的資料流挖掘開源框架,具有非常活躍的增長社群。它包括一系列機器學習演算法(分類,迴歸,聚類,異常檢測,概念漂移檢測和推薦系統)和評估工具。與WEKA專案相關,MOA也是用Java編寫的,同時可以擴充套件到更苛刻的問題。
  3. MEKA專案提供的多標記學習和評價方法的開源實現。在多標籤分類中,我們希望為每個輸入例項預測多個輸出變數。這與僅涉及單個目標變數的“標準”情況不同。MEKA基於WEKA機器學習工具包。
  4. 先進的資料探勘和機器學習系統(ADAMS)是一種新型的,靈活的工作流引擎,旨在快速構建和維護現實世界的,複雜的知識的工作流程,以GPLv3釋出。
  5. 開發KDD的環境 - 索引結構支援的應用程式(ELKI)是一個用Java編寫的開源(AGPLv3)資料探勘軟體。ELKI的重點是演算法研究,重點是聚類分析和異常檢測中的無監督方法。
  6. Mallet是一個用於文字文件的java機器學習工具包。Mallet支援分類演算法,如最大熵,樸素貝葉斯和用於分類的決策樹。
  7. Encog是一種先進的機器學習框架,支援支援向量機,人工神經網路,遺傳程式設計,貝葉斯網路,隱馬爾可夫模型,遺傳程式設計和遺傳演算法。
  8. Datumbox機器學習框架是用Java編寫的開源框架,允許快速發展的機器學習和統計應用。該框架的主要重點是包括大量的機器學習演算法和統計測試,並能夠處理中大型資料集。
  9. Deeplearning4j是第一個為Java和Scala編寫的商業級,開源,分散式深度學習庫。它旨在用於商業環境,而不是作為研究工具。
  10. Mahout是一個內建演算法的機器學習框架。Mahout-Samsara幫助人們建立自己的數學,同時提供一些現成的演算法實現。
  11. Rapid Miner由德國多特蒙德技術大學開發。它提供了GUI和Java API,用於開發您自己的應用程式。它使用機器學習演算法提供資料處理,視覺化和建模。
  12. Apache SAMOA是一個機器學習(ML)框架,包含分散式流ML演算法的程式設計抽象,可以開發新的ML演算法,而無需直接處理底層分散式流處理引擎的複雜性(DSPEe,如Apache Storm,Apache S4,和Apache Samza)。它的使用者可以開發一次分散式流ML演算法並在多個DSPE上執行它們。
  13. Neuroph透過提供支援建立,訓練和儲存神經網路的Java神經網路庫和GUI工具,簡化了神經網路的開發。
  14. Oryx 2是基於Apache Spark和Apache Kafka構建的lambda體系結構的實現,但具有專門用於實時大規模機器學習的功能。它是用於構建應用程式的框架,還包括用於協同過濾,分類,迴歸和群集的打包的端到端應用程式。
  15. 史丹佛分類器是一種機器學習工具,它將獲取資料項並將它們放入k類之一。像這樣的機率分類器也可以給出資料項的類分配的機率分佈。該軟體是最大熵分類器的Java實現。
  16. Cortical.io是一種Retina API快速,精確且類似腦的演算法,可實現NLP。
  17. JSAT是一個快速入門機器學習問題的庫。它是在我的空閒時間開發的,並且可以在GPL 3下使用。圖書館的一部分用於自學,因此 - 所有程式碼都是自包含的。JSAT沒有外部依賴關係,而且是純Java。
  18. 用於Java的N維陣列 (ND4J)是用於JVM的科學計算庫。它們旨在用於生產環境,這意味著例程設計為以最低RAM要求快速執行。
  19. Java的機器學習庫 是一組機器學習演算法參考實現。這些演算法都在文件站點的原始碼中有詳細記錄。它主要用Java編寫。
  20. Java-ML 是一個Java API,其中包含一系列用Java實現的機器學習演算法。它僅為演算法提供標準介面。
  21. MLlib(Spark) 是Apache Spark的可擴充套件機器學習庫。雖然Java,庫和平臺支援Java,Scala和Python繫結。該庫是新的,演算法列表很長。
  22. H2O  是用於智慧應用程式的機器學習API。它可以擴充套件大資料的統計,機器學習和數學。H2O是可擴充套件的,個人可以使用核心中的簡單數學句法來構建塊。
  23. WalnutiQ 是一個物件導向的部分人腦模型,具有1個理論化的通用學習演算法(正朝著強烈的情感AI的簡單模型進行工作)
  24. RankLib是一個學習排名演算法的庫。目前已經實現了八種流行的演算法。
  25. htm.java(Java中的分層時態記憶體實現)是Numenta智慧計算平臺的Java埠。


相關文章