GitHub上那些值得一試的JAVA開源庫

簡書 - 技匠發表於2016-07-16

作為一名程式設計師,你幾乎每天都會使用到GitHub上的那些著名Java第三方庫,比如Apache Commons,Spring,Hibernate等等。除了這些,你可能還會fork或Star一些其他的開源庫,但GitHub上的庫實在太多了,以至於對於個人來說,你很難有時間去發現並瞭解那些不斷加入的新庫,而它們卻往往能在一些新興領域中給你提供幫助。

我一直使用JAVA來寫後端應用,平時也會關注一些國外技術大牛的部落格(來自Tapki、DZone、Google Developer等技術部落格),從而注意到了一些新的而且很有意思Java開源庫,它們有些能給你的專案帶來幫助,有些是以遊戲的形式幫你提高Java的程式設計水平,而另一些則能夠幫助你識別JAVA程式中的常見問題 。在這多達330,000個JAVA開源庫中,我收集了下面這些或許也值得你一試的Java開源庫。

Strman-java – 字串處理

Strmen-java是一個字串處理工具,你可以通過maven將它引入到專案中。除了Java本身的字串處理方式外,我們還可以使用Apache Common Langs裡的StringUtils來簡化String的操作。但以上兩種方式對於我們日常程式設計中最容易碰到的字串處理來說,仍然顯得有些不足。Strmen-java為我們提供了一個非常完整且強大的解決方案,使用它可以解決幾乎所有字串處理場景。

下面便是Strman-java的幾個常見使用示例:

拼接字串

import static strman.Strman.append
append("f", "o", "o", "b", "a", "r")
// result => "foobar"

獲取某一個位置的字元

import static strman.Strman.at
at("foobar", 0)
// result => Optional("f")

取出某兩個字元包含的內容

import static strman.Strman.between
between("[abc][def]", "[", "]")

Base64 編碼

import static strman.Strman.base64Encode
base64Encode("strman")
// result => "c3RybWFu"

Tablesaw – “大資料”

談到大資料,我們想到的總是Hodoop加上叢集部署,但有沒有一種更小巧的方式,能讓我們在單機上方便地實現大資料的那些功能呢?Tablesaw給我們提供了一種基於記憶體的高效能大資料解決方案。你可以使用它的API方便地從RDBMS或是CSV中匯入資料,然後利用Tablesaw提供的介面對資料進行排序、篩選、分組、map/reduce等操作。

根據文件給出的說明,你將可以在22秒內將500,000,000行(每行4個欄位)的資料檔案載入到10G的記憶體中。而查詢速度更是達到僅需1-2ms。

Dex – 資料視覺化

Dex是一個資料視覺化解決方案,它支援超過50種不同的檢視型別,包括世界地圖,timeline,3D圖形等等。Dex是使用Java/JavaFX編寫的,你將可以很方便地將它與你的其他程式整合(比如用R語言寫的大資料分析程式)創造出美觀的圖表來。

Bootique – 微服務框架

以前開發Web應用程式時,我們總需要先構建一個應用,然後將它打包(war),再部署到如Tomcat這樣的Web容器中。但隨著微服務架構的流行,我們需要更輕量化,非容器的開發框架。SpringBoot是我一直在使用的,而Bootique無疑是另一種優秀的選擇。它允許你通過具有不同功能的模組插入,來支援如REST Service,Web app,定時排程,資料遷移等功能。而使用它寫的程式都則會被打包為一個Jar檔案,你可以通過命令列更靈活地去啟動它。

從很多角度看,它都很像SpringBoot,將你從Java應用從它所依賴的Web容器中解放出來,程式設計師們可以有更強的自主性,去寫主程式的main()函式。甚至在你不新增任何額外的模組的情況下,你也能直接使用Bootqiue去實現一個Java應用。

Gumshoe – Java程式檢測

Gumshoe是一個JAVA程式檢測工具,它能幫助你跟蹤程式的負載和效能。它能通過度量TCP,UDP,CPU使用等資訊,幫助你分析出資源的使用情況 ,同時它也提供了Java程式中呼叫棧的分析功能,比如提供某個方法呼叫的次數,頻度等資訊。

LeakCanary – 記憶體洩漏監控

記憶體洩漏一直是令Java程式設計師苦惱的問題,因為在你開發階段很難察覺記憶體洩漏問題,而一旦到了生產環境,則可能因為它而造成嚴重的後果。LeakCanary是一個記憶體洩漏檢查工具,只需要像下面這樣簡單加入LeakCanary,它便能全程監控你的應用,並在出現記憶體洩漏時給你發出警告。LeakCanary同時支援Android和Java,下面是在Android應用中使用的例子。

public class ExampleApplication extends Application {

  @Override public void onCreate() {
    super.onCreate();
    LeakCanary.install(this);
  }
}

awesome-java – JAVA資源大集合

Awesome-java得到了7490個Star,作者將JAVA中那些最常用的第三方庫按照分類整理成了一個列表。包含Ancients(古老,但常用的),Bean Mapping,Build,Bytecode Manipulation,Code Analysis,Command-line Argument Parsers,Configuration,Continuous Integration,CSV,Database等等,簡直是一本jiava第三方庫大全,如果你對專案中應該使用哪一個庫不確定,或希望選擇幾個庫來做比較,都可以到awesome-java上進行參考。

99-Problems – 學習JAVA8

99-Problems是一個很有意思的GitHub專案,它對三種不同的語言Java 8,Scala和Haskell分別提出了99個問題,讓你通過使用特定語言程式設計來提供一個最優的解決方案。

這些問題分為不同的難度等級,用*表示,一個星號表示在15分鐘內解決,2個星號可能需要30-69分鐘,而最難的3個星號,則需要更長時間(90分鐘左右),如果你能在限定的時間內使用JAVA8的特性解決所有的問題,那說明你對JAVA8的掌握程度已經非常牢固了。如果你沒辦法解決所有問題也沒關係,你可以檢視作者提供的程式碼示例,這也是你學習JAVA8很好的途徑。

Chronicle Map – 高效鍵值對儲存

Chronicle Map是一個基於記憶體的鍵值對儲存方案。以其低延遲、高併發的特性著稱,並在交易及金融系統中得到應用。另外,他還支援持久化到磁碟,以及多鍵值查詢的功能。

下面是官方文件中一段對於從JAVA角度描述Chronicle Map的說明:

From Java perspective, ChronicleMap is a ConcurrentMap implementation which stores the entries off-heap, serializing/deserializing key and value objects to/from off-heap memory transparently. Chronicle Map supports

  • Key and value objects caching/reusing for making zero allocations (garbage) on queries.
  • Flyweight values for eliminating serialization/deserialization cost and allowing direct read/write access to off-heap memory.

ND4J – 科學計算

ND4J是一個開源的數值計算擴充套件 ,它將 Python中著名的numpy庫的很多特性帶到了Java中。ND4J可以用來儲存和處理大型多維矩陣。它的計算和處理速度很快,但佔用的記憶體卻很少,程式設計師們可以很容易地使用它來與其他JAVA或Scala庫作介面。

ND4J主要包括了:一個強大的N維陣列物件Array,比較成熟的函式庫;實用的線性代數、傅立葉變換和隨機數生成函式等。它可以與Hadoop或者Spark這樣的工具整合使用。

Automon – Java監控

Automon是一個非常靈活的JAVA監控工具,它結合了AOP(AspectJ)以及JDK和其他依賴庫的功能特性,以宣告方式去監控你的Java程式碼。它可以與JAMon,JavaSimon,Yammer Metrics,StatsD和像 perf4j,log4j,sl4j這樣的logging庫結合使用。

Automon最常被用於跟蹤Java方法的呼叫時長,異常次數等資訊,並在你選擇的工具中顯示監控結果。它並不自己進行任何監控動作,但卻很好地扮演了“我應該監控什麼”以及“我如何進行監控”這兩者之間中間人的角色。而且它的安裝也非常簡單,只需要簡單進行配置便可使用。

Swiss Java Knife – JAVA工具集

SJK(Java瑞士軍刀)是一個用於JVM監控、排錯以及調優的工具集。它是一個命令列工具,但使用起來非常方便,你可以用它來查詢JVM中執行緒的CPU使用,GC實時資訊,以及基本調優選項。也可以結合MBean以JSON格式匯出所有你需要的資訊。

以上只是GitHub中那些優秀開源庫的冰山一角,作為一名現代的Java程式設計師,你除了需要優秀的程式設計能力之外,善於發現並使用那些優秀的開源庫將使你更上一個臺階。如果你也有好的Java開源庫推薦,請在下面留言,我會補充道這份清單中,讓更多JAVA程式設計師能夠從中受益。

相關文章