CSV檔案讀取效能大決戰:Julia 、Python與R語言 - Deepak
任何資料分析工作流程中的首要任務就是簡單地讀取資料,而這絕對必須快速而有效地完成,這樣才能開始更有趣的工作。在許多行業和領域中,CSV檔案格式都是儲存和共享表格資料的主要工具。快速而強大地載入CSV是至關重要的,並且必須在各種檔案大小,資料型別和形狀之間很好地擴充套件。這篇文章比較了在三個不同的CSV解析器中讀取8個不同的真實資料集的效能:R的fread,Pandas的read_csv和Julia的CSV.jl,每個庫都被選為“同類最佳” CSV解析器。
多執行緒對於實現當今計算機的最佳效能至關重要,但是隻有一種語言(Julia)能夠始終如一地有效使用多個核心。
基準測試表明,即使在限制單個核心的情況下,Julia的CSV.jl也比Pandas快1.5至5倍;啟用多執行緒後,速度可以提高20倍以上。R的fread支援多執行緒,因此更具競爭力,但在許多資料集中,它仍然比Julia落後10倍或更多。用於基準測試的工具是用於Julia的BenchmarkTools.jl,用於R的microbenchmark和用於Python的timeit。
詳細分析點選標題進入原文
相關文章
- R語言 - 讀取CSV檔案報錯R語言
- python 讀取csv檔案Python
- C語言讀取寫入CSV檔案 [一]基礎篇C語言
- R語言技巧:讀取spss的sav格式檔案R語言SPSS
- iOS讀取.csv檔案iOS
- python 使用字典讀取CSV檔案Python
- python讀取大檔案Python
- python如何讀取大檔案Python
- csv檔案的寫入和讀取
- C語言/C++讀取檔案資訊C語言C++
- Python 高階程式設計:深入解析 CSV 檔案讀取Python程式設計
- Jmeter之讀取csv檔案踩坑記JMeter
- 【易語言】編輯框讀取txt檔案
- Python專案實踐:串列埠字串資料的讀取、分割與儲存到csv檔案Python串列埠字串
- Python生成器讀取大檔案Python
- python讀取檔案——python讀取和儲存mat檔案Python
- Python的四個挑戰者:Swift、Go、Julia、RPythonSwiftGo
- python讀取大檔案的幾種方法Python
- C語言-檔案讀寫C語言
- R語言:資料輸出至檔案R語言
- python生成CSV檔案Python
- Java高效讀取大檔案Java
- python小白檔案讀取Python
- 【python】建立,讀取檔案Python
- python 讀取文字檔案Python
- (Python基礎教程之十二)Python讀寫CSV檔案Python
- MIT正式釋出程式語言Julia 1.0:Python、R、C++三合一MITPythonC++
- C語言fgetc()函式:讀檔案函式(由檔案中讀取一個字元)C語言函式字元
- 基於R語言的raster包讀取遙感影像R語言AST
- python讀取網路上的csv文Python
- Python中CSV讀取和轉換Python
- Julia語言程式基礎
- julia語言編輯器
- Python讀取大檔案的"坑“與記憶體佔用檢測Python記憶體
- 建立與讀取.ini檔案
- SQLServer匯入大CSV檔案SQLServer
- python 寫入CSV檔案Python
- php讀取大檔案詳解PHP