幾行程式碼提升Pandas效能150倍

banq發表於2024-06-27


Pandas是一個強大的Python資料分析和操作庫!NVIDIA讓Pandas的速度提高了150倍,無需更改程式碼

您只需新增幾行程式碼:

%load_ext cudf.pandas import pandas as pd

Pandas在記憶體中執行,因為它將整個資料集載入到執行它的機器的本地記憶體中。這限制了它處理大型資料集的能力。

藉助cuDF的pandas加速器,您現在可以為pandas工作流帶來加速計算。

此外,這個github cuDF庫將自動知道你是在GPU還是CPU上執行,並加快你的處理速度。

cuDF(讀作 "KOO-dee-eff")是一個 GPU DataFrame 庫,用於載入、連線、聚合、過濾和以其他方式運算元據。cuDF 利用 libcudf(一個超快的 C++/CUDA 資料幀庫)和 Apache Arrow 列式格式,提供了一個 GPU 加速的 pandas API。

CUDA/GPU 要求

  • CUDA 11.2+
  • NVIDIA 驅動程式 450.80.02+
  • Volta 架構或更高(計算能力 >=7.0)


詳細點選標題

相關文章