Pandas是一個強大的Python資料分析和操作庫!NVIDIA讓Pandas的速度提高了150倍,無需更改程式碼
您只需新增幾行程式碼:
%load_ext cudf.pandas import pandas as pd |
Pandas在記憶體中執行,因為它將整個資料集載入到執行它的機器的本地記憶體中。這限制了它處理大型資料集的能力。
藉助cuDF的pandas加速器,您現在可以為pandas工作流帶來加速計算。
此外,這個github cuDF庫將自動知道你是在GPU還是CPU上執行,並加快你的處理速度。
cuDF(讀作 "KOO-dee-eff")是一個 GPU DataFrame 庫,用於載入、連線、聚合、過濾和以其他方式運算元據。cuDF 利用 libcudf(一個超快的 C++/CUDA 資料幀庫)和 Apache Arrow 列式格式,提供了一個 GPU 加速的 pandas API。
CUDA/GPU 要求
- CUDA 11.2+
- NVIDIA 驅動程式 450.80.02+
- Volta 架構或更高(計算能力 >=7.0)
詳細點選標題