np.array-tensor(cpu)-tensor(gpu)-np.array哪一步最耗時
深度學習CPU到GPU 哪些步驟很耗時
僅以pytorch numpy.array與cpu/gpu tensor之間的轉換為例:
1.寫段程式碼用於測試時間
為了結果更準確,執行100個迴圈,求各段操作的平均時間:
import numpy as np
import torch
import time
numpy_tensor,cpu_gpu,gpu_cpu,tensor_numpy=0.0,0.0,0.0,0.0
for i in range(100):
a=np.random.randint(0,1000,(10000,10000),dtype=np.int16)
t0 = time.perf_counter()
b=torch.from_numpy(a)
t1 = time.perf_counter()
# print("numpy-tensor:",f"{t1-t0:.3f}")
numpy_tensor+=t1-t0
b=b.cuda()
t2 = time.perf_counter()
# print("cpu-gpu:",f"{t2-t1:.3f}")
cpu_gpu+=t2-t1
c=b.cpu()
t3 = time.perf_counter()
# print("gpu-cpu:",f"{t3-t2:.3f}")
gpu_cpu+=t3-t2
d=c.numpy()
t4 = time.perf_counter()
# print("tensor_numpy:",f"{t4-t3:.3f}")
tensor_numpy+=t4-t3
print("numpy-tensor:",(numpy_tensor)/100,"\n")
print("cpu-gpu:" ,(cpu_gpu)/100,"\n")
print(",gpu-cpu:",(gpu_cpu)/100,"\n")
print("tensor_numpy:",(tensor_numpy)/100,"\n")
2.每一步需要的時間
操作 | 時間(s) |
---|---|
numpy-tensor | 3.870e-05 |
cpu-gpu | 0.05468 |
gpu-cpu | 0.08956 |
tensor_numpy | 0.006042 |
可見資料從CPU到GPU/GPU到CPU是非常耗時間的。
暫時未發現破解之道。
相關文章
- DirectX11--CPU與GPU計時器GPU
- JVM調優jstack找出最耗cpu的執行緒&定位問題程式碼JVMJS執行緒
- Unity效能分析(二)CPU/GPU分析UnityGPU
- gpu是什麼 gpu和cpu的區別介紹GPU
- GPU程式設計--CPU和GPU的設計區別GPU程式設計
- AI究竟走到哪一步了?AI
- TensorFlow——tensorflow指定CPU與GPU運算GPU
- Keras/Tensorflow選擇GPU/CPU執行KerasGPU
- CPU Turbo和GPU Turbo的區別 CPU Turbo是什麼意思?GPU
- 你今天在哪一步(1)
- tensorflow 2.x CPU/GPU安裝攻略GPU
- 電腦gpu是什麼意思 gpu和cpu有什麼區別不同GPU
- 匯入PMC先從哪一步做起?
- 部署CPU與GPU通用的tensorflow:Anaconda環境GPU
- 監控Ubuntu Linux中的CPU/GPU 溫度UbuntuLinuxGPU
- Linux 中CPU 和 GPU 的行為監控LinuxGPU
- 在 Linux 上監控 CPU 和 GPU 溫度LinuxGPU
- 哪一款iPhone最適合攝影iPhone
- Python開源框架,你最中意哪一個?Python框架
- 追蹤將伺服器CPU耗光的兇手伺服器
- systrace 統計方法耗時
- Android 快速定位耗時方法Android
- CSS中哪些屬性會引起GPU渲染,會增加耗電嗎?CSSGPU
- tensor .detach()
- 特網雲 CPU和GPU有什麼區別GPU
- Java與Python:哪一個最適合你? - computersciencehubJavaPython
- Vue 服務端渲染實踐 ——Web應用首屏耗時最優化方案Vue服務端Web優化
- Tensor與tensor深入分析與異同
- 域名解析耗時是什麼?域名解析耗時影響因素有哪些?
- iOS 定時器耗電探究iOS定時器
- 【Remotery】 Remotery-輕量級的遠端實時 CPU/GPU 分析器設計淺析REMGPU
- 機器翻譯進化到哪一步了?
- MES vs ERP:哪一種最適合您的需求?
- pytorch之TensorPyTorch
- 統計lcp各部分耗時
- 雲原生 WebAssembly 現在發展到哪一步了?Web
- 耗時6小時的同花順面試面試
- 3576 npu ddr gpu 定頻(cpu定頻還不知道)GPU