nvidia 釋出了cuda3.2 釋出候選版

洛欣發表於2010-09-17
    已註冊的開發者可以到 http://partners.nvidia.com  或  http://nvdeveloper.nvidia.com上下載
    主要更新:
    cusparse一個GPU加速的稀疏矩陣庫
    curand一個GPU加速的隨機數生成庫,支援 Sobol quasi-random 枚 XORWOW 偽隨機數
    裝置端程式碼和主機端程式碼:
    cufft為在費米架構上基數是3,5,7的轉換尺寸做了優化
    對於費米架構的GPU,cublas中矩陣相乘和轉置效能提升了50%-300%
    以前SDK提供的H.264編/解碼現在是cuda工具包的一部分
    cuda驅動和執行時:
    支援6GB的視訊記憶體
    支援視訊記憶體超過4GB的GPU的除錯
    標準的windows驅動包整合了TCC(特斯拉計算叢集)支援
   
    其它:
    支援核心中的malloc()和free()
    英偉達系統管理介面(nvidia-smi)支援報告工作GPU的百分比和許多效能計數器

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22785983/viewspace-674252/,如需轉載,請註明出處,否則將追究法律責任。

相關文章