Tesla T4視訊編碼效能分析
Tesla T4視訊編碼效能分析
從開普勒開始的所有 NVIDIA GPUs 都支援完全加速的硬體視訊編碼; GPUs 支援完全加速的硬體視訊解碼。最近釋出的圖靈硬體提供了張量核心和更好的機器學習效能,但新的 GPU 還加入了新的多媒體功能,如改進的 NVENC 單元,以在視訊編解碼器中提供更好的壓縮和影像質量。
看一看圖靈設計的新的 NVENC 單元的效能和質量。
NVENC 效能測試設定
H.264 出現於 15 年前,已經成為一種無處不在的視訊編碼標準。它已經成為業界最重要和最廣泛的編解碼器。這些測試展示了 Tesla T4 與著名的開源編碼器 libx264 在兩種情況下的效能:
·
高質量模式,代表最常見的編碼方案與 VBR 控制和 B 幀啟用。
·
低延遲快速模式,適用於對延遲敏感的應用程式,如遠端遊戲或視訊會議。
為此,測試計算機的配置如表 1 所示:
這些效能測試將編碼引數設定為表 2 中所示的引數:
使用了各種輸入視訊進行 RD 估計,如 basketball _ drive 、 bq _ terrace 、仙人掌、 crowd _ run 、 ducks _ take _ off 、 jokey 、和服,以及更多解析度為 1280 × 720 、 1920 × 1080 和 3840 × 2160 的視訊。
功耗和質量結果
平衡序列
圖 1 到圖 4 顯示, Tesla T4 在高質量模式下為 libx264 提供相同或稍好的視覺質量,如 Kimono、 BQ Terrace 和 Park Scene 。
圖 1. 720p 解析度和序列的 PSNR-RD 曲線。
圖 2 . BQ 階地序列 1080p 解析度下的 PSNR-RD 曲線。
圖 3 . 場景序列在 720p 解析度下的 PSNR-RD 曲線。
圖 4 . 場景序列的 PSNR-RD 曲線,解析度為 1080p 。
與 libx264 相比, T4 顯示了更好的預測和過濾,如圖 5 和 6 所示。
圖 5 . 由 libx264 編碼的 bq _ terrace 序列的幀。
圖 6 . T4-Nvenc 編碼的 bq_terrace 序列的幀。
高速運動序列
顯著的混沌運動和圓周運動。與 libx264 相比, NVENC 在這些包含複雜內部預測的場景中顯示出明顯的優勢,如圖 7 和 8 所示。
圖 7. 視訊序列在 1080p解析度下的 PSNR-RD 曲線。
圖 8 . 視訊序列 1080p 解析度的PSNR-RD 曲線。
如圖 9 和圖 10 所示, Tesla T4 NVENC 在低延遲模式下的效能很容易超過 libx264 。請注意 Tesla T4 如何在高解析度下更有效,在相同的位元率下提供 1db 更好的視覺質量。
圖 9 . 1080p 解析度和低延遲模式下視訊序列的 PSNR-RD 曲線
圖 10. 視訊序列在 2160p 解析度下的 PSNR-RD 曲線。
如圖 11 和圖 12 所示,視覺質量的差異很容易被肉眼看到:
圖 11 . 由 libx264編碼的 ducks_take_off 視訊序列的第一幀。
圖 12. 由 T4 NVENC編碼的視訊序列的第一幀。
圖靈 GPUs 配備了功能強大的 NVENC 視訊編碼單元,與 libx264 等複雜的軟體編碼器相比,它提供了更高的視訊壓縮效率,因為它結合了更高的效能和更低的能耗。理想的程式碼轉換解決方案需要具有成本效益(美元/流)和節能(瓦/流)。在多個測試序列中平均的效能和功耗結果,如圖 13 和 14 所示。
圖 13. 在高質量模式下以每秒30 幀同時編碼的流數
圖 14. 在低延遲模式下以每秒 30 幀同時編碼的流數。
T4 以高質量模式同時編碼 22 個 720p 流。 GPU 還可以平均處理 10 個 1080p 的流和 2 到 3 個超高清( 2160p )解析度的流。這相當於在相同的視覺質量級別上幾乎是 libx264 的兩倍。
在低延遲模式下執行顯示出 T4 更大的優勢。它可以編碼 37 個 720p 解析度的流, 17-18 個 1080p , 4-5 個超高清,效能比 libx264 高 2-2 . 7 倍,具有更高的視覺質量。可以在圖 15 和圖 16 中看到每個流的瓦特數。
圖 15. 高質量模式下平均每流功耗瓦特
圖 16. 低延遲模式下平均每流功耗瓦特
Tesla 還顯示出很高的功率效率,在高質量模式下優於 libx264 2-4x ,在低延遲模式下高達 5 倍,同時保持低負載CPU。
結論
與前幾代相比, NVIDIA 的 Tesla T4 的編碼能力有了很大的提高。與 libx264 這樣的軟體編碼器相比,它在高質量模式下顯示出相同或更好的視覺質量,而在低延遲模式下則優於它們。這相當於在功耗降低 2-5 倍時效能提高了一倍。
相關文章
- Android 音視訊開發 視訊編碼,音訊編碼格式Android音訊
- 音視訊編解碼 -- 編碼引數 CRFCRF
- Android 音視訊 - MediaCodec 編解碼音視訊Android
- 視訊硬編碼(iOS端)iOS
- AVAssetWriter視訊資料編碼
- Linux火焰圖效能分析文章及視訊演示Linux
- 什麼是視訊編碼(Codec)?
- 前端獲取視訊編碼格式前端
- 史上最易懂的視訊編碼講解,告訴你哪種視訊編碼最適合你?
- 音視訊入門之音訊採集、編碼、播放音訊
- Android視訊編碼和直播推流教程Android
- Android音視訊(四)MediaCodec編解碼AACAndroid
- Android 音視訊錄製硬編碼實現Android
- 音視訊學習之 - H264編碼
- 位元組跳動視訊編解碼面經
- 使用MediaCodeC將圖片集編碼為視訊
- 專業的視訊編輯工具:視訊編輯軟體
- Android:MediaCodeC硬編碼解碼視訊,並將視訊幀儲存為圖片檔案Android
- Dubbo原始碼分析(六)Dubbo通訊的編碼解碼機制原始碼
- 音視訊開發-全網最全常用音視訊編碼和格式彙總
- Aupera:FPGA讓視訊編碼與AI結合水到渠成FPGAAI
- android使用MediaCodec實現非同步視訊編解碼Android非同步
- Web 上的隱形負擔:視訊編解碼Web
- 【秒懂音視訊開發】14_AAC編碼
- T4
- Camera2錄製視訊(一):音訊的錄製及編碼音訊
- 3C視訊音訊內容資訊編碼引數檢測MediaInfo音訊AI
- 視訊庫LFLiveKit分析
- Android如何回撥編碼後的音視訊資料Android
- 搜狐視訊iOS團隊 Objective-C 編碼規範iOSObject
- 擁抱智慧,AI 視訊編碼技術的新探索AI
- 【經驗分享】RTC 技術系列之視訊編解碼
- 【秒懂音視訊開發】23_H.264編碼
- electron-ipc通訊效能分析
- 視訊更新:程式碼分析8之單步除錯ARM64啟動彙編與重定位除錯
- Android短視訊開發業務中視訊編解碼的相關知識閱讀Android
- 視訊遊戲編年史遊戲
- Python視訊編輯庫:MoviePyPython