PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書
-
Upload
dell-techcenter-japan -
Category
Technology
-
view
150 -
download
1
Transcript of PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書
PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書
背景
• GPUサーバから複数のレンダリング映像を送出する
といった使い方をする場合、以下の製品が候補として考えられる
– NVIDIA GRID K1/K2 (VDI用途)
– NVIDIA GRID K340/K520 (CloudGaming用途)
背景
• K1/K2はVDI用途とされているが…
– VDIのような定形リソース分割をする形ではなく、フレキシブルなGPUリソースの利用を検討したい
• コンテンツ制作の柔軟性のため
–より汎用な製品を使うことによるメリット
• 供給の安定
• サポート
評価項目
• 1サーバでどれだけのアプリインスタンスを同時実行できるのか
• K340/K520といった特化製品との挙動差異を見る(今回の資料からは割愛)
概略図
Windows Server 2012 R2
App App App
PowerEdge R730
H.264 H.264
H.264 H.264
H.264 H.264 H.264
• サーバ上でアプリインスタンスを動かす • 生成した画面をNVIDIA GPUを使って H.264にエンコード • ビデオデータをパケットとして接続相手のクライアントに送出 • クライアントでデコード・表示
PC
SmartDevice
PC
評価機(サーバ)の仕様
• CPU
– Intel Xeon E5-2600 v3 2.60GHz x2
• RAM
– 32GB
• GPU
– NVIDIA GRID K2 x 2
評価ソフトウェア仕様
• アプリケーション仕様
– 解像度: 1280x720
– ビデオフレームレート: 30 fps
• アプリケーション種別
– App1
• 三角形の回転表示(シンプルなアプリ)
– App2
• 低負荷な2D表示 ※今回の検証では3D性能による負荷の計測は行っていない。
評価項目
• 主にビデオエンコーディング処理よる負荷計測にフォーカス
– 評価機 • 測定スクリプトで計測
– CPU 使用率
– メモリ使用量
– NVIDIA GRID K2 • 1チップ単一処理/4チップ分散処理における性能差を比較
• 測定スクリプトで計測
– GPU使用率
– VPU使用率*1
– ビデオメモリ使用量
評価結果 (ビデオチップ=1個で処理)
アプリケーション 最大インスタンス数 ボトルネック要因
App1 6 VPU
App2 6 VPU
評価結果 (ビデオチップ=4個で分散処理)
アプリケーション 最大インスタンス数 ボトルネック要因
App1 24 VPU
App2 24 VPU
ボトルネックにより発生する現象
ボトルネック要因 現象
CPU アプリケーション処理低下
GPU フレームレート低下
VPU エンコード遅延
RAM/VRAM不足 一定数よりアプリインスタンスが起動不能
まとめ
• NVIDIA GRID K2 について – ほぼ期待どおりの挙動。VDI向けだからという制限は感じられない
– K520は同時16セッション(GPU Coreあたり 8 セッション)というカタログスペックなのでK2がCoreあたり6セッションで頭打ちになっている事からするとVPU性能に差異がある可能性もある
まとめ
• アプリケーションのボトルネック傾向 – App1/2ともにVPUによるボトルネックが最初に来ている。それで最大同時接続台数が決まっている
– アプリが高品質な3D映像を生成するアプリケーションに変わったとしてもCPU/GPUの負荷が上がるだけでVPU負荷については解像度が変わらない限り変化はない
APPENDIX
GPU使用率(App1)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
gpu
usa
ge(%
)
Num of running applications
The transition of max gpu usage (App1)
gpu3
gpu2
gpu1
gpu0
VPU使用率(App1)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
vpu
usa
ge(%
)
Num of running applications
The transition of max vpu usage(App1)
vpu3
vpu2
vpu1
vpu0
GPU使用率(App2)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
gpu
usa
ge(%
)
Num of running applicaitons
The transition of max gpu usage(App2)
gpu3
gpu2
gpu1
gpu0
VPU使用率(App2)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
vpu
usa
ge(%
)
Num of running applications
The transition of vpu usage(App2)
vpu3
vpu2
vpu1
vpu0