PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

背景

• GPUサーバから複数のレンダリング映像を送出する

といった使い方をする場合、以下の製品が候補として考えられる

– NVIDIA GRID K1/K2 (VDI用途)

– NVIDIA GRID K340/K520 (CloudGaming用途)

背景

• K1/K2はVDI用途とされているが…

– VDIのような定形リソース分割をする形ではなく、フレキシブルなGPUリソースの利用を検討したい

• コンテンツ制作の柔軟性のため

–より汎用な製品を使うことによるメリット

• 供給の安定

• サポート

評価項目

• １サーバでどれだけのアプリインスタンスを同時実行できるのか

• K340/K520といった特化製品との挙動差異を見る（今回の資料からは割愛）

概略図

Windows Server 2012 R2

App App App

PowerEdge R730

H.264 H.264

H.264 H.264

H.264 H.264 H.264

• サーバ上でアプリインスタンスを動かす • 生成した画面をNVIDIA GPUを使って H.264にエンコード • ビデオデータをパケットとして接続相手のクライアントに送出 • クライアントでデコード・表示

PC

SmartDevice

PC

評価機（サーバ）の仕様

• CPU

– Intel Xeon E5-2600 v3 2.60GHz x2

• RAM

– 32GB

• GPU

– NVIDIA GRID K2 x 2

評価ソフトウェア仕様

• アプリケーション仕様

– 解像度: 1280x720

– ビデオフレームレート: 30 fps

• アプリケーション種別

– App1

• 三角形の回転表示(シンプルなアプリ)

– App2

• 低負荷な2D表示 ※今回の検証では3D性能による負荷の計測は行っていない。

評価項目

• 主にビデオエンコーディング処理よる負荷計測にフォーカス

– 評価機 • 測定スクリプトで計測

– CPU 使用率

– メモリ使用量

– NVIDIA GRID K2 • 1チップ単一処理/4チップ分散処理における性能差を比較

• 測定スクリプトで計測

– GPU使用率

– VPU使用率*1

– ビデオメモリ使用量

評価結果（ビデオチップ=1個で処理）

アプリケーション最大インスタンス数ボトルネック要因

App1 6 VPU

App2 6 VPU

評価結果（ビデオチップ=4個で分散処理）

アプリケーション最大インスタンス数ボトルネック要因

App1 24 VPU

App2 24 VPU

ボトルネックにより発生する現象

ボトルネック要因現象

CPU アプリケーション処理低下

GPU フレームレート低下

VPU エンコード遅延

RAM/VRAM不足一定数よりアプリインスタンスが起動不能

まとめ

• NVIDIA GRID K2 について – ほぼ期待どおりの挙動。VDI向けだからという制限は感じられない

– K520は同時16セッション(GPU Coreあたり 8 セッション)というカタログスペックなのでK2がCoreあたり6セッションで頭打ちになっている事からするとVPU性能に差異がある可能性もある

まとめ

• アプリケーションのボトルネック傾向 – App1/2ともにVPUによるボトルネックが最初に来ている。それで最大同時接続台数が決まっている

– アプリが高品質な3D映像を生成するアプリケーションに変わったとしてもCPU/GPUの負荷が上がるだけでVPU負荷については解像度が変わらない限り変化はない

APPENDIX

GPU使用率（App1）4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

gpu

usa

ge(%

)

Num of running applications

The transition of max gpu usage (App1)

gpu3

gpu2

gpu1

gpu0

VPU使用率（App1）4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

vpu

usa

ge(%

)


The transition of max vpu usage(App1)

vpu3

vpu2

vpu1

vpu0

GPU使用率（App2）4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

gpu

usa

ge(%

)

Num of running applicaitons

The transition of max gpu usage(App2)

gpu3

gpu2

gpu1

gpu0

VPU使用率（App2）4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

vpu

usa

ge(%

)


The transition of vpu usage(App2)

vpu3

vpu2

vpu1

vpu0

PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

Technology

Transcript of PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書