PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

18
PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

Transcript of PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

Page 1: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

Page 2: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

背景

• GPUサーバから複数のレンダリング映像を送出する

といった使い方をする場合、以下の製品が候補として考えられる

– NVIDIA GRID K1/K2 (VDI用途)

– NVIDIA GRID K340/K520 (CloudGaming用途)

Page 3: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

背景

• K1/K2はVDI用途とされているが…

– VDIのような定形リソース分割をする形ではなく、フレキシブルなGPUリソースの利用を検討したい

• コンテンツ制作の柔軟性のため

–より汎用な製品を使うことによるメリット

• 供給の安定

• サポート

Page 4: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

評価項目

• 1サーバでどれだけのアプリインスタンスを同時実行できるのか

• K340/K520といった特化製品との挙動差異を見る(今回の資料からは割愛)

Page 5: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

概略図

Windows Server 2012 R2

App App App

PowerEdge R730

H.264 H.264

H.264 H.264

H.264 H.264 H.264

• サーバ上でアプリインスタンスを動かす • 生成した画面をNVIDIA GPUを使って H.264にエンコード • ビデオデータをパケットとして接続相手のクライアントに送出 • クライアントでデコード・表示

PC

SmartDevice

PC

Page 6: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

評価機(サーバ)の仕様

• CPU

– Intel Xeon E5-2600 v3 2.60GHz x2

• RAM

– 32GB

• GPU

– NVIDIA GRID K2 x 2

Page 7: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

評価ソフトウェア仕様

• アプリケーション仕様

– 解像度: 1280x720

– ビデオフレームレート: 30 fps

• アプリケーション種別

– App1

• 三角形の回転表示(シンプルなアプリ)

– App2

• 低負荷な2D表示 ※今回の検証では3D性能による負荷の計測は行っていない。

Page 8: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

評価項目

• 主にビデオエンコーディング処理よる負荷計測にフォーカス

– 評価機 • 測定スクリプトで計測

– CPU 使用率

– メモリ使用量

– NVIDIA GRID K2 • 1チップ単一処理/4チップ分散処理における性能差を比較

• 測定スクリプトで計測

– GPU使用率

– VPU使用率*1

– ビデオメモリ使用量

Page 9: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

評価結果 (ビデオチップ=1個で処理)

アプリケーション 最大インスタンス数 ボトルネック要因

App1 6 VPU

App2 6 VPU

Page 10: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

評価結果 (ビデオチップ=4個で分散処理)

アプリケーション 最大インスタンス数 ボトルネック要因

App1 24 VPU

App2 24 VPU

Page 11: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

ボトルネックにより発生する現象

ボトルネック要因 現象

CPU アプリケーション処理低下

GPU フレームレート低下

VPU エンコード遅延

RAM/VRAM不足 一定数よりアプリインスタンスが起動不能

Page 12: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

まとめ

• NVIDIA GRID K2 について – ほぼ期待どおりの挙動。VDI向けだからという制限は感じられない

– K520は同時16セッション(GPU Coreあたり 8 セッション)というカタログスペックなのでK2がCoreあたり6セッションで頭打ちになっている事からするとVPU性能に差異がある可能性もある

Page 13: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

まとめ

• アプリケーションのボトルネック傾向 – App1/2ともにVPUによるボトルネックが最初に来ている。それで最大同時接続台数が決まっている

– アプリが高品質な3D映像を生成するアプリケーションに変わったとしてもCPU/GPUの負荷が上がるだけでVPU負荷については解像度が変わらない限り変化はない

Page 14: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

APPENDIX

Page 15: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

GPU使用率(App1)4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

gpu

usa

ge(%

)

Num of running applications

The transition of max gpu usage (App1)

gpu3

gpu2

gpu1

gpu0

Page 16: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

VPU使用率(App1)4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

vpu

usa

ge(%

)

Num of running applications

The transition of max vpu usage(App1)

vpu3

vpu2

vpu1

vpu0

Page 17: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

GPU使用率(App2)4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

gpu

usa

ge(%

)

Num of running applicaitons

The transition of max gpu usage(App2)

gpu3

gpu2

gpu1

gpu0

Page 18: PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

VPU使用率(App2)4チップ使用時

0

50

100

150

200

250

300

350

400

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26

vpu

usa

ge(%

)

Num of running applications

The transition of vpu usage(App2)

vpu3

vpu2

vpu1

vpu0