パフォーマンスレポート PRIMERGY RX200 S6...L3 キャッ シュ スピード QPI TDP...
Transcript of パフォーマンスレポート PRIMERGY RX200 S6...L3 キャッ シュ スピード QPI TDP...
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6
© Fujitsu Technology Solutions 2010-2011 1/47 ページ
ホワイトペーパー
FUJITSU PRIMERGY サーバ
パフォーマンスレポート PRIMERGY RX200 S6
本書では、PRIMERGY RX200 S6 で実行したベンチマークの概要について説明します。
PRIMERGY RX200 S6 のパフォーマンスデータを、他の PRIMERGY モデルと比較して
説明しています。ベンチマーク結果に加え、ベンチマークごとの説明およびベンチマーク
環境の説明も掲載しています。
バージョン
2.0a
2011-12-05
目次
ドキュメントの履歴 ............................... 2
製品データ.............................................. 3
SPECcpu2006 ........................................ 4
SPECjbb2005 ....................................... 15
SPECpower_ssj2008 ........................... 18
OLTP-2 ................................................. 22
vServCon .............................................. 29
VMmark V1 ........................................... 37
VMmark V2 ........................................... 40
STREAM ............................................... 43
関連資料 ............................................... 46
お問い合わせ先 .................................... 47
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
2/47 ページ © Fujitsu Technology Solutions 2010-2011
ドキュメントの履歴
バージョン 1.1
以下のベンチマークを含むレポートの初版
SPECcpu2006
Xeon E5503、E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677、L5640、
X5650、X5660、X5670、X5680 で測定
SPECjbb2005
Xeon X5680 で測定
SPECpower_ssj2008
Xeon X5670 および SSD 2.5 インチ 64GB(1 台)で測定
vServCon
Xeon E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677、L5640、X5650、X5660、
X5670、X5680 で測定
VMmark V1
Xeon X5680 で測定
バージョン 1.2
以下のベンチマークを追加
OLTP-2
Xeon E5503、E5506、E5507、E5620、E5630、E5640、L5609、L5630、L5640、X5650、X5660、
X5667、X5670、X5677、X5680 で測定
バージョン 2.0
以下のベンチマークを追加
VMmark V2
Xeon X5680、X5690 で測定
STREAM
Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5675、X5687、X5690 で測定
以下のベンチマークを更新
SPECcpu2006
Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5675、X5687、X5690 で測定
(インテル C++/Fortran コンパイラー 12.0)
SPECjbb2005
Xeon X5690 で測定
SPECpower_ssj2008
Xeon X5675 および SSD 2.5 インチ 32GB(1 台)で測定
OLTP-2
Xeon 55xx および 56xx プロセッサシリーズで測定
vServCon
Xeon 55xx および 56xx プロセッサシリーズで測定
バージョン 2.0a
軽微な訂正
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 3/47 ページ
製品データ
PRIMERGY RX200 S6 は、1 U の省スペース 2 ソケットラックサーバで、PRIMERGY RX200 S5 の後継製
品です。Intel 5500 チップセット、Intel Xeon 5500 または 5600 シリーズのプロセッサ(2 コア、4 コア、6
コア)2 基を搭載し、最大 192 GB の DDR3-SDRAM が搭載可能な 12 本の DIMM スロット、オンボード 2
ポート 1 Gbit イーサネットコントローラー、および 3 本の PCI スロット(PCI-Express 2.0 x4(1 本)およ
び PCI-Express 2.0 x8(2 本))が装備されています。PRIMERGY RX200 S6 は、ドライブベイの種類に
よって 2 つのバージョンが提供されています。ドライブベイには、最大 6 台または最大 8 台の 2.5 インチ
ドライブ(SSD、SATA、または SAS HDD)を搭載できます。
詳細な製品データについては、PRIMERGY RX200 S6 データシートを参照してください。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
4/47 ページ © Fujitsu Technology Solutions 2010-2011
SPECcpu2006
ベンチマークの説明
SPECcpu2006 は、整数演算および浮動小数点演算でシステム性能を測定するベンチマークです。このベン
チマークは、12 本のアプリケーションから成る整数演算テストセット(SPECint2006)、および 17 本のア
プリケーションから成る浮動小数点演算テストセット(SPECfp2006)で構成されています。これらのアプ
リケーションは大量の演算を実行し、CPU およびメモリを集中的に使用します。他のコンポーネント
(ディスク I/O、ネットワークなど)は、このベンチマークでは測定しません。
SPECcpu2006 は、特定のオペレーティングシステムに依存しません。このベンチマークは、ソースコード
として利用可能で、実際に測定する前にコンパイルする必要があります。したがって、使用するコンパイ
ラーのバージョンやその最適化設定が、測定結果に影響を与えます。
SPECcpu2006 には、2 つのパフォーマンス測定方法が含まれています。1 つ目の方法(SPECint2006 およ
び SPECfp2006)では、1 つのタスクの処理に必要な時間を測定します。2 つ目の方法(SPECint_rate2006
および SPECfp_rate2006)では、スループット(並列処理できるタスク数)を測定します。いずれの方法
も、さらに 2 つの測定の種類、「ベース」と「ピーク」に分かれています。これらは、コンパイラー最適化
を使用するかどうかという点で異なります。「ベース」値は常に公開されていますが、「ピーク」値はオプ
ションです。
ベンチマーク 演算 タイプ コンパイラー最適化 測定結果 アプリケーション
SPECint2006 整数 ピーク アグレッシブ 速度 単体実行
SPECint_base2006 整数 ベース 標準
SPECint_rate2006 整数 ピーク アグレッシブ スループット 多重実行
SPECint_rate_base2006 整数 ベース 標準
SPECfp2006 浮動小数点 ピーク アグレッシブ 速度 単体実行
SPECfp_base2006 浮動小数点 ベース 標準
SPECfp_rate2006 浮動小数点 ピーク アグレッシブ スループット 多重実行
SPECfp_rate_base2006 浮動小数点 ベース 標準
測定結果は、個々のベンチマークで得られた正規化比の幾何平均です。算術平均と比較して、幾何平均の方
が、ひとつの飛び抜けて高い値に左右されない平均値です。「正規化」とは、テストシステムがリファレン
スシステムと比較してどの程度高速であるかを測定することです。例えば、リファレンスシステムの
SPECint_base2006、SPECint_rate_base2006、SPECfp_base2006、および SPECfp_rate_base2006 の結
果が、値「1」と判定されたとします。このとき、SPECint_base2006 の値が「2」の場合は、測定システム
がこのベンチマークをリファレンスシステムの 2 倍の速さで実行したことを意味します。
SPECfp_rate_base2006 の値が「4」の場合は、測定対象システムがリファレンスシステムの約 4/[ベー
スコピー数]倍の速さでこのベンチマークを実行したことを意味します。「ベースコピー数」とは、実行さ
れたベンチマークの並行インスタンスの数です。
弊社では、SPEC の公開用に、SPECcpu2006 のすべての測定値を提出しているわけではありません。その
ため、SPEC の Web サイトに公開されていない結果が一部あります。弊社では、すべての測定のログファ
イルをアーカイブしているので、測定の内容に関していつでも証明できます。
ベンチマーク結果
測定 1
2010 年 4 月から 9 月にかけて、Xeon 5500 および 5600 シリーズのプロセッサを使用して、PRIMERGY
RX200 S6 を測定しました。ベンチマークプログラムは、インテル C++/Fortran コンパイラー 11.1 でコン
パイルし、SUSE Linux Enterprise Server 11( 64 ビット)で実行しました。すべての結果は、
http://www.spec.org で公開されています。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 5/47 ページ
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECint_base2006
2 チップ
SPECint2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 20.8 22.4
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 22.0 23.9
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 23.0 25.1
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 21.2 22.7
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 26.1 28.2
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 29.6 31.9
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 30.7 33.2
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 32.0 34.5
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 37.8 40.8
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 40.1 43.5
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 30.6 33.2
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 34.3 36.9
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 35.4 38.3
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 36.7 39.6
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 38.9 41.9
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECint_rate_base2006 SPECint_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.0 73.0 40.2 79.2
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 71.2 139 76.2 148
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 74.1 144 79.2 154
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 70.0 135 75.7 146
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 94.5 181 101 193
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 107 209 114 223
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 112 218 118 232
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 116 225 123 239
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 137 268 145 284
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 145 284 153 300
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 144 275 154 295
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 165 322 176 344
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 170 331 181 354
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 174 338 185 362
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 182 353 194 379
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
6/47 ページ © Fujitsu Technology Solutions 2010-2011
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECfp_base2006
2 チップ
SPECfp2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 24.2 26.0
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 26.3 28.3
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 27.5 29.5
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 25.7 27.5
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 30.7 32.9
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 34.2 37.0
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 35.5 38.2
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 36.7 39.5
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 43.4 46.9
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 45.8 49.2
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 36.2 39.1
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 40.3 43.3
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 41.1 44.3
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 42.2 45.5
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 45.0 48.3
プロセッサ コア GHz L3 キャッ
シュ
QPI
スピード TDP
SPECfp_rate_base2006 SPECfp_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 37.4 72.6 38.7 75.1
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 60.5 117 62.3 120
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 62.2 120 64.1 123
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 63.1 116 65.3 120
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 72.9 133 75.9 139
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 83.9 162 87.3 168
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 87.0 167 90.2 174
Xeon E5640 4 2.67 12 MB 5.86 GT/s 80 W 88.8 171 92.2 177
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 105 205 109 212
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 110 214 114 222
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 107 198 110 205
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 119 232 123 241
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 122 237 126 245
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 123 240 128 249
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 128 246 132 255
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 7/47 ページ
測定 2
2010 年 12 月から 2011 年 3 月にかけて、Xeon 5600 シリーズのプロセッサを使用して、PRIMERGY
RX200 S6 を測定しました。2011 年 2 月 23 日、Xeon X5690 プロセッサ 2 基を搭載した PRIMERGY
RX200 S6 は、SPECint_rate_base2006 ベンチマークのインテルベースの 2 ソケットサーバカテゴリで第 1
位を獲得しました。1結果は次の 4 つの表に示すとおりです。ベンチマークプログラムは、インテル
C++/Fortran コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise Server 11 SP1(64 ビット)で実
行しました。次の表の太字の値は、http://www.spec.org で公開されています。「予測」という印付きの値は、
予測値です。
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECint_base2006
2 チップ
SPECint2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 22.7(予測) 23.7(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 19.3 20.0
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 24.0(予測) 25.3(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 25.1(予測) 26.6(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 25.6 26.7
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 26.8 28.1
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 23.1(予測) 24.0(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 28.5(予測) 30.2(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 32.4(予測) 34.2(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 33.6(予測) 35.6(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 35.0(予測) 37.0(予測)
Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 37.5 39.5
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 41.5(予測) 43.8(予測)
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 44.0(予測) 46.7(予測)
Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 45.0 47.6
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 33.5(予測) 35.6(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 33.7 35.7
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 34.9 37.1
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 37.7(予測) 39.6(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 38.9(予測) 41.1(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 40.3(予測) 42.5(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 41.8 43.9
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 42.9 45.2
Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 44.1 46.5
1 上記の競合他社製品との比較は、 2011 年 2 月 23 日現在のものです。また、この比較は、インテルベースの 2 ソ
ケットサーバにおける SPECint_rate_base2006 の結果に基づいています。最新の結果は、
http://www.spec.org/cpu2006/results を参照してください。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
8/47 ページ © Fujitsu Technology Solutions 2010-2011
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECint_rate_base2006 SPECint_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 39.1(予測) 76.7(予測) 41.9(予測) 82.9(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 61.2 118 65.0 125
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 75.3(予測) 146(予測) 79.5(予測) 155(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 78.4(予測) 151(予測) 82.6(予測) 161(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 79.8 154 84.4 163
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 83.5 161 88.6 170
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 74.3(予測) 143(予測) 79.4(予測) 153(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 100(予測) 192(予測) 106(予測) 203(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 113(予測) 222(予測) 119(予測) 234(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 118(予測) 231(予測) 123(予測) 243(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 123(予測) 239(予測) 129(予測) 251(予測)
Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 130 253 137 266
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 145(予測) 285(予測) 152(予測) 298(予測)
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 154(予測) 302(予測) 161(予測) 315(予測)
Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 157 308 165 324
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 153(予測) 292(予測) 162(予測) 310(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 153 294 163 314
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 159 304 169 324
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 177(予測) 347(予測) 188(予測) 369(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 183(予測) 357(予測) 194(予測) 380(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 187(予測) 364(予測) 198(予測) 388(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 191 372 203 397
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 196(予測) 380(予測) 208(予測) 406(予測)
Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 200 389 213 416
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 9/47 ページ
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECfp_base2006
2 チップ
SPECfp2006
2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 32.8(予測) 34.2(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 29.8 31.3
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 35.7(予測) 37.2(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 37.3(予測) 38.8(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 37.0 39.1
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 38.5 40.6
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 34.9(予測) 36.1(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 40.8(予測) 43.2(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 45.5(予測) 48.6(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 47.2(予測) 50.2(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 48.8(予測) 51.9(予測)
Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 51.2 54.1
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 58.6(予測) 62.8(予測)
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 61.9(予測) 65.9(予測)
Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 61.7 65.5
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 48.1(予測) 51.4(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 48.0 51.4
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 49.3 53.0
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 54.0(予測) 58.0(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 55.1(予測) 59.3(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 56.6(予測) 60.9(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 57.3 61.5
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 58.5 62.4
Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 60.3 64.3
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
10/47 ページ © Fujitsu Technology Solutions 2010-2011
プロセッサ コア GHz L3
キャッシュ
QPI
スピード TDP
SPECfp_rate_base2006 SPECfp_rate2006
1 チップ 2 チップ 1 チップ 2 チップ
Xeon E5503 2 2 4 MB 4.80 GT/s 80 W 40.0(予測) 75.5(予測) 41.3(予測) 79.9(予測)
Xeon E5603 4 1.60 4 MB 4.80 GT/s 80 W 58.6 107 60.6 113
Xeon E5506 4 2.13 4 MB 4.80 GT/s 80 W 64.6(予測) 122(予測) 66.6(予測) 128(予測)
Xeon E5507 4 2.27 4 MB 4.80 GT/s 80 W 66.3(予測) 124(予測) 68.4(予測) 131(予測)
Xeon E5606 4 2.13 8 MB 4.80 GT/s 80 W 70.9 127 73.5 133
Xeon E5607 4 2.27 8 MB 4.80 GT/s 80 W 73.0 131 75.6 138
Xeon L5609 4 1.87 12 MB 4.80 GT/s 40 W 67.3(予測) 125(予測) 68.9(予測) 128(予測)
Xeon L5630 4 2.13 12 MB 5.86 GT/s 40 W 79.5(予測) 146(予測) 81.9(予測) 151(予測)
Xeon E5620 4 2.40 12 MB 5.86 GT/s 80 W 90.4(予測) 173(予測) 93.0(予測) 179(予測)
Xeon E5630 4 2.53 12 MB 5.86 GT/s 80 W 93.0(予測) 180(予測) 95.5(予測) 186(予測)
Xeon E5640 4 2.66 12 MB 5.86 GT/s 80 W 94.9(予測) 182(予測) 97.6(予測) 188(予測)
Xeon X5647 4 2.93 12 MB 5.86 GT/s 130 W 98.8 189 102 195
Xeon X5667 4 3.07 12 MB 6.40 GT/s 95 W 112(予測) 215(予測) 115(予測) 222(予測)
Xeon X5677 4 3.47 12 MB 6.40 GT/s 130 W 117(予測) 225(予測) 120(予測) 233(予測)
Xeon X5687 4 3.60 12 MB 6.40 GT/s 130 W 119 230 122 237
Xeon L5640 6 2.27 12 MB 5.86 GT/s 60 W 114(予測) 208(予測) 116(予測) 215(予測)
Xeon E5645 6 2.40 12 MB 5.86 GT/s 80 W 114 211 117 216
Xeon E5649 6 2.53 12 MB 5.86 GT/s 80 W 116 215 119 220
Xeon X5650 6 2.67 12 MB 6.40 GT/s 95 W 127(予測) 244(予測) 130(予測) 253(予測)
Xeon X5660 6 2.80 12 MB 6.40 GT/s 95 W 130(予測) 249(予測) 133(予測) 257(予測)
Xeon X5670 6 2.93 12 MB 6.40 GT/s 95 W 131(予測) 252(予測) 135(予測) 261(予測)
Xeon X5675 6 3.06 12 MB 6.40 GT/s 95 W 134 259 137 266
Xeon X5680 6 3.33 12 MB 6.40 GT/s 130 W 136(予測) 262(予測) 139(予測) 269(予測)
Xeon X5690 6 3.46 12 MB 6.40 GT/s 130 W 138 266 141 273
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 11/47 ページ
整数演算テストセットおよび浮動小数点演算テストセットの両方で、2 プロセッサのスループットは 1 プロ
セッサの約 2 倍です。
SPECfp_rate_base2006
SPECfp_rate2006
0
50
100
150
200
250
300
1 x Xeon X5690 2 x Xeon X5690
138
266
141
273
SPECint_rate_base2006
SPECint_rate2006
0
50
100
150
200
250
300
350
400
450
1 x Xeon X5690 2 x Xeon X5690
200
389
213
416
SPECcpu2006:整数演算性能
PRIMERGY RX200 S6(2 ソケットと 1 ソケットの比較)
SPECcpu2006:浮動小数点演算性能
PRIMERGY RX200 S6(2 ソケットと 1 ソケットの比較)
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
12/47 ページ © Fujitsu Technology Solutions 2010-2011
次のグラフは、PRIMERGY RX200 S6 とその旧モデルである PRIMERGY RX200 S5 のスループットを比較
したものです。それぞれ最大のパフォーマンス構成になっています。
SPECint_rate_base2006
SPECint_rate2006
0
50
100
150
200
250
300
350
400
450
PRIMERGY RX200 S52 x Xeon X5570
PRIMERGY RX200 S62 x Xeon X5690
252
389266
416
SPECint_base2006
SPECint2006
0
5
10
15
20
25
30
35
40
45
50
PRIMERGY RX200 S52 x Xeon X5570
PRIMERGY RX200 S62 x Xeon X5687
31.8
45.0
35.3
47.6
SPECcpu2006:整数演算性能
PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較
SPECcpu2006:整数演算性能
PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 13/47 ページ
SPECfp_rate_base2006
SPECfp_rate2006
0
50
100
150
200
250
300
PRIMERGY RX200 S52 x Xeon X5570
PRIMERGY RX200 S62 x Xeon X5690
193
266199
273
SPECfp_base2006
SPECfp2006
0
10
20
30
40
50
60
70
PRIMERGY RX200 S52 x Xeon X5570
PRIMERGY RX200 S62 x Xeon X5687
37.4
61.740.1
65.5
SPECcpu2006:浮動小数点演算性能
PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較
SPECcpu2006:浮動小数点演算性能
PRIMERGY RX200 S6 と PRIMERGY RX200 S5 の比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
14/47 ページ © Fujitsu Technology Solutions 2010-2011
ベンチマーク環境
測定 1
SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY RX200 S6
CPU Xeon E5503、E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677、L5640、
X5650、X5660、X5670、X5680
CPU 数
1 チップ:
Xeon E5503: 2 コア
Xeon E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677: 4 コア
その他すべて: 6 コア
2 チップ:
Xeon E5503: 4 コア
Xeon E5506、E5507、L5609、L5630、E5620、E5630、E5640、X5667、X5677: 8 コア
その他すべて: 12 コア
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ Xeon E5503、E5506、E5507: 4 MB(命令 + データ)オンチップ(チップあたり)
その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり)
ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11(64 ビット)
コンパイラー インテル C++/Fortran コンパイラー 11.1
測定 2
SPECcpu2006 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY RX200 S6
CPU Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5675、X5687、X5690
CPU 数
1 チップ:
Xeon E5603、E5606、E5607、X5647、X5687: 4 コア
その他すべて: 6 コア
2 チップ:
Xeon E5603、E5606、E5607、X5647、X5687: 8 コア
その他すべて: 12 コア
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ Xeon E5603、E5606、E5607: 8 MB(命令 + データ)オンチップ(チップあたり)
その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり)
ソフトウェア
オペレーティングシステム SUSE Linux Enterprise Server 11 SP1(64 ビット)
コンパイラー インテル C++/Fortran コンパイラー 12.0
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 15/47 ページ
SPECjbb2005
ベンチマークの説明
SPECjbb2005 は、Java サーバプラットフォームのパフォーマンスを評価する Java ビジネスベンチマーク
です。これは、本質的には SPECjbb2000 をアップデートしたものです。主な違いは次のとおりです。
トランザクションは、多様な機能範囲に対応するために、より複雑になっています。
ベンチマークのワーキングセットは、システムの負荷の増大に対応するために、拡大されています。
SPECjbb2000 では、アクティブな Java 仮想マシンインスタンスは 1 つのみ許可されていましたが、
SPECjbb2005 では複数のインスタンスが許可され、特に大規模なシステムで実環境との高い近似性
を得ることができます。
SPECjbb2005 は、ソフトウェアについては主にジャストインタイムコンパイラーで使用される JVM と、ス
レッドおよびガーベージコレクションの実装のパフォーマンスを測定します。使用されるオペレーティング
システムの機能も評価します。ハードウェアについては、CPU およびキャッシュの効率、メモリサブシス
テム、共有メモリシステム(SMP)のスケーラビリティを評価します。ディスクおよびネットワーク I/O は
無関係です。
SPECjbb2005 は、最近の代表的なビジネスプロセスアプリケーションである 3 階層クライアント/サーバ
システムをエミュレートしたもので、中間層システムに重点を置いています。
クライアントは、TPC-C ベンチマークを基にしたドライバスレッドを負荷として生成し、データ
ベースへの OLTP アクセスを思考時間ゼロで行います。
中間層システムは、ビジネスプロセスおよびデータベースの更新を実装します。
データベースはデータ管理を行い、メモリ内の Java オブジェクトによりエミュレートされます。
トランザクションのログ記録は XML ベースで実装されます。
このベンチマークの主な利点は、シングルホスト上で 3 つの層すべてを実行できることです。中間層のパ
フォーマンスが測定されます。このため、大規模なハードウェアの設置は不要となり、異なるシステムの
SPECjbb2005 の結果を直接比較できます。クライアントとデータベースのエミュレーションも Java で記
述されています。
SPECjbb2005 には、オペレーティングシステムと J2SE 5.0 機能に対応した Java 仮想マシンのみが必要で
す。
スケーリングの単位は、約 25 MB の Java オブジェクトから成るウェアハウスです。1 つのウェアハウスに
つき、1 つの Java スレッドがオペレーションを実行します。これらのビジネスオペレーションは TPC-C で
次の項目を前提としています。
新規オーダーエントリー
支払
オーダーステータスの照会
納入
在庫レベル監視
顧客レポート
ただし、これらは SPECjbb2005 と TPC-C が共通して持っている機能にすぎません。2 つのベンチマーク
の結果は比較できません。
SPECjbb2005 には、次の 2 つの性能指標があります。
bops(1 秒あたりのビジネスオペレーション)は、1 秒あたりのすべてのビジネスオペレーション
の処理レートです。
bops/JVM は、上記の性能指標(bops)とアクティブな JVM インスタンス数の比率です。
SPECjbb2005 のさまざまな結果の比較では、両方の性能指標を考慮する必要があります。
これらの性能指標の測定は、次のようなベンチマークのルールに準拠しています。
ベンチマーク測定は、ウェアハウス数(スレッド数)が増加する一連の測定ポイントで構成され、それぞれ
においてウェアハウス数は 1 つずつ増加します。測定は 1 ウェアハウスで開始され、2*MaxWh(尐なくと
も 8 ウェアハウス)まで実行されます。MaxWh は、ベンチマークで予想される秒あたりの処理レートが最
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
16/47 ページ © Fujitsu Technology Solutions 2010-2011
高になるウェアハウス数です。デフォルトでは、MaxWh はオペレーティングシステムで認識される CPU
の数と同じ値が設定されます。
性能指標の bops は、MaxWh ウェアハウスと 2*MaxWh ウェアハウス間のすべての測定ポイントのオペ
レーション速度の算術平均です。
ベンチマーク結果
測定 1
2010 年 3 月、2 基の Xeon X5680 プロセッサおよび 48 GB の PC3-10600R DDR3-SDRAM メモリの構成で
PRIMERGY RX200 S6 を測定しました。測定には、Windows Server 2008 R2 Enterprise を使用しました。
IBM から提供されている J9 VM の 6 つのインスタンスを使用しました。
測定結果は次のとおりです。
SPECjbb2005 bops = 927067
SPECjbb2005 bops/JVM = 154511
測定 2
2010 年 11 月、2 基の Xeon X5690 プロセッサ構成で、PRIMERGY RX200 S6 を測定しました。その他の
構成は、2010 年 3 月の測定と同じです。
測定結果は次のとおりです。
SPECjbb2005 bops = 946596
SPECjbb2005 bops/JVM = 157766
0
200000
400000
600000
800000
1000000
1 2 3 4 5 6 7 8
warehouses
PRIMERGY RX200 S62 x Xeon X5690
PRIMERGY RX200 S62 x Xeon X5680
PRIMERGY RX200 S52 x Xeon X5570
568875
927067 946597
0
200000
400000
600000
800000
1000000
PRIMERGY RX200 S52 x Xeon X5570
PRIMERGY RX200 S62 x Xeon X5680
PRIMERGY RX200 S62 x Xeon X5690
SPECjbb2005 bops:
PRIMERGY RX200 S6 と旧モデルとの比較
SPECjbb2005 bops:
PRIMERGY RX200 S6 と旧モデルとの比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 17/47 ページ
ベンチマーク環境
SPECjbb2005 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いまし
た。
ハードウェア
モデル PRIMERGY RX200 S6
CPU Xeon X5680、X5690
CPU 数 2 チップ、12 コア(チップあたり 6 コア)
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり)
その他のキャッシュ 12 MB(命令 + データ)オンチップ(チップあたり)
メモリ 4 GB PC3-10600R DDR3-SDRAM × 12 枚
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise
JVM バージョン IBM J9 VM (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwa6460sr6-20090923_42924 (JIT enabled, AOT enabled)
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
18/47 ページ © Fujitsu Technology Solutions 2010-2011
SPECpower_ssj2008
ベンチマークの説明
SPECpower_ssj2008 は、サーバクラスのコンピュータを対象とした、消費電力とパフォーマンスの特性を
評価する業界標準の SPEC ベンチマークです。SPEC は、SPECpower_ssj2008 をリリースし、パフォーマ
ンスの評価と同じ手法で、サーバの消費電力測定の標準を定義しました。
ベンチマークのワークロードは、典型的なサーバサイド Java ビジネスアプリケーションの負荷をシミュ
レートします。ワークロードはスケーラブルで、マルチスレッド化されており、さまざまなプラットフォー
ムで利用でき、簡単に実行できます。ベンチマークは、 CPU、キャッシュ、 SMP( symmetric
multiprocessor systems:対称型マルチプロセシングシステム)のメモリ階層とスケーラビリティに加え、
JVM(Java Virtual Machine:Java 仮想マシン)、JIT(Just In Time:ジャストインタイム)コンパイラー、
ガーベージコレクション、スレッドなどの実装や、オペレーティングシステムのいくつかの機能をテストし
ます。
SPECpower_ssj2008 では、100 %から「アクティブア
イドル」まで 10 %区切りで、さまざまなパフォーマン
スレベルにおける一定時間の消費電力をレポートします。
この段階的なワークロードは、サーバの処理負荷および
消費電力が、日や週によって大きく変化することを反映
しています。すべてのレベルにおける電力効率指標を計
算するには、各パフォーマンスレベル(セグメント)で
測定したトランザクションスループットを合計し、各セ
グメントの平均消費電力の合計で割ります。結果は、
overall ssj_ops/watt という性能指数です。この値から測
定対象サーバのエネルギー効率に関する情報が得られま
す 。 測 定 標 準 が 定 義 さ れ て い る こ と に よ り 、
SPECpower_ssj2008 で測定される値を他の設定やサー
バと比較することができます。ここで示すグラフは、
SPECpower_ssj2008 の標準的な結果のグラフです。
ベンチマークは、さまざまなオペレーティ
ングシステムおよびハードウェアアーキテ
クチャーで実行され、大がかりなクライア
ントやストレージインフラストラクチャー
を必要としません。SPEC に準拠したテス
トで必要な最低限の機材は、ネットワーク
で接続された 2 台のコンピュータと、電力
アナライザと温度センサーが 1 台ずつです。
コンピュータの 1 台は、SUT(System
Under Test:テスト対象システム)で、サ
ポート対象のオペレーティングシステムと
JVM が実行されます。JVM は、Java で実
装されている SPECpower_ssj2008 ワーク
ロードを実行するために必要な環境を提供
します。もう 1 台のコンピュータは、CCS
(Control & Collection System:収集および
制御システム)で、ベンチマークの動作を
制御し、レポートに使用する電力、パ
フォーマンス、および温度のデータを取得
します。この図は、ベンチマーク構成の基
本構造とさまざまなコンポーネントの概要を示しています。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 19/47 ページ
ベンチマーク結果
2010 年 11 月、2 基の Intel Xeon X5675 プロセッサおよび 12 GB の PC3L-10600E DDR3-SDRAM メモリ
の構成で PRIMERGY RX200 S6 を測定しました。測定には、Windows Server 2008 R2 Enterprise および
IBM J9 2.4 VM を使用しました。
Intel Xeon X5675 プロセッサを搭載した PRIMERGY RX200 S6 は、2,961 overall ssj_ops/watt の結果を
達成しました。
左のグラフは、PRIMERGY RX200
S6 の測定結果を示しています。赤い
横棒は、グラフの y 軸で示された各目
標負荷レベルに対する電力性能比(単
位:ssj_ops/watt、x 軸の上目盛)を
表しています。青い線は、小さなダイ
ヤで示された各目標負荷レベルにおけ
る平均消費電力(x 軸の下目盛)が描
く曲線を表しています。黒い縦線は、
PRIMERGY RX200 S6 の出したベン
チマーク結果である、2,961 overall
ssj_ops/watt を表しています。これは、
各測定におけるトランザクションス
ループットの合計を各測定での平均消
費電力の合計で割ったものです。
次の表は、各負荷レベルにおけるスループット(単位: ssj_ops)、平均消費電力(単位: W)、およびエ
ネルギー効率の詳細を表しています。
パフォーマンス 電力 エネルギー効率
目標負荷 ssj_ops 平均消費電力(W) ssj_ops/watt
100 % 932,989 239 3,904
90 % 837,478 218 3,842
80 % 746,900 197 3,786
70 % 651,878 179 3,640
60 % 558,298 165 3,388
50 % 467,230 153 3,059
40 % 371,128 142 2,618
30 % 276,339 131 2,103
20 % 187,218 122 1,538
10 % 94,027 109 859
アクティブアイドル 0 74.8 0
∑ssj_ops / ∑power = 2,961
サーバは、最大限のエネルギー効率を得られるようチューニングしました。メモリについては、最小の消費
電力で最高のパフォーマンスを得られるように、2 GB の LV-DIMM(Low Voltage DIMM:低電圧 DIMM)
計 6 枚を、利用可能な各メモリチャネルに 1 枚ずつ装着する構成としました。この構成では、1 つのメモリ
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
20/47 ページ © Fujitsu Technology Solutions 2010-2011
チャネルに 2 枚または 3 枚のメモリを装着した場合に比べ、消費電力を抑えることができ、さらに利用可
能なメモリ帯域幅を最大限に活用できます。ただし、ハードウェア構成で最も重要なことは、適切なプロ
セッサの選択です。プロセッサは、メモリサブシステムと並んで、サーバで最も電力を消費する部品だから
です。PRIMERGY RX200 S6 では、TDP(Thermal Design Power: 熱設計電力)95 W の 6 コア Xeon
X5675 プロセッサ搭載時に最高の値を記録しました。
次のグラフは、各負荷レベルでの消費電力(右の Y 軸)とスループット(左の Y 軸)について、
PRIMERGY RX200 S6 に Intel Xeon X5675 プロセッサを搭載した場合と Intel Xeon X5670 プロセッサを搭
載した場合(2010 年 3 月に測定済み)を比較したものです。
新しい Intel Xeon X5675 プロセッサは、同じ
95 W の TDP にもかかわらず、消費電力はや
や低いことがわかります。また、Xeon X5675
プロセッサは Xeon X5670 プロセッサと比較
してスループットが高くなっています。これ
はクロック周波数が高いためです。
この 2 つの要素によって、 PRIMERGY
RX200 S6 のエネルギー効率は全体で 3.9 %
向上しています。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 21/47 ページ
ベンチマーク環境
SPECpower_ssj2008 の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で、
Yokogawa WT210 電力アナライザを使用して行いました。
ハードウェア
モデル PRIMERGY RX200 S6
プロセッサ
(TDP) Xeon X5675(95 W)
CPU 数 6 コアプロセッサ × 2 基(コアあたり 2 スレッド)
1 次キャッシュ 32 KB(命令) + 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB(命令 + データ)オンチップ(コアあたり)
3 次キャッシュ 12 MB(命令 + データ)オンチップ(チップあたり)
メモリ 2 GB PC3L-10600E DDR3-SDRAM × 6 枚
ネットワーク
インターフェース 1 Gbit LAN Intel 82575EB ギガビットネットワーク接続(オンボード)× 2 基
ディスク
サブシステム
内蔵 SATA コントローラー × 1 基
2.5 インチ SATA SSD × 1 台、32 GB、JBOD
電源ユニット 450 W Fujitsu Technology Solutions S26113-F570-E1 × 1 基
ソフトウェア
オペレーティング
システム Windows Server 2008 R2 Enterprise
JVM バージョン IBM J9 VM (build 2.4, JRE 1.6.0 IBM J9 2.4 Windows Server 2008 amd64-64 jvmwa6460sr6-20090923_42924 (JIT enabled, AOT enabled)
JVM アフィニティ start /affinity [0xF,0xF0,0xF00,0xF000,0xF0000,0xF00000]
JVM オプション -Xaggressive -Xcompressedrefs -Xgcpolicy:gencon -Xmn1300m -Xms1500m -Xmx1500m -XlockReservation -Xnoloa -XtlhPrefetch -Xlp
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
22/47 ページ © Fujitsu Technology Solutions 2010-2011
OLTP-2
ベンチマークの説明
OLTP とは、Online Transaction Processing(オンライントランザクション処理)の略です。OLTP-2 ベン
チマークは、データベースソリューションの標準的なアプリケーションシナリオを基にしています。OLTP-
2 では、データベースアクセスがシミュレートされ、1 秒あたりに実行されるトランザクションの数(tps)
が測定されます。
独立した機関によって標準化され、その規則を順守して測定しているかを監視される SPECint や TPC-E の
ようなベンチマークとは異なり、OLTP-2 は、富士通が開発した固有のベンチマークです。OLTP-2 は、
データベースのベンチマークとしてよく知られている TPC-E を基に開発されました。そして、CPU やメモ
リの構成に応じてシステムがスケーラブルな性能を示すことを実証するために、さまざまな構成で測定でき
るように設計されています。
OLTP-2 と TPC-E の 2 つのベンチマークが同じ負荷プロファイルを使用して同様のアプリケーションのシ
ナリオをシミュレートしても、この 2 つのベンチマークは異なる方法でユーザーの負荷をシミュレートする
ため、結果を比較したり同等のものとして扱うことはできません。通常、OLTP-2 の値は、TPC-E に近い値
となります。しかし、価格性能比が算出されないため、直接比較できないだけでなく、OLTP-2 の結果を
TPC-E として利用することも許可されません。
詳細情報は、『ベンチマークの概要 OLTP-2』を参照してください。
ベンチマーク結果
PRIMERGY RX300 S6 の OLTP-2 の値は、Xeon 55xx および 56xx プロセッサシリーズを使用して、48 GB、
72 GB、96 GB、144 GB、および 192 GB のメモリ構成で測定しました。
次の表は、測定対象のプロセッサの仕様を示しています。
プロセッサ コア数/
チップ L3 キャッシュ
プロセッサ
周波数
QPI
スピード HT TM TDP
55
00
E5503 2 4 MB 2.00 GHz 4.8 GT/s - - 80 W
E5506 4 4 MB 2.13 GHz 4.8 GT/s - - 80 W
E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W
56
00
シリ
ーズ
4 コ
ア E5603 4 4 MB 1.60 GHz 4.8 GT/s - - 80 W
E5606 4 8 MB 2.13 GHz 4.8 GT/s - - 80 W
E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W
L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W
4 コ
ア、
HT、
TM
L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W
E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W
E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W
E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W
X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W
X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W
X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W
X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W
X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W
6 コ
ア、
HT、
TM
L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W
E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W
E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W
X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W
X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W
X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W
X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W
X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W
X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W
QPI=Quick Path インターコネクト、GT=ギガトランスファー、HT=ハイパースレッディング、TM=ターボモード、TDP=熱設計電力
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 23/47 ページ
データベースのパフォーマンスは、CPU やメモリの構成と、データベースで使用するディスクサブシステ
ムの接続性によって、大きく異なります。Xeon 55xx および 56xx プロセッサシリーズは、次のようなさま
ざまなシステム構成に対応しています。
プロセッサ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
55
00
E5503
E5506
E5507
56
00
シリ
ーズ
4 コ
ア E5603
E5606
E5607
L5609
4 コ
ア、
HT、
TM
L5630
E5620
E5630
E5640
X5647
X5667
X5672
X5677
X5687
6 コ
ア、
HT、
TM
L5640
E5645
E5649
X5650
X5660
X5670
X5675
X5680
X5690
最大 メモリ TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
CPU × 1 48 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 96 GB 144 GB
*)
CPU × 2 96 GB 192 GB 192 GB 192 GB 192 GB 144 GB 192 GB 192 GB 288 GB
*)
*) 16 GB デュアルランクメモリモジュールの特別リリース
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
24/47 ページ © Fujitsu Technology Solutions 2010-2011
次に示す CPU およびメモリの性能評価では、ディスクサブシステムは適切であり、ボトルネックにならな
いものとします。
PRIMERGY RX300 S6 の OLTP-2 の値は、オペレーティングシステム Microsoft Windows Server 2008 R2
Enterprise とデータベース SQL Server 2008 R2 Enterprise x64 Edition で測定したものです。システム構成
の詳細については、「ベンチマーク環境」を参照してください。
データベース環境でメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモ
リ容量が十分にあることが重要です。そのため、16 GB モジュールの最大構成、8 GB モジュールの最大構
成、および 8 GB モジュールの別構成で測定しました。周波数は、プロセッサと、メモリモジュールの種類
および数によって変わります。メモリパフォーマンスの詳細については、ホワイトペーパー『Xeon 5600
(Westmere-EP)搭載システムのメモリパフォーマンス』を参照してください。
次のグラフは、Intel Xeon 5600 および 5500 シリーズのプロセッサ(1 基または 2 基)と、さまざまなメモ
リ構成で測定した OLTP-2 トランザクションレートを示しています。
多種類のプロセッサにより、広範にわたるレベルのパフォーマンスが実現されていることがわかります。同
じ最大メモリ構成で比較すると、パフォーマンスが最も低いプロセッサ(Xeon E5503)を使用した場合に
比べ、パフォーマンスが最も高いプロセッサ(Xeon X5690)を使用した場合は、OLTP-2 値は 5.4 倍に
なっています。
測定結果が示す性能に基づき、プロセッサをいくつかのグループに分類できます。
最もパフォーマンスが低いのは、わずか 2 コアのプロセッサである Xeon E5503 です。
その次のグループのプロセッサは、OLTP-2 でほぼ 2 倍のパフォーマンスを達成しています。ハイパース
レッディングをサポートしていない 4 コアプロセッサ(Xeon E5506、Xeon E5507、Xeon E5603、Xeon
E5606、Xeon E5607 および Xeon L5609)が、このグループです。OLTP-2 の測定では、コア数を 2 倍に
すると、パフォーマンスもほぼ 2 倍になります。
ハイパースレッディングとターボモードの両方をサポートする 4 コアプロセッサでは、さらに高いパフォー
マンスが得られます。Xeon L5630、Xeon E5620、Xeon E5630、Xeon E5640 および Xeon X5647 がこの
グループです。このグループでは、ハイパースレッディングによって論理的なプロセッサコア数が 2 倍にな
るため、OLTP-2 の測定では特に優れた結果が得られます。Xeon X5667、Xeon X5672、Xeon X5677、
Xeon X5687 は、同じくハイパースレッディングとターボモードをサポートする 4 コアプロセッサですが、
高レベルのターボモードを利用可能で、QPI スピードも 5.86 GT/s よりさらに高速の 6.4 GT/s です。これ
により、このグループの 4 コアプロセッサは、下位の 6 コアプロセッサであるクロック周波数、ターボ
モードレベル、QPI スピードが低いモデル(Xeon E5645、および Xeon E5649)に近いスループットを達
成できます。
最高のパフォーマンスを発揮するのは、QPI スピード 6.4 GT/s を実現する 6 コアプロセッサ Xeon X5650、
Xeon X5660、Xeon X5670、Xeon X5675、Xeon X5680 および Xeon X5690 のグループです。このグルー
プでは、2 基の CPU を使用した OLTP-2 の測定のほとんどで、96 GB(8 GB DIMM × 12)で周波数
1333 MHz のメモリ構成の方が、144 GB(8 GB DIMM × 18)で周波数 800 MHz のメモリ構成より優れた
結果が得られました。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 25/47 ページ
0 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300
E5503-2Core
E5506-4Core
E5507-4Core
E5603-4Core
E5606-4Core
E5607-4Core
L5609-4Core
L5630-4Core
E5620-4Core
E5630-4Core
E5640-4Core
X5647-4Core
X5667-4Core
X5672-4Core
X5677-4Core
X5687-4Core
L5640-6Core
E5645-6Core
E5649-6Core
X5650-6Core
X5660-6Core
X5670-6Core
X5675-6Core
X5680-6Core
X5690-6Core
OLTP-2 tps2CPUs-192GB 2CPUs-144GB 2CPUs-96GB 1CPU-96GB 1CPU-72GB 1CPU-48GB
tps
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
26/47 ページ © Fujitsu Technology Solutions 2010-2011
PRIMERGY 現行モデルでの OLTP-2 の最高値は、旧モデルの最高値と比較して約 50 %向上しています。
0
100
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
+ ~ 50%
tps
現行モデル TX200 S6 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
旧モデル TX200 S5 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - -
2 × X5570
96 GB RAM
2 × W5590
96 GB RAM
2 × X5670
96 GB RAM
2 × X5690
96 GB RAM
現行モデル 旧モデル
OLTP-2 tps の最高値
システム世代間の比較
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 27/47 ページ
ベンチマーク環境
一般的な測定環境を以下に示します。
Intel Xeon 55xx および 56xx プロセッサシリーズの OLTP-2 のすべての値は、PRIMERGY RX300 S6 を使
用して測定しました。
データベースサーバ(B 層)
ハードウェア
システム PRIMERGY RX300 S6
プロセッサ Xeon E5503(2 コア、2.00 GHz)× 2 基
Xeon E5506(4 コア、2.13 GHz)× 2 基
Xeon E5507(4 コア、2.27 GHz)× 2 基
Xeon E5603(4 コア、1.60 GHz)× 2 基
Xeon E5606(4 コア、2.13 GHz)× 2 基
Xeon E5607(4 コア、2.27 GHz)× 2 基
Xeon L5609(4 コア、1.87 GHz)× 2 基
Xeon L5630(4 コア、2.13 GHz)× 2 基
Xeon E5620(4 コア、2.40 GHz)× 2 基
Xeon E5630(4 コア、2.53 GHz)× 2 基
Xeon E5640(4 コア、2.67 GHz)× 2 基
Xeon X5647(4 コア、2.93 GHz)× 2 基
Xeon X5667(4 コア、3.07 GHz)× 2 基
Xeon X5672(4 コア、3.20 GHz)× 2 基
Xeon X5677(4 コア、3.46 GHz)× 2 基
Xeon X5687(4 コア、3.60 GHz)× 2 基
Xeon L5640(6 コア、2.27 GHz)× 2 基
Xeon E5645(6 コア、2.40 GHz)× 2 基
Xeon E5649(6 コア、2.53 GHz)× 2 基
Xeon X5650(6 コア、2.67 GHz)× 2 基
Xeon X5660(6 コア、2.80 GHz)× 2 基
Xeon X5670(6 コア、2.93 GHz)× 2 基
Xeon X5675(6 コア、3.06 GHz)× 2 基
Xeon X5680(6 コア、3.33 GHz)× 2 基
Xeon X5690(6 コア、3.46 GHz)× 2 基
メモリ 48 GB~192 GB、 1333 MHz Registered ECC DDR3(8 GB DIMM)、または
1066 MHz Registered ECC DDR3(16 GB DIMM)
設定(デフォルト) ターボモード有効、NUMA サポート有効、ハイパースレッディング有効
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基
ディスクサブシステム RX300 S6: オンボード RAID コントローラー SAS 6G 5/6 512 MB
73 GB 15k rpm SAS ドライブ × 2 台、RAID1(OS)、
147 GB 15k rpm SAS ドライ ブ × 6 台、RAID10(ログ)
LSI MegaRAID SAS 9280-8e × 5 基
JX40 × 5 台:各 64 GB SSD ドライブ × 24 台、RAID5(データ)
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Enterprise
データベース SQL Server 2008 R2 Enterprise x64
アプリケーション
サーバ
A 層
B 層
ネットワーク
ネットワーク
クライアント
データベースサーバ
ストレージサブシステム
SUT(System Under Test:テスト対象システム)
ドライバ
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
28/47 ページ © Fujitsu Technology Solutions 2010-2011
アプリケーションサーバ(A 層)
ハードウェア
システム PRIMERGY RX200 S6
プロセッサ Xeon E5640 (6 コア、2.66 GHz)× 1 基
メモリ 12 GB、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基、デュアルポート LAN 1 Gbps × 2 基
ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard
クライアント
ハードウェア
システム PRIMERGY RX200 S5
プロセッサ Xeon X5570(4 コア、2.93 GHz)× 2 基
メモリ 24 GB、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
オンボード LAN 1 Gbps × 2 基
ディスクサブシステム 73 GB 15k rpm SAS ドライブ × 1 台
ソフトウェア
オペレーティングシステム Windows Server 2008 R2 Standard
OLTP-2 ソフトウェア EGen バージョン 1.12.0
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 29/47 ページ
vServCon
ベンチマークの説明
vServCon は、富士通テクノロジー・ソリューションズが、ハイパーバイザーを使用するサーバ構成につい
て、サーバ統合の適合性の比較に使用するベンチマークです。これにより、システム、プロセッサ、および
I/O テクノロジーの比較に加え、ハイパーバイザー、仮想化形式、および仮想マシン用の追加ドライバの比
較も可能になります。
vServCon は、厳密に言えば新しいベンチマークではありません。これは、言うなればフレームワークであ
り、すでに確立されたベンチマークをワークロードとして集約し、統合され仮想化されたサーバ環境の負荷
を再現します。データベース、アプリケーションサーバ、Web サーバというアプリケーションシナリオを
対象とする 3 つの実証済みのベンチマークが使用されます。
3 つのアプリケーションシナリオのそれぞれが、1 つの専用の仮想マシン(VM)に割り当てられます。これ
らに加えてアイドル VM という 4 番目の仮想マシンが追加されます。これら 4 つの VM が 1 つの「タイル」
を構成します。最大の性能値を引き出すためには、測定対象となるサーバの処理能力に応じて、いくつかの
タイルを並行して開始しなければならない場合もあります。
3 つの vServCon アプリケーションシナリオのそれぞれが、各 VM のアプリケーション固有のトランザク
ションレートという形でベンチマーク結果を提供します。スコアを正規化するために、1 つのタイルのそれ
ぞれのベンチマーク結果とリファレンスシステムの結果との比を求めます。その相対性能値に適切な重み付
けを行い、すべての VM とすべてのタイルについて加算します。最終的な計算結果が、このタイル数に対す
るスコアになります。
原則として、1 つのタイルから始めて、vServCon スコアの大幅な増加が見られなくなるまで、タイル数を
増やしながらこの手順が実行されます。最終的な vServCon スコアは、すべてのタイル数から得られた
vServCon スコアの最大値です。したがって、このスコアは、CPU リソースを最大限まで使用する構成で達
成される最大スループットを反映しています。このため、vServCon の測定環境は、CPU のみが制限要因と
なるように設計されており、他のリソースによる制限は発生しないように設計されています。
タイル数の増加に対する vServCon スコアの伸びは、テスト対象システムのスケーリング特性を知るための
有益な情報となります。
さらに、vServCon では、ホストの合計 CPU 負荷(VM および他のすべての CPU 処理)を記録し、可能な
場合は消費電力も記録します。
vServCon の詳細については、『ベンチマークの概要 vServCon』を参照してください。
アプリケーションシナリオ ベンチマーク 論理 CPU コアの数 メモリ
データベース Sysbench(補正済み) 2 1.5 GB
Java アプリケーションサーバ SPECjbb(補正済み、50~60 %の負荷) 2 2 GB
Web サーバ WebBench 1 1.5 GB
テスト対象システム
… …
タイル n
タイル 3
タイル 2
タイル 1
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
データベース
VM Web VM
アイドル
VM Java VM
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
30/47 ページ © Fujitsu Technology Solutions 2010-2011
ベンチマーク結果
PRIMERGY の 2 ソケットモデル現行世代は、Intel Xeon シリーズ 5600(または 5500)プロセッサをベー
スにしています。
次のようなさまざまなシステム構成に対応しています。
プロセッサ TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
5500 E5507
56
00
シリ
ーズ
4 コ
ア
E5607
L5609
4 コ
ア、
HT、
TM
L5630
E5620
E5630
E5640
X5647
X5667
X5672
X5677
X5687
6 コ
ア、
HT、
TM
L5640
E5645
E5649
X5650
X5660
X5670
X5675
X5680
X5690
HT = ハイパースレッディング、TM = ターボモード
PRIMERGY の 2 ソケットモデル現行世代は、プロセッサテクノロジーの進歩により、アプリケーションの
仮想化に最適なシステムとなっています。6 コアプロセッサにも対応しているため、前世代のプロセッサを
ベースとするシステムと比較して、仮想化性能が約 50 %向上しています(vServCon スコアで測定)。6 コ
アプロセッサを 2 基搭載したシステムで、前述の vServCon プロファイルを基にして 27 のアプリケーショ
ン VM(9 つのタイルに相当)を使用した場合、CPU リソースの最大活用をほぼ実現できます。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 31/47 ページ
次のグラフは、各プロセッサで達成可能な仮想化性能値を比較したものです。発売済みの 4 コアまたは 6
コアのプロセッサを対象に幅広く測定しました。
このグラフに示されているプロセッサ間の大きな性能差は、その機能が影響していると考えられます。グラ
フの左側のグループのプロセッサは、エントリーモデルです。グラフ中央のグループのプロセッサは、ハイ
パースレッディングとターボモードに対応しているため、パフォーマンスが大幅に向上していることがわか
ります。
グラフの中央と右側のグループのプロセッサでは、それぞれのプロセッサのメモリクロック周波数が徐々に
上がっています。このとき、パフォーマンスは、プロセッサのメモリクロック周波数とプロセッサ間のデー
タ転送速度(「QPI スピード」)の組み合わせで決まります。
グラフの右側のグループは、6 コアプロセッサで構成されています。6 コアプロセッサの場合、同機能の 4
コアプロセッサと比較すると、期待どおりにパフォーマンスが約 50 %向上しています。グラフの右側のグ
ループでは、E5649 から X5650 への大幅な向上が特に目立っています。X5650 以降は、最高の QPI スピー
ドと強力なターボモードを備えたアドバンストプロセッサというカテゴリであるためです。
メモリパフォーマンスと QPI アーキテクチャーの詳細については、ホワイトペーパー『Xeon 5600
(Westmere-EP)搭載システムのメモリパフォーマンス』を参照してください。
仮想化環境のメインメモリを選択するときのガイドラインとして、メモリアクセス速度よりも、メモリ容量
が十分にあることが重要です。
各プロセッサの製品データについて再度簡潔にまとめ、次の表に示します。
E5507
L5609
E5607
L5630
E5620
E5630
E5640
X5647
X5667
X5672
X5677
X5687
L5640
E5645
E5649
X5650
X5660
X5670
X5675
X5680
X5690
4 4 4 6 6 6 6 6 7 7 7 7 9 9 9 9 9 9 9 9 9
0
1
2
3
4
5
6
7
8
9
10
Fin
al v
Serv
Co
n S
co
re
#Tiles
4 Cores / 4 Threads 6 Cores / 12 Threads4 Cores / 8 Threads
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
32/47 ページ © Fujitsu Technology Solutions 2010-2011
プロセッサ コア数/
チップ
L3 キャッ
シュ
プロセッサ
周波数
QPI
スピード HT TM TDP タイル数 スコア
5500 E5507 4 4 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.02
56
00
シリ
ーズ
4 コ
ア
E5607 4 8 MB 2.27 GHz 4.8 GT/s - - 80 W 4 3.39
L5609 4 12 MB 1.87 GHz 4.8 GT/s - - 40 W 4 3.06
4 コ
ア、
HT、
TM
L5630 4 12 MB 2.13 GHz 5.86 GT/s 40 W 6 4.61
E5620 4 12 MB 2.40 GHz 5.86 GT/s 80 W 6 5.40
E5630 4 12 MB 2.53 GHz 5.86 GT/s 80 W 6 5.56
E5640 4 12 MB 2.67 GHz 5.86 GT/s 80 W 6 5.79
X5647 4 12 MB 2.93 GHz 5.86 GT/s 130 W 6 6.23
X5667 4 12 MB 3.07 GHz 6.4 GT/s 95 W 7 6.93
X5672 4 12 MB 3.20 GHz 6.4 GT/s 95 W 7 7.20
X5677 4 12 MB 3.46 GHz 6.4 GT/s 130 W 7 7.24
X5687 4 12 MB 3.60 GHz 6.4 GT/s 130 W 7 7.57
6 コ
ア、
HT、
TM
L5640 6 12 MB 2.27 GHz 5.86 GT/s 60 W 9 7.36
E5645 6 12 MB 2.40 GHz 5.86 GT/s 80 W 9 7.40
E5649 6 12 MB 2.53 GHz 5.86 GT/s 80 W 9 7.60
X5650 6 12 MB 2.67 GHz 6.4 GT/s 95 W 9 8.63
X5660 6 12 MB 2.80 GHz 6.4 GT/s 95 W 9 8.87
X5670 6 12 MB 2.93 GHz 6.4 GT/s 95 W 9 9.02
X5675 6 12 MB 3.06 GHz 6.4 GT/s 95 W 9 9.29
X5680 6 12 MB 3.33 GHz 6.4 GT/s 130 W 9 9.41
X5690 6 12 MB 3.46 GHz 6.4 GT/s 130 W 9 9.61
QPI = QuickPath インターコネクト、GT = ギガトランスファー、HT = ハイパースレッディング、
TM = ターボモード、TDP = 熱設計電力
次のグラフは、Xeon E5620(4 コア)プロセッサおよび E5649(6 コア)プロセッサを搭載した時の、VM
数の増加に対する仮想化性能を示しています。ホストのそれぞれの CPU 負荷も示されています。CPU 負荷
が 90 %のときが最適なタイル数で
す。90 %を超えると過負荷となり、
仮想化のパフォーマンスは停滞また
は低下します。
物理コア数の増加に加えて、ハイ
パースレッディング機能によって、
多数の VM の稼動が可能になります。
ハイパースレッディング機能では、
1 つの物理プロセッサコアが結果的
に 2 つの論理コアに分割されるた
め、ハイパーバイザーが利用できる
コア数は 2 倍になります。そのた
め、ハイパースレッディング機能は、
一般的にシステムの仮想化性能を向
上させます。
ハイパースレッディング機能を使用するシステムでは、前のグラフに示されているタイル数のスケーリング
曲線が明確に見られます。Xeon E5649 プロセッサには、12 個の物理コア、すなわち 24 個の論理コアがあ
り、1 つのタイルにつき 4 個程度の論理コアが使用されます(『ベンチマークの説明』を参照)。つまり、
ほぼ 3 タイルまでは、複数の VM が同じ物理コアを並行して使用することを回避できます。そのため、この
範囲ではほぼ理想的にパフォーマンスが上昇します。その後、CPU 使用率が限界に達するまでのパフォー
マンス曲線は、傾きが緩やかになっていきます。
2.1
8
3.8
4
4.4
7
5.0
1
5.3
0
5.4
0
2.1
2
4.2
3
5.6
9
6.3
7
7.0
8
7.3
4
7.4
5
7.5
5
7.6
0
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
E5620 E5649
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9
CP
U u
tilizati
on
vS
erv
Co
n S
co
re
# Tiles
vServCon Score (left axis) CPU utilization of host (right axis)
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 33/47 ページ
これまでは、システムの仮想化性能を全体的に分析してきました。ここからは、仮想化環境での個別アプリ
ケーション VM の観点でパフォーマンスについて説明します。ここでは例として、Xeon E5649 プロセッサ
のシステムを取り上げています。
システム総体としてのパフォーマンスを重視してアプリケーション VM の数を全体最適化(例として 6 タイ
ル)すると、部分最適化(例として 1 タイル)して負荷が尐ない状況に比べ、個別の VM のパフォーマンス
はかなり低くなります。次のグラフ(VM の数が増加したときの 3 種類の各アプリケーション VM のリファ
レンスシステムに対する相対的なパフォーマンス)により、この点を明らかにしています。各アプリケー
ション(Java、Web、DB)のグラフの最初の列には、1 つのタイルを構成する合計 3 つの VM がアプリ
ケーション別に 1 つずつ表示されています。2 番目の列には 2 つのタイルを構成する合計 6 つの VM がア
プリケーション別に 2 つずつ表示され、以降も同様に、タイルを構成する VM がアプリケーション別に表示
されています。各グラフから、個々のアプリケーション VM の値、およびアプリケーション種別ごとの合計
値が読み取れます。
仮想ホスト上の VM の数に関して、全体的なパフォーマンスよりも個別のアプリケーションのパフォーマン
ス要件を重視すべき場合もあります。
はじめに、完全に構成されたシステムの仮想化性能について見てきました。一方で、プロセッサを 1 基から
2 基に増やしたときに、どの程度パフォーマンスが向上するかという疑問もあります。パフォーマンスの向
上度が増せば、サーバ内のリソース共有によるオー
バーヘッドは減尐します。プロセッサ追加時の性能
向上度を示すスケーリング係数は、サーバの用途に
よって異なります。サーバ統合用の仮想化プラット
フォームとしてサーバを使用する場合、プロセッサ
の追加で性能は 1.95 倍になります。つまり、Xeon
E5649 のグラフに示したように、2 基のプロセッサ
を使用すると、1 基のプロセッサを使用した場合に比
べて、仮想化性能が約 2 倍になります。
0
1
2
3
4
5
6
7
8
9
10
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
Re
lative
pe
rfo
rma
nce
co
mp
are
d w
ith
Re
fSys
Relative performance of single VM for increasing tile count
9th VM 8th VM 7th VM 6th VM 5th VM 4th VM 3rd VM 2nd VM 1st VM
Web DBJava
#Tiles
0
1
2
3
4
5
6
7
8
9
1 × E5649 2 × E5649
× 1.95
vS
erv
Co
n S
co
re
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
34/47 ページ © Fujitsu Technology Solutions 2010-2011
2008 年以降のプロセッサテクノロジーにおける仮想化関連の進歩は、一方では個別の VM に影響し、他方
では CPU をフル活用したときの使用可能な最大 VM 数に影響しています。次のグラフでは、この 2 つの側
面における向上の度合いを比較しています。ここでは、2008 年の Xeon E5420 × 2 基のシステム、2009 年
の Xeon X5540 × 2 基のシステム、そして Xeon E5649 × 2 基の現行システムといった、ほぼ同じプロセッ
サ周波数を持つ 3 つのシステムを比較しています。
2011 TX300 S6 RX200 S6 RX300 S6 BX620 S6 BX920 S2 BX922 S2 BX924 S2
2009 TX300 S5 RX200 S5 RX300 S5 BX620 S5 BX920 S1 - -
2008 TX300 S4 RX200 S4 RX300 S4 BX620 S4 - - -
パフォーマンスの向上は、Xeon 5500 プロセッサ世代が登場した 2008 年から 2009 年にかけて最も顕著で
す(「拡張ページテーブル」(EPT)機能の実装などによる2)。VM の数が尐ないケース(1 タイル)では、
vServCon スコアが 1.30 倍に増加しています。
全体最適化した CPU フル稼動時のケースでは、vServCon スコアは、2.02 倍に増加しています。その理由
の 1 つは、個々の VM で実現できるパフォーマンスの向上です(グラフ左側の Few VMs のスコアを参照)。
もう 1 つの理由は、全体最適化された状態で実行可能な VM の数の向上です(ハイパースレッディング機能
の使用および物理コア数の増加による)。ただし、VM の数を増やすことで個々の VM のパフォーマンスは
低下しているため、全体としての性能向上は、VM の数が 3 倍になったことによってもたらされたものと言
えます。
2009 年から 2011 年にかけて、テクノロジーは、厳密にはどの点で進歩を遂げたのでしょうか。ここでは、
クロック周波数が同じで、キャッシュのサイズとメモリアクセス速度が異なるプロセッサを比較しています
が、低負荷状態における個々の VM のパフォーマンスについては、プロセッサによる違いはほとんどありま
せん。決定的に進歩を遂げた点は、物理コア数の増加と、それに関連した仮想化性能値の向上(グラフでは
1.47 倍)、および CPU 最大使用時における電力あたりの性能効率の向上です。ここで比較している 2009
年のプロセッサと 2011 年のプロセッサは、TDP(Thermal Design Power:熱設計電力)が 80 W で等しい
ため、CPU 最大使用時の消費電力はほぼ同じです。したがって、電力あたりの性能も約 1.47 倍に向上して
います。
仮想化パフォーマンスの増加は、個別の VM の性能向上によるものがすべてではありません。個別の VM の
性能向上だけでは、Xeon 5400 世代(2008 年)の同一クロックのプロセッサと比較して、30 %~50 %を
超えるスループットの増加は不可能です。2009 年以降の仮想化環境におけるパフォーマンス向上の大部分
は、利用可能な論理コアまたは物理コアが増加した結果として、実行できる VM 数が増大したことによって
達成されたものです。
2 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を高
速化します。
0
1
2
3
4
5
6
7
8
9
2008E5420
2.5 GHz4C
2009E5540
2.53 GHz4C
2011E5649
2.53 GHz6C
2008E5420
2.5 GHz4C
2009E5540
2.53 GHz4C
2011E5649
2.53 GHz6C
Overall OptimumFew VMs
×1.30
×2.02
vS
erv
Co
n S
co
re
×1.47
YearCPU
Frequency#Cores
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 35/47 ページ
ベンチマーク環境
測定は次のような環境で行いました。
Intel Xeon 55xx と 56xx プロセッサシリーズのすべての vServCon スコアは、PRIMERGY TX300 S6 を使用
して測定しました。
SUT ハードウェア
モデル PRIMERGY TX300 S6
プロセッサ 1 チップ: Xeon E5649(6 コア、2.53 GHz)
2 チップ: Xeon E5507(4 コア、2.27 GHz)
Xeon L5609(4 コア、1.87 GHz)
Xeon E5607(4 コア、2.27 GHz)
Xeon L5630(4 コア、2.13 GHz)
Xeon E5620(4 コア、2.40 GHz)
Xeon E5630(4 コア、2.53 GHz)
Xeon E5640(4 コア、2.67 GHz)
Xeon X5647(4 コア、2.93 GHz)
Xeon X5667(4 コア、3.07 GHz)
Xeon X5672(4 コア、3.20 GHz)
2 チップ: Xeon X5677(4 コア、3.47 GHz)
Xeon X5687(4 コア、3.60 GHz)
Xeon L5640(6 コア、2.27 GHz)
Xeon E5645(6 コア、2.40 GHz)
Xeon E5649(6 コア、2.53 GHz)
Xeon X5650(6 コア、2.67 GHz)
Xeon X5660(6 コア、2.80 GHz)
Xeon X5670(6 コア、2.93 GHz)
Xeon X5675(6 コア、3.07 GHz)
Xeon X5680(6 コア、3.33 GHz)
Xeon X5690(6 コア、3.46 GHz)
メモリ 96 GB(それぞれ PC3-10600R、8 GB、DIMM-1A~DIMM-1F および DIMM-2A~DIMM-2F に
搭載)
ネットワーク
インターフェース
1 Gbit LAN × 2 基:負荷用(2 基の LAN アダプター経由)× 1 基、制御用 × 1 基
ディスク
サブシステム
内蔵ハードディスクは使用せず、ストレージシステム FibreCAT CX500 のみを使用
VM の仮想ディスクファイル用のタイルあたり 1 つの 50 GB LUN
各 LUN は、5 つの Seagate ST373454 ディスク(15 krpm)で構成された RAID 0 アレイ
ストレージの接続 FC コントローラー Qlogic QLE 2462 を使用
SUT ソフトウェア
オペレーティング
システム
ハイパーバイザー VMware ESX Server
リリース バージョン 4.0 U1 ビルド 236512
BIOS バージョン 6.00 R1.08..2619.N1
隣接キャッシュラインプリフェッチ:無効、ハードウェアプリフェッチ:無効
DCU ストリーマープリフェッチ:無効、データ再利用の最適化:無効
複数の
1 Gb または 10 Gb
ネットワーク
負荷ジェネレーター
サーバ ストレージシステム
SUT(System Under Test:テスト対象システム)
フレームワーク
コントローラー
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
36/47 ページ © Fujitsu Technology Solutions 2010-2011
SUT:仮想化に関する詳細
ESX 設定 デフォルト
一般的な詳細 『ベンチマークの概要 vServCon』を参照
負荷ジェネレーターのハードウェア
モデル PRIMERGY BX920 S1 サーバブレード(PRIMERGY BX900 シャーシ)× 17 台
プロセッサ それぞれ Xeon X5570(2.93 GHz)× 2 基
メモリ 12 GB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 3 基
オペレーティング
システム
Windows Server 2008 R2 Enterprise with Hyper-V
負荷ジェネレーター VM(タイルあたり 3 つの負荷ジェネレーターを複数のサーバブレードで動作)
プロセッサ 論理 CPU × 1 基
メモリ 512 MB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 2 基
オペレーティング
システム
Windows Server 2003 Enterprise
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 37/47 ページ
VMmark V1
ベンチマークの説明
このセクションの内容は、VMmark ベンチマークバージョン 1.1.1(以降、「VMmark V1」)に基づいてい
ます。VMmark V1 は、ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比
較を行うために VMware が開発したベンチマークです。
ベンチマークは、負荷生成用のソフトウェアに加えて、定義済み負荷プロファイルおよび規定されたルール
で構成されます。長い間、VMmark V1 は、ベンダー間の比較が可能な唯一の確立された仮想化ベンチマー
クでした。VMmark V1 のベンチマーク結果は、VMware 社のレビュー後に VMware サイトで公開されてい
ました。現在では、VMmark V2 に置き換えられており、VMmark V1 は研究目的でのみ使用可能です。
VMmark V1 のようなベンチマークは、サーバ統合の観点から実際のデータセンターを模倣します。言い方
を変えると、実際にサーバ上で仮想化されているアプリケーションシナリオを考慮しなければなりません。
目標は、稼動率が低いサーバをできるだけ多く VM として集約することです。そのため、ベンチマークに
よって、さまざまなアプリケーション VM の全体的なスループットと、効率よく運用できる仮想マシンの個
数を評価することが必要になります。
これらの 2 つの目的のために次のようなソリューションコンセプトが確立されています。まず、アプリケー
ションシナリオの代表的なグループが選択されます。これらは、測定時に仮想ホスト上で同時に開始されま
す。各 VM には、適切な負荷ツールを使用して低い負荷がかけられるようになっています。このような VM
をグループ化したものを「タイル」と呼びます。
VMmark V1 のタイルは 6 つの VM で構成され、
そのうち 5 つは特定のアプリケーションシナリ
オに割り当てられます。これらの VM に加え、ス
タンバイサーバという 6 番目の VM が追加され
ます。VMmark V1 では、論理的なプロセッサ、
メモリ、ハードディスクスペースといった特定の
リソースが各 VM に強制的に割り当てられます。
右の表に、6 つの VM とそれらを測定するために
使用する負荷ツールを示します。
測定対象となるサーバの処理能力によっては、全体として最大のパフォーマンスを達成するために複数のタ
イルを並列して開始する必要があります。
5 つの VMmark V1 アプリケーションシナリオのそれぞれから VM ごとのベンチマーク結果が得られます。
これらの結果から単一のスコアを取得するために、すべての結果が適切に集約されます。結果は、あるタイ
ル数に対する VMmark V1 スコアで表し、「12.34@5 タイル」のように実際のスコアに加えてタイル数が示
されます。
VMmark V1 の詳細については、『ベンチマークの概要 VMmark V1』を参照してください。
アプリケーションシナリオ 負荷ツール
データベースサーバ Sysbench
ファイルサーバ Dbench(変更済み)
Java アプリケーションサーバ SPECjbb2005(変更済み)
メールサーバ Loadsim 2003
Web サーバ SPECweb2005(変更済み)
スタンバイサーバ -
テスト対象システム
タイル n
タイル 3
タイル 2
タイル 1
データ
ベース VM
Java VM
メール
VM
ファイル
サーバ VM
Web VM
スタンバイ
VM
データ
ベース VM
Java VM
メール
VM
ファイル
サーバ VM
Web VM
スタンバイ
VM
データ
ベース VM
Java VM
メール
VM
ファイル
サーバ VM
Web VM
スタンバイ
VM データ
ベース VM
Java VM
メール
VM
ファイル
サーバ VM
Web VM
スタンバイ
VM
… …
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
38/47 ページ © Fujitsu Technology Solutions 2010-2011
ベンチマーク結果
2010 年 8 月 10 日、富士通は、合計 12 プロセッサコアを搭載した PRIMERGY RX200 S6 と VMware ESX
4.0 Update 2 を使用して「35.09@27 タイル」の VMmark V1 スコアを達成しました。
このスコアおよび詳細な結果と構成データについては、
http://www.vmware.com/products/vmmark/v1/results.html を参照してください。
「35.09@27 タイル」というスコアを達成したことで、PRIMERGY RX200 S6 は、VMmark V1 の観点から
最も強力な 12 コアのラックサーバと評価され、VMmark V1 ランキングの 12 コアサーバのカテゴリでは 2
位(ベンチマーク結果の公表現在)になっています。
この記録を達成するために必要な主な条件は、プロセッサ(動作周波数が最適化された 6 コアプロセッサ
Xeon X5680)と、プロセッサの機能を最適に使用できるバージョンのハイパーバイザーです。プロセッサ
の機能には、拡張ページテーブル(EPT) 3 とハイパースレッディングが含まれます。これらはすべて、仮
想化に対して有効に機能します。
ベンチマークで定められた要件を満たすために、27 タイルの稼動時にはメモリを 192 GB(16 GB × 12 枚)
に拡張する必要があります。16 GB DIMM のメモリアーキテクチャーにより、速度は 800 MHz に低下しま
す。
すべての VM、それらのアプリケーションデータ、ホストオペレーティングシステム、および追加で必要な
データは、合計で 41 個の LUN を備えた ETERNUS DX80 システムの強力なファイバーチャネルディスク
サブシステムに格納しました。
使用したすべてのコンポーネントは、それぞれが最適に動作するように調整しました。
3 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を高
速化します。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 39/47 ページ
ベンチマーク環境
一般的な測定環境を次に示します。
SUT ハードウェア
モデル PRIMERGY RX200 S6
プロセッサ Xeon X5680(6 コア、3.33 GHz)× 2 基
メモリ 192 GB(16 GB DIMM × 12 枚)、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
内蔵 Intel 82575EB デュアルポート 1 GbE アダプター× 1 基
Intel 10 Gbit X520-DA2 デュアルポートサーバアダプター × 1 基
ディスクサブシステム 内蔵ハードディスクは使用しません。
ストレージシステム ETERNUS DX80 × 9 台、合計 196 台のハードディスクを搭載(複数
の RAID-0 アレイを構成)。
ストレージ接続 デュアルチャネル FC コントローラー Emulex LPe12002 × 1 基
SUT ソフトウェア
オペレーティングシステム ハイパーバイザー VMware ESX Server
ESX バージョン VMware ESX v4.0 Update 2、ビルド 261974
BIOS バージョン Rev R1.02.3031
負荷ジェネレーターのハードウェア
モデル サーバブレード PRIMERGY BX620 S4 × 27 基
プロセッサ Intel Xeon 5130(2 GHz)× 2 基
メモリ 3 GB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 1 基
オペレーティングシステム Microsoft Windows Server 2003 R2 Enterprise、SP2 および KB955839 を適用
詳細
公開 URL http://www.vmware.com/files/pdf/vmmark/VMmark-Fujitsu-2010-08-09-RX200S6.pdf
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
1 Gb または 10 Gb の
複数のネットワーク
プライムクライアントを
含む負荷ジェネレーター
サーバ ストレージシステム
SUT(System Under Test:テスト対象システム)
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
40/47 ページ © Fujitsu Technology Solutions 2010-2011
VMmark V2
ベンチマークの説明
VMmark V2 は、ハイパーバイザーを使用した仮想化ソリューションにおけるサーバ統合の適合性比較を行
うために VMware が開発したベンチマークです。ベンチマークは、負荷生成用のソフトウェアに加えて、
定義済み負荷プロファイルおよび規定されたルールで構成されます。VMmark V2 によって得られたベンチ
マーク結果は、VMware に提出しレビューを経た後に VMware のサイト上で公開されます。実績あるベンチ
マークである「VMmark V1」の使用は 2010 年 10 月に中止され、代わって後継の「VMmark V2」が使用さ
れるようになりました。VMmark V2 では、2 台以上のサーバのクラスタが必要であり、仮想マシン(VM)
のクローン作成とデプロイ、負荷分散、vMotion や Storage vMotion による VM の移動といった、データセ
ンター機能も評価できます。
VMmark V2 は、実際には新しいベンチマー
クではありません。VMmark V2 は、既存の
ベンチマークをワークロードとして統合す
るフレームワークで、これにより仮想化さ
れた統合サーバ環境の負荷をシミュレート
します。3 つの実績あるベンチマーク(それ
ぞれ、メールサーバ、Web 2.0、e コマース
のアプリケーションシナリオに対応)が、VMmark V2 に統合されています。
これらの 3 つのアプリケーションシナリオは、合計 7 つの仮想マシンに 1 つずつ割り当てられます。さら
に、スタンバイサーバという 8 番目の VM がこれらに追加されます。これらの 8 つの VM が「タイル」を
形成します。測定対象となるサーバの処理能力によっては、全体として最大のパフォーマンスを達成するた
めに複数のタイルを並列して開始する必要があります。
VMmark V2 の新機能に、ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントがありま
す。これにより、VM のクローン作成やデプロイ、vMotion、Storage vMotion によるデータセンター運用の
効率性が評価されます。このとき、DRS(Distributed Resource Scheduler)によるデータセンターの負荷
分散機能も使用されます。
VMmark V2 の結果は「スコア」と呼ばれる数値であり、テスト対象システムの仮想化パフォーマンスを表
します。スコアは、サーバ集約によるメリットの最大合計値で、さまざまなハードウェアプラットフォーム
の比較基準として使用されます。
このスコアは、VM の個々の結果とインフラストラクチャーコンポーネントの結果から導かれます。5 つの
VMmark V2 アプリケーション VM またはフロントエンド VM のそれぞれが、各 VM でのアプリケーション
固有のトランザクションレートという形でベンチマーク結果を示します。スコアを正規化するために、各タ
イルのベンチマーク結果とリファレンスシステムでの結果との比率を求め、得られた値の幾何平均を算出し
ます。さらに、すべての VM について、同じ手順で求めた値を加算します。この値は、総合スコアの 80 %
を決定します。また、ホスト 2 台ごとに 1 つ存在するインフラストラクチャーコンポーネントによるワー
クロードが、結果の 20 %を決定します。インフラストラクチャーコンポーネントのスコアは、1 時間あた
りのトランザクション数と、秒単位の平均持続時間で示されます。
実際にはスコアに加えて、タイル数が スコアと共に示されます。例えば「4.20@5 タイル」のように「スコ
ア@タイル数」と表します。
VMmark V2 の詳細については、『ベンチマークの概要 VMmark V2』を参照してください。
アプリケーションシナリオ 負荷ツール VM の数
メールサーバ LoadGen 1
Web 2.0 Olio クライアント 2
e コマース DVD Store 2 クライアント 4
スタンバイサーバ (IdleVMTest) 1
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 41/47 ページ
ベンチマーク結果
2011 年 1 月 19 日、富士通は、Xeon X5680 プロセッサを搭載した PRIMERGY RX200 S6 と VMware ESX
4.1 を使用して VMmark V2 スコアで「6.81@7 タイル」を達成しました。このときは、合計 2 × 12 のプロ
セッサコアを搭載するシステム構成で、「テスト対象システム」(SUT)には同一のサーバを 2 台使用しま
した。
2011 年 2 月 14 日には、PRIMERGY RX200 S6 を使用して VMmark V2 スコアで「7.02@7 タイル」を達
成し、さらに向上しました。このときも、合計 2 × 12 のプロセッサコアを搭載するシステム構成で、「テ
スト対象システム」(SUT)に 2 台のサーバを使用しましたが、搭載したプロセッサは Xeon X5690 でした。
このスコアおよび詳細な結果と構成データについては、http://www.vmware.com/a/vmmark/ を参照してくだ
さい。
上記の結果により、PRIMERGY RX200 S6 は、VMmark V2 の観点から、2 台の同一ホストによる「マッチ
ドペア」構成で最も強力なサーバと評価されると同時に、VMmark V2 のランキングで上位 2 つを占めてい
ます(ベンチマーク結果の公表日現在)。
こ の グ ラ フ は 、 PRIMERGY
RX200 S6 と競合他社の該当するシ
ステムの測定結果を比較4したもので
す。
同等のハードウェアでテストした
Cisco の結果と比較すると、Xeon
X5680 プロセッサを搭載した構成で
は、PRIMERGY RX200 S6 の方が
4.61 %上回っています。
使用したプロセッサ(最初は Xeon X5680、次に Xeon X5690)では、優れたハイパーバイザー設定によっ
てプロセッサの機能を最適に利用できます。そのため、これらのプロセッサの使用は、PRIMERGY
RX200 S6 がこの結果を達成するための重要な前提条件でした。プロセッサの機能には、拡張ページテーブ
ル(EPT 5 )とハイパースレッディングが含まれます。これらはすべて、仮想化に対して有効に機能します。
すべての VM、それらのアプリケーションデータ、ホストオペレーティングシステム、および追加で必要な
データは、ETERNUS DX80 システムの強力なファイバーチャネルディスクサブシステムに格納しました。
このディスクサブシステムは、ベンチマークの特定の要件を考慮して構成することもできます。2 番目の
VMmark V2 の公表結果では、Xeon X5690 のプロセッサ周波数が若干高いことに加えて、SSD(Solid State
Drive:半導体ドライブ)の使用によってハードディスクの数や応答時間が向上したことが、全体としてス
コアを多尐引き上げています。
負荷ジェネレーターのネットワーク接続とホスト間のインフラストラクチャー負荷接続は、10Gb LAN ポー
トで実装しました。
使用したすべてのコンポーネントは、それぞれが最適に動作するように調整しました。
4 上 記の競 合他社 製品との 比較は 、 2011 年 2 月 14 日現在 のもの です。 VMmark V2 の 結果は、
http://www.vmware.com/a/vmmark/ を参照してください。
5 EPT は、ホストとゲストのメモリアドレスのマッピングをハードウェアでサポートすることで、メモリの仮想化を
高速化します。
7.0
2@
7 tile
s
6.8
1@
7 tile
s
6.5
1@
6 tile
s
0
1
2
3
4
5
6
7
8
2 × FujitsuPRIMERGY RX200 S6
2 × Xeon X5690
2 × FujitsuPRIMERGY RX200 S6
2 × Xeon X5680
2 × CiscoUCS B200 M2
2 × Xeon X5680
2 ×12 Cores
VM
mark
V2 S
co
re
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
42/47 ページ © Fujitsu Technology Solutions 2010-2011
ベンチマーク環境
一般的な測定環境を次に示します。
SUT ハードウェア
サーバ数 2 台
モデル PRIMERGY RX200 S6
プロセッサ Xeon X5680(6 コア、3.33 GHz)× 2 基
Xeon X5690(6 コア、3.46 GHz)× 2 基
メモリ 96 GB(8 GB DIMM × 12 枚)、1333 MHz Registered ECC DDR3
ネットワーク
インターフェース
内蔵 Intel 82575EB デュアルポート 1 GbE アダプター × 1 基
Intel 10 Gbit X520-DA2 デュアルポートサーバアダプター × 1 基
ディスクサブシステム 内蔵ハードディスクは使用しません。
Xeon X5680:ストレージシステム ETERNUS DX80 × 7 台、合計 126 台のハードディス
クを搭載(複数の RAID-0 アレイを構成)。
Xeon X5690:ストレージシステム ETERNUS DX80 × 5 台、SSD を含む合計 73 台のハー
ドディスクを搭載(複数の RAID-0 アレイを構成)。
ストレージ接続 デュアルチャネル Emulex LPe12002 × 1 基
SUT ソフトウェア
オペレーティングシステム ハイパーバイザー VMware ESX Server
ESX バージョン VMware ESX v4.1、ビルド 260247
BIOS バージョン Rev R1.06.3031
負荷ジェネレーターのハードウェア
モデル サーバブレード PRIMERGY BX620 S4 × 7 基
プロセッサ Intel Xeon 5130(2 GHz)× 2 基
メモリ 4 GB
ネットワーク
インターフェース
それぞれ 1 Gbit LAN × 1 基
オペレーティングシステム Microsoft Windows Server 2003 R2 Enterprise、SP2 および KB955839 を適用
詳細
公開 URL http://vmware.com/a/assets/vmmark/pdf/2011-01-25-Fujitsu-RX200S6.pdf
http://vmware.com/a/assets/vmmark/pdf/2011-02-08-Fujitsu-RX200S6.pdf
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
複数の
1Gb または 10Gb
ネットワーク
プライムクライアントを
含む負荷ジェネレーターと
データセンター管理サーバ
サーバ ストレージシステム
テスト対象システム
(System Under Test:SUT)
vMotion
ネットワーク
クライアントと管理サーバ
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 43/47 ページ
STREAM
ベンチマークの説明
STREAM は、メモリのスループットを測定するために長年使用されてきた総合的なベンチマークで、John
McCalpin 氏がデラウェア大学に教授として在職中に、氏によって開発されました。現在はバージニア大学
でサポートされており、ソースコードを Fortran または C のいずれでもダウンロードできます。STREAM
は、特に HPC(ハイパフォーマンスコンピューティング)分野で、重要な役割を担っています。例えば、
STREAM は、HPC Challenge ベンチマークスイートの一部として使用されています。
このベンチマークは、PC とサーバシステムの両方で使用できるように設計されています。測定単位は、
[GB/s] であり、1 秒あたりにリード/ライト可能なギガバイト数です。
STREAM では、シーケンシャルアクセスでのメモリスループットを測定します。メモリ上のシーケンシャ
ルアクセスは、CPU キャッシュが使用されるため、一般にランダムアクセスより高速です。
ベンチマーク実行前に、測定環境に合わせて、STREAM のソースコードを調整します。また、CPU キャッ
シュによる測定結果への影響ができるだけ尐なくなるよう、データ領域のサイズは、全 CPU キャッシュの
総容量の 4 倍以上にする必要があります。ベンチマーク中にプログラムの一部を並列実行するために、
OpenMP プログラムライブラリを使用します。これにより、利用可能なプロセッサコアに対して最適な負
荷分散が行われます。
STREAM ベンチマークでは、8 バイトの要素で構成されるデータ領域が、4 つの演算タイプに連続的にコ
ピーされます。COPY 以外の演算タイプでは、算術演算も行われます。
演算タイプ 演算 ステップあたりのバイト数 ステップあたりの浮動小数点演算
COPY a(i) = b(i) 16 0
SCALE a(i) = q × b(i) 16 1
SUM a(i) = b(i) + c(i) 24 1
TRIAD a(i) = b(i) + q × c(i) 24 2
スループットは、演算タイプ別に GB/s で表されます。しかし最近のシステムでは、通常、演算タイプによ
る値の差はほんのわずかです。そのため、一般的に、性能比較には TRIAD の測定値だけが使用されます。
測定結果は、主にメモリモジュールのクロック周波数によって変わります。また、算術演算は、CPU に
よって影響を受けます。結果の精度は約 5 %です。
本章では、スループットを 10 のべき乗で表しています。(1 GB/s = 109 Byte/s)
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
44/47 ページ © Fujitsu Technology Solutions 2010-2011
ベンチマーク結果
PRIMERGY RX200 S6 の STREAM の値は、Xeon 5600 シリーズのプロセッサを使用して測定しました。
ベンチマークプログラムは、インテル C コンパイラー 12.0 でコンパイルし、SUSE Linux Enterprise
Server 11 SP1(64 ビット)で実行しました。
データ領域は 4,000 万個の要素で構成されます。これは約 305 MB に相当します。
プロセッサ コア GHz L3 キャッシュ メモリ周波数 TDP TRIAD [GB/s]
Xeon E5603 4 1.60 4 MB 1067 MHz 80 W 27.2
Xeon E5606 4 2.13 8 MB 1067 MHz 80 W 27.2
Xeon E5607 4 2.27 8 MB 1067 MHz 80 W 27.2
Xeon X5647 4 2.93 12 MB 1067 MHz 130 W 33.4
Xeon E5645 6 2.40 12 MB 1333 MHz 80 W 35.9
Xeon E5649 6 2.53 12 MB 1333 MHz 80 W 35.8
Xeon X5675 6 3.07 12 MB 1333 MHz 95 W 39.8
Xeon X5690 6 3.47 12 MB 1333 MHz 130 W 39.8
Xeon X5687 4 3.60 12 MB 1333 MHz 130 W 40.7
測定結果から、最大メモリ周波数が 1067 MHz のプロセッサと 1333 MHz のプロセッサの違いがはっきり
とわかります。Xeon X5647 は、高クロック周波数と大容量 L3 キャッシュにより、メモリ周波数 1067
MHz のプロセッサの中でも優れたパフォーマンスを示しています。6 コアのプロセッサでも、4 コアのプロ
セッサと同程度のスループットになっています。これは、CPU あたり 4 スレッドで、メモリコントロー
ラーの容量の上限に達しているためです。
次のグラフは、PRIMERGY RX200 S6 とその旧モデルである PRIMERGY RX200 S5 のスループットを、最
大パフォーマンス構成で比較したものです。
STREAM TRIAD
0
5
10
15
20
25
30
35
40
45
PRIMERGY RX200 S52 × Xeon X5570
PRIMERGY RX200 S62 × Xeon X5687
36.6
40.7
GB/s
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 45/47 ページ
ベンチマーク環境
STREAM の測定は、次のハードウェアおよびソフトウェア構成の PRIMERGY RX200 S6 で行いました。
ハードウェア
モデル PRIMERGY RX200 S6
CPU Xeon E5603、E5606、E5607、E5645、E5649、X5647、X5675、X5687、X5690
コア数
2 チップ
Xeon E5603、E5606、E5607、X5647、X5687: 8 コア
その他すべて: 12 コア
1 次キャッシュ 32 KB(命令)+ 32 KB(データ)オンチップ(コアあたり)
2 次キャッシュ 256 KB オンチップ(コアあたり)
その他のキャッシュ
Xeon E5603: 4 MB(命令 + データ)オンチップ(チップあたり)
Xeon E5606、E5607: 8 MB(命令 + データ)オンチップ(チップあたり)
その他すべて: 12 MB(命令 + データ)オンチップ(チップあたり)
メモリ 4 GB PC3-10600R DDR3-SDRAM ×12 枚
ソフトウェア
オペレーティング
システム SUSE Linux Enterprise Server 11 SP1(64 ビット)
コンパイラー インテル C コンパイラー 12.0
ベンチマーク Stream.c バージョン 5.9
国または販売地域によっては、一部のコンポーネントが利用できない場合があります。
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
46/47 ページ © Fujitsu Technology Solutions 2010-2011
関連資料
PRIMERGY システム
http://ts.fujitsu.com/primergy
PRIMERGY RX200 S6
データシート(英語)
http://docs.ts.fujitsu.com/dl.aspx?id=64834ad8-2320-412d-97ad-e93162eadead
Xeon 5600(Westmere-EP)搭載システムのメモリパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=e88beb76-a61b-4fad-8081-9f941d12476b
RAID コントローラーのパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=38e25913-195d-4f59-9efa-adaa2478ad6b
単一ディスクのパフォーマンス
http://docs.ts.fujitsu.com/dl.aspx?id=de940140-2f25-4207-8862-563c4d91f30c
PRIMERGY のパフォーマンス
http://ts.fujitsu.com/products/standard_servers/primergy_bov.html
OLTP-2
ベンチマークの概要 OLTP-2
http://docs.ts.fujitsu.com/dl.aspx?id=9775e8b9-d222-49db-98b1-4796fbcd6d7a
SPECcpu2006
http://www.spec.org/osg/cpu2006
ベンチマークの概要 SPECcpu2006
http://docs.ts.fujitsu.com/dl.aspx?id=00b0bf10-8f75-435f-bb9b-3eceb5ce0157
SPECjbb2005
http://www.spec.org/jbb2005
ベンチマークの概要 SPECjbb2005
http://docs.ts.fujitsu.com/dl.aspx?id=18c15041-a25f-4d23-b0a5-5742dd5715ba
SPECpower_ssj2008
http://www.spec.org/power_ssj2008
ベンチマークの概要 SPECpower_ssj2008
http://docs.ts.fujitsu.com/dl.aspx?id=a133cf86-63be-4b5a-8b0f-a27621c8d3c5
STREAM
http://www.cs.virginia.edu/stream/
VMmark V1
ベンチマークの概要 VMmark V1
http://docs.ts.fujitsu.com/dl.aspx?id=253a2cc2-b824-4ff4-85a4-8b55c0a265d5
VMmark V1 http://www.vmware.com/products/vmmark/v1/overview.html
VMmark V1 結果
http://www.vmware.com/products/vmmark/v1/results.html
ホワイトペーパー パフォーマンスレポート PRIMERGY RX200 S6 バージョン: 2.0A 2011-12-05
© Fujitsu Technology Solutions 2010-2011 47/47 ページ
VMmark V2
ベンチマークの概要 VMmark V2
http://docs.ts.fujitsu.com/dl.aspx?id=a083d947-8a41-45d1-a112-8cd295595a95
VMmark V2 http://www.vmmark.com
VMmark V2 結果
http://www.vmware.com/a/vmmark/
vServCon
ベンチマークの概要 vServCon
http://docs.ts.fujitsu.com/dl.aspx?id=c3d5ce5d-5610-43c6-86b4-051549940a71
PC サーバ PRIMERGY(プライマジー)
http://jp.fujitsu.com/platform/server/primergy/
お問い合わせ先
富士通テクノロジー・ソリューションズ
Web サイト:http://ts.fujitsu.com
PRIMERGY のパフォーマンスとベンチマーク
mailto:[email protected]
知的所有権を含むすべての権利は弊社に帰属します。製品データは変更される場合があります。納品までの時間は在庫状況によって異なります。データ
および図の完全性、事実性、または正確性について、弊社は一切の責任を負いません。本書に記載されているハードウェアおよびソフトウェアの名称
は、それぞれのメーカーの商標等である場合があります。第三者が各自の目的でこれらを使用した場合、当該所有者の権利を侵害することがあります。
詳細については、http://ts.fujitsu.com/terms_of_use.html を参照してください。
2011-12-05 WW JA Copyright © Fujitsu Technology Solutions GmbH 2010-2011