MEET THE EXPERTS: THIS IS EPY™ · 2018. 9. 5. · 世界初のCPU& GPU 1Chip化 Introduction of...
Transcript of MEET THE EXPERTS: THIS IS EPY™ · 2018. 9. 5. · 世界初のCPU& GPU 1Chip化 Introduction of...
1 | AMD THIS IS EPYC! | SEPTEMBER, 2018
MEET THE EXPERTS: THIS IS EPYC™September 7, 2018
日本AMD株式会社
HPE HPC & AIフォーラム 2018
2 | AMD THIS IS EPYC! | SEPTEMBER, 2018
First public demo of “Zen” microarchitecture
2016
First to market
with 6th generation
technology for
Commercial
2015
Inside every major next
generation gaming
console
2013Brings world’s
first APUs to
market
2011
Powered the
world’s most
efficient
super computer
2009
2004
2000
1970
20032006
2012 2014
Industry’s first
quad-core x86 SoCs
Breaks 1GHz GPU barrier
with Radeon™ HD 4890
First to break teraflop
performance barrier
World’s first x86
dual-core processor
First to break the historic
1GHz with the AMD Athlon™
World’s first x86-64
bit architecture
First proprietary
device: Am2501
logic counter
introduced
世界初のCPUコアクロック 1GHz を突破
世界初の64-bit x86 プロセッサーの市場投入
世界初のx86デュアルコアプロセッサーの市場投入
世界初のx86クアッドコアプロセッサー SoCを市場投入
世界初のCPU & GPU 1Chip化
Introduction of Ryzen, Ryzen PRO,
Vega, Radeon Instinct and EPYC SOC processors
2017
AMDはテクノロジー・リーダーです
創業以来 48年、イノベーションと
リーダーシップこそ、私たちの存在意義であり
今後も継続していきます。
64ビット化
X86 2コア実現
CPU & GPU1チップ化
X86 4コアSoCを実現
1GHz超
3 | AMD THIS IS EPYC! | SEPTEMBER, 2018
25% unit share
世界初の64-bit世界初のマルチコア X86ハーパートランスポート
スーパ―コンピュ
ータ市場での圧倒的な性能の提供
データセンター市場への長年の貢献
*See endnotes
4 | AMD THIS IS EPYC! | SEPTEMBER, 2018
現在のデータセンターは新しいテクノロジーを必要としています
既存のプラットフォーム
ブレードサーバーは停滞気味
依然ラックサーバーが主流
高密度サーバー需要は若干の上昇
不明瞭な進化
不相応な価格のUp
若干のコア数のUp
パフォーマンスのリソース制約と非効率性とで、アプリケーションのパフォーマンスが最適化されない…
革新的な進化
シリコン
サーバプラットフォーム基盤
デザインの再考が必要
SC17| AMD SERVER ROADMAP | SC17 | AMD CONFIDENTIAL – NDA ONLY
サーバー市場向けの新しいブランド
6 | AMD THIS IS EPYC! | SEPTEMBER, 2018
“ZEN” アーキテクチャーAMD が保証するハイパーフォーマンスコンピューティング
▪ マルチスレッド性能の優位性
▪ 妥協のない1P サーバーでの性能
▪ 最高の電力性能
▪ 前世代に比べて IPC 52% 向上
Zen
*See Endnotes: NAP-96; NAP-69; NAP-41,GD-108
7 | AMD THIS IS EPYC! | SEPTEMBER, 2018
▪ ハイパフォーマンス, スケーラブルなインターコネクト
▪ NUMA-対応アプリケーション向けにコアスケーラビリティ―を提供
▪ チップレベルでのシステム構成の選択を可能にします
インフィニティーファブリックハイパートランスポートからの進化
Scalable Control Fabric
Scalable Data Fabric
Memory
CPUs/GPUs/Accelerators
▪ コヒーレントなインターコネクトがチップ間の接続を拡張します
8 | AMD THIS IS EPYC! | SEPTEMBER, 2018
EPYC™
卓越した性能によりビジネス・
アジリティが実現
数字で見る
リーダーシップの機能セット32
ソケット あたり24、16、8コア
機能を損なうことなく幅広いコアをサポート
128単一のCPUにPCIe® 3.0レーン
最大のI/O容量*
8CPUあたりのメモリー・ チャネル
業界をリードするメモリー帯域幅*
2TB ソケットあたりのRAM
最もリッチなメモリー密度
脚注のNAP-42、NAP-43、NAP-44、NAP-56を参照してください
9 | AMD THIS IS EPYC! | SEPTEMBER, 2018
EPYCのパワーで性能を向上
より多いコア
最大32個のマルチスレッド・コア
クラウド・スケーラビリティ
優れた性能
より高いVM密度
より大きいメモリー
最高のメモリー・チャネル最大のメモリー容量
強化されたVM性能
優れたデータベース性能
リソース使用率の最適化
より高いI/O
128個のPCIe 3.0レーン
より高い駆動力
より高いGPU
より優れたアクセラレータ
脚注のNAP-42、NAP-43、NAP-44、NAP-56を参照してください
10 | AMD THIS IS EPYC! | SEPTEMBER, 2018
24コア
7451
7401
16コア
7351
7281
7301
32コア
7601
7551
7501
一貫した機能と簡素な製品シリーズ
1ソケットと2ソケット
7551P 7401P 7351P1ソケットのみ
AMD価格設定は2018年1月の1K単価ベースに基づきます 12
DDR4-2666
メモリー容量:2TB
128個のPCIe3®レーン
ターボ・ブースト
SMT
✓
✓
✓
✓
✓
✓
✓
✓
✓
✓
✓
✓
✓
✓
✓
7251/DDR4-2400
✓
✓
✓
✓
8コア
7251
7261
11 | AMD THIS IS EPYC! | SEPTEMBER, 2018
AMD EPYC 7000 SERIES PROCESSOR PRODUCT STACK
Model Number
OPN 2P/1P Cores ThreadsBase Freq
(Ghz)
All Cores Boost Freq
(Ghz)
Max.Boost Freq
(Ghz)
L3 $(MB)
DDR Channels
Max DDR Freq
(1DPC)PCIe
TDP(W)
7601 PS7601BDVIHAF 2P or 1P 32 64 2.20 2.70 3.20 64 8 2666 x128 180
7551 PS7551BDVIHAF 2P or 1P32 64 2.00 2.55 3.00 64 8 2666 x128 180
7551P PS755PBDVIHAF 1P ONLY
7501 PS7501BEVIHAF 2P or 1P 32 64 2.00 2.60 3.00 64 8 2400/2666 x128 155/170
7451 PS7451BDVHCAF 2P or 1P 24 48 2.30 2.90 3.20 64 8 2666 x128 180
7401 PS7401BEVHCAF 2P or 1P24 48 2.00 2.80 3.00 64 8 2400/2666 x128 155/170
7401P PS740PBEVHCAF 1P ONLY
7351 PS7351BEVGPAF 2P or 1P16 32 2.40 2.90 2.90 64 8 2400/2666 x128 155/170
7351P PS735PBEVGPAF 1P ONLY
7301 PS7301BEVGPAF 2P or 1P 16 32 2.20 2.70 2.70 64 8 2400/2666 x128 155/170
7281 PS7281BEVGAAF 2P or 1P 16 32 2.10 2.70 2.70 32 8 2400/2666 x128 155/170
7261 PS7261BEV8RAF 2P or 1P 8 16 2.50 2.90 2.90 64 8 2400/2666 X128 155/170
7251 PS7251BFV8SAF 2P or 1P 8 16 2.10 2.90 2.90 32 8 2400 x128 120
12 | AMD THIS IS EPYC! | SEPTEMBER, 2018
MCM VS. MONOLITHIC
MCM のアプローチは数々の優位性を提供します
高いイールド、機能の拡張性 製品展開の拡張性
EPYC™ Processors 4x 213mm2die/package = 852mm2Si/package
EPYC Monolithicの場合 ~777mm2*
各ダイ間のInfinity Fabric を削除出来るので、その分 Total Die面積は小さくなります。
852mm2/ 777mm2= ~10% MCM の方がダイ面積が大きくなります。
ダイサイズが小さくなると、歩留まりは指数関数的に改善します。結果、Totalコストが下がります。
* Die sizes as used for Gross-Die-Per-Wafer
MCM は歩留まりの改善、ピーク性能の向上の向上により、プラットフォームの価値を最大化します。
32C ダイコスト
1.0x
32C ダイコスト
0.59x
13 | AMD THIS IS EPYC! | SEPTEMBER, 2018
PUTTING IT TOGETHER : 2Pピークバンド幅 DDR4-2667
4 M
emo
ry C
han
nel
s 4 M
emo
ry Ch
ann
els
4 M
emo
ry Ch
ann
els
4 M
emo
ry C
han
nel
s
Memory BW = 21.3 GB/s per channel, ~170GB/s per socket
Fabric BW (bidir) = 42.6 GB/s per 4B linkBisection BW: 4*42.6 = ~170GB/s
Fabric BW (bidir) = 37.9 GB/s per 2B linkBisection BW: 4*37.9 = ~152GB/s
EPYC™はバランス良く設計され
ダイ内部だけでなく、ダイ間でも、ソケット間でもスケールする
▪ 高性能コア, 大規模I/Oを支えるバランスが必要‒ ボトルネックの排除
▪ バイセクション・バンド幅‒ ソケット内は2倍必要
‒ ソケット間とマッチさせる必要
▪ 低レイテンシーの実現‒ Infinity ファブリックを構築した目的
14 | AMD THIS IS EPYC! | SEPTEMBER, 2018
メモリー・インターリービング
メモリー・チャンネル・インターリーブ:各チャンネル・ペアに最低1枚のDIMMが実装されていること
‒ さらにDIMM 容量が各チャンネルで同じであること
‒ 性能のために、チャンネル。インターリービングはデフォルトであることを推奨
ダイ (チャンネル・ペア)インターリーブ:すべてのチャンネルのメモリ容量が同じであること
ソケット・インターリーブ:チャンネル・ペアとダイ・インターリーブが有効で、かつすべてのチャンネルのメモリ容量が同じであること
ソケット・インターリーブ
チャンネル
インターリーブ
ダイ・インターリーブ
DIE 2 DIE 1
DIE 3 DIE 0
DIE 2 DIE 1
DIE 3 DIE 0
15 | AMD THIS IS EPYC! | SEPTEMBER, 2018
消費電力 パフォーマンス
パフォーマンス定義, パワー定義, TDP設定
サーバーシステムとその環境は多岐に渡ります
CPUに多くの選択肢があります‒ 高速 / ハイ・リーケジパーツ‒ 低速 / ロー・リーケジパーツ
ある顧客は、どの様な環境においても再現性が高く、安定的なパフォーマンスを要求します‒ この様な設定下では、消費電力が変動します
またある顧客は消費電力固定で、最大のパフォーマンスを望む場合もあります。‒ この場合、パフォーマンスは変動します
EPYC™ CPUはどちらのモードもブート時に選択可能です (BIOS設定可能)
0.96
0.98
1
1.02
1.04
1.06
Max System and Silicon Margin Min
消費電力定義のモード
0
0.5
1
1.5
パフォーマンス定義のモード
正規化されたパフォーマンスと消費電力
Max System and Silicon Margin Min
Product TDP Low range High range
180W 165W 200W155W 135W 170W120W 105W 120W
▪ また、EPYC はTDPの設定変更可能が可能ですので、TCO,ピークパフォーマンス、パフォーマンス/Wの最適化を可能にします。
16 | AMD THIS IS EPYC! | SEPTEMBER, 2018
1コアあたりのリニア・ボルテージ・レギュレーション
全てのDie/Coreを同時に電圧制御していては、電力の無駄になります。
EPYCは、各コアの負荷状況を確認し、コア毎の電圧制御を可能にします。
‒ これにより大幅な消費電力の削減を実現します
Per-core LDO Controlled
Core0 Core1 Core2 Core3 Core4 Core5 Core6 Core7
VD
D0
VD
D1
RVDD (VRM output)
Core8 Core9 Core10 Core11 Core12 Core13 Core14 Core15
VD
D8
VD
D9
Die0 Die1
Core16 Core17 Core18 Core19 Core20 Core21 Core22 Core23
VD
D1
6
VD
D1
7
Die2
Core24 Core25 Core26 Core27 Core28 Core29 Core33 Core31
VD
D2
4
VD
D3
1
Die3
17 | AMD THIS IS EPYC! | SEPTEMBER, 2018
現状を超えるセキュリティ機能
SECURE ROOT-OF-TRUSTテクノロジー
Secure Root-of-Trusからの起動
SECURE MEMORY
ENCRIPTION(SME)
メモリー・ハッキングやスクレイピングから保護
SECURE ENCRYPTED VITUALIZATION(SEV)
仮想マシンを暗号化して隔離
18 | AMD THIS IS EPYC! | SEPTEMBER, 2018
14% より多くのコア33% より広帯域なメモリー
FABRIC
7601
世界記録を樹立!SPECfp®_rate2006SPECrate®2017_fp
7601
2.6x より大容量なメモリー
2.3x より優れた価格性能比
Feature and perf/$ comparison to 2 Intel Xeon Platinum 8180.Perf/$ based on published prices and published SPECFP_rate2016 scores on spec.orgWorld record benchmarks based on SPECfp®_rate2006 and SPECrate®2017_fp scores on spec.org as of Jan. 18, 2018*See Endnotes: NAP-43; NAP-56; NAP-42; NAP-44 ;NAP-53
最先端の 2-ソケットサーバー
UPTO
19 | AMD THIS IS EPYC! | SEPTEMBER, 2018
HPC 分野での2ソケットEPYCのご採用が進んでいます!
研究・解析 & 学術系
産業分野
クラッシュ解析向けにEUの大手自動車会社での採用実績
F1数チームでの採用実績 工業系デザインでの採用実績(大手企業様)
INFNItalian National Institute for
Nuclear Physics
University of Ulm
“AMD EPYCはこれまでのプロセッサーとは全く違います。これは、大幅なアーキテクチャのアップグレードです。”
“我々は価格性能比の圧倒的に優れた、HPEのAMD EPYC搭載機を採用しました。”
Dr. Paul Brenner, Associate Director, Notre Dame Center for Research Computing
AMD EPYC™搭載サーバーでハイスピード性能を提供
チャレンジハイパフォーマンスコンピューティングの性能を向上し、幅広い領域の科学アプリケーションに向けて、強靭な計算インフラを提供すること。
ソリューションAMD EPYCプロセッサベースのHPE ProLiant DL385 Gen10サーバーを導入することで、HPE Silicon Root of Trustセキュリティとプロセッサあたり最大32コアと2TBのメモリを提供します。
結果CRCの研究者は、大容量・広帯域のメモ
リー、とプロセッサーコアを使用し、メモリを大量に消費するワークロードをコスト効率良く、しかも効率的に実行し、大量のデータをすばやく分析することが可能になりました。
21 | AMD THIS IS EPYC! | SEPTEMBER, 2018
HTTPS://H50146.WWW5.HPE.COM/DIRECTPLUS_ENT/CASESTUDY/NAIST.HTML
DL385 GEN10 採用事例: NAIST (ビックデータ解析)
22 | AMD THIS IS EPYC! | SEPTEMBER, 2018
EPYC が得意とするアプリケーション・ベンチマーク
CFD (流体解析系)‒ Siemens Star CCM+
‒ ANSYS Fluent
‒ Altair RADIOSS
‒ OpenFORM
FEA Crash Simulation (衝突解析系)‒ LSTC LS-Dyna
‒ Dassault Systems Simulia Abaqus
‒ Altair RADIOSS
EDA (デザインツール)‒ Synopsys IC Compiler II
‒ Synopsys PrimeTime
‒ Mentor Calibre nmDRC Physical Verification
Oil and Gas (オイル・ガス探索系)‒ Semismic data analysis and reservoir modeling
Weather Modeling (天気予測)‒ Weather Research and Forecast model
In-Memory Data Analysis (メモリー内解析)‒ SPARK
Synthetics (汎用ベンチマーク)‒ Stream
‒ DGEMM performance
‒ SPEC CPU 2017 & SPEC CPU 2006
Molecular Dynamics (分子力学系)
‒ NAMD Molecular Dynamics
‒ Gromacs
‒ Lammps
Raytracing (光学・レイトレーシング)‒ POV-Ray Rendering
23 | AMD THIS IS EPYC! | SEPTEMBER, 2018
価格 VS. 性能 SPECCPU2006 FP Rate Score vs. list price
Increased throughput
DECREASE TCO
Reduced iteration times
INCREASE AGILITY
Protect vital data
ENHANCE SECURITY
SPECCPU2006 FP Rate Score
List
pri
ce
24 | AMD THIS IS EPYC! | SEPTEMBER, 2018
テクニカルな優位性のポイント
0% 20% 40% 60% 80% 100% 120% 140% 160% 180%
Xeon 4114
EPYC 7281
Xeon 4116
EPYC 7301
Xeon 5118
EPYC 7351
Xeon 6130
EPYC 7401
Xeon 8160
EPYC 7601
Scores are estimates based on SPECrate®2017_fp_base. See SpecInt End Notes
Pricing ranges based on Intel recommended customer pricing per ark.intel.com Mar2018; AMD 1Ku pricing Mar2018
$500 - $800
$900 - $1,000
$1,800 - $2,500
$1,000 - $1,800
> $4,00022% Better Perf
35% Better Perf
57% Better Perf
54% Better Perf
72% Better Perf
$4,200
$1,100
$1,273
$825
$1,002
$650
$694
$4,701
$1,850
$1,894
▪ 性能
▪ コア密度
▪ メモリー容量
▪ IO 接続性
▪ 一貫した機能サポート
より優れた高性能を市場に提供します2 EPYC™ VS. 2 XEON™ - 浮動小数点演算性能
25 | AMD THIS IS EPYC! | SEPTEMBER, 2018
+55%
ポイント: 浮動小数点演算性能と L1キャッシュ性能
+16%
ポイント: 浮動小数点演算性能とL2キャッシュ性能
Intel Xeon E5-2699 v4, 263
Intel Xeon Platinum 8176, 340
EPYC 7601, 526
0 100 200 300 400 500 600
+41%
ポイント: 浮動小数点演算性能とメモリーバンド幅
浮動小数点演算:サードパーティによる評価VS XEON PLATINUM 8176
圧倒的な浮動小数点演算性能
を提供
▪ より多くの高性能コア
▪ 効率的はFP専用エンジン
▪ 広いメモリバンド幅
Note: All benchmarks taken from Anandtech.com. 3rd party testing not verified by AMD. See Endnotes NAP-42, NAP-43
Intel Xeon E5-2699 v4, 3.9
Intel Xeon Platinum 8176, 4.1
EPYC 7601, 5.8
0 1 2 3 4 5 6 7
Intel Xeon E5-2699 v4, 188
Intel Xeon Platinum 8176, 214
EPYC 7601, 249
0 50 100 150 200 250 300
NAMD Molecular
Dynamics 2.10
C-ray rendering at
3840x2160
POV-ray
26 | AMD THIS IS EPYC! | SEPTEMBER, 2018
Intel Xeon E5-2699 v4
EPYC 7601, SPEC OMP®
EPYC 7601, ANSYS Fluent
EPYC 7601, Weather Research Forecast
0 50 100 150 200
▪ オイラーマスソルバに基づくメソスケールの数値気象予測エンジン
EPYC™ 7601 プロセッサーは、Broadwellに対して最大+77% の性能を提供します
▪ 航空機周辺の乱気流のシミュレーション▪ 1400万もの細胞に関する問題
HPC テスト – ANSYS FLUENT, WRF, SPEC OMPVS XEON E5-2699V4
Up to 77%
Up to 76%
▪ 流体力学計算
▪ 大気研究調査と気象のモデリング
▪ 石油・ガス探査
▪ クラッシュシミュレーション
WHY IDEAL FOR MEMORY BOUND HPC
▪ 高メモリバンド幅
▪ 高性能コア
▪ バランスのとれたアーキテクチャー
Up to 69% ▪ 14の科学および工学アプリケーションコード▪ 分子動力学、パターンマッチング、CFD、線形代数、画像操作、有限要素
See Endnotes NAP-18, NAP-42, NAP-43,NAP-92, NAP-93
27 | AMD THIS IS EPYC! | SEPTEMBER, 2018
Intel Xeon 8160
EPYC 7601 -Synopsys PrimeTime®
EPYC 7601 – Calibre nmDRC™
EPYC 7601 - Synopsys IC Compiler II™
0 20 40 60 80 100 120 140
▪ SynopsysのIC Compiler IIを利用した配置とクロック最適化 (〜900kインスタンスの7nm設計)
EPYC™ 7601プロセッサーは、 Skylake 8160 に対して最大+32% の性能を提供します
▪ Synopsys PrimeTime(STA -静的タイミング解析):7nmグラフィクスコンピュートアレイ設計(91Mリーフセル設計の再利用)
HPC ベンチマーク – EDAVS Intel XEON 8160
Up to 32%
▪ 配置配線の実装
▪ 物理的検証 -デザインルールチェッ
▪ 静的タイミング検証
WHY IDEAL FOR EDA
▪ より多くの高性能コア
▪ バランスの良いアーキテクチャ
Up to 5%
Up to 15% ▪ Mentor Calibre nmDRC Physical Verification を利用した、物理検証 (528 billion flat geometriesの7nm GPU SOC デザイン)
See end notes: NAP-XX
28 | AMD THIS IS EPYC! | SEPTEMBER, 2018
EPYC 2ソケットサーバーの優位性
1.業界最多のCPU Core数、メモリー性能、浮動小数点性能を提供データセンター増設へ、旧来より少ないサーバー台数での実現
2.世界最高性能の浮動小数点性能
4.世界有名大学、研究機関、大手企業様での採用実績
3.EPYCユニークなセキュリティー機能を提供 (SME/SVE)
29 | AMD THIS IS EPYC! | SEPTEMBER, 2018
ハイパーバイザー | オペレーティング・システム 開発ツールX86のユビキタス性と堅牢性の構築
Server 2012 R2 ● Server 2016
vSphere 6.5 u1
XenServer 7.0 ● XenServer 7.1 SLES 11 SP4 ● SLES 12 SP2 RHEL 6.9 ● RHEL 7.3
Ubuntu 16.04 ● Ubuntu 17.04
X86 エコシステムを活用
30 | AMD THIS IS EPYC! | SEPTEMBER, 2018
AMD DEVELOPER CENTRAL (HTTPS://DEVELOPER.AMD.COM/)
31 | AMD THIS IS EPYC! | SEPTEMBER, 2018
AMD EPYC™ プロセッサー・コンパイラー・サポートオープンソース戦略
AOCCAMD 最適化 C/C++ コンパイラー – LLVMに統合、
EPYC プロセッサー最適化済
Java コンパイラー、ランタイム –オラクルから提供されます。AMDはOpenJDKの最適化やリリースに協力しています。
AMD はLLVMコミュニティに対して活発に貢献しています。EPYC プロセッサに最適化を行ったAOCCを公開します。
広く使われているオープンソース・コンパイラーです。AMDは EPYCプロセッサ向けの最適化を行い公開します。
広く使われているWindowsコンパイラーです。AMDは EPYCチューニングやプロセッサの対応を行います。
PGI 、その他EPYC対応サポート, ソフトウェア最適化ガイドや
推奨フラグなどの提供を行います。
プラットフォームコンパイラー
パフォーマンスコンパイラー
エコシステムコンパイラー
32 | AMD THIS IS EPYC! | SEPTEMBER, 2018
AOCC は LLVM のアップデートの後、1ヵ月後にリリースされます。‒エンドユーザー向けにAMD Developer Centralサイトから入手可能です。
‒リリース・スケジュール‒ 2018年 4月- AOCC 1.2 リリース済み
‒ 2018年 10月 - AOCC 1.3 リリース予定
‒これにより、顧客/開発者は、定期的に最新のAOCCコンパイラの更新を行うことができます。
AMD EPYC AOCC COMPILERリリースタイミング
33 | AMD THIS IS EPYC! | SEPTEMBER, 2018
AOCC 戦略オープンソースへの統合– EPYC™ プロセッサーの最適化
C/C++ サポート • Clang
Fortran サポート
• Dragon Egg から Flangへ Fortranのサポートを移行
• AOCC 1.2 リリースから DragonEggに加えてアルファ―バージョンのAOCC Flangをアルファーテスターに提供
• 2018年末までに Flangへの移行を予定
34 | AMD THIS IS EPYC! | SEPTEMBER, 2018
AMD EPYC™ プロセッサ・ライブラリー・サポートオープンソース、ポータビリティ戦略
Library AMD インプリメンテーション
Core Math libM - EPYC プロセッサ最適化済
Linear Algebra LibFLAME - EPYC プロセッサ最適化済
Basic Linear Algebra BLIS - EPYC プロセッサ最適化済
Fast Fourier Transforms FFTW – GPU/APU によるヘテロジニアス・コンピュートと OpenCL™ のサポート
Random Number Generator RNG –単精度と倍精度
35 | AMD THIS IS EPYC! | SEPTEMBER, 2018
オープンソース戦略
AMD EPYC最適化ツール
AMD uProf
‒ AMD uProfは、開発者がAMD APUおよびCPU上で動作するアプリケーションを最適化できるようにする、パフォーマンスおよび電力プロファイリングツールスイートです。 WindowsおよびLinux用のグラフィカルユーザーインターフェイスおよびコマンドラインインターフェイスツールとして利用できます。Ryzen、Threadripper、EPYCなどの新しいプロセッサをサポート
‒主な用途:
‒ 時間的に重要なホットスポットを特定して分析し、パフォーマンスの問題を診断するパフォーマンスプロファイリング
‒ システムレベルの電力、周波数、熱特性をリアルタイムで提供するパワープロファイリング
36 | AMD THIS IS EPYC! | SEPTEMBER, 2018
AMD X86 CORE ROADMAP
Performance LeadershipContinuous Innovation
▪ “Zen”▪ 14nm
“Milan”
▪ “Zen 3”▪ 7nm+
“Rome”
▪ “Zen 2”▪ 7nm
2017 2020
“Naples”
37 | AMD THIS IS EPYC! | SEPTEMBER, 2018 Dates subject to change.
SILICON IN LABSNOW
SAMPLING2H18
LAUNCH2019
LEADERSHIP ROADMAP EXECUTION
7nm “Zen 2” Processors
38 | AMD THIS IS EPYC! | SEPTEMBER, 2018
THIS IS
39 | AMD THIS IS EPYC! | SEPTEMBER, 2018
GPU Solutionのご紹介
40 | AMD THIS IS EPYC! | SEPTEMBER, 2018
Radeon Reach
FOR GAMERS FOR CREATORSFOR MACHINE INTELLIGENCE
Consumer Brand Professional Brand Compute Brand
Pro WX
Desktop & MobileWorkstations
Pro V
VirtualizedGraphics
Pro
StrategicUse Cases
MI
Compute ServerAccelerators
41 | AMD THIS IS EPYC! | SEPTEMBER, 2018
RADEON INSTINCT MI25Current Deep Learning Solution
(NCU – 4096 Stream Processors)64 Next-Gen Compute Units
Peak Single Precision Compute (FP32)12.3 TFLOPS
High Bandwidth Cache16GB HBM2
Memory Bandwidth484 GB/s
Peak Half Precision Compute (FP16)24.6 TFLOPS
Powered by “Vega”
42 | AMD THIS IS EPYC! | SEPTEMBER, 2018
LEADERSHIP ROADMAP EXECUTION
LAUNCH2H18
SAMPLINGNOW
World’s First 7nm GPU
43 | AMD THIS IS EPYC! | SEPTEMBER, 2018
2 0 1 7 2 0 2 0
14nm
“VEGA”7nm
“VEGA”7nm
“NAVI”7nm+
“NEXT-GEN”
Roadmap subject to change.
GRAPHICS ARCHITECTURE R O A D M A P
44 | AMD THIS IS EPYC! | SEPTEMBER, 2018
▪ MIOpen provides Optimized Deep Learning GPU kernels for OpenCL and HIP
▪ Integrated into Caffe, TensorFlow and other frameworks
▪ Describes operations as a function on tensors
MIOpen LIBRARIESFOR DEEP LEARNING Open source deep learning libraries
optimized for Radeon Instinct™
45 | AMD THIS IS EPYC! | SEPTEMBER, 2018
Machine LearningAPPLICATIONS
ROCm
ROCm Platform
HCC HIP OpenCLTM Python
SOFTWARE STACK
PyTorch/Caffe2FRAMEWORKS TensorFlow CNTKMxNet
MIDDLEWARE & LIBRARIES MIOpen BLAS, FFT, RNG RCCL Eigen C++ STL
HSA
LLVM
Open Source
46 | AMD THIS IS EPYC! | SEPTEMBER, 2018
TRUE OPEN SOURCE MATTERS!
Open source software AMD / ROCm NVIDIA / CUDA
Caffe Open-source Open-source
TensorFlow Open-source Open-source
Programming language Open-source (HIP) Proprietary (CUDA)
Accelerated MI library Open-source (MIOpen) Proprietary (cuDNN)
Accelerated math libsOpen-Source (rocBLAS, rocRAND,
rocFFT, rocSPARSE)Proprietary (cuBLAS, cuRNG,
cuFFT, cuSPARSE)
Communication library RCCL NCCL
Runtime Open-source (ROCr) Proprietary
Linux driver Open-source (AMDGPU) Proprietary
Documented ISA Open (GCN) Proprietary
Italics = Under development
47 | AMD THIS IS EPYC! | SEPTEMBER, 2018
GPUOPEN HTTPS://GPUOPEN.COM/