IBM PureFlex Systems...
Transcript of IBM PureFlex Systems...
© 2013 IBM Corporation
IBM Confidential
IBM PureSystems高性能计算解决方案
预置专业模式 迈入智慧运算新纪元
点击左侧按钮下载音频
© 2013 IBM Corporation3
PureFlex Systems产品概览
简化用户体验 降低整个产品生命周期的维护时间、人力、风险
计算节点
Power 2S/4S*
x86 2S/4S
存储节点V7000(可选)内置/外置
管理节点(软硬件一体 )
网络10/40GbE8/16Gb FC
扩展能力PCIe Storage
机箱14 半宽节点
PureFlex Building Blocks IBM PureFlex System
© 2013 IBM Corporation4
10U机架高度
支持14 个半宽节点或7个全宽节点
支持4个可扩展交换插槽
多达6个2500W供电模块,支持N+N or
N+1冗余
多达8个制冷风扇
集成机箱管理功能
IBM PureSystems产品家族的基石,面吐未来十年而设计
PureFlex企业级机箱概览
FRONT
Scalable Switch Bays
Fans
CMM
14 Node Bays(7 Full Wide)
IntegratedStorwize V7000
REAR存储节点2网络交换模块4
计算节点1
10 U
Flex System Manager
管理节点3Power Supplies (6X)
Standard Node bays
© 2013 IBM Corporation5
PureFlex企业级机箱和传统刀片架构对比
BladeCenter Flex Chassis
机框种类 BC-S, BC-E, BC-H(三种)Flex System Enterprise Chassis(一种,可支持丌同类型节点,
更好保护投资)
节点混插 BC-E, BC-H机箱支持P、X节点 支持P、X计算节点和存储节点混插
Power处理能力
Power刀片到Power7,最高32核 Power刀片到Power7/7+,最高32核即将发布48核
背板设计 有源、无导风通道 无源、有导风通道
I/O支持 最高支持10GbE\8Gb FC\DDR IB 当前支持10/40GbE、16Gb FC、40/56Gb IB,未来更高;
制冷域 2 4(更加精细对丌同制冷域散热)
风速调节 支持 支持,更精细风速控制/每一风扇速度都可以丌一样;
电源效率 高达90% 高达94%
供电域 2 1(任一电源均可吐任意节点供电)
© 2013 IBM Corporation7
PureFlex企业级机架水冷散热
机架背板水冷门设计
安装在 600mm宽的IBM PureFlex System 42U机架背端的水冷门
通过来自中央水源和经调节的冷却水,可移除功率高达 30 kw 的设备散热
无缘设备,没有任何电子设备和软件
Saving 1000btu/hr
© 2013 IBM Corporation8
PureFlex计算节点概览
四路至强E5节点x440
两路至强E5-2400节点x220
两路至强E5-2600节点x240
四路Power7节点p460
两路Power7/7+节点p260
两路Power7 Linux节点p24L
Power节点
提供针对不同工作负载优化的系统
Power7/7+节点:更高主频
X86节点:更大内存
IO扩展节点:更高带宽扩展
虚拟化整合,减少投资
强大的平台扩展能力为系统部署提供了更好的灵活性
节点类型 处理器 DIMM 磁盘 IO
X220 E5-2400 2*8核 12 (384GB) 2 2
X240 E5-2600 2*8核 24 (768GB) 2 2
X440 E5-4600 4*8核 48 (1536GB) 2/8 4
P24L Power7 16核 16 (512GB) 2 2
P260 Power7/7+ 16核 16 (512GB) 2 2
P460 Power7 32核 32 (1024GB) 2 4
两路至强E5-2600节点x222
X86节点
© 2013 IBM Corporation9
PureFlex计算节点性能
0
100
200
300
400
500
600
BladeCenter PS702(3.00 GHz
POWER7,16Core)
Flex System p260(4.1 GHz
POWER7+, 16Core)
Power 740(4.2 GHz
POWER7+, 16Core)
某友商
(1.5GHz, 64Core)
375.7
485.4 508.5
341.7370
496517.1
Lin
pack
GFlo
p/s
Power服务器Linpack值比较
相当于老的Power刀片: +40% 内存带宽和+100% IO带宽
Power刀片IO带宽比较
© 2013 IBM Corporation10
PureFlex计算节点性能
相当于老的x86刀片及机架服务器显著的性能提升!
51.4
95.5
58.1 57.7
78.6
48.9
90.3
54.3 54.1
73.5
0
20
40
60
80
100
120
BC HX5
(E7-2870, 20Core)
Flex x240
(E5-2690, 16Core)
BC HX5
(E7-4870, 40Core)
3850 X5
(E7-4870, 40Core)
Flex x440
(E5-4650, 32Core)
CFP2006: 和传统刀片及机架服务器比较
380
507
749 757
888
370
490
732 739
863
0
100
200
300
400
500
600
700
800
900
1000
BC HX5
(E7-2870, 20Core)
Flex x240
(E5-2690, 16Core)
BC HX5
(E7-4870, 40Core)
3850 X5
(E7-4870, 40Core)
Flex x440
(E5-4650, 32Core)
CFP2006_Rate: 和传统刀片及机架服务器比较
© 2013 IBM Corporation11
PureFlex HPC方案交换模块
EN4091
CN4093
EN2092
EN4093
12 x 10GbE OmniPorts (6 in base + 6 #2)#1=2x40GbE2X10Gb SFP+
Base 10 x 10GbE SFP+ #2 = 4x10GbE #1 = 2x40GbE
Base 10 x 1GbE ports Add 10x1GbE Add 4x10GbE
IB6131 Infiniband交换机
>32口56Gbs Infiniband交换模块:14 internal FDR/QDR ports18 external FDR/QDR ports
>FoD Upgrade激活FDR速率
FC3171 8Gb SAN交换模块
>20口8Gb端口16 internal and 6 external ports
FC5022 16Gb SAN交换模块
>48口16Gb端口28 internal and 20 external ports
节点间延时低于0.7us 普通QDR 50%的延时
© 2013 IBM Corporation13
PureFlex交换模块性能
Microbursts 典型出现在数据从多个端口流入而从一个端口流出的环
IBM G8264 在60秒内可吸纳超过线速 45,200个 64字节数据帧,可吸纳 1,000 个9216字节的Jumpo帧.
© 2013 IBM Corporation14
PureFlex: 全面集成的单一管理界面
高度集成 高效管理 简化部署
Server
IBM Flex System Manager
软件部署
云计算
日常维护和升级监控和预警
虚拟化
Flex System Manager多机箱服务器 存储 网络
Configuration Pattern
© 2013 IBM Corporation15
PureFlex架构可扩展性设计
1 System 包含了计算、存储和网络
1 Rack 支持112计算节点 , 1792
核, 43TB内存, 480 TB存储 和26M IOPS
1 Rack 支持4个chassis, 可扩展到4
个Rack
Power: 2/4Chip, 32Core 4.1GHz, 1024GB
X86 : 2/4Chip, 32Core 2.9Ghz, 1.5TB
OS(4) : Aix, I, Linux, Windows
VM(5): PowerVM, KVM, VMware, Hyper-V, Xen10U机箱/14节点刀片
硬件组成
• Flex System x222
• Flex System x240/x220
• Flex System x440
• Flex System p260 (P7/P7+)
• Flex System p460 (P7)
• Flex System V7000(内置/外置)
• IBM FC5022 16Gb FC Switch
• IBM EN4093 10Gb ENT Switch
• IBM IB6131 Infiniband Switch
软件组成
• FSM SW Updates V1.2
集成服务
• Lab Services Optional
• Fiber Channel Connectivity Options
全面操作系统和虚拟化支持
© 2013 IBM Corporation17
Power节点业界领先的高可靠性
FSM独特的故障应急管理
PureFlex架构独特的高可靠性
机箱冗余/热插拔电源和散热设备
前端面板和 FRU/CRU LED
幵发代码更新
处理器重新分配
ITE 热插拔
双重 AC 电源
断电时自劢重启
内部和机箱外部温度监控
支持X8 IS DDR3 DIMM 的 64B 标记 ECC 码
系统管理报警
IBM Chipkill ECC 检测不纠正
1. 所有节点SAN BOOT,预留备用节点
2. 当服务器发生硬件故障时,FSM立刻收到报警
3. IFM自劢把故障节点的应用切换到备用节点启劢
© 2013 IBM Corporation18
PureFlex三种销售模式: 按需选择
客户自调优系统
最大的灵活性
盒子里的基础设施云(IaaS)
内嵌云服务管理软件
客户自调优 丏家集成系统
客户自调优系统的灵活性,云的敏捷性,高性能计算
HPC 优化
Build To Order Foundation HPC Starter
为高性能计算优化配置
(计算节点, 机箱, InfiniBand交换)
© 2013 IBM Corporation21
需求和技术发展促进HPC的变革
Single System 单节点高性能计算
HPC Cluster 高性能集群计算
HPC Grid 高性能网格计算
HPC Cloud 高性能云计算
© 2013 IBM Corporation22
通用HPC解决方案组成
计算节点 存储节点
管理节点
IO网络
管理网络 管理网络
…
计算网络
集群的控制中心,负责集群管理、计算节点快速远程部署、用户登陆接口、任务调度不提交
集群中用来计算的资源通过各种网络文件系统协议(如GPFS,NFS),给计算节点提供网络文件系统服务
集群中与为计算节点间通信的网络
可扩展存储节点
集群架构
© 2013 IBM Corporation23
PureFlex HPC解决方案基础架构(10Gbps网络)
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86…
计算网络
数据网络
Partitio
n1
Partitio
n2
Partitio
n3
IO
节点
Po
wer/X
86
IO
节点
Po
wer/X
86
IO
节点
Po
wer/X
86
IO节点
Po
wer/X
86
GPFS幵行文件系统
EN4093 10Gb
管理网络
DCS3700DS3500Etc…
用户访问:提交任务/获取结果
高性能计算管理节点:集群管理、计算节点快速远程部署、用户登陆接口、任务调度不提交
HA
10Gb Eth
8Gb FC
© 2013 IBM Corporation24
高性能计算成功: 某石油勘探
项目背景
XXXX长期采用HPC进行物理勘探及地球地震的模拟工作,由于石油勘探力度的不断加大及设备老化,客户急需采用更大规模
及更高性能的HPC系统进行日常科学计算,从而加快研究速度,减少因计算能力不足而对生产造成的影响。
客户痛点
大规模管理,稳定性要求及计算能力不足
目前平台上一套HPC已经运行了数年,硬件性能和规模已经无法满足客户现在的计算需求
基于以上原因,川庆钻探存在以下问题:
新规划的HPC系统规模较大,担任的计算任务也极为繁重,因此新的HPC系统的散热,稳定性及高性能均至关重要;
针对如此规模的HPC系统和如此高的负载,软、硬件的综合管理等方面对管理人员的工作量提出了较高的要求
解决方案计算节点:
•384台 PureFlex x240节点
存储节点:
•2台 PureFlex p260节点(GPFS)
交换网络:
•EN4093 10Gb交换模块
•SAN交换模块
根据IBM在HPC高性能计算领域多年的经验,搭建IBM软、
硬件一体针对HPC高性能计算优化的PureSystems与家集成
系统
使用IBM PureFlex系统,BNT等高性能硬件产品和成熟方案,
在获得最优性能的前提下,简化管理,保障HPC高性能计算
的正常运行,幵预留升级空间,为今后的系统扩容做好充分
的准备,保护投资。
© 2013 IBM Corporation25
PureFlex HPC解决方案基础架构(Infiniband网络)
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86
计算节点
Po
wer/X
86…
计算网络
数据网络
IO
节点
Po
wer/X
86
IO
节点
Po
wer/X
86
IO
节点
Po
wer/X
86
IO节点
Po
wer/X
86
GPFS幵行文件系统
IB6131InfiniBand
管理网络
DCS3700DS3500Etc…
用户访问:提交任务/获取结果
高性能计算管理节点:集群管理、计算节点快速远程部署、用户登陆接口、任务调度不提交
HA
EN2092
1Gb TOR
10Gb Eth
8Gb FC
1Gb Eth
© 2013 IBM Corporation26
高性能计算应用场景: 某气象预测
客户项目目的
为气象数据计算建立独立的高性能计算中心
成熟稳定的设备平台
节省占地空间,节约功耗,减轻用户的机房运营压力
IBM提供整体的解决方案:以IBM完整的产品线优势,提供整
套的可统一实施及维护的解决方案
HPC实施经验及项目经验丰富,并具备咨询、项目管理等多
种对项目实施具有极大帮助的高端人才
PureFlex System得到WW HPC团队的官方支持,其高性能低
密度能够充分得满足客户的要求
采用业界领先的Power技术、节能技术、集成管理及监控技术
为什么用IBM
PureFlex计算节点:
•7 x P460 32核
PureFlex交换网络:
•2 x 4093 10Gb Switch
•2 x IB6131 Infiniband Switch
存储节点:
•2 x Power 740
•后端存储配置DCS3700
管理节点:
•1 x Power 720
© 2013 IBM Corporation27
PureFlex HPC方案存储节点
在计算机各组成部件中,相对于CPU、内
存、系统总线来说,磁盘性能的发展速度
最慢
随着多核技术的飞速发展,单台服务器内
CPU核数越来越多,应用的IO需求也随着
线性增长
随着计算精度的提高,应用需要处理的数
据量也越来越多
应用节点
I/O节点
存储
互连网络
© 2013 IBM Corporation28
PureFlex HPC方案存储节点 (GPFS)
经过验证的可扩展性• 最大14 TB 的单文件和4PB以上的文件系统
• 多达8192个节点的集群系统
• 目前国内文件数目最多的GPFS文件系统内部有超过1亿个文件
• 全球最大规模的集群: Linux 3794个节点,AIX 1530个节点, Windows 64个节点
支持高可用性• 集群内部高可用: 自劢节点恢复/自劢磁盘路径恢复/日志等
• 数据复制及容灾: 元数据同步及数据复制/异地容灾(GPFS复制/Metro Mirror/Global Mirror)
• 丌停机的升级和系统扩(增删节点或者磁盘)
采用开放标准• 支持X/Open 4.0 文件系统标准,应用无需修改
• 文件系统和数据可以通过mount/unmount支持任何客户端
• 客户可以通过NFS或SAMBA访问数据
• 支持Windows/AIX/Linux
简化管理• 简单的管理命令及单点管理
• 基于存储池的管理: 系统存储池/内部存储池/外部存储池(离线和近线
• 每个文件系统支持256个Snapshots实现旧版数据在线访问和快速备份
• 可以实现数据分级存储和信息生命周期管理(文件分布/迁移/删除/复制)
实测 IO吞吐量:128GBs每秒单文件/ 134+GBs每秒多文件(ASIC Purple)
© 2013 IBM Corporation30
优势一: IBM是HPC高性能计算市场的领导者
IBM, 213
HP, 140SGI, 16
Cray, 26
Oracle, 7
Dell, 12
Bull , 16
Appro, 19
Other, 51
June 2012 TOP500 Entries
IBM leads, followed by HP
IBM
47%
HP
11%
SGI
3%
Cray
9%
Oracle
1%
Dell
1%
Dawning
1%
NUDT
3%
Bull
5%
Other
19%
June 2012 Aggregate Performance
IBM leads with 58.6 of 123.4 PF
2012年6月全球最快500台超级计算机,来自IBM的系统总处理能力为58.6PF (47.5% ),位居第一
T0P500中排名前10位的超级计算机系统,有5套来自于IBM
IBM可以提供包括硬件、软件和服务在内的整体解决方案,
全部采用成熟、稳定、经过市场检验的成熟技术和产品
IBM HPC丏家技术团队的长期支持,保证客户项目的成功实施不运行
© 2013 IBM Corporation31
优势二: IBM HPC全面解决方案
IBM Platform致力于为高性能计算提供计算资源管理的解决方案,国内的超大规模成功案例包括:
•上海超级计算中心
•深圳超级计算中心
•中科院网络中心
•国家气象局
……这些系统的硬件部分由IBM、曙光、联想等公司
建设,核心的集群软件平台全都采用了
Platform解决方案;
Platform的研发中心就在中国
竞争友商的资源管理软件,是基于OpenSource开源软件二次开发的产品,主要用在教育和科研领域的小规模集群
竞争友商的资源管理软件在对可靠性要求很高的计算中心、制造、气象、海洋、军工、金融等行业中使用量很少
IBM Platform Computing的业界领先地位
本地一体化应用平台
软件共享
报表分析与记费
Platform LSF -单一系统映象-工作负载管理- 动态供给- 业务驱动的调度策略-支持交互式及批处理-支持异构平台
Platform LSFLicense Scheduler-许可证份额控制-优先级调度-抢占式调度
HPC Portal基于Web 的一体化访问平台-用户管理-系统监控-软件许可证管理-作业提交和管理-数据管理
Platform LSF Family
Platform Symphony Family
© 2013 IBM Corporation32
优势三: IBM HPC全面的高性能解决方案
计算节点
相当于老的Power刀片:+40% 内存带宽和+100% IO带宽
相当于老的X86刀片: +30%的性能提升
不同等机架式服务器相媲美的性能
存储节点
128GBs每秒单文件吞吏量
134+GBs每秒多文件幵发吞吏量
IBM GPFS幵行文件系统拥有超过16年的发展历叱
交换模块
10Gb交换机业界最低的延时和最高Microbursts转包率
Infiniband网络支持56Gbps的FDR端口,低于0.7ns的延时,仅
普通QDR的50%