天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go...
Transcript of 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go...
2014年08月29日
百度:张家军
天蝎整机柜服务器V2.0(Project Scorpio Rack Server V2.0)
We did it!
2
通过开放、协作、创新、共赢的方式共同推动行业合作、产业创新和新技术应用,导向形成整机柜服务器行业规范,以降低TCO及提升交付运维效率,并促进服务器和数据中心的融合
天蝎项目使命
3
Go Your Own Road -- Erik Johansson
不忘初心,砥砺前行
4
The Road We Go
2011.11
项目成立并在IPDC上发布
发布整机柜服务器技术规范v1.0
200+Rack规模落地部署 广州会议,讨论天蝎
2.0需求与规范
召开第一次研讨会,听取厂商对技术方案的反馈
2011.12
2012.04
2012.09
2012.12
2013.06
中国电信加入天蝎项目
完成天蝎2.0技术规范Rev 0.5
2013.10
2013.09
天蝎机柜部署量接近
500Rack,7家Vendor提供产品
天蝎2.0 Rev 1.0发布2000+Rack Deployed
2014.08
l2年半,2代产品,4次迭代
l2年,200Rack到2000Rack
l1年,V2.0从Concept到Deployed
5
天蝎Roadmap
天蝎1.0 天蝎2.0 天蝎3.0设计理念 结构创新 标准化 架构创新设计内容 功能设计
1)共享架构+模块化 集中供电、集中散热、集中管理6大模块2)一体交付
规格设计
1)模块标准化2)统一接口、规范、协议3)生态共享4)高度兼容
架构设计????????????
收益 •节能•交付效率提升10倍
•TCO•运维•生态、融合
????
Schedule 2011-2013 2013-2015 2015??
6
Why 2.0?
一 技术问题汇总
• 业务透明性:背板故障需要下线节点进行运维,没有完全实现非节点类故障运维对业务透明
• 硬盘热插拔:暂不支持大容量存储的硬盘热插拔运维
• 节点配置单一: 机柜对节点的类型兼容性差,类型单一
• 标准不统一:v1.0只定义了框架设计,各厂商的结构实现、散热、供电、管理都不统一。运
维效率、部件通用型、散热优化、供电与散热管理、可互换支持都成为新挑战
• 细节粗糙:局部技术细节处理粗糙
二 非技术类问题汇总
• 规模与成本:部署规模小,分摊研发成本大
• 数据中心支持:节点类型和部署规模同时受数据中心支持的制约
• 重复开发成本高:主要体现在结构模具成本上和管理软件开发上
7
天蝎2.0的变化
V1.0 V2.0
天蝎1.0 天蝎2.0 标准化设计 No Yes 机柜内宽 19” 21”机柜高度 2100mm
2100mm &
2300mm单节点支持的最大硬盘数量
8 14-20统一的定制化电源 No Yes 全模块化 No Yes
统一所有硬件接口 No Yes 统一所有管理API No Yes 统一散热设计 No Yes
8
天蝎2.0规范内容
• 结构子系统• 供电子系统• 散热子系统• 管理子系统• 节点子系统• 网络子系统
9
天蝎2.0-结构设计
3U Switch Zone3U x 46.5mm=139.5mm
20U Server Zone20U x 46.5mm=930mm
3U Power Zone3U x 46.5mm=139.5mm
20U Server Zone20U x 46.5mm=930mm
3U Switch Zone3U x 46.5mm=139.5mm
16U Server Zone16U x 46.5mm=744mm
3U Power Zone3U x 46.5mm=139.5mm
20U Server Zone20U x 46.5mm=930mm
2300mm Rack 2100mm Rack
10
天蝎2.0-电源设计
u 定制化高效电源
u 实现电源框的互换
u 统一管理软件接口
u 统一电性结构规格
u 去PDU,无缆化
u N+N/N+1的电源模块ü单输入模块ü支持AC+AC,AC+DC,DC+DC
11
天蝎2.0-散热设计
Thermal设计
• 统一采用140*38的风扇设计,上下share
cooling zone设计
• 根据V1.0的各类散热方案分析,140*38风扇效
率为最佳
• 风扇Tray可以根据实际需求灵活配置,可按照
1U单位调节
• N+2冗余设计
• 统一的接口定义,可以兼容不同厂商的风扇
• 通过仿真得出静压腔深度统一为200mm
12
天蝎2.0-管理架构拓扑
1 机柜管理设计:
• 所有板卡支持热插拔设计
• 所有模块运维对业务透明
• 统一所有管理链路的接口和pin definition
逻辑上实现节点混插
• 支持多类节点共存
• 采用I2C和 Ethernet结合的管理架构提高管理通信的稳定性和效率
2 整机柜RMC监控设计
• 提供统一的RMC管理接口
• 统一数据监控格式和内容
• 提供风扇,电源控制接口
• 对外提供统一的API
13
1 非热插拔硬盘最大支持14 * 3.5”2 热插拔硬盘最大支持12 * 3.5”3 两边硬盘tray可以单独抽出进行硬盘热插拔维护4 整个Tray可以整体抽出进行整体维护
天蝎2.0-节点 Reference Design
14
一些思考和探索
配电系统
空调系统
独立的监控管理
传统数据中心设计
独立机箱
独立电源
独立风扇
独立管理
传统服务器设计
分布式供电/内置电池
列间制冷/自然风冷却
统一管理,智能控制,供电、散热随IT负载动态调节
集中供电
集中散热/无风扇设计
模块化构建,分布式部署
IT设备机房
分布 共享
15
一些思考和探索
• 解耦合与重耦合、混合架构、资源池化、可重构、SDD(Software Defined Datacenter)
•练内功:设计能力->创新能力;规范->标准;系统->部件->架构
• 两结合:结合应用,提升资源使用率;结合DC,降低TCO
• Eco-System:行业联合,产业支持
16