天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go...

16
20140829百度:张家军 天蝎整机柜服务器V2.0 (Project Scorpio Rack Server V2.0) We did it!

Transcript of 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go...

Page 1: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

2014年08月29日

百度:张家军

天蝎整机柜服务器V2.0(Project Scorpio Rack Server V2.0)

We did it!

Page 2: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

2

通过开放、协作、创新、共赢的方式共同推动行业合作、产业创新和新技术应用,导向形成整机柜服务器行业规范,以降低TCO及提升交付运维效率,并促进服务器和数据中心的融合

天蝎项目使命

Page 3: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

3

Go Your Own Road -- Erik Johansson

不忘初心,砥砺前行

Page 4: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

4

The Road We Go

2011.11

项目成立并在IPDC上发布

发布整机柜服务器技术规范v1.0

200+Rack规模落地部署 广州会议,讨论天蝎

2.0需求与规范

召开第一次研讨会,听取厂商对技术方案的反馈

2011.12

2012.04

2012.09

2012.12

2013.06

中国电信加入天蝎项目

完成天蝎2.0技术规范Rev 0.5

2013.10

2013.09

天蝎机柜部署量接近

500Rack,7家Vendor提供产品

天蝎2.0 Rev 1.0发布2000+Rack Deployed

2014.08

l2年半,2代产品,4次迭代

l2年,200Rack到2000Rack

l1年,V2.0从Concept到Deployed

Page 5: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

5

天蝎Roadmap

天蝎1.0 天蝎2.0 天蝎3.0设计理念 结构创新 标准化 架构创新设计内容 功能设计

1)共享架构+模块化 集中供电、集中散热、集中管理6大模块2)一体交付

规格设计

1)模块标准化2)统一接口、规范、协议3)生态共享4)高度兼容

架构设计????????????

收益 •节能•交付效率提升10倍

•TCO•运维•生态、融合

????

Schedule 2011-2013 2013-2015 2015??

Page 6: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

6

Why 2.0?

一 技术问题汇总

• 业务透明性:背板故障需要下线节点进行运维,没有完全实现非节点类故障运维对业务透明

• 硬盘热插拔:暂不支持大容量存储的硬盘热插拔运维

• 节点配置单一: 机柜对节点的类型兼容性差,类型单一

• 标准不统一:v1.0只定义了框架设计,各厂商的结构实现、散热、供电、管理都不统一。运

维效率、部件通用型、散热优化、供电与散热管理、可互换支持都成为新挑战

• 细节粗糙:局部技术细节处理粗糙

二 非技术类问题汇总

• 规模与成本:部署规模小,分摊研发成本大

• 数据中心支持:节点类型和部署规模同时受数据中心支持的制约

• 重复开发成本高:主要体现在结构模具成本上和管理软件开发上

Page 7: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

7

天蝎2.0的变化

V1.0 V2.0

  天蝎1.0 天蝎2.0 标准化设计 No Yes 机柜内宽 19” 21”机柜高度 2100mm

2100mm &

2300mm单节点支持的最大硬盘数量

8 14-20统一的定制化电源 No Yes 全模块化 No Yes

统一所有硬件接口 No Yes 统一所有管理API No Yes 统一散热设计 No Yes

Page 8: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

8

天蝎2.0规范内容

• 结构子系统• 供电子系统• 散热子系统• 管理子系统• 节点子系统• 网络子系统

Page 9: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

9

天蝎2.0-结构设计

3U Switch Zone3U x 46.5mm=139.5mm

20U Server Zone20U x 46.5mm=930mm

3U Power Zone3U x 46.5mm=139.5mm

20U Server Zone20U x 46.5mm=930mm

3U Switch Zone3U x 46.5mm=139.5mm

16U Server Zone16U x 46.5mm=744mm

3U Power Zone3U x 46.5mm=139.5mm

20U Server Zone20U x 46.5mm=930mm

2300mm Rack 2100mm Rack

Page 10: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

10

天蝎2.0-电源设计

u 定制化高效电源

u 实现电源框的互换

u 统一管理软件接口

u 统一电性结构规格

u 去PDU,无缆化

u N+N/N+1的电源模块ü单输入模块ü支持AC+AC,AC+DC,DC+DC

Page 11: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

11

天蝎2.0-散热设计

Thermal设计

• 统一采用140*38的风扇设计,上下share

cooling zone设计

• 根据V1.0的各类散热方案分析,140*38风扇效

率为最佳

• 风扇Tray可以根据实际需求灵活配置,可按照

1U单位调节

• N+2冗余设计

• 统一的接口定义,可以兼容不同厂商的风扇

• 通过仿真得出静压腔深度统一为200mm

Page 12: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

12

天蝎2.0-管理架构拓扑

1 机柜管理设计:

• 所有板卡支持热插拔设计

• 所有模块运维对业务透明

• 统一所有管理链路的接口和pin definition

逻辑上实现节点混插

• 支持多类节点共存

• 采用I2C和 Ethernet结合的管理架构提高管理通信的稳定性和效率

2 整机柜RMC监控设计

• 提供统一的RMC管理接口

• 统一数据监控格式和内容

• 提供风扇,电源控制接口

• 对外提供统一的API

Page 13: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

13

1 非热插拔硬盘最大支持14 * 3.5”2 热插拔硬盘最大支持12 * 3.5”3 两边硬盘tray可以单独抽出进行硬盘热插拔维护4 整个Tray可以整体抽出进行整体维护

天蝎2.0-节点 Reference Design

Page 14: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

14

一些思考和探索

配电系统

空调系统

独立的监控管理

传统数据中心设计

独立机箱

独立电源

独立风扇

独立管理

传统服务器设计

分布式供电/内置电池

列间制冷/自然风冷却

统一管理,智能控制,供电、散热随IT负载动态调节

集中供电

集中散热/无风扇设计

模块化构建,分布式部署

IT设备机房

分布 共享

Page 15: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

15

一些思考和探索

• 解耦合与重耦合、混合架构、资源池化、可重构、SDD(Software Defined Datacenter)

•练内功:设计能力->创新能力;规范->标准;系统->部件->架构

• 两结合:结合应用,提升资源使用率;结合DC,降低TCO

• Eco-System:行业联合,产业支持

Page 16: 天蝎整机柜服务器V2.0 2014-08-28 baidu - IDCQUAN.com · 2020-03-20 · 4 The Road We Go 2011.11 项目成立并在 IPDC上发布 发布整机柜服务器技 术规范v1.0 200+Rack规模

16