Cloudera CDH5 3 DataSheet Chinese - 数据中心解决 ... · Apache HCatalog 对存放在Hadoop...

2
DATA SHEET CDH 5.3 CDH 将 HADOOP 生态系统 的力量带给企业 集成 快速建立快速运行于一个完 整的包装好的基于 Apache Hadoop 的系统 安全 处理和控制敏感的数据,提供多 租户的运行设施 可扩展延伸的 为广泛的应用提供运行设施,并随着业务 成长 高可用性 信心十足地运行关键业务的应 用和负载 兼容 扩充和利用现有的基础架 构的投资 开放 受益于高速的创新,并且无需受 制于专有供应商的锁定 数据对我们的业务是不 可或缺的。CDH 占据 了我们数据分析系统的 中央。 企业级的 Hadoop 标准,100% 开源 CDH 是 Cloudera 的 100% 开源平台分发版. 它包含了 Apache Hadoop™ ,并且特别创建 了来满足企业的需求。作为最为广泛部署的 Hadoop 分发版, CDH 正运行在比如银行, 电信,媒体,零售,政府等这样的最大型的组织里的扩展至数百个节点的生产环境 里。. 包含 Apache Hadoop 和超过两位数的其他领先的开源项目,CDH 将存储和计算集成 进单一的, 可扩展的系统,交付了用户大数据运营所要求的灵活性和经济性,而这些 运营如果采用传统的解决方案,限于时效性和成本,是根本不可能实现的。通过赋予 您以下的能力,CDH 将帮助您操作您的数据,驱动您的业务: > 将存储和计算统一到单一的系统资源池内 > 存储任意格式的数据, 不会受限于苛刻的数据架构 > 将一个计算框架的灵活数组带入一个单一数据池-- 包括批处理,交互式 SQL, 交互式搜索,机器学习,流处理及一系列的第三方应用。 > 以并行方式,在具有线性扩展性的地方处理数据 > 实时向用户和应用交付数据 > 与您现有的数据管理和分析工具集成 作为 Cloudera 企业方案的核心部件和一个企业数据枢纽架构, CDH 交付了 Hadoop 的核 心元素--可扩展的存储和分布式的计算--以及所有必需的企业级支持能力比如安全,高可 用性和广泛的硬件软件方案相集成。对那些寻找一个稳定的,有历史经验证明的,开源 的大数据管理方案,并且避免专有供应商锁定的企业来说, CDH 是使得其用户组织既 在生产中可靠地使用 Hadoop ,同时又从开源社区借助到持续的无穷的创新的独一无二 的方案。 最先进的 Hadoop 分发版, 就绪部署 CDH 是世上最完整的, 业经测试的 和最流行的企业级 Apache Hadoop 分发版。所有的软 件打包和集成工作都为了您,整个方案经过了彻底的测试并附完整的文档记录。 剔除了 您在 Hadoop 部署中的怀疑感, CDH 给了您成功通过大数据来解决实际业务问题的捷 径。

Transcript of Cloudera CDH5 3 DataSheet Chinese - 数据中心解决 ... · Apache HCatalog 对存放在Hadoop...

  • DATA SHEE T

    CDH 5.3

    CDH 将 HADOOP 生态系统

    的力量带给企业

    集成

    快速建立快速运行于一个完

    整 的 包 装 好 的 基 于 Apache

    Hadoop 的系统

    安全

    处理和控制敏感的数据,提供多

    租户的运行设施

    可扩展延伸的

    为广泛的应用提供运行设施,并随着业务

    成长

    高可用性

    信心十足地运行关键业务的应

    用和负载

    兼容

    扩充和利用现有的基础架

    构的投资

    开放

    受益于高速的创新,并且无需受

    制于专有供应商的锁定

    数据对我们的业务是不

    可或缺的。CDH 占据

    了我们数据分析系统的

    中央。

    企业级的 Hadoop 标准,100% 开源

    CDH 是 Cloudera 的 100% 开源平台分发版. 它包含了 Apache Hadoop™ ,并且特别创建

    了来满足企业的需求。作为最为广泛部署的 Hadoop 分发版, CDH 正运行在比如银行,

    电信,媒体,零售,政府等这样的最大型的组织里的扩展至数百个节点的生产环境

    里。.

    包含 Apache Hadoop 和超过两位数的其他领先的开源项目,CDH 将存储和计算集成

    进单一的, 可扩展的系统,交付了用户大数据运营所要求的灵活性和经济性,而这些

    运营如果采用传统的解决方案,限于时效性和成本,是根本不可能实现的。通过赋予

    您以下的能力,CDH 将帮助您操作您的数据,驱动您的业务:

    >将存储和计算统一到单一的系统资源池内

    >存储任意格式的数据, 不会受限于苛刻的数据架构

    >将一个计算框架的灵活数组带入一个单一数据池-- 包括批处理,交互式 SQL,

    交互式搜索,机器学习,流处理及一系列的第三方应用。

    >以并行方式,在具有线性扩展性的地方处理数据

    >实时向用户和应用交付数据

    >与您现有的数据管理和分析工具集成

    作为 Cloudera 企业方案的核心部件和一个企业数据枢纽架构, CDH 交付了 Hadoop 的核

    心元素--可扩展的存储和分布式的计算--以及所有必需的企业级支持能力比如安全,高可

    用性和广泛的硬件软件方案相集成。对那些寻找一个稳定的,有历史经验证明的,开源

    的大数据管理方案,并且避免专有供应商锁定的企业来说, CDH 是使得其用户组织既

    在生产中可靠地使用 Hadoop ,同时又从开源社区借助到持续的无穷的创新的独一无二

    的方案。

    最先进的 Hadoop 分发版, 就绪部署

    CDH 是世上最完整的, 业经测试的 和最流行的企业级 Apache Hadoop 分发版。所有的软

    件打包和集成工作都为了您,整个方案经过了彻底的测试并附完整的文档记录。 剔除了

    您在 Hadoop 部署中的怀疑感, CDH 给了您成功通过大数据来解决实际业务问题的捷

    径。

  •    

    | 2

    CDH 项目和描述

    项目 描述 CDH 5.3.1

    Apache Avro 通过网络来存储和传输数据的串行化系统 v1.7.6

    Apache Crunch 撰写,测试,运行 MapReduce 和 Spark 管道的 Java 库框架 v0.11.0

    Apache DataFu Apache Pig 的 用户定义功能(UDFs)库 v1.1.0

    Apache Flume NG 收集和聚合日志和事件数据,实时流写入 HDFS 或 HBase 的分布式框架 v1.5.0

    Apache Hadoop 可靠的,可扩展的,分布式的存储和计算平台 v2.5.0

    FUSE-DFS 把 HDFS 当做传统文件系统来 mount 的模块 v2.5.0

    HDFS Hadoop 分布式文件系统—可扩展的, 分布式的,容错的数据存储 v2.5.0

    MapReduce Apache Hadoop 的分布式计算框架 v2.5.0

    MapReduce2(YARN) 新一代的 MapReduce 框架 v2.5.0

    Apache HBase 实时读写访问的可扩展的记录和表的存储 v0.98.6

    Apache HCatalog 对存放在 Hadoop 里的数据提供表和存储的管理服务 已并入 Hive

    Apache Hive 具备类 SQL 接口和 ODBC/JDBC 驱动的元数据知识库连接 BI 应用和 Hadoop v0.13.1

    Cloudera Hue 具备 Apache 许可证的基于浏览器的桌面 Hadoop 接口。 v3.7.0

    Cloudera Impala 具备 Apache 许可证的,实时,针对存放在 HDFFS 和 Hbase 的数据的基于 SQL 的查询引擎

    yenginefordatastoredinHDFSorHBase

    V2.1.1

    Kite SDK 具备 Apache 许可证的 SDK 库,工具,样例的集合,简化 Hadoop 应用的开发 v0.12.0

    Apache Mahout Hadoop 的机器算法的库 v0.9

    Apache Oozie 协调 Hadoop 活动的工作流程引擎 v4.0.0

    Parquet 具备 Apache 许可证的面向列的文件格式 v1.5.0

    Apache Pig 处理存放在 Hadoop 里的数据的高级数据流语言 v0.12.0

    Cloudera Search CDH 和 Solr 里的各种项目的集合 v1.0

    Lily HBase Indexer 具备 Apache 许可证的为 Hbase 里的数据实时建立索引的模块 v1.5

    Apache Solr 文本,模糊数学和分面搜索引擎 v4.4.0

    Apache Sentry(Incubating) 为 Impala&Hive 提供精细化的基于角色授权的模块 v1.3.0

    Apache Spark 支持循环数据流和内存计算的高速通用数据处理引擎 v1.2.0

    Apache Sqoop 为集成 Hadoop 和关系数据库的数据传输引擎 v1.4.5

    Apache Sqoop2 Sqoop 的并发和服务支持 v1.99.4

    Apache Whirr 在云端部署和运行 Hadoop 的数学库 v0.9.0

    Apache Zookeeper 高可靠的分布式协同服务 v3.4.5

    详细列表请参阅:http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/cdh_vd_cdh_package_tarball.html

    CDH 5.3 技术规范

    Supported Cloudera Manager Versions Cloudera Manager 5.0 and later

    Supported Cloudera Navigator Versions Cloudera Navigator 1.2 and later

    Supported Operating Systems Red Hat Enterprise Linux 5.7*, 6.2, 6.4*

    CentOS 5.7*, 6.2, 6.4* Oracle Linux 5.6*, 6.4* - w/UEK 2 SUSE Linux Enterprise Server 11* (SP2 or later) Debian 7.x* 12.04* (Precise)

    * 64-bit only

    Support JDK JDK1.7u25, JDK1.7u45

    Support Build Infrastructure Apache Maven

    Supported Cloud Platforms Amazon EC2, Rackspace, SoftLayer

    英文在线版本文档请参阅:http://www.cloudera.com/content/dam/cloudera/Resources/PDF/Datasheet/cloudera-cdh-datasheet.pdf

    Cloudera ,上海市延安西路 2299 号世贸商城 2612 室 200336, 021-62369001,

    [email protected] | zh-cn.cloudera.com

    ©2014Cloudera,Inc.Allrightsreserved.ClouderaandtheClouderalogoaretrademarksorregisteredtrademarksofCloudera,Inc.intheUSAandothercountries.All other trademarks are

    the property of their respective companies. Information is subject to change without notice. cloudera-cdh5-datasheet-Q114-103