大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf ·...

16
http://www.cgws.com 请参考最后一页评级说明及重要声明 投资评级:推荐(维持) 周伟佳 CFA, ACCA 0755-83516551 Email:[email protected] 执业证书编号:S1070514110001 股票名称 EPS PE 15E 16E 15E 16E 天源迪科 0.36 0.54 51.8 34.3 东方国信 0.41 0.60 83.9 56.7 行业表现 数据来源:贝格数据 相关报告 大数据行业独角兽 Palantir 启示录 Palantir 概述。 2004 年, Paypal 创始人兼 Facebook 早期投资人的 Peter Thiel Alex Karp,以及 Joe LonsdaleStephen CohenNathan Gettings 共同创立 Palantir。目前其主要的服务对象是政府和金融机构,同时业 务还涉及医疗、零售、生物科技、自然灾害救援、网络安全等多个领域。 Palantir 发展历程。Palantir 以做情报分析起家,NSACIAFBI 等都 是公司的客户,直至 2008 年公司都只是在为政府客户服务。公司随后在 其他领域,尤其是金融领域取得重大突破,非政府客户已达到 70%以上。 Palantir 自成立以来,经历 8 轮融资共计超过 10 亿美元, 2014 年收入达 10 亿美元,估值接近 200 亿美元,PS 达到约 20 倍,成为继 Uber小米、Airbnb 之后,全球估值第四高的创业公司。 Palantir 技术与产品。 Palantir 主要有两款产品 Palantir Gotham Palantir Metropolis。前者主要应用于国防、反恐和危机应对等。后者目前主要 应用于金融服务。Palantir 的大数据技术已经形成了十余种解决方案, 根据官网披露,Palantir 的解决方案遍布反诈骗、资本市场分析、国防、 网络安全、医疗、保险分析、情报分析、行为监控、案例管理、灾害防 范、危机应对等领域。 Palantir 四大亮点。Palantir 作为美国大数据龙头公司,自身亮点颇多。 通过研究,我们认为其最闪耀的四大亮点分别为从政府业务到金融业务 的发展路径、注重信息安全和隐私保护、人才济济的技术团队和人机结 合的分析模式。 对中国企业的四大启示。 大数据公司分为三类,可分别定义为数据拥有 者、技术提供者、服务提供者。本文通过借鉴 Palantir 的发展经验,主 要分析对国内技术提供者中的软件提供商以及服务提供者发展的启示。 四大启示分别是明确公司定位以及跨领域发展规划、注重信息安全和隐 私保护、人才成为竞争的重中之重、重视人机结合的分析模式。 大数据公司可取的发展思路。 第一阶段,将自身客户定位于具有较高社 会和市场影响力的政府机关、大型集团或知名企业,深耕大数据的某一 细分行业领域;第二阶段,在细分行业领域取得成功案例和大客户信任 后,拓展到需求旺盛、定价较高的其他领域,实现技术沉淀和名望积累 的快速变现,完成估值飞跃;第三阶段,凭借已有的渠道、人才、资金 的积累,继续拓展业务范围,巩固业内领先地位。 -100% -50% 0% 50% 100% 沪深300 计算机 分析师 要点 证券研究报告 计算机行业| 行业深度报告 2015 11 05 重点推荐公司盈利预测

Transcript of 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf ·...

Page 1: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

http://www.cgws.com 请参考最后一页评级说明及重要声明

投资评级:推荐(维持)

周伟佳 CFA, ACCA 0755-83516551

Email:[email protected]

执业证书编号:S1070514110001

股票名称 EPS PE

15E 16E 15E 16E

天源迪科 0.36 0.54 51.8 34.3

东方国信 0.41 0.60 83.9 56.7

行业表现

数据来源:贝格数据

相关报告

大数据行业独角兽Palantir启示录

Palantir 概述。2004 年, Paypal 创始人兼 Facebook 早期投资人的 Peter

Thiel 和 Alex Karp,以及 Joe Lonsdale、Stephen Cohen、Nathan Gettings

共同创立 Palantir。目前其主要的服务对象是政府和金融机构,同时业

务还涉及医疗、零售、生物科技、自然灾害救援、网络安全等多个领域。

Palantir 发展历程。Palantir 以做情报分析起家,NSA、CIA、FBI 等都

是公司的客户,直至 2008 年公司都只是在为政府客户服务。公司随后在

其他领域,尤其是金融领域取得重大突破,非政府客户已达到 70%以上。

Palantir 自成立以来,经历 8 轮融资共计超过 10 亿美元,2014 年收入达

到 10 亿美元,估值接近 200 亿美元,PS 达到约 20 倍,成为继 Uber、

小米、Airbnb 之后,全球估值第四高的创业公司。

Palantir技术与产品。Palantir主要有两款产品Palantir Gotham和 Palantir

Metropolis。前者主要应用于国防、反恐和危机应对等。后者目前主要

应用于金融服务。Palantir 的大数据技术已经形成了十余种解决方案,

根据官网披露,Palantir 的解决方案遍布反诈骗、资本市场分析、国防、

网络安全、医疗、保险分析、情报分析、行为监控、案例管理、灾害防

范、危机应对等领域。

Palantir 四大亮点。Palantir 作为美国大数据龙头公司,自身亮点颇多。

通过研究,我们认为其最闪耀的四大亮点分别为从政府业务到金融业务

的发展路径、注重信息安全和隐私保护、人才济济的技术团队和人机结

合的分析模式。

对中国企业的四大启示。大数据公司分为三类,可分别定义为数据拥有

者、技术提供者、服务提供者。本文通过借鉴 Palantir 的发展经验,主

要分析对国内技术提供者中的软件提供商以及服务提供者发展的启示。

四大启示分别是明确公司定位以及跨领域发展规划、注重信息安全和隐

私保护、人才成为竞争的重中之重、重视人机结合的分析模式。

大数据公司可取的发展思路。第一阶段,将自身客户定位于具有较高社

会和市场影响力的政府机关、大型集团或知名企业,深耕大数据的某一

细分行业领域;第二阶段,在细分行业领域取得成功案例和大客户信任

后,拓展到需求旺盛、定价较高的其他领域,实现技术沉淀和名望积累

的快速变现,完成估值飞跃;第三阶段,凭借已有的渠道、人才、资金

的积累,继续拓展业务范围,巩固业内领先地位。

-100%

-50%

0%

50%

100%

沪深300 计算机

分析师 要点

证券研究报告

计算机行业| 行业深度报告

2015年 11月 05日

重点推荐公司盈利预测

Page 2: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 2 请参考最后一页评级说明及重要声明

目录

1. Palantir 的神奇历程 ................................................................................................................ 4

1.1 发展历程、业绩与估值 ................................................................................................. 4

1.2 业务领域及应用案例 ..................................................................................................... 4

2. 对中国大数据企业的启示 ..................................................................................................... 7

2.1 Palantir 亮点分析 ............................................................................................................ 7

2.2 对中国企业的启示 ......................................................................................................... 8

3. 大数据巨头进化路径总结 ................................................................................................... 15

Page 3: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 3 请参考最后一页评级说明及重要声明

图表目录

图 1:Palantir 成长逻辑框图 ..................................................................................................... 7

图 2:云环境的数据隐私保护系统架构 ................................................................................. 11

图 3:包含多个公有云的混合云架构 ..................................................................................... 11

图 4:数据脱敏架构 ................................................................................................................. 12

图 5:大数据巨头进化要素图 ................................................................................................. 15

表 1:Palantir 发展历程 ............................................................................................................. 4

表 2:Palantir 技术产品 ............................................................................................................. 5

表 3:Palantir 解决分案介绍 ..................................................................................................... 5

表 4:大数据公司分类 ............................................................................................................... 8

表 5:大数据涉及的行业领域 ................................................................................................... 9

表 6:大数据信息安全和隐私保护的关键技术 ..................................................................... 10

表 7:数据脱敏概念与分类 ..................................................................................................... 12

表 8:大数据人才岗位需求 ..................................................................................................... 13

表 9:大数据巨头进化路径 ..................................................................................................... 15

Page 4: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 4 请参考最后一页评级说明及重要声明

1. Palantir 的神奇历程

1.1 发展历程、业绩与估值

Palantir 在 2004 年是由 Paypal 创始人兼 Facebook 早期投资人的 Peter Thiel 和他在斯坦福

大学的老同学 Alex Karp,以及 Joe Lonsdale、Stephen Cohen、Nathan Gettings 共同创立的。

主要的服务对象是政府和金融机构,同时业务还涉及医疗、零售、生物科技、自然灾害

救援、网络安全等多个领域。

Palantir 以做情报分析起家,NSA、CIA、FBI 等都是公司的客户,直至 2008 年公司都只是

在为政府客户服务。据统计 2009-2014 年共获得了 2.15 亿美元的政府订单。大量的政府

订单和政府影响力成为公司继续拓展业务的良好基础,公司随后在其他领域,尤其是金

融领域取得重大突破,在 2013 年底公司已经有 60%的订单来自于非政府客户,目前最新

数据显示这个数字已更新为 70%以上。

Palantir 自 2004 年成立以来,经历 8 轮融资共计超过 10 亿美元,2014 年收入达到 10 亿

美元,估值接近 200 亿美元,PS 达到约 20 倍,成为继 Uber、小米、Airbnb 之后,全球

估值第四高的创业公司。

表 1:Palantir 发展历程

时间 主要事件

2004 年 Palantir 创立于 2004 年,总部位于美国加州帕洛阿尔托。

Palantir 的第一笔外部投资来自于 In-Q-Tel——中央情报局下的非盈利风资公司。

2010 年 拥有 250 位工程师的 Palantir 完成 9000 万美元的 D 轮融资,估值达到 7.35 亿美元。

2013 年 Palantir 收购语音邮件服务公司 Voicegem。

Palantir 通过新一轮价值 1.075 亿美元的融资,估值达到 90 亿美元。此时 Palantir 的年

收入已经超过 4.5 亿美元。

2014 年 Palantir 连续收购了社交测试服务公司 Poptip 和移动应用孵化公司 Propeller。

Palantir 再拿到 5 亿美元投资,年收入约为 10 亿美元,估值达到了 150 亿美元。

2015 年 Palantir 收购全渠道营销平台的创业公司 Fancy That。

2015 年 7 月底递交给美国证券交易委员会的文件显示,Palantir 成功融资约 4.5 亿美元。

同时,公司已有有 1500 名员工。

至此,Palantir 共计 8 轮融资,总额超过 10 亿美元,估值已接近 200 亿美元。

资料来源:福布斯,纽约时报,Palantir 官网,长城证券研究所

1.2 业务领域及应用案例

Palantir 主要有两款产品:Palantir Gotham 和 Palantir Metropolis。前者主要应用于国防、

反恐和危机应对等。后者目前主要应用于金融服务。

Page 5: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 5 请参考最后一页评级说明及重要声明

表 2:Palantir 技术产品

产品 简介 优势

Palantir Gotham 把分散在各种不同数据库中的结构

化数据如日志文件、电子表格等和

非结构化数据如电子邮件、文档、

图像和视频等整合在一个统一的平

台上,并完成数据分析与用户交互。

1.整合数据的同时,将所有的相关数据自动

连接起来,形成多种相关的数据链条。

2.挖掘原本看似不相关的数据之间的联系。

3.平台通过自身的处理和分析为普通用户提

供了良好的交互功能。

4.用户的所有分析行为也会被监控和保存,

最大程度保障信息安全。

Palantir Metropolis 跨数据源将不同的信息汇集到统一

的定量分析环境中,进行大规模定

量数据的分析。目前已经开发出适

用于跟踪分析保险理赔、网络流量

和金融交易等领域的功能。

1.该平台整合了不同模型,实现从简单到复

杂的模型嵌套。

2.开发出可视化工具,实现更好的用户交互。

3.实现数据的实时更新。

资料来源:Palantir 官网,长城证券研究所

Palantir 的大数据技术已经形成了十余种解决方案,根据官网披露,Palantir 的解决方案遍

布反诈骗、资本市场分析、国防、网络安全、医疗、保险分析、情报分析、行为监控、

案例管理、灾害防范、危机应对等领域。

表 3:Palantir 解决分案介绍

解决方案 简介

反诈骗 面向金融机构和政府,以发现和避免诈骗犯罪活动,主要包括信用卡欺诈、洗钱、抵押

贷款欺诈、骗税逃税以及身份欺诈等。

案例管理 提供协作业务流程管理的高灵活性解决方案。通过整合完整的工作环境数据平台,有效

地提高用户协作办公效率。

网络安全 检测隐藏在数据中的高级威胁。通过检测所有的网络日志、电子邮件、打印日志、设备

访问日志、内部聊天记录和人力资源数据、开源和第三方数据,并从噪声信号中分离操

作信号,保护网络安全。

灾害防范与危机应对 旨在帮助人们对意料之外的自然灾害、政治冲突、经济危机作出应对。在整合公开数据、

卫星图像、天气报告、基础设施、救灾资源、地理空间信息、新闻动态等海量数据的基

础上,提供危机应对的服务。

医疗服务 整合不同的数据源,建立连接到本地数据集和外部数据源的联合搜索,实现合作伙伴的

实施协作。

保险分析 帮助保险企业获取数据洞察力,识别欺诈性索赔。尤其是通过整合分析处方信息、药品

属性、处方交易数据、和类似医院的数据,识别公共和私人医疗保险索赔中的医患联合

诈骗。

执法 客户对象是执法机构,帮助执法人员从众多数据库中快速提取分析犯罪嫌疑人的相关数

据,并生成报告和及时应对犯罪发生。

Palantir Verus 针对数据滥用问题的解决方案。搭建数据安全性验证的完整框架,跟踪所有数据使用记

录,使用大数据分析技术确保数据只用于被许可的用途。

交易监督 交易监督产品提供了主动检测未经授权的交易活动的平台。通过联系分析结构化和非结

构化数据,了解交易者、交易活动以及内外企业的其他交易者之间的复杂关系,实时监

控风险,对异常行为及时反馈,在风险升级之前进行控制。

Page 6: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 6 请参考最后一页评级说明及重要声明

资本市场 针对投资银行和其他主要金融机构的数据源孤立问题,该资本市场解决方案通过整合不

同子公司和部门的数据,提高整个企业的协作效率,便于研究员进行直观的分析。

国防 针对数据链中感知层的非结构化数据,进行实时的处理与分析,并及时反馈给数据链中

的战斗单元。

疾病应对 帮助公共卫生组织处理大量的疾病监测数据,从噪声中提取有用信息,检测疾病爆发的

源头,并及时应对。

内部威胁 保护公司的敏感信息,防止内部人员进行信息盗窃、误用和滥用。通过人机结合的方式,

监控和分析员工的访问行为,有效地识别和应对内部威胁。

情报分析 防止恐怖袭击、应对安全威胁、筹备重大的政治和经济改革,这些都离不开情报分析的

预见性。该解决方案提供了获取海量级数据洞察力的有效方式,实现高效、安全地利用

和分析数据,从而辅助有关部门制定出作出更优质的方案与策略。

法律情报 对于复杂的法律案件,该解决方案通过分析嫌疑人的行为模式,在海量的结构化和非结

构化数据中分析挖掘出数据之间的联系,进而证明推断隐藏在嫌疑人关键行为背后的谎

言。

医药研发 对于生物医学研究人员和制药公司,该解决方案通过整合不同的数据,建立完善的数据

分析平台和可视化工具,帮助团队实现多维分析,加速药品研发。

定制化解决方案 公司的个性化服务解决方案,公司宣称可以克服几乎任何行业的复杂问题与挑战,用产

品改变世界。

资料来源:Palantir 官网,长城证券研究所

经过十余年的发展,政府和金融业务已经成为 Palantir 的两大支柱产品。

在政府业务方面,如今 Palantir 的技术已经深入美国的每一家情报机构,帮助实现特种作

战的完整循环:分析情报、打击目标、将打击中获得的新情报与现有情报一起分析、根

据新的分析结果发起下一轮打击。众多著名的大事件,比如刺杀本·拉登以及绘制叙利

亚自杀性袭击网络,都有 Palantir 的参与。

在金融业务方面,Palantir 已经得到了长足的发展。2010 年,摩根大通成为 Palantir 的首

批非政府客户。摩根大通使用 Palantir 的技术保护账户安全、识别盗号欺诈者,并将 Palantir

的产品用于房产定价,解决房产抵押贷款的纠纷。Palantir 出色的技术得到了金融业界的

认可,目前许多银行、保险、对冲基金乃至美国证券交易委员会都在使用他们的技术。

随着业务规模的不断扩张,Palantir 正在拓展其他各个领域的业务。据 IDC 估计,2013

年-2020 年期间数据量将扩张十倍。在数据大爆炸的今天,预期对技术有绝对自信的

Palantir,继打通政府、金融和医疗业务之后,会快速切入零售、电商、电信等领域,未

来发展潜力无穷。

Page 7: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 7 请参考最后一页评级说明及重要声明

2. 对中国大数据企业的启示

2.1 Palantir 亮点分析

从政府业务到金融业务的发展路径

Palantir 从一开始就想做一个分析一切数据,为企业、银行等机构提供服务的公司。

但是现实是残酷的,当时的 Palantir 既没有得到商业投资,也没能打开市场。直至转

向 CIA 创办的非盈利投资机构 In-Q-Tel,才给他们带来了外部投资和政府客户。6 年

后,Palantir 凭借多年积淀的政府业务影响力,才逐渐进入了金融领域。如果说政

府业务是 Palantir 最初生长的温床,那么金融业务就是公司估值腾飞的助推器。受

益于业务领域的拓展,公司在近两年时间内,估值从约 90 亿美元飞跃至 200 亿美元。

注重信息安全和隐私保护

Palantir 作为大数据公司,十分注重信息安全和隐私保护。Palantir 对自己的大数据平

台有着高安全性的要求,对用户的操作进行了严格的监控和记录,以保证数据的安

全性。安全性是大数据分析的根基,没有安全性,就更不用谈数据分析和商业化。

人才济济的技术团队

Palantir 创立之初,已经具有社会威望的四位创立者和原 PayPal 技术人员就组成了强

大的技术团队,并且依靠在 PayPal 时积累的反洗钱、反欺诈技术进入了政府大数据

市场。Palantir 甚至建设了一个人才激励的企业文化,使员工真正热爱自己的工作,

渴望打造市场上最好的产品:公司每个月发布一次软件更新,工程师们利用元素周

期表中的元素来命名这些更新,并设计专门的 T 恤加以纪念。

人机结合的分析模式

尽管 Palantir 对自己的技术十分自信,但是仍然采用了人机结合的方式解决复杂和困

难的问题。在很多情况下数据不仅数量庞大而且是不断变化的,这样的数据环境使

普通用户很难通过现有工具进行分析,甚至对自己的需求都无法明确定位。Palantir

认为自己的技术是为提升人类的智慧而存在的,将数据整合并进行初步处理分析,

进而呈现给分析者,以人类的智慧和洞察力发现数据之间的联系,最终解决复杂的

问题。人机结合的模式对分析者的数据分析能力、IT 技能以及行业经验都有着很高

的要求,在这一点上具有较高的人才壁垒。

图 1:Palantir 成长逻辑框图

资料来源:长城证券研究所

Page 8: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 8 请参考最后一页评级说明及重要声明

2.2 对中国企业的启示

Viktor Schönberger 和 Kenneth Cukier 在《大数据时代》一书中提到:整个大数据市场上,

根据所提供价值的不同来源,分别出现了三种大数据公司,这三种来源是指数据本身、

技能与思维。我们可以把它们分别定义为数据拥有者、技术提供者、服务提供者。这是

一个单纯意义上的分类,在现实中往往会出现身份的交叉。

本文通过借鉴 Palantir 的发展经验,主要分析对国内技术提供者中的软件提供商以及服务

提供者发展的启示。

表 4:大数据公司分类

价值来源 定位 含义

数据本身 数据拥有者 拥有大量数据或者至少可以收集到大量数据,却不一定

有从数据中提取价值或者用数据催生创新思想的技能。

技能 技术提供者 通常是咨询公司、技术供应商或者分析公司。它们掌握

了专业技能但并不一定拥有数据或提出数据创新性用

途的才能。

思维 服务提供者 对于某些公司来说,数据和技能并不是成功的关键。让

这些公司脱颖而出的是其创始人和员工的创新思维,他

们有怎样挖掘数据的新价值的独特想法。

资料来源:《大数据时代》,长城证券研究所

下文分析从四个方面展开,分别是:公司定位以及跨领域发展规划、信息安全和隐私保

护、人才争夺、人机结合的分析模式。

明确公司定位以及跨领域发展规划

Palantir 的成长路径具有重要的借鉴价值:公司首先使用 6 年时间专注情报分析,凭借成

功案例和政府客户影响力在大数据领域树立名望,继而拓展业务到需求最迫切、定价较

高的金融领域,完成估值的飞跃,进而向其他各领域拓展业务。

Palantir 的成长路径不一定是每个公司的必然选择,但是提供给了我们一个非常好的发展

思路:第一阶段,将自身客户定位于具有较高社会和市场影响力的政府机关、大型集团

或知名企业,深耕大数据的某一细分行业领域;第二阶段,在细分行业领域取得成功案

例和大客户信任后,拓展到需求旺盛、定价较高的其他领域,实现技术沉淀和名望积累

的快速变现,完成估值飞跃;第三阶段,凭借已有的渠道、人才、资金的积累,继续拓

展业务范围,巩固业内领先地位。

根据上述思路,目前具备政府机关、大型金融机构、大型企业集团客户渠道的 IT 公司具

有明显的渠道优势,尤其是这些 IT 公司中已经开展大数据业务的公司取得显著的先发优

势。实际上每一个阶段的晋升都是赛跑,并且每一个阶段都在为下一个阶段进行准备。

公司必须统筹分析自身的竞争优势,选择最佳的市场定位,制定明确的跨领域发展规划,

才能在这大数据的赛场上一马当先。

同时,我们认为目前在大数据的众多细分行业领域中,金融是最具有价值的领域,是第

一阶段定位和第二阶段拓展的极佳之选。原因主要有以下四点:第一,我国金融业体量

快速增长,营销、风控、运营、定价等大数据需求不断增长;第二,金融业大数据应用

起步较晚,目前的深度和广度都还有较大的发展空间;第三,商业银行为代表的传统金

Page 9: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 9 请参考最后一页评级说明及重要声明

融业面临发展瓶颈,为实现转型,高层已经开始重视大数据应用;第四,金融业的人力

成本较高,对应的大数据产品产生的人力替代价值也相对较高。

表 5:大数据涉及的行业领域

行业名称 大数据价值

金融 1. 信贷管理

2. 跨行业联动营销

3. 风险管理

4. 资产定价

公安 1. 建立研判模型

2. 电子取证

3. 关口分析

4. 视频图像分析

5. 情报分析

6. 跨警种数据整合

网络通信 1. 客户分析

2. 网络优化

3. 位置服务

4. 社会化推荐

5. 趋势分析

6. 实时数据统计

7. 流式数据分析

医疗 1. 提供诊断和治疗数据证据

2. 智能化监测居民健康

3. 分析影响居民健康因素

4. 降低平均住院日

零售 1. 细分客户群体

2. 模拟实际交易

3. 提高投入回报率

4. 出租数据存储空间

5. 进行客户关系管理

6. 个性化精准推荐

餐饮 1. 基于 LBS 的地理位置服务

2. 管理决策数据应用

3. 基础数据管理

4. 规避经营风险

交通 1. 提高交通运转效率

2. 促进交通智能化管理

3. 降低管理成本

4. 海量数据处理

能源 1. 高功效新产品开发

2. 能源管理智能化

3. 能源基础设施规划

生产制造 1. 预测产品需求并调整产能

2. 跨多重指标理解工厂绩效

3. 为消费者提供服务与支持

4. 提升产品质量

娱乐传媒 1. 精准营销

2. 开发增值服务

3. 品牌包装

4. 企业决策

5. 舆情管理

资料来源:《大数据时代的营销与分析》苏高,互联网,长城证券研究所

信息安全和隐私保护是大数据业务拓展的基石

大数据在收集、存储和使用过程中面临着诸多安全风险,大数据所导致的信息安全和隐

私泄露问题为用户带来严重困扰,也为大数据公司的运营带来了法律风险。这些问题从

数据源的角度阻碍了大数据的发展,大数据公司只有尽量的规避这些风险,才能逐渐扫

清自身业务发展的障碍。

对于大数据公司来说,实现信息安全与隐私保护是一个重大的技术挑战。唯有重视和使

用这些安全技术,才能打开隐私、敏感数据的商业化空间,将其应用从不可能变为了可

能,助推大数据行业逐步走向万亿市场。

Page 10: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 10 请参考最后一页评级说明及重要声明

表 6:大数据信息安全和隐私保护的关键技术

关键技术 简介

数据发布匿名保护技术 平衡数据的有效性和隐私保护之间的关系,把原始数据表

等结构化数据进行某种变换,使攻击者不能从变换后的数

据表中轻易分析出某个元组的敏感属性值,从而不能识别

敏感信息所属的具体个体,达到隐藏个体隐私信息的目

的。

社交网络匿名保护技术 保护需求为用户标识匿名与属性匿名(点匿名),在数据

发布时隐藏了用户的标识与属性信息;以及用户间关系匿

名(边匿名)在数据发布时隐藏用户间的关系。

数据水印技术 数字水印是指将标识信息以难以察觉的方式嵌入在数据

载体内部且不影响其使用的方法!多见于多媒体数据版权

保护也有部分针对数据库和文本文件的水印方案。

数据溯源技术 根据追踪路径,重视数据的历史状态和演变过程,实现数

据历史档案的追溯。

基于角色的访问控制 通过为用户指派角色,将角色关联至权限集合,实现用户

授权、简化权限管理。早期的权限管理多采用自顶向下的

模式,即根据企业的职位设立角色分工。当其应用于大数

据场景时,面临需大量人工参与角色划分、授权的问题。

风险自适应的访问控制 在大数据场景中,安全管理员可能缺乏足够的专业知识,

无法准确地为用户指定其可以访问的数据风险自适应的

访问控制是针对这种场景讨论较多的一种访问控制方法。

资料来源:中国知网,长城证券研究所

除了上述关键技术之外,近年来还出现了隐私感知混合云和数据脱敏这两大关键技术,

未来有望成为大数据安全和隐私保护的重要领域。

隐私感知混合云

根据 NIST 的定义,混合云是由两个或者多个独立运行却绑定在一起的云组成的混合体,

它可支持数据和应用在不同云之间迁移。由私有云和公有云组成的混合云兼具了两种云

的优点,既有私有云的隐私性,也具有公有云的低计算成本。因此混合云成为许多公司

或机构的首选模式,并被认为是将来云计算的主要模式。

Page 11: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 11 请参考最后一页评级说明及重要声明

图 2:云环境的数据隐私保护系统架构

资料来源:《云计算环境下的数据安全与隐私保护》陈克非,长城证券研究所

图 3:包含多个公有云的混合云架构

资料来源:《云计算环境下的数据安全与隐私保护》陈克非,长城证券研究所

数据脱敏

近年来,数据脱敏这个词汇不断地进入人们的视野。数据脱敏是指对某些敏感信息通过

脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。

Page 12: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 12 请参考最后一页评级说明及重要声明

重视安全技术的发展,我们不仅需要在技术上做到更完善,还应该像 Palantir 一样,注重

操作者的行为分析,挖掘新的攻击模式,不断升级安全技术,全方位构建令人安心的大

数据环境。

表 7:数据脱敏概念与分类

概念 介绍

数据脱敏 又称数据漂白、数据去隐私化或数据变形,指对某些敏感信息通过脱敏规则进行

数据的变形,实现敏感隐私数据的可靠保护。普遍按照应用场景划分为静态数据

脱敏(SDM)和动态数据脱敏(DDM)。

静态数据脱敏 一般用在开发、测试、外包等非生产环境中,是将敏感数据脱敏处理完毕之后再

在非生产环境使用,一般用于解决测试、开发库需要生产库的数据量与数据间的

关联,以排查问题或进行数据分析等,但又不能将敏感数据存储于非生产环境的

问题。

动态数据脱敏 一般用在生产环境,在访问敏感数据当时进行脱敏,一般用来解决在生产环境需

要根据不同情况对同一敏感数据读取时需要进行不同级别脱敏的问题。

资料来源:Gartner,长城证券研究所

图 4:数据脱敏架构

资料来源:博尔信官网,长城证券研究所

人才成为竞争的重中之重

今年初,国外著名职业人士社交网站 LinkedIn 对全球超过 3.3 亿用户的工作经历和技能

进行分析,并公布了 2014 年最受雇主喜欢、最炙手可热的 25 项技能,其中统计分析和

数据挖掘技能位列榜首。大数据时代对数据人才的需求已经排在了首位。

就在不久前的“中国国际大数据大会”上,中科院院士、北京大学教授鄂维南还作出表

示,中国大数据的前景非常广阔,市场非常大。但如何把这个广阔的前景变成现实,现

在还面临数据质量不高、数据流通不畅、数据分析存技术问题等诸多瓶颈,“但最严重的

还是人才问题”。

Page 13: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 13 请参考最后一页评级说明及重要声明

究竟大数据行业需要什么样的人才呢?大数据人才的需求梳理如下:

表 8:大数据人才岗位需求

人才岗位 简介

大数据分析师 从事数据挖掘工作,运用算法来解决和分析问题,让数据显露出真相,

同时,他们还推动数据解决方案的不断更新。随着数据集规模不断增大,

企业对 Hadoop 及相关的廉价数据处理技术如 Hive、HBase、MapReduce、

Pig等的需求将持续增长,具备 Hadoop框架经验的技术人员是最抢手的

大数据人才,他们所从事的是热门的分析师工作。

大数据应用开发工程师 负责搭建大数据应用平台以及开发分析应用程序,他们必须熟悉工具或

算法、编程、优化以及部署不同的 MapReduce,他们研发各种基于大数

据技术的应用程序及行业解决方案。其中,ETL 开发者是很抢手的人才,

他们所做的是从不同的源头抽取数据,转换并导入数据仓库以满足企业

的需要,将分散的、异构数据源中的数据如关系数据、平面数据文件等

抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库,成

为联机分析处理、数据挖掘的基础,为提取各类型的需要数据创造条件。

大数据系统研发工程师 负责大数据系统研发,包括大规模非结构化数据业务模型构建、大数据

存储、数据库构设、优化数据库构架、解决数据库中心设计等,同时,

还要负责数据集群的日常运作和系统的监测等,这一类人才是任何构设

大数据系统的机构都必须的。

数据可视化工程师 负责在收集到的高质量数据中,利用图形化的工具及手段的应用,清楚

地揭示数据中的复杂信息,帮助用户更好地进行大数据应用开发,如果

能使用新型数据可视化工具如 Spotifre,Qlikview 和 Tableau,那么,

就成为很受欢迎的人才。

数据安全研发人才 负责企业内部大型服务器、存储、数据安全管理工作,并对网络、信息

安全项目进行规划、设计和实施,而对于数据安全方面的具体技术的人

才就更需要了,如果具备数据安全技术,同时又具有较强的管理经验,

能有效地保证大数据构设和应用单位的数据安全,那就是抢手的人才。

数据科学研究人才 将单位、企业的数据和技术转化为有用的商业价值,随着大数据时代的

到来,越来越多的工作、事务直接涉及或针对数据,这就需要有数据科

学方面的研究专家来进行研究,通过研究,他们能将数据分析结果解释

给 IT部门和业务部门管理者听,数据科学专家是联通海量数据和管理者

之间的桥梁,需要有数据技术、分析师能力和管理者的知识,这也是抢

手的人才。

资料来源:百度经验,长城证券研究所

从上表中可以看到,对于一个合格的大数据人才来说技术与管理知识的重要性。但需要

指出的是,以上 6 大岗位中最热门的大数据分析师,除了需要具备上述两大要素之外,

往往还要具有大数据的某个细分行业经验,例如拥有十几年资历的资深产业人员更能懂

得所属产业的大数据需求和数据使用方法,从而更好地解决和分析问题。与此同时,拥

有技术、管理知识和行业经验的大数据人才,必将成为大数据公司之间竞相争夺的对象。

Page 14: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 14 请参考最后一页评级说明及重要声明

重视人机结合的分析模式

目前大多数公司的大数据业务模式仍局限于系统搭建和运维服务,实际上我们还应该将

思维转变到“人机结合”的方式。

这里“人机结合”的方式,主要是指通过搭建系统将所有关联数据进行整合,并呈现给

大数据分析师,继而分析师使用系统内的各种数据分析工具进行深度数据分析,寻找客

户的深层需求和数据之间的深度关联,不断优化解决方案。

作为大数据客户来说,自身技术能力不足,无法将数据与需求之间进行有效地关联。在

大数据时代,数据能做什么以及怎么做的问题,不是由客户来解答,而是由大数据公司

来解答。解答过程中由于每个客户的特殊性,大数据公司很难以标准化的产品解决所有

问题,而个性化大数据解决方案需要大数据分析师不断地跟踪和改进。

另外,在大数据的某些应用领域,由于数据关联性的复杂多变,“人机结合”成为有效开

展业务的重要模式。例如情报分析和反欺诈过程中,犯罪分子作为分析对象,其犯罪手

段是在不断变化、升级的,这种情况下必须使用人脑和系统相结合的方式,才能够对这

种变化尽快作出反应,做到有效的打击。

Page 15: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

长城证券 15 请参考最后一页评级说明及重要声明

3. 大数据巨头进化路径总结

在总结 Palantir 和考虑我国大数据行业发展状况的基础上,我们梳理出了一条可取的大数

据巨头进化路径,它不一定是每个公司的必然选择,但是提供给了我们一个非常好的发

展思路。详见以下图表:

表 9:大数据巨头进化路径

阶段 简介

第一阶段 将自身客户定位于具有较高社会和市场影响力的政府机关、大型集团或知

名企业,深耕大数据的某一细分行业领域。

第二阶段 在细分行业领域取得成功案例和大客户信任后,拓展到需求旺盛、定价较

高的其他领域,实现技术沉淀和名望积累的快速变现,完成估值飞跃。

第三阶段 凭借已有的渠道、人才、资金的积累,继续拓展业务范围,巩固业内领先

地位。

资料来源:百度经验,长城证券研究所

结合这条进化路径以及上文总结的四大启示(明确公司定位以及跨领域发展规划、注重信息

安全和隐私保护、人才成为竞争的重中之重、重视人机结合的分析模式),我们给出了大数

据巨头进化要素图:

图 5:大数据巨头进化要素图

资料来源:长城证券研究所

Page 16: 大数据行业独角兽Palantir - file.gongxiangcj.comfile.gongxiangcj.com/f9.pdf · 行业深度报告 长城证券5 请参考最后一页评级说明及重要声明 表2:Palantir

行业深度报告

http://www.cgws.com

研究员介绍及承诺 周伟佳:计算机行业首席分析师,CFA 会员,ACCA 资深会员,悉尼大学商科硕士,曾就职于华为技术、阿尔卡特朗讯、招商证券、大成基金等公

司,2014 年加入长城证券金融研究所。

本人具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,在执业过程中恪守独立诚信、勤勉尽职、谨慎客观、公平公正的原

则,独立、客观地出具本报告。本报告反映了本人的研究观点,不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接接收到任

何形式的报酬。

免责声明

长城证券股份有限公司(以下简称长城证券)具备中国证监会批准的证券投资咨询业务资格。

本报告由长城证券向其机构或个人客户(以下简称客户)提供,除非另有说明,所有本报告的版权属于长城证券。未经长城证券事先书面授权

许可,任何机构和个人不得以任何形式翻版、复制和发布,亦不得作为诉讼、仲裁、传媒及任何单位或个人引用的证明或依据,不得用于未经

允许的其它任何用途。如引用、刊发,需注明出处为长城证券研究所,且不得对本报告进行有悖原意的引用、删节和修改。

本报告是基于本公司认为可靠的已公开信息,但本公司不保证信息的准确性或完整性。本报告所载的资料、工具、意见及推测只提供给客户作

参考之用,并非作为或被视为出售或购买证券或其他投资标的的邀请或向他人作出邀请。在任何情况下,本报告中的信息或所表述的意见并不

构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。

长城证券在法律允许的情况下可参与、投资或持有本报告涉及的证券或进行证券交易,或向本报告涉及的公司提供或争取提供包括投资银行业

务在内的服务或业务支持。长城证券可能与本报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。

长城证券版权所有并保留一切权利。

长城证券投资评级说明

公司评级:强烈推荐——预期未来 6 个月内股价相对行业指数涨幅 15%以上;

推荐——预期未来 6 个月内股价相对行业指数涨幅介于 5%~15%之间;

中性——预期未来 6 个月内股价相对行业指数涨幅介于-5%~5%之间;

回避——预期未来 6 个月内股价相对行业指数跌幅 5%以上.

行业评级:推荐——预期未来 6 个月内行业整体表现战胜市场;

中性——预期未来 6 个月内行业整体表现与市场同步;

回避——预期未来 6 个月内行业整体表现弱于市场.

长城证券销售交易部

深圳联系人 刘 璇: 0755-83516231, 18938029743, [email protected]

李 丹: 0755-83699629, 18665289977, [email protected] 王 涛: 0755-83516127, 13808859088, [email protected]

李嘉禾: 0755-83516287, 18201578698, [email protected]

李小音: 0755-83516187, 18562591899, [email protected]

吴林蔓: 075583515203, 13418560821, [email protected] 北京联系人 赵 东: 010-88366060-8730, 13701166983, [email protected]

王 媛: 010-88366060-8807, 18600345118, [email protected]

李珊珊: 010-88366060-1133, 18616891195, [email protected]

申 涛: 010-88366060-8777, 15801188620, [email protected]

上海联系人 谢彦蔚: 021-61680314, 18602109861, [email protected]

徐佳琳: 021-61680673, 13795367644, [email protected]

凌 云: 021-61683504, 18621755986,, [email protected]

王 一: 021-61683504, 13761867866, [email protected]

长城证券研究所

深圳办公地址:深圳市福田区深南大道 6008 号特区报业大厦 17 层

邮编:518034 传真:86-755-83516207

北京办公地址:北京市西城区西直门外大街 112 号阳光大厦 8 层

邮编:100044 传真:86-10-88366686

上海办公地址:上海市民生路 1399 号太平大厦 3 楼

邮编:200135 传真:021-61680357

网址:http://www.cgws.com