Click to edit Master title · •分散型ビッグデータ処理の活用...

43
PUBLIC Click to edit Master title style Click to edit Master subtitle style 9/21/2018 1 2018年9月19日 SAPジャパン株式会社 知って得する SAP HANAの概要と最新活用事例 成功事例と最新情報から学ぶDB移行セミナー

Transcript of Click to edit Master title · •分散型ビッグデータ処理の活用...

Page 1: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

PUBLIC

Click to edit Master title style

Click to edit Master subtitle style

9/21/2018 1

2018年9月19日

SAPジャパン株式会社

知って得する

SAP HANAの概要と最新活用事例

成功事例と最新情報から学ぶDB移行セミナー

Page 2: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

2CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAPの戦略 : インテリジェントエンタープライズ

製造&物流

顧客体験

デジタルコア従業員

マネジメント

ネットワーク&経費マネジメント

インテリジェントテクノロジー

デジタルプラットフォーム

データマネジメント

クラウドプラットフォーム

インテリジェントスイート

1

2

3

インテリジェントエンタープライズを構成する3つの要素:

インテリジェントスイート1

インテリジェントテクノロジー2

デジタルプラットフォーム3

Page 3: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

3CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

Supply Chain

Finance

HR

Manufacturing

Sales

Connected Assets

Supply Chain

Finance

HR

Manufacturing

Sales

Connected Assets

Clouds

Applications

Tools

Data Stores

SAPの戦略 : インテリジェントエンタープライズ

製造&物流

顧客体験

デジタルコア従業員

マネジメント

ネットワーク&経費マネジメント

インテリジェントテクノロジー

デジタルプラットフォーム

データマネジメント

クラウドプラットフォーム

インテリジェントスイート

Page 4: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

4CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

デジタルプラットフォーム : SAP HANA Data Management Suite

新しいアプリ開発/既存システムの拡張、

インテグレーションのための

デジタルプラットフォーム

様々なタイプのデータから

リアルタイム・バリューを取得する

統一されたデータ管理機能

デジタルプラットフォーム

データマネジメント

クラウドプラットフォーム

Supply Chain

Finance

HR

Manufacturing

Sales

Connected Assets

Supply Chain

Finance

HR

Manufacturing

Sales

Connected Assets

Page 5: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

5CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP HANA : ビジネスデータ プラットフォームAccelerate with simplicity | Act with live intelligence | Innovate with confidence | Achieve cloud freedom

SAP HANA Platform

Application Development Advanced Analytical Processing Data Integration and Quality

SAP, ISV and Custom Applications

All Devices

Database Management

Web Server JavaScript Fiori UX

Graphic Modeler

Application Lifecycle Management

Spatial Graph Predictive Search

Text Analytics

Streaming Analytics

Series Data

Business Functions

Data Virtualization

ELT & Replication

Data Quality Hadoop & Spark Integration

Columnar OLTP + OLAP

Multi-Core & Parallelization

Advanced Compression

Multi-tenancy Multi-Tier Storage

Data Modeling Openness Admin & Security

High Availability & Disaster Recovery

All-in-one,in-memory-first

HTAP with broadest

advanced analytics

Secure & future-ready

Hybrid and multicloud

Document Store

Page 6: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

6CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP Data Hub : Freedom of Data in a Complex World ビッグデータをあらゆるユーザーが活用できる

Cloud

systems

SAP HANA

and SAP BW

Non-SAP

applications

Databases

Delimited

files

Hadoop

data lakes

SCMSocial

media

Mobile

apps

ERP

CRMIoT

www

Ingest and

govern

Enrich and

compute

Integrate and

orchestrateTransform

and refineData load

Data access

データパイプライン

データのワークフローを定義、迅速にビッグデータが活用可能

データガバナンス

データソースの管理やデータの生成/加工の工程をトレース

データの共有

ビッグデータとエンタープライズデータの統合アクセスが可能

Page 7: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

7CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

アジャイルでデータ駆動型のアプリケーションとプロセスを構築するSAP Data Hub

パワフルなデータパイプラインの作成

• 分散型ビッグデータ処理の活用

• 急進的に拡大するサーバーレスコンピューティングのパラダイムを活用

• 機会学習(マシンラーニング) などの強力なライブラリの統合

データ駆動型プロセスを可能にするためのデータストリームの構築

• 即座にデータ変更に対応するデータストリームを確立

• 任意のコードまたはスクリプトを利用して複雑なアルゴリズムを既存のデータフローに組み込む

Page 8: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

8CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP HANA Data Management Suite : データシステム、アプリケーション、システム開発における柔軟性の提供

ローカル、プライベート、マルチパブリッククラウド環境に分散しているデータ、インスタンス、クエリーの移動と同期における柔軟性を提供

オンプレミス・データセンターをローカルクラウドとして運用支援するソフトウェア定義のクラウドオートメーション機能を提供

SAP HANA

Enterprise Cloud

SAP Cloud

Platform

SAP HANA

Data Management Suite

Private cloud

On premise

Page 9: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

SAP HANA概要と活用事例

Page 10: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

10CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

“One Fact, One Place, Real Time”“事実は1つであり、その事実を1カ所に記録する”

“全ての活動をデータの発生箇所でリアルタイムに記録する”

“データベース層はリアルタイムに業務に対してデータを提供すべき”

ハッソ・プラットナーSAP共同創立者 監査役会会長

真のリアルタイム経営の実現

「圧倒的な高速性」を実現するデータベースを開発10CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP HANAの開発コンセプトとゴール

Page 11: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

11CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP S/4HANA - SAP Business Suite for SAP HANA例) 財務会計と管理会計が統合されたモデル

S/4HANAでは、従来業務ごとに分離していたデータ構造を統合し、事前集計することなくオンデマンドで集計分析することで、すべての会計明細データを即座に任意の切り口で詳細分析することが可能です

業務別+任意の切り口でオンデマンド集計

[インフォメーション・ビュー]

ロール別インターフェース(Fiori)

統合会計伝票 (ユニバーサルジャーナル)

SAP S/4HANA

機能別画面 (SAP GUI)

間接費管理

収益性分析

総勘定元帳

債権管理

債務管理

固定資産

品目評価

集計

インデックス 総勘定元帳 債権管理 債務管理

伝票データ

従来のSAP ERP

財務会計伝票

管理会計伝票

収益性分析固定資産

伝票品目元帳

伝票

画面

Page 12: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

12CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

BI/ReportERP

データ発生 データ利用

RDBMS情報系DB

RDBMS更新系DB

基幹系 情報系

今日の企業システム

業務視点

IT視点ETL・人手

情報処理・活用を別システムで実施処理活用のタイムラグ

ITバリュー向上の限界・複雑性の増大

企業システムのパラダイムシフト~リアルタイム・コンピューティング~

目的別データマート

システムの更新処理(ERP)と活用処理(BI/Report)をリアルタイム化

究極のシンプル化

SAPが考える今後の企業システム

SAP HANA更新系&情報系DB

ERP/BI/Report/NEW..

データ発生&利用

基幹系&情報系

In-MemoryComputingCLOUD

AnalyticsMobile

Page 13: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

13CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP ranked as a LEADERThe Forrester Wave™: Translytical Data Platforms, Q4 2017

SAPは製品機能、戦略、市場において、Forresterの

Translytical Data Platforms Waveのリーダーとして評価、

指名され、以下の18の基準で5/5の得点を獲得しました

The Forrester Wave™: Translytical Data Platforms, Q4 2017,Noel Yuhanna and Mike Gualtieri with Gene Leganza and Jun Lee , 28 November 2017

Read the full report"The Forrester Wave™ is copyrighted by Forrester Research, Inc. Forrester and Forrester Wave™ are trademarks of Forrester Research, Inc. The Forrester Wave™ is a graphical representation of Forrester's call on a market and is plotted using a detailed spreadsheet with exposed scores, weightings, and comments. Forrester does not endorse any vendor, product, or service depicted in the Forrester Wave. Information is based on best available resources. Opinions reflect judgment at the time and are subject to change."

• Architecture• Data management • Data types• Development tools• Data modeling• Transactions• Analytical queries• Advanced analytics• Streaming

• Data Security• Performance features• Ability to execute• Roadmap• Implementation support• Product revenue• Install base• Market awareness• Partnerships

Page 14: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

14CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

Lidl | Heidelberg University Hospital | Siemens | VMwareMcLaren | Cisco | Swiss Re | Women's | Tennis AssociationLenovo | HPE | Mercy Health | NTT | Accenture | Nestlé |City of Cape Town | Horizon Pharma | BASF | Zalando |Nissan Motor Vodafone | Munich Re | Airbus DS | PayPal |Thomson Reuters | E.ON Saudi Aramco | GendarmerieNationale de France | Indus Motor Camposol | Aché | Cityof Nanjing | ARI | Swisscom | TSG 1899 Hoffenheim |Mars International | Tata Power | Snow Peak Cirque duSoleil Inc | Evonik | FC Bayern MünchenSurgutneftegasLidl | Heidelberg University Hospital |Siemens | VMware | McLaren | Cisco | Swiss Re | Women's| Tennis Association | Lenovo | HPE | Mercy Health | NTT |Accenture Nestlé | City of Cape Town | Horizon Pharma |BASF | Zalando| Nissan Motor | Vodafone | Munich Re |Airbus DS | PayPal Reuters | E.ON | Saudi Aramco |Gendarmerie Nationale de France | Indus Motor |Camposol | Aché | City of Nanjing | ARI Swisscom | TSG1899 Hoffenheim | Mars International | Tata Power | SnowPeak | Cirque du Soleil Inc | Evonik | FC Bayern München |Surgutneftegas | Medtronic | State of Indiana | adidas

SAP HANA 導入実績

More than

23,000SAP HANAcustomers

SAP is a Leaderfor Database and Data ManagementPress Release Cisco, Siemens and VMware Running Live Digital Businesses on SAP HANA Platform, as Customer Growth Accelerates

Corporate Fact SheetSAP Corporate Fact Sheet showing 23,000 customers

Page 15: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

15CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

メモリー

1.メモリー上のデータにアクセス

2.分析処理とトランザクション処理を高速実行する仕組み

3.CPUの最新テクノロジーを活用

Row Head Head Head Head

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Row Head Head Head Head

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

ディスク

SAP HANAが「圧倒的な高速性」を実現した理由

Page 16: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

16CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

Row Head Head Head Head

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

メモリー

従来のデータベース

メモリー

SAP HANA

Row Head Head Head Head

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

SAP HANA

Row Head Head Head Head

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Row Head Head Head Head

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

メモリー上のデータにアクセスするため高速

ディスク・アクセスが性能ボトルネック

更新データを失わない

データ更新

ディスク

Column Head Data Data Data

1. メモリー上のデータにアクセスSAP HANAが「圧倒的な高速化」を実現した理由

Row Head Head Head Head

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Column Head Data Data Data

Page 17: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

17CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

カラムストア : 列(カラム)単位

: メモリ(またはディスク)上のデータ格納単位

ローストア : 行(ロー)単位

•ユーザー/アプリケーションは リレーショナルDBの表(テーブル)として操作

•従来通りのDB設計とアプリケーション(SQL)開発が可能

表(テーブル)

DB内部のデータ格納方式

ユーザーから見える形式

•表データをメモリ上のデータ格納単位毎に配置

•ユーザー/アプリケーションはデータ格納方式を意識する必要はない

•データ処理特性に応じてデータ格納方式を選定するケースあり

トランザクション処理が得意 集計、演算などの分析処理が得意

2. 分析処理とトランザクション処理を高速実行する仕組みDB(データベース)内部のデータ格納方式について

Page 18: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

18CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

日付 販売店 製品 売上

04/01 新宿店 PC 68,000

04/01 新宿店 Tablet 54,000

04/01 半蔵門店 Tablet 54,000

04/02 半蔵門店 sPhone 37,000

04/02 半蔵門店 sPhone 37,000

04/02 横浜店 Tablet 54,000

04/02 横浜店 sPhone 37,000

表(テーブル)形式のデータ

トランザクション処理も高速実行可能なカラム型DB

日付 販売店 製品 売上

04/01 新宿店 PC 68,000

04/01 新宿店 Tablet 54,000

04/01 半蔵門店 Tablet 54,000

04/02 半蔵門店 sPhone 37,000

04/02 半蔵門店 sPhone 37,000

04/02 横浜店 Tablet 54,000

04/02 横浜店 sPhone 37,000

日付

04/01

04/01

04/01

04/02

04/02

04/02

04/02

売上

68,000

54,000

54,000

37,000

34,000

54,000

36,500

製品

PC

Tablet

Tablet

sPhone

sPhone

Tablet

sPhone

販売店

新宿店

新宿店

半蔵門店

半蔵門店

半蔵門店

横浜店

渋谷店

日付

04/01

04/01

04/01

04/02

04/02

04/02

04/02

製品

PC

Tablet

Tablet

sPhone

sPhone

Tablet

sPhone

販売店

新宿店

新宿店

半蔵門店

半蔵門店

半蔵門店

横浜店

渋谷店

売上

68,000

54,000

54,000

37,000

34,000

54,000

36,500

日付

04/01

04/02

売上

68,000

54,000

37,000

36,500

34,000

製品

PC

Tablet

sPhone

販売店

新宿店

半蔵門店

横浜店

渋谷店

ローストア(従来のDB)”行(ロー)”毎にデータを分割管理

集計対象外のデータにアクセスするため、非効率例) 4月の売上集計

カラムストア(SAP HANA)”列(カラム)”毎にデータを分割管理

分析対象データに効率的にアクセス冗長なデータを高圧縮

2. 分析処理とトランザクション処理を高速実行する仕組みDB内部のデータの格納方式 : カラムストア (列単位のデータ格納) の特徴

Page 19: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

19CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

***

***

***

***

***

***

***

***

***

***

***

***

***

***

***

***

***

***

***

***

*** *********

*** *** *** ***

検索処理データ更新処理

データ読込専用メモリ領域データ更新専用メモリ領域

•読込用のデータをメモリ上に保持•高度な拡張圧縮技術によりデータ圧縮•データ更新専用メモリ領域の更新データを定期的にマージ

•更新用のデータをメモリ上に保持•レコードをカラム毎に分割し、圧縮•更新ログ(ジャーナル)をディスクに同期書き込み

最新データを検索

定期的にマージ

データ追加処理

更新対象データをコピー*** *** *** ***

*** *********

2. 分析処理とトランザクション処理を高速実行する仕組みデータ更新専用メモリ領域によるトランザクション処理の実装

Page 20: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

20CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

複数CPUコアで並列処理

日付

04/01

04/02

売上

68,000

54,000

37,000

36,500

34,000

製品

PC

Tablet

sPhone

販売店

新宿店

半蔵門店

横浜店

渋谷店

新宿店

渋谷店

横浜店

半蔵門店

新宿店

渋谷店

横浜店

半蔵門店

販売店 = ‘横浜店’

新宿店

渋谷店

横浜店

半蔵門店

新宿店

渋谷店

横浜店

半蔵門店

CPU

CPU

SAP HANA

従来のデータベース処理

1件ずつ処理

複数データを一括処理(*)

* SIMD (Single Instruction Multiple Data)

3. CPUの最新テクノロジーを活用SAP HANAが「圧倒的な高速化」を実現した理由

Page 21: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

21CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP HANA: ビジネスデータ プラットフォームAccelerate with simplicity | Act with live intelligence | Innovate with confidence | Achieve cloud freedom

SAP HANA Platform

Application Development Advanced Analytical Processing Data Integration and Quality

SAP, ISV and Custom Applications

All Devices

Database Management

Web Server JavaScript Fiori UX

Graphic Modeler

Application Lifecycle Management

Spatial Graph Predictive Search

Text Analytics

Streaming Analytics

Series Data

Business Functions

Data Virtualization

ELT & Replication

Data Quality Hadoop & Spark Integration

Columnar OLTP + OLAP

Multi-Core & Parallelization

Advanced Compression

Multi-tenancy Multi-Tier Storage

Data Modeling Openness Admin & Security

High Availability & Disaster Recovery

All-in-one,in-memory-first

HTAP with broadest

advanced analytics

Secure & future-ready

Hybrid and multicloud

Document Store

Page 22: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

22CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

データ配置の”階層化”SAP HANA dynamic tiering

S A P H A N A P L A T F O R M

アクセス頻度、性能要件、コスト等のバランスを鑑み、データ配置をメモリーとディスクに階層化して管理

Inputdate Country Measure

01.01.2015 XXXXX 300

02.01.2014 XXXXX 600

Date Column1 Column2

01.01.2017 XXXXX 200

02.01.2016 XXXXX 500

1つのテーブルとしてアクセスし、

HANAが物理的なアクセス先を制御

HANA Multi Store Table *

“パーティション”を活用したデータ管理のため、

データの挿入・更新処理も通常のテーブルアクセス

Disk Partition (dynamic tiering)

In-Memory Partition

* SAP HANA 2.0の機能

SAP HANAdynamic tiering

SAP HANA Hot Store

Warm Store

ディスクベースカラムストア技術を活用

Page 23: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

23CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

データの格納場所にとらわれない仮想データアクセスとデータ移動の削減

ビジネスメリット

▪ 分析コンテキストの拡張

▪ リアルタイムでの外部データソースへの仮想データアクセス

▪ エンタープライズレベルのセキュリティの強化

▪ ソースシステムから直接データ利用による開発コストの低減

データソース

▪ Oracle 12c, MS SQL, Teradata, DB2, Netezza

▪ Hadoop – Hive (Hortonworks, Cloudera, MapR, etc.), Spark

▪ SAP HANA, SAP Vora

▪ SAP Sybase ASE, IQ and MaxDB

▪ SAP Sybase ESP, SQLA

SAP HANA

StructuredUnstructured

Analytics & Applications

Smart Data Access

VirtualTable

Oracle

TeradataSQL Server

データ統合基盤としてのSAP HANA ~ DBの仮想統合 ~Smart Data Access

Page 24: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

24CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP HANA Smart Data Integration : 外部ソースのデータをSAP HANAに統合する

データ統合基盤としてのSAP HANASmart Data Integration

機能概要:

さまざまなデータ配信方式をサポート

• リアルタイムレプリケーション (対応データソースのみ)

• バッチ (ETL / ELT)

• データ仮想化 (フェデレーション)

他ターゲットへのデータの配布のサポート (双方向)

オンプレミス、クラウド、ハイブリットに対応するアーキテクチャの採用

直観的でわかりやすい Web ベースの設計ツール

オープンフレームワークの採用

• 一般的なソースに対するすぐに利用できるアダプタ

• カスタムアダプタを作成するためのオープンなSDK

Data Provisioning Agent

SAP HANA

Data Provisioning Server

非データベースアダプタ

カスタムアダプタ(SDK)

データベースアダプタ

Server – Agent方式により、オンプレ-クラウド連携や、Firewallを超えられないネットワーク環境でも柔軟にデータ連携が可能

VirtualPhysical

OData

他社データベース ビッグデータ ファイル API連携 ソーシャル

Page 25: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

25CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

自動フェイルオーバー (HA)▪ スケールアウト構成内▪ N アクティブノード, M スタンバイノード▪ 自動でスタンバイノードへ切替

システムレプリケーション (HA & DR)▪ マルチシステム/ロケーション横断▪ 障害時や計画停止時の迅速な切替▪ アクティブアクティブリードイネーブルド機能

Storage

SAP HANA(Primary)

Node

Storage

SAP HANA(Secondary)

Node

ストレージレプリケーション(DR)▪ マルチシステム/ロケーション横断▪ ストレージミラーリング機能でデータ転送▪ パートナーソリューションから選択

多階層のデータ・センター内、都市間、地域間をサポート

SAP HANA

Node 1 Node 2 Standby

Storage

SAP HANA(Primary)

Node

Storage

SAP HANA(Secondary)

Node

地域間

Sync/ Async

Storage

都市間

Sync/ Async

キャンパス

データベースの可用性高可用性(HA)と災害復旧(DR)対応

Page 26: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

26CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

構造化データ

統合されたデータモデルとあらゆるデータへのSQLアクセス

予測分析

プロアクティブでインテリジェントな意思決定

地理空間情報

ビジネスデータとジオデータを結合

グラフ

オンザフライで関係性のデータを分析

* Partner integration

時系列データ

連続するデータポイントを取得して分析

テキスト & サーチ

構造化データ・非構造化データの全文テキスト検索、ナビゲーション、アクセス

機械学習

Google TensorFlow*で機械学習モデルを学習し分類

マルチモデルアナリティクスと機械学習高度なアナリティカルエンジンによるインメモリーコンピューティング

ストリーミング

ストリームデータのリアルタイム分析

SAP HANA

Page 27: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

27CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

予測解析 / 機会学習

▪ 90を超える機械学習、予測分析アルゴリズム

▪ Association, Clustering, Classification, Regression, Time Series 等をサポート

▪ 様々なデータタイプをサポート – structured, spatial, text, streaming, series data

▪ グラフィカルモデリングツールはPAL, R-Scriptを利用した分析アプリケーションの開発をサポート

▪ SAP Predictive Analytics(PA)は SAP HANA上の自動予測分析機能(Automated Predictive Libraries)を最大限利用

▪ SASはデータ転送を排除してSAP HANA上でネイティブに処理を実行

▪ Rの様々な機能は透過的に利用可能

▪ 複数のデータタイプをまたがった分析処理が可能

SAP Web IDE for SAP HANA

Application Function

Modeler (AFM)

3rd Party ApplicationsUsing Python

driver , R Studio

SAP Predictive Analytics

Predictive Analysis Libraries

(PAL)

Integration

Application Function Library

SDK (AFLSDK)

Automated Predictive Libraries

(APL)

Streaming Analytics

SAP HANA Platform

Tools & Application

s

アドバンストアナリティクス - 分析インテリジェンスの進化予測解析 / 機械学習

豊富なネイティブアルゴリズムをインメモリで高速に処理し迅速に洞察を発見・迅速な導入

Page 28: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

28CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

参考 : SAP HANA Predictive Analysis Library (PAL)Algorithm overview by category

Classification Analysis

▪ CART, C4.5 and CHAID Decision Tree Analysis

▪ K Nearest Neighbor

▪ Logistic Regression Elastic Net

▪ Back-Propagation (Neural Network)

▪ Naïve Bayes

▪ Support Vector Machine

▪ Random Decision Trees

▪ Gradient Boosting Decision Tree (GBDT)

▪ Linear Discriminant Analysis (LDA)

▪ Confusion Matrix

▪ Area Under Curve (AUC)

▪ Parameter Selection/Model Evaluation

Regression

▪ Multiple Linear Regression Elastic Net

▪ Polynomial, Exponential, Bi-Variate Geometric, Bi-Variate Logarithmic Regression

▪ Generalized Linear Model (GLM)

▪ Cox Proportional Hazards Model

▪ Random Decision Trees

▪ Gradient Boosting Decision Tree (GBDT)

Association Analysis▪ Apriori, Apriori Lite

▪ FP-Growth

▪ KORD – Top K Rule Discovery

▪ Sequential Pattern Mining

Probability Distribution

▪ Distribution Fit/ Weibull analysis

▪ Cumulative Distribution Function

▪ Quantile Function

▪ Kaplan-Meier Survival Analysis

Outlier Detection▪ Inter-Quartile Range Test (Tukey’s Test)

▪ Variance Test

▪ Anomaly Detection

▪ Grubbs Outlier Test

Recommender Systems▪ Factorized Polynomial Regression Models

▪ Alternating least squares

▪ Field-aware Factorization Machines (FFM)

Link Prediction▪ Common Neighbors, Jaccard’s Coefficient,

Adamic/Adar, Katzβ

▪ PageRank

Statistical Functions

▪ Mean, Median, Variance, Standard Deviation, Kurtosis, Skewness

▪ Covariance Matrix

▪ Pearson Correlations Matrix

▪ Chi-squared Tests: Quality of Fit, Test of Independence

▪ F-test (variance equal test)

▪ Data Summary

▪ Correlation Function

▪ ANOVA

▪ One-sample Median Test

▪ T Test

▪ Wilcox Signed Rank Test

Data Preparation

▪ Sampling, Binning, Scaling, Partitioning

▪ Principal Component Analysis (PCA)/PCA Projection

▪ Factor Analysis

▪ Multi dimensional scaling

Other

▪ Weighted Scores Table

▪ Substitute Missing Values

Cluster Analysis

▪ ABC Classification

▪ DBSCAN, K-Means/Accelerated K-Means, K-Medoid Clustering, K-Medians

▪ Kohonen Self Organized Maps

▪ Agglomerate Hierarchical

▪ Affinity Propagation

▪ Latent Dirichlet Allocation (LDA)

▪ Gaussian Mixture Model (GMM)

▪ Cluster Assignment

Time Series Analysis

▪ Single/Double/ Brown/Triple Exp. Smoothing

▪ Forecast Smoothing

▪ Auto – ARIMA/Seasonal ARIMA

▪ Croston Method

▪ Forecast Accuracy Measure

▪ Linear Regression with Damped Trend and Seasonal Adjust

▪ Test for White Noise, Trend, Seasonality

▪ Fast Fourier Transform (FFT)

▪ Hierarchical Forecasting

Page 29: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

SAP HANA 活用事例/ユースケース

Page 30: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

30CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

データ発生 データ利用

RDBMS情報系DB

RDBMS更新系DB

基幹系 情報系

今日の企業システム

業務視点

IT視点ETL・人手

SAP HANAによる情報系システムのモダナイゼーション

目的別データマート

データ発生 データ利用

RDBMS情報系DB

RDBMS更新系DB

基幹系 情報系

リアルタイム

明細データへのアクセス

超高速アクセス

情報処理・活用を別システムで実施処理活用のタイムラグの極小化ITバリュー向上・複雑性の軽減

現状の課題解決と将来に向けた情報基盤強化

AnalyticsMobile

利便性と操作性の向上

機械学習/予測分析

情報処理・活用を別システムで実施処理活用のタイムラグ

ITバリュー向上の限界・複雑性の増大

Page 31: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

31CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

従来の課題

予め用意された分析テンプレート

– 製品/店舗レベルまでのドリルダウンできない

– 自由検索が制限、仮説設定や検証ができない

情報鮮度と活用ユーザが限定的

–マネージャーが週次で確認

– 日次レポートは翌日配布

システム開発と運用コストの増大

導入効果

明細レベルのデータにリアルタイムアクセス

– 過去3年以上のPOSデータを蓄積

– メインテーブルは2,500億件以上

– 仮説検証、状況変化への迅速な対応が可能に

TCO削減とシステムのシンプル化

– 事前集計のバッチ処理を削減

–チューニングコストの大幅な削減

– 46.5TBから5.7TBへデータ圧縮

1,500ユーザーがアクセス94%のクエリーが2秒以内に完了

Analyticapplications

Transactionapplications

2,000万件/時間のPOSデータ

16+1ノード(Standby), Total : 32TB In-Memory DB

・・・SAP HANA PLATFORM

某流通業様データウェアハウス事例

Page 32: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

32CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

NTTドコモ様におけるSAP HANA 導入事例https://www.sap.com/japan/about/customer-testimonials.html#pdf-asset=18ce6435-d07c-0010-82c7-eda71af511fa&pdf-page=1

Page 33: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

33CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

予測分析ライブラリ

Cisco 様 - SAP HANA による販売戦略の変革多種多様なデータを活用し、$1Bilion の新規案件創出を実現

SAP Predictive Analytics

予測分析とスコアリングの高速化を

インデータベース・アルゴリズムで実現

導入後の効果

▪ ダッシュボードによる日々の販売目標の可視性が向上

▪ 顧客コミュニケーションの向上と高い案件勝率を実現

▪ 購入見込み顧客を示し、顧客に対する提案内容を推奨

従来の課題

▪ 多種・多様なデータが社内に散在

▪ 各チームがバラバラの情報に基づき戦略立案

▪ リアルタイムな洞察が得られず、営業活動が不調

様々なデータソース、

データタイプを活用した予測分析

サプライチェーン

受注情報人事情報 案件情報 人員配置 目標達成状況 etc.

..…

SAP HANAData Management Suite

Page 34: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

34CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

アドバンストアナリティクスを活用した犯罪捜査分析の高度化

Page 35: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

某製造業での実証実験 : 品質検査の正確性向上

Page 36: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

36CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

某製造業での実証実験 : 品質検査の正確性向上

ビジネス結果

• 歩留まり改善、廃棄量と再加工の削減

• 仕入先も含めた品質上の素早い問題解決

圧力データ

温度データ

プレス機による造形プロセス

センサー

原材料

赤外線カメラ

ビジネス課題

• 不良品の廃棄と再加工によるコスト増

• 原因究明に時間がかかっている

品質予測

原材料の調達先が原因の可能性も大いに考えられるが、問題特定に時間がかかる

課題センサーデータだけでは特徴量が断片的で不良品判定ができない

課題

品質予測精度が低く、後工程の品質検査で問題が発覚する場合もある

課題

ERPデータ

改善

画像の特徴量抽出

改善

品質予測が向上

Page 37: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

37CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

現状と課題、新たにチャレンジしたいこと

イメージデータ

センサーデータ

Focus: インプットデータ

› 大量データがコンスタントに増加

› 構造化データと非構造化データのハンドリング

› Pythonプログラムによる複雑なアルゴリズムの作成

Focus: アナリティクス

› イメージデータとセンサーデータの統合

› 履歴データを活用したトレンド分析をリアルタイム分析に

› 基幹システムの製品マスターや生産データとの統合

› 原材料の仕入先情報との連帯

Page 38: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

38CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

ソリューション : イメージデータ活用による分析精度の向上

各セグメント毎の温度分布認識

異常箇所の特定

製品形状の認識

各セグメント毎の温度の数値化

Page 39: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

39CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP HANAとSAP Data Hubを活用したデータパイプライン

イメージデータ

センサーデータ

SAP HANA上で予測分析

SAP HANAData Management Suite

Page 40: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

40CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

SAP HANAでモニタリング画面を開発

生産ライン毎の製造品と品質チェック後の結果を表示

製品イメージデータ

品質判定の根拠となった詳細データの表示

オペレーターは異常発見時にエンジニアに連絡

原材料の仕入先情報との連帯

Page 41: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

41CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

Supply Chain Finance HR Manufacturing Sales Connected Assets

Third-party Finance

and PlanningVisualization Tools Statistical Analytics Spreadsheets

SAP

BusinessObjects

Decision

Intelligence

Systems

TACTICAL REPORTS FUNCTIONAL REPORTS STRATEGIC REPORTS INNOVATION APPS

BW

現状と課題 : データ分散、複雑化するデータアクセス、データガバナンスの欠如

Page 42: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

42CUSTOMER© 2018 SAP SE or an SAP affiliate company. All rights reserved. ǀ

Third-party Finance

and PlanningVisualization Tools Statistical Analytics Spreadsheets

SAP

BusinessObjects

Decision

Intelligence

Systems

Supply Chain Finance HR Manufacturing Sales Connected Assets

Vision : 共通データモデル、全データが活用可能、シンプルな統合データ基盤

TACTICAL REPORTS FUNCTIONAL REPORTS STRATEGIC REPORTS INNOVATION APPS

BW

SAP HANA DATA MANAGEMENT SUITEIn-Memory Data Management | Single logical data model across entire organization | Data Flow Modeling and Control | Insights from powerful analytics engines

Page 43: Click to edit Master title · •分散型ビッグデータ処理の活用 •急進的に拡大するサーバーレスコンピューティングの パラダイムを活用 •機会学習(マシンラーニング)

Thank You