201402 Jornada UNEF sobre fotovoltaica tras reforma renovables
SteelEye - 락플레이스 :: 오픈소스...
Transcript of SteelEye - 락플레이스 :: 오픈소스...
SteelEye 소개
SteelEye Protection Suite
1. 회사 소개
2. H/A Cluster 기본개념
CONTENTS
3. SteelEye 소개
4. SteelEye 구성 방안
5. SteelEye 요약
별첨1. H/A와 유사 솔루션 비교
별첨2. vAppKeeper 소개
별첨3. 데이터 복제 방식 비교
1
1. 회사 소개
1997 2001 2005 2007~
Open Source Solution
Java
Valu
e for
Busi
ness
High Availability
Cloud #1 Public Cloud Service
(NikkeiBP)
#2 HA Software
(IDC Japan)
#1 APAC Best
Partner Award
(RedHat)
SIOS Business Area
• 1997: Company Founded • 2003: Business partnership with Red Hat • 2004: IPO on the Tokyo Stock Exchange • 2005: Acquired SteelEye Technology, Inc
1. About SIOS Technology
10년 이상 Open Source환경의 사업기반을 통해, 위 환경에서 최적화된 이중화 솔루션사업과 Cloud서비스로 사업영역을 확대
• Established in 1999 as SteelEye Technology, part of SIOS Technology (publicly traded in Japan) since 2005 • Provides Best-In-Class High Availability, Data Replication and Disaster Recovery solutions • Over 35,000 licenses installed worldwide • Strategic Relationships with HP, IBM and SAP • Multi-time award winner for Linux High Availability with RedHat and Novell certified solutions • Microsoft Gold Certified Partner
2. About SteelEye Solution
Long terms of Focus on Ensuring Availability and Architecture Consistency
1992 AT&T Bell Lab’s
Cluster R&D
NCR
1996
Spinout to NCR R&D in South Carolina
SteelEye
1999
Combine Cluster & Data Replication
SIOS
2006
Software for Innovation Open Solutions
2
Server
Data
Instance
Server
Data
Instance
Server
Data
Instance
Server Instance
H/A
Replication
Active Stand by Active Stand by
H/A
2. H/A Cluster 란 기본 개념
모니터링 Resource (Application, Server, Storage, Data, Network 등)을 주기적으로
감시하여, 장애발생시 자동으로 Fail-over하여 서비스를 복구
SteelEye는 Shared Storage환경”의 H/A Cluster 및 Shared Nothing 환경에서 Replication을 통한 H/A Cluster 두가지 구성 제공
Shared Storage Cluster Shared Nothing Cluster
Fail-over Fail-over
3
Server
Data
Instance
Server
Data
Instance
Data
1. CDC 2. Storage Replication
• CDC(Change Data Capture)솔루션을 통해
Source 노드의 변경사항을 Target에서
DML실행으로 동기화하는 방식
• Async방식이고, (일부)데이터가 논리적으로
동일한거지, 물리적으로 같은 DB라고 보기
어려워, 이중화로 활용 어렵다
• 부분 복제, 집계성 복제를 통한 별도의
Read/Write가능한 DB로 활용에 유리
• EMC의 BCV, Hitachi의 SI같은 Storage
Replication 이용한 Storage이중화 방식
• 복제성능이 빠르고, 안정성이 검증되어 주로
백업부하 분산용과 복구용으로 유리
• 고가의 Enterprise Storage와 해당 벤더의
고가의 복제솔루션 필요
• 자동Fail-over구성 안되고, 일반적으로 특정
시점 기준으로 Sync되도록 구성
Active
Server
Active
Instance
Backup / Test
Server Instance
Active’
Data’ Replication CDC
별첨1. H/A와 유사 솔루션의 비교
4
Server
Data
Instance
Server
Data
Instance
Server
Data
Instance
3. Oracle: RAC 4. Oracle: Active Data Guard
Server Instance
• Storage 이중화가 안되어 있음 • Active-Active가 가능한 방법으로 고가의
Unix의 Oracle환경에서 유리 • Fail-over시간이 짧거나 무중단 서비스 가능 • Oracle만 가능
RAC
ADG
Active Read Only Active Active
• Oracle복구 방식으로 Block level동기화 방식 •속도 빠르고 Target노드를 ReadOnly로 읽기부하 분산 및 백업 부하 분산용으로 활용 가능
• Read Only ReadWrite전환 포함한 Fail-over 자동화 구성 안됨
• Oracle만 가능
별첨1. H/A와 유사 솔루션의 비교
5
Server
Data
Instance
Server
Data
Instance
Server
Data
Instance
5. H/A Solution - Server Only 6. H/A Soution - Server+Data
Server Instance
• Server나 Instance 장애 시 중단 후 자동 Fail-over되어 서비스가 재개되는 구조
•평상시에 Stand by서버가 유휴이므로, 상대적으로 저가인 Linux나 가상화 환경에서 유리
• Storage 이중화가 안되어 있음 •DB이외의 모든 서비스에 활용 가능
H/A
Replication
Active Stand by Active Stand by
• Server, Instance, Storage에 장애 시 중단 후 자동 Fail-over되어 서비스가 재개되는 구조
•평상시에 Stand by서버가 유휴이므로, 상대적으로 저가인 Linux나 가상화 환경에서 유리
• DB이외의 모든 서비스에 활용 가능
H/A
별첨1. H/A와 유사 솔루션의 비교
6
이중화 구성 방안 이중화 Component 활용
범위 Fail-over 자동화
주 용도 Server Instance Data
CDC - - - DB Ⅹ
부분 복제, 집계성 복제를 통한 타시스템 IF나 읽기부하 분산용 및 별도의 Read/Write가능한 DB로 활용에 유리
Storage Replication - - - ALL Ⅹ 백업부하 분산 및 빠른 복구를 위한 1차 백업용으로 유리
Oracle: RAC O O Ⅹ Oracle O
(무중단) RAC + ADG로 구성시 고가의 Oracle환경에서 장애복구, 읽기부하 분산, 백업부하 분산용으로 유리 Oracle: ADG △ △ O Oracle △
HA – Server Only O O Ⅹ ALL O
(중단후) 상대적으로 저가인 Linux 및 가상화 환경에서 DB를 포함한 여러 이중화 환경 구성에 유리
HA – Server+Data O O O ALL O
(중단후)
별첨1. H/A와 유사 솔루션의 비교
7
•Linux RHEL, SLES, OEL,
CentOS, Asianux
•Windows 2003,2008,2012
•Citrix XenServer
•MS Hyper-V
•Red Hat KVM
•OracleVM
•Vmware ESX
•Shared Storage
SAN, iSCSI, NAS
•Non-Shared Storage
Internal Disk, DAS,
Fusion IO
Storage Type
Virtualizations
O/S
Supported
Environment
2. SteelEye 소개 Support Environment
8
SteelEye Protection Suite
Application
Recovery
Kits LifeKeeper DataKeeper
LifeKeeper: Server 및 Application의 장애 감지를 통한 자동 fail-over를 담당하는 H/A Cluster 모듈
DataKeeper: Real-time, High performance의 Data volume Replication 모듈로 LifeKeeper와 연동
ARK: Application의 장애 감지 및 fail-over를 위한 Built-in된 Knowledge 모듈로 LifeKeeper와 연동
2. SteelEye 소개 Product 구성
Combining High Availability with efficient Data Replication to ensure
Business Continuity for your Mission Critical Apps!
9
Application
Recovery
Kits
•Apache
•Samba
•NFS
•SW Raid(md)
•SAP
•WebSphere MQ
•Exchange
•Any Custom App
•Oracle
•MySQL
•PostgreSQL
•Sybase
•DB2
•MSSQL
•DMMP
•NAS
•EMC PowerPath
•Hitachi HDLM
• IBM SDD
•Data Replication
Storage
Applications Services
Databases
2. SteelEye 소개 Support ARK
10
별첨2. vAppKeeper 소개
VMware HA
• Monitors physical host for failure
• Monitors virtual machine for failure
• Can monitor VMware Tools heartbeat to identify OS failure
vAppKeeper
• Monitors the health and applications (A) and their dependencies (D)
• Withholds heartbeat to instruct VMware HA to respond to an application failure (restart, VMotion)
11
별첨2. vAppKeeper 소개
Visibility
• vSphere Client dashboard and granular application hierarchy views
Flexible Management Options
• Brower-based user interface
• Command-line interface
• Multi-level policy
• Temporal recovery logic
12
별첨2. VMHA : vAppKeeper : SPS
구성 방안
이중화 구성
SPOF 이중화 비용
비고
VM HA vAppKeeper LifeKeeper
+ ARK DataKeeper
구성1 ○ •Storage •Application •VM OS
0 • VM HA만을 사용하는 경우 가상화 서버에 대한 HA만을 지원
• 가상화 서버내에서 수행되는 Application장애 감지를 위해서는 vAppKeeper필요
구성2 ○ ○ •Storage •VM OS
5
구성3 ○ •Storage 10 • VM HA와 SPS를 같이 사용하는 경우 SPS가 기 구성된 Standby node로 Fail-over를 하게되면, VM HA는 장애난 Active 노드를 자동으로 기동하여, 빠른 Fail-back이 가능하게 된다.
•즉, SPS를 사용하게 되더라도 VM HA를 같이 사용하는게 이중화 측면에서는 유리하다
구성4 ○ ○ •Storage 10
구성5 ○ ○ - 20
구성6 ○ ○ ○ - 20
vAppKeeper는 vSphere환경의 Linux버전만 지원
13
2. SteelEye 소개 Shared Storage vs. Shared Nothing
Shared Storage Cluster Shared Nothing Cluster
• LAN or WAN recovery 환경도 가능
• Shared storage의 single point of failure 제거
• DR 구성에 적합
• 기존 Storage Replication 대비 비용 절감
• 복제된 데이터도 H/A Automated failover
protection 의 한 구성 요소로 관리
• Fibre Channel SAN, iSCSI or NAS 필요
• 동일 Data Center 내에서만 가능
• 데이터 정합성 보장을 위한 I/O fencing은
SCSI PR3 기본 제공(추가 fencing구성 가능)
• 여러 storage type 지원
• 여러 Multi-Path solution 지원
• Storage에 Single Point of failure 존재
Server
Data
Instance
Server
Data
Instance
Server
Data
Instance
Server Instance
H/A
Replication
Active Stand by Active Stand by
H/A
Fail-over Fail-over
14
항목 비교 설명
비용 Shared Nothing
우수
Shared Storage로 이중화 구성시, SAN Switch 및 외장 Storage로 공유환경을 구성하여야 하므로, Local Disk나 DAS로 Storage를 구성하는 환경에 비해 Storage 구성비용이 상대적으로 고가
Component 이중화
Shared Nothing 우수
Shared Storage환경으로 이중화 구성시, 서버 장애는 대비가 되지만, Storage장애 시 서비스를 Fail-over할 수 없는 SPOF(Single Point of failure)가 존재
Active노드의 Write성능
Shared Storage 우수
Replication을 Async로 구성 시 는 성능이 동일하나, Sync 방식으로 구성 시, Standby노드 까지 Write가 완료 되어야만, Active노드의 Write가 완료되는 구조이므로, Active노드의 Write작업에 일부 성능 저하
Active노드의 Read 성능
동일 Read는 Active 노드 단독으로만 처리하기 때문에 영향 없음
DR 구성 Shared Nothing
Only Replication을 통한 DR구성
Replicated Storage 활용
임시 테스트 환경
Shared Nothing Only
Standby노드로의 복제를 임시 중단하고, Standby 시스템을 테스트용으로 활용 가능하다. 테스트 완료 후 복제를 재개하면, 전체 스토리지 볼륨을 복제하는 것이 아니고, 테스트 시에 변경된 블럭과 복제가 중단된 블록만 다시 Sync하여, 빠른 시간 안에 HA Standby로 복귀가 가능
Rolling Patch 작업
Shared Nothing Only
복제 구성 시, OS나 DB같은 시스템 S/W가 설치된 볼륨은 복제를 하지 않고, 데이터 영역만 복제 구성을 합니다. OS, DB등의 S/W영역에만 변경이 일어나는 Patch와 같은 작업 시 일부 절체 시간의 중단만으로, Active노드를 변경하면서 작업이 가능
2. SteelEye 소개 Shared Storage vs. Shared Nothing
15
bitmap file
bitmap file
Active의 디스크와 리모트의 디스크는 nbd와 software RAID를 통해 복제
2. SteelEye 소개 DataKeeper 아키텍쳐
16
별첨3. 데이터 복제 방식 비교
CDC방식 Log Apply 방식 File 단위 복제 Block 단위 Volumn/LUN 복제
설명
Active node의 DML을 Log에서 추출하여 Target node에서 SQL execution하는 방식
Active노드에서 발생한 DB복구를 위한 Log를 Target node에서 Log apply(=recovery)를 하는 방식
Active node에서 변경된 파일을 Target node에 전송하는 방식
Active node에서 변경된 Block만을 Target node로 전송하는 방식
적용가능 범위
DB에만 사용 가능 DB에만 사용 가능 Raw Device를 제외한 모든 File에 사용 가능
Raw Device를 포함한 모든 데이터 복제에 사용 가능
솔루션 •SharePlex •Oracle Golden Gate •MySQL Replica 등
• Oracle Active Data Guard – Physical mode
• Cubrid Replication
BCV DataKeeper 등
동기화 방식
Async/Sync(일부 지원) Async/Sync Async/Sync Async/Sync
성능 느림 중간 중간 빠름
전송량 적음 보통 많음 적음
비교
•성능이 느린 경우가 많다. •솔루션에 따라 읽기 정합성이 순간 불일치 난다.
•데이터 불일치 상태를 모니터링 하기 어렵다.
•동기화에 문제가 없으면 논리적으로 동일한 데이터이지만, 물리적으로 동일하지 않다
• DB벤더에서 제공하는 가장 안정적인 DB복제 방식
•복제 중간에 복제가 중단되면, 이후에 복제를 따라가기 위해서는 중간의 모든 로그를 Apply해야만 한다. 복제 Target을 읽기전용과 같은 용도로 사용 가능
• DB처럼 I/O의 단위가 파일단위로 Write가 일어나지 않는 경우 적용이 어렵다.
•인프라적으로 가장 빠르고 안정적으로 복제를 하는 방식이다.
•물리적으로 동일하기 때문에, Fail-over나 DR구축 용으로 가장 안정적인 복제 방식
17
별첨3. CDC와 DataKeeper
Server
Data
Instance
Server Instance
Data
DataKeeper
Master Standby
LifeKeeper Server Instance
Data’
Slave
CDC
Read Only Read/Write
Fail-over
Active
방안1: CDC
방안2: LK + DK
고려사항
•Read Traffic 분산 방안
•장애 감지 범위
•Fail-over 자동화 방안(VIP, DB Mode, Application 등)
•Master만으로 Read Traffic 처리 가능한가
•CDC복제의 안정성, 속도, 데이터 유실 가능성
Fail-over
18
2. SteelEye 소개
GUI를 통한 리소스 등록 및 관리 가능
각 리소스 타입별 관리 메뉴 제공
각 리소스 타입별 설정 마법사 제공
각종 로그 조회 및 리소스 상태 관제 가능
GUI
19
3. SteelEye 구성 방안
All configurations supported across both physical and virtual servers
Single Node
Monitoring &
Recovery
Two Node LAN
Failover Cluster with
Shared Storage
Two Node LAN
Failover Cluster with
Data Replication
N-Node WAN Failover
Cluster with Data
Replication (DR)
Hybrid Shared Storage
Cluster with WAN
replication (DR)
20
Server
Data
Instance
Server
Data
Instance
Server
Data
Instance
Server Instance
Replication
Active Stand by Active Stand by
3. SteelEye 구성 방안 기본 구성
모든 구성에서 Server는 Physical, Virtual모두 가능 즉, PP, PV, VP, VV 모두 가능
Shared Storage Cluster Shared Nothing Cluster
H/A H/A
21
Data2
Server
Active
Data1
Sync
Server
Active
Data2
Server
Data1
Instance2
Standby
Instance2
Instance1
Instance1
Sync Data2
Server
Active
Server
Active Server
Data1
Instance2
Standby
Instance2
Instance1
Instance1
Shared Nothing Cluster Shared Storage Cluster
3. SteelEye 구성 방안 N:1 구성
22
Server
Active/Standby
Data2
Sync
Data1
Instance2 Instance1
Server
Data2 Data1
Instance2 Instance1
Sync
Active/Standby
Shared Nothing Cluster
Shared Storage Cluster
Server
Active/Standby
Data2 Data1
Instance2 Instance1
Server Instance2 Instance1
Active/Standby
3. SteelEye 구성 방안 Crose Standby
23
Server
Data
Instance
Active
Server Instance
Standby
Data Sync
Server Instance
DR
Data
Async
Instance
Server
Data
Instance
Active
Server Instance
Standby
Server Instance
DR
Data Async
Instance
3. SteelEye 구성 방안 DR 구성
H/A
H/A H/A
H/A
Shared Nothing Cluster
Shared Storage Cluster
24
다양한 x86 환경
지원
우수한 복제 성능
다양한 Resource
지원
다양한 Enterprise Linux 배포판 지원 다양한 가상화, Cloud 환경 지원 Shared Storage 외 Local, DAS Storage 지원 각 스토리지 밴더의 multipath 드라이버 지원
LAN/WAN환경에서의 Host-based Replication Sync/Async/Periodic 모드 복제 지원 Block 단위 Volume/LUN 복제로 대용량 파일 처리에 적합 Fail-over시 자동 Source/Target변경 각각 다른 설정의 Multi-target 지원 Dirty block을 bitmap으로 관리하여 full resync 방지 복제 대역폭 제한 및 9단계의 압축 전송 지원
30여개의 주요한 Application에 최적화된 knowledge module 각 리소스 타입별 최적화된 기동/정지, 상태 check 제공 리소스 타입별로 2 level(quick/deep check) health check 제공
구성 및 운영
편의성 각 리소스 type 별 wizard를 통한 리소스 등록 및 관리 Java 기반 GUI 및 CLI 제공 비즈니스 변화에 따른 노드 증설, 변경 및 축소 용이함 클러스터 상태 모니터링을 위한 SMTP/SNMP trap 지원
Shared Storage 및 Shared Nothing 환경 지원 1:1, 1:N, N:1, DR, cross standby 구성 지원 Virtual, Physical 간의 자유로운 이중화 구성 지원
다양한 구성
4. SteelEye 요약 Key feature
25
4. SteelEye 요약
SteelEye Protection Suite 10년이상 검증된 Architecture의 Consistency
x86(Linux, Windows), 가상화, Cloud 환경에 최적화
Open Source를 포함한 다양한 Linux배포 버전을 지원
다양한 Resource들을 Script작성 기반이 아닌 지능화된 Application감시 모듈
다양한 환경 구성(1:1, N:1, DR, cross standby, Shared Storage/Shared Nothing)
Block기반 복제로 빠른 성능 및 DB이외의 다양한 형태의 Replication 지원
설치, 구성, 운영 작업에 직관적인 Wizard 형태의 GUI 제공
HA Fail-over, Data Replication, DR을 하나의 솔루션으로 구축
Business 요구사항 변경에 따른 유연한 확장/변경 가능
storage-based DR/Replication보다 유연하고 저가의 구축 가능
26
감사합니다.