Big Data na Nuvem da AWS

38
Big Data na AWS José Papo AWS Tech Evangelist @josepapo

description

Apresentação introdutória sobre Big Data feita como webinar em 31/10/2012

Transcript of Big Data na Nuvem da AWS

Page 1: Big Data na Nuvem da AWS

Big Data na AWS

José Papo

AWS Tech Evangelist

@josepapo

Page 2: Big Data na Nuvem da AWS
Page 3: Big Data na Nuvem da AWS

A análise de grandes volumes de dados está se

tornando a grande barreira para

inovação, competição e

produtividade.

Page 4: Big Data na Nuvem da AWS

O que é Big Data?Gerados por computador – estruturados, semi-estruturados ou não-estruturados Logs (web sites, jogos) Sensores (tempo, água) Imagens/vídeos (cameras, segurança)

Gerados por pessoas Blogs/Resenhas/Emails/Fotos

Redes Sociais Facebook, Linkedin, Twitter

Page 5: Big Data na Nuvem da AWS

Onde se vê Big Data

Mídia/

Propaganda

Anuncios Dirigidos

Processa-mento de vídeos e imagens

Óleo e Gás

Análise Sismica

Varejo

Recomen-dações

Análise de Transações

Telecom

Cobrança

Log de Ligações

Uso dos Produtos

Instituições Financeiras

Simulações de Monte

Carlo

Análise de Riscos

Segurança

Anti-virus

Detecção de Fraudes

Reconheci-mento de Imagens

Marketing e Jogos

(sobretudo social)

Analise Comporta-

mental

Análise de Uso

Métricas “In-game”

Page 6: Big Data na Nuvem da AWS

O que é Hadoop?

Apache Hadoop Sistema de storage distribuído e tolerante a falhas

(HDFS) Usa um algoritmo chamado MapReduce para realizar

análises estatísticas exaustivas sobre um grande conjunto de dados distribuídos

Benefícios-chave Custo mais baixo – Escala linearmente Provado em escala– Petabytes em milhares de nós Flexível – Dados podem ser armazenados com ou sem schema

Page 7: Big Data na Nuvem da AWS

"Hadoop é um storage confiável e um sistema analítico"

HDFS MapReduce

Page 8: Big Data na Nuvem da AWS

RDBMS MapReduce (Hadoop)

Schema definido Schema não requerido

Explora índices para recuperação rápida

Análises rápidas de dados e performance uniforme de

queries

SQL apenas Suporta SQL + outras linguagens

Não escala linearmente Escalabilidade linear para reads + writes

Page 9: Big Data na Nuvem da AWS

Implantar um cluster hadoop é difícil

http://eddie.niese.net/20090313/dont-pity-incompetence/

Page 10: Big Data na Nuvem da AWS

Big Data requer infraestrutura flexível

Infraestrutura física leva a hardware e software estático e planejado para atender picos…

…e muitas vezes acaba gerando longas filas de processamento

Page 11: Big Data na Nuvem da AWS

+

Page 12: Big Data na Nuvem da AWS

Data Warehouse Elástico

Aumenta para 25

instancias

Data Warehouse(Estável)

Data Warehouse(Processo Batch)

Diminui para

9 instancias

Data Warehouse(Estável)

Page 13: Big Data na Nuvem da AWS

Input data

S3

UNDERTHE

HOOD

ii

Page 14: Big Data na Nuvem da AWS

Elastic MapReduce

Code

Input data

S3

UNDERTHE

HOOD

ii

Page 15: Big Data na Nuvem da AWS

Elastic MapReduce

Code Name node

Input data

S3

UNDERTHE

HOOD

ii

Page 16: Big Data na Nuvem da AWS

Elastic MapReduce

Code Name node

Input data

S3

Elastic cluster

UNDERTHE

HOOD

ii

Page 17: Big Data na Nuvem da AWS

Elastic MapReduce

Code Name node

Input data

S3

Elastic cluster

HDFS

UNDERTHE

HOOD

ii

Page 18: Big Data na Nuvem da AWS

Elastic MapReduce

Code Name node

Input data

S3

Elastic cluster

HDFSQueries+ BI

Via JDBC, Pig, Hive

UNDERTHE

HOOD

ii

Page 19: Big Data na Nuvem da AWS

Elastic MapReduce

Code Name node

OutputS3 + SimpleDB

Input data

S3

Elastic cluster

HDFSQueries+ BI

Via JDBC, Pig, Hive

UNDERTHE

HOOD

ii

Page 20: Big Data na Nuvem da AWS

OutputS3 + SimpleDB

Input data

S3

UNDERTHE

HOOD

ii

Page 21: Big Data na Nuvem da AWS
Page 22: Big Data na Nuvem da AWS
Page 23: Big Data na Nuvem da AWS
Page 24: Big Data na Nuvem da AWS
Page 25: Big Data na Nuvem da AWS
Page 26: Big Data na Nuvem da AWS
Page 27: Big Data na Nuvem da AWS
Page 28: Big Data na Nuvem da AWS
Page 29: Big Data na Nuvem da AWS
Page 30: Big Data na Nuvem da AWS
Page 31: Big Data na Nuvem da AWS
Page 32: Big Data na Nuvem da AWS
Page 33: Big Data na Nuvem da AWS
Page 34: Big Data na Nuvem da AWS
Page 35: Big Data na Nuvem da AWS

AWS MarketplaceInformatica, MapR, Karmasphere, Marketshare, Acunu Cassandra, Metamarkets, Aspera e mais.

aws.amazon.com/marketplace

Page 36: Big Data na Nuvem da AWS
Page 37: Big Data na Nuvem da AWS
Page 38: Big Data na Nuvem da AWS

OBRIGADO!aws.typepad.com/brasil

slideshare.net/AmazonWebServicesLATAM

José Papo

AWS Tech Evangelist

@josepapo