Lambda Architecture presentaton

9

Click here to load reader

description

Presentation of Lambda Architecture, Lambdoop project and output for fast business solutions

Transcript of Lambda Architecture presentaton

Page 1: Lambda Architecture presentaton

Думать в стиле

Представление Лямбда Архитектуры

Кузнецов Сергей Викторович

Директор по технологиям

Page 2: Lambda Architecture presentaton

2

Предпосылки

Пакетный процессинг

Большие объемы статичных

данных (Volume)

Масштабируемое решение

«Логика приведет вас из точки А в точку В.

Воображение доставит куда угодно!» (А. Эйнштейн)

Процессинг Реального Времени

Анализ потоковых данных (Velocity)

Быстрый отклик

Гибридный подход

Лямбда Архитектура

Volume + Velocity

Page 3: Lambda Architecture presentaton

3

- Философия

Запрос = Функция (Всей Информации)

Cистема не восприимчива к единичной потере

данных и/или повреждению данных (fault-tolerance)

Неизменность данных – хранение данных в

исходном неизменяемом виде

Перевычисление – есть возможность всегда

провести вычисления на исходных данных

«Мы не можем решать проблемы, используя те же

подходы в мышлении, которые мы использовали,

чтобы создать проблемы.» (А. Эйнштейн)

Page 4: Lambda Architecture presentaton

4

Требования к Потоковой обработке в реальном времени

1 • Сохраняйте данные движущимися

2 • Формулируйте запросы с использованием SQL на потоках (Stream SQL)

3 • Справляться с дефектностью потоков (задержка, отсутствие и нарушение порядка данных)

4 • Генерируйте предсказуемые результаты

5 • Интегрируйте хранимые и потоковые данные

6 • Гарантируйте безопасность и доступность данных

7 • Автоматически разделяйте и масштабируйте приложения

8 • Мгновенно обрабатывайте и выдавайте результаты

- Michael Stonebraker

Page 5: Lambda Architecture presentaton

5

Инфраструктура потоковой обработки данных

Twitter STORM

Yahoo S4 -> Apache

IBM InfoSphere Streams

Apache Samza

SQL Stream

ParStream

….

ZeroMQ, Rabbit MQ

Apache Kafka

Hadoop YARN

Twitter Trident

Page 6: Lambda Architecture presentaton

6

Идея

Растущие

Исходные

Данные

Предвычисленные

значения (Views)

Аналитика

Приложения

Накапливаемые

Данные (Master)

Page 7: Lambda Architecture presentaton

7

Архитектура

(A)— Новые данные поступают на

Пакетный уровень и уровень Ускорения.

(B)— Мастер – неизменяемая сырая

информация, данные только

добавляются.

(C)— Пакетный уровень постоянно

перевычисляет функции заново в Пакеты.

(D)—Сервисный Уровень индексирует

Пакеты. Результаты обычно отстают.

(E)—Уровень Ускорения компенсирует

разницу в актуальности данных,

инкрементально добавляет данные в

представления реального-времени с

коротким ЖЦ.

(F)— Запросы обрабатывают Пакеты и

представления реального времени.

Page 8: Lambda Architecture presentaton

8

Архитектура

All data

(HDFS)

Precomputer

views

(MapReduce)

New data

stream

Query

(Impala)

Process

stream

Increment

views

QFD 1 QFD 2 QFD N

QFD 1 QFD 2 QFD N

Batch layer

Serving layer

Speed layer

Batch

recompute

Hadoop

Batch views (HDFS Impala)

Realtime views (Apache HBase) Merge

Storm

Realtime

increment

Page 9: Lambda Architecture presentaton

9

Почему ??

Функциональное Программирование Пути потоков данных для Принятия

Быстрого Решения