Тимашев Дмитрий "Что такое визуализация данных, или...

Post on 17-May-2015

9.618 views 0 download

description

Конференция "AI&BigData Lab", 12 апреля 2014

Transcript of Тимашев Дмитрий "Что такое визуализация данных, или...

Визуализация данных

Или художественный

компонент в Big Data

О чем поговорим?

❖ Вкратце: что такое визуализация данных, и кому это

нужно

❖ Какие этапы и кто участвует в разработке?

❖ А как это создавать технически?

Data visualization:

что и зачем

Данные - ценны

Зачем визуализировать?

❖ Хочется минимизировать разглядывание таблиц aka

сырых данных

❖ Хочется подергать данные за ниточки

❖ Хочется найти простой способ презентации и

анализа сложных структур данных

❖ Хочется упростить поиск ответов на вопросы

"Main goal of data visualization is to communicate

information clearly and efficiently through graphical

means"

Простой Пример

0

25

50

75

100

125

Апрель Май Июнь Июль

Пример посложнее

❖ http://bost.ocks.org/mike/nations/

The Wealth & Health of Nations

Еще пример - карта

❖ http://prescriptions-demo.dataart.com/

Немного о политикеhttp://cartodb.s3.amazonaws.com/static_vizz/ukr.html

Какие задачи стоят?

❖ Ответить на вопросы о данных которые интересны в

этот конкретный момент

❖ Сделать это максимально понятно

❖ А уж затем (если повезет) - сделать это красиво

Каков процесс

Из чего состоит процесс

Аналитика

❖ Сбор данных

❖ Постановка вопросов

Аналитика + Дизайн

❖ Поиск способов отображения

Техническая реализация

❖ Имплементация

❖ Интерактив

❖ Рефайнмент

Подготовим данные

❖ А как угодно

Зададимся вопросами

❖ ОТКУДА взялись данные?

❖ КТО пользователь?

❖ ЧТО ему нужно увидеть?

❖ ЗАЧЕМ ему это видеть?

Подумаем

Ну и реализация

❖ Наконец-то

Что такое хорошая визуализация?

❖ Не та, которая красивая

❖ Не та, которая показывает на одной картинке

миллион записей базы данных

❖ Но та, которая отвечает на конкретные вопросы (те

самые, которые мы задали пару слайдов назад)

Lorem Ipsum Dolor

Техническая реализация

Три "подхода"

❖ Использовать существующий продукт(дорого, не всегда комфортно, но доступно многим)

❖ Использовать существующие компоненты(дешево, быстро, но не все есть из коробки)

❖ Разработать самому(долго и дорого, но возможности безграничны)

Enterprise продукты

❖ Tableau, Qlikview, TIBCO Spotfire, Panopticon, .....

❖ Можно создать интерактивную картинку без единой

строки кода - много шаблонов "из коробки"

❖ Но зато дорого, сложно интегрировать, и ограничены

все той же "коробкой"

❖ Сравнение

Сравним

❖ Spotfire – замечательно

для Big Data

❖ QlikView –

интерактивность,

дашбоарды, мобильность

❖ Tableau – просто, удобно,

быстро развивается

Ну и пример - Tableau

Библиотеки графиков

❖ Платные (Highcharts, jqchart) и Open Source (Google

charts, nvd3, rickshaw, ...)

❖ Дешевле и быстрее

❖ Но ограничены в наборе графиков, стилизации и

кастомизации

Пример - HighCharts

Кастомная разработка

❖ Возможность создать визуализацию, которая:

❖ отвечает на конкретный вопрос

❖ помогает принимать конкретные решения

❖ анализирует конкретные данные

❖ Может быть красивой и увлекательной (хотя это не

самоцель)

❖ D3.js, Raphael, Processing

D3.js

❖ http://d3js.org/

❖ …“D3 allows you to bind arbitrary data to a Document Object Model (DOM), and then apply data-driven transformations to the document. For example, you can use D3 to generate an HTML table from an array of numbers. Or, use the same data to create an interactive SVG bar chart with smooth transitions and interaction”…

❖ …“D3 is not a new graphical representation. Unlike Processing, Raphaël, or Protovis, the vocabulary of marks comes directly from web standards: HTML, SVG and CSS”…

Пример ❖ http://www.brightpointinc.com/interactive/political_influence/

Пример ❖ http://www.findtheconversation.com/concept-map

Подведем итоги

❖ Визуализация данных – тема, которая в тренде

❖ Существует множество способов реализовать

визуализацию в вашем проекте

❖ Цели проекта и вопросы, которые задает

пользователь, должны диктовать выбор технологии

Вопросы?

mailto: Vladimir.Timashov@dataart.com