Чему учиться, чтобы заниматься дата-журналистикой

Post on 02-Jul-2015

308 views 1 download

Transcript of Чему учиться, чтобы заниматься дата-журналистикой

Как становиться дата-журналистом?

19 сентября 2013 г.

•Что изучать?

• Где изучать?

•Когда изучать?

«Не люблю термин “дата-журналист”»

Для меня данные - это инструмент, как ручка или печатная машинка. Люди не называли себя "журналистами печатной машинки", просто потому что они пользовались печатной машинкой, вместо ручки… Я думаю, способность обращаться с данными и с такой сжатой информацией, - это то, что свойственно всей журналистике, и я скептически отношусь к такому разделению на журналистов и дата-журналистов, потому что для меня данные - это просто один из инструментов, который может использовать журналист, чтобы находить истории, чтобы находить свидетельства тому, что происходит, и понимать, что происходит.

http://dataplayblog.wordpress.com/2013/04/28/i

-dont-even-like-the-term-data-journalist/ Michael Bauer

Что такое данные?

Источник: Археологический музей, г. Ираклион

Нравится ли вам это… существо? Выберите наиболее подходящий ответ (1 – оно отвратительно; 10 – очень нравится)

Место: Ираклион, Греция

Число голов: 4

1 2 3 4 5 6 7 8 9 10

Данные:

Что такое данные?

Jonathan Stray

Data is a collection of similar pieces of information.

Данные – это

собрание сходных информационных единиц.

http://courses.jmsc.hku.hk/jmsc6

041spring2013/

Задача: описать мир в цифрах

• Какие измерения есть у объекта?

• Какие из них значимы?

• От чего это зависит?

• Как это соотносится с другими объектами?

Котировки акций и солнечная активность

Любая статистическая графика… хороша лишь настолько, насколько хороши её основания.

Edward R. Tufte, The Visual Display of

Quantitative Information

Что нам это дает?

Jer Thorp

Визуализация частотности употребления слов "надежда"/hope (голубой) и "crisis"/кризис (черный) в New York Times 1981-2010 гг.

ЧТО?

ЧТО? Области знания:

• Программирование

• Статистика

• Социальные науки

• Машинное обучение

• Дизайн

• Обработка естественных языков

• GIS, картография

• Дата-наука

• …

Что? Инструменты:

• Таблицы (Excel, Open/Libre Calc, Google Таблицы)

• Инструменты для очистки данных

• Репозитории (Github, CKAN…)

• Среды разработки, текстовые редакторы

• Языки программирования (Python, Ruby…)

• Инструменты визуализации

• Картографические инструменты

• Инструменты статистической обработки данных (R)

• …

Где?

• Онлайн-библиотеки, справочники

• Сообщества и рассылки

• Платформенные массовые образовательные онлайн-курсы

• Неплатформенные онлайн-курсы

• Вебинары и мастер-классы

• Оффлайн-семинары, хакатоны

• Профильные блоги

Где? Ресурсы по программированию для начинающих:

Codecademy.com

Mechanicalmooc.org

OpenStudy.com

P2PU.org

Где?

Coursera.org

Udacity.com

edX.org

Массовые открытые онлайн-курсы:

Где ещё? Сообщества и школы:

• OpenDataSchool.ru

• Datadrivenjournalism.ru

• Datadrivenjournalism.net

• KnightFoundation.org

• SchoolOfData.org

• P2PUniversity (P2PU.org)

• …

Когда?

Пусть это войдет в привычку: делайте по одному упражнению - каждый день в одно и то же время.

Zach Sims, Codecademy

Для начала: таблицы

MS Excel Open/Libre Calc Google Таблицы

CSV XLS XML

Итого

• Для осмысленной работы с данными требуется освоение нескольких областей знания.

• Есть общедоступные онлайн-ресурсы, с помощью которых можно приобщиться к этим областям.

• Их можно осваивать постепенно и параллельно с основной работой.

• Быстрый старт возможен благодаря существованию простых, но эффективных инструментов.

Вопросы?