Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School...

32
Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School April 2011 ЦЖР/ИОО Журналистские расследования - Общественная Школа Финансов, Баку, 14-16 апреля 2011 Статистические модули Инструктор: Эд Суирс-Хеннесси
  • date post

    15-Jan-2016
  • Category

    Documents

  • view

    219
  • download

    0

Transcript of Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School...

Statistics and how to interpret them

CIJ/OSI Investigative Journalism – Public Finance School April 2011

ЦЖР/ИОО Журналистские расследования- Общественная Школа Финансов, Баку, 14-16 апреля 2011Статистические модули Инструктор: Эд Суирс-Хеннесси

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Средняя величина или Среднее значение

Среднее значение вычисляется путём суммирования значений и деления суммы на количество переменных.

В задаче по математике на «множества», количество правильных ответов из 10 были:

Значения: 3,4,5,5,4,10,4,10,4,6,4,7,10,3,10,5,4,6,10,5

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Средняя величина или Среднее значение

Сумма 20 значений составляет 119 Среднее количество 119/20 = 5.95

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Мода (Статистика)

Рассортируйте числа в группах, учитывая сколько людей собрали 3 балла, сколько 4 балла и т.д. Это называется распределение чисел.

См. Excel пример

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Медиана (Статистика)

Сортируйте значения от меньшего к большему.

Подсчитайте количество значений. Если у вас нечетное число

значений, медианой является среднее значение.

Если число значений четное, медиана является средним числом от двух средних значений.

See Excel examples

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Сумма

Данные переменных потока и запаса

Добавьте данные о запасах Будьте осторожны с данными

потока – их можно добавить, но будьте осторожны с описанием.

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население , 2010Азербайджан

8,997,400

Грузия 4,436,400Таджикистан

7,595,000

Украина 45,870,700

Всего 66,899,500

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население, 2010

Процент населения который любит футбол

Азербайджан 8,997,400 30.1

Грузия 4,436,400 25.6

Таджикистан 7,595,000 27.6

Украина 45,870,700 50.3

Всего 66,899,500 Average 33.4

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население, 2010

Процент населения который любит футбол

Азербайджан 8,997,400 30.1

Грузия 4,436,400 25.6

Таджикистан 7,595,000 27.6

Украина 45,870,700 50.3

Всего 66,899,500 Среднее (взвешенное)

43.4

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность

Количество между 0 и 1 0 = невозможное событие 1 = определенное событие 0,5 = событие которое может

произойти и непроизойти

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность

0 = невозможное событие - все мы позавтракали сегодня в Лондоне

1 = определенное событие - все встали с постели сегодня

0,5 = событие может произойти, или не произойти - монета упала на одну из сторон

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность

• Несмещённые кости• Все шесть сторон имеют равную

вероятность выподания• Вероятность = 1 / 6 = 0,1666

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность Отметим сумму вероятностей всех вариантов = 1

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность - возрастно-половая пирамида

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность - эксперименты типа да / нет ; биномиальное распределение

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность -Невероятные события; распределение Пуассона

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Вероятность - Нормальное распределение, например, для зарплаты на определенном уровне

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника Не все люди отвечают Цена опроса высока – поэтому

рассматриваются образцы опросов с малым количеством респондентов

Различные образцы могут давать отличающиеся результаты

Результатам присваивают меру надежности - доверительный интервал.

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника

Реальная стоимость

X Выборочная оценка

X

XX

XXX

X

XX

X

X

X

X

X

XX

X

X

X

X

X

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника

Реальная стоимость

X Выборочная оценка

X

X

X X

XX

X

XX

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника Статистика это среднее арифметическое от

всех наблюдений плюс-минус погрешность измерения

Для 67% доверия к результату???, средний плюс или минус одно (1х) стандартное отклонение.

Для 95% доверия к результату????, средний плюс или минус двукратное (2x) стандартное отклонение.

Для 99% доверия к результату, средний плюс или минус трехкратное (3x) стандартное отклонение.

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Интерпретация данных, полученных с помощью вопросника

Пример возраста

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Примените проверку смысла (sense check) Если вы не уверены, ищите

альтернативные источники Существует ли показатель предыдущего

года? Является ли изменения по годам

допустимым? Правильно ли отображаются единицы

измерения?

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Два примера, где данные не были проверены

1. Население Таджикистана не составляет 7595 млн. (это больше, чем населения земного шара!)

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Два примера, где данные не были проверены

1. Население Таджикистана не составляет  7,595,000,000  (это больше, чем населения земного шара!)

2. Ошибка произошла из-за неправильного применения точки и запятой в дробях

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Ошибки в данных

Два примера, где данные не были проверены

1. Население Таджикистана не составляет 7,595,000,000

2. Не так много людей нетрудоспособны.

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Доверительные интервалы - сравнение результатов

Год Доля курящего населения

Доверительный интервал

2009 32.4 ± 1.2

2010 31.6 ± 1.3

31.2 33.6

32.930.3

Совпадение

Поэтому статистически не значительно

отличается

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Индекс

Используется для описания тенденций в экономике, в частности, в ценах и торговле

Полезен для сравнения разрозненных рядов данных.

Позволяет сравнивать перемены во времени относительно постоянной точки.

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население четырех стран- числа

Статистические данные и как их интерпретировать

ЦЖР/ИОО журналистское расследование Общественная Школа Финансов, апрель 2011

Население четырех стран- 2006=100