Корреляционный анализ
-
Upload
sixsigmaonlineru -
Category
Education
-
view
290 -
download
0
Transcript of Корреляционный анализ
Корреляционный анализ
Correlation Analysis
SixSigmaOnline.ru 2015
© Six Sigma Online . ru
Корреляционный анализ
2
В производственном процессе всегда проводится контроль
тех или иных показателей: параметров конечного продукта
или параметров процесса, количественных или качественных
показателей. Причиной проведения такого контроля может
быть требование заказчика, требование отраслевых
стандартов или перестраховка выпуска брака.
Так или иначе, в ходе проведения контроля накапливается
огромный массив данных. Его исследование с помощью
простейших статистических методов анализа, таких как
корреляционный анализ, может принести много полезных
сведений о процессе без дополнительных затрат на его
изучение.
© Six Sigma Online . ru
Корреляционный анализ
3
Термин “корреляция” означает взаимосвязь двух параметров.
Два параметра считаются корреляционно зависимыми, если
изменения одного параметра зависят от изменений другого.
Основной характеристикой корреляционной зависимости
является коэффициент корреляции r, который количественно
характеризует силу связи между двумя параметрами.
На основании его величины судят о наличии или отсутствии
корреляции. При этом не следует забывать, что:
коэффициент характеризует линейную зависимость;
коэффициент сильно подвержен влиянию выбросов.
© Six Sigma Online . ru
Корреляционный анализ
4
Наглядно представить взаимосвязь между двумя
переменными и качественно оценить ее помогают
диаграммы рассеяния.
Диаграммы рассеяния отображают данные в виде
точек в координатах, осями которых являются
переменные.
В таблице справа собраны данные о силе,
требуемой для разрыва бумаги, и ее толщине.
Используем эту информацию для построения
диаграммы рассеяния и корреляционного анализа.
№ x y
1 0,2 64
2 0,19 65
3 0,28 69
4 0,26 69
5 0,23 66
6 0,21 65
7 0,24 67
8 0,26 67
9 0,28 70
10 0,25 68
11 0,25 67
12 0,22 66
13 0,18 63
14 0,26 68
15 0,17 62
16 0,3 70
17 0,19 64
18 0,25 68
19 0,29 69
20 0,27 68
21 0,2 63
22 0,19 66
23 0,29 70
24 0,31 72
25 0,24 66
26 0,22 65
27 0,27 69
28 0,23 65
29 0,25 69
30 0,17 61
© Six Sigma Online . ru
Корреляционный анализ
5
В пакете Minitab выберите
Graph > Scatterplot > Simple
и укажите переменные x и y
соответственно таблице.
0,3250,3000,2750,2500,2250,2000,1750,150
72
70
68
66
64
62
60
x
y
Scatterplot of y vs x in Minitab 17
А вот так будет выглядеть
диаграмма рассеяния в
пакете “101 инструмент
вашего проекта шести сигм”
© Six Sigma Online . ru
Корреляционный анализ
6
Рассчитать величину коэффициента корреляции в пакете
Minitab можно с помощью команды Stat > Basic Statistics >
Correlation:
Correlation: x; y
Pearson correlation of x and y = 0,944
P-Value = 0,000
В пакете “101 инструмент вашего проекта шести сигм”
воспользуйтесь первой таблицей под графиком:
r= 0,94418
r2= 0,89148
p-value= 0,00000
t= 15,16663
Коэффициент корреляции
Значимость или вероятность
© Six Sigma Online . ru
Корреляционный анализ
7
Чтобы рассчитать коэффициент корреляции r вручную,
воспользуйтесь формулой:
𝑟 =1
𝑛 − 1 𝑥𝑖 − 𝑥
𝜎𝑥×𝑦𝑖 − 𝑦
𝜎𝑦
𝑛
𝑖=1
где 𝑛 – число опытов,
𝑥𝑖 и 𝑦𝑖 – i-е значения переменных 𝑥 и 𝑦, 𝑥 и 𝑦 – средние арифметические переменных 𝑥 и 𝑦, 𝜎𝑥 и 𝜎𝑦 – стандартные отклонения переменных 𝑥 и 𝑦.
Или используйте функцию Correl (Коррел в русскоязычной
версии) для расчета коэффициента корреляции в MS Excel.
© Six Sigma Online . ru
Корреляционный анализ
8
В зависимости от величины коэффициента корреляции
различают три вида корреляционной зависимости:
Y-Axis
X-Axis
Y-Axis
X-Axis
Y-Axis
X-Axis
Строгая отрицательная
корреляция
Строгая положительная
корреляцияОтсутствие корреляции
© Six Sigma Online . ru
Корреляционный анализ
9
Если две переменные не связаны между собой, то на
диаграмме рассеяния будет лишь набор случайно
расположенных точек - никакой структуры (выраженной
группы точек) или направления (тренда):
r = 0 – корреляционная
зависимость отсутствует.
Чем ближе r к 0, тем слабее
зависимость между двумя
переменными.
Y-Axis
X-Axis
© Six Sigma Online . ru
Корреляционный анализ
10
В случае наблюдения четкого направления или структуры
можно говорить о том, что два фактора корреляционно
зависимы.
r = 1 – сильная положительная корреляция.
Чем ближе r к 1, тем сильнее связь между
двумя факторами.
r = -1 – сильная отрицательная корреляция.
Чем ближе r к -1, тем сильнее связь между
двумя факторами.
Y-Axis
X-Axis
Y-Axis
X-Axis
© Six Sigma Online . ru
Корреляционный анализ
11
Если r >0.8 или r < -0.8 – корреляция считается сильной
Если r < 0.2 или r > -0.2 – считается, что корреляция
отсутствует.
Если r находится в пределах 0.2–0.8 или (-0.8)–(-0.2),
считается, что корреляция слабая.
Помните! Оценивая зависимость между двумя
переменными, опираясь лишь на коэффициент корреляции,
можно легко допустить ошибку или упустить из виду
нелинейную зависимость. Поэтому не следует пренебрегать
графическим анализом корреляционной зависимости.
© Six Sigma Online . ru
Корреляционный анализ
12
Корреляционной анализ
говорит о сильной
взаимосвязи: Pearson correlation of X1
and Y1 = 0,816
Pearson correlation of X2
and Y2 = 0,816
Pearson correlation of X3
and Y3 = 0,816
Pearson correlation of X4
and Y4 = 0,817
X1 Y1 X2 Y2 X3 Y3 X4 Y4
10 8,04 10 9,14 10 7,46 8 6,58
8 6,95 8 8,14 8 6,77 8 5,76
13 7,58 13 8,74 13 12,74 8 7,71
9 8,81 9 8,77 9 7,11 8 8,84
11 8,33 11 9,26 11 7,81 8 8,47
14 9,96 14 8,1 14 8,84 8 7,04
6 7,24 6 6,13 6 6,08 8 5,25
4 4,26 4 3,1 4 5,39 19 12,5
12 10,84 12 9,13 12 8,15 8 5,56
7 4,82 7 7,26 7 6,42 8 7,91
5 5,68 5 4,74 5 5,73 8 6,89
Ниже приведены четыре набора
числовых данных – “Квартет
Энскомба”
© Six Sigma Online . ru
Корреляционный анализ
13
15,012,510,07,55,0
10
8
6
4
X1
Y1
15,012,510,07,55,0
10
8
6
4
X2
Y2
15,012,510,07,55,0
12
10
8
6
4
X3
Y3
201510
12,5
10,0
7,5
5,0
X4
Y4
Scatterplot of Y1 vs X1 Scatterplot of Y2 vs X2
Scatterplot of Y3 vs X3 Scatterplot of Y4 vs X4
В то же время графический
анализ позволяет избежать
опрометчивых выводов
© Six Sigma Online . ru
Корреляционный анализ
14
Следующие графики иллюстрируют примеры ошибочного
определения корреляции в наборе не связанных данных:
Y-A
xis
X-Axis
Y-A
xis
X-Axis
Y-A
xis
X-Axis
Y-A
xis
X-Axis
Y-A
xis
X-Axis
Y-A
xis
X-Axis
© Six Sigma Online . ru
Корреляционный анализ
15
Корреляционный анализ в проектах шести сигм применяется:
на стадии измерения (Measure) для сужения круга
исследуемых параметров;
на стадии анализа (Analyze) для поиска зависимости
между параметрами;
на стадии улучшения (Improve)
для анализа результатов
экспериментов (DOE).
605040 320315310 3,02,52,0 140125110
90
60
30
90
60
30
90
60
30
90
60
30
SoldPotTemp
PrehTemp
WaveH
FluxVol
ConvSp
250 Corner
260 Center
270 Corner
SoldPotTemp Point Type
40 Corner
50 Center
60 Corner
PrehTemp Point Type
310 Corner
315 Center
320 Corner
WaveH Point Type
2,0 Corner
2,5 Center
3,0 Corner
FluxVol Point Type
Interaction PlotData Means