분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수:...

32
분산분석

Transcript of 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수:...

Page 1: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

분 산 분 석

Page 2: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

목 차

1. 분산분석의목적2. 분산분석의예3. 분산분석에사용되는용어4. 일원배치법5. 이원배치법

Page 3: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

1. 분산분석의목적

연구대상인특성은몇가지인자에의하여영향을받는다. 이몇가지인자중에서어느인자에 따라서가장많이영향을받는지를결정하거나이인자를어떻게조절하면 최적의상태로되는가의 조건을결정하는일이중요하다.이에분산분석이사용되어진다.

Page 4: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

2. 분산분석의정의

실험결과생긴자료의분산을각인자에기인하는부분과우연오차에기인하는부분으로분해하고인자에기인하는분산과우연오차에기인하는분산차이의유의성을검증함으로써각인자의영향을가려내는방법이다.

Page 5: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

3.분산분석에사용되는용어

인자(factor) : 실험결과에영향을미치는원인수준(level) : 인자의상태를지정한조건요인 (factorial factor) : 주효과와교호작용의원인이되는요소의전체 (주효과, 교호작용)

Page 6: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

*확률변수 : 한 동전을 2회던지는시행에서앞면이나오는사건은 H, 뒷면이나오는사건 T라하고표본공간 S={TT,TH,HT,HH} 이때앞면의수를 X라고하면 X에의하여표본공간의원소에앞면의수를대응시킬수있다. X(S)={0, 1, 1, 2}가된다. 표본공간 S의각원소를어떤규칙 X에의하여실수 x로바꾸어생각하는경우 x=X(S)와같이 X는표본공간S를정의구역으로하는함수이다.즉 표본공간을정의구역으로하는실수함수이다.

Page 7: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

*귀무가설 : 어떤회사제품의전구의평균수명은 1500시간이라고주장하고있다. 지금이회사의전구중에서 36개를무작위추출하여검사해보니 1478시간이었다.이때일반적으로표본으로뽑힌모집단의평균을 1500이라가정하고이가정은모집단의평균과회사에서주장하는평균 1500과차이가없다라는가정을귀무가설이라한다.

*대립가설 : 귀무가설이기각되는경우모집단의평균은 1500이아니라는가정이다.

*유의적 : 표본평균값이귀무가설를기각할만큼모집단평균값으로부터떨어진상태를유의적이라 한다.

*위험역 : 가설이참인데도기각할때참인가설을기각하는과오를범하는확률을어느정도허용하느냐의기준을유의수준혹은위험영역이라한다.

Page 8: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

. 1)-(n 1)-(n

iX .

n 1)-(n 0)X(

)X()X(X

X,X,X

iX

1 iX

)X,X,(X :

2n

1

_

i

_

n

_

2

_

1

n

1

_

i

n21

2n

1

_

i

2n

1

_

i

n21

X

X

X

X

이다

자유도는가지므로독립변수를개의값은의

평방합따라서된다결정이머지값에의하여

나머는변수제수있으나취할자유로이값은개의

의중이있으므로관계가인

수사이에는

변들이보이지만개로의겉보기로는

수는변수의좌우하는값을의이유는그

자유도는대하여에평방합

에서표본임의의자유도

=

=

=

=

⎟⎟⎠

⎞⎜⎜⎝

⎛−

=−+⋅⋅⋅+

−+−=⎟⎟

⎜⎜

⎛−

⋅⋅⋅

⎟⎟⎠

⎞⎜⎜⎝

⎛−

−⎟⎟⎠

⎞⎜⎜⎝

⎛−

⋅⋅⋅∗

i

i

i

i

X

XX

n

n

Page 9: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

4. 일원배치법3개이상의 평균의균일성을검증하는데사용되는방법

일원배치표

/ n T

/ n T x x x x A

/ n T x x x x A

/ n T x x x x A

/ n T x x x x A

A

....

_

..

..

_

kk.knkkjk2k1k

..

_

ii.iniiji2i1i

2.2.2

_

22.2n22j22212

1.1.1

_

11.1n11j12111

x xx

xx

nT

nT

nk

nT

nT

kkk

iii

=

=⋅⋅⋅⋅⋅⋅

=⋅⋅⋅⋅⋅⋅

=⋅⋅⋅⋅⋅⋅

=⋅⋅⋅⋅⋅⋅

평균자료수계자료값인자

ΜΜΜΜΜΜΜΜΜ

Page 10: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

) ,0( ji, :

A : :

ji,Xji,X ji, x

2ji,

ii

ji,i

αε

αµ

εαµ

정규분포실험오차로서나타나는관계없이와

상수가리키는주효과를의수준

평균자료전체의이

를확률변수나타난로실측값

++=

Page 11: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

평방합대한전체에자료즉합제곱의차의

의와전체평균자료의와변수각

.. : ) variation total(

(1) )..( ) variation total(

)1., 1(.

1

)1.( .

)(11.

_

1

2_

1

1

_

1

___

11

_

1

__

11

_

XS

XS

X

X

ijT

n

jij

k

iT

n

iij

i

n

ii

iii

n

jij

k

ii

n

iij

ii

ij

n

ii

i

n

iij

i

X

X

niniXnij

nii

nX

ni

j

iij

i

ii

∑∑

∑∑∑∑=

∑∑

==

====

=

==

−=

==++=

=++=

++==

εαααµ

εαµ

εαµ

εε

εε

Page 12: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

2k

1i

__2

_

2k

1i

__

1

_ k

1i

__2

_

2___

T

TT

) .. .( ).(

) .. .(

).() .. .( 2 ).(

)} .. .( ).{(S

다 )1(1 S

X

X

X

X

∑∑∑

∑∑∑∑

∑∑

=

=

==

−+−=

−+

−−+−=

−+−=

−=

iiX

i

iXiiX

iiX

n

XX

X

XXX

XX

i jij

n

jij

i jij

i jij

i

변형하면같이음과식을

자유도의전변동 ν

Page 13: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

1-k

)...() ( S

) 1n )i. ( (

)1(n

)i. ( )(S

A

2__k

1iA

i

n

1j

2_

k

1iiE

2k

1 1

_

E

X

X

X

=

−=

−−

−=−=

−=

∑∑

=

=

=

= =

ν

ν

자유도

변동급간

자유도는의

자유도

급내변동

in

X

kn

X

Xi

ij

i

n

jij

i

Θ

Page 14: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

2_ _

i.i1

2_

i

_

i1

2__

1

2_

1i 1ij

_

i

_

iji

2_

i

k

1i 1iji

2k

1i

_

1E

).. i. (

)}.. )i. {()...(

)i. (

i. . ,

)}i. () {( ).( S

εε

εε

ε

ε

ε

αα

αµαµ

ε

αµεαµ

αµεαµ

−+=

++−++=−=

−=

++=++=

++−++=−=

−∑

∑∑

∑∑

∑∑∑∑

=

==

= =

= == =

k

ii

k

ii

k

iiA

j

ij

n

jij

n

j

n

ninS

iX

iX

XX

X

Xii

Page 15: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

. F k-n 1,-k

F

1V

V

:H " "

A

E

k21 0

한다분포를

인자유도분모의자유도분자의이는

분산비이들의

불편분산급간

급내불편분산

세우면를귀무가설즉

가설라는없다차이가사이에주효과수준의각

E

A

A

A

A

E

E

E

i

VV

kS

VS

knS

VS

=

−==

−==

==⋅⋅⋅== αααα

Page 16: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

E

A

EA

a T EATE

a2

2..

2.

A

T

2..

T

0

VVF

V 1

V

S SS )(

1 )(S

1 )(S (2)

. A :H )1(

=

−=

−=

−=−=−=

−=−=

−=−=

∑∑

분산비

불편분산

오차급내변동

급간변동

전변동

없다차이가주효과의수준사이에의인자가설

분산분석일원배치의

knS

kS

kn

kn

Tn

T

nn

Tx

EA

i i

i

i jij

ννν

ν

ν

Page 17: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

(4) A

)(FF (3) 1-kk-n

작성분산분석표

유의적차이는효과의수준간의한에인자즉

기각가설을로유의수준이면우측검정 αα≥

1-n S k-n/SV k -n S

)(F V /V F 1-/kSV 1-k S

T

EEE

1-kk-nEAAAA

급내

급간

판정기준분산비불편분산자유도평방합요인

=== α

*두수준간의평균의 차의검정분석결과수준간의주효과의유의차가인정되면각수준중의어느두수준의평균차가유의적인가를알아보는것이다.이때귀무가설을검정할때의유의수준의위험역은양측검과우측검정으로한다.

Page 18: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

좌측검정

우측검정

양측검정

불편분산이때의

표본평균값

표본값얻은

추출하여표본을인크기각각독립적으로서로에서

세운다가설을같다라는모평균이대하여에

정규분포집단두같은모분산이

검정평균차의

(5)(4)

(3)

/1/1 t

})()({2

1

1 , 1

),(y ),,(x ,n B(2)A,

. BA, )1(),(: ),,(:

21

__

2_

11

2_

21

2

11

_

11

_

221121

21

22

yx

yx

yx2

2

nn

yxnn

yn

xn

yyxxn

NBNA

n

ii

n

ii

n

ii

n

ii

nn

i

i

+−

=

−+−−+

=

==

==

==

∑∑

∑∑

σ

σ

σµσµ

ΚΚ

Page 19: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

)/1/1()2(x

(2)

)/1/1()(x

(1)

0.01_) 0.05

. t )/1/1(

T

:

i

.i.

.i.

E..

jiEknj

jiEknj

jiE

ji

jiji

ji

nnVtx

nnVtx

knnnV

XX

j

+≥−

+≥−

=

−=+

−=

=+=+

++

α

α

α

ν

αααµαµ

αµαµ

우측검정

양측검정

위험역은인

또는유의수준검정할때의을귀무가설따라서

한다분포를인자유도인

즉가설

이면모평균을수준의째와모평균수준의째

Page 20: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

Ex)어떤합성반응에서촉매의양이합성물의생산량에영향을알기취해촉매의양을 2g, 4g, 6g 의 3수준으로하여각수준마다 4회씩실험한결과다음과같은자료를얻었다. 촉매의양은합성물의생성량에영향을미친다고할수있는가?

uij = xij-77 (77은가평균)과같이변환함으로써자료값 xij를 uij로고치면

79 80 85 82 )6( 78 75 81 79 )4(

67 73 69 74 )2(

3

2

1

gAgAgA

생성량촉매량

974 2- 324 18 2 3 8 5

25 5 1 2- 4 2 625 25- 10- 4- 8- 3-

)( 77u

3

2

1

2ij

계계인자

AAA

xA ij −=

Page 21: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

CT=(-2)2/12=0.33전변동 : ST={(-3)2+(-8)2 +(-4)2 +(-10)2 +(2)2 +(4)2 +(-2)2 +(1)2 +(5)2

+(8)2 +(3)2 +(2)2}- CT=316-0=316 전변동의자유도 12-1=11촉매량간변동 : SA={(-252/4)+(-52/4)+(182/4)- CT=244촉매량간변동의자유도 3-1=2촉매량내변동 : SE=ST-SA =72

자유도 11-2=9

11 316 02.8)01.0(F 8 9 72

26.4)05.0(F 15.2 122 2 244

29

29

급내

급간

판정기준분산비불편분산자유도평방합요인

=

=

Page 22: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

위의예제각촉매량에대한평균의차의유의성을개별적으로비교하면

500.6)4/14/1()01.0( t

524.4)4/14/1()05.0( t

8 , 4250.3)01.0( t, 262.2)05.0( t

9

50.81774

18

25.787745 70.2577

425-

,

, 6g , 4g , 2g

9

9

E4321

99

.3

_

.2

_

.1

_.3

_

.2

_.1

_

x

xxxx

x

=+

=+

=======∴

=+=

=+==+=

E

E

V

V

nnnn ν

자유도오차변동의

하면라

각각평균을생성량의합성물대한에촉매량

Page 23: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

.

4.524 )4/14/1()05.0( t 25.325.8125.78

.3 .2.3

. 1%

5.6 )4/14/1()01.0( t 0.1125.8125.70

.2 .1 .2

. 1%

5.6 )4/14/1()01.0( t 0.825.7825.70

.2 .1 .1

9

__

9

__

9

__

아니다유의적이

차의과

유의적이다으로유의수준

차의과

유의적이다으로유의수준

차의과

=+⟩=−=

=+⟩=−=

=+⟩=−=

E

E

E

V

V

V

xx

xx

xx

Page 24: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

5. 이원배치법

두인자 A,B가있어서인자 A의수준은 k개, 인잔 B의수준은 l개가 있다고하면 A수준의 Ai와 B수준의 Bj가결합된조건(Ai,Bj)에서의측정값 xij를얻으면이실험을이원배치라하고이원배치표에서인자의각수준에서의측정값이가로로 배열된것을행 (행인자), 세로로배열된것을열 (열인자)

Page 25: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

..

_

.

_

.

_

2.

_

1.

_

...l.j.2i1

.

_

k.klkjk2k1k

.

_

i.iliji2i1i

.2

_

2.2lij22212

.1

_

1.1lij12111

lj 21

xxxxx

xx

xx

T T T T T

T x x x x A

T x x x x A

T x x x x A

T x x x x A

B B B B

lj

k

i

⋅⋅⋅⋅⋅⋅

⋅⋅⋅⋅⋅⋅

⋅⋅⋅⋅⋅⋅

⋅⋅⋅⋅⋅⋅

⋅⋅⋅⋅⋅⋅

⋅⋅⋅⋅⋅⋅

⋅⋅⋅⋅⋅⋅

평균

평균계

ΜΜΜΜΜΜΜ

Page 26: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

) ,0(

ji, :

B ,A : , :

ji,Xji,X ji, x

2

ji,

jiji

ji,ji

α

ε

βαµ

εβαµ

정규분포실험오차로서

나타나는관계없이와

상수가리키는주효과를의수준

평균모자료전체의이

를확률변수나타난로실측값

+++=

Page 27: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

평방합대한전체에자료즉합제곱의차의

의와전체평균자료의와변수각

마찬가지로일원배치법과ㅣ

.. : on) variati total(

(1) )..( on) variati total(

)1., 1(.

1

)1.( .

)(11.

_

1

2_

1

1

_

1

___

11

_

1

__

11

_

XS

XS

X

X

ijT

jij

k

iT

n

iij

i

n

ii

iii

n

jij

k

ii

n

iij

ii

ij

n

ii

i

n

iij

i

X

X

niniXnij

nii

nX

ni

iij

i

ii

∑∑

∑∑∑∑=

∑∑

==

====

=

==

−=

==++=

=++=

++==

εαααµ

εαµ

εαµ

εε

εε

Page 28: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

∑∑

∑∑

++

++−=

++++

−+−=

−=

i j

i jij

i

kil

i

iiX

kl

X

X

X

XX

2___

ij

2__2

i

__

2___

ij

__

___

T

TT

)...j- .-X(

)...j() .. .(

)}...j- .-(X )...j(

) .. .( ).{(S

다 )1(1 S

X X

X XX

X XX X

X

변형하면같이음과식을

자유도의전변동 ν

Page 29: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

1)-1)(l-(k1)-(-1)-(-1)-(

SSSS

)...j- .-X( S

1 )...j(S B

1 ) .. .(S A

BAE

EBAT

2___

ijE

B2

__

B

A

2

i

__

A

X X

X X

X

==−−=

++=∴

+=

−=+=

−=−=

∑∑

lkkl

i

lk

kil

T

i jX

X

νννν

ν

ν

자유도오차변동의

오차변동

자유도간변동

자유도간변동

Page 30: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

2_ _

i1

2_ _

i1

2__ _

1i 1ijE

j

_

1

_

1

_

___

j

_

_

i

_

iji

).. .ji. (

).. i. (

)...j- i. (S

) kl1

.. , 1 .j. , 1i. (

.... , .j. .

i. . ,

-

X

εε

εε

εεε

εεε

εε

ε

β

α

ε

εεε

µβµ

αµεαµ

−+=

−+=

−=

===

+=++=

++=++=

∑∑

∑∑∑∑

=

=

= =

==

l

iB

k

iA

j

iij

k

iij

l

jij

ij

kS

lS

kl

j

iX

X

X

Page 31: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

. F 1)-1)(l-(k 1,-l

F , 1

V

0 :H

F , 1

V

0 :H )1)(1(

V

0 :H 0 :H

A

0

A

0

E

0

0

한다분포를

인자유도분모의자유도분자의이는

분산비

참이면가가설

분산비

참이면가가설

가설

가설

E

BA

B

B

j

E

AA

A

A

i

E

E

E

j

i

VV

lS

VS

VV

kS

VS

lkS

VS

=−

==

=

=−

==

=−−

==

==

β

α

βα

β

α

β

α

Page 32: 분 산 분 석 - CHERIC · 2004. 10. 25. · *확률변수: 한동전을2회던지는시행에서앞면이 나오는사건은h, 뒷면이나오는사건t 라하고표본공간s={tt,th,ht,hh}

따라서 일원배치법의경우와 마찬가지로인자 A ,B의각수준의평균의균일성의 검정을 분산분석표에의해할수있다.또한 각수준의평균의차를개별적으로검정할때의위험역을 일원배치법의경우와마찬가지로결정할수있다.