İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
description
Transcript of İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
BAĞIMSIZ GRUPLARA İLİŞKİN
HİPOTEZ TESTLERİ
İKİ ÖRNEKLEM TESTLERİ
• TEK YÖNLÜ VARYANS ANALİZİ (ANOVA)
BAĞIMSIZ K ÖRNEKLEM TESTLERİ
PARAMETRİK TESTLER
PARAMETRİK OLMAYAN TESTLER
• KRUSKAL-WALLIS VARYANS ANALİZİ
• ÇOK GÖZLÜKİ-KARE TESTLERİ
TEK YÖNLÜ VARYANS ANALİZİ
• Parametrik test varsayımları sağlandığında, ölçümle belirtilen bir değişken yönünden ikiden fazla bağımsız grubun ortalamaları arasında fark olup olmadığını test etmek için kullanılır. İki ortalama arasındaki farkın anlamlılık testi için gerekli varsayımlar varyans analizi için de geçerlidir.
Varsayımlar
• Karşılaştırılacak gruplarda veriler normal dağılım göstermeli
• Grupların varyansları homojen olmalı• Gruplar birbirinden bağımsız olmalı
Hipotezler:
H0: 1= 2= 3=...= k
Ha: En az bir i farklıdır.
Ortalama
T..T.kT.3T.2T.1Toplam
x3kx33x32x31
x2kx23x22x21
x1kx13x12x11
k321
Gruplar
1.x 2.x 3.x kx. ..x
11nx... ... ... ...
...
...
...
...22nx 33n
x knkx
jn
iijj xT
1.
..
j
jj n
Tx
k
j
k
j
n
iijj
j
xTT1 1 1
...
N
Tx ..
..
k
jjnN
1
j. sütunun toplamı
j. sütunun ortalaması
Bütün gözlemlerin toplamı
k
j
n
i
k
j
n
iijij
j j
N
Txxx
1 1 1 1
2..22
.. )(GnKT
Genel Kareler Toplamı:
Grup İçi Kareler Toplamı:
k
j
n
i
k
j
n
i
k
j j
jijjij
j j
n
Txxx
1 1 1 1 1
2.22
. )(GIKT
Gruplar Arası Kareler Toplamı:
k
j
k
j j
jjj NT
n
Txxn
1 1
2..
.2... /)(GAKT
GnKT=GIKT+GAKT
1)GAKT/(kGAKO
)kGIKT/(NGIKO
GAKO/GIKOFH
Gruplar İçi Kareler Ortalaması:
Gruplar Arası Kareler Ortalaması:
F Hesap İstatistiği:
Değişim
Kaynağı
Kareler toplamı
Ser.
Der.
Kareler Ortalaması
F
Gruplar Arası GAKT k-1 GAKO GAKO/GIKO
Grup İçi GIKT N-k GIKO
Genel GnKT N-1
ANOVA TABLOSU
GAKO/GIKOFH );(),1(tabloF kNksdF
Varyans Analizi Sonucu Anlamlı Olduğunda Farklı Grupların Belirlenmesi
Varyans analizi sonucunda gruplar arasında fark yoksa işlemler sona erer. Ancak, gruplar arasında fark varsa, farklılığın hangi grup ya da gruplar arasında olduğu farklı yöntemlerle araştırılabilir. Bu yöntemlere post-hoc testleri denir. Bu yöntemlerden en çok kullanılanları;
LSD
Tukey
Bonferroni
Sidak
Dunnett’s C
Dunnett’s T3
Örneklem genişlikleri eşit olduğunda(n1=n2=n3=...=nk=n)
LSD Testi
n
GIKOtxx ji
)(2 p<0.05
Örneklem genişlikleri eşit olmadığında(n1n2 n3 ... nk)
)11
(ji
ji nnGIKOtxx p<0.05
Örnek:
Adölesan dönemindeki 90 kız, yaş gruplarına göre (11-14, 15-18, 19-24) 3 gruba ayrılmıştır. Günlük kilo başına tükettikleri kaloriler hesaplanmıştır. Yaş gruplarına göre tüketilen kaloriler bakımından farklılık var mıdır?
Yaş Grupları
11-14 15-18 19-24
42.45 39.98 43.30
46.81 45.29 42.85
45.62 33.08 32.43
53.82 38.60 46.81
. . .
. . .
. . .
50.68 37.57 35.18
Toplam 1380.76 1193.82 1105.72 3680.30
Ortalama 46.02 39.79 36.86 40.89
H0: 1= 2= 3
Ha: En az bir i farklıdır.
36.3642
65.15049501.154138
90
30.368018.3581.4645.42GnKT
2222
1 1
2..2
k
j
n
iij
j
N
Tx
31.2327
30
72.1105
30
82.1193
30
76.138018.3581.4645.42
GIKT
222222
1 1 1
2.2
k
j
n
i
k
j j
jij
j
n
Tx
GAKT=GnKT-GIKT=3642.36-2327.31=1315.05
ANOVA TABLOSU
1315.05 2 657.53 24.58 ,000
2327.31 87 26.75
3642.36 89
Gruplar Arası
Grup İçi
Toplam
KarelerToplamı sd
Kareler Ortalaması F P değeri
GIKO=GIKT/(90-3)=2327.31/87=26.75
GAKO=GAKT/(3-1)=1315.05/2=657.53
F=GAKO/GIKO=657.53/26.75=24.58
Grup ortalamaları arasında anlamlı bir farklılık vardır.
Gruplardaki kişi sayıları birbirine eşit olduğu için
Hipotezler LSD İstatistiksel karar
H0: 1= 2
6.23>2.64,
H0 red.
H0: 1= 3
9.16>2.64,
H0 red.
H0: 2= 3
2.93>2.64,
H0 red.64.2
30
)75.26(298.1
79.3902.46 n
GIKOtxx ji
)(2
64.230
)75.26(298.1
64.230
)75.26(298.1
KRUSKAL- WALLIS TESTİ
Tek yönlü varyans analizinin parametrik olmayan karşılığıdır. Veriler ölçümle belirtildiği halde parametrik test varsayımları sağlanmıyorsa (gözlem sayısı az ya da gruplar normal dağılmıyor ise) Kruskal-Wallis testi kullanılır.
Testin aşamaları şu şekilde gerçekleşir:
1. k grubun n1, n2,…, nk gözlemleri tek bir değişken altında küçükten büyüğe sıralanır. Tüm gözlemlere sıra numarası verilir.
2. k grubun sıra numaraları ayrı ayrı toplanır(Rj)
3. Test istatistiği
şeklinde hesaplanır.
k
j j
j nn
R
nnKW
1
2
)1(3)1(
12
Grup sayısı
j. gruptaki gözlem sayısı
j. gruptaki sıra sayıları toplamı
4. Üç grup olduğunda ve her bir grupta beş ve daha az gözlem olduğunda hesaplanan KW istatistiği, özel tablolar kullanılarak karşılaştırılır. Bir ya da daha fazla grupta beşten fazla gözlem olduğunda ise KW, k-1 serbestlik dereceli 2 tablo değeriyle karşılaştırılır.
ji
ji nnkn
KWnnntRR
111
12
)1(
ANOVA’da olduğu gibi bu Kruskal-Wallis testi de tüm gruplar arasında anlamlı bir farklılık olup olmadığını belirtir. Hangi gruplar arasında farklılık olduğunu vermez. Bunun için çoklu karşılaştırma yapmak gerekir.
p<0.05
Test Sonucu Anlamlı Olduğunda Farklı Grupların Belirlenmesi
Örnek: Üniversite öğrencilerinin çay içme miktarına göre hemoglobin düzeylerinin değişip değişmediği incelenmek istenmektedir. Bu amaçla 13 kişi “yemekten 1 saat önce veya sonra çay içenler”, “yemekten 30 dakika önce ya da sonra çay içenler” ve “yemekle birlikte çay içenler” olmak üzere üç gruba ayrılmışlardır ve hemoglobin düzeyleri ölçülmüştür. Buna göre hemoglobin düzeyi çayın içilme zamanına göre değişmekte midir?
H0: Kitle dağılımları benzerdir.
Ha: En az bir kitle dağılımı diğerlerinden farklıdır.
Hipotezler:
Grup
I II III
13.5 12.9 10.9
13.8 12.5 11.5
15.5 13 11.2
14 12.9 11
14.7
Sıra Sıra Sıra
9 6.5 1
10 5 4
13 8 3
11 6.5 2
12
Ri 55 26 10
68.10
)113(3
4
10
4
26
5
55
)113(13
12
)1(3)1(
12
222
1
2
k
j j
j nn
R
nnKW
KW(5,4,4;0.05)=5.657<KW=10.68
p<0.05, H0 red.
I: Yemekten 1 saat önce veya sonra çay içenlerII: Yemekten 30 dakika önce ya da sonra çay içenlerIII: Yemekle birlikte çay içenler
Gruplar İstatistiksel Karar
1-2 4.5 2.115 p<0.05
1-3 8.5 2.115 p<0.05
2-3 4 2.229 p<0.05
ji RR
ji nnkn
KWnnnt
111
12
)1(
Çoklu Karşılaştırma Tablosu
Ki-kare testi iki ya da daha fazla gruplarda oran ya da frekansları karşılaştırmak için de kullanılır. Çok gözlü ki-kare düzenleri çoğu zaman satır ve sütun sayıları yardımıyla adlandırılır.
Eğer incelenen herhangi bir nitelik değişken bakımından 2’den çok grup arasında fark olup olmadığı araştırılıyor ise bağımsız değişkenin(grupların) satırlarda yer alması,gerektiğinde yapılacak bazı ileri hesaplamalar içim daha uygun olacaktır.
rxc Ki-KareTesti
İkinci
Ölçüt
Birinci Ölçüt
1 2 c Toplam
1 G11 G12 G1c G1.
2 G21 G22 G2c G2.
r Gr1 Gr2 Grc Gr.
Toplam G.1 G.2 G.c N
...
...
...
... ... ... ......
...
... ...
r
1i
c
1j ij
2ijij2
B
)B(Gχ
N
GGB .ji.
ij
Çok gözlü ki-kare düzenlerinde beklenen frekansı 5’ten küçük göz sayısının toplam göz sayısı içinde payının %20’yi aşmaması istenir.
sd = (r-1)(c-1)
Örnek:
Eczacılığı <75, 75-84 ve 85+ not ortalaması ile bitiren öğrencilerin meslekteki başarı durumları inceleniyor. Sonuçlar;
Meslekteki Başarı
Bitirme Puanı
Başarılı Yeterli Başarısız Toplam
85+ 50 30 25 105
75-84 35 80 25 140
<75 25 90 50 165
Toplam 110 200 100 410
Bitirme puanı ile meslekteki başarı arasında bir ilişki var mıdır?
Hiçbir hücrenin beklenen değeri 5’ten küçük değildir.
Meslekteki Başarı
Bitirme Puanı
Başarılı Yeterli Başarısız Toplam
85+ 50 (28.2) 30 (51.2) 25 (25.6) 105
75-84 35 (37.6) 80 (68.3) 25 (34.1) 140
<75 25 (44.3) 90 (80.5) 50 (40.2) 165
Toplam 110 200 100 410
2hesap =42.22 > 2
(4,0.05)=9.488, H0 red , p<0.05
Bitirme puanı ile meslekteki başarı arasında bir ilişki vardır.
H0: Bitirme puanı ve meslekteki başarı bağımsızdır.
Ha: Bitirme puanı ve meslekteki başarı bağımsız değildir.
22.42 2.40
)2.4050(
2.51
)2.5130(
2.28
)2.2850(
B
)B(Gχ
222
r
1i
c
1j ij
2ijij2
Farklılığın hangi gruplardan kaynakladığını bulmak için her bir grup için ayrı ayrı ki-kare değerleri hesaplanır.
Meslekteki Başarı
Bitirme Puanı
Başarılı Yeterli Başarısız Toplam
85+ 50 (28.2) 30 (51.2) 25 (25.6) 105
75-84 35 (37.6) 80 (68.3) 25 (34.1) 140
<75 25 (44.3) 90 (80.5) 50 (40.2) 165
Toplam 110 200 100 410
2=4.63
2=25.66
2=11.93
2=42.22
Farklılığın hangi gruplar arasında olduğunu bulmak için ki-kare değeri büyük olan grup(85+) dışarıda bırakılır. Geriye kalan gruplar arasında fark olup olmadığı yeniden ki-kareanalizi yapılarak araştırılır. Buna göre ki-kare değeri 8.60 olarak bulunur. (2-1)x(3-1)=2 Serbestlik dereceli ki-kare tablo istatistiği 5.99 olarak elde edilir ve 2
hesap =8.60> 2tablo=5.99
olduğu için Ho hipotezi red edilir. Yani 75-84 ve <75 puan grupları ile meslekteki başarıarasında anlamlı bir ilişki vardır. Genel bir yorum olarak, tüm bitirme puanları ile meslektekibaşarı arasında anlamlı bir ilişki vardır.
BAĞIMLI GRUPLARA İLİŞKİN
HİPOTEZ TESTLERİ
İKİ ÖRNEKLEM TESTLERİ
• TEKRARLI ÖLÇÜMLERDE TEK YÖNLÜ VARYANS ANALİZİ
BAĞIMLI K ÖRNEKLEM TESTLERİ
PARAMETRİK TESTLER
PARAMETRİK OLMAYAN TESTLER
• FRIEDMAN TESTİ
• COCHRAN Q TESTİ
İki eş arasındaki farkın önemlilik testinin ikiden çok grup için genelleştirilmişidir
Örnek 1.Kandaki şeker miktarını düşürmek için hazırlanan bir diyet programının etkinliğini ölçmek için şeker hastalarının diyetten önce, diyetin 1. ayında ve diyetin 3. ayında kandaki şeker miktarlarının farklı olup olmadığının araştırılmasında kullanılabilir.
TEKRARLI ÖLÇÜMLERDE
TEK YÖNLÜ VARYANS ANALİZİ
Örnek 2.Üç ayrı firmanın ürettiği tansiyon ölçme araçlarının aynı kişilerin tansiyonunu aynı değerde ölçüp ölçmediğinin test edilmesinde kullanılabilir.
Ortalama
n
xikxijxi1i
x1kx1jx111
kj1 OrtalamaZaman
Gözlem
1.x jx. kx. ..x1nx nkx
.1x
.ix
.nx
...
...
...
...
...
...
...
...
...
...
......
... ... ... ............
... ...
... ...
...
...
ÖRNEK:
BKİ>35 olan 30 bireye mide bandı takılmıştır. Bant takılmadan önce, takıldıktan 3 ay sonra ve takıldıktan 6 ay sonra beden kitle indeksleri ölçülmüştür. Beden kitle indeksleri zamana göre değişmekte midir?
Birey
Bant Öncesi
Banttan 3 ay sonra
Banttan 6 ay sonra
1 40,45 30,04 25,232 42,96 27,34 30,463 42,44 31,83 25,904 49,10 41,86 38,455 48,50 44,60 36,806 50,90 42,73 40,787 53,21 43,17 42,058 46,90 40,29 37,659 51,37 46,06 41,81. . . .
30 43,43 39,09 36,75
Beden Kitle İndeksi
Zaman Ortalama S. Sapma n
Bant
Öncesi47,71 5,08 30
Banttan 3 ay sonra
40,26 5,83 30
Banttan 6 ay sonra
36,52 6,16 25
Tanımlayıcı İstatistikler
BKİ>35 olan bireylerin zamana göre Beden Kitle İndekslerine ilişkin
ortalama ve standart sapma grafiği
H0: Mide bandı takılmadan önceki ve takıldıktan
sonraki zamanlarda BKİ değerleri bakımından fark yoktur.
HİPOTEZLERİN BELİRLENMESİ
H1: Mide bandı takılmadan önceki ve takıldıktan
sonraki zamanlarda BKİ değerleri bakımından fark vardır.
Karşılaştırma için F dağılımından yararlanılır. Hesapla bulunan F istatistiğinin elde edilmesinde kullanılan bilgiler sıklıkla varyans analizi tablosunda özetlenir.
BKİ için Varyans Analizi Tablosu
Değişim Kaynağı
KT Sd KO F P
Genel 4544,86 89
ZamanlarArası
1847,03 2 923,52 165,80 0.000
Denekler
Arası2374,85 29 81,89
Hata 322,98 58 5,57
BKİ’nin zamanlara göre değişimi önemlidir (p<0.05). Hangi zamanlar arasında fark olduğu ikişerli karşılaştırmalarla incelenmelidir.
Tukey HSD testi ile ikişerli karşılaştırmalara bakılacak olursa;
n
)GIKO(2qxx )GISD,k,(ji P<0.05
GISD: Grup içi serbestlik derecesi
40.3q )58,3,05.0(
q değerleri tablosu
Gruplar İstatistiksel Karar
1-2 7.44 2.07 p<0.05
1-3 10.85 2.07 p<0.05
2-3 3.41 2.07 p<0.05
ji xx
Çoklu Karşılaştırma Tablosu
n
)GIKO(2q )GISD,k,(
FRIEDMAN TESTİ
Tekrarlı ölçümlerde varyans analizinin varsayımları yerine gelmediğinde (özellikle denek sayısı az ve/ya da veriler sayımla belirtildiğinde ya da sıralama ölçeğinde olduğu durumlarda) kullanılır.
)1(3)1(
12
1
22
knRknk
k
jjR
n: Satır sayısı
k: Grup (sütun sayısı)
Rj: Her bir gruba (sütuna) ilişkin sıra numaraları toplamı
Friedman testi için test istatistiği:2R
İstatistiksel karar için ki-kare ya da F dağılımından yararlanılabilir (F dağılımından yararlanılarak yapılan çözüme burada değinilmeyecektir).
Gruplar arasında fark olması durumunda ikişerli karşılaştırmalar yapılır.
2R İstatistiği seçilen yanılma düzeyinde k-1 serbestlik
dereceli ki-kare dağılımı gösterir.
Örnek :Tekrarlı ölçümlerde tek yönlü varyans analizi için verilen örneğin 11 birey üzerinde yapıldığını düşünelim. Bu durumda Friedman testi için hazırlık tablosu aşağıdaki gibi olacaktır.
Birey
Bant Öncesi
Banttan 3 ay
sonra
Banttan 6 ay
sonraR(1)
Sıra no
R(2) R(3)
1 40,45 30,04 25,23 3 2 1
2 42,96 27,34 30,46 3 1 2
3 42,44 31,83 25,90 3 2 1
4 49,10 41,86 38,45 3 2 1
5 48,50 44,60 36,80 3 2 1
6 50,90 42,73 40,78 3 2 1
7 53,21 43,17 42,05 3 2 1
8 46,90 40,29 37,65 3 2 1
9 51,37 46,06 41,81 3 2 1
10 52,44 39,59 25,37 3 2 1
11 45,67 39,60 35,84 3 2 1
Örneğimiz için hipotez:
Ho: BKİ zamana göre değişmemiştir.
2R
)13(113)12()21()33()13(311
12 2222
R
=20.182R
Ho red
Friedman test istatistiği:
2Tablo =5.99
22TabloR
COCHRAN Q TESTİ
Cochran Q testi, McNemar bağımlı örneklerde ki-kare testinin ikiden çok grup için genelleştirilmişidir.
Cochran Q testinde incelenen değişken, evet-hayır, yeterli-yetersiz… gibi iki durumludur.
n
ii
n
ii
k
jj
k
jj
RRk
CCkk
Q
1
2
1
2
11
2)1(
Cochran Q istatistiği:
Cj: sütun toplamları
Ri: satır toplamları
n: gözlem sayısı
k: grup sayısı
Hesapla bulunan Q istatistiği seçilen alfa yanılma düzeyinde k-1 serbestlik dereceli ki-kare tablo istatistiği ile karşılaştırılır.
QHESAP > QTABLO ise Ho Hipotezi reddedilir.
İstatistiksel karar:
Örnek:
Beslenme ve diyetetik öğrencilerinin geleceğe yönelik kaygılarının yıllar içinde değişip değişmediğini incelemek amacıyla düzenlenen ve aynı öğrenciler üzerinde son 3 öğretim yılı süresince devam eden bir çalışmada öğrencilere geleceğe yönelik kaygılarının var olup olmadığı soruluyor ve yanıtlar; geleceğe yönelik kaygı var için 1, yok için 0 şeklinde kodlanıyor.
Öğrencilerin geleceğe yönelik kaygılarının yıllar içinde değişip değişmediği Cochran Q testi ile araştırılabilir.
Öğrenci
Dönem
II
Dönem
III
Dönem
IVRi
1 1 0 1 2
2 1 0 0 1
3 1 1 1 3
4 0 0 0 0
5 1 0 1 2
6 1 0 1 2
7 1 1 1 3
8 1 0 0 1
9 1 1 1 3
10 1 0 0 1
Cj 9 3 6 18
912
108
)112()112(3
18639(3)13(
)1(
222
2222
1
2
1
2
11
2
n
ii
n
ii
k
jj
k
jj
RRk
CCkk
Q
QHESAP= 9 > 2(2,0.05) =5.99 p<0.05
H0 reddedilir.
Fark önemli olduğu için ikişerli karşılaştırmalar McNemar testi ile yapılabilir.
Kİ-KARE TABLOSU