Önemlilik Testleriesaglikonline.com/E-Saglik Online/Tibbi Istatistik/8... · 2017-05-04 ·...
Transcript of Önemlilik Testleriesaglikonline.com/E-Saglik Online/Tibbi Istatistik/8... · 2017-05-04 ·...
Önemlilik Testleri
Prof.Dr.İhsan HALİFEOĞLU
ÖNEMLİLİK TESTLERİ
● Önemlilik testleri elde edilen değerlerin ya da varılan
sonuçların istatistiksel olarak önem taşıyıp
taşımadığını ya da anlamlı olup olmadığını test etmek
için başvurulan yöntemlerdir.
● Tek değişkenli (tek gruplu) verilerde önemlilik testleri,
örneklemden elde edilen istatistiksel değerin gerçek
bir değer mi yoksa rastlantıya bağlı olarak elde
edilmiş bir değer mi olduğunun test edilmesinde
kullanılır.
2
● İki ya da daha çok sayıda grup incelendiğinde
önemlilik testleri gruplar arasında fark olup
olmadığının, değişkenler arasında bağ olup
olmadığının ve grupların homojen olup olmadığının
test edilmesinde kullanılır.
● Önemlilik testlerinden elde edilen sonuçlara göre
bazı kararlara varıldığı için önemlilik testlerinin doğru
ve uygun olarak seçilmesi, bilinçli olarak kullanılması
ve yorumlanması gerekir.
3
ÖNEMLİLİK TESTLERİ HAKKINDA GENEL BİLGİLER
● Verinin Ölçüm Biçimi: Uygun testin seçiminde verinin
ölçüm biçimi önemli bir kriterdir. Veriler ölçüm biçimine
göre üçe ayrılır:
1. Ölçümle belirtilen veriler: Boy uzunluğu, vücut ağırlığı,
yaş, zaman, kandaki hemoglobin miktarı, kandaki
kolesterol miktarı, hava sıcaklığı vb. Bu tür veriler kantitatif
(nicel) özelliğe sahiptir. Sürekli dağılım gösterirler ve
ölçümle belirtilirler.
2. Sayısal olarak belirtilen kesikli veriler: Ölen sayısı,
yaşayan sayısı, iyileşen sayısı, hastalanan sayısı, gebe
kalma sayısı gibi sayı ile belirtilen fakat kesikli (sürekli
olmayan) değişkenlerdir. 4
3.Nitelik (isimsel) olarak belirtilen veriler: Bazı veriler
ölçülemez yalnız sayımla belirtilir. Örneğin; saç rengi,
göz rengi, cinsiyet, meslek, oturulan bölge vb. Bu tür
veriler kalitatif (nitel) özelliğe sahiptir. Kesikli dağılım
gösterirler. Bazı durumlarda bu nitelikler belirli
kriterlere göre derecelendirilebilir. Örneğin; bir grup
hastayı iyileşme gösterdi, az iyileşme gösterdi,
iyileşme göstermedi şeklinde sıralamak gibi.
5
● Ölçümle belirtilen verilere parametrik test
varsayımları yerine getirilebiliyorsa parametrik testler
uygulanmalıdır.
● Sayımla belirtilen verilere parametrik olmayan testler
uygulanır.
● Ayrıca veri ölçümle belirtildiği halde parametrik test
varsayımları yerine getirilemiyorsa parametrik
olmayan testlerden birisi uygulanmalıdır.
6
HİPOTEZLER
● Önemlilik testleri bir hipotezi test etmek için yapılır.
Bu nedenle bazen önemlilik testi yerine hipotez testi
de denmektedir. Hipotez bir önyargıdır. Örneğin, iki
ilkokul öğrencilerinin vücut ağırlıklarının farksız
olduğunu ileri sürmek bir hipotezdir.
● Hipotezler, olaylar arasında ilişki kuran ve bu
olayların nedenlerini araştırmak amacıyla planlanan
önermelerdir. Bu önermelerin doğruluğu bilimsel
yöntemlerle denetlenebilir olmalıdır.7
● Bir testte hem Ho hipotezi, hem H1 hipotezi (alternatif
hipotez) kullanılmalıdır. Araştırmada Ho’ın red edilmesi,
H1’in kabul edilmesi anlamına gelir.
a)H0 hipotezi; farksızlık hipotezi, sıfır hipotezi olarak
adlandırılır. Bir testte öne sürülen ve asıl test edilmek
istenen hipotezdir. Bu hipotez, karşılaştırmak
istediğimiz değerler arasında farkın sıfır (0) olduğunu
ileri sürer.
Örneğin; bir ana yığının ortalamasıyla () bir örnek
ortalaması karşılaştırdığımızı düşünelim.
Bu durumda,
şeklinde ifade edilir.
8
0-x :Ho da yaμ x : Ho
b) H1 ise alternatif hipotez olarak adlandırılır ve H0
hipotezine karşı kurulan hipotezdir.
olarak ifade edilir.
● Gruplar arasında fark arandığında H0 hipotezi olumsuz
olarak belirlenir. Örneğin; iki ortalama arasında fark
yoktur, iki grup arasında fark yoktur, iki değişken
arasında bağ yoktur gibi. H1 hipotezi ise H0 hipotezine
ters yönde kurulur. Örneğin; iki ortalama arasında fark
vardır, iki grup arasında fark vardır, iki değişken arasında
bağ vardır gibi.
● Test sonucunda H0 kabul edilirse H1 red edilir, H0
reddedilirse H1 kabul edilir.9
0-x :H1 da yaμ x : H1
● Örneğin aşağıdaki hipotez iki yönlü bir hipotezdir.
Çünkü, H0 reddedilirse ’nün 100’e eşit olmadığını yani
100’den büyük ya da küçük olabileceğini
öngörmekteyiz.
● Hipotezi aşağıdaki gibi belirtirsek tek yönlü olur. Çünkü,
H0 reddedildiğinde ’nün sadece 100’den küçük
olabileceğini öngörmekteyiz.
10
1
oH :μ=100
H :μ 100¹
o
1
H :μ=100
H :μ<100
GÜVEN DÜZEYİNİN SEÇİMİ
● İstatistikte bulunacak sonuçların geçerli olabilmesi
için (yani Ho hipotezinin rededilmesi için hesaplanan
olasılık) güven düzeyi göstergesi olan (alfa)’nın %5
veya daha az olması genellikle kabul edilir. Bu
değere yanılma düzeyi adı verilir ve ile gösterilir.
11
● Hesaplanan olasılık, olasılık (probability) ilk harfi
olan p ile gösterilir ve istatistik testinin bitiminde
hesaplanır. Bu değer sıfır varsayımının doğru
olması durumunda, gözlenen farkın tesadüfi
değerlere bağlı olma ihtimalini verir. p< ise H0
reddedilir.
● Yani p değeri 0.05 olduğunda, H1 hipotezinin
tesadüfen doğru olma şansı %5’tir.
12
ÖRNEKLEM BÜYÜKLÜĞÜ (GRUPLARDAKİ DENEK SAYISI)
● Önemlilik testlerinde örneklem büyüklüğü önemli bir
etmendir. Çünkü:
1. Gruplardaki denek sayısı arttıkça kullanılan testin gücü
ve güvenilirliği artar.
2. Kullanılacak testin uygun olarak seçiminde önemli bir
kriterdir. Gruplardaki denek sayısı az olduğunda
(genellikle 30’dan az olduğunda) parametrik olmayan
testler kullanılmalıdır. Çünkü denek sayısı azaldıkça
parametrik testlerde varsayımların bozulma olasılığı
artar.13
● İki ya da daha çok grup karşılaştırılıyorsa deney
düzenlenirken gruplardaki denek sayılarının eşit olması
için gerekli önlem alınmalıdır. Gruplardaki denek
sayılarının eşit olamadığı durumlarda birbirine yakın
olmalı, arada çok fazla fark bulunmamalıdır.
● İki ya da daha çok grup karşılaştırılacaksa incelenen
grupların birbirinden bağımsız olması ya da bağımlı
olması uygun test seçimi yönünden çok önemlidir.
14
Bağımsız grup
● İncelenen grupların bağımsız olması demek grupların
ayrı bireylerden oluşması, başka bir deyişle bir grupta
bulunan bir deneğin diğer grupta bulunmaması
demektir. İki ayrı ilkokulda, aynı ilkokulda ayrı sınıflarda
ya da aynı sınıfta okuyup herhangi bir özellik yönünden
ayrı gruplarda bulunan (cinsiyet, oturulan bölge,
ailelerinin sosyo-ekonomik durumu vb.) öğrenciler
bağımsız gruplar oluşturur.
● Yine aynı hastalığa yakalanmış bir grup hastayı değişik
iki yöntemle tedavi etmek için iki gruba ayırmak
bağımsız gruplar oluşturmaktır. 15
Bağımlı grup
● Bir denek üzerinde birden çok gözlem yapıldığında ya da
gözlem sayısı denek sayısını aştığında gruplar bağımlı
olur.
Örneğin, iki doktorun tanı tutarlılığını ölçmek için aynı
hastanın her iki doktor tarafından muayene edilmesi
durumunda gruplar birbirine bağımlı olur. Aynı denekler
üzerinde aynı konuda ayrı zamanlarda yapılan
çalışmalarda da gruplar bağımlı olur. Örneğin bir sağlık
ocağı bölgesinde yaşayan 0-4 yaş grubu çocuklarda
malnütrisyon (beslenme bozukluğu) araştırması yapılsa, bir
süre sonra aynı çocukların tümü ya da bir kısmı yine
malnütrisyon yönünden incelense bu iki grup bağımlı olur.16
TEST ÇEŞİTLERİ ve ÖZELLİKLERİ
● Doğru bir sonuç elde edebilmek için testin doğru
seçilmesi çok önemlidir. Önemlilik testleri iki ana gruba
ayrılır:
1. Parametrik önemlilik testleri
2. Parametrik olmayan önemlilik testleri
● Bir testin parametrik ya da parametrik olmamasını
sağlayan nitelik testte kullanılan ölçülerdir. Bir testte;
ortalama, varyans, oran gibi ölçüler kullanılıyorsa bu
test parametrik bir testtir. Ölçü yerine sıralama, sayma,
işaretleme gibi işlemler yapılıyorsa bu test parametrik
olmayan bir testtir17
● Parametrik testlerin uygulanabilmesi için bazı
varsayımların yerine getirilmesi gerekmektedir. Bu
varsayımlar şunlardır:
1. Örneklemin çekildiği evrenle ilgili:
a) Normal dağılıma sahip olacak
b) Varyanslar homojen olacak
2. Örneklemle ilgili:
a) Denekler evrenden rastgele seçilecek
b) Denekler birbirinden bağımsız olarak seçilecek (Bir
deneğin seçimi diğer deneklerin seçimini
etkilemeyecek)18
● Niteliksel veriler için parametrik olmayan testler
kullanılır. Bunun yanında ölçümle belirtildiği halde
veri parametrik test varsayımlarını yerine
getiremiyorsa, denek sayısı azsa ya da değerler
yerine sıraları verilmişse yine parametrik olmayan
testler kullanılır.
● Veri ölçümle belirtilmişse ve parametrik test
varsayımlarını yerine getirebiliyorsa parametrik
testleri uygulamak daha doğru olur. Çünkü
parametrik testler parametrik olmayan testlerden
daha güçlüdür. 19
20
Parametrik Test Parametrik Olmayan Test
Evren ortalaması önemlilik testi İşaret testi
İki ortalama arasındaki farkın önemlilik testi
Mann-Whitney U testi
İki eş arasındaki farkın önemlilik testi Wilcoxon eşleştirilmiş örnek testi
İki yüzde arasındaki farkın önemlilik testi
4 gözlü ki-kare testi
Tek yönlü varyans analizi Kuruskal-Walis varyans analizi
Her bir parametrik teste karşı birden çok parametrik olmayan test vardır.
● Parametrik testler uygulanmadan önce normal dağılıma
uygunluk ve varyansların homojenlik testi yapılmalıdır.
Aşağıda açıklanan pratik yol ile elde edilen dağılımın
normal dağılıma uyup uymadığı yaklaşık olarak
incelenebilir.
Normal dağılımda deneklerin;
girmesi gerekir. Bu nedenle dağılımın ortalama ve
standart sapması hesaplanarak deneklerin yaklaşık olarak
bu sınırlar içinde kalıp kalmadığı kontrol edilebilir. 21
22
Bunu bir Örnekle açıklayalım:●Aşağıdaki tabloda verilen 75 çocuğun boylarının aritmetik
ortalaması 103.72 ve standart sapması (S) 6.35’tir. Buna
göre bu sınırlar içine giren denek sayı ve yüzdelerini bulalım :
90 91 92 93 93 94 94 95 96 96 96 97
97 98 98 98 99 99 99 99 100 100 100 100
101 101 101 101 102 102 102 102 103 103 103 103
103 104 104 104 104 104 105 105 105 105 106 106
106 106 107 107 107 108 108 108 109 109 109 110
110 110 111 111 112 112 113 113 113 113 114 114
114 114 115
İSTATİSTİKSEL KARAR
Test sonucu Ho hipotezi ya reddedilir ya kabul edilir. Bu
karara hesaplanan t değeri ile seçilen yanılma
düzeyindeki tablo t değeri değeri karşılaştırılarak varılır.
Test sonucunda Ho hipotezinin kabul ya da
reddedilmesinde kriter şudur:
1. Hesaplanan t değeri tablo değerinden büyükse; Ho
reddedilir, H1’in desteklendiğine karar verilir.
2. Hesaplanan t değeri tablo değerinden küçükse; Ho kabul
edilir. 23
24
Serbestlik derecesi
İstatistikte Serbestlik Derecesi terimiyle sık karşılaşırız.
Serbestlik Derecesi genelde S.D. ile gösterilir. Basit bir
örnekle: 3 kişilik bir örneklemde boy ölçümü yaptığımızı
varsayalım. Örneklemimiz n=3 olacaktır. Bireylerimizin
boylarının toplamı 500 cm olsun. İlk iki bireyimiz geniş bir
yelpazede herhangi bir boy değerine sahip olabilir.
Ancak, 1. ve ikinci bireylerimizin boylarını belirledikten
sonra (burada 165 ve 175 olsun) 3 bireyimizin boyu artık
serbest değildir. Bu bireyimiz 160 cm boyunda olmak
zorundadır. Bu nedenle SD=n–1=3–1=2 olacaktır.
İKİ ORTALAMA ARASINDAKİ FARKIN ÖNEMLİLİK TESTİ
Parametrik (ölçüme dayanan) test varsayımları yerine
getirildiğinde, ölçümle belirtilen sürekli bir değişken
yönünden bağımsız iki grup arasında fark olup
olmadığını test etmek için kullanılan bir önemlilik
testidir. Bu testte;
a) İki grup karşılaştırılmaktadır.
b) Karşılaştırılan bu iki grup birbirinden bağımsızdır.
c) Bu iki grup arasında farklı olup olmadığı test edilen
değişken, ölçümle belirtilen sürekli bir karakterdir.
25
Örnek 1.
Bir eczacı yeni üretilen bir ilacın bir hastalığın
iyileştirilmesinde diğer bir ilaçtan daha etkili olduğu
hipotezini öne sürüyor. Bu hipotezin doğru olup
olmadığını kontrol etmek için söz konusu hastalığı
taşıyan hastalardan tamamen tesadüfi belirli bir sayıda
hasta seçer. Daha sonra yine tamamen tesadüfi olarak
bu hastaları iki gruba ayırır. Gruplardan birini oluşturan
hastaları yeni ilaç (A) ile diğer grubu da diğer ilaç (B) ile
tedavi eder. Belirli bir süre sonunda hastalığın iyileşme
göstergesi olarak kabul edilen bir kan özelliğine ait
analizleri yaparak verilerini toplar. 26
Gözlediği verilerine dayanarak eczacı şu hipotezi kurar
ve hipotezleri test eder.
Ho: Hastalığın iyileşmesine etki bakımından yeni ilaç ile
eski ilaç arasında fark yoktur, gözlenen fark tesadüften
ileri gelmektedir, yani kontrol hipotezini
H1: Hastalığın iyileşmesine etki bakımından yeni ilaç,
eski ilaç ilaçtan daha etkilidir.Yani karşı hipotezi kontrol
edecektir.
27
t TESTİ: iki farklı ortalamanın karşılaştırılmasında kullanılan bir testtir. Böylece iki ortalamanın arasında bir fark olup olmadığı test edilir. İkiden fazla ortalama söz konusu ise bu durumda çoklu karşılaştırma testlerinden bir kullanılır. T testi uygulaması kolay olduğundan çok kullanılan bir testtir. “t” değerini bulmak için aşağıdaki formül kullanılır.
28
gruplar : B A ve
hataStandart S
ortalamaAritmetik x
Formülde;
)()(
22
BA SESE
xxt
BA Bu formülün
uygulanabilmesi için her
gruba ait aritmetik
ortalama ve standart
hataların hesaplanması
gerekir.
Problem: Modern beslenme yönteminin çocuğun gelişimi
üzerine etkisini araştırmak için aynı yaşta, aynı kiloda 60
çocuk iki gruba ayrılmış, birinci grup modern beslenme
yöntemine , ikinci grup annelerin kendi bilgilerine göre
beslenmiştir. Bir süre sonra çocuklar tartılmıştır. İki
gruptan elde edilen bulgular aşağıda verilmiştir. Kilo
kazanma yönünden bu iki yöntem arasında fark varmıdır?
29
Modern Yönteme Göre Beslenme
Anne Bilgisine Göre Beslenme
Aritmetik ortalama 8.860 kg 8.300 kg
Standart sapma (S) 0.560 kg 0.567 kg
Örnek sayısı (n) 30 30
30
58230302nn(S.D) derecesi Serbestlik
3,850,1453
0,56
0,0211
0,56
0,01070,0104
0,56
0,10350,1022
8,308,86
50,1035,477
0,567
30
0,567 ve0,1022
5,477
0,560
30
0,560
Örnek
sapmaStandart
0 xx :H
0 x - x : H
21
22
21
2 1 1
210
t
SESE
Yanılma olasılığı =0.05 olarak seçilmiştir. 58 derecesindeki t değeri 2.00’dır.Hesapla bulunan t değeri (3.85) tablo değerinden büyük olduğundan Ho hipotezi reddedilecektir. Karar: Kilo alma yönünden modern beslenme yöntemi ile anne bilgisine göre beslenme arasındaki fark istatiksel olarak anlamlı bulunmuştur (t=3.85, p<0.05). Modern yöntemle beslenen çocuklar daha fazla kilo almaktadırlar.
31
Soru: Aynı hastalığa yakalanan bir grup hasta A ilacıyla,
bir grup hasta B ilacıyla tedavi edilmiş, iyileşme saati ölçu
olarak kullanılmış ve elde edilen bulgular aşağıda
verilmiştir. İlaçların tedavi etkinlikleri farklı mıdır?
32
A İlacı B İlacı
Aritmetik ortalama 8.46 7.62
Standart sapma (S) 1.70 2.23
Örnek sayısı (n) 50 50
Soru: Zehirli bir madde farelere iki ayrı dozda enjekte
edilmiş ve ölüm süreleri saniye cinsinden kaydedilmiştir.
Elde edilen bulgular aşağıda verilmiştir. Dozlar arasında
istaistiksek bir fark varmıdır?
33
Doz (mg)
0.50 0.75
Aritmetik ortalama 8.67 7.33
Standart sapma 1.75 1.00
Örnek sayısı (n) 28 32
Soru: Alkol kullanan 65 ve kullanmayan 78 şahıs üzerinde
yapılan bir araştırmada bu şahısların kanlarında fosfor
seviyeleri ortalaması ve standart hata (SE) değerleri
aşağıdaki gibidir. İki grup arasındaki fosfor seviyelerinin
önemli derecede farklı olmadıklarını belirleyiniz.
34
Fosfor Aritmetik ortalama (SE) n
Alkol kullananlar 3.22 mg 0.058 65
Alkol kullanmayanlar 3.78 mg 0.066 78
Soru: Kronik böbrek yetmezliğine bağlı aneminin tedavisi
amacıyla eritropoetin tedavisi verilen 12 hastada tedaviden
önce ve tedaviden sonra hemoglobin (Hb) düzeylerine
bakılıyor. Hastaların Hb düzeyleri aşağıda verilmiştir. Buna
göre tedavi öncesi ve sonrası Hb değerleri arasında önemli
bir fark var mıdır? Serbestlik derecesi= n-1 alınız.
35
Tedavi öncesi Hb (g/dL)
7.5 7.6 8.6 9.3 7.8 9.8 9.3 10.3 8.4 7.0 11.9 7.5
Tedavi sonrası Hb (g/dL)
12.3 10.9 9.8 13.4 11.1 9.3 9.9 12.3 11.3 9.0 10.9 12.3