Önemlilik Testleriesaglikonline.com/E-Saglik Online/Tibbi Istatistik/8... · 2017-05-04 ·...

Önemlilik Testleri

Prof.Dr.İhsan HALİFEOĞLU

ÖNEMLİLİK TESTLERİ

● Önemlilik testleri elde edilen değerlerin ya da varılan

sonuçların istatistiksel olarak önem taşıyıp

taşımadığını ya da anlamlı olup olmadığını test etmek

için başvurulan yöntemlerdir.

● Tek değişkenli (tek gruplu) verilerde önemlilik testleri,

örneklemden elde edilen istatistiksel değerin gerçek

bir değer mi yoksa rastlantıya bağlı olarak elde

edilmiş bir değer mi olduğunun test edilmesinde

kullanılır.

2

● İki ya da daha çok sayıda grup incelendiğinde

önemlilik testleri gruplar arasında fark olup

olmadığının, değişkenler arasında bağ olup

olmadığının ve grupların homojen olup olmadığının

test edilmesinde kullanılır.

● Önemlilik testlerinden elde edilen sonuçlara göre

bazı kararlara varıldığı için önemlilik testlerinin doğru

ve uygun olarak seçilmesi, bilinçli olarak kullanılması

ve yorumlanması gerekir.

3

ÖNEMLİLİK TESTLERİ HAKKINDA GENEL BİLGİLER

● Verinin Ölçüm Biçimi: Uygun testin seçiminde verinin

ölçüm biçimi önemli bir kriterdir. Veriler ölçüm biçimine

göre üçe ayrılır:

1. Ölçümle belirtilen veriler: Boy uzunluğu, vücut ağırlığı,

yaş, zaman, kandaki hemoglobin miktarı, kandaki

kolesterol miktarı, hava sıcaklığı vb. Bu tür veriler kantitatif

(nicel) özelliğe sahiptir. Sürekli dağılım gösterirler ve

ölçümle belirtilirler.

2. Sayısal olarak belirtilen kesikli veriler: Ölen sayısı,

yaşayan sayısı, iyileşen sayısı, hastalanan sayısı, gebe

kalma sayısı gibi sayı ile belirtilen fakat kesikli (sürekli

olmayan) değişkenlerdir. 4

3.Nitelik (isimsel) olarak belirtilen veriler: Bazı veriler

ölçülemez yalnız sayımla belirtilir. Örneğin; saç rengi,

göz rengi, cinsiyet, meslek, oturulan bölge vb. Bu tür

veriler kalitatif (nitel) özelliğe sahiptir. Kesikli dağılım

gösterirler. Bazı durumlarda bu nitelikler belirli

kriterlere göre derecelendirilebilir. Örneğin; bir grup

hastayı iyileşme gösterdi, az iyileşme gösterdi,

iyileşme göstermedi şeklinde sıralamak gibi.

5

● Ölçümle belirtilen verilere parametrik test

varsayımları yerine getirilebiliyorsa parametrik testler

uygulanmalıdır.

● Sayımla belirtilen verilere parametrik olmayan testler

uygulanır.

● Ayrıca veri ölçümle belirtildiği halde parametrik test

varsayımları yerine getirilemiyorsa parametrik

olmayan testlerden birisi uygulanmalıdır.

6

HİPOTEZLER

● Önemlilik testleri bir hipotezi test etmek için yapılır.

Bu nedenle bazen önemlilik testi yerine hipotez testi

de denmektedir. Hipotez bir önyargıdır. Örneğin, iki

ilkokul öğrencilerinin vücut ağırlıklarının farksız

olduğunu ileri sürmek bir hipotezdir.

● Hipotezler, olaylar arasında ilişki kuran ve bu

olayların nedenlerini araştırmak amacıyla planlanan

önermelerdir. Bu önermelerin doğruluğu bilimsel

yöntemlerle denetlenebilir olmalıdır.7

● Bir testte hem Ho hipotezi, hem H1 hipotezi (alternatif

hipotez) kullanılmalıdır. Araştırmada Ho’ın red edilmesi,

H1’in kabul edilmesi anlamına gelir.

a)H0 hipotezi; farksızlık hipotezi, sıfır hipotezi olarak

adlandırılır. Bir testte öne sürülen ve asıl test edilmek

istenen hipotezdir. Bu hipotez, karşılaştırmak

istediğimiz değerler arasında farkın sıfır (0) olduğunu

ileri sürer.

Örneğin; bir ana yığının ortalamasıyla () bir örnek

ortalaması karşılaştırdığımızı düşünelim.

Bu durumda,

şeklinde ifade edilir.

8

0-x :Ho da yaμ x : Ho

b) H1 ise alternatif hipotez olarak adlandırılır ve H0

hipotezine karşı kurulan hipotezdir.

olarak ifade edilir.

● Gruplar arasında fark arandığında H0 hipotezi olumsuz

olarak belirlenir. Örneğin; iki ortalama arasında fark

yoktur, iki grup arasında fark yoktur, iki değişken

arasında bağ yoktur gibi. H1 hipotezi ise H0 hipotezine

ters yönde kurulur. Örneğin; iki ortalama arasında fark

vardır, iki grup arasında fark vardır, iki değişken arasında

bağ vardır gibi.

● Test sonucunda H0 kabul edilirse H1 red edilir, H0

reddedilirse H1 kabul edilir.9

0-x :H1 da yaμ x : H1

● Örneğin aşağıdaki hipotez iki yönlü bir hipotezdir.

Çünkü, H0 reddedilirse ’nün 100’e eşit olmadığını yani

100’den büyük ya da küçük olabileceğini

öngörmekteyiz.

● Hipotezi aşağıdaki gibi belirtirsek tek yönlü olur. Çünkü,

H0 reddedildiğinde ’nün sadece 100’den küçük

olabileceğini öngörmekteyiz.

10

1

oH :μ=100

H :μ 100¹

o

1

H :μ=100

H :μ<100

GÜVEN DÜZEYİNİN SEÇİMİ

● İstatistikte bulunacak sonuçların geçerli olabilmesi

için (yani Ho hipotezinin rededilmesi için hesaplanan

olasılık) güven düzeyi göstergesi olan (alfa)’nın %5

veya daha az olması genellikle kabul edilir. Bu

değere yanılma düzeyi adı verilir ve ile gösterilir.

11

● Hesaplanan olasılık, olasılık (probability) ilk harfi

olan p ile gösterilir ve istatistik testinin bitiminde

hesaplanır. Bu değer sıfır varsayımının doğru

olması durumunda, gözlenen farkın tesadüfi

değerlere bağlı olma ihtimalini verir. p< ise H0

reddedilir.

● Yani p değeri 0.05 olduğunda, H1 hipotezinin

tesadüfen doğru olma şansı %5’tir.

12

ÖRNEKLEM BÜYÜKLÜĞÜ (GRUPLARDAKİ DENEK SAYISI)

● Önemlilik testlerinde örneklem büyüklüğü önemli bir

etmendir. Çünkü:

1. Gruplardaki denek sayısı arttıkça kullanılan testin gücü

ve güvenilirliği artar.

2. Kullanılacak testin uygun olarak seçiminde önemli bir

kriterdir. Gruplardaki denek sayısı az olduğunda

(genellikle 30’dan az olduğunda) parametrik olmayan

testler kullanılmalıdır. Çünkü denek sayısı azaldıkça

parametrik testlerde varsayımların bozulma olasılığı

artar.13

● İki ya da daha çok grup karşılaştırılıyorsa deney

düzenlenirken gruplardaki denek sayılarının eşit olması

için gerekli önlem alınmalıdır. Gruplardaki denek

sayılarının eşit olamadığı durumlarda birbirine yakın

olmalı, arada çok fazla fark bulunmamalıdır.

● İki ya da daha çok grup karşılaştırılacaksa incelenen

grupların birbirinden bağımsız olması ya da bağımlı

olması uygun test seçimi yönünden çok önemlidir.

14

Bağımsız grup

● İncelenen grupların bağımsız olması demek grupların

ayrı bireylerden oluşması, başka bir deyişle bir grupta

bulunan bir deneğin diğer grupta bulunmaması

demektir. İki ayrı ilkokulda, aynı ilkokulda ayrı sınıflarda

ya da aynı sınıfta okuyup herhangi bir özellik yönünden

ayrı gruplarda bulunan (cinsiyet, oturulan bölge,

ailelerinin sosyo-ekonomik durumu vb.) öğrenciler

bağımsız gruplar oluşturur.

● Yine aynı hastalığa yakalanmış bir grup hastayı değişik

iki yöntemle tedavi etmek için iki gruba ayırmak

bağımsız gruplar oluşturmaktır. 15

Bağımlı grup

● Bir denek üzerinde birden çok gözlem yapıldığında ya da

gözlem sayısı denek sayısını aştığında gruplar bağımlı

olur.

Örneğin, iki doktorun tanı tutarlılığını ölçmek için aynı

hastanın her iki doktor tarafından muayene edilmesi

durumunda gruplar birbirine bağımlı olur. Aynı denekler

üzerinde aynı konuda ayrı zamanlarda yapılan

çalışmalarda da gruplar bağımlı olur. Örneğin bir sağlık

ocağı bölgesinde yaşayan 0-4 yaş grubu çocuklarda

malnütrisyon (beslenme bozukluğu) araştırması yapılsa, bir

süre sonra aynı çocukların tümü ya da bir kısmı yine

malnütrisyon yönünden incelense bu iki grup bağımlı olur.16

TEST ÇEŞİTLERİ ve ÖZELLİKLERİ

● Doğru bir sonuç elde edebilmek için testin doğru

seçilmesi çok önemlidir. Önemlilik testleri iki ana gruba

ayrılır:

1. Parametrik önemlilik testleri

2. Parametrik olmayan önemlilik testleri

● Bir testin parametrik ya da parametrik olmamasını

sağlayan nitelik testte kullanılan ölçülerdir. Bir testte;

ortalama, varyans, oran gibi ölçüler kullanılıyorsa bu

test parametrik bir testtir. Ölçü yerine sıralama, sayma,

işaretleme gibi işlemler yapılıyorsa bu test parametrik

olmayan bir testtir17

● Parametrik testlerin uygulanabilmesi için bazı

varsayımların yerine getirilmesi gerekmektedir. Bu

varsayımlar şunlardır:

1. Örneklemin çekildiği evrenle ilgili:

a) Normal dağılıma sahip olacak

b) Varyanslar homojen olacak

2. Örneklemle ilgili:

a) Denekler evrenden rastgele seçilecek

b) Denekler birbirinden bağımsız olarak seçilecek (Bir

deneğin seçimi diğer deneklerin seçimini

etkilemeyecek)18

● Niteliksel veriler için parametrik olmayan testler

kullanılır. Bunun yanında ölçümle belirtildiği halde

veri parametrik test varsayımlarını yerine

getiremiyorsa, denek sayısı azsa ya da değerler

yerine sıraları verilmişse yine parametrik olmayan

testler kullanılır.

● Veri ölçümle belirtilmişse ve parametrik test

varsayımlarını yerine getirebiliyorsa parametrik

testleri uygulamak daha doğru olur. Çünkü

parametrik testler parametrik olmayan testlerden

daha güçlüdür. 19

20

Parametrik Test Parametrik Olmayan Test

Evren ortalaması önemlilik testi İşaret testi

İki ortalama arasındaki farkın önemlilik testi

Mann-Whitney U testi

İki eş arasındaki farkın önemlilik testi Wilcoxon eşleştirilmiş örnek testi

İki yüzde arasındaki farkın önemlilik testi

4 gözlü ki-kare testi

Tek yönlü varyans analizi Kuruskal-Walis varyans analizi

Her bir parametrik teste karşı birden çok parametrik olmayan test vardır.

● Parametrik testler uygulanmadan önce normal dağılıma

uygunluk ve varyansların homojenlik testi yapılmalıdır.

Aşağıda açıklanan pratik yol ile elde edilen dağılımın

normal dağılıma uyup uymadığı yaklaşık olarak

incelenebilir.

Normal dağılımda deneklerin;

girmesi gerekir. Bu nedenle dağılımın ortalama ve

standart sapması hesaplanarak deneklerin yaklaşık olarak

bu sınırlar içinde kalıp kalmadığı kontrol edilebilir. 21

22

Bunu bir Örnekle açıklayalım:●Aşağıdaki tabloda verilen 75 çocuğun boylarının aritmetik

ortalaması 103.72 ve standart sapması (S) 6.35’tir. Buna

göre bu sınırlar içine giren denek sayı ve yüzdelerini bulalım :

90 91 92 93 93 94 94 95 96 96 96 97

97 98 98 98 99 99 99 99 100 100 100 100

101 101 101 101 102 102 102 102 103 103 103 103

103 104 104 104 104 104 105 105 105 105 106 106

106 106 107 107 107 108 108 108 109 109 109 110

110 110 111 111 112 112 113 113 113 113 114 114

114 114 115

İSTATİSTİKSEL KARAR

Test sonucu Ho hipotezi ya reddedilir ya kabul edilir. Bu

karara hesaplanan t değeri ile seçilen yanılma

düzeyindeki tablo t değeri değeri karşılaştırılarak varılır.

Test sonucunda Ho hipotezinin kabul ya da

reddedilmesinde kriter şudur:

1. Hesaplanan t değeri tablo değerinden büyükse; Ho

reddedilir, H1’in desteklendiğine karar verilir.

2. Hesaplanan t değeri tablo değerinden küçükse; Ho kabul

edilir. 23

24

Serbestlik derecesi

İstatistikte Serbestlik Derecesi terimiyle sık karşılaşırız.

Serbestlik Derecesi genelde S.D. ile gösterilir. Basit bir

örnekle: 3 kişilik bir örneklemde boy ölçümü yaptığımızı

varsayalım. Örneklemimiz n=3 olacaktır. Bireylerimizin

boylarının toplamı 500 cm olsun. İlk iki bireyimiz geniş bir

yelpazede herhangi bir boy değerine sahip olabilir.

Ancak, 1. ve ikinci bireylerimizin boylarını belirledikten

sonra (burada 165 ve 175 olsun) 3 bireyimizin boyu artık

serbest değildir. Bu bireyimiz 160 cm boyunda olmak

zorundadır. Bu nedenle SD=n–1=3–1=2 olacaktır.

İKİ ORTALAMA ARASINDAKİ FARKIN ÖNEMLİLİK TESTİ

Parametrik (ölçüme dayanan) test varsayımları yerine

getirildiğinde, ölçümle belirtilen sürekli bir değişken

yönünden bağımsız iki grup arasında fark olup

olmadığını test etmek için kullanılan bir önemlilik

testidir. Bu testte;

a) İki grup karşılaştırılmaktadır.

b) Karşılaştırılan bu iki grup birbirinden bağımsızdır.

c) Bu iki grup arasında farklı olup olmadığı test edilen

değişken, ölçümle belirtilen sürekli bir karakterdir.

25

Örnek 1.

Bir eczacı yeni üretilen bir ilacın bir hastalığın

iyileştirilmesinde diğer bir ilaçtan daha etkili olduğu

hipotezini öne sürüyor. Bu hipotezin doğru olup

olmadığını kontrol etmek için söz konusu hastalığı

taşıyan hastalardan tamamen tesadüfi belirli bir sayıda

hasta seçer. Daha sonra yine tamamen tesadüfi olarak

bu hastaları iki gruba ayırır. Gruplardan birini oluşturan

hastaları yeni ilaç (A) ile diğer grubu da diğer ilaç (B) ile

tedavi eder. Belirli bir süre sonunda hastalığın iyileşme

göstergesi olarak kabul edilen bir kan özelliğine ait

analizleri yaparak verilerini toplar. 26

Gözlediği verilerine dayanarak eczacı şu hipotezi kurar

ve hipotezleri test eder.

Ho: Hastalığın iyileşmesine etki bakımından yeni ilaç ile

eski ilaç arasında fark yoktur, gözlenen fark tesadüften

ileri gelmektedir, yani kontrol hipotezini

H1: Hastalığın iyileşmesine etki bakımından yeni ilaç,

eski ilaç ilaçtan daha etkilidir.Yani karşı hipotezi kontrol

edecektir.

27

t TESTİ: iki farklı ortalamanın karşılaştırılmasında kullanılan bir testtir. Böylece iki ortalamanın arasında bir fark olup olmadığı test edilir. İkiden fazla ortalama söz konusu ise bu durumda çoklu karşılaştırma testlerinden bir kullanılır. T testi uygulaması kolay olduğundan çok kullanılan bir testtir. “t” değerini bulmak için aşağıdaki formül kullanılır.

28

gruplar : B A ve

hataStandart S

ortalamaAritmetik x

Formülde;

)()(

22

BA SESE

xxt

BA Bu formülün

uygulanabilmesi için her

gruba ait aritmetik

ortalama ve standart

hataların hesaplanması

gerekir.

Problem: Modern beslenme yönteminin çocuğun gelişimi

üzerine etkisini araştırmak için aynı yaşta, aynı kiloda 60

çocuk iki gruba ayrılmış, birinci grup modern beslenme

yöntemine , ikinci grup annelerin kendi bilgilerine göre

beslenmiştir. Bir süre sonra çocuklar tartılmıştır. İki

gruptan elde edilen bulgular aşağıda verilmiştir. Kilo

kazanma yönünden bu iki yöntem arasında fark varmıdır?

29

Modern Yönteme Göre Beslenme

Anne Bilgisine Göre Beslenme

Aritmetik ortalama 8.860 kg 8.300 kg

Standart sapma (S) 0.560 kg 0.567 kg

Örnek sayısı (n) 30 30

30

58230302nn(S.D) derecesi Serbestlik

3,850,1453

0,56

0,0211

0,56

0,01070,0104

0,56

0,10350,1022

8,308,86

50,1035,477

0,567

30

0,567 ve0,1022

5,477

0,560

30

0,560

Örnek

sapmaStandart

0 xx :H

0 x - x : H

21

22

21

2 1 1

210

t

SESE

Yanılma olasılığı =0.05 olarak seçilmiştir. 58 derecesindeki t değeri 2.00’dır.Hesapla bulunan t değeri (3.85) tablo değerinden büyük olduğundan Ho hipotezi reddedilecektir. Karar: Kilo alma yönünden modern beslenme yöntemi ile anne bilgisine göre beslenme arasındaki fark istatiksel olarak anlamlı bulunmuştur (t=3.85, p<0.05). Modern yöntemle beslenen çocuklar daha fazla kilo almaktadırlar.

Soru: Aynı hastalığa yakalanan bir grup hasta A ilacıyla,

bir grup hasta B ilacıyla tedavi edilmiş, iyileşme saati ölçu

olarak kullanılmış ve elde edilen bulgular aşağıda

verilmiştir. İlaçların tedavi etkinlikleri farklı mıdır?

32

A İlacı B İlacı

Aritmetik ortalama 8.46 7.62

Standart sapma (S) 1.70 2.23


Soru: Zehirli bir madde farelere iki ayrı dozda enjekte

edilmiş ve ölüm süreleri saniye cinsinden kaydedilmiştir.

Elde edilen bulgular aşağıda verilmiştir. Dozlar arasında

istaistiksek bir fark varmıdır?

33

Doz (mg)

0.50 0.75

Aritmetik ortalama 8.67 7.33

Standart sapma 1.75 1.00


Soru: Alkol kullanan 65 ve kullanmayan 78 şahıs üzerinde

yapılan bir araştırmada bu şahısların kanlarında fosfor

seviyeleri ortalaması ve standart hata (SE) değerleri

aşağıdaki gibidir. İki grup arasındaki fosfor seviyelerinin

önemli derecede farklı olmadıklarını belirleyiniz.

34

Fosfor Aritmetik ortalama (SE) n

Alkol kullananlar 3.22 mg 0.058 65

Alkol kullanmayanlar 3.78 mg 0.066 78

Soru: Kronik böbrek yetmezliğine bağlı aneminin tedavisi

amacıyla eritropoetin tedavisi verilen 12 hastada tedaviden

önce ve tedaviden sonra hemoglobin (Hb) düzeylerine

bakılıyor. Hastaların Hb düzeyleri aşağıda verilmiştir. Buna

göre tedavi öncesi ve sonrası Hb değerleri arasında önemli

bir fark var mıdır? Serbestlik derecesi= n-1 alınız.

35

Tedavi öncesi Hb (g/dL)

7.5 7.6 8.6 9.3 7.8 9.8 9.3 10.3 8.4 7.0 11.9 7.5

Tedavi sonrası Hb (g/dL)

12.3 10.9 9.8 13.4 11.1 9.3 9.9 12.3 11.3 9.0 10.9 12.3

Önemlilik Testleriesaglikonline.com/E-Saglik Online/Tibbi Istatistik/8... · 2017-05-04 ·...

Documents

Transcript of Önemlilik Testleriesaglikonline.com/E-Saglik Online/Tibbi Istatistik/8... · 2017-05-04 ·...