Istatistik Ders Anlatımı
-
Upload
ismail-bayraktar -
Category
Documents
-
view
156 -
download
6
description
Transcript of Istatistik Ders Anlatımı
İstatistik
Araştırma ve İstatistik Hakkında Ne Biliyoruz?
Konu Özeti
İstatistik Nedir? Neden İstatistik? İnsanlar istatistiği ne zamandır
kullanıyorlar? İstatistikte Bazı Temel Kavramlar İstatistiksel Verileri Tasnif Etme Korelasyon Grafik Analizi
Herkes biraz istatistik bilmeli!
• Üniversite Oran(%)
• Marmara 75
• Balıkesir 85
• Gazi 74
•Niğde 100
Herkes biraz istatistik bilmeli!Hangisi Başarılı?
Üniversite Sınava giren Kazanan Oran(%)
•Marmara 60 45 75
•Balıkesir 55 47 85
•Gazi 62 46 74
•Niğde 2 2 100
Herkes biraz istatistik bilmeli!Hangisi Başarılı?
Lise Üniversiteye giren öğrenci sayısı
A 120
B 90
C 62
Herkes biraz istatistik bilmeli!
Hangisi Başarılı?
Lise Üniversiteye giren
öğrenci sayısı
Sınava giren öğrenci sayısı
Oran(%)
B 90 210 42
C 62 260 24
A 120 630 19
Herkes biraz istatistik bilmeli!Hangisi Başarılı?
Firma Kaza / yıl
A 20
B 7
Hangi firmanın otobüsleri daha çok kaza yapıyor?
Herkes biraz istatistik bilmeli!
Firma Yolcu / gün Kaza / yıl Oran(%)
A 500 20 4.0
B 120 7 5.8
Hangi firmanın otobüsleri daha çok kaza yapıyor?
Herkes biraz istatistik bilmeli!
İstatistik Nedir?
İstatistik Nedir?
• İstatistik,İstatistik, belirli amaçlar için veri toplama, belirli amaçlar için veri toplama, toplanan verileri tasnif etme, çözümleme ve toplanan verileri tasnif etme, çözümleme ve yorumlama bilimidir.yorumlama bilimidir.
• İstatistik sayısal verileri değerlendiren bir İstatistik sayısal verileri değerlendiren bir bilim dalıbilim dalı
Neden İstatistik?
Neden İstatistik?
İstatistik,İstatistik, Ne kadar?Ne kadar? Ne zaman?Ne zaman? Nerede?Nerede? Nasıl?Nasıl? Kaç tane?Kaç tane? Hangi oranda?Hangi oranda?
Sorularına yanıt ararSorularına yanıt arar
İstatistik, çevremizde olup bitenleri sayılarla ifade etmede yardımcı olur.
İnsanlar İstatistiği Ne zamandır Kullanıyorlar?
• 1445 - zar atma, şans oyunları1445 - zar atma, şans oyunları• 17.Yüzyıl ortaları, istatistik ilk kez ders 17.Yüzyıl ortaları, istatistik ilk kez ders
kitaplarına girdikitaplarına girdi
İstatistikte Bazı Temel Kavramlar
İstatistikte Bazı Temel kavramlar
• EvrenEvren▫ Gözlem alanına giren obje ya da bireylerin Gözlem alanına giren obje ya da bireylerin
tümütümü• ÖrneklemÖrneklem
▫ Bir evrenden seçilmiş daha küçük sayıdaki Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grupobje ya da bireylerin oluşturduğu grup
İstatistikte Bazı Temel kavramlar
• DeğişkenDeğişken▫ Her gözleme göre farklı değerler alabilen Her gözleme göre farklı değerler alabilen
objelere, özelliklere ya da durumlara denirobjelere, özelliklere ya da durumlara denir• Değişkenler nicel ya da nitel olabilir.Değişkenler nicel ya da nitel olabilir.• Nitel verilerNitel veriler• Sayısal verilerSayısal veriler-kesikli sayısal veriler (maç kazanma syısı)-kesikli sayısal veriler (maç kazanma syısı)-sürekli sayısal veriler (boy, kilo)-sürekli sayısal veriler (boy, kilo)• Nitelik ve sayısal veriler arasındaki ilişki (boy Nitelik ve sayısal veriler arasındaki ilişki (boy
sınıflandırması)sınıflandırması)
İstatistikte Bazı Temel kavramlar• ÖlçmeÖlçme
▫ objelere ya da bireylere belirli bir değere objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir.sembolik değerler verme işlemidir.
▫ Değişkenler hakkında bilgi edinmek için Değişkenler hakkında bilgi edinmek için yapılıryapılır
• ÖlçümÖlçüm▫ Ölçme sonucunda elde edilen değerÖlçme sonucunda elde edilen değer
İstatistikte Bazı Temel kavramlar
• Anlamlı rakamAnlamlı rakam
X=2.8
0 1 2 3 4 5 6
X=5.0
5 cm = 5,0cm
İstatistikte Bazı Temel kavramlar
•Sayıları yuvarlamaSayıları yuvarlama
5,387123 = 5,39 = 5,4 = 55,387123 = 5,39 = 5,4 = 5
Verilerin Sınıflandırılması •2,4,4,4,6,6,8,10,12,16,18•En büyük değerden en küçük değer
çıkarılarak veri aralığı tespit edilir. İstenen sınıf sayısına bölünerek
•2-18=16/8=2 veri aralığı 2 dir. •2-4•5-7•8-10
18.04.23
23
Frekans tablosu hazırlama
BÖLGE
35 22.7 22.7 22.7
59 38.3 38.3 61.0
13 8.4 8.4 69.5
14 9.1 9.1 78.6
18 11.7 11.7 90.3
7 4.5 4.5 94.8
8 5.2 5.2 100.0
154 100.0 100.0
akdeniz
ege
ic anadolu
marmara
karadeniz
dogu anadolu
guneydogu anadolu
Total
ValidFrequency Percent Valid Percent
CumulativePercent
18.04.23
24
Merkezi Eğilim Ölçüleri
İstatistikte Bazı Temel kavramlar
•Aritmetik OrtalamaAritmetik Ortalama•Aralık (range)Aralık (range)•SapmaSapma•Standart sapma Standart sapma •Ölçümlerin dağılımı ve standart Ölçümlerin dağılımı ve standart
sapma ile ilişkisisapma ile ilişkisi
İstatistikte Bazı Temel kavramlar
RangeDeğişken
İstatistikte Bazı Temel kavramlar
d1
Aritmetik ortalama
Sapma
d2
X= değerlerin toplamı/değer sayısı
Ağırlıklı ortalama
•İki eşit gurubun ortalamalarının ortalamasıdır.
• Geometrik ortalama
18.04.23
29
Standart sapma: •Bir dizi ölçümün gösterdiği değişimin en
güvenilir ölçüsüdür.
•Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür.
•Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır
Standart sapma: • Standart sapma /bütün elemanların
ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir.
[ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi)
ve yukarıdaki ifadenin karekökü..
ortalama değer
Ortanca (medyan)
•50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2
•Çift ise n/2 nci ile n+2/2 nci değeri /2 dir.•Veriler büyükten küçüğe doğru sıralanır
ortadaki iki değerin aritmetik ortalaması alınır
•5,5,6,6,7,9,9, 7+1/2 •5,5,6,6,7,9,9,10 8/2=4,
8+2/4=5•6+7=13/2=6,5
18.04.23
32
Tepe değer (mod)
•Dağılımda en fazla tekrarlanan değerdir. •Frekansı en fazla olan sınıfın değeridir. •5,5,6,6,6,7,9,9,10
18.04.23
33
Ölçme Sonucunun Gösterilmesi X = 5,8 ± 0,25
X = 58 ± 0,2
X = 58.3 ± 2
Yanlış Gösterim
X = 58.3 ± 0.2 Doğru Gösterim
İstatistiksel Verileri Tasnif Etme
İstatistiksel Verileri Tasnif Etme
• İstatistiksel verileri anlamlı hale İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu:getirmenin 5 ayrı yolu:
1. Sözel ifadelerle açıklama
2. Tablolar halinde düzenleme
3. Grafikle gösterme
4. Verileri değerlendirerek istatistiksel ölçüler bulma
5. Bu yöntemlerde birkaçını birlikte uygulama
İstatistiksel Verileri Tasnif Etme
Verileri sözel ifadelerle açıklama
Verileri tablolar halinde düzenleme
▫ Frekans tablosu
Denekler ağırlık( kg)
1 52,5
2 68,0
3 75,8
4 89,7
İstatistiksel Verileri Tasnif Etme
Verileri tablolar halinde düzenleme
▫ Frekans tablosuPuan Frekans Yüzde
50-60 1 25
61-70 1 25
71-80 1 25
81-90 1 25
İstatistiksel Verileri Tasnif Etme
Verilerin grafikle gösterilmesi
▫ Çizgi grafiği
▫ Çubuk grafik (Histogram)
▫ Pasta grafiği
İstatistiksel Verileri Tasnif Etme
Çizgi grafiği
İstatistiksel Verileri Tasnif Etme
Fre
kan
s
Puan
2
46
8
1012
30 40 50 60 70 80 9040
Çubuk Grafik
İstatistiksel Verileri Tasnif Etme
Fre
kan
s
Puan
3
45
6
78
30 40 50 60 70 80 9040
Çubuk Grafik
İstatistiksel Verileri Tasnif Etme
0
5
10
15
20
25
2000 2001 2002
TÜRKÇE
SOSYAL
MATEMATİK
FEN
Çö
züle
n n
et s
oru
say
ısı
Yıllar
Pasta grafiği
İstatistiksel Verileri Tasnif Etme
36%
64%
Genel lise Meslek lisesi
Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır
2003 Üniversiteye yerleşme2003 Üniversiteye yerleşme
60%19%
10%
11%
Yerleşemeyen
Açık Öğr
Önlisans
Lisans
İstatistiksel Verileri Tasnif Etme
Doğru Grafik Seçme
35%
65%
Genel Lise Meslek Lisesi
3565
0
50
100
Ge
ne
lL
ise
Me
sle
kL
ise
si
AB Ülkelerinde Genel Lise Meslek Lisesi Oranları
İkisi de olabilir. Birincisi daha uygun
Doğru Grafik Seçme
4,6
9,4
8,3
6,5
Dünya
Avrupa 15'ler
Doğu Avrupa
Türkiye
6,5
8,39,4
4,6
0
2
4
6
8
10
Dün
ya
Avr
upa
15'le
r
Doğ
uA
vrup
a
Tür
kiye
Ülkelere Göre Eğitim Yaşı
Doğru Yanlış
Doğru Grafik Seçme
Yıllara göre okul yaşı
2,73,2
3,8
4,8
6,8
0
2
4
6
8
1975 1980 1985 1990 2000
2,7
3,2
3,8
4,8
6,8
1975
1980
1985
1990
2000
Doğru Yanlış
ödev
•Bir grup sporcunun ağırlık değerleri aşağıda verilmiştir.
•55, 56, 60, 65, 65, 67, 68, 70, 75, 77, •80, 82, 84,86, 88, 90, 92, 95, 97, 100
•n=20
18.04.23
49
İstatistiksel verileri açıklamada daima en etkili olanı kullanılmalıdır
Türkiye, kızların okullaşma oranında İran ve Mısır’dan da sonra geliyor
69 70
45
0
20
40
60
80
İran Mısır Türkiye
Kızların okullaşma oranı ve Türkiye
İki gurubun sınıflandırması
•Sporcuların kuvvet değerleri•Erkek: 10,10,20,20,20,30,30,30,50,40•Bayan: 5,5,10,20,20,20,30,30,40,40,
18.04.23
52
Veri sınıflandırması Erkek: 10,10,20,20,20,30,30,30,50,40
Bayan: 5,5,10,20,20,20,30,30,40,40 Veri aralıkları Bayan
F %
Erkek
F %
5-10
11-15
16-20
21-25
26-30
31-35
36-40
41-45
46-50
18.04.23
53
Basit tablolaştırma
Değişkenler N X ss min max
Erkek 10 26,00 12,64 10 50
Bayan 10 22,00 12,95 5 40
18.04.23
54
yada
Değişkenler N X ± SS(kg) Min (kg) Max(kg)
Erkek 10 26,00 ±12,64 10 50
Bayan 10 22,00 ±12,95 5 40
18.04.23
55
Grafik seçenekleri
kuvvet değerleri
20
21
22
23
24
25
26
27
erkek bayan
Seri 1
18.04.23
56
NORMAL DAĞILIM NEDIR
▫ İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir.
▫ Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır.
▫ Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.
• Standart sapması• Frekans eğrisi çan şeklinde olan
simetrik dağılımdır. • Normal dağılım simetrik olduğu
için, normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir
Normal dağılım,
• Dağılım şekli ölçütleri : Çarpıklık –1 ve +1 arasında yer alır.
• Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık,
• Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.
Dağılım özelliğinin önemi nedir
• Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır.
• Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir
NORMAL DAĞILIMIN KRİTERLERİ • Dağılımın normal olup olmadığı grafik
ve istatistik analiz yöntemleri ile anlaşılır.
• Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir.
• Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır.
•Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve ortalamanın örneklem dağılımı normal dağılıma yaklaşır.
•Genellikle bir örneklemde 30 ya da daha fazla sayıda denek varsa, evren normal dağılım göstermiyorsa bile, ortalamanın örneklem dağılımının normal olduğu varsayılabilir
Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :
1. Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak.
2. Varolan verilere parametrik olmayan bir test uygulamak
KESTİRİM
• Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır
• Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır.
• Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.
Hipotez testleri :
• Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve Ho ile gösterilir.
• H1 ile gösterilen alternatif hipotez adı verilen hipotez ise, Ho hipotezinin tam tersidir.
P değeri ve yanılma düzeyi :
• Ho hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani Ho hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır
• Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır.
• Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır
Testler
Parametrik Parametrik olmayan
İki ortalama arasındaki farkın anlamlılık testi t. test
Mann-Witney U testi
Tek yönlü varyans analizi (f testi) Kruskal-Wallis varyans analizi
İki eş arasındaki farkın anlamlılık testi (t test)
Wilcoxon eşleştirilmiş iki örnek testi
Tekrarlı ölçümlerde varyans analizi (f testi)
4 gözlü Ki-Kare testi
Bağımlı örneklerde iki yüzde rasındaki farkın anlamlılk testi ( z testi)
Bağımlı örneklerde ki-kare testi (McNemer testi)
18.04.23
71
Bağımlı gurup- bağımsız gurup kavramı •Bağımlı gurup: bir gözlem (denek)
üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur
•Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.
18.04.23
72
TESTLER
18.04.23
73
BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI •İki ortalama arasındaki farkın anlamlılık testi
•T. Testi •Gerekli koşullar1.Karşılaştırılacak iki gurup vardır2. Guruplar birbirinden bağımsızdır3. Veriler sürekli veri gurubundadır4: evren dağılımları normal dağılım gösterir5. Evren varyansları eşitti.
18.04.23
74
Mann-Witney U testi
•İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır.
•Parametrik koşulları sağlanmadığı durumda kullanılır
18.04.23
75
Bağımsız ikiden çok gurubun karşılaştırılması •Tek yönlü varyans analizi •İkiden çok bağımsız gurup olduğunda ve
parametrik koşullar sağlandığında uygulanır.
•Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.
18.04.23
76
Varyans analizinde farkın kaynaklandığı gurubu belirleme •Varyans analizinde guruplar arasındaki
farkın hangi gurup yada guruplardan kaynaklandığını belirlemede
•1. duncan yöntemi•Tukey HSD yöntemi•Dunnet yöntemi•Student nevman-Keuls Yöntemi kullanılır
18.04.23
77
BAĞIMLI İKİ GURUBUN KARŞILAŞTIRILMASI •İKİ EŞ ARASINDAKİ FARKIN
ANLAMLILIK TESTİSAYFA 149………….
18.04.23
78
Korelasyon
• Korelasyon: iki değişken arasında bağıntı Korelasyon: iki değişken arasında bağıntı olup olmadığını araştırmaolup olmadığını araştırma
• Korelasyon katsayısı – r -
• Regrasyon analizi: bağıntının türünü : bağıntının türünü bulma bulma
Korelasyon
Korelasyon
Matematik Notları
Fiz
ik N
otl
arı
Korelasyon
Kişi başına gelir
Ort
alam
a ö
mü
r
Korelasyon kararı için bir-kaç veri yeter mi?
Ülke nüfusu
Ort
alam
a ö
mü
r
Korelasyon kararı için bir-kaç veri yeter mi?
Ülke nüfusu
Ort
alam
a ö
mü
r
Korelasyon var mı?
Matematik Notları
Res
im N
otl
arı
Korelasyon var mı?
Frekans r*5 0,878
10 0,63215 0,51420 0,44430 0,36140 0,312
Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok.
Grafik Analizi
• Basit korelasyon işlemlerinde kullanılır.Basit korelasyon işlemlerinde kullanılır.
• Grafik çizimi işlem sırası:Grafik çizimi işlem sırası:
▫ Eksenlerin belirlenmesi
▫ Uygun ölçek seçimi
▫ Verilerin yerleştirilmesi
▫ Lineer grafik elde edilmesi
▫ Eğim bulunması
Grafik Analizi
Eksenlerin belirlenmesi
Serbest değişken (birim)
Ba
ğlı
değ
işke
n(b
irim
)
Ölçek Seçimi
Hacim
Kü
tle
Her iki ölçek uygun değil
Ölçek Seçimi
Hacim
Kü
tle
Y ölçeği uygun değil
Ölçek Seçimi
X ölçeği uygun değil
Hacim
Kü
tle
Ölçek Seçimi
Hacim
Kü
tle
Uygun ölçek seçimi
Doğru çizimi
Hacim
Kü
tle
Doğru çizim
Yanlış çizim
Doğru çizimi
Hacim
Kü
tle
Yanlış çizim
Yanlış çizim
Doğru çizim
Eğim Bulunması
Zaman
Hız
Eğim= Hız/zaman = Tan!
Dikkat!
Kaynaklar
• Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme• İstatistik Yöntemler ve Uygulaması, H.Arıcı
Teşekkürler