Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)
Transcript of Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)
MÜH 100MÜH 100
İSTATİSTİKİSTATİSTİK
Yrd. Doç. Dr. Veysel GaziYrd. Doç. Dr. Veysel GaziTOBB Ekonomi ve Teknoloji ÜniversitesiTOBB Ekonomi ve Teknoloji ÜniversitesiElektrik-Elektronik Mühendisliği BölümüElektrik-Elektronik Mühendisliği Bölümü
AMAÇAMAÇ
• KitleKitle ve ve örneklemörneklem arasındaki farkı öğrenmekarasındaki farkı öğrenmek• Betimsel istatistiğiBetimsel istatistiği kullanmayı öğrenmek kullanmayı öğrenmek
(veri sıralaması, merkezsel eğilim ölçüleri, (veri sıralaması, merkezsel eğilim ölçüleri, dağılım ölçüleri, vs.)dağılım ölçüleri, vs.)
• HistogramHistogram çizme ve okumayı öğrenmekçizme ve okumayı öğrenmek• Normal dağılımıNormal dağılımı ve ve standart normal dağılımıstandart normal dağılımı
tanımlamaktanımlamak• Olasılık hesabı içinOlasılık hesabı için Z-tablolarıZ-tabloları kullanmakkullanmak
İstatistikİstatistik• İstatistik olasılık kuramının yöntemlerine bağlı İstatistik olasılık kuramının yöntemlerine bağlı
bir daldır bir daldır - - betimsel (descriptive) istatistikbetimsel (descriptive) istatistik: : veri veri toplamak, toplamak,
düzenlemek, özetlemek, sunmak ve incelemekdüzenlemek, özetlemek, sunmak ve incelemek- tümevarımsal istatistik (statistical inference)tümevarımsal istatistik (statistical inference)::
- verilere dayanarak verilere dayanarak sonuçlar çıkarmaksonuçlar çıkarmak- sonuçlara dayanarak sonuçlara dayanarak kararlar almakkararlar almak
• mühendisler tarafından çok kullanılır mühendisler tarafından çok kullanılır ((meselamesela kalite kontrol içinkalite kontrol için))
Kitle ve ÖrneklemKitle ve Örneklem• Kitle (Kitle (PopulationPopulation)) – – üzerinde çalışılan tüm üzerinde çalışılan tüm
gruba yada istatistiksel sonuçların gruba yada istatistiksel sonuçların genişletileceği gruba kitle denirgenişletileceği gruba kitle denir – örnek:örnek: bütün sınıf, tüm ülke insanları, tüm kanser bütün sınıf, tüm ülke insanları, tüm kanser
hastalarıhastaları• Örneklem (Örneklem (SampleSample)) – – kitlenin bir alt kitlenin bir alt
kümesidirkümesidir– örnek: bir takım, rasgele seçilen bazı insanlarörnek: bir takım, rasgele seçilen bazı insanlar
• Bütün kitle hakkında sonuçlara varabilmek için Bütün kitle hakkında sonuçlara varabilmek için genelde örneklem kullanılırgenelde örneklem kullanılır..
Neden örneklem Neden örneklem kullanılır?kullanılır?• Kitle çok büyük olabilirKitle çok büyük olabilir
– dünyadaki tüm insanlardünyadaki tüm insanlar, , uzaydaki tüm yıldızlaruzaydaki tüm yıldızlar..• Kitleye ulaşmak imkansız olabilirKitleye ulaşmak imkansız olabilir
– tarih öncesi insanlarıtarih öncesi insanları• Kitleyi incelemek tehlikeli olabilirKitleyi incelemek tehlikeli olabilir
– araba enkazları/kazalarıaraba enkazları/kazaları, , patlamalarpatlamalar• Kitleyi ölçmek zor olabilirKitleyi ölçmek zor olabilir
– atomatomların alt parçacıklarıların alt parçacıkları• Ölçüm örneği kullanılmaz hale getiriyor olabilirÖlçüm örneği kullanılmaz hale getiriyor olabilir
– vidanın dayanma gücüvidanın dayanma gücü
Örnek:Örnek: • Sağındaki ve solundaki kişilerin Sağındaki ve solundaki kişilerin
yaşlarının ve kendi yaşının yaşlarının ve kendi yaşının ortalamasını alarak sınıf yaş ortalamasını alarak sınıf yaş ortalamasını tahmin et.ortalamasını tahmin et.
• Aldığın Aldığın 3 kişilik örneklem3 kişilik örneklem hangi hangi şartlarda sınıfı temsil etmez?şartlarda sınıfı temsil etmez?
Merkezsel Eğilim ÖlçüleriMerkezsel Eğilim Ölçüleri• Bir kitleyi (yada bir örneklemi) tek bir sayı ile Bir kitleyi (yada bir örneklemi) tek bir sayı ile
tanımlamak/betimlemek istersek ne tanımlamak/betimlemek istersek ne kullanırızkullanırız??
– Ortalama (Ortalama (MeanMean)) – aritmeti– aritmetik ortalamak ortalama – Mod (Mod (ModeMode)) – – en çok tekrarlanan (en sık en çok tekrarlanan (en sık
görülen) değergörülen) değer..– Ortanca/Medyan (Ortanca/Medyan (MedianMedian)) – – veri veri
kümesinin kümesinin ““ortaorta” ” değerideğeri..
Ortalama nedir?Ortalama nedir?
• Ortalama Ortalama verilerin toplamının veri verilerin toplamının veri sayısına bölümüdürsayısına bölümüdür..
Kitle OrtalamasıKitle Ortalaması
• μμ = kitle ortalamasıkitle ortalaması• xxii == verilerveriler
• NN == kitledeki tüm gözlemlerin sayısıkitledeki tüm gözlemlerin sayısı
N
iixN 1
1
Örneklem OrtalamasıÖrneklem Ortalaması
n
iixn
x1
1
• = = örneklem ortalamasıörneklem ortalaması• xxii == verilerveriler
• nn == örneklemdeki gözlemlerin sayısıörneklemdeki gözlemlerin sayısı
x
Ağırlıklı OrtalamaAğırlıklı Ortalama
k
iii
k
ii wnxw
nOA
11
burada ve1..
• Ağırlıkları w1,w2, …,wk, olan x1,x2, …, xk, verilerinin ağırlıklı ortalaması:
ÖrnekÖrnekDersDers KredKred
iiNotNot Ağ. NotAğ. Not
Fiz 101Fiz 101 44 AA (4.0)AA (4.0) 16.016.0Kim 101Kim 101 44 BB (3.0)BB (3.0) 12.012.0Müh Müh 100100
22 BA (3.5)BA (3.5) 7.07.0
Mat 101Mat 101 44 CB (2.5)CB (2.5) 10.010.0Türk Türk 101101
22 CC (2.0)CC (2.0) 4.04.0
İng 101İng 101 22 DD DD (1.0)(1.0)
2.02.0
MAK MAK 101101
33 DC DC (1.5)(1.5)
4.54.5
ToplamToplam 2121 55.555.5
64.221
5.55.. OA
• Yandaki tabloda verilen ders ve notlar için ağırlıklı ortalama:
Mod Nedir?Mod Nedir?• modmod – – kesikli verilerde (yada kesikli aralıklara kesikli verilerde (yada kesikli aralıklara
gruplanmış verilerde) gruplanmış verilerde) en fazlaen fazla görülen değergörülen değer..
0
5
10
15
20
25
30
35
EE MAK BİL
Seri 1
Örnek: Örnek: MÜH100 MÜH100 dersini alan dersini alan öğrencilerin öğrencilerin çoğu EEM çoğu EEM bölümündenbölümünden..
Ortanca nedir?Ortanca nedir?• Ortanca (medyan)Ortanca (medyan) – – veriler sıralanmış olmalıveriler sıralanmış olmalı
– tek sayıda gözlem var ise ortanca orta tek sayıda gözlem var ise ortanca orta değerdirdeğerdir
– çift sayıda gözlem var ise ortanca iki orta çift sayıda gözlem var ise ortanca iki orta değerin ortalamasıdırdeğerin ortalamasıdır
• Verilerde Verilerde sapan değerlersapan değerler var ise var ise ortanca verileri ortalamadan daha iyi ortanca verileri ortalamadan daha iyi betimler.betimler. – Örnek: Şu an bu odadaki kişilerin yaş Örnek: Şu an bu odadaki kişilerin yaş
ortalamasıortalaması..
Dağılım ÖlçüleriDağılım Ölçüleri
• Verilerin merkeze göre dağılımı Verilerin merkeze göre dağılımı tanımlayan ölçülertanımlayan ölçüler– değişim aralığıdeğişim aralığı– ortalama mutlak sapmaortalama mutlak sapma– standart sapmastandart sapma – varyansvaryans
Değişim Aralığı Nedir?Değişim Aralığı Nedir?
• Değişim Aralığı (Değişim Aralığı (RangeRange)) – – en en büyük ve en küçük değerler büyük ve en küçük değerler arasındaki farkarasındaki fark..– Örnek: A üniversitesinin B bölümünün Örnek: A üniversitesinin B bölümünün
tavan puanı 361 ve taban puanı 349 isetavan puanı 361 ve taban puanı 349 ise.. •En düşük (En düşük (MinimumMinimum)) = = 349 puan349 puan •En yüksek (En yüksek (MaMaksksimumimum)) = = 361 puan361 puan•Değişim aralığı Değişim aralığı = = 361-349 = 12 puan361-349 = 12 puan
Ortalama Mutlak SapmaOrtalama Mutlak Sapma• Herhangi bir verinin ortalamadan sapmasıHerhangi bir verinin ortalamadan sapması
• Tüm sapmaların toplamı sıfırdırTüm sapmaların toplamı sıfırdır• Ortalama Mutlak Sapma (OMS)Ortalama Mutlak Sapma (OMS)
xxdxd iiii yada
||1 yada ||111
xxn
OMSxN
OMSn
ii
N
ii
Standart SapmaStandart Sapma•Kitle için
2
1
)(1
N
iixN
2
1
)()1(
1 xxn
sn
ii
Sapma
Varyans = 2
Varyans = s2
• Örneklem için
Standart SapmaStandart Sapma
•Verilerin dağılımı hakkında Verilerin dağılımı hakkında önemli bilgi vermektedirönemli bilgi vermektedir..
•Matematiksel analiz için OMS’den Matematiksel analiz için OMS’den daha uygun.daha uygun.
ve s Farkıve s Farkı
•s (örneklem varyansı) s (örneklem varyansı) ‘nın (kitle ‘nın (kitle varyansının) bir tahminidir.varyansının) bir tahminidir.
•s’nin hesaplanmasında s’nin hesaplanmasında n-1n-1 kullanılır kullanılır ve bu daha iyi sonuç verir.ve bu daha iyi sonuç verir.
•Eğer Eğer nn büyük ise büyük ise nn ve ve n-1n-1 kullanımı kullanımı arasındaki fark önemsizdirarasındaki fark önemsizdir..
Önemli bir özellikÖnemli bir özellik
• Standart sapmayı Standart sapmayı Gauss Gauss 1700’lerde 1700’lerde yıldızların ölçülen konumlarındaki yıldızların ölçülen konumlarındaki gözlenen hataları açıklamak için icat gözlenen hataları açıklamak için icat etmişetmiş..
• Bugün ise kalite kontrolden finansal Bugün ise kalite kontrolden finansal risklerin ölçülmesi/hesaplanması’na risklerin ölçülmesi/hesaplanması’na kadar birçok yerde kullanılıyorkadar birçok yerde kullanılıyor..
Verilerin DüzenlenmesiVerilerin Düzenlenmesi• Bir gözlemde yada deneyde elde edilen verilere Bir gözlemde yada deneyde elde edilen verilere
ham veri (raw data)ham veri (raw data) denir. denir.• Veriler genelde incelemeden önce Veriler genelde incelemeden önce büyükten büyükten
küçüğe (yada tersi) sıralanır (sort edilir).küçüğe (yada tersi) sıralanır (sort edilir).• Sıralanmış veriler Sıralanmış veriler sınıflandırılırsınıflandırılır..• Sınıflar tüm verileri kapsayacak ve her veri sadece Sınıflar tüm verileri kapsayacak ve her veri sadece
bir sınıfa dahil olacak şekilde tanımlanır.bir sınıfa dahil olacak şekilde tanımlanır.• Her sınıftaki eleman sayısına Her sınıftaki eleman sayısına sınıf frekansısınıf frekansı denir. denir. • Veriler Veriler histogram histogram kullanarak grafiksel olarak kullanarak grafiksel olarak
gösterilebilir. gösterilebilir.
ÖrnekÖrnek• Müh 100 dersinin notları aşağıdaki gibi olsunMüh 100 dersinin notları aşağıdaki gibi olsun50 54 54 60 55 73 74 5462 64 63 47 57 62 54 5862 50 62 59 47 74 51 5549 67 60 48 46 71 57 5952 65 49 46 69 53 66 7570 51 50 57 60 47 51 5358 57 56 69 53 59 47 4663 48 48 61 68 56 58 6460 37 49 66 62 51 59 5053 69 74 48 50 64 64 6053 65 65
ÖrnekÖrnek• Notlar büyükten küçüğe sıralanır.Notlar büyükten küçüğe sıralanır.
– En yüksek not (maksimum) = 75En yüksek not (maksimum) = 75– En düşük not (minimum) = 37En düşük not (minimum) = 37– Not değişim aralığı = 75 – 37 = 38Not değişim aralığı = 75 – 37 = 38– Ortalama = 58’dir.Ortalama = 58’dir.– Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir.Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir.
• Sıralanmış notlar 9 sınıfa ayrılırSıralanmış notlar 9 sınıfa ayrılır– Sınıflar 35-39, 40-44,45-49,…,75-79’dırSınıflar 35-39, 40-44,45-49,…,75-79’dır– En fazla not 50-54 sınıfındadır – bu sınıf En fazla not 50-54 sınıfındadır – bu sınıf mod mod
sınıfıdırsınıfıdır..
ÖrnekÖrnek
02468
101214161820
Seri 1
• Her sınıfın frekansına göre histogram çizersek.
Veri DağılımlarıVeri Dağılımları• Verinin Verinin ““şeklişekli” ” frekans histogramı ile frekans histogramı ile
anlaşılıranlaşılır..• Frekans histogramlarında genelde Frekans histogramlarında genelde oransal oransal
frekansfrekans (OF = sınıf frekansı/toplam (OF = sınıf frekansı/toplam frekans) kullanılır.frekans) kullanılır.
• Çoğunlukla veriler Çoğunlukla veriler ““çan-eğrisiçan-eğrisi” ” şeklinde bir şeklinde bir dağılım gösterirler ve bu tür dağılıma dağılım gösterirler ve bu tür dağılıma “normal” d“normal” dağılım (distribution)ağılım (distribution) denir denir..
• Gauss Gauss yıldızların konum hatalarının yıldızların konum hatalarının “normal” “normal” dağılım gösterdiğini gözledidağılım gösterdiğini gözledi..
Normal DağılımNormal Dağılım• NNormal dormal dağılım bazen ağılım bazen “Gauss” “Gauss”
dağılımı olarak da adlandırılırdağılımı olarak da adlandırılır..
22 /21
21OF
xe ortalama
x
OFOransal (Relative)Frekans
Standart Normal DağılımStandart Normal Dağılım
içiniçin / xz
2
21
21OF
ze
0.0
0.1
0.2
0.3
0.4
0.5
-4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0
Alan = 1.00
Bilinmesi Gereken Bazı Bilinmesi Gereken Bazı ŞeylerŞeyler• z=-1 ve z=1 (x=-z=-1 ve z=1 (x=- ve x= ve x= arasındaki arasındaki
alan 0.6827’dır.alan 0.6827’dır.• z=-2 ve z=2 (x=-2z=-2 ve z=2 (x=-2 ve x=2 ve x=2 arasındaki arasındaki
alan 0.9545’dır.alan 0.9545’dır.• z=-3 ve z=3 (x=-3z=-3 ve z=3 (x=-3 ve x=3 ve x=3 arasındaki arasındaki
alan 0.9973’dır.alan 0.9973’dır.• z=-4 ve z=4 (x=-4z=-4 ve z=4 (x=-4 ve x=4 ve x=4 arasındaki arasındaki
alan pratik olarak 1.0’dır.alan pratik olarak 1.0’dır.
Bilinmesi Gereken Bazı Bilinmesi Gereken Bazı ŞeylerŞeyler• Normal eğrisinde orta değer alanı Normal eğrisinde orta değer alanı
%%5050’lik iki eşit bölgeye ayırır’lik iki eşit bölgeye ayırır..• NNormal dormal dağılımağılım eğrisi toplam eğrisi toplam 1.001.00
alana sahiptiralana sahiptir..• ““z-Tablz-Tablolarıoları” standar” standartt normal d normal dağılım ağılım
eğrisinin altındaki alanı gösterir ve z-eğrisinin altındaki alanı gösterir ve z-eksenindeki herhangi iki nokta eksenindeki herhangi iki nokta arasındaki alanı hesaplamak için arasındaki alanı hesaplamak için kullanılabilirkullanılabilir..
Z-Tabloları Kullanarak Z-Tabloları Kullanarak Olasılık HesabıOlasılık Hesabı• ÖrnekÖrnek: : Kitabınızdaki Ek-C’deki Z-tablosunu Kitabınızdaki Ek-C’deki Z-tablosunu
kullanarak kullanarak z= -1.0 z= -1.0 veve z= 2.0 z= 2.05 arasındaki 5 arasındaki alanı bulunuz.alanı bulunuz.– TTablablodan:odan: z = 1.0 z = 1.0 için alan için alan = 0.3413 = 0.3413– SiSimetrmetriden dolayıiden dolayı z = -1.0, z = -1.0, için de alan için de alan = 0.3413 = 0.3413– TTablablodan:odan: z= 2.0 z= 2.05 için5 için, a, allaann = 0.47 = 0.479898– ToToplam alanplam alan = 0.3413 + 0.47 = 0.3413 + 0.479898 = 0.8 = 0.8211211 – ““KuyruklarınKuyrukların” ” alanıalanı = 1.0 - 0.8 = 1.0 - 0.821211 = 0.11 = 0.1789789
ÖzetÖzet• Merkezsel ÖlçülerMerkezsel Ölçüler
– ortalamaortalama– modmod– ortancaortanca
• Dağılım ÖlçüleriDağılım Ölçüleri – değişim aralığıdeğişim aralığı– varvaryansyans– standarstandart sapmat sapma
• Normal DNormal Dağılımıağılımı
vgazivgazi@@etuetu.edu.tr.edu.tr