TIBBİ İSTATİSTİK -...

i

T.C. ANADOLU ÜNİVERSİTESİ YAYINI NO: 2534

AÇIKÖĞRETİM FAKÜLTESİ YAYINI NO: 1505

TIBBİ İSTATİSTİK

Yazarlar

Doç.Dr. Zeki YILDIZ (Ünite 1, 7)

Prof.Dr. Veysel YILMAZ, Yrd.Doç.Dr. H. Eray ÇELİK (Ünite 2, 5)

Yrd.Doç.Dr. Cengiz AKTAŞ (Ünite 3, 8)

Yrd.Doç.Dr. Cengiz BAL (Ünite 4)

Prof.Dr. Ahmet ÖZMEN (Ünite 6)

Editör

Prof.Dr. Veysel YILMAZ

ANADOLU ÜNİVERSİTESİ

ii

Bu kitabın basım, yayım ve satış hakları Anadolu Üniversitesine aittir.“Uzaktan Öğretim” tekniğine uygun olarak hazırlanan bu kitabın bütün hakları saklıdır.

İlgili kuruluştan izin almadan kitabın tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kayıtveya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz.

Copyright © 2012 by Anadolu University All rights reserved

No part of this book may be reproduced or stored in a retrieval system, or transmitted in any form or by any means mechanical, electronic, photocopy, magnetic, tape or otherwise, without

permission in writing from the University.

UZAKTAN ÖĞRETİM TASARIM BİRİMİ

Genel KoordinatörDoç.Dr. Müjgan Bozkaya

Genel Koordinatör YardımcısıDoç.Dr. Hasan Çalışkan

Öğretim TasarımcılarıYrd.Doç.Dr. Seçil Banar

Öğr.Gör.Dr. Mediha Tezcan

Grafik Tasarım YönetmenleriProf. Tevfik Fikret Uçar

Öğr.Gör. Cemalettin YıldızÖğr.Gör. Nilgün Salur

Kitap Koordinasyon Birimi Yrd.Doç.Dr. Feyyaz Bodur

Uzm. Nermin Özgür

Kapak DüzeniProf. Tevfik Fikret Uçar

Öğr.Gör. Cemalettin Yıldız

Grafiker Gülşah Yılmaz

Dizgi Açıköğretim Fakültesi Dizgi Ekibi

Tıbbi İstatistik

ISBN 978-975-06-1208-4

1. Baskı

Bu kitap ANADOLU ÜNİVERSİTESİ Web-Ofset Tesislerinde 22.800 adet basılmıştır.ESKİŞEHİR, Haziran 2012

iii

İçindekiler

Önsöz ……………………………………………………………………………………………….... iv

1. İstatistiğin Tanımı ve Temel Kavramlar……………………………………………………… 2

2. Verilerin Derlenmesi, İşlenmesi ve Grafikler ile Gösterimi………………………………. 14

3. Ortalamalar ve Değişkenlik Ölçüleri……………………………..…………………………… 54

4. Sağlık Alanına Özel İstatistiksel Yöntemler……………………………..………………….. 76

5. Olasılık Kuramı……………………………..……………………………………………………. 112

6. Örnekleme ve Bazı Örnekleme Dağılımları……………………………..…………………… 146

7. İstatiksel Tahmin ve Hipotez Testleri……………………………..…………………………. 182

8. Korelasyon ve Regresyon Analizi……………………………..……………………………… 212

iv

Önsöz

Anadolu Üniversitesi Açıköğretim Fakültesi önlisans programlarından Sağlık Kurumları İşletmeciliği Programında yürütülecek olan Tıbbi İstatistik dersi için hazırlanan bu kitap sekiz üniteden oluşmaktadır. Bu programda öğrenim görecek siz değerli öğrencilerimiz sağlık kurumları işletmelerinde gelecekte birer yönetici olarak yer alacasınız. Bu amaçla sizlerin vereceği kararlarda ve planlamalarınızda doğru ve sağlıklı kararlar alabilmeniz için, karar verme sürecinde riski en aza indirecek istatistik bilgisiyle donatılmış olmanız gerekmektedir.

İstatistik, verilerin elde edilmesinden başlayarak bilgiye dönüştürülmeleri ve veri sayısının azaltılarak kullanım değerlerinin artması sürecinde çeşitli alanlarda çalışan kişilere birçok yararlar sağlar. Ekonomik, sosyal, tıbbi, biyolojik, jeolojik v.b. herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen verilerden sonuçlar çıkarılmasında istatistik başvurulabilecek önemli bir araçtır.

Sağlık kurumu yöneticileri özellikle ileriye dönük planlama yaparken, mevcut durumu değerlendirirken, önceki yıllara göre kıyaslama yaparken ve diğer sağlık kurumları ile kendi kurumunu karşılaştırırken tek bir ölçüye dayalı değil, bir çok ölçüden yararlanarak karşılaştırmalar yapmalıdır. Kendini sürekli olarak yenilemeli, sağlık yöneticiliği alanındaki gelişmeleri takip etmeli, kurumunu en üst seviyeye çıkarmaya çaba göstermelidir. Bu anılan faaliyetler gerçekleştirebilmek için doğru, tam, güvenilir, kullanılabilir, güncel ve denetlenebilir verilere ihtiyaç vardır. Bu verilerin, bilgiye dönüştürülmesi işlemi istatistiksel teknikler olmadan asla yerine getirilemez. Bu nedenle müfredatınızda okutulan Tıbbi İstatistik dersini bu açıdan değerlendirmekte yarar vardır.

Sağlık kurumları işletmeciliği programında okutulacak olan bu kitapda, öncelikle istatistiğe ilişkin temel konular ile alana ilişkin karar verme durumunda kalabileceğiniz çok sayıda probleme ve çözülmüş örneklere yer verilmiştir. Her ünite içinde yer alan sıra sizde soruları konuları kavrayıp kavramadınız hakkında sizlere geribildirim sunmak için verilmiştir. Ayrıca ünite içindeki konularda bilginizi değerlendirebileceğiniz ve sizleri sınavlara hazırlamak için her ünite sonunda yer alan kendimizi sınayalım sorularına yer almıştır.

Hazırlamış olduğumuz Tıbbi istatistik kitabı sadece öğrenim gördüğünüz süre içinde değil aynı zamanda sağlık kurumu işletmelerinde birer yönetici olarak yer aldığınızda da bir başvuru kitabı olarak karar verme sürecinizde belirsizlikleri en aza indirgemenizde yardımcı olmasını dilerim..

Bu kitabın meydana gelmesinde, başta Anadolu Üniversitesi Rektörlüğüne, Açıköğretim Fakültesi Dekanlığına, koordinatörler ve ile kitabın hazırlanması için emeği geçen çalışanlara, editör ve yazarlar olarak teşekkür ederiz.

Editör

Prof.Dr. Veysel Yılmaz

2

Amaçlarımız Bu üniteyi tamamladıktan sonra;

İstatistiğin tanımı ve işlevini açıklayabilecek,

İstatistiğin temel kavramlarını açıklayabilecek,

Değişken kavramını açıklayabilecek ve çeşitli açılardan sınıflandırabilecek,

Değişkenin hangi ölçekle ölçülebileceğini belirleyebilecek

bilgi ve becerilere sahip olabilirsiniz.

Anahtar Kavramlar

İstatistik

Birim

Yığın olay

Değişken

Ana kütle

Örneklem

Ölçekler

İçindekiler

Giriş

İstatistik Kelimesinin Anlamı

İstatistiğin Tanımı ve İşlevi

İstatistiğin Bilim Dalları ve Hastane Yöneticiliği Açısından Önemi

Temel Kavramlar

1

3

GİRİŞBilimsel araştırma, belirli bir o1gular kümesinin niteliği, ortaya çıkış nedenleri ile ortaya çıkardığı sonuçlar konusunda bilgilenme olarak tanımlanabilir. Araştırma amacının gerçekleştirilmesi için benimsenen genel yaklaşım araştırma yöntemi olarak ifade edilebilir. Bilimsel bir araştırma yöntemi soru biçiminde bir araştırma probleminin ortaya konulması, eldeki bilgilerin değerlendirilmesi, araştırmanın planlanması, araştırmanın gerçekleştirilmesi, elde edilen verilerin bilgiye dönüştürülerek yorumlanması, sonuçlara varılması ve sonuçların yarara sunulması aşamalarını içerir. Gözlem yapıldığında istatistik, bilimsel yöntemdeki yerini almaktadır. Gözlemler sonucunda verilerin elde edilmesi, düzenlenmesi, kullanıma sunulması ve çözümlenmesi istatistiğin görevidir. Ayrıca, bilimsel araştırmalarda ulaşılan sonuçların çoğu kesin olmayan yargı, birer çıkarsama niteliğindedir. Bu durumun ölçülmesi de istatistiğin işlevlerinden biridir. Dolayısıyla istatistiğin bilimsel yöntemde betimleme ve çıkarsama görevleri vardır.

İstatistik, verilerin elde edilmesinden başlayarak bilgiye dönüştürülmeleri ve hacimlerinin azaltılarak kullanım değerlerinin artması sürecinde çeşitli alanlarda çalışan kişilere birçok yararlar sağlar. Ekonomik, sosyal, tıbbi, biyolojik, jeolojik v.b. herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen verilerden sonuçlar çıkarılmasında istatistik başvurulabilecek önemli bir araçtır.

Bu ünitede, istatistiğin tanımı ve işlevine, ayrıca istatistiğin öğrenilmesinde belirli bir temelin oluşmasında önemli rol oynayacak bazı temel kavramlar açıklanmaya çalışılacaktır. Temel kavramlar öğrenilmeden sayısal problemlere odaklanılmasının araştırmacıyı yanlış yönlendireceği unutulmamalıdır.

İSTATİSTİK KELİMESİNİN ANLAMIİstatistik kelimesi üç farklı anlamda kullanılmaktadır. Birinci anlamda istatistik kelimesi, çeşitli olaylar hakkında toplanan verileri belirtmek için kullanılmaktadır. Örneğin “sağlık istatistikleri” denildiğinde sağlık alanındaki olaylar hakkındaki sayısal veriler anlatılmak istenmektedir. Benzer biçimde “eğitim istatistikleri”, “dış ticaret istatistikleri” ve “bir spor karşılaşmasına ilişkin istatistikler” ifadelerindeki “istatistikler” kelimesi bu anlamda kullanılmaktadır.

İkinci anlamda istatistik kelimesi, çeşitli alanlardaki bilimsel araştırmalardan elde edilen verilerin düzenlenmesi, özetlenmesi, çözümlenmesi ve yorumlanması işlemlerinin gerçekleştirildiği teknikler bütününü ifade etmektedir. İstatistik yöntembiliminin adıdır.

Üçüncü anlamda istatistik, hakkında bilgi elde etmek amacıyla hedeflenen ana kütleden tesadüfiolarak çekilen bir örneklemin aritmetik ortalama, standart sapma, oran v.b. herhangi bir özetleyici değerine verilen addır. Ana kütleden hesaplanan bu özet değerlere “parametre”, örneklemeye başvurulduğunda ise “istatistik” adı verilir.

İSTATİSTİĞİN TANIMI VE İŞLEVİİstatistik, belirli bir amaç için incelenen bir olayın (olgunun, gerçekliğin) sayısal doğasının anlaşılmasına ve başkalarına anlatılmasına yarar. Çeşitli bilim dallarındaki araştırmalarda, herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen verilerden yararlanarak sonuçlar çıkarılmasında kullanılan bir araçtır. İstatistik sayılarla ilgilidir ve istatistiksel çözümlemelerin yapılabilmesi için sayısal verilere veya

İstatistiğin Tanımı ve Temel Kavramlar

4

sayısal görünüm kazandırılmış verilere gereksinim vardır. İstatistiğin tanımı şu biçimde yapılabilir; İstatistik, belirli bir amaca yönelik veri elde etme (derleme), elde edilen verileri işleme, özetleme, çözümleme ve elde edilen sonuçları yorumlama işlemlerinin gerçekleştirildiği teknikler bilimidir.

İstatistik, belirli bir amaç için hakkında bilgi edinilmek istenen birimleri ve bunların oluşturduğu kütleleri inceler. Söz konusu birimler canlı varlıklar, cansız varlıklar ya da “ortaya çıkan durum” biçiminde ifade edilebilecek olaylar olabilir. Örneğin, bir hastanede yatan hastalar çeşitli nitelikleri bakımından, belirli bir bölgedeki özel, devlet ve üniversite hastaneleri çeşitli nitelikleri bakımından ya da belirli bir hastanedeki doğumlar, acil vakalar çeşitli açıdan incelenebilir. Ancak birimlerin istatistiğin konusu olabilmesi için “yığın (kollektif) olay” niteliğinde olması gerekir. Yığın olay, bir olaylar kütlesinde bir olayın kendi türünden olayları incelenen nitelikleri bakımından tam anlamıyla temsil etmeyen olaylardır. Birbirinin tam benzeri olan olaylar “tipik olaylardır. Bu tür olaylardan ele alınan değişken açısından sadece biri incelense ait olduğu kütleyi temsil eder. Bu tür olaylar birim anlamında istatistiğin konusunu oluşturmaz. Örneğin bir hastane işletmesinde görev yapan doktorların meslek açısından incelenmesinde doktorlar tipik olay durumundadır. Dolayısıyla bu çalışmada doktorlar birim olma niteliğinde olmazlar.

İşlevleri açısından istatistik, “betimsel istatistik” ve “çıkarsamalı istatistik” biçiminde iki ana gruba ayrılabilir. İncelenen birimlere ilişkin verilerin elde edilmesi, elde edilen verilerin sayısal yapılarının anlaşılabilmesi amacıyla işlenip düzenlenmesi, tablolar ve grafiklerle görsel olarak sunulması, aritmetik ortalama, standart sapma gibi değerlerle özetlenmesi betimsel istatistiğin konusudur. Buna karşılık örnekleme temeline dayanan çıkarsamalı istatistikte bir ana kütleden tesadüfî olarak seçilen örneklem yardımıyla ana kütle parametrelerine ilişkin tahmin, hipotez testleri ve gelecek dönemlere ilişkin öngörüler yapılır.

İstatistiğin kelime anlamını ve işlevlerini açıklayınız.

İSTATİSTİĞİN BİLİM DALLARI VE HASTANE YÖNETİCİLİĞİ AÇISINDAN ÖNEMİ İstatistik yığın olayları, yani birbirine benzemeyen, bazı ortak özelliklere sahip olmakla birlikte genelde aralarında önemli farklılıklar da bulunan olayları, konu aldığı için bu tür olayları konu alan çeşitli alanlara uygulanabilmektedir. İstatistik, hangi amaçlar için, hangi verilerin toplanacağını, verilerin nasıl işleneceğini, çözümleme aşamasında amaca uygun olarak hangi teknik ya da tekniklerin kullanılacağını ve sonuçların nasıl yorumlanacağı konusunda araştırmacıya ışık tutmaktadır. Bu açıdan istatistik çeşitli bilim dallarındaki uygulamalı çalışmalarda yoğun bir biçimde kullanılmaktadır.

Günümüzde hastaneler hizmet üreten işletmeler olarak değerlendirilmektedir. Bu amaçla işletme faaliyetlerinde istatistiksel tekniklerden yoğun bir biçimde yararlanılmaktadır. Örneğin;

Hastane işletmesinin bütünü veya hastane bölümleri için faaliyetlerin planlanmasında,

Üretilen veya satın alınan mal ve hizmetlerin kalitesi, miktarı, finansal değerler gibi işletme yönetimi için önem taşıyan değerlerin belirlenmesinde,

Hasta memnuniyeti, çalışan personelin memnuniyeti veya tükenmişlik durumlarının tespiti,

Planlanan hedeflere ulaşılıp ulaşılmadığının ortaya konulması ve bunların nedenlerini belirlemek üzere başvurulan denetim işlemlerinde istatistikten yararlanılmaktadır.

Çalışma hayatında rasyonel hareket edebilmek için yöneticilerin yerel, ulusal ve uluslar arası istatistiklerden yararlanmaları kaçınılmaz olmaktadır. Ancak, bu anlamda yararlanılacak istatistiklerin tümünün hazır olarak bulunması mümkün gözükmemektedir. Bu durumda işletmelerin faaliyetleri için gerekli olan bazı istatistikleri kendi bünyesinde hazırlaması bir zorunluluktur. İşletmeler gerekli istatistikleri toplamanın yanında bunların değerlendirilmesi ve çözümlenmesi, ayrıca işletmeye özel istatistiksel araştırmaları yapmak üzere büyük ölçekli kuruluşlarda istatistik ve araştırma birimi kurulmaktadır.

5

TEMEL KAVRAMLAR Bu bölümde, istatistiğin öğrenilmesinde belirli bir temelin (alt yapının) oluşturulmasını sağlayacak bazı temel kavramlar açıklanacaktır. İstatistik öğrenilmek isteniyorsa öncelikle onun temel kavramları iyi bir biçimde öğrenilmelidir. Dolayısıyla istatistik öğreniminde temel kavramlar öğrenilmeden sayısal problemlere ve bunlardan elde edilen sonuçlara odaklanma bireyi yanılgıya düşürebilir.

Birim ve Türleri Araştırmanın amacına uygun olarak incelenen ve hakkında bilgi edinilmek istenen yığın olayların her birine “birim” adı verilir. Birimler canlı veya cansız varlıklar olabileceği gibi ortaya çıkan durumlar (fiili olaylar) da olabilir. Canlı varlıklara insan, hayvan, bitki, cansız varlıklara bina, otomobil, aile, banka, işletme gibi sosyal bir kuruluş, fiili olaylara ise doğum, ameliyat, trafik kazası örnek olarak verilebilir.

Birimler çeşitli açılardan sınıflandırılabilir. Bunlardan önemli görülen bazılarına aşağıda değinilecektir.

Birimler öncelikle belirli bir maddi varlığa sahip olup olmamasına göre “maddi birim” veya “maddi olmayan birim” biçiminde sınıflandırılmaktadır. Bu sınıflama biçiminde birimlerin boyutlarının olup olmaması dikkate alınır. Maddi birim, elle tutulur ve gözle görülür, yani uzunluk, genişlik ve yükseklik boyutlarına sahip olan birimlerdir. Maddi olmayan birim ise boyutları olmayan birimlerdir. Örneğin, insan, bitki, bina v.b. birimler maddi, doğum, ölüm, hastalık, bir ilaç denemesi gibi birimler maddi olmayan birimlerdir.

Birimleri incelendikleri zaman diliminde hazır oluş durumlarına göre de sınıflandırmak mümkündür. Ömür süreleri oldukça uzun olan, dolayısıyla herhangi bir anda incelenebilecek durumdaki birimler “devamlı birim”, çok kısa bir ömür süresine sahip, dolayısıyla ortaya çıktığı anda incelenebilecek birimler “ani birim” olarak sınıflandırılır. Genel olarak maddi birimler aynı zamanda devamlı birimler, maddi olmayan birimler ise ani birimler niteliğindedir.

Birimlerin sınıflandırılmasında “doğal birim” ve “doğal olmayan birim” biçiminde bir ayrım da yapılmaktadır. Doğal birim, parçalara ayrıldığında veya birleştirildiğinde birim olma özelliklerini yitiren birimlerdir. Örneğin, deneysel bir çalışmada denek olarak kullanılan bir farenin ikiye bölünmesi durumunda iki canlı fare oluşmaz. Benzer biçimde otomobil, bina doğal birime örnek olarak verilebilir. Doğal olmayan birim ise bir bütün olma niteliğinde olmayan, dolayısıyla parçalandığında ya da birleştirildiğinde birim olma niteliğini koruyan birimlerdir. Bu durumda birimlerin sadece büyüklükleri değişmektedir. Örneğin, deneysel bir çalışmada büyük hacimli bir sıvı daha küçük miktarlara ayrılarak denemede birim olarak kullanılabilir. Bir arazi parçası daha küçük parsellere ayrılarak tarımsal denemelerde birim olarak kullanılabilmektedir. Verilen iki örnekte de birimler aynı araştırma düzeninde parçalandıklarında veya birleştirildiklerinde birim olma niteliğini kaybetmezler.

Bir başka sınıflandırmada birimler “gerçek birim” ve “varsayımsal birim” biçiminde iki kategoriye ayrılabilir. Gerçekte somut olarak var olan birimler gerçek birim, buna karşılık fiili olarak var olmayan ancak kuramsal olarak var olacağı düşünülebilen birimler varsayımsal birim olarak nitelendirilirler. Gerçek birimlerin maddi bir varlığa sahip olması gerekliliği yoktur. Maddi olmayan birimler de gerçek birim olabilir. Ayrıca doğal veya doğal olmayan birimler de gerçek birimdir.

İstatistiğin konusu olan “birim” kavramını açıklayınız. Her olay istatistiğe konu olur mu?

Ana kütle (Popülâsyon) ve Örneklem

Üzerinde araştırma yapmak amacıyla hakkında bilgi elde edinilmek istenen ve belirli bir tanıma uyan, yani yığın olay niteliğindeki birimlerin tamamının oluşturduğu topluluğa “ana kütle” adı verilmektedir. Ana kütleyi oluşturan birimlerin aralarında farklılıklar olmakla birlikte biçimsel homojenlik açısından bazı ortak özellikleri bulunmalıdır. Ekonomik, zaman kısıtı, deneysel çalışmalarda birimlerin deforme

6

olması v.b. nedenlerden dolayı her araştırmada hedeflenen ana kütleyi oluşturan birimlerin tamamı incelenemez. Böyle durumlarda gözlemlemek üzere ana kütleden tesadüfî olarak seçilen birimlerden oluşan ve ana kütlenin doğal bir parçası olan alt kütleye “örneklem” adı verilir.

Ana kütle ve örneklem birimlerden oluştuğuna göre bu birimlerden ayrı bir yapıya sahip olmaması gerekir. Örneğin bir üniversitenin çeşitli bölümleri birim olarak tanımlandığında üniversite ana kütle olarak ifade edilemez. Sözü edilen bölümlerin oluşturduğu topluluk ana kütledir.

Ana kütle ve örneklemi oluşturan birimlerin zaman ve mekân bakımından sınırlandırılması zorunluluğu vardır. Araştırmanın amacına uygun olarak belirli bir tanıma uyan belirli bir mekândaki (hastane, şehir, bölge, ülke v.b.) birimler ile ilgilenildiğinde kütle mekân bakımından, benzer biçimde belirli bir zaman noktası veya zaman aralığındaki (gün, hafta, ay, yıl v.b.) birimler ile ilgilenildiğinde ise kütle zaman bakımından sınırlandırılmış olur. Örneğin, 2011 yılı Mart ayında Eskişehir’deki özel hastanelere başvuran hastaların oluşturduğu kütle zaman ve mekân bakımından sınırlandırılmıştır. Böylece hedeflenen kütle net olarak belirtilmiş olur.

Değişken ve Türleri İncelenen birimlerin sahip olduğu ve birimden birime farklı değerler alabilen, dolayısıyla birimlerin ayırt edilmesini sağlayan niteliklerine “değişken” adı verilir. Örneğin, insanlar için yaş, cinsiyet, öğrenim durumu, medeni durum, bir bina için inşaat türü, oda sayısı, kullanım alanı, bir hastane işletmesi için yatak sayısı, hizmet verdiği servisler, doktor sayısı v.b. değişken olarak sayılabilir.

Bir değişken kütleyi oluşturan birimlerde çeşitli biçimlerde ortaya çıkabilir. Belirli bir değişkenin birimlerde ortaya çıkış biçimine “düzey” adı verilir. Düzeyler araştırma için verileri (gözlem değerleri, ölçüm sonuçları) oluşturur. Bu anlamda değişken, birimler topluluğunu veriler topluluğuna dönüştüren bir işleve sahiptir. Değişkenler çeşitli açılardan sınıflandırılabilirler. Bu sınıflandırma biçimleri bir araştırmanın istatistiksel olarak tanımlanmasında ele alınacak değişkenlerin belirlenmesinde yararlı olmaktadır.

Sayısal ve Sayısal Olmayan Değişken Düzeyleri sayılarla ifade edilebilen ve matematiksel işlemlere elverişli olan değişkenlere sayısal (nicel) değişken adı verilir. Matematiksel işlemlere elverişlilik, incelenen değişkene ilişkin elde edilen veriler üzerinde aritmetik işlemlerin bir anlam ifade etmesidir. Örneğin yaş, boy uzunluğu, ağırlık, işletmenin geliri, yatan hastaların yatış süresi sayısal değişkenlerdir. Sayısal değişkenler ayrıca “sürekli sayısal değişken” ve kesikli sayısal değişken” olmak üzere iki gruba ayrılabilir. Sayısal bir değişkenin herhangi iki düzeyi arasına düşünsel olarak sonsuz sayıda yeni düzey ilave edilebiliyorsa sürekli, sınırlı sayıda yeni düzey ilave edilebiliyorsa kesikli sayısal değişken söz konusu olur. Örneğin ağırlık değişkeninin iki düzeyi arasına sonsuz sayıda yeni düzey getirilebilir, ancak ailedeki çocuk sayısı değişkeninin iki düzeyi arasına sınırlı sayıda düzey ilave edilebilir. Buna göre ağırlık sürekli, çocuk sayısı kesikli sayısal değişkendir.

Düzeyleri sözcüklerle ifade edilebilen ya da sayılarla ifade edilse bile matematiksel işlemlere elverişli olmayan değişkenler sayısal olmayan (nitel) değişken olarak adlandırılır. Cinsiyet, medeni durum, hastaların yattığı servis türü, hastanın mesleği değişkenleri sayısal olmayan değişkene örnek olarak verilebilir.

Bağımsız, Bağımlı ve Kontrol Edilecek Değişken Araştırmalarda ele alınan problemler genellikle çok değişkenli yapıdadır. Dolayısıyla bazı araştırmaların amacı değişkenler arasındaki nedensellik (sebep-sonuç) ilişkisini belirlemek olabilir. Değişkenler bu tür bir araştırmada üstlendikleri işlevlere göre bağımsız, bağımlı ve kontrol edilecek (etkisi arındırılacak) değişken olarak üç grupta toplanabilir. Bağımlı (açıklanan) değişken, bir araştırmada özellikle inceleme konusu olan ve başka değişken ya da değişkenler tarafından açıklanan değişkendir. Bağımsız (açıklayıcı) değişken ise bağımlı değişken üzerinde etkisi araştırılan değişkendir. Bir araştırmada bağımlı ve bağımsız değişkenler üzerinde etkili olabilecek bazı değişkenler bulunabilir. Bağımlı ve bağımsız değişkenler

7

arasındaki salt ilişkiyi ortaya koyabilmek bakımından bu tür değişkenlerin kontrol altına alınması ya da etkilerinin giderilmesi gerekebilir. Bu tür değişkenler kontrol edilecek (etkisi arındırılacak) değişken olarak ifade edilir.

Bir araştırmada herhangi bir değişkenin bağımsız, bağımlı ya da kontrol edilecek değişken işlevini üstlenmesi araştırmanın amacı ile ilgilidir. Başka bir anlatımla, bir değişken belirli bir araştırmada bağımsız değişken işlevi görürken başka bir araştırmada araştırmanın amacına uygun olarak bağımlı ya da kontrol edilecek değişken işlevini üstlenebilir.

Değişken nedir? Sayısal ve sayısal olmayan değişkeni açıklayınız, matematiksel işlemlere elverişliliğini değerlendiriniz.

Değişkenin Ölçülmesi ve Ölçekler Bir araştırmada ele alınan belirli bir değişkenin birimlerde ortaya çıkış biçimi olan düzeyler değişkenin ölçülmesiyle belirlenebilir. Ölçme, herhangi bir değişkene ilişkin gözlem sonuçlarının sayı ve simgelerle gösterilmesidir. Birimlerin ele alınan değişken ya da değişkenlerin hangi düzeyine karşılık olduklarının ölçme yoluyla belirlenmesi sonucu sayısal ve sayısal olmayan değerlere ulaşılır. Bilimsel araştırmalarda bu değerler veri (gözlem değeri) olarak isimlendirilir. Bu verilerden yararlanılarak kullanılacak çözümleme tekniklerinin belirlenmesinde değişkenlerin ölçme düzeyi olarak ifade edilebilecek ölçekler önemli rol oynarlar. İstatistiksel araştırmalarda değişkenlere ilişkin elde edilen verilerin matematiksel özelliklerine göre sınıflayıcı, sıralayıcı, aralıklı ve oranlı olmak üzere dört ölçek kullanılmaktadır. Bu ölçekler izleyen alt kesimlerde incelenecektir.

Sınıflayıcı Ölçek Sınıflayıcı ölçek, incelenen değişken bakımından birimlerin eşdeğer olup olmadıklarını ortaya koyan ölçme düzeyidir. Bu ölçekte incelenen değişken bakımından benzer birimlere diğer birimlerden ayırmak için aynı simge verilir. Bu simgeler sayılar olsa bile bunlar sadece birimlerin hangi sınıfa (kategoriye) ait olduklarını belirler. Örneğin bir hastaneye başvuranların meslek bakımından incelenmesiyle çeşitli meslek sınıflarına ayrılması ve her bir sınıfın da bir sayı veya simgeyle gösterilmesi durumunda sınıflayıcı ölçek söz konusu olur. Sınıflayıcı ölçekte gözlem sonuçlarıyla sadece birimlerin sınıflandırılması işlemi yapılabilir. Buna karşın sıralama ve aritmetik işlemler yapılamaz.

Sınıflayıcı ölçekle ölçülebilen değişkenlere ilişkin cinsiyet, medeni durum, hastanın yattığı servis, hastane türü v.b. örnek olarak verilebilir.

Sıralayıcı Ölçek Sıralayıcı ölçek ele alınan birimlerin incelenen değişken bakımından sınıflandırılması yanında önem sıralarını da belirleyen ölçektir. Bu ölçekte gözlem sonuçları sayı ile ifade edildiğinde bunlar sıra sayılarıdır. Örneğin bir yerleşim yerinde en çok tercih edilen hastaneye “1.”, ondan sonra tercih edilene “2.”, … sıra sayılarının verilmesiyle tercih sırasının oluşturulması durumunda sıralayıcı ölçek söz konusu olur. Burada sayıların sırasının bir anlamı olmakla birlikte, bunlar arasındaki farkın bir anlamı yoktur. Başka bir anlatımla sıralayıcı ölçekte gözlem sonuçlarıyla sınıflama ve sıralama işlemleri yapılabilirken aritmetik işlemler yapılamaz.

Sıralayıcı ölçekle ölçülebilen değişkenlere öğrenim düzeyi, ordu ve emniyet mensuplarının rütbeleri, başarı düzeyi örnek olarak verilebilir.

Aralıklı Ölçek Aralıklı ölçekte değişkenler için elde edilen gözlem değerleri sayılarla ifade edilirler ve bunlar arasındaki farklar bir anlam taşımaktadır. Ele alınan bir değişkenin aralıklı ölçekle ölçülebilmesi için bir ölçü biriminin tanımlanması gerekir. Ayrıca aralıklı ölçme düzeyinde gözlem değerleri için bir başlangıç noktasının belirlenmesi gerekir. Örneğin sıcaklık değişkenini incelediğimizde gözlem değerleri 150C, 200C, 300C gibi ölçü birimi ile birlikte ifade edilir. Ayrıca 00C değeri -17,780F değerine karşılık

8

gelmektedir. Burada farklı ölçü birimlerinde farklı değerler elde edilmektedir. Aralıklı ölçekte sıfır değeri bir anlam ifade eder, yani yokluk anlamına gelmez.

Aralıklı ölçekle ölçülebilen değişkenler için elde edilen gözlem sonuçlarıyla sınıflama, sıralama ve aritmetik işlemler yapılabilir. Ancak herhangi iki değer arasındaki farkın bir anlamı varken iki değer arasındaki kattan söz edilemez. Aralıklı ölçekle ölçülebilen değişkenlere takvim zamanı, başarı örnek olarak verilebilir.

Oranlı Ölçek Oranlı ölçekte aralıklı ölçeğin özellikleriyle birlikte sıfır değerinin bir başlangıç değeri olması söz konusudur. Buna bağlı olarak sıfır değeri yokluk anlamı ifade eder ve herhangi iki değer arasındaki katın (veya oranın) bir anlamı vardır. Bu ölçme düzeyinde ölçülebilen değişkenlere ilişkin elde edilen gözlem değerleriyle sınıflama, sıralama ve aritmetik işlemler yapılabilir. Örneğin ağırlık değişkeni için elde edilen değerler yardımıyla birimler 50 kg’dan az ve 50 kg ve daha fazla biçiminde sınıflandırılabilir. Ayrıca gözlem değerleri en küçük değerden en büyüğüne doğru sıralandığında birimler de ağırlık sırasına konmuş olur. Herhangi iki birime ilişkin ağırlık değerleri arasında 10 kg’lık bir fark olduğunu ve bir birimin diğerinin iki katı ağırlığa sahip olduğunu söyleyebiliriz.

Oranlı ölçekle ölçülebilecek değişkenlere örnek olarak boy uzunluğu, hastane işletmesinin geliri, yatan hasta sayısı, yatış süresi verilebilir.

Ölçekler arasında sınıflayıcıdan oranlıya doğru geçiş söz konusu değildir. Buna karşın oranlıdan başlayarak sınıflayıcı ölçeğe doğru geçiş yapılabilir, ancak bu durum bilgi kaybına neden olur.

Bir araştırmanın amacına uygun olarak ele alınan herhangi bir değişkenin hangi ölçme düzeyinde ölçülebileceğini belirleyebilmek için aşağıdaki sorulardan yararlanabiliriz.

a) Gözlem değerlerinin sırasının anlamı var mı?

b) Gözlem değerleri arasında farkın anlamı var mı?

c) Gözlem değerleri arasında katın anlamı var mı?

Ölçeklerin yukarıdaki sorulara verecekleri cevaplar dikkate alınarak aşağıdaki karar tablosu oluşturulabilir.

Tablo 1.1: Ölçek Türü Belirlemede Karar Tablosu

Ölçek Türü

Gözlem değerlerinin sırasının anlamı var mı?

Gözlem değerleri arasında farkın anlamı var mı?

Gözlem değerleri arasında katın anlamı var mı?

Sınıflayıcı Hayır Hayır Hayır

Sıralayıcı Evet Hayır Hayır

Aralıklı Evet Evet Hayır

Oranlı Evet Evet Evet

Verilerin elde edilmesinde kullanılan ölçeklerin önemi, istatistiksel çözümlemede kullanılacak teknik

seçiminde ortaya çıkmaktadır. Sayısal değişkenler oranlı ve aralıklı ölçme düzeyinde, buna karşın sayısal olmayan değişkenler ise sıralayıcı ve sınıflayıcı ölçekle ölçülebilmektedir. Dolayısıyla sınıflayıcı ve sıralayıcı ölçekle elde edilen veriler “parametrik olmayan”, aralıklı ve oranlı ölçekle elde edilen veriler hem “parametrik” hem de “parametrik olmayan” tekniklerden yararlanılarak çözümlenebilir. Ancak parametrik olmayan tekniklerin kullanımı bilgi kaybına neden olabilir. Özet olarak, sayılarla ifade edilen her veri her türlü istatistiksel işlem ve çözümlemeye elverişli değildir. Bu nedenle, incelenen değişkene ilişkin elde edilen verilerin hangi ölçekle ölçülmüş oldukları bilinmeli ve yeri geldiğinde hatırlanmalıdır.

9

Ölçek türlerini kısaca açıklayınız. Çözümleme tekniğinin seçimi açısından önemini açıklayınız.

Likert Ölçeği

Sosyal bilimlerde bireylerin duyguları, düşünceleri, tutumları, beğeni düzeyleri, kaygıları ile ilgili veriler anket yoluyla toplanmaktadır. Buna bağlı olarak elde edilen veriler genellikle sınıflayıcı ve sıralayıcı ölçme düzeyinde olmaktadır. Likert ölçeği, insanların belirli bir konudaki tavırlarını ölçmek amacıyla geliştirilmiş bir yaklaşımdır. Likert ölçeğinin oluşturulmasında yanıtlayıcılara belirli bir konuya ilişkin çeşitli ifadeler (maddeler) sunulur ve bunlara karşı tavırlarını ifade eden seçeneği işaretlemeleri istenir. Örneğin, hasta memnuniyetinin belirlenmesine ilişkin bir araştırmada “hemşirelik hizmetleri yeterlidir”, “hastanenin genel temizliği iyidir”, “doktorum hastalığım konusunda doğruları söyler” biçimindeki ifadeler için yanıtlayıcının ifadelere katılma derecesi genellikle 5’li ölçekle “kesinlikle katılmıyorum” ile “kesinlikle katılıyorum” arasında seçenekleri işaretlemesi biçiminde belirlenir. Yanıtlayıcının bu biçimdeki çok sayıda soruya verdikleri cevaplardan hareketle toplam skoru hesaplanabilir. Ancak soruların oluşturulmasında farklı tavırları ortaya çıkarmada geçerli ve güvenilir olduklarının belirlenmesi gerekir. Bu amaçla çeşitli yaklaşımlardan yararlanılmaktadır.

Örneğin; Bir hastane yöneticisi hastaneden hizmet alan kişilerin hizmetlere göre memnuniyetlerini belirlemek istemektedir. Bu amaçla Likert ölçeği ile hazırlanan tutum ifadeleri Tablo 1.1’de örnek olarak verilmiştir.

Tablo 1.1: Hastane Memnuniyetinin Belirlenmesi Amacıyla Likert Ölçeği Örneği

10

Özet

İstatistik kelimesi değişik anlamlarda kullanılmaktadır. Belirli amaçlar için kişi ve kuruluşlar tarafından toplanan verileri belirtmek için istatistikler kelimesi kullanılmaktadır. İkinci anlamda istatistik, yöntembilimi açısından verilerin elde edilmesi, düzenlenmesi, belirli değerlerle özetlenmesi ve çözümlenmesi işlemlerinin gerçekleştirildiği teknikler bütününü ifade eder. Üçüncü anlamda istatistik, ana kütleolarak adlandırılan kütleye ilişkin parametreleri tahmin etmek amacıyla örneklemden hesaplanan özetleyici bilgileri ifade eder.

İstatistik yığın olayları ve bunların oluşturduğu kütleleri inceler. İstatistik, yığın olayları incelemek suretiyle verilerin elde edilmesini, düzenlenmesini, özetlenmesini, çeşitli tekniklerle çözümlenmesini ve elde edilen sonuçların yarara sunulmasını mümkün kılan teknikler bütünüdür.

Hakkında bilgi edinilmek istenen birimlerin tamamının oluşturduğu topluluk ana kütle, bu ana kütleden çekilen ve ana kütleyi araştırmanın amacına uygun olarak temsil eden alt kütleyeörneklem adı verilir.

İstatistiğin betimleme ve çıkarsama olmak üzere en genel olarak iki işlevi vardır. Betimsel istatistik, elde edilen verilerin sayısal ve grafiksel yaklaşımlarla özetler ve sunar. Çıkarsamalı istatistik, bir ana kütleden tesadüfî olarak seçilen örneklem yardımıyla ana kütle parametrelerine ilişkin kestirim, hipotez testleri ve gelecek dönemlere ilişkin öngörüler yapar.

Hakkında bilgi edinilmek istenen birimlerin sahip olduğu ve birimden birime farklı değerler alabilen niteliklere değişken adı verilir. Değişkenler çeşitli açılardan sınıflandırılırlar. Değişkenler sayılarla ifade edildiklerinde ve sayıların aritmetik işlemlere elverişli olmaları durumunda sayısal değişken, sayılarla ifade edilemediği durumda ise sayısal olmayan değişken olarak ifade edilirler. Sayısal değişkenler ayrıca sürekli ve kesikli olmak üzere iki sınıfta toplanır. Değişkenler ayrıca bir araştırmada üstlendikleri işlevler açısından bağımlı, bağımsız ve kontrol edilecek değişken biçiminde üç sınıfa ayrılır.

Değişkenlerin birimlerdeki ortaya çıkış biçimine düzey adı verilir. Düzeyler verileri oluştururlar.Değişkenlerin ölçülmesinde istatistikte ölçek olarak adlandırılan dört ölçme düzeyinden yararlanılır. Bunlar sınıflayıcı, sıralayıcı, aralıklı ve oranlı ölçektir.

Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesi önemlidir. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir.

11

Kendimizi Sınayalım 1. Aşağıdaki değişkenlerden hangisi nicel değişkendir?

a. Cinsiyet

b. Yaş

c. Öğrenim durumu

d. Meslek

e. Medeni durum

2. Değişkenlerin ortaya çıkış biçimine ne ad verilir?

a. Birim

b. Kütle

c. Düzey

d. Örneklem

e. Ölçek

3. Aşağıdakilerden hangisi birim olarak kullanılmaz?

a. Bina

b. Öğrenci

c. Hastane

d. Renk

e. Trafik kazası

4. Araştırma amacına uygun olarak hakkında bilgi edinilmek istenen birimlerin tamamının oluşturduğu kütle hangisidir?

a. Ana kütle

b. Grup

c. Yığın

d. Örneklem

e. Üniversite

5. Aşağıdaki değişkenlerden hangisi aralıklı ölçekle ölçülebilir?

a. Hastalık türü

b. Sıcaklık

c. Ağırlık

d. Göz rengi

e. Gelir

6. Aşağıdakilerden hangisi ani birim değildir?

a. Doğum

b. Grev

c. Ölüm

d. Ameliyat

e. Doktor

7. Aralıklı ölçekle elde edilen verilerle hangi işlem sonucu anlamlı olmaz?

a. Sınıflama

b. Sıralama

c. Toplama

d. İki değer arası fark

e. İki değer arası oran

8. Aşağıdaki ifadelerden hangisi doğrudur?

a. İstatistik yığın olayları inceler

b. Aralıklı ölçekte sıfır değeri yokluk ifade eder

c. Doğal birimler parçalandığında birim olma özelliğini yitirmez

d. Bağımsız değişken açıklanan değişkendir

e. Tipik olaylar istatistiğin konusudur

9. Ölçekler ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

a. Sınıflayıcı ölçekle elde edilen verilerle sı-ralama yapılabilir

b. Sıralayıcı ölçekle elde edilen verilerle sıralama yapılabilir

c. Aralıklı ölçekle elde edilen verilerle sıralama yapılabilir

d. Oranlı ölçekle elde edilen verilerle sıralama yapılabilir

e. Aralıklı ve oranlı ölçekle elde edilen verilerle sınıflama yapılabilir

10. Aşağıdakilerden hangisi kesikli sayısal değişken değildir?

a. Hastanenin yatak kapasitesi

b. Yatan hasta sayısı

c. Çocuk sayısı

d. Doğum ağırlığı

e. Doktor sayısı

12

Kendimizi Sınayalım Yanıt Anahtarı

1. b Yanıtınız yanlış ise “Değişken ve Türleri” başlıklı konuyu yeniden gözden geçiriniz.

2. c Yanıtınız yanlış ise “Değişken ve Türleri” başlıklı konuyu yeniden gözden geçiriniz.

3. d Yanıtınız yanlış ise “Birim ve Türleri” başlıklı konuyu yeniden gözden geçiriniz.

4. a Yanıtınız yanlış ise “Ana kütle ve Örneklem” başlıklı konuyu yeniden gözden geçiriniz.

5. b Yanıtınız yanlış ise “Değişken ve Türleri ile Değişkenin Ölçülmesi ve Ölçekler” başlıklı konuyu yeniden gözden geçiriniz.

6. e Yanıtınız yanlış ise “Birim ve Türleri” başlıklı konuyu yeniden gözden geçiriniz.

7. e Yanıtınız yanlış ise “Değişkenin Ölçülmesi ve Ölçekler” başlıklı konuyu yeniden gözden geçiriniz.

8. a Yanıtınız yanlış ise “Temel Kavramlar” başlıklı konuyu yeniden gözden geçiriniz.

9. a Yanıtınız yanlış ise “Değişkenin Ölçülmesi ve Ölçekler” başlıklı konuyu yeniden gözden geçiriniz.

10. d Yanıtınız yanlış ise “Değişken ve Türleri” başlıklı konuyu yeniden gözden geçiriniz.

Sıra Sizde Yanıt Anahtarı

Sıra Sizde 1 İstatistik, belirli bir amaca yönelik veri elde etme (derleme), elde edilen verileri işleme, özetleme, çözümleme ve elde edilen sonuçları yorumlama işlemlerinin gerçekleştirildiği teknikler bilimidir. İstatistiğin betimleme ve çıkarsama olmak üzere en genel olarak iki işlevi vardır. Betimsel istatistik, elde edilen verilerin sayısal ve grafiksel yaklaşımlarla özetler ve sunar. Çıkarsamalı istatistik, bir ana kütleden tesadüfi olarak seçilen örneklem yardımıyla ana kütle parametrelerine ilişkin kestirim, hipotez testleri ve gelecek dönemlere ilişkin öngörüler yapar.

Sıra Sizde 2 Araştırmanın amacına uygun olarak incelenen ve hakkında bilgi edinilmek istenen yığın olayların her birine “birim” adı verilir. Ancak birimlerin

istatistiğin konusu olabilmesi için “yığın (yığın) olay” niteliğinde olması gerekir. Dolayısıyla istatistik her olayla ilgilenmez.

Sıra Sizde 3 İncelenen birimlerin sahip olduğu ve birimden birime farklı değerler alabilen, dolayısıyla birimlerin ayırt edilmesini sağlayan niteliklerine “değişken” adı verilir. Düzeyleri sayılarla ifade edilebilen ve matematiksel işlemlere elverişli olan değişkenlere sayısal (nicel) değişken adı verilir. Düzeyleri sözcüklerle ifade edilebilen ya da sayılarla ifade edilse bile matematiksel işlemlere elverişli olmayan değişkenler sayısal olmayan (nitel) değişken olarak adlandırılır.

Sıra Sizde 4 Sınıflayıcı ölçek, incelenen değişken bakımından birimlerin eşdeğer olup olmadıklarını ortaya koyan ölçme düzeyidir. Sıralayıcı ölçek ele alınan birimlerin incelenen değişken bakımından sınıflandırılması yanında önem sıralarını da belirleyen ölçektir. Bu ölçekte gözlem sonuçları sayı ile ifade edildiğinde bunlar sıra sayılarıdır. Aralıklı ölçekte değişkenler için elde edilen gözlem değerleri sayılarla ifade edilirler ve bunlar arasındaki farklar bir anlam taşımaktadır. Ele alınan bir değişkenin aralıklı ölçekle ölçülebilmesi için bir ölçü biriminin tanımlanması gerekir. Oranlı ölçekte aralıklı ölçeğin özellikleriyle birlikte sıfır değerinin bir başlangıç değeri olması söz konusudur. Buna bağlı olarak sıfır değeri yokluk anlamı ifade eder ve herhangi iki değer arasındaki katın (veya oranın) bir anlamı vardır. Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesi önemlidir. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir.

13

Yararlanılan Kaynaklar

Çömlekçi, N. (1998). Temel İstatistik İlke ve Teknikleri. İstanbul: Bilim Teknik Yayınevi.

Çömlekçi, N. (1998). Bilimsel Araştırma Yöntemi ve İstatistiksel Anlamlılık Sınamaları. İstanbul: Bilim Teknik Yayınevi.

Gürsakal, N. (2007). Betimsel İstatistik, İstanbul: Nobel Yayın Dağıtım.

Serper, Ö (2004). Uygulamalı İstatistik 1, Bursa: Ezgi Kitabevi.

14


İstatistiksel bir araştırmada verilerin nasıl derleneceğini açıklayabilecek,

Derleme türlerini ifade edebilecek,

Veri toplama tekniklerini sıralayabilecek,

Verileri tablo ve grafiklerle gösterebilecek,


Anahtar Kavramlar

Veri

Derleme

Derleme Türleri

Veri Toplama Teknikleri

Gözlem

Anket

Tablo

Grafik

Histogram

İçindekiler

Giriş

Veri ve Derleme

Derleme Türleri

Verinin Özellikleri

Veri Toplama Teknikleri

Tablolar

Grafikler

2

15

GİRİŞModern yaşamda karşılaşılan birçok sorunun çözümü için istatistiksel veriye ve istatistiksel çözümleme tekniklerine gereksinim vardır. İstatistiksel teknikleri öğrenmek kolaydır, zor olan doğru ve veri için uygun tekniğin doğru yerde kullanımıdır. Bu nedenle, yeni bilgilerin verilerin özenle derlenmesi, analiz edilmesi ve yorumlanmasıyla elde edilebileceğini dikkate alarak, maksimum bilginin mümkün olan en düşük maliyette sağlanabilmesi için verilerin derlenmesiyle ilgili kullanılacak tekniklerin seçiminde özenli davranılması gerekir. İstatistiksel bir araştırma; araştırma probleminin tanımlanması, verilerin derlenmesi, derlenen verilerin işlenmesi ve düzenlenmesi, verilerin belirli kurallar çerçevesindegösterilmesi, analiz ve sonuçların yorumlanması aşamalarından oluşur. Araştırmanın en önemli basamaklarından biri olan veri derleme aşamasında hata yapıldığında, bundan sonraki tüm aşamalar zincirleme olarak bu hatalı durumdan etkileneceğinden, doğru ve güvenilir veri uygun veri derleme tekniği kullanılarak derlenmelidir.

Sağlık kurumları yöneticileri, kurumlarının geçmiş ve bugünkü hizmet göstergelerini anlayarakkurumlarına ilişkin etkin planlamalar yapabilmesi için, öncelikle güvenilir verilere ve bu verileri değerlendirebilmek için de istatistiksel tekniklere ihtiyacı vardır. Sağlık kurumları yöneticileri açısından doğru verilerin derlenmesi, hizmetleri etkin ve uygun biçimde planlanarak doğru kararlar alınabilmesi için çok önemlidir.

Bu ünitede verinin tanımı, veri derleme, verilerin sahip olması gereken özellikler, veri toplama teknikleri ve verilerin gösterimi konuları işlenecektir.

VERİ VE DERLEMEBir problemi çözmek, bir olayı aydınlatmak ya da belli bir konuda planlama yapmak amacıyla; istatistik birimlerinin ilgilenilen değişken ya da değişkenler dikkate alınarak yapılan gözlem, ölçme ve sayma yoluyla elde edilen özelliklerine veri denmektedir. Veriler sayısal, sözel, simge ya da herhangi bir şekil ile gösterilebilir. Veriler, belirli bir amaca göre bir araya getirilip düzenlendikten sonra istatistiksel tekniklerle analiz edilmesi sonucu bilgiye dönüşür. Bilgi, çok sayıda rakam topluluğundan oluşan verinin istatistiksel teknikler kullanılarak daha az sayıda rakamla özetlenmesinden oluşur. Herhangi bir hastanede muayene olan hastaların aldıkları hizmetlerden memnuniyet düzeyleri; “memnun değilim, orta ve memnunum” cevapları veri, verilerin analizi sonucunda hastaların % 70’ inin memnun olduğu bulgusu ise bilgi olarak değerlendirilir. Bu örnekten de anlaşılabileceği gibi karar alma sürecinde bilgi, veriden daha değerlidir. Bu nedenle verinin bilgiye dönüştürülerek karar alıcıya sunulması gerekir. Budönüştürme işlemi de ancak istatistiksel tekniklerin kullanımıyla olabilir.

Sağlık yöneticileri için veri kaynakları ölümler, doğumlar, hastalıklar ve sağlık hizmetleri konusunda sürekli olarak tutulan kayıtlar veya deneylerle saptanan veriler olabilir. İstatistikte toplanan ilk veriler ham veri olarak tanımlanır. Ham veriler üzerinde herhangi bir düzenleme ve işlem yapılmamış verilerdir.

Veri derleme, derlenen verilerin düzenlenmesi ve sunulması bir araştırmanın ilk basamaklarını oluşturmaktadır. Veri derleme; belirlenen amaçlar doğrultusunda gözlenecek birimlerin ölçülmesi ya

Verilerin Derlenmesi,İşlenmesi ve Grafiklerle

Gösterimi

16

da sayılması, sonra da bunların, ilgilenilen değişkenlere göre, hangi düzeylere sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içermektedir.

Derlemenin yapılabilmesi için derlemeye ilişkin konu ve gözlenecek birimlerin açık bir şekilde tanımlanması gerekir. Bir kütleyi oluşturan öğelere birim adı verilmektedir. Bir olayın birim olabilmesi için ölçülmeye ve sayılmaya uygun olması gerekir. Örneğin insan, evlilik, intihar, bekleme süresi, kırmızı ışık ihlali, hastane, hastalık gibi canlı ve cansız varlıklar ölçülmeye ve sayılmaya elverişleri olan istatistik birimleridir. Sayılmaya ve ölçülmeye uygun olmayan, kâbuslar, sevinçler ve rüyalar gibi olaylar istatistik açısından birim olamazlar. Gözlem birimlerinden meydana gelen kütlenin, zaman ve mekânın kesin olarak sınırlandırılmış olması gerekir. Araştırma nerede, ne zaman, kimlerle, ne kadar sürede tamamlanacağı ve ölçmenin nasıl yapılacağı bilinmelidir. Hastanede belli bir ameliyatı olmuş hastalar, bir hastalıktan dolayı yatan hastalar ya da meydana gelen bebek ölümlerine ilişkin derleme yapılacağı zaman kimlerin gözleneceği açıklanmış olmakla birlikte, ne zaman ve nerede gözleneceklerine dair sorular cevapsız kalmaktadır. Bu örnekteki belirsizliklerin giderilmesi için ana kütle zaman ve mekân bakımından tanımlanmalı ve sınırlandırılmalıdır.

Verileri derlemeye başlamadan önce ana kütleyi zaman ve mekân bakımından sınırlandırarak tanımlayınız. Derleme Türleri Derlemeleri farklı kriterlere göre sınıflandırmak mümkündür. Derlemenin ilk sınıflandırılması verilerin elde ediliş biçimine göre doğrudan(dolaysız) ve dolaylı derlemedir. Araştırılması söz konusu olan ana kütle birimleri doğrudan gözlenip kayıt altına alınıyorsa doğrudan derleme, ilgilenilen ana kütle birimlerinin gözlenmesi yerine farklı bir ana kütlenin birimleri gözlenerek asıl ana kütle hakkında veri derlenmesi ise dolaylı derleme türü olarak tanımlanır. Nüfusun miktarı ve çeşitli niteliklere göre dağılımı belirlenmek istendiğinde doğrudan nüfusu oluşturan bireyler gözlemlendiğinden derleme doğrudandır. Buna karşılık, bir ülkede nüfusun miktarını bulmak için bu ülkedeki konutların sayısı belirlenebilir ki, bu dolaylı derlemedir. Böyle bir durumda asıl hakkında bilgi edinilmek istenen kütleye varabilmek için tahmin yapmak gerekir. Bu örnek için ülke nüfusu, konut sayısının bir konutta yaşayan ortalama kişi sayısı tahminiyle çarpılarak belirlenir. Dolaylı derleme ile elde edilen verilerin güvenirliği doğrudan derlemeye göre daha az olacağından uygulamalarda dolaylı derleme türü tercih edilmemektedir.

Derleme genel ve kısmi olarak da sınıflandırılabilir. Bu sınıflandırma istatistiksel açıdan oldukça önemlidir. Ana kütleyi oluşturan birimlerin tamamının gözlenmesi genel derleme olarak tanımlanmaktadır. Nüfus sayımları genel derlemeye ilişkin en belirgin örnektir. Bazı durumlarda üzerinde araştırma yapılan ana kütlenin tamamının gözlenmesi maliyet, zaman ve işgücü açısından imkansızdır. Bu gibi durumlarda ana kütleyi oluşturan birimlerin tamamının gözlenmesi yerine olası gözlem birimlerinin bir bölümü seçilerek incelenir. Bu derleme türü kısmi derleme olarak tanımlanır. Genel derlemede ana kütleyi oluşturan bütün birimler-denekler gözlenirken kısmi derlemede ana kütle içinden tesadüfi bir örneklem seçilerek gözlem yapılır. Bundan dolayı genel derleme “tamsayım”, kısmi derleme ise “örnekleme” olarak da tanımlanmaktır. Doğu Anadolu Bölgesindeki yetişkinlerin beslenme alışkanlıklarının belirlenmesi için yürütülen bir araştırmada, söz konusu bölgedeki yetişkin bireylerin tamamı gözlendiğinde genel derleme, ancak bu bölgeden tesadüfî olarak seçilen 1000 kişinin gözlenmesi ise kısmi derlemeye örnektir.

Derleme, derlemenin zamanına göre ani ya da devamlı olarak da sınıflandırılabilmektedir. Kütleyi oluşturan gözlem birimlerinin belli bir zaman aralığındaki durumlarının belirlenmesi için yapılan derleme ani derlemedir. Ani derlemede kütleyi oluşturan birimler devamlı birimlerdir. Bu birimler, tanımlanan bir zaman aralığında toplu halde var olan ve gözlenen birimlerdir. Nüfus, hastane, tarım ve sanayi işyeri sayımları ani derlemeye örnektir. Araştırılması söz konusu olayın gözlenmesi olay gerçekleştiği anda oluyorsa bu derleme devamlı derlemedir. Bu olaylar belli bir zaman aralığı boyunca meydana geldikçe kayıt altına alınmaktadırlar. Devamlı derlemede kütle ani birimlerden oluşmaktadır. Bu birimlerin belli bir zaman aralığında gözlenmeleri ve kaydedilmeleri gerekmektedir. Doğum, ölüm,

17

intihar, bir acil servise gelen hastaların yaralanma türü, evlenme ve bir hastanenin hasta hakları birimine gelen şikâyetler devamlı derlemeye örnek olarak gösterilebilir.

Genel ve kısmi derleme kavramlarını örneklendirerek açıklayınız. Verinin Özellikleri Derlenen verilerden anlamlı sonuçlar çıkarabilmek için verinin taşıması gereken bazı özellikler vardır. Bu özellikler verinin yararlılık derecesinin belirlenmesini sağlamaktadır. Öncelikle bir veri doğru olmalı ve var olan durumu objektif bir biçimde yansıtmalıdır. Doğruluk, en basit tanımıyla gözlenen veya ölçülen bir olgunun gerçeği en yakın biçimde yansıtmasıdır. Bir hastanede yürütülen hasta memnuniyeti çalışmasında söz konusu hastanenin hizmetlerinden hiç faydalanmamış bir kişiye anket uygulayarak elde edilen verinin doğruluğu tartışmalıdır. “Hastane Afet Planı” na ilişkin eğitim almamış ve hiç tatbikata katılmamış yönetici hemşirelerin, deprem afet planları konusundaki görüşlerinden oluşan veriler var olan durumu objektif olarak yansıtmadığından doğru veri değildir.

Verilerin taşıması gereken diğer bir özellik ise güvenilir olmasıdır. Güvenirlik aynı şeyin tekrarlamalı ölçme sonuçlarının birbirine yakın değerler almasıdır. Doğru veri aynı zamanda güvenilir veri olma özelliğini de taşımaktadır. Güvenilir bir verinin ise aynı zamanda doğru bir veri olduğu söylenemez.

Bir veri güncel olmalıdır. Bir araştırmada derlenen veriler o zamana kadar olan durumu belirleyerek, geleceğe ilişkin tahminlerde bulunmak ve planlama yapmak için kullanılır. Verilerin gereksinimleri karşılayabilmesi ve onlardan yararlanılabilmesi için zamanında elde edilerek kullanıma sunulması gereklidir. Bir afet bölgesinde, risk gruplarının temel sağlık ihtiyaçlarına ilişkin verilerin afet durumu ortadan kalktıktan sonra ya da derleme işleminin çok uzun sürmesi durumunda veriler güncel olma özelliğini taşımayacaktır.

Verinin taşıması gereken son özellik maliyettir. Verinin faydası derlenmesi için yapılan harcamadan daha yüksek olmalıdır.

Verinin taşıması gereken dört özelliği açıklayınız. Veri Derleme Teknikleri Araştırma sorununun çözümlenebilmesi için gerekli olan veri farklı kaynaklardan sağlanabilir. İstatistik yayınları, dergiler, raporlar ve arşivler hazır veri kaynaklarıdır. Bir istatistiksel araştırmada hazır veri; iç veya dış kaynaklardan sağlanabilir. Örneğin bir hastanenin acil servisine gelen hastaların şikayet nedenlerini araştırmak isteyen bir yönetici gereksinim duyduğu verileri hastanenin kayıtlarından sağlayabilir, böyle bir araştırmada iç veri kaynağı kullanmış olacaktır. Çeşitli illerdeki özel hastanelerin yoğun bakım ünitelerinin kapasiteleri hakkında araştırma yapan yöneticinin yararlanacağı veriler, Sağlık Bakanlığı Sağlık İstatistikleri Yıllığından veya TSİM’ den (Temel Sağlık İstatistikleri Müdürlüğü) elde edilebilir. Bu yolla elde edilen veriler dış veri niteliğindedir.

Sağlık alanında veri toplama teknikleri; sistematik veri toplama teknikleri ve özel veri toplama teknikleri olmak üzere iki başlık altında ele alınmaktadır. Sistematik veri derleme, istatistik birimlerinin çeşitli niteliklerine ait bilgilerin ortaya çıktığı yer ve zamanda belgelenerek kayıt altına alınmasıyla yapılır. Özel amaca yönelik verilerin toplanması için başvurulan teknikler ise özel veri toplama teknikleri olarak adlandırılır.

Sistematik Veri Toplama Teknikleri Sağlık alanında kullanılan sistematik veri kaynakları, kayıtlar, sayımlar ve özel bildirimlerdir. Sistematik veri toplama tekniğinde hazır veri kaynaklarından faydalanılır.

18

Sağlık kayıtları; hasta ya da sağlıklı tüm bireylerin sağlık ve hastalıkla ilgili bilgileri ile sağlık yönetimiyle ilgili bilgilerin yazıldığı defter, kart, dosya, form ya da formlar topluluğudur. Doğum, ölüm ve hastalık kayıtları sağlık hizmetlerinin planlanmasında kullanılan en önemli veri kaynaklardır.

Belirli zaman aralıklarında yapılan sayımlarla bölge ya da ülke hakkında bazı veriler derlenir. Genel nüfus sayımı en önemli veri derleme tekniğidir. Nüfus sayımı; bir ülkede veya herhangi bir toplumda belirli bir zaman kesitinde yaşayanların sayısını, niteliklerini saptamak amacıyla yapılan sayımlardır.

Özel bildirimler; sağlık kurum ve kuruluşları ile sağlık personelinin bazı sağlık olaylarını (doğum, anne ölümleri, ölümler, bulaşıcı hastalıklar vb.) gözledikleri anda belirli süre içinde sağlık otoritelerine bildirmeyle elde edilen verilerdir. Bazı sağlık olayları sağlık bakanlığınca, bildirimi zorunlu olaylar ya da hastalıklar olarak tanımlanmıştır. Bu sağlık olayları gözlendiği an ya da her ayın sonunda ilgili birimlere bildirilmesi zorunludur.

Sağlık Bakanlığı Sağlıkta Dönüşüm Programı kapsamında Bilgi İşlem Daire Başkanlığı sorumluluğunda yürütülen çalışmalarla, sağlık verilerinin ve temel süreçlerin standart hâle getirilmesi üzerinde yoğunlaşmaktadır. Sağlık alanından toplanan veriler, il sağlık müdürlükleri aracılığıyla elektronik ortamda sağlık bakanlığı veri sistemine aktarılmaktadır. Bakanlık sağlık hizmetlerini planlama, yürütme, değerlendirme ve denetim işlevlerinde bu verileri ölçü olarak kullanmaktadır. Sağlık bakanlığı; Sağlık-NET ile sağlık kurumlarında üretilen her türlü veriyi, doğrudan üretildikleri yerden, standartlara uygun şekilde toplamayı, toplanan verilerden tüm paydaşlar için uygun bilgiler üreterek sağlık hizmetlerinde verim ve kaliteyi artırmayı hedefleyen, entegre, güvenli, hızlı ve genişleyebilen bir bilgi ve iletişim platformu kurmayı amaçlamaktadır.

http://www.sagliknet.saglik.gov.tr/

Sağlık Bakanlığı Tedavi Hizmetleri Genel Müdürlüğü tarafından “Çekirdek Kaynak Yönetim Sistemi” ile toplanan veriler hazır veri kaynakları için önemli örneklerden biridir. Sağlık Bakanlığı “Çekirdek Kaynak Yönetim Sistemi” ile standart olarak geliştirilmiş formlara uygun olarak kayıtlar yapılmaktadır. İlgili birimlerin sağlıkla ilgili verileri kayıt altına alması sağlık bilgi kaynağını oluşturmaktadır.

TC. Sağlık Bakanlığı Tedavi Hizmetleri Genel Müdürlüğü: http://www.tedavi.saglik.gov.tr/

Sağlık Bakanlığının sahadan toplayacağı minimum içeriğe sahip veri grupları Minimum Veri Setleri (MVS) olarak adlandırılmaktadır. MVS ile şimdiye kadar kâğıt ortamda toplanan veriler, gelişen haberleşme ve bilişim teknolojisi altyapısını kullanarak daha hızlı ve doğru bir şekilde doğrudan verinin üretildiği bilgi sisteminden elektronik ortamda Sağlık Bakanlığına iletilebilmektedir. Sağlık Kurumları, veri setleri içerisinde yer alan veri elemanlarını kullandıkları bilgi sistemleri aracılığıyla veya Sağlık-NET portalı üzerindeki veri seti bildirim ekranları aracılığıyla Sağlık Bakanlığına iletilmektedir. Minimum Sağlık Veri Setleri (MSVS) ile başlangıçta büyük ölçüde sağlık verisi toplama amacıyla geliştirilen veri setlerine, idari ve mali veri setlerinin de eklenmesiyle daha kapsamlı bir yapı ortaya çıkartılması planlanmaktadır. Sağlık bakanlığı bünyesinde İdari Veri Setleri ve Mali Veri Setleri çalışmaları önümüzdeki dönemde yerine getirileceğe öngörülmektedir. İdari Veri Setleri, sağlık kurumlarının altyapı ve idari bilgilerini toplamayı hedeflerken; Mali Veri Setleri ise sağlık kurumlarının maliyet bilgilerini toplamayı hedeflemektedir. MSVS veri seti içerikleri Şekil 2.1’ de gösterilmiştir.

19

Şekil 2.1: Sağlık Bakanlığı Minimum Sağlık Veri Setleri

Sağlık-NET bünyesinde Aralık 2011 tarihine kadar hazırlanmış olan Minimum Sağlık Veri Seti adedi 46 tanedir. Bu veri setlerinin listesine ve içeriklerine Ulusal Sağlık Veri Sözlüğü Web Browser üzerinden ulaşılabilmektedir. Veri setlerini ana gruplar halinde ifade etmek gerekirse 10 farklı veri seti grubundan bahsetmek mümkündür;

Kayıt Veri Setleri

Doğum-Ölüm Veri Setleri

Bebek-Çocuk Veri Setleri

Kadın Sağlığı Veri Setleri

Bulaşıcı Hastalık Veri Setleri

Muayene Grubu Veri Setleri

Yatan Hasta Veri Setleri

Kronik Hastalık Veri Setleri

Organ ve Kök Hücre Nakil Veri Setleri

Akıl ve Ruh Sağlığı Veri Setleri

Sağlık Bakanlığının veri şeması Temel Sağlık İstatistikleri Müdürlüğü (TSİM), İnsan Kaynakları Yönetimi Sistemi (İKYS), Sağlık Kuruluşları Yönetim Sistemi (SKYS), Malzeme Kaynakları Yönetim Sistemi (MKYS) ve Çekirdek Kaynak Yönetim Sisteminden (ÇKYS) meydana gelmektedir. Veri şeması Şekil 2.2’de verilmiştir.

Şekil 2.2: Sağlık Bakanlığı veri tabanı şeması

http://www.sagliknet.saglik.gov.tr/portal_pages/notlogin/saglikcilar/saglikcilar_standart_msvs_icerikleri.htm

20

Sağlık Bakanlığı veri akış şeması ise Şekil 2.3’ te ayrıntılı olarak verilmiştir.

Şekil 2.3 Sağlık Bakanlığı veri akış şeması

http://www.istatistik.saglik.gov.tr Özel Veri Toplama Teknikleri Veri kaynakları çok çeşitli olmakla birlikte her zaman yeterli olmayabilir. Bazen gerekli olan veri, iç ve dış veri kaynaklarından elde edilemeyebilir. Bu gibi durumlarda yeni veri derlemek zorunlu hale gelir. İstatistiksel bir araştırmada, yeni veri derlemesine karar verildiğinde, öncelikle uygun veri derleme tekniğinin seçilmesi gerekir. Yürütülecek istatistiksel bir araştırma ister deneysel araştırma isterse de alan araştırması yöntemi olsun, kullanılacak özel veri toplama teknikleri; gözlem, görüşme, anket, taramalar ve muayenelerdir. İzleyen kısımda sözü edilen bu tekniklere yer verilecektir.

Gözlem Tekniği Gözlem tekniği, veri derleme teknikleri arasında en yaygın olarak kullanılanıdır. Gözlem bakma ve dinleme olarak tanımlanabilir. Her araştırıcının dikkatli gözlemler yapabilmesi gerekir. Çok farklı şekillerde yapılabilen gözlem, özel veri derleme tekniklerinin hem en eskisi, hem en modern olanıdır. Gözlem tekniği laboratuvar deneylerinde kullanıldığı gibi, alan araştırması niteliğindeki araştırmalarda da kullanılabilir. Araştırmacı gözlemi, veri derleme tekniği olarak seçtiğinde, bu seçiminin araştırmasına sağlayacağı yarar ve sakıncaları dikkate almalıdır.

Gözlem tekniğinin sağladığı yararlar;

1. Bu veri derleme tekniğinde ölçme işlemi ilgilenilen birim üzerinde doğrudan doğruya yapıldığı için, veri derlemesi sırasında “eksik hatırlama” veya “gerçeklerin çarpıtılması” gibi sorunlar ortaya çıkmaz.

2. Gözlem tekniği uygulanarak veriler oldukça uzun bir zaman aralığı boyunca sürekli olarak elde edilebilir.

Gözlem tekniğinin sakıncaları ise;

1. Gözlem tekniğini benimseyen araştırmacı yanlı davranabilir, ilgilenilen değişken veya değişkenlere ilişkin ölçüm değerlerini doğru bir biçimde kaydetmeyebilir.

2. Gözlemi yapanlar yanlı davranabilecekleri gibi, gözlenenler de yanlı gözlemlere neden olabilirler. Gözlemi yapılan ve bunun farkında olan kişiler davranışlarını değiştirebilir. Böylece derlenen veriler yanlı olabilir.

İstatistiksel bir araştırmada veri derleme tekniği olarak gözlem benimsendiğinde aynı zamanda gözlemlerin (derlenen verilerin) hangi koşullarda yapıldığı ve veri setinin sınırlılıkları da açıklanmış olur.

21

Görüşme Tekniği Görüşme tekniğiyle veri derlemede görüşmeci daha önce hazırlanmış olan soru kâğıdındaki soruları ilgiliye sorar, yanıtları da soru kâğıdında yanıtlara ayrılmış olan yerlere kaydeder. Görüşmeci ve yanıtlayıcı kişi arasındaki doğrudan ilişkiyle derlenen verilerin birtakım yararları olduğu gibi sakıncaları da olabilir;

1. Kendileriyle doğrudan ilişki kurulan kişiler, yöneltilen sorulara cevap verme eğilimindedir. Görüşülen kişilerin büyük bir bölümü yararlı yanıtlar verebilir.

2. Görüşme tekniği soruların yanlış anlaşılmasını engellerken, tamamlayıcı bir takım verilerin de derlenmesine imkân sağlayabilir.

Veri derleme tekniği olarak görüşme seçildiğinde bazı sakıncalar ortaya çıkabilir;

1. Görüşmeci yanıtlayanların seçiminde objektif davranmayabilir. Bu durum verilerde bir yanlılığa neden olur.

2. Görüşmeci tutum ve davranışlarıyla yanıtlayanı etkileyebilir.

3. Görüşmeci yanıtları kaydetmede hatalar yapabilir.

Anket Tekniği Anket tekniği doğrudan yanıtlayanın doldurması gereken bir soru kâğıdına dayandırılmış bir veri derleme tekniğidir. Anketler; yanıt ya da yanıtları yazmayı gerektiren açık uçlu sorulardan oluşabileceği gibi daha önceden belirlenmiş yanıt seçeneklerinden birini veya birkaçını işaretlemeyi gerektiren kapalı uçlu sorulardan oluşur. Soru kâğıdı yanıtlayıcıya posta veya başka bir şekilde kendisine ulaştırılır. Anket ile veri derlemenin yarar ve sakıncalar, görüşmecinin olmamasından kaynaklanabilir. Görüşme tekniğinde görüşmeci nedeniyle ortaya çıkan yanılgılar anket yoluyla veri derlemede ortadan kalkar; ancak bu defa da görüşmecinin olmaması nedeniyle bazı sorunlar ortaya çıkabilir:

1. Anket soruları bir kuruma veya bir aileye ulaştırıldığında, yanıtlayıcı konusunda bir denetim uygulanması söz konusu değildir.

2. Görüşmecinin olmaması nedeniyle yanıtlama oranının düşük düzeyde kalmasıyla karşılaşılabilir. Düşük yanıtlama oranı özellikle alan araştırmalarında yanlılığın ortaya çıkmasına neden olabilir.

Taramalar Toplumda görülen veya görülebilecek sağlık olaylarının tespiti için çeşitli araştırmalar yapılır. Bu araştırmalarda özel veri derleme tekniği olarak taramalar kullanılır. Bulaşıcı hastalıkların tespitinde en çok kullanılan bu teknikte;

1. Risk altındaki grupların belirlenmesiyle araştırmanın sınırları çizilir,

2. Taramada kullanılacak teknik ve formlar tespit edilir,

3. Taramada görev alacak, yapılacak araştırma alanında eğitimli personel seçilir,

4. Tarama sonucu kullanılacak değerlendirme şekli belirlenir,

5. Değerlendirme sonucu rapor hâlinde sunulur. Muayeneler Toplumda görülen hastalıkların durumu ve seyrinin nasıl devam ettiğini tespit etmek için uygulanan veri toplama tekniğidir. Muayenede hangi tekniklerin uygulanacağı, hangi tetkiklerin yapılacağı ve bireylere hangi soruların sorulacağı önceden belirlenir.

Yukarıda ifade edilen teknikler kullanılarak derlenen verilerin daha iyi anlaşılabilir duruma getirilebilmesi için tablolar veya grafikler şeklinde düzenlenmesi gerekir. Araştırmada ele alınan değişken türüne göre oluşturulan tablo ve grafikler izleyen kısımda aktarılacaktır.

22

Özel veri toplama teknikleri; gözlem, görüşme, anket, taramalar ve muayenelerdir.

Sistematik veri derleme teknikleri nelerdir? Tablolar ve Grafikler İstatistiğin üç temel işlevi betimleme, çözümleme ve tahmindir. Betimleme işlevinin temel amacı istatistiksel verilerin özetlenerek en iyi şekilde kullanıma sunmaktır. Gözlenen veya kayıt altına alınan veriler başlangıçta anlaşılması zor karmaşık bir niteliktedir. Derleme sonucunda elde edilen istatistiksel veriler belli bir düzende olmayan niceliklerdir. Fişler, anketler veya listeler şeklinde toplanmış verilere bakarak ilk bakışta bir sonuç çıkarmak oldukça zordur. Belli bir niteliğe ilişkin toplanmış ham verilerin düzenlenerek sunulması gereklidir. Ham verilerin düzenlenmesi ve sunumu ele alınan verilerin niteliğine göre yapılmaktadır. Bundan dolayı veriler tablolar veya grafikler yardımıyla sunulabilir.

Tablo, elde edilen sayısal veya sözel verilerin satır ve sütunler halinde düzenlenmiş halidir. Tablolar verilerin daha kolay anlaşılmasını sağlar. İstatistiksel verilerin sunulduğu tabloların üç temel özelliği: tablonun hangi bilgiyi içerdiğini gösterir bir başlığının, satır ve sütunlarının olmasıdır. Tablonun satır ve sütunlarında hangi bilgilerin temsil edildiği açık bir biçimde belirtilmelidir. Tablolarda sunulan bilgiler anlaşılabilir olmalı ve çok fazla bilgiyi aynı anda karmaşık olarak sunmamalıdır. Ayrıca tabloda kullanılan verilerin varsa ölçü birimi (TL, kg., saat, vb.) açık bir şekilde ifade edilmelidir.

Verilerin daha anlaşılır bir şekilde sunumunu sağlayan diğer bir gösterim şekli ise grafiklerdir. Bir grafik kolayca anlaşılabilir ve çiziminin objektif olmasının yanı sıra konusunu açıklayan bir başlığa da sahip olmalıdır. Grafik çiziminde; histogram, çizgi grafiği, çubuk grafiği ve daire grafik gibi grafik türleri kullanılabilir.

İstatistiksel verilerin sunulduğu tabloların üç temel özelliğini yazınız.

Tablolar Nicel (sayısal) bir değişken (yaş, canlı doğum ağırlığı, kolesterol düzeyleri vb.) dikkate alınarak gözlem yapıldıysa, söz konusu bu gözlem değerleri belli bir sıraya göre dizilir ve değişkenin aldığı değerlere göre sınıflanır. Nitel (sözel-sayısal olmayan) bir değişken (cinsiyet, medeni durum, göz rengi vb.) söz konusu olduğunda ise gözlenen özelliğin gözlem birimlerindeki görünme sayıları saptanarak tablo halinde sunulur. İlgilenilen nitel değişken sayısı iki veya daha çok olduğunda çapraz tablolar (kontenjans) kullanılarak verilerin sunumu gerçekleştirilir.

Nicel Verilerin Tablolaştırılması Bir tablo oluşturulurken yapılacak işlemlerden ilki, derlenen ham verilerin küçükten büyüğe veya büyükten küçüğe sıralayarak istatistiksel bir dizi oluşturmaktır. Belli bir amaca göre düzenlenmiş veriler tabloya aktarılırken tablonun bir başlığı olmalıdır. Tablo başlığı bilgiyi kısa ve anlaşılır bir biçimde tanımlamalıdır. Satır ve sütun başlıkları açık bir biçimde belirtilmelidir. Ayrıca satır ve sütunlarda yer alan değişkenlerin ölçülmesinde kullanılan ölçü birimlerine yer verilmelidir ( kg, saat, %, lt vb.).

Örneğin; bir aile hekimine gün içerisinde gelen 30 kadın hastanın ağırlıkları (kg) ile ilgilendiğimizi varsayalım. Kadınların ağırlıkları (kg) şöyledir: 68, 57, 50, 47, 61, 49, 68, 57, 68, 55,49, 52, 61, 50, 55, 68, 55, 57, 57, 61, 52, 72, 63, 65, 50, 72, 61, 63, 68, 49. Bu 30 kadına ait ağırlıkları kullanarak bir tablo hazırlayalım. Yukarıda verilen ağırlıklar incelendiğinde verilerin karmaşık bir halde olduğu ve bir anlam ifade etmediği anlaşılmaktadır. Öncelikle bu veriler küçükten büyüğe dizilmelidir.

Ağırlık (kg) : 47, 49, 49, 49,50, 50, 50, 52, 52, 55, 55, 55, 57, 57, 57, 57, 61, 61, 61, 61, 63, 63, 65, 68, 68, 68, 68, 68, 72, 72

23

Bu düzenlemeyle veriler derli toplu bir görünüş kazanmış olmaktadır. Verilerin bu şekilde bir dizi olarak gösterilmesi kolaylıkla algılanmasına ve yorumlanmasına imkan vermektedir. Ağırlıklar incelendiğinde çok sayıda ağırlığın tekrarlanan değerleri olduğu görülmektedir. Ölçümlerin tekrar sayıları frekans (sıklık) olarak tanımlanır.

Bu durumda iki sütundan oluşan bir tablo oluşturarak verilerin düzenlenmesi sağlanabilir. Tablonun birinci sütununda ağırlık değişkeninin almış olduğu farklı değerlere, ikinci sütununda ise her değerin gözlem sayısını gösteren frekanslara yer verilir.

Tablo 2.1: 30 Kadının ağırlıklarına ait frekans dağılımı

Ağırlık (kg) Frekans47 149 350 352 255 357 461 463 265 168 572 2

Toplam 30

Tablon 2.1’ in ikinci sütunda yer alan frekansların toplamı toplam gözlem sayısına eşit olmalıdır. Tablo incelendiğinde en düşük ağırlığın 47 kg, en yüksek ağırlığın 72 kg ve en çok gözlenen ağırlığın ise68 kg olduğu görülmektedir.

Tablo 2.1’ de sunulan frekans dağılımına gruplandırılmamış frekans dağılımı da denilmektedir. Gruplandırılmamış frekans dağılımı gözlenen birim sayısı az olduğunda verilerin sunulması için oldukça

elverişlidir. Oluşturulan tablonun matematiksel simgelerle gösteriminde ix , değişkenin i. sıradaki almış

olduğu değeri, in ise .i değerin frekansını göstermek için kullanılır.

Değişken Frekansix in

1x 1n

2x 2n . .. .. .

kx knToplam n

Frekansların toplamı yukarıda değinildiği gibi toplam gözlem sayısına eşit olmalıdır. O zaman;

1 21

k

i ki

n n n n n

i kn n n n ni kn n n n ni k n n n n n n n n n ni kn n n n ni k i kn n n n ni k dır.

Nicel Verilerin Gruplandırılarak Tablolaştırılması Tablo 2.1’ de ele alınan örnekte ağırlık değişkeninin ölçülmesi sonucunda elde edilen veriler gruplandırılmadan tablolaştırıldı. Derlenen verilerin çok fazla sayıda olduğunda verileri gruplandırmadan sunmak oldukça zordur. Gözlenen denek veya birim sayısı çok fazla olduğunda ve ölçümü yapılan değişkenin almış olduğu değerler bir birinden oldukça farklı olduğunda gruplandırılmamış frekans

24

dağılımları çok uzun olabilmektedir. Böyle durumlarda gruplandırılmamış frekans dağılımı veriyi temsil etmede kolayca anlamada yetersiz kalabilir. Bundan dolayı verilerin gruplandırılarak tablolaştırılması en iyi çözümdür. Yaş, kişi başı ilaç harcaması, hastane yatış süresi, fiili yatak sayısı, döner sermaye harcamaları gibi değişkenlerin tablo halinde sunumunda verilerin gruplandırılmış frekans dağılımı biçiminde verilmesi sıklıkla tercih edilmektedir. Gruplandırılmış frekans dağılımları kullanıldığında bilgi kaybı olmakla birlikte genel yapının daha kolay bir biçimde betimlenmesine olanak tanınmaktadır.

Verilerin gruplandırılmasında en önemli konular; ilgilenilen değişkenin kesikli ya da sürekli olması, grup sayısı ve grup aralığıdır. Öncelikle elde edilen ham verilerin dizi biçiminde düzenlenmesi gereklidir. Küçükten büyüğe sıralanmış olarak düzenlenen verilerin kaç grupta sınıflandırılacağının belirlenmesi için genellikle Sturges Kuralı kullanılır. Sturges kuralı uygun grup sayısının ve grup aralığının hesaplanmasını olanak sağlamaktadır. Gruplandırma yapılırken ilgilenilen değişken nicel ve sürekli ise gruplandırma işleminde genellikle ortak sınıf yaklaşımı benimsenirken, değişken nicel ve kesikli olduğunda ise ortak sınıf yaklaşımı benimsenmez.

Sturges kuralı yardımıyla grup sayısını hesaplamak için aşağıdaki matematiksel eşitlik kullanılır:

1 3,3 logk n

k, grup sayısını n ise toplam gözlem sayısını göstermektedir. Grup sayısı belirlendikten sonra grup aralıklarını hesaplamak için veri setindeki gözlenen en küçük ve en büyük değer yardımıyla aşağıdaki eşitlik kullanılır;

enbüyük enküçükx xc

k

Örnek 2.1: Bir hastanede çalışanların örgüt kültürünü belirlemek amacıyla yapılan bir çalışmada, 50 personelin kıdem yılına ilişkin veriler derlenmiştir. Elde edilen sonuçlar Tablo 2.2’ de verilmiştir.

Tablo 2.2: Kıdem yıları

Kıdem Yılı

1 1 1 2 2 2 3 3 3 3 4 4 5 5 5 5 6 6 7 8 8 9 9 9 10 10 10 11 11 11 13 14 14 15

15 15 16 16 17 17 18 18 20 20 21 21 22 23 26 28

Çözüm 2.1: Tablo 2.2’de yer alan veri setinin gruplandırılarak tablolaştırılması için aşağıdaki işlem adımları sırasıyla gerçekleştirilir.

1. Grup Sayısının Hesaplanması

1 3,3 logk n

50n (toplam gözlem sayısı)

log50 1,699

1 3,3 1,699 6,61 7k

Veriler 7 grup altında düzenlenecektir.

2. Grup Aralığının Hesaplanması

Veri setinde kayıt altına alınan en küçük kıdem yılı 1 yıl ve en yüksek kıdem yılı 28 yıldır.

28enbx

1enkx

28 14

7c

Grup aralığının genişliği 4 yıl olacaktır.

25

3. Grup sayısı 7 ve grup aralığı 4 yıla göre verilerin tablolaştırılması

Kayıt altına alınan en küçük değerden başlanarak (1 yıl) grup aralıkları 4 yıl ve grup sayısı 7 olacak biçimde veriler gruplandırılır. Gruplar oluşturulduktan sonra bu gruplarda yer alan değerlerin sayısı frekans olarak tablonun ikinci sütununa yazılır.

Tablo 2.3: Kıdem yıllarına ilişkin gruplandırılmış frekans dağılımı

Kıdem Yılı Frekans

1 - 5’den az 12

5 - 9’dan az 9

9 - 13’den az 9

13 - 17’den az 8

17 - 21’den az 6

21 - 25’den az 4

25 - 29’dan az 2

Toplam 50

Tablo 2.3’ te yer alan gruplandırılmış frekans dağılımı oluşturulurken kayıt altına alınan en büyük

değer grup aralığı dışında kaldığında “açık grup” biçiminde düzenlenir. Örneğin en büyük kıdem yılı 29 yıl olarak belirlenseydi bu durumda 7.grup “25 yıl ve üzeri” biçiminde düzenlenecekti.

Tablo 2.3 kullanarak üçüncü grubu ilişkin sonuçları yorumlayalım. Üçüncü grup 9-13 yıl grubudur. 50 hastane çalışanından dokuzunun kıdem yılı 9-13 yıl arasındadır. Bu dokuz çalışanın kıdem yılı 9 yıla eşit ve daha fazla ancak 13 yıldan daha azdır. Kıdem yılı 13 yıl olanlar dördüncü grup (13-17 yıl) içindedir. Bu grubun alt sınırı 9 yıl, üst sınırı ise 13 yıl ve grup aralığı = grubun üst sınırı – grubun alt sınır = 4 yıldır. Her grubun orta noktasının o grubu en iyi şekilde temsil ettiği varsayılır. Üçüncü grubun orta

noktası 9 13 / 2 11 yıldır. Tabloda yer alan diğer gruplar içinde ayrı ayrı yorumlar yapılabilir.

Aşağıda yönetici hemşirelerin aylık ayakta geçirdikleri süre saat olarak verilmiştir, frekans dağılımını oluşturarak elde ettiğiniz sonuçları tabloda gösteriniz ve kısaca yorumlayınız.

Birikimli Frekans Dağılımları Bir frekans dağılımında, her sınıfın frekansına bir önceki sınıfın frekansının birikimli olarak eklenmesiyle oluşturulan dağılıma birikimli dağılımı, bu şekilde oluşturulan dağılımlara da birikimli frekans dağılımları adı verilir. Birikimli frekanslar, küçükten büyüğe ya da büyükten küçüğe oluşturulabilir. Eğer birikimli frekanslar küçükten büyüğe oluşturulmuşsa “-den az”, büyükten küçüğe oluşturulmuşsa “-den çok” olarak isimlendirilir. Birikimli frekanslar, gözlem değerlerinin büyüklüklerine göre kaçıncı sırada yer aldıklarının belirlenmesinde kullanılır.

Süre (saat)

60 61 62 62 62 62 63 63 64 64 64 64 65 65 65 65 66

66 66 66 66 66 66 66 67 67 67 67 67 67 67 67 68 68

68 69 69 69 69 70 70 70 71 71 71 72 72 73 73 73

26

Tablo 2.3’ te 50 çalışanın kıdem yıllarına ilişkin gruplandırılmış frekans dağılımını kullanarak “-den az” ve “-den çok” birikimli frekansları oluşturarak, bu birikimli frekansları nasıl yorumlayacağını görelim.

Tablo 2.4: Kıdem yıllarına ilişkin gruplandırılmış frekans dağılımı

Kıdem Yılı Frekans “-den az” “-den çok”

1 - 5’den az 12 12 38 + 12= 50

5 - 9’dan az 9 9 + 12 = 21 29 + 9= 38

9 - 13’den az 9 9 + 21 = 30 20 + 9= 29

13 - 17’den az 8 8 + 30 = 38 12 + 8= 20

17 - 21’den az 6 6 + 38 = 44 6 + 6= 12

21 - 25’den az 4 4 + 44= 48 2+ 4= 6

25 - 29’dan az 2 2 + 48 = 50 2

Toplam 50

Tablo 2.4’ ün ikinci ve üçüncü sütunlarında birikimli frekanslara yer verilmiştir. “-den az” birikimli

frekanslar oluşturulurken ilk grubun frekansından başlanılır. İkinci grubun “-den az” birikimli frekansı ilk grubun frekansı ile ikinci grubun frekansının toplanmasıyla elde edilir. Son gruba kadar frekanslar toplanarak devam eder, son grubun “-den az” birikimli frekansı toplam frekansa eşit olmalıdır. “-den çok” birikimli frekansta ise işlem “-den az” birikimli frekansların tam tersidir ve “-den çok” birikimli frekanslarda birinci grubun birikimli frekansı toplam frekans sayısına eşit olmalıdır.

Tablo 2.4’ deki örnekte kıdem yılı grupları göz önüne alınırsa “-den az” birikimli frekanslar yardımıyla 38 personelin kıdem yılının 17 yıldan daha az olduğu, “-den çok” birikimli frekanslar yardımıyla 6 personelin kıdem yılının ise 21ve 21 yıldan daha fazla olduğu söylenir.

Örnek 2.2: Aşağıda verilen gruplandırılmış frekans dağılımını kullanarak,

Kıdem Yılı Frekans

0 - 10 7

10 - 20 12

20 - 30 16

30 - 40 24

40 - 50 32

50 - 60 28

60 - 70 21

a. Frekans dağılımındaki toplam gözlem sayısını belirleyiniz.

b. “-den az” ve “-den çok” birikimli frekansları oluşturunuz.

c. Kıdem yılı 40’ tan küçük olan gözlem sayısını belirleyiniz.

d. Kıdem yılı 60 ve daha büyük gözlem sayısını belirleyiniz.

27

Çözüm 2.2:

a. Toplam gözlem sayısı frekanslar toplamına eşittir. Bu örnekte toplam gözlem sayısı 140’ tır.

1

7 12 16 24 32 28 28 21 140k

ii

n n

b. “-den az” ve “-den çok” birikimli frekanslar:

Kıdem Yılı Frekans “-den az” “-den çok”

0 - 10 7 7 140

10 - 20 12 19 133

20 - 30 16 35 121

30 - 40 24 59 105

40 - 50 32 91 81

50 - 60 28 119 49

60 - 70 21 140 21

Toplam 140

c. Kıdem yılı 40’ tan küçük olan gözlem sayısı 59’ dur.

d. Kıdem yılı 60 ve daha büyük gözlem sayısı 21’dir.

Nitel Verilerin Tablolaştırılması Nicel bir değişkene ait verilerin tablolaştırılmasından sonra, şimdi nitel bir değişkenin nasıl tablolaştıracağımızı ele alalım. Medeni durum, cinsiyet, öğrenim düzeyi, psikiyatrik tanı, hastaların hastane tercih nedenleri gibi nitel değişkenlerin kullanıldığı durumlarda değişkenin sözel karşılıkları tablo haline getirilir. Nitel değişkenlerin kullanıldığı durumlarda frekanslarla birlikte yüzdelik oranlara da yer verilmesi önemlidir. Gerçek frekansların yanında verilen yüzdelikler oransal frekanslar olarak tanımlanmaktadır. Oransal frekanslar nitel değişkenin düzeylerine katılma yüzdesini ya da tercih oranını göstermektedir. Değişken düzeylerinin tekrarlanma sayısı (frekansı) sadece değişkenin o değerinin gözlenme sayısını gösterir ve elde edilen diğer sonuçlardan bağımsızdır. Oransal frekans ise değişkenin almış olduğu değerin toplam içindeki oranını gösterir ve bu tüm veri setiyle ilişkilendirilir.

Birim sayısı en az 50 ve daha fazla olan kütlenin oransal frekanslarının hesaplanması ve yorumlanması anlamlıdır.

Zaman kavramı sağlık hizmetlerinin yönetimi alanında oldukça önemli bir konudur. Hastane yöneticilerinin zaman yönetimine ilişkin tutumlarının belirlenmesi için bir çalışma yapıldığını varsayalım. Bu çalışmada 250 hastane yöneticisinin “zaman planlaması yönetimi yapıyor musunuz?” ifadesine verdiği yanıtlar özet olarak aşağıda verilmiştir. Bu yanıtları kullanarak ilgili tabloyu oluşturalım.

Yönetici Cevap

Birinci Yönetici Bazen

İkinci Yönetici Her Zaman

Üçüncü Yönetici Hiçbir Zaman

. .

. .

. . İki Yüz Ellinci Yönetici Her Zaman

28

Elde edilen ham verileri yorumlamak oldukça zordur. Zaman Planlaması nitel değişkeninin 5 farklı düzeyi; Hiçbir Zaman, Nadiren, Bazen, Genellikle, Her Zaman şeklindedir. Beş farklı sonucun tercih sıklıkları belirlenerek tablonun ikinci sütununda yer alan frekans kısmına yazılır. Tablonun üçüncü sütununda yer alan oransal frekanslar, değişkenin i. sıradaki almış değerin frekansı ni’ nin toplam frekansına oranlanmasıyla hesaplanır, i in n . Örneğin, “Hiçbir Zaman” düzeyi için oransal frekans

30/250=0,12 dir.

Tablo 2.4: 250 Hastane yöneticisinin zaman planlamasına ilişkin tutumları

Hastane yöneticilerinin % 32’ si zaman planlanmasını genellikle, % 28’ i ise her zaman yaptıklarını bildirmiştir. Zaman planlamasına ilişkin “Hiçbir Zaman” yanıtı verenlerin oranı ise % 12 dir. Tablo 2.4’ te nitel değişken için oluşturulan tablonun matematiksel simgelerle ifadesi aşağıda verilmiştir.

Değişken Frekans Oransal Frekans

ix in i in n

1x 1n 1 in n

2x 2n 2 in n

. . .

. . .

. . .

kx kn k in n

Toplam n 1,00

Örnek 2.3:

Tablo 2.5’ te 262 hastanın A hastanesinde aradıkları birimleri bulma konusunda kullandıkları yönteme ilişkin elde edilen veriler düzenlenmiş biçimde verilmiştir. Tablo 2.5’ i kullanarak elde edilen sonuçları yorumlayınız. Hastaların aradıkları birimi bulma konusunda en sık kullandıkları yöntemin ne olduğunu açıklayınız.

Tutum Frekans Oransal Frekans

Hiçbir Zaman 30 0,12

Nadiren 20 0,08

Bazen 50 0,20

Genellikle 80 0,32

Her Zaman 70 0,28

Toplam 250 1,00

29

Tablo 2.5: Hastaların aradıkları birimleri bulma teknikleri

Tablo 2.5. incelendiğinde hastaların A hastanesinde ilgili birimi bulmak için 4 farklı teknik kullandığı görülmektedir: levhalar, danışma memuru, herhangi bir hastane personeli ve diğer. Hastalar aradıkları birimi bulmak için en sık olarak herhangi bir hastane personeline danışmaktadırlar, 262 hastanın % 34’ u bu yöntemi tercih etmiştir. Danışma memuruna sorarak aradıkları birimi bulan hastaların oranı ise % 25’ dir. Levhaları takip ederek ilgili birimi bulanların oranı % 32 iken diğer herhangi bir yöntemi kullananların oranı ise % 9’ dur.

Hastaların poliklinik hizmeti aldıkları hastaneleri genel olarak değerlendirme sonuçları hastane yöneticileri açısından oldukça önemlidir. Hastanelerin hastalarda bıraktığı genel imajının belirlenmesine yönelik sonuçlar Tablo 2.6’ da verilmiştir. Tabloda yer alan sonuçlardan hareketle oransal frekansları hesaplayarak elde edilen sonuçları yorumlayınız.

Tablo 2.6: Hastaların hastanenin genel imaj değerlendirmeleri

Çapraz Tablo Derlenen veriler aynı anda iki veya daha fazla değişken göz önünde bulundurularak tablolaştırıldığında çapraz tablo elde edilir. Bir gözlem kümesi iki değişkene göre tablolaştırıldığında 2×2 veya genelde R×C tabloları ortaya çıkar. Bu tablolar R kadar sıra ve C kadar sütundan oluşur. Söz konusu tabloların gözelerinde (hücre) frekanslar yer alır. Y hastanesinde yatarak tedavi görüp taburcu olan 500 hastaya, hastanede kalış süreleri ve bu hastaneden tekrar hizmet alıp almayacakları sorulmuş olsun. Veriler aşağıdaki 2×2 çapraz tabloda verilmiştir.

Hastaneden tekrar hizmet alma

Hastanede yatma süresi

Tekrar Hizmet Alacağım

Tekrar Hizmet Almayacağım

Toplam

En fazla Bir hafta 260 20 280

Bir haftadan fazla 80 140 220

Teknik Frekans Oransal Frekans

Levhalar 84 0,32

Danışma Memuru 65 0,25

Herhangi Bir Hastane Personeli 90 0,34

Diğer 23 0,09

Toplam 262 1,00

İmaj Frekans Oransal Frekans

Çok İyi 25

İyi 80

Orta 64

Zayıf 19

Çok Zayıf 12

Toplam 200

30

Bu tablodan şu yorumlar çıkarılabilir;

Hastanede en fazla bir hafta yatan 280 hastanın %93’ü (260/280) tekrar bu hastaneden hizmet almaya devam edeceğini,

Hastanede bir haftadan daha fazla yatan 220 hastanın %36’ı (80/220) tekrar bu hastaneden hizmet almaya devam edeceğini, %64’ü (140/220) ise bu hastaneden tekrar hizmet almayacağını belirtmiştir.

Hastane yöneticisi, bu sonuçlardan hastanede kalış süresi arttıkça hastaların Y hastanesinden tekrar hizmet alma eğiliminde bir azalma olduğu bulgusuna ulaşabilir. Ancak, bu bulgunun idari karara dönüşebilmesi için kitabın ilerleyen ünitelerinde yer alan hipotez testlerinin uygulanmasına gerek vardır. Grafikler Verileri kolay anlaşılabilir hale getirerek sunmanın en iyi yollarından biri de grafiklerdir. Grafikler verilerin geometrik şekilleridir. Grafik çizimi belli kurallar çerçevesinde yapılır. Tablolarda olduğu gibi grafiklerin de konusunu gösteren bir başlığı olmalıdır. Bir grafikte yer alan şekil ve çizgilerin anlamları grafik üzerinde belirtilmelidir. Grafiğin apsis (yatay eksen –x) ve ordinat (düşey eksen –y) eksenlerinin ölçeklendirilmesi ve bu eksenlerin tanımları grafik üzerinde gösterilmelidir. Grafikte anlaşılması ve yorumlanması zor olan işaretlemelere ve şekillere yer verilmemelidir. Ayrıca çizilen grafiğin kaynağının da belirtilmesi gerekir. Veri türlerinin yanında grafikler oluşturulma amaçları, kullanış biçimleri ve şekilleri itibariyle de farklı başlıklar altında ele alınmaktadır. Verilerin görsel bir biçimde sunumunda sıklıkla kullanılan grafikler: çubuk grafiği, histogram, serpilme diyagramları, alan grafikleri, çizgi grafiği, kare ve daire grafikleridir. Histogram Birbirine bitişik dikdörtgenlerden oluşan grafiğe histogram adı verilir. Histogram sürekli nicel veriler için uygun bir gösterim biçimidir. Histogram çizilirken apsis ekseninde değişkenin almış olduğu farklı değerler, ordinat ekseninde ise frekanslar yer alır. Apsis ekseninde grup sınırları işaretlenerek; tabanı grup aralığına, alanı ise grup frekansına karşılık gelen bir birine bitişik dikdörtgenler çizilerek histogram oluşturulur. Çizilen dikdörtgenlerin orta noktalarının birleştirilmesi ile frekans poligonu elde edilir.

Histogram çiziminde diğer önemli konulardan biri grupların bölüm aralıklarının eşit olmasıdır. Grup aralıkları eşit olmadığında frekansların ayarlanması gerekmektedir. Histogramda grup aralıkları eşit olduğunda dikdörtgenlerin tabanlarının bir birim olduğu kabul edilmektedir. Grup aralıkları eşit olmadığında dikdörtgen tabanlarının bir birim olacak şekilde düzenlenmesi için frekansların basit matematiksel işlemler ile ayarlanır. Bunun için frekanslar grup aralığına bölünerek dikdörtgenlerin alanları ile grupların frekansları eşit hale getirilir. Frekanslar ayarlanırken en fazla görülen grup aralığı standart birim olarak tanımlanır. Aralığı bir standart birim olan grupların frekansları değerlerini korurken, grup aralığı standart birimden farklı olan grupların frekansları grupların standart birim cinsinden aralık değerlerine oranlanarak frekanslar ayarlanır (Bakınız: örnek 2.4). Dikdörtgenlerin alanlar toplamı her zaman toplam frekansa eşit olmalıdır.

Hastanede çalışan hekim ve hemşireleri geçirdikleri iş kazaları ve meslek hastalıkları yönünden değerlendirmek amacıyla yapılan bir çalışmada A hastanesinin çalışanlarının haftalık çalışma sürelerine ait veriler toplanmış ve Tablo 2.7 de sunulmuştur. Bu frekans dağılımı için histogramı çizelim.

Tablo 2.7: Haftalık çalışma sürelerine ilişkin gruplandırılmış frekans dağılımı

Çalışma Süresi

(saat) Frekans

30 - 40 4 40 - 50 29 50 - 60 23 60 - 70 40 Toplam 96

31

Tablo 2.7’ deki çalışma sürelerinin grup aralıkları incelendiğinde, 4 grupta da grup aralıklarının 10 saat olduğu görülmektedir. Frekanslara ilişkin her hangi bir matematiksel işlem yapmadan histogram çizilebilir.

Şekil 2.4: Tablo 2.7’deki veriler için histogram

Şekil 2.4’ te yer alan histogramda her bir dikdörtgenin alanı o grubun frekansına eşittir. Dikdörtgenlerin alanları toplamı ise toplam frekansı vermektedir. Dikdörtgenlerin orta noktalarını birleştirerek çizdiğimiz doğru ise frekans poligonunu göstermektedir. Grup aralıkları bu histogramda (10) birbirine eşit olduğundan her bir dikdörtgenin tabanı 1 birim olarak kabul edilir. O halde 30-40 grubunu temsil eden dikdörtgenin yüksekliği h = 4, tabanı 1 birimdir ve dikdörtgenin alanı 4 birimdir (4×1=4). Dikdörtgenlerin alanları sırasıyla; 4, 29, 23 ve 40’ tır, alanlar toplamı ise 96’ dır.

Örnek 2.4:

Aşağıda verilen gruplandırılmış frekans dağılımının histogramını çiziniz.

Çözüm 2.4:

Bu örnekte grup aralıklarının eşit olmadığı görülmektedir. En sık görülen grup aralığı 10’dur ve 10 bir standart birim olarak kabul edilir. Bölüm aralığı 10’ dan farklı olan; birinci, beşinci ve altıncı grupların frekansları ayarlanmalıdır. Bu grupların aralıkları 10’ a bölünerek standartlaştırıldıktan sonra bu grupların gerçek frekansları standart değerlere bölünerek ayarlamış frekanslar elde edilir. Örneğin birinci grubun “15-30” grup aralığı 15, bir standart birim olarak belirlediğimiz grup aralığı 10 için 1,5 birimdir. O zaman birinci grubun ayarlanmış frekansı 15 /1,5 10 olarak hesaplanır. Ayarlanmısş frekans hesabı tablo

üzerinde gösterilmiştir. O halde ayarlanmış frekanslar kullanılarak histogram çizimi yapılabilir

Gruplar Frekans 15 - 30 15 30 - 40 25 40 - 50 60 50 - 60 44 60 - 75 30 75 - 80 16 Toplam 190

32

Şekil 2.5: Ayarlanmış frekanslara göre histogram

Tablo 2.8’de verilen gruplandırılmış frekans dağılımı için histogramı çiziniz.

Tablo 2.8: Gruplandırılmış frekans dağılımı

Çubuk Grafiği

Nitel verilerin gösteriminde sıklıkla çubuk grafikleri kullanılmaktadır. Bu grafikte, sıralayıcı veya sınıflayıcı ölçekle ölçülmüş değişkenlere ait verilerin sayılarını veya oranlarını gösterilmektedir. Çubuk grafiklerinde gruplar tabanları eşit ve birbirine bitişik olmayan dikdörtgenler ile çizilir. Dikdörtgenler bir birini izleyen bir seriyi temsil eder. Çubuk grafiği dikey ya da yatay olabilir. Eksenlerden birinde değişkenin düzeyleri, diğerinde ise frekans veya yüzdelere yer verilir.

Gruplar Frekans Grup Aralığı Standart Birim Ayarlanmış Frekans

15 - 30 15 15 15 /10 1,5 15 /1,5 10

30 - 40 25 10 10/10=1 25 40 - 50 60 10 10/10=1 60 50 - 60 44 10 10/10=1 44 60 - 75 30 15 15 /10 1,5 30 /1,5 20

75 - 80 16 5 5 /10 0,5 16 / 0,5 32

Toplam 190

Gruplar Frekans 0 - 15 10 15 - 30 15 30 - 45 20 45 - 60 30 60 - 75 15 75 - 90 5

33

Örnek 2.5:

2010 yılı Sağlık İstatistikleri Yıllığına göre tüm sektörler itibariyle sağlık personeli sayıları Tablo 2.9’ da verilmiştir. Bu verileri kullanarak çubuk grafiğini çiziniz.

Tablo 2.9: 2010 Yılı Sağlık Personeli Sayıları

Sağlık Personeli Personel

Sayısı

Uzman Hekim 63563

Pratisyen Hekim 38818

Asistan Hekim 21066

Diş Hekimi 21432

Eczacı 26506

Sağlık Memuru 94443

Hemşire 114772

Ebe 50343

Kaynak: Sağlık İstatistikleri Yıllığı 2010

Şekil 2.6: Tablo 2.9’daki veriler için çubuk grafiği

0

20000

40000

60000

80000

100000

120000

UzmanHekim

PratisyenHekim

AsistanHekim

Diş Hekimi Eczacı SağlıkMemuru

Hemşire Ebe

34

Örnek 2.6:

Yıllara ve sektörlere göre hastane sayılarını gösteren çubuk grafiği Şekil 2.7’ de verilmiştir.

Şekil 2.7: Yıllara ve Sektörlere Göre Hastane Sayısı, Türkiye


Çubuk grafiğinde 4 sektöre göre hastaneler farklı renklerde gösterilmiştir. Çubukların üzerinde sektörler itibariyle hastane sayıları görülmektedir.

Örnek 2.7: Bir hastane hastalarına sunmuş oldukları hizmetlerin hastalar tarafından değerlendirilmesi amacıyla bir değerlendirme formu hazırlayarak 300 hastanın görüşlerini almıştır. Elde edilen görüşlerin oransal dağılımları Tablo 2.10 da verilmiştir. Tablo 2.10 kullanılarak birikimli grafiğin çizimi şekil 2.8 de verilmiştir. Elde edilen sonuçları yorumlayınız.

Tablo 2.10: Hastane hizmetlerinin değerlendirilmesinde verilen yanıtların oransal dağılımı (%)

Hizmetler Mükemmel İyi Orta YetersizÇok

Yetersiz Toplam

Randevu Alma % 35 % 30 % 15 % 10 % 10 100

Kayıt Yaptırma % 25 % 30 % 25 % 10 % 10 100

Acil Servis Hizmet % 30 % 35 % 10 % 10 % 15 100

Laboratuvar % 30 % 20 % 10 % 15 % 25 100

Doktorlar % 35 % 25 % 10 % 20 % 10 100

Hemşireler % 20 % 20 % 30 % 10 % 20 100

Güvenlik % 15 % 15 % 20 % 20 % 30 100

Temizlik % 25 % 15 % 20 % 15 % 25 100

0100200300400500600700800900

1000

2006 2007 2008 2009 2010

Has

tan

e S

ayıla

rı

Yıllar

Sağlık bakanlığı

Özel

Üniversite

Diğer

35

Şekil 2.8: Hastane hizmetlerinin değerlendirilmesinde verilen yanıtların oransal dağılımı (%)

Bir ildeki Devlet, Özel ve Fakülte hastanelerinin acil servislerine hafta sonu (Cumartesi – Pazar) başvuran hasta sayıları Tablo 2.11 de verilmiştir. Tablo 2.11’e göre çubuk grafiğini çiziniz.

Tablo 2.11: Hastanelere göre hafta sonu Acil servise gelen hasta sayıları

Daire Grafiği Daire grafikleri tek bir değişken dikkate alınarak çizilen grafiklerdir. Nitel verilerin grafik gösteriminde kullanılmaktadır. Bir nitel değişkenin düzeyleri az olduğunda çoğunlukla daire grafikleri tercih edilmektedir. Dairenin alanı değişkenin düzeylerinin 360 lik daire içindeki paylarına göre parçalara ayrılır. Her bir düzeyin daire içindeki payını bulmak için; önce her bir düzeye ait frekans toplam frekans sayısına oranlanır, sonra bunların derece cinsine dönüştürülmesi için bu oranlar 360’ la çarpılır. Böylece her grubun daire içinde kaç derecelik bir merkez açıyla yer aldığı belirlenmiş olur.

Hastaneler

Hasta Başvuru Sayısı (Kişi)

Cumartesi Pazar

Devlet Hastaneleri Acil Servisleri 52 68

Özel Hastaneler Acil Servisleri 54 46

Fakülte Hastanesi Acil Servisi 64 55

36

Örnek 2.8:

Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayıları aşağıda verilmiştir. Bu verileri kullanarak daire grafiğini çizelim.

Tablo 2.12: Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayısı

Sektör Yatak Sayısı

Sağlık Bakanlığı 6130

Üniversite 2900

Özel 4142


Çözüm 2.8:

Tablo 2.12’de Sağlık Bakanlığı’na ait erişkin yoğun bakım yatağı sayısı 6130 ve toplam yatak sayısı 13172’dir. Sağlık Bakanlığına ait erişkin yoğun bakım yatağı sayısının daire içindeki payı 6120 /13172 0.47 dir. Diğer düzeyler içinde aynı işlem sırasıyla tekrarlanarak tüm düzeylerin daire içindeki payları elde edilir.

Tablo 2.13: Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayısı ve oranları

Sektör Yatak Sayısı Yüzde Daire Üzerindeki Açı

Sağlık Bakanlığı 6130 0,47 0,47 360 167,5 0,47 360 167,50,47 360 167,5 0,47 360 167,5

Üniversite 2900 0,22 0,22 360 79,3 0,22 360 79,30,22 360 79,3 0,22 360 79,3Özel 4142 0,31 0,31 360 113,2 0,31 360 113,20,31 360 113,2 0,31 360 113,2

Şekil 2.9: 2010 Yılı sektörlere göre yoğun bakım yatağı sayısı, Türkiye

37

Örnek 2.9:

Bir hastanenin hasta hakları birimi hastanelerine gelen hastalardan tesadüfi olarak gelen 250 hastaya sunulan hizmetlerden memnuniyetlerini sormuş ve Tablo 2.14’deki sonuçları elde etmiştir. Hasta memnuniyeti için daire grafiğini çiziniz ve kısaca sonuçları yorumlayınız.

Tablo 2.14: 250 Hastanın Memnuniyet Düzeyi

Memnuniyet Düzeyi Yatak Sayısı Yüzde Daire Üzerindeki Açı

Memnun 187 0,75 0,75 360 269,3 0,75 360 269,30,75 360 269,3 0,75 360 269,3

Orta 33 0,13 0,13 360 47,5 0,13 360 47,50,13 360 47,5 0,13 360 47,5Memnun Değil 30 0,12 0,12 360 43,2 0,12 360 43,20,12 360 43,2 0,12 360 43,2

Şekil 2.10: 250 Hastanın Memnuniyet Düzeyi

250 hastanın % 75’ i hastanenin hizmetlerinden memnun, % 13’ u orta derece memnun ve % 12’ si memnun olmadığını bildirmiştir. Söz konusu hastanenin hizmet sunumu hasta memnuniyeti sağlamaktadır.

2000 yılı Sağlık Bakanlığı istatistiklerine göre ölüm sayılarının hastalık nedenlerine göre dağılımı Tablo 2.15’ te yer almaktadır. Verilere ilişkin daire grafiğini çiziniz, hastalık nedenlerinin oranlarını hesaplayarak kısaca açıklayınız.

Tablo 2.15: 2000 yılı ölüm sayılarının hastalık nedenlerine göre dağılımı

Hastalık Nedeni Ölüm Sayısı

Enfeksiyon Hastalıkları 38071

Yaralanmalar 25025

Kardiyovasküler Hastalıklar 205457

Kanserden Ölüm 56250

Solunum Sistemi Hastalıkları 34211

Diabet 9549

Kaynak: Sağlık İstatistikleri Yıllığı, 2000

38

Çizgi Grafiği Çizgi grafikleri nicel bir değişkenin almış olduğu değerlerin frekanslarının dağılımını göstermek için kullanılmaktadır. Çizgi grafikleri, basit ve çoklu çizgi grafikleri olmak üzere ikiye ayrılmaktadır. Çizgi grafikleri belli bir aralıkta grafik üzerinde işaretlenen noktaların bir çizgi ile birleştirilmesi ile oluşturulur. Zaman serisi grafiği olarak ta adlandırılan çizgi grafikleri değişkenin zaman içindeki değişimini görsel olarak gösterir. Diğer grafiklere göre zamana bağlı değişimleri daha iyi bir şekilde açıklamaktadır.Çubuk ve histograma göre çizimi daha kolay olmakla birlikte büyük veri setlerinin özet bir biçimde gösterimini de sağlamaktadır. Ancak verilerin doğruluğu ve kaynağına ilişkin kesin kanıtlar sunmada yetersiz kalmaktadır. Yıllara göre ölüm hızı, yıllara göre birinci basamak sağlık kuruluşlarına müracaat sayısı, kişi başına düşen ilaç harcamaları gibi değişkenlerin çiziminde basit çizgi grafiği kullanılır. Yıllara göre faiz dışı harcamalar ve kamu sağlık harcamaları aynı grafik üzerinde gösterilecekse bu durumda çoklu çizgi grafiği kullanılır. Çizgi grafiklerinde bir değişkenin almış olduğu değerler ve bunların frekansları varsa; apsis ekseninde değişkenin almış olduğu değerler ordinat ekseninde ise frekanslar yer alır. Ancak iki değişkenin olduğu durumlarda ise apsis ve ordinat eksenleri birer değişkeni temsil eder.

Şimdi farklı örnekler üzerinde basit ve çoklu çizgi grafiklerini ele alalım. Örneğin; yıllara göre Sağlık Bakanlığı birinci basamak kuruluşları sevk oranlarına ilişkin bir grafik çizmeye karar verelim. Tablo 2.16’ da yıllara göre Sağlık Bakanlığı birinci basamak kuruluşları sevk oranları verilmiştir.

Tablo 2.16: Yıllara Göre Sağlık Bakanlığı Birinci Basamak Kuruluşları Sevk Oranı

Yıllar Oran2002 16,72006 6,42007 2,42008 1,32009 1,02010 0,4


Bu durumda farklı grafikler çizilebilir. Ancak yıllar itibariyle birinci basamak sağlık kuruluşlarına sevk oranlarındaki değişimi veya farklılaşmayı gösterecek en iyi grafik çizgi grafiktir. Verileri önce çubuk grafiği ile gösterelim.

Şekil 2.11: Yıllara Göre Sağlık Bakanlığı Birinci Basamak Kuruluşları Sevk Oranı

02468

1012141618

2002 2006 2007 2008 2009 2010Yıllar

Oran(%)

39

Çubuk grafiği (Şekil 2.11) incelendiğinde yıllar itibariyle sevk oranının azaldığı görülmektedir. Ancak bu grafik azalım eğilimini iyi bir şekilde temsil etmemektedir. Çubuk grafiği yerine çizgi grafiği verilerin daha kolay anlaşılmasını sağlayacaktır. Grafik çizilirken apsiste oranlar ordinat ekseninde ise yıllar yer alacaktır. Her bir yıla karşılık gelen sevk oranı analitik düzlemde birer nokta olarak işaretlenecek ve daha sonra bu noktalar birleştirilerek çizgi grafiği elde edilecektir.

Şekil 2.12: Yıllara göre sağlık bakanlığı birinci basamak kuruluşları sevk oranı

Şekil 2.12’ de verilen çizgi grafik ile Tablo 2.16’daki veriler daha kolay anlaşılabilir duruma getirilmiştir. 2002 yılında birinci basamak sağlık kuruluşlarında sevk oranı 16,7 iken bu oran 2010 yılında 0,4’ e kadar düşmüştür.

Örnek 2.10:

Yıllara göre kemik iliği nakli merkezlerindeki değişime ilişkin veriler Tablo 2.17’de verilmiştir. Uygun grafiğin hangisi olduğunu belirterek, çiziniz ve grafiği kısaca yorumlayınız.

Tablo 2.17: Yıllara göre kemik iliği nakli merkezleri

Yıllar Pediatrik Erişkin Toplam

2004 7 12 19

2005 7 13 20

2006 7 14 21

2007 8 18 26

2008 9 21 30

2009 9 25 34

2010 10 28 38

Kaynak: Sağlık İstatistikleri Yıllığı, 2010

Verileri özetlemek için farklı grafikler kullanabilir. Ancak kemik iliği nakli merkezi sayılarını yıllar itibariyle, pediatri, erişkin ve toplam açısından göstermek için kullanılacak en iyi grafik çoklu çizgi grafiğidir. Çoklu çizgi grafiği, sonuçların bütünsel bir çerçevede değerlendirmesini sağlamaktadır Grafiğin apsis ekseninde yıllar ordinat ekseninde ise sayılar yer alır. Analitik düzlemde sırasıyla pediatri, yetişkin ve toplam için yıllara karşılık gelen nakil merkezleri sayıları işaretlenir. Bu işaretlenen noktaların birleştirilmesi ile çoklu çizgi grafiği çizilir. Çoklu çizgi grafikleri çiziminde her bir değişken için çizilen değişkenin diğer değişken veya değişkenlerden ayrımının yapılması çok önemlidir. Şekil 2.13’ teki çoklu

16,7

6,4

2,4 1,3

1 0,4 0

2

4

6

8

10

12

14

16

18

2002 2006 2007 2008 2009 2010Yıllar

Oran(%)

40

çizgi grafiği incelendiğinde pediatri, erişkin ve toplam için farklı desenlerin kullanıldığı görülmektedir. Çizgiler üzerinde yıllar için alınan değerleri göstermek için kullanılan işaretçiler görülmektedir. Örneğin pediatrik için kullanılan işaretçi karelerdir. İstendiğinde işaretçiler etiketlenerek ilgili sayılar da gösterilebilir.

Şekil 2.13: Yıllara Göre Kemik İliği Nakil Merkezleri 2004-2010

Şekil 2.13’ teki çoklu çizgi grafiği incelendiğinde 2006 yılı itibariyle kemik iliği nakil merkezleri sayısında bir artış olduğu görülmektedir. Yeni açılan kemik iliği nakil merkezleri büyük oranda erişkinler için olduğu görülmektedir.

Yıllara göre Sağlık Bakanlığı bütçesinin GSYİH (Gayri Safi Yurtiçi Hasıla) içindeki oranına ilişkin veriler aşağıdaki Tablo 2.18’ de gösterilmiştir. Çizgi grafiğini çiziniz.

41

Tablo 2.18: Yıllara göre sağlık bakanlığı bütçesinin GSYİH içindeki oranı

Yıllar Oran

1999 0,77

2000 0,68

2001 0,76

2002 0,87

2003 0,81

2004 0,80

2005 1,04

2006 1,13

2007 1,23

2008 1,26

2009 1,53


Birikimli Frekansların Grafikle Gösterilmesi Birikimli dağılımların grafikleri çizilirken gruplar apsiste, birikimli frekanslarda ordinat ekseninde yer alır. Terim sayısı çok olduğu ya da özellikle birkaç dağılımın aynı grafik üzerinde gösterilmesi ve karşılaştırılması söz konusu olduğunda histogram yerine birikimli frekans grafikleri tercih edilmektedir. “-den az” birikimli frekanslar için grafik çizilirken, koordinat sisteminde grup üst sınıflarıyla ilgili gruba karşılık gelen birikimli frekansların belirledikleri noktalar birleştirilerek grafik oluşturulur. “-den çok” grafikleri oluşturulurken ise, grup alt sınırlarıyla ilgili gruba karşılık gelen birikimli frekansların belirledikleri noktalar birleştirilerek grafik çizimi yapılır. “-den az” birikimli frekanslara ait eğri ilk grubun frekansından başlayarak sürekli artan, “-den çok” birikimli frekanslar ise son grubun frekansına kadar sürekli azalan bir eğridir.

Örnek 2.11: Aşağıda verilen gruplandırılmış frekans dağılımı için birikimli frekansları oluşturarak grafiğini çizelim.

Gruplar Frekans

25 - 30 15

30 - 35 25

35 - 40 68

40 - 45 54

45 - 50 20

50 - 55 18

Toplam 200

42

Çözüm 2.11:

Gruplar Frekans “-den az” “-den çok”

20-30 15 15 200

30-40 25 40 185

40-50 68 108 160

50-60 54 162 92

60-70 20 182 38

70-80 18 200 18

Toplam 200

Şekil 2.14: Birikimli frekans eğrileri

MICROSOFT OFFICE EXCEL UYGULAMASI Microsoft Office Excel ortamında kolayca grafikler oluşturulabilir. Oluşturduğunuz bu grafikler, anlamlı olacak şekilde verileri görüntülemenize ve daha kolay yorumlanmasına yardımcı olur. Excel, sayısız grafik türünü destekler. Excel'de yeni bir grafik oluşturmak için öncelikle sayısal girdilerden oluşan bir veri aralığına sahip olmanız gerekir.

Aşağıdaki resimde gösterilen çalışma sayfası verilerinin grafiklerinin çizilmesi için gerekli adımları gösterelim.

0

50

100

150

200

250

25 35 45 55 65 75

Fre

kan

s

Gruplar

den az

den çok

43

1. Adım: Grafiği çizilecek veri aralığı içinden bir hücre seçerek Ekle sekmesine tıklayarak, Grafikler grubunu görüntüleyiniz.

2. Adım: Grafikler grubunda bulunan Sütun düğmesine daha sonra açılan menüden 2-b Sütun grubunda bulunan ve seçtiğiniz grafik türünün alt türü olan Kümelenmiş Sütun tıklayınız. Elde ettiğiniz grafik üzerinde fare sağ tuşa basarak veri seç ve buradan da satır/sütün değiştir öğesini tıklayınız. Böylece aşağıdaki grafiği elde edeceksiniz.

44

3. Adım: Başlık eklemek istediğiniz grafiği fare ile tıklayınız. Tasarım, Düzen ve Biçim sekmeleri eklenerek Grafik Araçları görüntülenir.

45

Buradan Düzen sekmesinde, Etiketler grubundaki Grafik Başlığını fare ile tıklayınız. Grafik Başlığı metin kutusuna grafik başlığı olmasını istediğiniz metni yazınız.

Şimdi aynı veriler için çizgi grafik çizelim. Bunun için yukarıdaki adımlar da ekle sekmesinden grafik grubundan ise çizgi seçilerek çizgi grafik elde edilir. Elde ettiğiniz grafik üzerinde fare sağ tuşa üzerinde istediğiniz değişiklikleri yapabilirsiniz. Böylece aşağıdaki grafiği elde edeceksiniz.

46

Özet

Sağlık kurumu yöneticileri işletmenin geçmiş ve bugünkü durumunu betimleyerek, geleceğe yönelik planlamalar yapabilmesi ancak amaca yönelik verileri derleyip bu verileri analiz etmesi ile mümkün olabilir.

Veri derlemek, gözlemi yapılacak birimleri ölçmek veya saymak, sonara da bunları göz önünde buldurulan değişken ya da değişkenlerin hangi konumlarına karşılık geldiklerini belirlemek ve kaydetmektir.

Sağlık yöneticileri için veri kaynakları ölümler, doğumlar, hastalıklar ve sağlık hizmetleri konusunda sürekli olarak tutulan kayıtlar veya deneylerle saptanan veriler olabilir. İstatistikte toplanan ilk verilere ham veri olarak tanımlanır. Ham veri herhangi bir düzenleme ve işleme tabii tutulmamış veridir.

Derlemenin yapılabilmesi için derlemeye ilişkin konu ve gözlenecek birimlerin açık bir biçimde tanımlanarak zaman – mekan dikkate alınaraksınırlandırılması gerekir.

Derleme verilerin elde ediliş biçimine göre, doğrudan veya dolaylı; hakkında bilgi edinilmek istenin kütlenin tamamının incelenip incelenmemesine göre genel ve kısmi; birimlerinbelirli bir anda ve yerde mi yoksa belirli bir zaman aralığı boyunca sürekli olarak kaydedilmesine göre ani veya devamlı derleme olarak sınıflandırılır.

Derlenen veriler doğru, güvenilir, güncel ve en az maliyetle elde edilmiş olmalıdır.

Veri toplama teknikleri sistematik veri toplama teknikleri ve özel veri toplama teknikleri olmak üzere ikiye ayrılmaktadır. Sistematik veri kaynakları, kayıtlar, sayımlar ve özel bildirimler, özel veri toplama teknikleri ise; gözlem, görüşme, anket, taramalar ve muayenelerdir.

Tablo, elde edilen sayısal veya sözel verilerin satır ve sütünler halinde düzenlenmiş halidir.Tablolar verilerin daha kolay anlaşılmasını sağlar. İstatistiksel verilerin sunulduğu tabloların üç temel özelliği: tablonun hangi bilgiyi içerdiğini gösterir bir başlığının, satır ve sütunlarının olmasıdır.

Verilerin daha anlaşılır bir şekilde sunumunu sağlayan diğer bir gösterim grafiklerdir. Bir grafiğin kolayca anlaşılabilir ve çiziminin objektif olması oldukça önemlidir. Aynı zamanda

grafik konusunu açıklayan bir başlığa sahip olmalıdır. Grafik çiziminde; histogram, çizgi grafiği, çubuk grafiği ve daire grafik gibi grafik türleri kullanılabilir.

Verilerin gruplandırılmasında en önemli konular; ilgilenilen değişkenin kesikli ya da sürekli olması, grup sayısı ve grup aralığıdır. Öncelikle elde edilen ham verilerin dizi biçiminde düzenlenmesi gereklidir. Küçükten büyüğe sıralanmış olarak düzenlenen verilerin kaç grupta sınıflandırılacağının belirlenmesi için genellikle Sturges Kuralı kullanılır. Sturges kuralı uygun grup sayısının ve grup aralığının hesaplanmasınısağlamaktadır.

Sturges kuralı yardımıyla grup sayısını hesaplamak için aşağıdaki matematiksel eşitlik kullanılır:

1 (3,3 log )k n

k, grup sayısını n ise toplam gözlem sayısını göstermektedir. Grup sayısı belirlendikten sonra grup aralıklarını hesaplamak için veri setindeki gözlenen en küçük ve en büyük değer yardımıyla aşağıdaki eşitlik kullanılır;

enb enkx xck

Bir frekans dağılımında, her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan dağılıma birikimli dağılım, bu tür oluşturulan frekanslara da birikimli frekans dağılımları adı verilir. Birikimli frekanslar, küçükten büyüğe ya da büyükten küçüğe oluşturulabilir. Eğer birikimli frekanslar küçükten büyüğe oluşturulmuşsa “-den az”, büyükten küçüğe oluşturulmuşsa “-den çok” olarak isimlendirilir. Birikimli frekanslar, gözlem değerlerinin büyüklüklerine göre kaçıncı sırada yer aldıklarının belirlenmesinde kullanılır.

Verileri kolay anlaşılabilir hale getirerek sunmanın bir yolu da grafiklerdir. Grafikler verilerin geometrik şekilleridir. Grafik çizimi belli kurallar çerçevesinde yapılmalıdır. Tablolarda olduğu gibi grafiklerin de konusunu gösteren bir başlığı olmalıdır. Bir grafikte yer alan şekil ve çizgilerin anlamları grafik üzerinde belirtilmelidir. Grafiğin apsis ve ordinat eksenlerinin ölçeklendirilmesi ve bu eksenlerin tanımları grafik üzerinde gösterilmelidir. Grafikte anlaşılması ve yorumlanması zor olan

47

işaretlemeler ve şekillere yer verilmemelidir.Tüm bunlara ek olarak çizilen grafiğin kaynağının da belirtilmesi oldukça önemlidir.

Birbirine bitişik dikdörtgenlerden oluşan grafiğe histogram adı verilir. Histogram sürekli nicel veriler için uygun bir gösterim biçimidir. Özellikle aralıklı ölçekle ölçülmüş ve gruplandırılmış verilerin gösteriminde kullanılmaktadır. Histogram çiziminde diğer önemli konulardan biri grupların bölüm aralıklarının eşit olmasıdır. Grup aralıkları eşit olmadığında frekansların ayarlanması gerekmektedir. Histogramda grup aralıkları eşit olduğunda dikdörtgenlerin tabanlarının bir birim olduğu kabul edilmektedir. Grup aralıkları eşit olmadığında dikdörtgen tabanlarının bir birim olacak şekilde düzenlenmesi için frekansların basit matematiksel işlemler ile ayarlanır. Bunun için frekanslar grup aralığına bölünerek dikdörtgenlerin alanları ile grupların frekansları eşit hale getirilir.

Nitel verilerin gösteriminde sıklıkla çubuk grafikleri kullanılmaktadır. Bu grafikte, sıralayıcı veya sınıflayıcı ölçekle ölçülmüş değişkenlere ait verilerin sayılarını veya oranlarını gösterilmektedir. Çubuk grafiklerinde gruplar tabanları eşit ve birbirine bitişik olmayan dikdörtgenler ile çizilir.

Daire grafikleri tek bir değişkene göre çizilen grafiklerdir. Nitel verilerin grafiksel gösteriminde kullanılmaktadır. Bir nitel değişkenin düzeyleri az olduğunda çoğunlukla daire grafikleri tercih edilmektedir. Dairenin alanı değişkenin düzeylerinin 360 lik daire içindeki paylarına göre parçalara ayrılır.

Çizgi grafikleri nicel bir değişkenin almış olduğu değerlerin frekanslarının dağılımını göstermek için kullanılmaktadır. Çizgi grafikleri, basit ve çoklu çizgi grafikleri olmak üzere ikiye ayrılmaktadır. Çizgi grafikleri belli bir aralıkta grafik üzerinde işaretlenen noktaların bir çizgi ile birleştirilmesi ile oluşturulur.

Birikimli dağılımların grafikleri çizilirken gruplar apsiste, birikimli frekanslarda ordinat ekseninde yer alır. Terim sayısı çok olduğu ya da özellikle birkaç dağılımın aynı grafik üzerinde gösterilmesi ve karşılaştırılması söz konusu olduğunda histogram yerine birikimli frekans grafikleri tercih edilmektedir.

48

Kendimizi Sınayalım

1. Aşağıdakilerden hangisi istatistik birimi değildir?

a. Hastane

b. Doktor

c. İntihar

d. Kabus

e. Yangın

2. Bir psikiyatri kliniğine gelen hastaların memnuniyet düzeyleri araştırılmak istenmektedir. Bu olaydaki birim nedir?

a. Hastane

b. Doktor

c. Memnuniyet

d. Tanı

e. Hasta

3. Aşağıdaki olaylardan hangisi ani veri derlemeye konu oluşturur?

a. Belli bir yer ve zaman aralığındaki doğumlar

b. Belli bir yer ve zamandaki aralığındaki intiharlar

c. Nüfus sayımı

d. Belli bir yer ve zamandaki trafik kazaları

e. Belli bir yer ve zamandaki hasta hakları birimine gelen şikayetler

4. Aşağıdakilerden hangisi derleme türü değildir?

a. Genel derleme

b. Devamlı derleme

c. Kısmi derleme

d. Olay derleme

e. Ani derleme

5. Aşağıdakilerden hangisi bir verinin taşıması gereken özelliklerden değildir?

a. Soyut

b. Güvenilir

c. Güncel

d. Doğru

e. Düşük maliyet

6. Aşağıdakilerden hangisiz özel veri toplama tekniklerinden biri değildir?

a. Gözlem

b. Kayıtlar

c. Anket

d. Görüşme

e. Tarama

7.

X Frekans

5 3

7 6

9 8

11 11

13 7

15 5

Toplam 40

Yukarıda verilen frekans dağlımı için “-den az” birikimli frekanslar oluşturulmak istendiğinde, birikimli frekanslar aşağıdakilerden hangisidir?

a. b. c.

d. e.

a. b. c. "-den az"

3

9

17

28

35

40

a. b. c. a. b. c. "-den az"

3

9

15

25

38

40

a. b. c. a. b. c. "-den az"

40

37

31

23

12

5

d. "-den az"

3

6

8

11

7

40

e.e. "-den az"

3

11

17

32

35

38

49

8. Aşağıdaki “-den az” ve “-den çok” birikimli frekanslar birlikte verilmiştir.

Gruplar Frekans “-den az” “-den çok”

0-6 20 20 127

6-12 24 44 107

12-18 35 79 83

18-24 26 105 48

24-30 22 127 22

Yukarıdaki tabloya göre sayısal değeri 18’ den büyük gözlem sayısı kaçtır?

a. 105

b. 79

c. 44

d. 48

e. 26

9. Bir hastanenin acil servisine haftanın günlerine göre geliş yoğunluğu aşağıda yer alan daire grafiğinde gösterilmiştir.

Daire grafiği yorumlandığında aşağıdaki ifadelerden hangisi yanlıştır?

a. Acil servise en çok Pazar günleri hasta gelmektedir.

b. Salı, Çarşamba ve Perşembe günleri hasta yoğunluğu aynı düzeydedir.

c. Pazartesi günü hasta yoğunluğu Cuma gününden fazladır.

d. Cumartesi hasta yoğunluğu haftalık hasta yoğunluğunun % 16’ sıdır.

e. Hafta sonları acil servis hafta içine göre daha yoğun olmaktadır.

10. Aşağıdakilerden hangisi bir tablonun taşıması gereken özellik değildir?

a. Her tablonun bir başlığı olmalıdır.

b. Tablo karmaşık olmalı ve çok sayıda bilgi içermelidir.

c. Tablonun satır ve sütun başlıkları yazılmalıdır.

d. Tablonun kaynağı belirtilmelidir.

e. Tabloda kullanılan değişkenin varsa ölçü birimi belirtilmelidir.

Pazartesi 13%

Salı 13%

Çarşamba 13%

Perşembe 13%

Cuma 14%

Cumartesi 16%

Pazar 18%

50


1. d Yanıtınız yanlış ise “Veri ve Derleme” başlıklı konuyu yeniden gözden geçiriniz.

2. e Yanıtınız yanlış ise “Veri ve Derleme” başlıklı konuyu yeniden gözden geçiriniz.

3. c Yanıtınız yanlış ise “Veri ve Derleme” başlıklı konuyu yeniden gözden geçiriniz.

4. d Yanıtınız yanlış ise “Derleme Türleri” başlıklı konuyu yeniden gözden geçiriniz.

5. a Yanıtınız yanlış ise “Verinin Özellikleri” başlıklı konuyu yeniden gözden geçiriniz.

6. b Yanıtınız yanlış ise “Özel Veri Toplama Teknikleri” başlıklı konuyu yeniden gözden geçiriniz.

7. a Yanıtınız yanlış ise “Birikimli Frekans Dağılımları” başlıklı konuyu yeniden gözden geçiriniz.

8. d Yanıtınız yanlış ise “Birikimli Frekans Dağılımları” başlıklı konuyu yeniden gözden geçiriniz.

9. c Yanıtınız yanlış ise “Daire Grafiği” başlıklı konuyu yeniden gözden geçiriniz.

10. b Yanıtınız yanlış ise “Tablolar” başlıklı konuyu yeniden gözden geçiriniz.


Sıra Sizde 1 Anakütleyi oluşturan birimlerin tamamının gözlenmesi genel derleme olarak tanımlanmaktadır. Anakütleyi oluşturan birimlerin tamamının gözlenmesi yerine olası gözlem birimlerinin bir bölümü seçilerek incelenir. Bu derleme türü kısmi derleme olarak tanımlanır .

Sıra Sizde 2 Verinin taşıması gereken dört özellik; doğru, güvenilir, güncel ve düşük maliyetli olmasıdır.

Sıra Sizde 3 Sağlık alanında kullanılan sistematik veri kaynakları; kayıtlar, sayımlar ve özel bildirimledir.

Sıra Sizde 4 İstatistiğin üç temel işlevi betimleme, çözümleme ve tahmindir.

Sıra Sizde 5 1.Grup Sayısının Hesaplanması

50n (toplam gözlem sayısı)

log50 1,699

1 (3,3 1,699) 6,61 7k

Veriler 7 grup altında düzenlenecektir.

2. Grup Aralığının Hesaplanması

Veri setimizde kayıt altına alınan en küçük değer 60 yıl ve en büyük değer 73’tür.

73enbx

60enkx

73 602

7c

Grup aralığının genişliği 2 olacaktır.

51

3. Grup sayısı 7 ve grup aralığı 2’ ye göre verilerin tablolaştırılması

Gruplar Frekans

60 - 62’den az 2

62 - 64’den az 6

64 - 66’dan az 8

66 - 68’den az 16

68 - 70’den az 7

70 - 72’den az 6

72 - 74’den az 5

Toplam 50

Sıra Sizde 6

Sıra Sizde 7

Sıra Sizde 8 Grafiği çizebilmek için Microsoft Excel kullanılabilir. Tablonun tümünü seçerek kopyalayınız ve Excel’de bir çalışma sayfasına yapıştırınız. Excel’e yapıştırdığınız tablonun tamamını seçerek ekle sekmesinden çubuk grafiği seçilerek grafik çizilir.

Sıra Sizde 9

Sıra Sizde 10

İmaj Oransal Frekans

Çok İyi 0,125

İyi 0,400

Orta 0,320

Zayıf 0,095

Çok Zayıf 0,060

Toplam 1,000

Gruplar15 30 45 60 75

15

5

10

20

30

90

52


Anadolu Üniversitesi Açık Öğretim Fakültesi, İstatistik, Editör: Prof. Dr. Ali Fuat Yüzer, AÖF Yayın No: 771, Anadolu Üniversitesi, Eskişehir.

Çömlekçi, N. (1997). Temel İstatistik İlke ve Teknikleri, Bilim Teknik Yayınevi, Eskişehir.

Çömlekçi, N. (1998). Bilimsel Araştırma Yöntemi ve İstatistiksel Anlamlılık Sınamaları, Bilim Teknik Yayınevi, Eskişehir

Gürsakal, N. (2007). Betimsel İstatistik, Nobel Yayın Dağıtım, İstanbul.

Serper, Ö. (1988). Uygulamalı İstatistik I, Filiz Kitabevi, İstanbul.

Sümbüloğlu, K. (2001). Sağlık Alanına Özel İstatistiksel Teknikler, Somgür Yayıncılık, Ankara.

Sağlık istatistikleri yıllığı (2010), T.C. Sağlık Bakanlığı, Bakanlık Yayın no: 832.

http://www.tedavi.saglik.gov.tr

http://www.sagliknet.saglik.gov.tr

http://www.istatistik.saglik.gov.tr

http://www.sagliknet.saglik.gov.tr/

http://www.istatistik.saglik.gov.tr/

54


İstatistik serileri için duyarlı ortalamaları hesaplayabilecek,

İstatistik serileri için duyarlı olmayan ortalamaları hesaplayabilecek,

İstatistik serileri için değişkenlik ölçülerini hesaplayabilecek


Anahtar Kavramlar

Aritmetik ortalama

Tartılı aritmetik ortalama

Geometrik ortalama

Mod

Medyan

Standart sapma

Varyans

Değişim katsayısı

İçindekiler

Giriş

Verilerin Özetlenmesi

Aritmetik Ortalama

Geometrik Ortalama

Tartılı Aritmetik Ortalama

Mod

Medyan

Değişkenlik ölçüleri

Standart Sapma

Değişim katsayısı

3

55

GİRİŞBundan önceki bölümlerde, verilerin toplanması, düzenlenmesi (dizi, frekans serisi, gruplandırılmış seri) ve grafiklerle gösterilmesi ayrıntılı olarak anlatıldı. Frekans dağılımları ve grafikler, bir veri seti içindeki değerlerin dağılımı hakkında genel bir fikir vermede etkilidir. Bununla birlikte, daha ileri analizler için,verilerin tek bir değerle ifade edilebileceği, kesin bilgilere ihtiyaç vardır. Bu ünitede, bir veri setinin tek bir değerle ifade edilmesini sağlayan ortalamalar anlatılacaktır. Daha sonra da verilerin bir değer etrafında nasıl dağıldıklarının ölçüsü olarak, değişkenlik ölçüleri açıklanacaktır.

VERİLERİN ÖZETLENMESİBir araştırma sonucu toplanan verilerin frekans serisi veya gruplandırılmış seri halinde gösterilmesi, veriler hakkında genel fikir verebilir. Yine bu verilerin grafikle gösterilmesi, verilerin nasıl dağıldıkları hakkında genel bir eğilim yansıtır. Ancak bunların hiç biri verilerin tek bir değerle gösterilmesini sağlamazlar. Oysa derlenen verileri “tek bir sayıda” özetleyecek kolay ölçütlere de ihtiyaç vardır. Bu özet veri, araştırma sonunda derlenen verilerin hangi değer etrafında toplandıklarının bir göstergesi olacaktır. Bir seriyi temsil etmeye ve özetlemeye yarayan tek bir rakama “ortalama” denir. Dolayısıyla ortalamalar veri setindeki en küçük değerden daha küçük, en büyük değerden de daha büyük olamazlar.

enk enbx Ortalama x

Hesaplanan ortalamanın serideki terimlerin çoğuna yakın değer alması, söz konusu ortalamanın seriyi iyi temsil ettiğini gösterir. Ortalamalar hesaplanırken, serideki bütün gözlem değerleri hesaba katılarak hesaplanıyorsa buna “duyarlı ortalamalar”, bazı gözlem değerlerine göre hesaplanıyorsa buna da “duyarlı olmayan ortalamalar” adı verilir. Başka bir ifadeyle ortalama hesaplanırken, gözlem değerlerinden birinin değiştirilmesiyle ortalama değeri değişiyorsa bu duyarlı ortalamadır. Aksi durumda gözlem değerlerinden birinin değiştirilmesi ortalama değerini etkilemiyorsa buna da duyarlı olmayan ortalama denir. Bu ünitede, duyarlı ortalamalardan aritmetik ortalama ve geometrik ortalama, duyarlı olmayan ortalamalardan da mod ve medyan anlatılacaktır.

Aritmetik Ortalama

Hesaplanması kolay ve çok geniş bir uygulama alanına sahip olduğu için, istatistikte en çok kullanılan ve ortalama denilince akla gelen ilk ortalama “aritmetik ortalama” dır. Aritmetik ortalama, veriler toplamının veri sayısına bölünmesi şeklinde tanımlanabilir. Bir ortalama, ana kütlenin tamamı için hesaplanacağı gibi, ana kütleden seçilen bir örneklem kütlesi için de hesaplanır. Kütledeki birimlerin sayısı, yani kütle büyüklüğü genellikle N ve kütle ortalaması da ile gösterilir. Örneğin, A hastanesinde

yatan toplam hasta sayısı 120 kişi ise ve amacımız bu hastaların tamamını incelemek ise kütle mevcudu N=120 olacaktır. Bu hastaların yaş ortalamasını belirlemek istediğimizde, hasta yaşlarının toplamı, 120’ye bölünerek hesaplanacaktır. Yaş değişkeni x ile gösterildiğinde, kütle ortalaması;

Ortalamalar ve Değişkenlik Ölçüleri

56

1 2 120....

120

x x x

olarak hesaplanacaktır. Bilindiği gibi toplam simgesi sembolüyle gösterilir. Bu durumda kütle

ortalaması kısaca

1

N

ii

x

N

formülüyle belirlenir.

Ancak kütle çok büyük olduğunda, bunun tamamını gözlemlemek daha çok maliyet ve zaman gerektirir ya da bazen kütlenin tamamı incelemek imkansız olabilir. Böyle durumlarda daha az sayıda birimle araştırma yapılır. Örneğin Türkiye’deki tüm hastanelerde yatan hastaların incelenmesi oldukça zor olacağından, bunlar arasından çeşitli tekniklerle belirlenen ve “örneklem “olarak ifade edilen, daha az sayıda hasta ile araştırma yapılır. Kütle içinden seçilen birim sayısı da genellikle n simgesiyle gösterilir. n birim için hesaplanılan ortalamaya “örneklem ortalaması” denir ve aşağıdaki gibi hesaplanır:

1

n

ii

xx

n

Eğer istatistik serisi, frekans serisi veya gruplandırılmış seri ise aritmetik ortalama,

1

1

.k

i ii

k

ii

x nx

n

formülüyle hesaplanacaktır.

Bu ünitenin ilerleyen sayfalarındaki örnek çözümler aksi belirtilmedikçe örneklem verileri için çözülecektir.

Örnek 3.1:

Eskişehir Yunus Emre Devlet hastanesi dâhiliye kliniğinde yatarak tedavi gören ve taburcu edilen 10 hastanın, hastanede kalış süreleri gün olarak aşağıdaki gibi elde edilmiştir. Buna göre örneklem ortalamasını hesaplayınız.

ix : 8 10 12 15 16 18 20 21 23 25

Çözüm 3.1:

Yukarıda ifade edilen örneklem ortalaması formülüne göre, verilerin toplanıp veri sayısına bölünmesi gerekir. O halde veriler toplamı;

10

1i

i

x

=8+10+12+15+16+18+20+21+23+25=168

olarak hesaplanacaktır. 168 değeri aynı zamanda terimler toplamı olarak da ifade edilir. Terimler toplamının, terim sayısına bölünmesiyle elde edilecek aritmetik ortalama,

1 16816,8

10

n

ii

xx

n

gün olarak hesaplanacaktır.

57

Örnek 3.2:

A hastanesinin çeşitli kliniklerinde yatan 25 hastalık örneklem seçilmiş ve bu hastaların tedavisi için kullanılan B maddesi tüketimi değerleri ölçülmüş ve tüketen hasta sayılarıyla beraber Tablo 3.1’deki değerler elde edilmiştir. B maddesi tüketim ortalamasını hesaplayınız.

Tablo 3.1: B maddesi Tüketim Verileri

B Maddesi Tüketimi ( ix ) Hasta Sayısı ( in )

120 2 125 3 130 5 135 7 140 5 145 2 150 1

Çözüm 3.2:

Yukarıdaki örnekte verilen seri bir frekans serisidir. Frekans serileri için terimler toplamı ise;

ix 120+120+125+125+125+…………..+145+145+150

şeklinde belirlenecektir. Ancak bu şekilde hesaplama işlemi uzatacağından, terimler frekanslarla çarpılıp, toplamı alınır. Bu değerler de Tablo 3.2’de verilmiştir:

Tablo 3.2: Frekans Serisi İçin Gerekli İşlemler Tablosu

x Hasta Sayısı ( in ) i

nxi.

120 2 240 125 3 375 130 5 650 135 7 945 140 5 700 145 2 290 150 1 150

Toplam 3350 Terimler toplamı 3350 olarak hesaplandığına göre, bu değerin frekanslar toplamına bölünmesiyle,

verilen frekans serisinin ortalaması hesaplanmış olacaktır. Dolayısıyla B maddesi tüketim ortalaması

1

1

.k

i ii

k

ii

x nx

n

=

3350134

25

olarak elde edilecektir.

58

Örnek 3.3:

A hastanesinde yatan hastaları arasından tesadüfi olarak seçilen 40 hastanın tedavi süreleri ve hasta sayıları Tablo 3.3’deki gibi elde edilmiştir. Aritmetik ortalamayı hesaplayınız.

Tablo 3.3: Örnek 3.3 Verileri

Tedavi Süresi (Gün) Hasta Sayısı ( in )

3-5 3

5-7 5

7-9 9

9-11 12

11-13 7

13-15 3

15-17 1

Çözüm 3.3:

Verilen seri gruplandırılmış bir seridir. Gruplandırılmış serilerin aritmetik ortalaması da frekans

serilerindeki gibi hesaplanır. Ancak ix değerlerinin hesaplanması gerekir. ix değerleri de her bir grubun

ortalaması alınarak hesaplanır. Örneğin, 3-5 grubu için ix değeri (3 5)

42

olarak elde edilecektir.

Diğer gruplara ilişkin grup ortalamaları da benzer şekilde hesaplandığında Tablo 3.4’de verilen sonuçlara ulaşılacaktır.

Tablo 3.4: Gruplandırılmış Seri İçin Gerekli İşlemler Tablosu

Grup Ortalaması in

inxi.

4 3 12

6 5 30

8 9 72

10 12 120

12 7 84

14 3 42

16 1 16

Toplam 40 376

Yine, terimler toplamı olan 376 değeri, frekanslar toplamı olan 40 değerine bölündüğünde, istenilen

ortalama değeri,

1

1

.k

i ii

k

ii

x nx

n

=

3769,4

40

gün olarak hesaplanacaktır.

Ancak belirtmek gerekir ki, gruplandırılmış serilerde aritmetik ortalama hesaplanırken, her bir grubun ortalaması alındığından, gruplandırılmış serilerdeki aritmetik ortalama yaklaşık olarak hesaplanabilmektedir.

Aritmetik ortalama, aşırı küçük veya büyük değerlerden etkilenen bir ortalamadır. Dolayısıyla veriler içinde, diğer verilere nazaran aşırı küçük veya büyük değerler olması durumunda, aritmetik ortalama tüm

59

verileri temsil eden bir ortalama olmayacaktır. Böyle durumlarda ise temsili olabilecek yani, verilerin geneline yakın olabilecek ortalama geometrik ortalamadır.

Geometrik Ortalama

Bir istatistik serisindeki veriler geometrik olarak artıyorsa ya da diğer verilere nazaran aşırı büyük ya da küçük değerler varsa, bu durumda aritmetik ortalama temsili olmayacağından, geometrik ortalama hesaplanır. Mikroorganizmaların çoğalması, nüfus artışı, gibi birbirinin katları olarak çoğalan yani geometrik artış gösteren verilerde geometrik ortalama kullanılır. Diziler için geometrik ortalama aşağıdaki gibi hesaplanır:

1 2. . .......nnG O x x x

Ancak veri sayısı çok olduğunda bu şekilde hesaplamak zorlaşacağından, önce ix ’lerin her birinin e

tabanına göre doğal logaritması olan “ln” leri alınır, daha sonra bunların toplamı terim sayısına bölünür. En sonunda bulunan bu sayının exponansiyeli alınır ve aşağıdaki gibi hesaplanır.

ln( )

.ix

nG O e

Gruplandırılmış ve frekans serilerinde ise aşağıdaki formülle belirlenir:

ln( )

.

i i

i

n x

nG O e

Örnek 3.4:

Bir hafta boyunca A hastanesinin acil servisine gelen hasta sayıları aşağıdaki gibi elde edilmiştir. Buna göre en uygun (temsili) ortalamayı hesaplayınız.

Tablo 3.5: Acil Servise Gelen Hasta Sayıları

Günler ix

1 12

2 15

3 10

4 18

5 13

6 11

7 100

Çözüm 3.4:

Seri incelendiğinde, son değerin diğer verilerden oldukça büyük olduğu görülecektir. Böyle durumlarda aritmetik ortalama, serideki aşırı büyük verilerden etkileneceğinden temsili olmayacaktır. Dolayısıyla duyarlı ortalamalardan geometrik ortalamanın hesaplanması gerekir. Çözümleme için önce verilerin “ln” değerleri hesaplanacaktır. Bu değerler de Tablo 3.6’da verilmiştir.

60

Tablo 3.6: Geometrik Ortalama İçin ln Değerleri

Günler ix ln( ix )

1 12 2,48

2 15 2,71

3 10 2,30

4 18 2,89

5 13 2,56

6 11 2,40

7 100 4,61

Toplam 19,95

ln değerlerinin toplamı formülde yerine yazıldığında,

ln 19,95( ) ( ) 2,857. 17,29

ix

nG O e e e

olarak bulunacaktır. Aynı serinin aritmetik ortalaması hesaplandığında ise 25,57 olarak elde edilecekti. Dolayısıyla serideki 100 değeri, aritmetik ortalamayı gerçek değerinin çok üzerine çıkarttığından, aritmetik ortalama temsili ortalama olmayacaktır.

Aşağıdaki istatistik serisi için temsili olabilecek duyarlı ortalamayı hesaplayınız.

ix in

5 3

7 7

10 10

13 4

500 1

Tartılı Aritmetik Ortalama

Ortalamaların ve oranların ortalamaları hesaplanmak istendiğinde ya da farklı zaman ve yerde yapılan deney sonuçlarını birleştirerek ortak bir değer hesaplama gerektiğinde, “tartılı aritmetik ortalama”

hesaplanır. in ‘ler tartı olmak üzere, ortalamaların ortalaması,

1

1

.k

i ii

t k

ii

x nx

n

formülüyle belirlenirken, oranları göstermek üzere oranların ortalaması da aşağıdaki gibi hesaplanır:

1

1

k

i ii

t k

ii

n pp

n

61

Örnek 3.5:

A ilacı ile tedavi edilen akut ishalli hastalardaki serum gereksinimleri, Tablo 3.7‘deki gibi olsun. Buna göre 5 klinikte hastalar için kullanılan serum miktarı ortalamasını hesaplayınız.


Klinik Adı Tedaviye Katılan Hasta Sayısı( in ) Ortalama Serum Miktarı(kg)

A 75 4,5 B 92 3,6 C 71 3,9 D 18 5,9 E 60 4,8

Çözüm 3.5:

Veriler incelendiğinde, kliniklerde tedaviye katılan hasta sayıları farklı olduğundan, bu verilerin çözümü için tartılı aritmetik ortalama kullanılacaktır. Verilen serum miktarları da ortalama değerler olduğundan, ortalamaların ortalaması için verilen formül yardımıyla hesaplanacaktır. Tedaviye katılan hasta sayıları tartı olmak üzere, gerekli hesaplamalar Tablo 3.8‘de verilmiştir:

Tablo 3.8: Tartılı Aritmetik Ortalama İçin Gerekli İşlemler Tablosu

Klinik Adı

Tedaviye Katılan Hasta

Sayısı ( in )

Ortalama serum

miktarı (kg) ix iinx

A 75 4,5 337,5 B 92 3,6 331,2 C 71 3,9 276,9 D 18 5,9 106,2 E 60 4,8 288,0

Toplam 316 1339,8

Hesaplanılan toplam formülde yerine yazıldığında, 5 klinikte kullanılan serum miktarı ortalaması

5

15

1

.i ii

t

ii

x nx

n

=

1339,84,24 kg

316 olarak belirlenecektir.

Örnek 3.6:

4 farklı klinikte, B anti-kanser ilacının deneme sonuçları aşağıdaki gibi elde edilmiştir. 4 klinikteki hayatta kalan hasta oranını hesaplayınız.


Klinik Adı Denemeye Katılan Hasta Sayısı( in ) 3. yılda hayatta kalan kanserli hasta oranı (%)

A 98 53,9

B 65 28,5

C 76 61,2

D 28 38,6

62

Çözüm 3.6:

Bu örnekte de kliniklerdeki denemeye katılan hasta sayıları farklı olduğundan tartılı ortalama hesaplanacaktır. Ancak bir önceki örnekten farklı olarak, ortalamalar yerine oranlar söz konusudur. O

halde oranlar için tartılı ortalama formülü kullanılacaktır. Bir önceki soruda olduğu gibi in ‘ler tartı

olmak üzere gerekli hesaplamalar Tablo 3.10‘da verilmiştir:

Tablo 3.10: Oranların Ortalaması İçin Gerekli İşlemler Tablosu

Klinik Adı in ip (%) ii pn

A 98 53,9 5282,2

B 65 28,5 1852,5

C 76 61,2 4651,2

D 28 38,6 1080,8

Toplam 267 12866,7

Gerekli toplamlar formülde yerine yazıldığında, 4 klinik için oranların ortalaması aşağıdaki gibi elde edilecektir:

Gerekli toplamlar formülde yerine yazıldığında, 4 klinik için oranların ortalaması aşağıdaki gibi elde edilecektir:

5

15

1

12866,748,19

267

i ii

t

ii

n pp

n

Dolayısıyla 4 klinikte, 3 yılsonunda hastaların hayatta kalma oranları %48,19 dur.

Şimdiye kadar anlatılan ortalamalar serideki tüm verilere göre hesaplanan ortalamalardı. Oysa bazı ortalamalar, bir serideki tüm gözlemleri dikkate almadan hesaplanır. Bundan sonraki kısımda da tüm verileri hesaba katmadan belirlenen ve “duyarlı olmayan ortalamalar” olarak isimlendirilen “mod” ve “medyan” açıklanacaktır.

Mod

İstatistikte, diziler ve frekans serileri için hesaplanması en kolay ortalama mod değeridir. Bir dizide en çok tekrarlanan değere “Mod” değeri denir. Frekans serlerinde bu değer en yüksek frekansa sahip olan değer olacaktır. Dizilerde ve frekans serilerinde mod değerini belirlemek oldukça basit olmasına rağmen, gruplandırılmış serilerde ise aşağıdaki formül yardımıyla belirlenecektir:

1

1 2a mMod L c

aL : Mod grubunun alt değeri,

1 : Mod grubunun frekansı ile bir önceki grubun frekansı arasındaki fark,

2 : Mod grubunun frekansı ile bir sonraki grubun frekansı arasındaki fark,

mc : Mod grubunun aralığıdır.

Gruplandırılmış serilerde frekans değeri en yüksek olan grup mod grubu olarak tanımlanır. Eğer grup aralıkları farklı ise grup aralıkları ünite 2’de anlatıldığı gibi ayarlanır.

63

Örnek 3.7:

B hastanesinde çalışan 15 personelin kullandığı yıllık izin süreleri gün olarak aşağıda verilmiştir. Bu veriler için mod değerini hesaplayınız.

13 12 14 15 18 22 25 15 30 18 24 18 17 23 16

Çözüm 3.7:

Veriler incelendiğinde en fazla görülen izin süresinin 18 olduğu yani, 3 defa yer aldığı görülecektir. Dolayısıyla aranılan mod değeri 18 gün olacaktır.

Örnek 3.2’deki veriler için mod değerini hesaplayınız.

Örnek 3.8:

Tablo 3.11’deki gruplandırılmış seri için mod değerini hesaplayınız.

Tablo 3.11: B Maddesi Tüketim Verileri

B Maddesi Tüketimi Hasta Sayısı ( in )

110-115 6 115-120 8 120-130 12 130-140 17 140-150 9 150-155 7 155-160 5

Çözüm 3.8:

En yüksek frekansın (17) bulunduğu grup, mod grubudur (130-140). Dolayısıyla mod grubunun alt değeri 130’dur. Mod grubunun frekansı 17 ve bir önceki grubun frekansı da 12 olduğuna göre, arasındaki fark 17-12=5 olacaktır. Yine mod grubundan sonraki frekans 9 olduğuna göre, bunun farkı da 17-9=8’dir. Mod grubunun aralığı da 140-130=10 olduğuna göre, formülde yer alan değerler aşağıdaki gibi olacaktır:

aL =130

1 =5

2 =8

mc =10

Belirlenen bu değerler formülde yerine yazıldığında mod değeri,

1

1 2

5 50130 10 130 130 3,85 133,85

5 8 13a mMod L c

olarak hesaplanacaktır.

64

Medyan

Küçükten büyüğe sıralanmış verileri, iki eşit kısma ayıran ve tam ortaya düşen değere Medyan (ortanca değer) adı verilir.

Dizilerde medyan hesabı oldukça kolaydır. Önce gözlem sayısı 2’ye bölünür (n/2). Eğer (n/2) bir tamsayı değilse, bu değer tamsayıya çevrilir. Aranan medyan değeri de tam ortaya düşen bu gözlem değeridir. Örneğin, veri sayısı 17 olsun. 17/2 değeri 8,5 olacağından, bu değer tamsayıya

çevrildiğinde 9 olacaktır. (2

1n). Dolayısıyla medyan değeri küçükten büyüğe sıralanmış veri setindeki

9. değer olacaktır (x9). Eğer (n/2) tamsayı ise aranılan medyan değeri aşağıdaki gibi belirlenir:

/2 ( /2) 11/2 2

n nx xM

Frekans serilerinde medyan değerini hesaplayabilmek için frekans serisindeki gözlem değerlerinin sırasının bilinmesi gerekir. Bu nedenle küçükten büyüğe “birikimli frekanslar” oluşturulur ve medyan değeri dizilerdeki gibi hesaplanır.

Gruplandırılmış serilerde medyan hesabı ise aşağıdaki formülle hesaplanacaktır:

1/22 a

a mm

nn

M L cn

Formüldeki;

aL : Medyan grubunun alt değeri,

an : Medyan grubundan önceki grupların frekanslar toplamı,

mn : Grup frekansı,

mc : Medyan grubunun aralığı’dır.

Örnek 3.9:

Örnek 3.1 ‘deki veriler için medyan değerini hesaplayınız.

Çözüm 3.9:

Çözüm için önce n/2 değerini hesaplamak gerekir. Örneğimizde n=10 olduğuna göre 10/2=5 olarak hesaplanacaktır. 5 değeri bir tamsayı olduğuna göre medyan değeri

10/2 (10/2) 1 5 61/2 2 2

x x x xM

formülünden,

5 ve 6. terimin ortalaması olarak elde edilecektir. Terimleri küçükten büyüğe sıralanmış serideki 5 nci değer 16, 6 ncı değer de 18 olduğuna göre, medyan değeri

1/2

16 1817

2M

gün olacaktır.

65

Örnek 3.10:

Örnek 3.2’deki veriler için medyan değerini hesaplayınız.

Çözüm 3.10:

Veriler frekans serisi şeklinde olduğundan, medyan değerinin hesaplanabilmesi için, birikimli frekanslara ihtiyaç vardır. Birikimli frekansların bulunduğu tablo ise aşağıda verilmiştir:

Tablo 3.12: Örnek 3.10 İçin Birikimli Frekanslar Tablosu

B Maddesi Tüketimi ( ix ) Hasta Sayısı ( in ) Birikimli Frekanslar

in

120 2 2 125 3 5 130 5 10 135 7 17 140 5 22 145 2 24 150 1 25

Şimdi de (n/2) değerinin belirlenmesi gerekir. 25

12,52 2

n olduğundan ve tamsayı olmadığından

bu değer yuvarlatılarak tamsayıya 13 olarak çevrilir. Yani medyan değeri 13. değerdir. Bu da birikimli frekanslarda 11. değerden 18. değere kadar olan 135 değeri olacaktır.

Örnek 3.11:

Örnek 3.3’deki veriler için medyan değerini hesaplayınız.

Çözüm 3.11:

Örnek 3.3’deki veriler gruplandırılmış bir seri olduğuna göre önce medyan grubunun bulunduğu grubu belirlemek gerekir. Bunun için de yine birikimli frekanslar hesaplanacaktır. Birikimli frekanslar Tablo 3.13’de verilmiştir:

Tablo 3.13: Örnek 3.11 İçin Birikimli Frekanslar Tablosu

Tedavi Süresi (Gün) Hasta Sayısı ( in ) Birikimli Frekanslar

in

3-5 3 3 5-7 5 8 7-9 9 17

9-11 12 29 11-13 7 36 13-15 3 39 15-17 1 40

Birikimli frekanslar belirlendikten sonra medyan grubunu belirleyebilmek için n/2=40/2=20 değeri belirlenir. 18. değerden 29. değere kadar olan veriler 9-11 grubundadır. O halde aranılan medyan grubu 9-11 grubudur. Dolayısıyla medyan grubunun alt değeri 9 olacaktır. Birikimli frekanslara bakıldığında, medyan grubundan önceki frekanslar toplamının 17 olduğu görülmektedir. Medyan’nın grup frekansı 12 ve medyan grubunun grup aralığı da 11-9=2 olarak hesaplanacaktır. Formülde yer alan bu değerler düzenli bir şekilde yazılırsa aşağıdaki gibi elde edilecektir:

66

aL = 9

an = 17

mn = 12

mc : 2

Bu değerler formülde yerine yazılarak gerekli işlemler yapıldığında,

1/2

4017

2 29 212

a

a mm

nn

M L cn

1/2

39 2 9 0,5 9,5

12M

olarak hesaplanacaktır. O halde aranılan medyan 9,5 değeridir.

DEĞİŞKENLİK ÖLÇÜLERİ Ortalamalar, serileri özetlemek için gerekli olsa da gözlem değerlerinin birbirine yakınlık derecesini belirlemediğinden yeterli değildir. Ortalamaları aynı olan seriler birbirinden çok farklı olabilir. Dolayısıyla bir istatistik serisi incelenirken gözlem değerlerinin ortalaması yanında, ortalama etrafındaki dağılımlarına da ihtiyaç vardır. Bir istatistik serisini oluşturan gözlem değerlerinin birbirlerinden ya da ortalamadan uzaklıkları, verilerin nasıl değişim gösterdiğini belirtir. Bunları hesaplamaya yarayan ölçülere de “değişkenlik ölçüleri” denir. Ortalamalarda olduğu gibi yine bu ünitede istatistikte en sık kullanılan değişkenlik ölçüleri olan standart sapma ve değişim katsayısı anlatılacaktır. Standart Sapma

İstatistikte en sık kullanılan değişkenlik ölçüsü standart sapmadır. Standart sapma ve karesi olan varyans pek çok istatistiksel analize temel oluşturur. Dizilerde ana kütle standart sapması,

2( )ix

N

formülüyle hesaplanır. Bunun karesi olan 2 ise “ana kütle varyansı” olarak ifade edilir. Örneklem standart sapması ise s ile ifade edilir ve aşağıdaki gibi belirlenir:

2( )ix Xs

n

Bunun karesi olan 2s değerine ise “örneklem varyansı” denir. Frekans serilerinde ve gruplandırılmış serilerde örneklem standart sapması,

2( )i in x Xs

n

formülü yardımıyla hesaplanır.

67

Örnek 3.12:

Özel bir hastanede çalışan personelin tamamının yaşları Tablo 3.14’de verilmiştir. Standart sapmayı hesaplayarak yorumlayınız.

Tablo 3.14: Hastanede Çalışan Personelin Yaşları

56 33 27 36 40 32 56 48 29 38 36 55 44 32 53 41 42 40 38 35 45 32 42 41 43 48 53 39 42 33 41 34 54 43 28 56 35 28 28 54 48 32 47 22 36 26 53 30 43 33

Çözüm 3.12:

Çalışan personelin tamamı incelendiğinden, hesaplanacak standart sapma ana kütle için olacaktır. Terimlerin ortalamadan sapmalarının kareleri toplamını belirleyebilmek için, ana kütle ortalamasını hesaplamak gerekir. Bunun için de ana kütledeki tüm terimlerin toplamına ihtiyaç vardır. Terimlerin tamamı toplandığında 2000 olarak elde edilecektir. Dolaylısıyla ana kütle ortalaması,

1 200040

50

N

ii

x

N

olarak hesaplanacaktır. Şimdi de tüm terimlerin ana kütle ortalaması olan

40 değerinden çıkartılarak karelerinin alınması gerekmektedir. Yani sırasıyla

(56-40)2+(32-40)2+(36-40)2+(41-40)2+…+(54-40)2+(36-40)2+(33-40)2 hesaplanarak, bunların toplamı alınacaktır. Bu değer ise 4104 olarak bulunacaktır. Buradan da ana kütle standart sapması,

2( ) 410482,08 9,06

50ix

N

olarak hesaplanacaktır. O halde incelenen serinin terimleri, ortalaması olan 40 değerinden, ortalama olarak 9,06 birimlik bir sapma gösterecektir.

Örnek 3.11’deki verilerden 8 birimlik bir örneklem çekilerek 54, 43, 30, 34, 48, 35, 53 ve 39 değerleri elde edilmiştir. Standart sapmayı hesaplayınız.

68

Örnek 3.13:

Örnek 3.3’deki veriler için standart sapmayı hesaplayınız. Çözüm 3.13:

Standart sapmayı hesaplayabilmek için öncelikle serinin ortalaması hesaplanmalıdır. Serinin ortalaması Örnek 3.3’te 9,4 olarak hesaplanmıştı. Bu seri bir frekans serisi olduğuna göre, terimlerin ortalamadan sapmalarının kareleri, frekanslarla çarpılarak toplanacaktır. Bu işlemler de izleyen tabloda açık bir şekilde verilmiştir:

Tablo 3.15: Standart Sapmanın Hesaplanması İçin Gerekli İşlemler Tablosu

Grup Ortalaması in 2).( xxn ii

4 3 3.(4-9,4)2=87,48 6 5 5.(6-9,4)2=57,80 8 9 9.(8-9,4)2=17,64

10 12 12.(10-9,4)2=4,32 12 7 7.(12-9,4)2=47,32 14 3 3.(14-9,4)2=63,48 16 1 1.(16-9,4)2=43,56

Toplam 40 321,60

Gerekli toplamlar, frekans serisi için verilen standart sapma formülünde yerine yazıldığında,

2( ) 321,608,04 2,84

40i in x x

sn

gün olarak bulunur. Dolayısıyla “terimler ortalama 9,4 değerinden ortalama olarak 2,84 günlük bir sapma gösterir” şeklinde yorumlanır. Mutlak bir ölçü olan standart sapma, gözlem değerlerinin büyüklüğünden etkilenen bir ölçüdür. Ayrıca ölçü birimleri farklı olan serilerin karşılaştırılmasında da standart sapma kullanılamaz. Dolayısıyla ölçü birimleri (cm, lt, hg v.b), ve terimlerin değeri farklı olan serilerin karşılaştırılmasında değişim katsayısı kullanılır.

Değişim Katsayısı

Standart sapmanın, aritmetik ortalamaya bölünmesiyle elde edilen değişim katsayısı, oransal bir ölçüdür. Dolayısıyla değişim katsayısı terimlerin büyüklüğünden ve ölçü birimlerinden etkilenmez. Değişim katsayısı aşağıdaki formülle hesaplanır:

.s

D Kx

Mutlak bir ölçü olan standart sapmanın aksine, değişim katsayısının ölçü birimi yoktur. Çünkü formülün pay ve paydasında yer alan ve aynı ölçü birimine sahip olan standart sapma ve aritmetik ortalama birbirine bölündüğü için, sonuçta ölçü birimine sahip olmayan bir oran kalır. Tek bir serinin değişkenliğini belirlemek için çok kullanışlı olmayan değişim katsayısı, daha çok iki ve daha fazla serinin karşılaştırılması için kullanılır. Değişim katsayısı küçük olan serilerin, diğerlerine göre daha az değişken olduğu ifade edilecektir. Bunun anlamı ise değişim katsayısı küçük olan serinin daha homojen yani birbirine daha yakın terimlerden oluştuğudur.

69

Örnek 3.14:

Tablo 3.16’da verilen serilerden hangisinin değişkenliğinin daha fazla olduğunu belirleyiniz.

Tablo 3.16: A ve B Maddesi Tüketim Verileri

A Maddesi Tüketimi (gr) B Maddesi Tüketimi (cm)

110 125

115 132

120 140

130 160

140 200

150 225

160 300

Çözüm 3.14:

Hatırlanacağı gibi serilerin değişkenliğini belirleyebilmek için kullanılan ölçüler, standart sapma ve değişim katsayısıdır. Ancak bu iki serinin ölçü birimleri farklı olduğundan, bunların karşılaştırılabilmesi için kullanılacak değişkenlik ölçüsü, değişim katsayısı olacaktır. Değişim katsayısının hesaplanabilmesi için de serilerin ortalaması ve standart sapmasına ihtiyaç vardır. Bu iki seri için hesaplanılan ortalama ve standart sapma Tablo 3.17’de verilmiştir.

Tablo 3.17: Değişim Katsayısı İçin Hesaplanan Ortalama ve Standart Sapma Verileri

s x

A Maddesi Tüketimi (gr) 17,29 132,14

B Maddesi Tüketimi (cm) 58,66 183,14

A maddesinin tüketimi için değişim katsayısı,

17,29. 0,13

132,14

sD K

x

olarak hesaplanırken, B maddesinin tüketimi için,

58,66. 0,32

183,14

sD K

x

şeklinde belirlenecektir. Bu sonuçlara göre, B maddesi tüketimi için hesaplanılan %32 değeri, A maddesinin tüketimi için belirlenen %13 değerinden daha büyüktür. Dolayısıyla, B maddesi tüketimi serisinin değişkenliği, A maddesi tüketimi serisinin değişkenliğinden daha fazladır.

MICROSOFT EXCEL OFFICE UYGULAMALARI Şimdiye kadar ortalamalar ve değişkenlik ölçülerinin teorik yapısı anlatılarak, konuya ilişkin sayısal örnekler çözüldü. Bu kısımda da bazı örneklerin Excel’de nasıl çözümlendiği anlatılacaktır. Ancak hemen belirtmek gerekir ki, Excel’in doğrudan hesapladığı seriler, basit seri şeklindedir.

Öncelikle basit bir seri için aritmetik ortalamanın nasıl hesaplandığı anlatılacaktır. Bunun için Excel’de yeni bir çalışma sayfası açarak, daha önce çözülen Örnek 3.1’deki verileri A kolonuna giriniz. Daha sonra “Formüller” menüsü tıklanarak buradan “Tüm İşlevler” ve “İstatistiksel” menüsü tıklanır. Şimdi karşımıza çıkan pencereden, “ORTALAMA” işlevi tıklanır. Bunların nasıl yapılacağı ayrıca aşağıda gösterilmiştir.

70

Şimdi karşımıza çıkan pencerede, ortalaması hesaplanacak verilerin seçilmesi gerekir. Veriler A2-A11

arasında olduğu için, bu aralık seçilerek “Tamam” tıklandığında, aritmetik ortalamanın hesaplanarak A13 kolonuna yazıldığı görülecektir (İşlem yapılırken hangi hücre seçilmişse, değer oraya yazılır).

71

Şimdi de sırasıyla geometrik ortalama, mod, medyan ve standart sapma’nın hesaplanmasına ilişkin

uygulama yapılacaktır. Bunun için aşağıda da görüldüğü gibi, A kolonuna Örnek 3.4, C kolonuna Örnek 3.6, E kolonuna Örnek 3.1 ve G kolonuna da Sıra Sizde 3 verilerini giriniz. Aritmetik ortalamanın hesaplanmasında olduğu gibi yine “Formüller-Tüm İşlevler ve İstatistiksel” menüsü tıklanarak karşımıza çıkan pencerede geometrik ortalama için “GEOORT”, mod için “ENÇOK_OLAN”, medyan için “ORTANCA” ve standart sapma için de “STDSAPMAS” tıklanarak işlemler yaptırılır. Bu işlemlerin sonucunu da ayrıntılı olarak aşağıda verilmiştir.

72

Özet

Bir araştırmada toplanan verilerin tek bir değerle gösterilmesi, hem verilerin özetlenmesi açısından hem de daha ileri analizlerin kullanılabilmesi için oldukça önemlidir. Verilerin tek bir değerle gösterilebildiği bu ölçütlere ortalama denir.

Serideki tüm verileri dahil ederek hesaplanan ortalamalar duyarlı, verilerin tamamı dahil edilmeden hesaplanan ortalamalar ise duyarlı olmayan ortalamalar olarak adlandırılır.

Duyarlı ortalamalardan aritmetik ortalama ise, ortalama denilince akla gelen ilk ortalamadır.Ancak bazı durumlarda aritmetik ortalamanın hesaplanması mümkün olmayabilir. Böyle durumlarda ise duyarlı ortalamalardan geometrik ortalama veya duyarlı olmayan ortalamalardan mod ve medyan hesaplanabilir. Dolayısıyla aritmetik ortalama çok sık kullanılan bir ortalama olmasına rağmen, özel durumlarda uygun ortalamaların kullanılması gerekir.

Eğer elimizde farklı zamanlarda veya farklı yerlerde elde edilmiş deney sonuçları varsa ve bunlar da ortalama veya oran şeklinde ise, bunların ortalamaları için tartılı aritmetik ortalama kullanılacaktır.

Verilerin tek bir değerle ifade edilebilmelerini sağlayan ortalamalar, verilerin nasıl dağıldıkları konusunda yeterince fikir veremezler. Bazı serilerde veriler birbirine yakın yani, homojen olabilirler. Bazen de gözlem değerleri birbirinden oldukça farklı dağılmış yani, heterojen olabilirler. İşte verilerin nasıl bir dağılım gösterdiklerini belirleyebilmek için de değişkenlik ölçülerine gereksinim vardır. İstatistikte verilerin nasıl bir değişkenlik gösterdiğini belirleyebilmek için kullanılan ve yine ilk akla gelen ölçü ise standart sapmadır. Ancak standart sapma verilerin büyüklüğünden etkilenen bir ölçüdür. Yani büyük rakamlardan oluşan bir serinin standart sapması, küçük rakamlardan oluşan serinin standart sapmasından daima daha büyüktür. Dolayısıyla terim büyüklükleri veya ölçü birimleri farklı serilerin karşılaştırılmasında kullanılacak değişkenlik ölçüsü ise değişim katsayısıdır.

73

Kendimizi Sınayalım 1. 6 çocuğun vücut ağılığı 30, 32, 28, 34, 24 ve 32 olarak belirlenmiştir. Aritmetik ortalamasının değeri aşağıdakilerden hangisidir?

a. 28

b. 30

c. 32

d. 34

e. 24

2. 1. sorudaki veriler için standart sapmanın değeri aşağıdakilerden hangisidir?

a. 10,67

b. 9,26

c. 6,78

d. 5,52

e. 3,27

Gruplar Kişi Sayısı

95-100 10

100-110 14

110-120 18

120-130 13

130-140 8

3. Yukarıda verilen gruplandırılmış seri için aritmetik ortalama değeri aşağıdakilerden hangisidir?

a. 114,60

b. 120,87

c. 105,45

d. 130,58

e. 118,79

4. 3. Sorudaki veriler için medyan değeri aşağıdakilerden hangisidir?

a. 121,44

b. 132,42

c. 114,17

d. 118,26

e. 125,19

5. 3. sorudaki veriler için mod değeri aşağıdakilerden hangisidir?

a. 111,56

b. 127,37

c. 98,56

d. 114,44

e. 102,65

6. 3. sorudaki veriler için varyans değeri aşağıdakilerden hangisidir?

a. 135,46

b. 165,86

c. 19,92

d. 17,65

e. 142,10

7. Bir hafta boyunca A hastanesi acil servisine başvuran hasta sayıları aşağıdaki gibi elde edilmiştir:

20, 28, 17, 25, 12, 23, 15

Bu veriler için medyan değeri aşağıdakilerden hangisidir?

a. 25

b. 15

c. 17

d. 23

e. 20

8. 7. Sorudaki veriler için değişim katsayısının değeri aşağıdakilerden hangisidir?

a. 0,13

b. 0,52

c. 0,44

d. 0,26

e. 0,72

74

9. Aşağıdakilerden hangisi ana kütle varyansının simgesidir?

a. s

b. 2s

c.

d.

e. 2

10. Bir istatistik serisinde diğer verilerden aşırı büyük bir değer varsa duyarlı ortalamalardan hangisi hesaplanmalıdır?

a. Aritmetik ortalama

b. Geometrik ortalama

c. Tartılı aritmetik ortalama

d. Mod

e. Medyan


1. b Yanıtınız yanlış ise “aritmetik ortalama” başlıklı konuyu yeniden gözden geçiriniz.

2. e Yanıtınız yanlış ise “standart sapma” başlıklı konuyu yeniden gözden geçiriniz.

3. a Yanıtınız yanlış ise “aritmetik ortalama” başlıklı konuyu yeniden gözden geçiriniz.

4. c Yanıtınız yanlış ise “Medyan” başlıklı konuyu yeniden gözden geçiriniz.

5. d Yanıtınız yanlış ise “Mod” başlıklı konuyu yeniden gözden geçiriniz.

6. e Yanıtınız yanlış ise “Standart sapma” başlıklı konuyu yeniden gözden geçiriniz.

7. a Yanıtınız yanlış ise “Medyan” başlıklı konuyu yeniden gözden geçiriniz.

8. d Yanıtınız yanlış ise “Değişim katsayısı” başlıklı konuyu yeniden gözden geçiriniz.

9. e Yanıtınız yanlış ise “Standart sapma” başlıklı konuyu yeniden gözden geçiriniz.

10. b Yanıtınız yanlış ise “Geometrik ortalama” başlıklı konuyu yeniden gözden geçiriniz.

75


Sıra Sizde 1

ix in ln ix lni in x

5 3 1,61 4,83

7 7 1,95 13,65

10 10 2,3 23

13 4 2,56 10,24

500 1 6,21 6,21

Toplam 57,93

ln57,93( )

2,3225 10,18.i i

i

n x

nG O e e e

Sıra Sizde 2

Örnek 3.2’deki veriler için en yüksek frekans 7 olduğuna göre, aranılan mod değeri 135 olacaktır.

Sıra Sizde 3

2)( xxi

54 (54-42)2=144

43 (43-42)2= 1

30 (30-42)2=144

34 (34-42)2= 64

48 (48-42)2= 36

35 (35-42)2= 49

53 (53-42)2=121

39 (39-42)2= 9

336 568

1 33642

8

n

ii

xx

n

2( ) 56871 8,43

8ix X

sn



Devore, J. ve Peck, R. (1990), Introductory Statistics, West.

Freund, J.E. ve Simon, G.A. (1 997), Modern Elementary Statistics, Prentice Hall, New Jersey.

Özdamar, (1985). Biyoistatistik, Bilim Teknik Yayınevi, Eskişehir.

Serper, Ö. (2004). Uygulamalı İstatistik 1,Ezgi Kitabevi, Bursa.

Sümbüloğlu, K. ve Sümbüloğlu. V. (2002), Biyoistatistik, Hatipoğlu Yayınevi, Ankara.

76


Nüfusun yapısı ve dinamiklerini tanımlayabilecek,

Sağlık alanında, nüfus ile ilgili verilerin önemini açıklayabilecek,

Sağlık alanında sıklıkla kullanılan istatistiksel yöntemleri tanımlayarak, hesaplayabilecek,

Hastanelerdeki sağlık hizmetlerinin değerlendirilmesini yapabilecek,

İstatistiklere ait formülleri belirleyerek, verilen istatistikleri hesaplayabilecek

bilgi ve becerilerine sahip olabilirsiniz.

Anahtar Kavramlar

Nüfus ve yapısı

Hız

Oran

Nüfus piramidi

İnsidans, prevelans

Mortalite

Odds Oranı

Göreli risk

Yaşam tablosu

İçindekiler

Giriş

Nüfusun yapısı ve özellikleri

Hız ve oran

Hastalıklarla ilgili istatistikler

Koruyucu sağlık hizmetleri

Sunulan sağlık hizmetlerinin düzeyini gösteren ölçütler

Yaşam tabloları

Hastalık ve ölüm nedenlerinin uluslararası sınıflandırılması

Hastanedeki sağlık hizmetlerinin değerlendirilmesi

4

77

GİRİŞBu bölümde, toplumun nüfus yapısı, bu yapıyı etkileyen faktörler tanımlanacak ve sıklıkla kullanılan sağlık alanına özel istatistiksel teknikler hakkında bilgi verilecektir. Çözümlü örnekler aracılığı ile konuların kavranması sağlanacaktır.

Sağlık alanında kullanılan istatistiksel yöntemlerin temel amacı;

Bölgenin uzun, orta ve kısa vadede sağlıkla ilgili hizmet planlamasını yapmak,

Sağlık kurumlarındaki tedavi hizmetlerinin aksamadan yürümesini sağlamak, doktor ve personel sayısını düzenlemek,

Sağlık kurumlarındaki hastaların bakım ve tedavi hizmetlerinin sürekliliğini sağlamak, toplum dinamiklerine göre yeniden düzenlemek ve değerlendirmek,

Sağlık kurumlarında verilen hizmetin kalitesini arttırmak,

Belirli aralıklarla, doktor, yardımcı sağlık personeli, hasta ve hasta yakınlarının bilgi, tutum ve davranışlarını araştırarak sağlık hizmetlerinin en iyi şekilde yürütülmesini sağlamak,

Yapılacak olan bilimsel çalışmalara en doğru bilgiyi sağlamak, bu çalışmalara yol göstermek,

Sağlık çalışanlarının, kendi alanlarında yayınlanan güncel bilimsel çalışmaları değerlendirebilmesini sağlamaktır.

Başka bir tanımla sağlık istatistiği; sağlık hizmetlerinde, sağlık hizmetlerinin planlanmasında, sağlıkla ilgili bilimsel araştırmaların yürütülmesinde, hizmet göstergesi olarak, koruyucu sağlık hizmetlerinde, tedavi edici sağlık hizmetlerinde, toplumun sağlık düzeyinin belirlenmesinde, yükseltilmesinde ve toplumda sağlık alanındaki değişimlerin incelenmesinde kullanılmaktadır.

İlgilenilen bölgenin coğrafi, sosyal, ekonomik, demografik ve sağlık açısından göstergelerini belirlemek için sağlık örgütünün hangi tür verilere gereksinim duyacağı ve toplanan verilerin içeriğininne olacağı, bu sağlık sisteminin yönetim biçimine, sağlıkta ulaşılması istenen hedeflere ve içeriğine bağlıdır. Sağlık enformasyon sistemlerinin etkin ve yaygın olmadığı bir ülke ya da bölgede iyi bir sağlık planlaması ve sağlığın iyi bir şekilde yönetilmesinden sözetmek oldukça zordur.

NÜFUSUN YAPISI VE ÖZELLİKLERİHastane yöneticileri hizmet verecekleri bölgenin nüfus yapısını iyi bilmeli ve ona göre vereceği sağlık hizmetlerini planlama yoluna gitmelidir. Bir bölgedeki sağlık ile ilgili hizmetlerin örgütlenmesi, tedavi hizmetlerinin yürütmesi ve zaman içerisinde yeniden düzenlenmesi çalışmalarında bölgenin nüfusu ve nüfusun yapısal özelliklerine öncelikle başvurulmaktadır. Günümüzde nüfus yapısını ayrıntılı olarak incelemeden yapılacak olan hizmet planlamasının başarılı olması neredeyse imkânsızdır. Buna ilave olarak nüfus; bölgeye ait hız ve oranların hesaplanılmasında kullanılan önemli bir veridir. Bu bakımdan nüfus ve nüfusun yapısı sağlık yöneticilerinin, planlayıcıların, ekonomistlerin ve istatistikçilerin en çok yararlandıkları veridir.

Sağlık Alanına Özelİstatistiksel Yöntemler

78

Nüfus, belirli bir zamanda sınırları belirlenmiş bir bölgede yaşayan insan sayısı olarak tanımlanabilir. Bir ülkenin ya da bölgenin sağlık ile ilgili istatistiklerinin, hız ve oranlarının hesaplanmasında bölgenin nüfusu ve nüfusun yapısal özelliklerinden yararlanılmaktadır. Bölgede belirli bir zamandaki yaşayan bireylerin sayılarak çeşitli özelliklerinin kaydedilmesi işlemine nüfus sayımı denir. Nüfus sayımları iki farklı yöntemle yapılmaktadır. Bunlar;

De facto, sayım anında bireylerin bulundukları bölge içerisinde sayılmasıdır.

De jure, sayım anında bireylerin bulundukları bölge içerisinde değil sürekli oturma yerlerindeki nüfusta sayılması yöntemidir.

Nüfus sayımları yoluyla belirli bir zamanda, bir yerleşim birimindeki insan grubunun demografik özellikleri saptanmaya çalışılır. Bu sayımların amacı, erkek-kadın nüfusu belirlemek, eğitim durumunu belirlemek, nüfusun yaşa göre dağılımını belirlemek vb. olarak sayılabilir. Ülkemizde, nüfusumuzun sayı ve demografik özelliklerini belirlemek amacıyla Cumhuriyet’in kuruluşundan günümüze kadar pek çok nüfus sayımı yapılmıştır. Birincisi 1927 yılında, ikincisi 1935 yılında ve bu tarihten sonra 1990'a kadar her 5 yılda bir aksatılmadan nüfus sayımı tekrarlanmıştır. 1990'dan sonra ise nüfus sayımı 2000 yılında yapılmış ve her 10 yılda yapılmasına karar verilmiştir. Bu arada 1997 yılında bir sayım yapılmıştır. Fakat bu sayım nüfus tesbiti olarak adlandırılmıştır. Seçmen kütüklerinin güncelleştirilmesine yönelik bu sayımda, yerleşim yerleri itibariyle ikametgâha dayalı sayısal sonuçlar elde edilmiş, sosyal ve ekonomik bilgiler bu sayımda yer almamıştır. Ülkemizde yapılan nüfus sayımlarına ait tarihler, nüfusumuz ve artış hızları Tablo 4.1’de görülmektedir. 2000 yılı sonuçlarındaki yıllık nüfus artış hızı rakamı 1990-2000 dönemine aittir.

Tablo 4.1: Yıllara ilişkin nüfusumuz ve artış hızları

YILLAR NÜFUS Artış Hızı (binde)

20.10.1927 13.648.270 -

20.10.1935 16.158.018 21,10

20.10.1940 17.820.950 19,59

21.10.1945 18.790.174 10,59

22.10.1950 20.947.188 21,73

23.10.1955 24.064.763 27,75

23.10.1960 27.754.820 28,53

24.10.1965 31.391.421 24,63

25.10.1970 35.605.176 25,19

26.10.1975 40.347.719 25,01

12.10.1980 44.736.957 20,65

20.10.1985 50.664.458 24,88

21.10.1990 56.473.035 21,71

30.11.1997 62.865.574 15,08

22.10.2000 67.803.927 18,28

2007(1) 70.586.256 -

2008(1) 71.517.100 13,10

2009(1) 72.561.312 14,50

2010(1) 73.722.988 15,88

(1) Adrese Dayalı Nüfus Kayıt Sistemi (ADNKS)

http://tr.wikipedia.org/wiki/Demografi

79

Sağlık kurumu yöneticisinin hizmet verdiği bölgeye ait bir takım düzenlemeleri yapabilmesi için bölgeye ait nüfus yapısı hakkında öncelikle bilmesi gereken tanım, açıklamalar ve hesaplamalar aşağıda verilmiştir.

Yıl ortası nüfus (YON)

Bir bölgenin belirli bir yıl içindeki 30 Haziran ya da 1 Temmuz tarihindeki nüfusudur. 3 farklı şekilde hesaplanır.

ı şı ü ı ü

( ) ( )

Eğer sadece her yılın başında nüfus sayımı yapılıyor ise yıl ortası nüfus,

Ülkelerin veya bölgelerin nüfusları, belli yaş gruplarındaki insanların yoğunluklarına göre farklı

isimlerle anılmaktadır. Eğer, 65 ve daha üzeri yaştaki insanlar (65+), toplumun %10’undan fazla ise bu tür toplumların nüfus yapısına yaşlı nüfus adı verilmektedir. Endüstriyel toplumların nüfus yapıları yaşlı nüfusa örnek olarak verilebilir.

15 yaş altı nüfusun, genel nüfus içerisindeki oranı yüksek ise bu tür toplumların nüfus yapısına genç nüfus adı verilir. Özellikle bu oran %40’ın üzerinde ise bu tür toplumlara genç nüfuslu toplumlar denir. Genellikle geri kalmış ülkeler ya da bölgelerin nüfusları bu özelliği taşımaktadır.

0-14 yaş nüfusu tüm topluma oranlandığında %30-40, 15-64 yaş nüfusu %50-60, 65+ yaş nüfusu ise %5-9 oranlarında yoğunluğa sahip olan bölgelere orta yaşlı nüfus adı verilir. Kalkınmakta olan ülkelerin nüfus yapıları bu formdadır.

Sağlık kurumlarının yöneticileri ve planlayıcılar nüfusun genel yapısını bilmeli ve faaliyetlerini toplumun nüfus yapısı doğrultusunda şekillendirmelidir. Nüfusun yapısını etkileyen başlıca faktörler; doğumlar, ölümler, göçler, evlenme ve boşanmalardır. Doğumlar ve ölümler genellikle nüfusun sayısını, içe ve dışa göçler hem nüfusun sayısını hem de yapısını etkiler. Evlenmeler ve boşanmalar ise nüfusun medeni durum yapısındaki değişikliğe, dolayısıyla da doğumlarda artış ya da azalışa neden olur. Bu olaylar kısaca nüfus hareketleri olarak isimlendirilmektedir.

Nüfusla İlgili Hız ve Oranlar

Sağlık kurumu yönetcisi, nüfusun bölgedeki dağılımı, hizmet verilen bölgedeki nüfusun yoğunluğunu, kadın- erkek oranını, bölgedeki nüfus artış hızını, nüfusun yaşa ve cinsiyete göre dağılımını bilmek zorundadır. Sağlık hizmeti verilecek olan hedef toplumun nüfus yapısı ve özellikleri bilinmiyorsa, yapılan hizmetin etkinliğinden sözetmekte mümkün olamaz. Bu nedenle bölgenin nüfus yapısına göre yönetici, kurumunu organize etmeli, hizmet vereceği hedef toplumu tanımalı, toplumdaki hastalık profillerini çıkarmalı, personel eksikliklerini tamamlamalı ve verilecek olan sağlık hizmetini hasta kabulünden, hastanın tedavisi sonlanıncaya kadar planlamalıdır. Aşağıda bazı hız ve oranlara ait tanım ve hesaplamalar verilmiştir

80

Nüfus yoğunluğu

Bir bölgedeki kilometre kare başına düşen nüfusu gösteren bir ölçüdür. Aşağıdaki biçimde hesaplanır.

( )

Nüfus Artış Hızı (NAH)

Bir bölgenin nüfusunda bir yıl içerisindeki doğumlar ve ölümlere bağlı olarak nasıl bir artış ya da azalışın olduğunu ifade eden bir kavramdır. Aşağıdaki gibi hesaplanmaktadır.

( ) [

]

Cinsellik Oranı (CO)

Bölge nüfusunda her 100 kadına düşen erkek sayısını belirleyen bir ölçüdür. Cinsellik oranı aşağıdaki gibi hesaplamaktadır.

( )

Nüfus Piramidi

Nüfus pramidi, nüfusun yaş ve cinsiyet yapısını incelemeyi sağlayan grafiksel bir yöntemdir. Aynı zamanda nüfusun yaş ve cinsiyet yapısını bir zaman dilimi içerisinde değerlendirme olanağı sağlamaktadır. Bu grafiksel yöntemde nüfusun yaşa ve cinsiyete göre dağılımı beşerli yaş gruplarına göre gösterilir. 0-4 yaş grubu tabanda, 90+ yaş grubu tavanda olacak şekilde artan beşli yaş grupları yukarıya doğru orantılı olarak yatay dikdörtgen çubuklar dizilerek çizilmektedir. Farklı iki cinsiyete ait aynı yaş grubundaki verileri, toplam nüfus içerisindeki yoğunluğunu da dikkate alarak karşılaştırma olanağı sağlar. Nüfus pramitleri ülkelerin sosyo-ekonomik yapıları hakkında da önemli bilgiler vermektedir. Aşağıda Şekil 4.1’de nüfus piramitlerine ilişkin bazı örnekler verilmiştir.

Geri kalmış ülkeler

Gelişmekte olan ülkeler

Gelişmiş ülkeler

Sanayileşmiş Ülkeler

Şekil 4.1: Nüfus pramitlerine ilişkin bazı örnekler

Seçilmiş bazı ülkelerin 2010 yılı nüfus piramitleri Şekil 4.2’de verilmiştir. (Kaynak: U.S. Census Bureau http://www.census.gov)

http://www.census.gov/

81

Şekil 4.2: Seçilmiş bazı ülkelerin 2010 yılı nüfus piramitleri

TÜİK verilerine göre, Türkiye’nin kadın ve erkek nüfusundan ve yaş gruplarından yararlanılarak çizilen 2007 yılına ait nüfus piramidi Şekil 4.3’te, 2010 yıllarına ait nüfus piramidi ise Şekil 4.4’te verilmiştir. Üç yıl gibi kısa bir sürede, nüfustaki değişim karşılaştırmalı olarak bu piramitlerden görülmektedir.

82

Şekil 4.3: Türkiye’nin 2007 yılına ait nüfus pramidi

Şekil 4.4: Türkiye’nin 2010 yılına ait nüfus pramidi

-4000000 -2000000 0 2000000 40000000-45-9

10-1415-1920-2425-2930-3435-3940-4445-4950-5455-5960-6465-6970-7475-7980-8485-8990+

Kadın

Erkek

-4000000 -2000000 0 2000000 40000000-45-9

10-1415-1920-2425-2930-3435-3940-4445-4950-5455-5960-6465-6970-7475-7980-8485-8990+

Kadın

Erkek

83

HIZ VE ORAN Birçok alanda olduğu gibi sağlık alanında da bölgelere ait nüfus profillerinin belirlenmesi aşamasında hız, oran ve diğer istatistiklerden sıklıkla yararlanılmaktadır. Oran (proportion) ve hız (rate) bir bölgede meydana gelen olayların yüzde (%), binde ( ), onbinde,… gibi değerlerle sunulmasını sağlayan göstergelerdir. Hesaplanılan hız ve oranlar sağlıkta verilen hizmetlerin kalitesi hakkında bilgiler vermekte, standartlar yardımıyla da önceki yıllara göre kurumun kendini değerlendirmesine veya kurumlararası karşılaştırmalara olanak sağlamaktadır. Sayılarla karşılaştırma yerine hız ve oranlarla yapılan karşılaştırmalar sağlık kurumlarının yöneticilerine pek çok yönden avantajlar sağlamaktadır.

Hız, sağlık olaylarının belirli bir bölgede görülme sıklığını belirlemek amacıyla kullanılır. Olayın görülme sayısının, bölgedeki tüm nüfusa bölünmesiyle elde edilir. (belli bir zaman diliminde ölenlerin sayısının (a), ölen ve yaşayanların (b) toplamına oranıdır (a/a+b)). Örnek olarak, “2011 yılında trafik kazalarında ölenlerin toplam nüfusa (kazalarda ölenlerde dahil tüm nüfus) bölünmesi” verilebilir.

Oran, bir olayının diğerine göre ne boyutta olduğunu ifade eder. Bir miktarın kendi bütünü içerisindeki payı olarakta tanımlanabilir. Hasta sayısının sağlam nüfusa oranı, 15-49 yaş grubundaki sigara kullanan erkeklerin kullanmayanlara oranı ya da kontrol yöntemi olarak RİA (rahim içi araç) kullanan kadınların, kullanmayan kadınlara oranıdır (a/b).

Sağlık kurumu yöneticileri ve sağlık planlayıcıları bölgenin demografik yapısını belli aralıklarla takip etmelidir. Toplum dinamiklerinin ne yönde değiştiğini saptamalı ona göre kurumlarını yönetmelidirler. Dünya’da, sağlık alanına ilişkin demografik göstergeler, nüfus, evlenmeler, boşanmalar, doğum, ölüm ve hastalıklara göre benzer şekillerde hesaplanmaktadır.

Sağlık hizmetlerinin değerlendirilmesinde sıklıkla kullanılan hız ve oranlar aşağıda açıklanmıştır.

Evlenmeler

Evlenme; Türk Medeni Kanunu’na göre evlenmeye ehil erkek ve kadının, yetkili kanuni merci önünde yapmış oldukları çift taraflı bir akittir. Bölgede olan evlenmelerin sayısı ve evlenen çiftlerin özellikleri hakkındaki veriler, ana-çocuk sağlığı ve aile planlaması hizmetlerinin örgütlenmesi, yürütümü ve yeniden düzenlenmesi aşamalarının planlanmasında kullanılır. Evlenmelerle ilgili olarak evlenme akdinin yapıldığı il, ilçe, bucak veya köy verileri derlenmektedir. Bunun yanında evlenen kadın ve erkeğin; doğum yeri ve yılı, uyruğu, ana dili, dini, eğitimi, evlenmeden önceki medeni durumu, kaçıncı evliliği olduğu, önceki evliliklerinden olup da bakmakla yükümlü olduğu çocuk sayısı, evlenmeden önceki daimi oturduğu yer, mesleği gibi bilgiler toplanmaktadır. Evlenmelerle ilgili veri kaynakları ise TÜİK’in yayınladığı Evlenme İstatistikleri, Türkiye nüfus araştırmaları ve özel araştırmalardır.

Evlenme verilerinin değerlendirilmesinde evlenenlerin; cinsiyete göre yaş ortalamaları, oturulan bölgeye göre yaş ortalamaları, cinsiyete göre eğitim düzeyleri, evlenme sayıları, evlenmeden önceki medeni durumları, oturdukları illere göre dağılımı, mesleklere göre dağılımı, önceki evliliklerindeki çocuk sayıları, evlendikleri yaşlara göre dağılımları, din ve ana dillerine göre dağılımları, uyruklarına göre dağılımı hesaplanabilmektedir. 2010 yılı TÜİK verilerine göre Türkiye’de yaş gruplarına göre damat ve gelin sayıları Tablo 4.2’de verilmiştir.

Tablo 4.2: Türkiye’de 2010 yılında yaş gruplarına göre Damat ve Gelin sayıları

16-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55+ Damat 14.824 163.791 237.474 91.054 30.276 13.729 9.237 6.326 12.679

Gelin 134.874 212.923 132.952 45.817 19.409 9.326 6.057 3.675 4.470

Kaynak: (TÜİK, 2010, http://www.tuik.gov.tr)

84

Tablo 4.2 verilerinden yararlanılarak çizilen Şekil 4.5 incelenecek olursa, yaş grupları ile damat ve gelin sayıları arasındaki ilişki daha iyi anlaşılabilir. Grafikte, bayanların büyük çoğunluğunun 20-24 yaş grubunda, erkeklerin ise büyük çoğunluğunun 25-29 yaş grubunda evlenmiş oldukları açıkça görülmektedir.

Şekil 4.5: 2010 yılında yaş gruplarına göre damat ve gelin sayıları

Sağlık kurumları yöneticisi hizmet verdiği toplumdaki evlenmelerle ilgili olarak ana ve çocuk sağlığı, aile planlaması, aşılama hizmetleri vb. sağlık hizmetlerinide düzenlemelidir.

Evlenmelerle İlgili Hız ve Oranlar

Evlenmelerle ilgili olarak sıklıkla kullanılan hızlar aşağıdaki gibi sıralanabilir.

Genel Evlenme Hızı

Evlenelebilecek Yaşa Özel Evlenme Hızı

Kadınlara Özel Evlenme Hızı

Erkeklere Özel Evlenme Hızı

Genel Evlenme Hızı (GEH)

Belirli bir yıl içerisindeki evlenme sayısının o yıla ait yıl ortası nüfusa bölünmesi ile hesaplanır. Binde olarak yorumlanır.

Örnek 4.1:

Bir bölgede 2010 yılı içerisinde 178 evlenme gerçekleşmiştir. Bu bölgenin yıl ortası nüfusu ise 327.147’dir. Eldeki bilgilere göre genel evlenme hızını hesaplayınız.

( )

Bölgenin 2010 yılı genel evlenme hızı ’tür

0

50

100

150

200

250

300

350

400

16-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55+

Damat Gelin

85

Erkeklere Özel Evlenme Hızı (EÖEH)

Belirli bir yıl içerisindeki evlenen erkek sayısının o yıla ait evlenebilecek yaşta olan erkeklerin yıl ortası nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır.

Kadınlara Özel Evlenme Hızı (KÖEH)

Belirli bir yıl içerisindeki evlenen kadın sayısının o yıla ait evlenebilecek yaşta olan kadınların yıl ortası nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır.

Örnek 4.2:

Bir bölgede 2010 yılı içerisinde evlenen kadın sayısı 347’dir. 2010 yılı evlenebilecek yaştaki kadın yıl ortası nüfusu 6.219 ise kadınlara özel evlenme hızını hesaplayınız.

Bölgenin 2010 yılı kadınlara özel evlenme oranı ’dir.

Evlenilebilecek Yaşa Özel Evlenme Hızı (EYÖEH)

Belirli bir yıl içerisindeki evlenme sayısının o yıla ait evlenebilecek yaşta olan erkek ve kadın yıl ortası nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır.

Bir bölgede 2011 yılı içerisinde 422 evlenme gerçekleşmiştir. Bu bölgenin Genel Evlenme Hızı olduğuna göre yıl ortası nüfusu kaçtır?

Boşanmalar

Boşanma, evlenmenin yasal olarak sona erdirilmesidir. Diğer bir ifade ile erkek ile kadının, yeniden evlenmelerine hukuki bir engel kalmayacak şekilde hukuki bir kararla evliliklerini tamamen sona erdirmeleridir.

Boşanmalara ilişkin veriler, Medeni Kanun'un 4 Ekim 1926 tarihinde yürürlüğe girmesinden sonra Türkiye geneli için toplanmaktadır. Boşanmalara ait bilgiler 2003 yılına kadar Türkiye İstatistik Kurumu tarafından asliye hukuk ve aile mahkemeleri kanalıyla üçer aylık dönemler halinde derlenmekteydi. İçişleri Bakanlığı Nüfus ve Vatandaşlık İşleri Genel Müdürlüğü ile Türkiye İstatistik Kurumu arasında 7 Şubat 2006 tarihinde yapılan bir protokol ile 2003 yılından sonra boşanmalara ait bilgiler, Merkezi Nüfus İdaresi Sistemi (MERNİS) veri tabanından elde edilerek yayımlanmaya başlanmıştır.

Bölgede olan boşanmaların sayısı ve boşanan çiftlerin belirli özellikleri hakkında toplanan verilerden, Ana-çocuk sağlığı, aile planlaması hizmetlerinin örgütlenmesi, yürütülmesi ve yeniden yapılandırılarak düzenlenmesi aşamalarının planlanmasında yararlanılır. Ayrıca sağlık kurumu yöneticisi boşanmaların sık olduğu bir bölgede, boşanan çiftlerin ve çocuklarının ruh-sinir hastalıkları tedavilerinin planlanması ve

86

düzenlenmesi, psikolojik danışmanlıkların arttırılması ve sağlıklı birey, aile ve toplum yapısının oluşturulması, korunması çabalarını desteklemelidir.

Boşanmalarla ilgili olarak birçok veri toplanmaktadır. Bunlar; boşanma davasını açan taraf, boşanma nedeni, kadın ve erkeğin doğum tarihi, eğitim durumu ve mesleği, evlenme tarihi, boşanma davasının açıldığı tarih, boşanma davasının sonuçlandığı tarih, bu evlilik içinde doğan çocuk sayısı gibi verilerdir. Sonlanan her boşanma davası için yetkili mahkemenin doldurduğu ve savcılıkça altı ayda bir TÜİK’e gönderilen Boşanma İstatistik Formu ve bu formların derlenmesiyle her yıl TÜİK tarafından yayınlanan Boşanma İstatistikleri isimli yayın konu ile ilgili önemli bir veri kaynağıdır. Buna ilaveten, özel araştırmalar ve nüfus sayımı yoluyla da boşanmalar hakkında veri toplanabilmektedir.

Boşanmalara ilişkin verilerin analiz edilmesinde, yıllara göre boşanma sayıları ve oranları, illere göre dağılımı, yaşlara göre dağılımı, cinsiyete göre dağılımı, boşanma nedenlerine göre dağılımı, evlilik süresine göre dağılımı, davanın süresine göre dağılımı, çocuk sayısına göre dağılımı, kadın-erkek yaşlarına göre dağılımı, davayı açan tarafa göre dağılımı, eğitim düzeyine göre dağılımı, mesleklere göre dağılımı gibi istatistikler için hız ve oranlar yardımıyla hesaplanmaktadır.

Türkiye’de 2010 yılında dava süresine göre boşanma sayıları Tablo 4.3’te verilmiştir. Bu verilere göre 2010 yılında toplam 118.568 boşanma olmuştur.

Tablo 4.3: Türkiye’de 2010 yılında dava sürelerine göre boşanma sayılarının dağılımı

Dava Süresi (Ay) Sayı Yüzde < 2 34.738 29,3 2-4 29.254 24,7 5-8 20.114 17,0

9-12 10.754 9,1 13-18 8.255 7,0 19-24 4.628 3,9 25-35 5.910 5,0 36 + 3.560 3,0

Bilinmeyen 1.355 1,1 Toplam 118.568 100,0

Kaynak: TÜİK, 2011

Türkiye’de 2010 yılında nedenine göre boşanma sayıları Tablo 4.4’te evlilik süresine göre boşanmalar

ise Tablo 4.5’te verilmiştir.

Tablo 4.4: Türkiye’de 2010 yılında nedenine göre boşanma sayılarının dağılımı

Sebep Sayı Yüzde Geçimsizlik 113.039 95,3 Terk 317 ,3 Zina 90 ,1 Akıl sağlığı 42 ,0 Cürüm ve haysiyetsizlik 37 ,0 Cana kast ve pek fena muamele 32 ,0 Diğer 1.414 1,2 Bilinmeyen 3.597 3,0 Toplam 118.568 100,0


87

Tablo 4.5: Türkiye’de 2010 yılında evlilik süresine göre boşanma sayıları

Evlilik süresi Sayı Yüzde 1 yıldan az 3.967 3,3 1-5 yıl 43.310 36,5 6-10 yıl 24.940 21,0 11-15 yıl 17.528 14,8 16+ yıl 28.433 24,0 Bilinmeyen 390 ,3 Toplam 118.568 100,0

Kaynak: TÜİK , 2011

Boşanmalar için sıklıkla kullanılan hız ve oranlar aşağıda tanımlanmış ve hesaplamaları hakkında bilgiler verilmiştir.

Boşanmalarla İlgili Hız ve Oranlar

Kaba Boşanma Hızı (KBH)

Belirli bir yıl içerisinde olan boşanma sayısının o yıla ait yıl ortası nüfusa bölünmesi ile hesaplanır. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır.

2007-2010 yılları arasında TÜİK verilerine göre Türkiye’deki kaba boşanma hızları Tablo 6’da

verilmiştir.

Tablo 4.6: 2007-2010 yılları için Kaba Boşanma Hızları

YIL 2007 2008 2009 2010

HIZ (‰) 1,34 1,40 1,58 1,62


Bir bölgede 2011 yılı içerisinde toplam 4.214 boşanma olmuştur. Anılan yıla ait bölgenin yıl ortası nüfusu 2.417.813 olduğuna göre Kaba Boşanma Hızını hesaplayınız. Genel Boşanma Hızı (GBH)

Belirli bir yıl içerisinde olan boşanma sayısının o yıla ait boşanabilir nüfusun yıl ortası nüfusuna (16 ve yukarı yaş) bölünmesi ile hesaplanır. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır.

88

Cinsiyete Özel Boşanma Hızı (CÖBH)

Bir yıl içerisinde olan boşanma sayısının o yıla ait kadın ya da erkek yıl ortası nüfusuna bölünmesi ile elde edilir. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır.

( )

Yaşa ve Cinsiyete Özel Boşanma Hızı (YCÖBH)

Bir yıl içerisinde x yaşında ve c cinsiyetinde olan boşanma sayısının o yıla ait x yaş ve c cinsiyetindeki yıl ortası nüfusa bölünmesi ile elde edilir. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır.

( )

Bunların dışında, evlilik süresine özel, yaşayan çocuk sayısına özel, mesleğe özel, eğitim düzeyine özel, ilk evlilikte kadın ve kocasının yaşına özel vb. boşanma hızlarıda isteğe bağlı olarak hesaplanılabilmektedir.

Doğumlar

Hastane hizmetlerinin değerlendirilmesinde doğumlar oldukça önemli bir yer tutmaktadır. Kurum yöneticisi ya da sağlık planlayıcısı bilmelidir ki; özellikle, hastaneler, bölgeler ve ülkeler arası karşılaştırmalarda bebek doğum ve ölüm istatistikleri en önemli sağlık göstergesidir. Bu amaçla bölgeye sağlık hizmeti verecek yönetici ve personele öncelikle bazı tanım ve açıklamaları yapmak uygun olacaktır.

Canlı Doğum, çocuğun doğduğu andan itibaren en az birkaç dakika yaşadığı, ağlama, nefes alma ve hareket etme gibi hayat belirtileri gösterdiği doğumdur. Diğer bir ifade ile gebelik süresini dikkate almadan anne vücudundan ayrıldığı anda soluk alan, kalp atımı, kordonda nabız ve çizgili adalelerin hareketi gibi herhangi bir yaşam belirtisi gösteren gebelik sanucuna canlı doğum denir.

Fetüs Ölümü (Ölü doğum) ise gebelik süresini dikkate almadan anne vücudundan ayrıldığı anda soluk almayan, kalp atımı, kordonda nabız ve çizgili adalelerin hareketi gibi herhangi bir yaşam belirtisi göstermeyen gebelik sonucuna ölü doğum adı verilir.

Erken Fetüs Ölümü (Düşük) : Gebelik süresi 28 haftadan az olan fetüs ölümüdür.

Geç Fetüs Ölümü (Ölü Doğum) : Gebelik süresi 28 haftadan çok olan fetüs ölümüdür.

Prematüre Doğum: Gebelik süresi 37 haftadan (259 günden) az olan canlı doğum

Normal Doğum: Gebelik süresi 38-42 hafta arası olan canlı doğum

Sürmatüre Doğum (Gecikmiş doğum, sürmatürasyon): Gebelik süresi 42 haftadan fazla olan canlı doğumdur.

Bebeğindoğduğu andaki ağırlığına göre de doğumlar 4’e ayrılmaktadır. Bunlar;

<1.500gr Çok düşük Doğum Ağırlığı

1.500-2.499gr Düşük Doğum Ağırlığı

2.500-4.250gr Normal Doğum Ağırlığı

>4.250gr Tosuncuk olarak adlandırılmaktadır.

89

Doğum sonrasında bebekle ilgili olarak, bebeğin doğum şekli, canlı doğum, ölü doğum, bebeğin cinsiyeti, doğum ağırlığı, boyu ve baş çevresi, gebelik haftası, doğum yeri, doğuma yardım eden kişi vb gibi veriler kayıt altına alınmaktadır. Bebeğin annesi ile ilgili olarak yaşı, gebelik sayısı, canlı doğum sayısı, düşük sayısı, yaşayan çocuk sayısı, yaşları ve cinsiyetleri, ölen çocuk sayısı, ölüm yaşları ve cinsiyetleri, evlilik süresi, eğitimi, mesleği veya işi, geliri, oturduğu bölge gibi veriler derlenmektedir. Bebeğin babası ile ilgili olarak ise, yaşı, eğitimi, mesleği ve geliri gibi veriler toplanmaktadır.

Doğumlarla ilgili olarak birçok istatistik hesaplanmaktadır. Bunlardan en sık kullanılanlar; kaba doğum hızı, genel doğurganlık hızı, evli kadınlara özel doğum hızı, yaşa özel doğurganlık hızı ve toplam doğurganlık hızıdır.

Doğumlarla İlgili Hız ve Oranlar

Kaba Doğum Hızı (KDH)

Belirli bir yıl içindeki canlı doğum sayısının yıl ortası nüfusa bölünmesiyle elde edilir ve her bin nüfusa kaç tane canlı doğum düştüğünü gösterir.

UNICEF’in 2005 yılına ait verilerine göre bazı ülkelerin Kaba doğum hızları (KDH) ve Kaba

ölüm hızları (KÖH) Tablo 4.7’de verilmiştir.

Tablo 4.7: 2005 yılına ait UNICEF verilerine göre seçilmiş bazı ülkelerin KDH ve KÖH değerleri

Seçilmiş bazı ülkeler Kaba Doğum Hızı Kaba Ölüm Hızı Japonya 9 8 İngiltere 11 10 Almanya 8 10 Türkiye 20 7 Hindistan 23 9 Pakistan 30 8 Etiyopya 40 16

Örnek 4.3:

A ülkesinde, 2011 yılındaki canlı doğan bebek sayısı 1.380.000 olarak belirlenmiştir. Bu ülkenin 2011 yılına ait yıl ortası nüfusu ise 70.231.000’dir. Eldeki verilere göre ülkenin 2011 yılı kaba doğum hızını hesaplayınız.

A ülkesinin 2011 yılı KDH ‰19,6 olarak elde edilmiştir.

Genel Doğurganlık Hızı (GDH)

Belirli bir yılda doğurgan çağda olan 16-49 yaş grubundaki her 1.000 kadına düşen canlı doğum sayısını gösterir. Aşağıdaki şekilde hesaplanır.

90

Örnek 4.4:

2009 yılında bir ülkede 1.241.617 canlı doğum olmuştur. Bu ülkenin 16-49 yaş kadın yıl ortası nüfusu 1.9109.000’dur. Buna göre genel doğurganlık hızını hesaplayınız.

Ülkesinin 2009 yılı GDH ‰64,98 olarak elde edilmiştir.

Bir bölgenin 2011 yılına ait 16-49 yaş grubu kadın sayısı 816.411 ve aynı bölgedeki canlı doğum sayısı 62.993’tür. Bölgenin 2011 yılı Genel Doğurganlık Hızını hesaplayınız Yaşa Özel Doğurganlık Hızı (YÖDH)

Belirli bir yaş ya da yaş grubundaki kadınların 1 yıl içinde yaptıkları canlı doğum sayısının o yaş grubundaki kadın yıl ortası nüfusuna bölünmesiyle bulunur. Belirli bir yaş grubundaki her 1.000 kadın başına düşen doğum sayısını gösterir.

Örnek 4.5:

Türkiye’de 2009 yılında, 30-34 yaş grubundaki kadınların yıl içinde yaptıkları canlı doğum sayısı 241.718 olarak saptanmıştır. 30-34 yaş grubu kadınların yıl ortası nüfusu 2.900.000’dir. Buna göre yaşa özel doğurganlık hızını aşağıdaki şekilde hesaplanır. (örnek varsayımsaldır)

30-34 yaş grubundaki her 1000 kadına 83 canlı doğum düşmektedir.

Evli Kadınlara Özel Doğurganlık Hızı (EKÖDH)

Belirli bir yıl içindeki toplam canlı doğum sayısının 15-49 yaş arası evli kadın yıl ortası nüfusuna bölünmesiyle bulunur. Aşağıdaki şekilde hesaplanır.

Toplam Doğurganlık (Fertilite) Hızı (TDH)

Toplam doğurganlık hızı, doğurgan çağdaki kadın nüfusun yaş yapısını dikkate almadan ülke yada bölgenin doğurganlık düzeyi hakkında bilgi veren bir istatistiktir. TDH tek tek yaşa özel doğurdanlık hızlarının toplamı alınarak bulunur ve doğurdan çağa giren bir kadının doğurganlık çağı sonuna kadar kaç canlı doğum yapacağını belirtir. Türkiye’nin 2001-2009 yılları arasındaki doğumlarla ilgili bazı istatistikleri Tablo 4.8’de verilmiştir.

91

Tablo 4.8: TÜİK (2011) verilerine göre 2001-2009 yılları arasındaki doğumlarla ilgili bazı istatistikler

Yıllar Doğum sayıları

Kaba Doğum Hızı

Genel doğurganlık hızı

Toplam doğurganlık hızı

Annenin yaş ortalaması

2001 1.322.703 20,3 83,8 2,37 26,2 2002 1.228.717 18,6 76,8 2,17 26,3 2003 1.197.452 17,9 73,9 2,09 26,5 2004 1.219.343 18,0 74,4 2,10 26,5 2005 1.238.463 18,1 74,7 2,12 26,5 2006 1.247.445 18,0 74,6 2,11 26,6 2007 1.279.087 18,2 75,8 2,15 26,7 2008 1.281.302 18,0 75,3 2,14 26,8 2009 1.241.617 17,3 72,3 2,06 27,0


Ölümler Canlı doğum olayı gerçekleştikten sonra bireyin yaşamının herhangi bir anında yaşamsal fonksiyonların tamamını yitirmesine ölüm adı verilir. Bir bölgedeki ölüm istatistikleri, sağlık hizmetlerinin planlamasında ve bölgeler arasındaki karşılaştırmalarda kullanılan en önemli verilerdendir. Ölümler hem sayısal hem de nitelik olarak değerlendirilebilir. Elde edilen veriler ile bölgedeki sorunlar ve öncelikler saptanabilir, önlemler alınabilir, ileriye yönelik planlamalar yapılabilir.

Sağlık kurumu yöneticileri ve sağlık planlayıcıları, bir bölgedeki ölümlerin sayısını ve ölenlerin özelliklerini tam ve doğru olarak bilmelidir.

Ölüm istatistiklerinin değerlendirilmesinde ne tür verilerin toplanacağı ve verilerin neleri kapsayacağı sağlık hizmet sistemi ile ilgilidir. Bu veriler genellikle ölen kişinin yaşı, cinsiyeti, mesleği, medeni durumu, eğitimi, oturduğu yer, ölüm tarihi, ölüm yeri, ölüm nedeni gibi verilerdir. Ayrıca, ölüme neden olan sosyal, ekonomik ve kültürel nedenlerin dağılımlarıda araştırılmaktadır.

Ölüm olayları ile ilgili istatistiki bilgiler DİE tarafından 1931 yılından itibaren toplanmaya başlanmış ve 1949 yılı sonuna kadar nüfusu en fazla olan 25 il merkezi, 1950-1957 yılları arasında bütün il merkezleri, 1957 yılından itibaren il ve ilçe merkezlerinde tutulmaya başlamıştır. Ölümlerin ülkemizde en geç 10 gün içerisinde ilgili nüfus idaresine bildirilmesi veya gönderilmesi yasal bir zorunluluktur. Ölüm tutanaklarına ölenin nüfus cüzdanı da eklenmektedir. Ülkemizde il ve ilçe merkezlerinde olan ölümleri incelememize yarayan tek kaynak TÜİK tarafından yayınlanan, ölüm istatistik formlarından faydalanılarak oluşturulan “Ölüm İstatistikleri; il ve ilçe merkezleri” adlı yayındır. Bu yayında ölümün meydana geldiği ay, cinsiyet, yaş, süreklii ikametgâh, ölüm nedeni, ölüm nedeninin saptandığı yer, medeni durum, meslek grubu ve bebek ölümlerine ilişkin bilgiler yer almaktadır. Ülkemizedeki ölümlerle ilgili verilere ve diğer verilere ve göstergelere aşağıdaki TÜİK (Türkiye İstatistik Kurumu) web sitesi bağlantısından ulaşabilirsiniz.

http://www.tuik.gov.tr/Kitap.do?metod=KitapDetay&KT_ID=11&KITAP_ID=21 Diğer ülkelere ait ölümler ise, Dünya Sağlık Örgütü’nün (WHO) her yıl yayınladığı “Dünya Sağlık İstatistikleri (world health statistics)” ve Birleşmiş Milletler Örgütü’nce her yıl yayınlanan “Demographic Yearbook” isimli yıllıklardan elde edilebilmektedir.

http://www.who.int/gho/publications/world_health_statistics/en/index.html (Dünya Sağlık Örgütü’nün, (WHO) Dünya Sağlık İstatistiklerine ait web sitesi)

http://unstats.un.org/unsd/demographic/products/dyb/dyb2.htm (Birleşmiş Milletler Örgütünce hazırlanan Demographic Yearbook)

http://www.tuik.gov.tr/Kitap.do?metod=KitapDetay&KT_ID=11&KITAP_ID=21

http://www.tuik.gov.tr/Kitap.do?metod=KitapDetay&KT_ID=11&KITAP_ID=21

http://www.who.int/gho/publications/world_health_statistics/en/index.html

http://unstats.un.org/unsd/demographic/products/dyb/dyb2.htm

92

Ölümlere ilişkin hesaplamalar yaşa göre, cinsiyete göre, ölümlerin oldukları aylara göre, mesleğe göre, medeni duruma göre, ölüm nedenine göre olmak üzere farklı şekillerde hesaplanabilmektedir.

TÜİK verilerine göre Türkiye’de 2000-2009 yılları arasında yaşa göre ölüm sayıları Tablo 4.9’da verilmiştir.

Tablo 4.9: Türkiye’de, 2000-2009 yılları arası yaş gruplarına göre ölüm sayıları

YIL 0-11 ay 1-4 yaş 5-14yaş 15-34 yaş 35-54 yaş 55-74 yaş 75 +

2000 15.543 2.907 2.108 8.515 23.841 72.035 49.366 2001 14.947 2.915 2.123 8.370 24.020 71.131 51.631

2002 13.125 2.365 1.830 7.181 23.417 71.310 56.206 2003 12.878 2.428 2.000 8.219 25.146 73.913 59.746

2004 10.706 2.190 1.997 8.043 24.041 72.131 62.255

2005 10.180 2.249 2.092 7.947 24.957 75.748 67.876 2006 10.199 2.220 1.993 8.205 25.748 78.307 76.735

2007 10.201 2.015 1.978 7.772 25.300 76.951 80.996 2008 9.987 2.017 1.718 7.404 25.590 76.301 86.523 2009 14.348 4.564 5.974 15.432 41.971 122.651 159.064

Ölümlerle İlgili Hız ve Oranlar

Ölümlerle ilgili olarak hesaplanan birçok hız ve oran bulunmaktadır. Bunlardan bazıları; Kaba ölüm hızı, yerel ölüm hızı, yaşa özel ölüm hızı, cinsiyete özel ölüm hızı, yaşa ve cinsiyete özel ölüm hızı, ana ölüm hızı, bebek ölüm hızı, ölü doğum hızı, perinatal ölüm hızı, orantılı ölüm hızı, yaşa özel orantılı ölüm hızı, ölüm nedenine göre orantılı ölüm hızıdır.

Kaba Ölüm Hızı (KÖH)

Bir ülke ya da bölgede belirli bir yıl içindeki toplam ölüm sayısının yıl ortası nüfusa oranlanması ile hesaplanır. Bölge ya da ülkenin kabaca ölüm düzeyi hakkında bilgi verir. Aşağıdaki şekilde hesaplanır.

Örnek 4.6: TÜİK 2009 yılı verilerine göre Türkiye genelinde görülen ölüm sayısı 367.971 olarak saptanmıştır. Aynı yıla ait yılortası nüfusumuz 72.561.312 olduğuna göre Kaba ölüm hızını hesaplayınız.

2009 yılında Türkiye’de her 1.000 kişiden 5’i ölmüştür.

Bir bölgenin 2010 yılı kaba ölüm hızı ‰3,13 ve aynı yıla ait yıl ortası nüfusu 4.526.410 kişidir. Bölgedeki 2010 yılı ölen sayısını hesaplayınız?

Nüfusun yaş ve cinsiyet dağılımları bölgelerde farklı olabilir. Nüfus yapısı içerisinde yaşlıların oranı fazla olan bir ülkenin sağlık düzeyi yüksek olsa bile, yaşlılar ilerleyen zamanlarda daha fazla öleceğinden kaba ölüm hızı yüksek çıkmaktadır. Bu bakımdan bölgeler arası karşılaştırmalar kaba ölüm hızı yerine diğer standartlaştırılmış ölüm hızları ile yapılabilir. Bu hızlarının bazılarının tanımları ve hesaplama biçimleri aşağıda verilmiştir.

93

Cinsiyete Özel Ölüm Hızı (CÖÖH)

Genellikle bir yıl için hesaplanır. Bir bölgede bir yıl içinde incelenen cinsiyette ölen sayısının, bu cinsiyete ait yıl ortası nüfusuna bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanır.

Örnek 4.7:

TÜİK 2009 yılı verilerine göre Türkiye genelinde kadınlarda görülen ölüm sayısı 172.078 olarak saptanmıştır. Aynı yıla ait kadın yılortası nüfusumuz 36.125.322 olduğuna göre Kadınlara özel ölüm hızını hesaplayınız.

2009 yılında Türkiye’de her 1.000 kadından yaklaşık olarak 5’i ölmüştür.

Yaşa Özel Ölüm Hızı (YÖÖH)

Bir bölgede bir yıl içinde incelenen yaş grubunda ölen sayısının, bu yaş grubu yıl ortası nüfusuna bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanır.

Genel Mortalite Hızı (GMH)

Bir bölgede bir yıl içinde belirli bir hastalıktan ölenlerin (mortalite), yıl ortası nüfusa bölünmesi ile elde edilir. Aşağıdaki gibi hesaplanır

( )

Örnek 4.8:

2008 yılı verilerine göre Türkiye genelinde kalp rahatsızlığına bağlı sebeplerden 72.564 kişi ölmüştür. Aynı yıla ait yılortası nüsus ise 71.517.100 olduğuna göre bu hastalığa ilişkin genel mortalite hızı nedir? Hesaplayınız

2008 yılında Türkiye’de her 10.000 kişiden yaklaşık olarak 1’i kalp rahatsızlığına bağlı nedenlerden

ölmüştür. GMH çok küçük bir değer aldığından onbinde olarak hesaplanmıştır.

Bebek Ölüm Hızı (BÖH)

Bir yıl içinde bölgede bir yaşına (0-364 günlük) girmeden ölen bebeklerin o yılda canlı doğan toplam bebek sayısına oranlanmasıyla elde edilir. Bölgedeki her bin canlı doğuma karşı kaç bebeğin bir yaşına girmeden öldüğünü ifade eder. Bebek ölüm hızı aşağıdaki gibi hesaplanır.

94

( )

Örnek 4.9:

A bölgesinde 2011 yılı içerisinde 1 yaşını doldurmadan ölen bebeklerin sayısı 82 olarak belirlenmiştir. Aynı yıl içerisinde bölgedeki meydana gelen canlı doğum sayısı ise 1.560’tır. Bu bölgenin 2011 yılına ait bebek ölüm hızını hesaplayınız.

( )

Bu bölgede canlı doğan her 1.000 bebekten 53 tanesi ( 53) 1 yaşına girmeden ölmüştür. Bu

oldukça yüksek bir hızdır. Bölgenin geri kalmışlığının en önemli ölçüsüdür.

Bir bölgede 2010 yılı içinde bir yaşını doldurmadan ölen bebek sayısı 49’dur. Bölgenin aynı yıla ait kaba ölüm hızının ‰7’ye eşit veya daha az (KÖH≤‰7) olduğu bilindiğine göre, bölgeye ait 2010 yılı canlı doğum sayısı en az kaç olmalıdır?

Bebek ölüm hızı bölgede ana-çocuk sağlığı hizmetlerinin sağlık kurumları tarafından iyi yürütülüp yürütülmediğini göstermek için kullanılan ve uluslarası kabul gören önemli istatistiklerdendir. Ülkenin ya da bölgenin sağlık düzeyini ve gelişmişliğini gösterir. BÖH gelişmiş ülkelerde ‰10’un altına inmiştir. Avrupa ülkelerinin çoğunda ‰4-6 arasındadır.

Bebek ölüm hızı neonatal ve postneonatal dönem olarak ikiye ayrılır. Neonatal dönem 0-27 günlük dönemde ölen bebekler için, postneonatal dönem ise 28-364 günlük dönemde ölen bebekler için kullanılır. Neonatal dönemide kendi içerisinde 0-6 günlük için erken neonatal dönem, 7-27 günlük için ise geç neonatal dönem olarak ikiye ayırmak mümkündür.

Neonatal dönemdeki bebek ölümlerin büyük bir kısmı doğuştan normal olmayan bebekler, doğumdaki travmalar, genetik problemler, 37 haftadan daha erken doğan bebekler, düşük doğum ağırlığı gibi önlenmesi zor ve tedavisi güç ya da olanaksız hastalıklara bağlıdır.

Postneonatal dönemdeki ölümler genellikle iyi bakım ve beslenme, hijyen, aşılama, zamanında teşhis ve tedavi hizmetleri ile önlenmektedir. Postneonatal dönemdeki bebek ölümlerinin en düşük seviyede olması sağlık sisteminin başarısı olarak değerlendirilmektedir

Ölü Doğum Hızı (ÖDH)

Gebelikte, 28. haftadan sonraki fetüs ölümü ölü doğum olarak adlandırılır. Ölü doğumlar veya gebeliğin 20. haftasından sonraki ölümler (perinatal) sayı olarak ana ölümlerinden daha fazladır. Bundan dolayı bölgelerin yapısı hakkında, kolay ölçülebilir ve ana ölüm hızından daha geçerli bilgi verir. Fakat bu

95

hızların güvenilir olabilmesi için ölü doğumların doğru bir şekilde kayıt edilmesi gerekir. Bu kayıtların doğru ve güvenilir olmadığı ülke ve bölgelerde, ölü doğum hızının doğru hesaplanması ve doğru yoruma gidilmesi mümkün olmamaktadır.

Kurum yöneticisi ve sağlık planlayıcıları bilmelidir ki hizmet verilen bölgede tüberküloz, tifo, dizanteri, kolera vb. hastalıklar ölü doğum hızını arttırdığı gibi hijyenik koşullarda sürdürülemeyen gebeliklerde de ölü doğum hızı yükselmektedir.

Perinatal Ölüm Hızı (PÖH)

Yıl içerisindeki ölü doğan bebek sayısı ile canlı doğan fakat 0-6 gün arasında ölen bebeklerin, o yılki tüm canlı doğum sayısına bölünmesiyle elde edilmektedir. Aşağıdaki şekilde hesaplanmaktadır.

Ana Ölüm Hızı (AÖH)

Anne ölüm hızı bir ülkenin sağlık düzeyini gösteren önemli bir ölçüttür. Annenin gebeliği hijyenik koşullarda sürdürülemiyorsa, doğum ve lohusalık dönemlerinde etkili bir sağlık hizmeti alamıyorsa, bu bölgedeki anne ölümleri dolayısıyla yüksek olacaktır. Bu hızın hesaplanmasında eğer gebe, herhangi bir kaza ya da gebelik dışında farklı bir hastalıktan ölmüş ise bu ölümler anne ölümleri dışında tutulmaktadır.

Orantılı Ölüm Hızı (OÖH)

Orantılı ölüm hızı farklı yaşlara veya ölüm nedenlerine göre ayrı ayrı hesaplanabilmektedir. Bunlara ait tanım ve hesaplamalar aşağıda verilmiştir.

Yaşa Göre Orantılı Ölüm Hızı (YGOÖH)

Belirli bir yaş veya yaş grubundaki ölümlerin, toplam ölümler içerisindeki yüzdesini gösteren bir istatistiktir. Ülkelerin ve bölgelerin sağlık düzeylerini gösteren en önemli ölçütlerden biridir. Sağlık düzeyi yüksek olan ülkelerde, 50 yaşın üzerindeki ölümler tüm ölümlerin %90’ı veya da daha fazlasını oluşturmaktadır.

Yaşa göre orantılı ölüm hızı genellikle üç yaş grubu için hesaplanmaktadır. Bunlar 0-4 yaş grubu, 5-49 yaş grubu ve 50+ yaş grubudur. Bu yaş gruplarına ait ölüm sayıları ayrı ayrı belirlenir. İstenilen yaş grubuna ait ölüm sayıları, tüm ölümlere (üç gruptaki ölü sayısının tamamına) oranlanarak yaşa göre orantılı ölüm hızı belirlenir.

96

Örnek 4.10:

Bir ülkede 2011 yılına ait ölümler yaş gruplarına göre Tablo 4.10’da verilmiştir. Bu verilere göre ülkenin 2011 yılı yaşa göre orantılı ölüm hızlarını hesaplayınız.

Tablo 4.10: 2011 yılı yaş gruplarına göre ölümler

Yaş grupları Ölümler 0-4 13.047 5-49 23.933 50+ 173.603

Toplam 210.583

Ölüm Nedenine Göre Orantılı Ölüm Hızı (ÖNGOÖH)

Bir yıl içerisinde belirli bir nedenden dolayı olan ölümlerin, o yıla ait toplam ölümler içerisindeki yüzdesini vermektedir.

Örnek 4.11:

Bir bölgede 2010 yılında çeşitli nedenlerle toplam 3.127 kişi ölmüştür. Aynı bölgede kalp hastalıkları nedenine bağlı olarak toplam 29 kişi ölmüş ise ölüm nedenine göre orantılı ölüm hızını hesaplayınız.

Bölgede kalp hastalıkları nedenine bağlı olan ölümler, tüm ölümlerin %0,927’sini ( ’sini)

oluşturmaktadır.

HASTALIKLARLA İLGİLİ İSTATİSTİKLER Hedef topluma ait hastalıkların iyi bir şekilde değerlendirilmesi birçok yönden sağlık kurumunun yöneticisine ve personeline, sağlık alanındaki planlamaların daha etkin biçimde yapılması için çok büyük avantajlar sağlamaktadır. Bu verileri değerlendirirken hastalıkların bölgelere, sosyo-kültürel ve ekonomik özelliklere, aylara, yıllara, mevsimlere, göre dağılışlarını hesaba katmak gerekmektedir. Ayrıca bölgede sık görülen hastalıkların görülüş sırasına göre dağılımlarını dikkatlice incelemek gereklidir. Aşağıda hastalıkların kurumlar, bölgeler, ülkeler arasındaki karşılaştırılmalarına imkan veren bazı istatistikler verilmiştir.

Hastalıklarla İlgili Hızlar

Çalışmalarda, incelenen süre içerisinde hastalık (morbidite) ve hasta kişi sayısı farklı olabileceği için hastalık hızları, hastalık (vaka) ve hasta için ayrı olarak hesaplanmalıdır. İncelenen sürede hastalık hızları, prevelans hızı ve insidans hızı olarak iki değişik biçimde hesaplanabilir.

97

Prevalans hızı: İnceleme süresi (period) içinde mevcut hasta sayısının (eski ve yeni olgular dahil olmak üzere) risk altındaki nüfusa bölünmesiyle elde edilen hastalık hızıdır. Bir hastalığın o toplumda görülme sıklığı olarakta ifade edilir. Prevelans hızı, genellikle kronik hastalıkların görülme sıklıklarını ifade etmekte kullanılmaktadır.

Prevelans hızı hastalık ve hasta için ayrı ayrı hesaplanabildiği gibi günlük (nokta) ve aylık ya da yıllık (süre) olarakta hesaplanabilir.

Nokta Prevelans Hızı

Belirli bir anda (günde) mevcut eski ve yeni olguların risk altındaki topluma oranının yüzde çarpımıdır.

Örnek 4.12:

Eskişehir’de bir aile hekimliği bölgesinde, 20 Kasım 2011 tarihinde 2.400 çocukta 284 Akut Solunum Yolu Enfeksiyonu (ASYE) vakası tespit edilmiştir. Verilen tarihteki nokta prevelans hızını hesaplayınız. (örnek varsayımsaldır)

İnsidans Hızı

İncelenen süre içerisinde yeni gözlenen hasta sayısının risk altındaki nüfusa oranlanmasıyla elde edilen yeni olgu gözlenme hızıdır. Bir bölgede, herhangi bir hastalığın mevcutlara ek olarak belirli bir süre içerisinde yeniden görülme sıklığının belirlenmesidir. Akut, sosyal ve bulaşıcı hastalıkların değerlendirilmesinde kullanılmaktadır.

İnsidans hızı hastalık ve hasta için iki ayrı biçimde hesaplanabilir.

( )

( )

Örnek 4.13:

Bir sağlık ocağı bölgesinde 2011 yılı Temmuz ayında 2.500 çocuktan yeni ishal olan vaka sayısı 216 ise, vaka insidans hızını hesaplayınız.

( )

98

Örnek 4.14:

Bir sağlık ocağı bölgesinde 2011 yılı Temmuz ayında 2.500 çocuktan yeni ishal olan kişi sayısı 160 ise, şahıs insidans hızını hesaplayınız.

( )

Fatalite Hızı

Belirli bir hastalıktan ölenlerin o hastalığa yakalananların sayısına oranlanması ile bulunur. Belirli bir süre içinde X hastalığına yakalananların bu süre içinde %, ‰, … (k) kaçının öldüğünü ifade etmek için kullanılır. Aşağıdaki şekilde hesaplanır.

Örnek 4.15:

Bir bölgede 2011 yılı içerisinde karaciğer kanserine yakalananların sayısı 1.500 ve aynı hastalıktan ölenlerin sayısı 600’dür. Eldeki verilere göre Fatalite hızını hesaplayınız.

Bölgenin 2011 yılı Karaciğer kanserine ilişkin Fatalite hızı %40 olarak elde edilir.

Afrika’da bir bölgede 2011 yılı içerisinde AIDS hastalığına yakalanan 4.481 kişiden 2.128’i (AIDS hastalığından) ölmüştür. Bölgenin Fatalite hızını hesaplayınız.

Hastalık Riskleri

Hastane yöneticisi, hastalık risklerine bağlı olarak bazı durumlarda çalışanlarını, hastaları ve hizmet verdiği nüfusu bilgilendirme toplantıları yapabilir. Hastalıklar hakkında toplumu bilinçlendirerek toplum sağlığı hizmetlerini yürütebilir. Halk sağlığı ve aile hekimliği birimleri ile ortak hareket ederek toplumun sağlık seviyesini arttırma çabasına girebilir. Böylece önlenebilir bazı hastalıklardan toplumu koruyabilir, sağlık konusunda toplumu bilinçlendirebilir ve sağlık giderlerinin azaltılmasını sağlayabilir.

Bir hastalığın ortaya çıkmasında kesin etkisi olup olmadığı bilinmeyen, fakat hastalığın ortaya çıkmasında birçok faktör arasında yer alan ve varlığında ise hastalığın gözlenme oranını arttırdığı saptanan değişkenlere risk faktörü denir. Örneğin; sigara alışkanlığı akciğer kanserinin bir risk faktörüdür. Yaş, cinsiyet, günlük içilen sigara sayısı, kolesterol düzeyi, sistolik kan basıncı (SKB), stres, sedanter yaşam gibi faktörler de kalp hastalıklarında birer risk faktörüdür.

Hastalık risklerinin hesaplanmasında; bir hastalık durumunda risk faktörünün olması ve hastalık yokluğunda risk faktörünün olması durumlarından yararlanılır. Risk faktörü ile belirli bir hastalık arasındaki bağımlılığı, birlikteliği değerlendirmek için yararlanılan ve olasılık kurallarından yararlanılarak geliştirilen birçok oran bulunmaktadır. Bunlar araında en çok kullanılanlar Odds Oranı (Göreli orantı, olasılıklar oranı, Odds ratio, OR), Göreli Risk Oranı (Relative Risk) ve Atfedilen Risktir (Attributable Risk).

Hastalık risklerine ilişkin tanım ve hesaplar aşağıda verilen Tablo 4.11’den yararlanılarak hesaplanmaktadır.

99

Tablo 4.11: Risk faktörünün varlık ya da yokluğuna göre hastalık durumu

Göreli Risk Oranı

Risk faktörü var iken hastalığın görülme sıklığının, risk faktörü yok iken hastalığın görülme sıklığına oranına Göreli Risk Oranı adı verilmektedir. Tablo 11 incelenecek olursa, risk faktörü var iken, risk faktörü altındaki birey oranı; a/(a+b) ve risk faktörü yok iken, risk faktörü altındaki birey oranı; c/(c+d) olarak alınır. Göreli risk oranı ise bu iki riskin birbirine oranlanması ile elde edilir. Risk faktörü varken, faktörün olmadığı duruma göre hastalığın kaç kat daha fazla gözlendiğini belirten bir orandır. Aşağıdaki formül ile hesaplanmaktadır.

( )⁄

( )⁄

Örnek 4.16:

Bir hastaneye başvuran 1.010 hastadan 106 hastanın sigara içtiği ve bu 106 hastanında 6 tanesinin Akciğer kanserine yakalandığı tespit edilmiştir. Sigara içmeyen diğer 904 hastadan ise 4 tanesinin sigara kullandığı saptanmıştır. Akciğer kanserine yakalanmada sigara içme alışkanlığının önemli bir risk faktörü olduğu bilinmektedir. 1.010 kişi ile yapılan bir araştırmadan elde edilen veriler Tablo 4.12’de verilmiştir. Buna göre Göreli Risk Oranını hesaplayınız.

Tablo 4.12: Sigara alışkanlığı risk faktörüne göre akciğer kanserine yakalanma durumu

Akciğer Kanseri

Toplam Var Yok

Sigara Alışkanlığı İçen 6 100 106 İçmeyen 4 900 904

Toplam 10 1.000 1.010

( )⁄

( )⁄

Yukarıda elde edilen sonuca göre, sigara içen kişilerin akciğer kanserine yakalanma riski içmeyenlere

göre 12,8 kat daha fazla olduğu yorumu yapılır.

Odds Oranı (Odds Ratio): T zaman diliminde toplumda gözlenen bir hastalığın gözlenme oranı P(H) ve gözlenmeme oranı Q(H) olarak tanımlanabilir. Hastalığın gözlenme oranının, gözlenmeme oranına bölünmesine ise odds adı verilir. İki odds un birbirine oranlanması ise odds oranı olarak tanımlanmaktadır. Kısaca risk faktörünün olduğu durumda hastalık görülme oranının, risk faktörü olmadığı durumdaki hastalık görülme oranına bölümü Odds oranı olarak ifade edilmektedir.

⁄

⁄

Belli bir olayın olasılığının iki grup için aynı ya da benzer olup olmadığını karşılaştırmanın bir

yoludur. OR=1 olması her iki grup için olayın olması olasılığı eşit demektir. OR>1 ise olayın olması olasılığı birinci grupta daha fazla, OR<1 ise olayın olması olasılığı birinci grupta daha azdır.

Hastalık

Var Yok

Risk faktörü Var a b

Yok c d

Toplam a+c b+d

100

Örnek 4.17:

Akciğer Kanserine yakalanmada sigara içme alışkanlığının önemli bir risk faktörü olduğu bilinmektedir. Bu nedenle toplam 1.010 kişi ile yapılan bir araştırmadan elde edilen veriler Tablo 4.13’te verilmiştir. Buna göre Odds Oranını (OR) hesaplayınız. (Anlaşılmasının ve karşılaştırmaların kolay olması nedeni ile Örnek 16’nın verileri bu örnekte kullanılmıştır.)

Tablo 4.13: Sigara alışkanlığı risk faktörüne göre akciğer kanserine yakalanma durumu

Akciğer Kanseri Toplam

Var Yok

Sigara Alışkanlığı içen 6 100 106

İçmeyen 4 900 904

Toplam 10 1.000 1.010

⁄

⁄

Yukarıda elde edilen sonuca göre, sigara kullanımına bağlı akciğer kanseri hastalığına yakalanma

riski, sigara kullanmayanlara göre 13,5 kat daha fazladır. Sigara kullanan kişiler akciğer kanserine 13,5 kat daha fazla yakalanmaktadır.

Atfedilen Risk

Belirli bir risk faktörün etkisiyle hastalananların (ya da ölenlerin) hızından bu faktörün etkisinde kalmadan hastalananların (ya da ölenlerin) hızının çıkarılmasıyla elde edilir.

( ( )⁄ ) ( ( ))⁄

Örnek 4.18:

Bir bölgede, sigara içenlerde akciğer kanserine yakalanma oranı ‰8,45, bu oran sigara içmeyenlerde ise ‰1,07 olarak saptanmıştır. Eldeki verilere göre akciğer kanserinin sigara kullanımına atfedilen riskini hesaplayınız.

Atfedilen risk=8,45-1,07=7,38

Elde edilen sonuca göre akciğer kanserine yakalanmanın sigaraya atfedilen riski ‰7.38’dir.

KORUYUCU SAĞLIK HİZMETLERİ Koruyucu sağlık hizmetleri ile ilgili toplanan veriler, sağlık hizmetlerinin örgütlenmesi, bu hizmetleri etkin bir biçimde yürütülme ve yeniden düzenlenmesi, uygun bir biçimde planlaması ve farklı bölgelere ait verilerin karşılaştırılması işlemlerine olanak sağlamaktadır. Sağlık kurumlarının yöneticileri aynı zamanda koruyucu sağlık hizmetlerinde de etkin bir rol oynamaktadır. Yönetici, koruyucu hizmetlerle ilişkili olarak personel, araç, gereç vb. istihdamını sağlama, bunları düzenleme ve sağlıkla ilgili olarak gerekli önlemleri alma çabası içerisinde olmalıdır. Koruyucu sağlık hizmetleri için hesaplanan istatistikler aşağıda verilen ana başlıklar altında sıralanabilmektedir.

Aile planlamasına hizmetleri

Gebe ve lohusa bakım ve takip hizmetleri

Bebek ve çocuk bakım, takip, aşılama hizmetleri

Kronik hastalıkların bakım ve takip hizmetleri

Çevre sağlığı hizmetleri

101

Kurum yöneticisine ve sağlık planlayıcısına yukarıda sayılan ana başlıklara ait doğru, güvenilir ve güncel verilerin elde edilmesi ve bu ham verilerin yararlı bilgilere (enformasyona) dönüştürülmesi aşamasında büyük iş düşmektedir.

SUNULAN SAĞLIK HİZMETLERİNİN DÜZEYİNİ GÖSTEREN İSTATİSTİKLER Sağlık kurumu tarafından hedef topluma sunulan hizmetlerin başarılı olup olmadığını saptamada kullanılan birçok gösterge geliştirilmiştir. Sağlık kuruluşu ya da ülke için düşünüldüğünde sağlık düzeyi göstergeleri olarak adlandırılan bu istatistikler aynı zamanda kurumlar, bölgeler ve ülkeler arası karşılaştırmalar içinde sıklıkla kullanılmaktadır. Bu göstergeler kurumların, bölgelerin ve ülkelerin sağlık açısından zaman içerisindeki değişimlerinin olumlu yönde olup olmadığının değerlendirmelerine de olanak sağlamaktadır. Bu nedenle kullanılan verilerin ve bu verilerden hesaplanan göstergelerin karşılaştırmalara olanak sağlayacak şekilde standart olması gerekmektedir..

Çalışmalardan elde edilen göstergeler öncelikle hastane, sağlık ocağı, il, bölge, ülke için önceki yıllara ait göstergeler ile, ikinci aşamada aynı ya da benzer hizmet veren başka kuruluşlarla karşılaştırılır. Bu tür karşılaştırmalar sağlık hizmetlerinin hangi alanlarda başarılı, hangi alanlarda başarısız olduğunun ortaya konması ve başarısızlığın giderilmesi, eksiklerin tamamlanması için gereken önlemlerin alınması yönünden çok faydalıdır.

Ülkeler, bölgeler ve kurumlar arası karşılaştırmalara olanak sağlayan çok sayıda sağlık hizmet düzeyi ölçüsü bulunmaktadır. Bu nedenle, sağlık alanında ülkeler ya da kurumlararası karşılaştırmalarda tek ölçü ile değil çok sayıda ölçü ile karşılaştırmalar yapılmalıdır. Yukarıda da üzerinde durulduğu gibi ölçüler ve ölçülerin hesaplanmasında kullanılan veriler standart olmalıdır. Sağlık kurumların personel, bütçe ve diğer olanakları her zaman göz önünde bulundurulmalıdır. Ölçüleri etkileyebilecek bazı faktörler (eğitim, sağlık, sosyal ve ekonomik özellikler vb.) dikkate alınmalıdır.

YAŞAM TABLOLARI

Bir ülkede yaşayan insanlar, ülkenin sahip olduğu sosyal, ekonomik ve sağlık koşullarından farklı şekillerde etkilenmekte ve farklı yaş gruplarında değişik risklere maruz kalmaktadırlar. Belirli bir yaş ya da yaş grubu içerisindeki bireylerin sahip oldukları ölüm risklerini, ölüm istatistikleri aracılığı ile değerlendiren ve bireylerin beklenen yaşam sürelerini belirlemeyi amaçlayan tablolara yaşam tabloları denir.

Yaşam tabloları belli bir yaşa sağ olarak ulaşan bir kişinin, ortalama daha kaç yıl yaşayacağına ilişkin hesaplamaların yapıldığı bir tablodur. Genellikle 0-4, 5-9, 10-14, …, 80-84, 85+ yaş gruplarına göre hazırlanan yaşam tabloları, her bir yaş grubundaki bireylerin tahmini olarak kaç yıl yaşayacağını belirtir. Kadınlara ve erkeklere göre ayrı ayrı hesaplanabilmektedir. Bunun dışında belli iş kollarına, bekar, evli kalma sürelerine, uygulanan tedavi sonrasında hastanın kaç yıl yaşayacağına göre farklı alanlarda yaşam tabloları da hesaplanabilmektedir. Beklenen yaşam süresi bazı kaynaklarda beklenen yaşam ümidi olarakta adlandırılmaktadır.

Tablo 4.14’teki ilk sütun yaş gruplarını, Nx sütunu (2. sütun) yaş gruplarına göre nüfus sayılarını ve Dx

sütunu ise (3. sütun) yaş gruplarına göre ölüm sayılarını göstermektedir. Tablonun 2 ve 3. sütundan hareket ederek, bir dizi matematiksel işlem sonucunda ex sütunu (10. sütun) elde edilir ki bu sütun belli bir yaş grubuna ulaşan bireylerin beklenen yaşam süresini göstermektedir.

Örneğin Tablo 4.14’te, 2009 yılında Türkiye’de 5-9 yaşındaki bir çocuğun beklenen yaşam süresi 72,78 yıl olarak gösterilmiştir. Tablodan da görüleceği gibi bir yaşını doldurmadan olan ölümler oldukça fazladır. Bu nedenle sıfır “0” yaş grubu nüfusumuzun beklenen yaşam süresi (76,38yıl), 1-4 yaş grubu nüfusa (76,51yıl) göre daha düşüktür. Nüfusun genel yapısı içerisinde, bir yaşını doldurmadan ölen bebek sayısının fazla olmasından dolayı yaşam tablolarında bu iki yaş grubu birbirinden ayrılmıştır.

102

Türkiye’nin 2009 yılına göre düzenlenmiş yaşam tablosu Tablo 4.14’te görülmektedir.

Tablo 4.14: Türkiye’nin 2009 yılına göre düzenlenmiş yaşam tablosu

Yaş Grupları

Nx

1 Dx

2 nmx

3 nqx

4 nPx

5 lx

6 ndx

7 nLx

8 Tx

9 ex

10 0 1231064 17354 0,014097 0,014548 0,985452 100000 1455 98694 7638126 76,38

1-4 4924257 4564 0,000927 0,003701 0,996299 98545 365 393451 7539431 76,51

5-9 6201647 3433 0,000554 0,002764 0,997236 98180 271 490224 7145980 72,78

10-14 6502366 2541 0,000391 0,001952 0,998048 97909 191 489068 6655756 67,98

15-19 6234620 3412 0,000547 0,002733 0,997267 97718 267 487922 6166688 63,11

20-24 6280117 3585 0,000571 0,002850 0,997150 97451 278 486561 5678766 58,27

25-29 6508860 4166 0,000640 0,003195 0,996805 97173 310 485090 5192205 53,43

30-34 5911032 4269 0,000722 0,003605 0,996395 96863 349 483441 4707115 48,60

35-39 5505313 5554 0,001009 0,005032 0,994968 96514 486 481354 4223674 43,76

40-44 4676145 7777 0,001663 0,008281 0,991719 96028 795 478152 3742320 38,97

45-49 4469953 11929 0,002669 0,013255 0,986745 95233 1262 473008 3264168 34,28

50-54 3725743 16711 0,004485 0,022178 0,977822 93970 2084 464642 2791160 29,70

55-59 2945603 21603 0,007334 0,036010 0,963990 91886 3309 451160 2326518 25,32

60-64 2361178 26201 0,011097 0,053985 0,946015 88578 4782 430933 1875358 21,17

65-69 1723714 33378 0,019364 0,092349 0,907651 83796 7738 399632 1444425 17,24

70-74 1323668 41469 0,031329 0,145267 0,854733 76057 11049 352665 1044793 13,74

75-79 1145932 61705 0,053847 0,237291 0,762709 65009 15426 286478 692128 10,65

80-84 611703 53694 0,087778 0,359909 0,640091 49583 17845 203300 405650 8,18

85+ 278397 43665 0,156844 1,000000 0,000000 31737 31737 202350 202350 6,38

Toplam 72561312 367010

HASTALIK VE ÖLÜM NEDENLERİNİN ULUSLARARASI SINIFLANDIRILMASI Sınırların kalktığı, insanların oldukça kolay bir şekilde ülkeler arasında yolculuk yaptığı dünyamızda hastalıklara ve ölüm nedenlerine her geçen gün yenileri ilave olmakta ve bu kadar çok hastalığın tek tek incelenmesi oldukça zor hale gelmektedir. Bu nedenle hastalıkları sınıflamak, belli alt başlıklarda incelemek bir zorunluluk haline gelmiştir. Hastalık ve ölüm nedenlerinin belirli bir sistematik içerisinde incelenmesi gerekmektedir. Bu nedenle Dünya Sağlık Örgütü (DSÖ) belli zamanlarda hastalık ve ölüm nedenlerini sınıflama yoluna gitmiştir. İlk sınıflama DSÖ tarafından 1946 yılında yapılmış, bunu daha sonra 1955, 1965, 1975 ve 1989 sınıflamaları takip etmiştir. 1989 yılında yapılan düzenleme ICD-10 (International Classification of Diseases-10) olarak adlandırılmıştır. Şu anda ülkemizde ICD-10 uygulanmaktadır. Ülkemizde yapılan bir çok çalışmada ve hazırlanan dökümanlarda sağlık hizmetlerinin yönetilmesi için kaliteli, güvenilir ve doğru sağlık enformasyonuna ihtiyaç olduğu, bu sağlık enformasyonununda toplanabilmesi için ICD-10’un kullanılması gerektiği savunulmuştur. ICD-10’u uygulamak için öncelikle iyi eğitimli bir personele, iyi bir otomasyona (yazılımların yeterli olması) ihtiyaç vardır. Hastanın hastaneye başvurmasından, ayakta ya da yatarak tedavi olmasına kadar, taburcu olup, faturalanmasına kadar tüm aşamalarda bu kodlama sistemlerinden yararlanılmaktadır. ICD-10 düzenlenmesinde hem alfabetik hem de sayısal kodlama sistemlerinden yararlanılmıştır. Tablo 4.15’te genel başlıklar altında ICD-10 listesi verilmiştir. Bu düzenlemede U harfi kullanılmamış, ileride olabilecek ilaveler ya da revizyonlar için boş bırakılmıştır.

ICD-10 aynı zamanda bölge ya da ülke hastanelerinin birbirleriylede karşılaştırılmasına olanak sağlamaktadır. Buradan elde edilen veriler değerlendirilerek bölge ya da ülkenin sağlık politikaları belirlenebilmekte, optimum düzeyde sağlık planlamaları yapılabilmektedir. Sağlık hizmetleri belli bir sistematik içerisinde yürütülmekte, kontrol altında tutulabilmektedir.

103

Kurum yöneticilerinin, personeli belli aralıklarla eğitim vermesi, bilgilendirmesi kurumun iyi bir şekilde yönetilmesi, zarar etmemesi bilgilerin doğru ve güvenilir olarak toplanması açısından çok önemlidir. Ayrıca kurum yöneticileri belirli aralıklarka kendi kurumunu, bölgedeki diğer kurumlarla karşılaştırabilmeli ve yeniliklere açık olmalıdır.

Tablo 4.15: Hastalıkların Uluslararası sınıflandırılması (1989 düzenlemesine göre ICD-10)

Hastalıkların uluslararası sınıflandırılması Kod Aralığı

1. Bölüm - Enfeksiyon ve Paraziter Hastalıklar (A00-B99)

2. Bölüm - Neoplazmlar (C00-D48)

3. Bölüm - Kan ve Kan Yapıcı Organ Hastalıkları ve Bağışıklık Sistemini İçeren Hastalıklar

(C00-D48)

4. Bölüm - Endokrin, Nutrisyonel ve Metabolik Hastalıklar

(E00-E90)

5. Bölüm - Akıl ve Davranış Bozuklukları (F00-F99)

6. Bölüm - Sinir Sistemi Hastalıkları (G00-G99)

7. Bölüm - Göz ve Gözle Bağlantılı Doku Hastalıkları

(H00-H49)

8. Bölüm - Kulak ve Mastoid Oluşum Hastalıkları (H60-H95)

9. Bölüm - Dolaşım Sistemi Hastalıkları (I00-I99)

10. Bölüm - Solunum Sistemi Hastalıkları (J00-J99)

11. Bölüm - Sindirim Sistemi Hastalıkları (K00-K93)

12. Bölüm - Cilt ve Cilt altı Dokusu Hastalıkları (L00-L99)

13. Bölüm - Kas-İskelet ve Bağ Dokusu Hastalıkları (M00-M99)

14. Bölüm - Ürogenital Sistem Hastalıkları (N00-N99)

15. Bölüm - Gebelik, Doğum ve Lohusalık Dönemi Hastalıkları

(O00-O99)

16. Bölüm - Perinatal Dönemden Kaynaklanan Hastalıklar

(P00-P96)

17. Bölüm - Konjenital Malformasyon, Deformasyon ve Kromozom Anomalileri

(Q00-Q99)

18. Bölüm - Semptomlar ve Anormal Klinik ve Laboratuar Bulguları

(R00-R99)

19. Bölüm - Yaralanma, Zehirlenme ve Dış Nedenlere Bağlı Diğer Durumlar

(S00-T98)

20. Bölüm - Hastalık ve Ölümün Dış Nedenleri

(V01-Y98)

21. Bölüm - Sağlık Durumu ve Sağlık Hizmetlerinden Yararlanmayı Etkileyen Faktörler

(Z00-Z99)

104

HASTANEDEKİ SAĞLIK HİZMETLERİNİN DEĞERLENDİRİLMESİ Bölge nüfusu, sağlık kurumundan etkin ve yeterli hizmet vermesini beklemektedir. Sadece tedavi hizmetleri değil, otelcilik hizmetleri, yemek hizmetleri gibi birçok alanda da hastaneden beklentiler üst seviyededir. Bu nedenle sağlık kurumu yönetcisi, kurumunu her alanda sürekli denetlemeli, yönetmeli, en iyi sağlık hizmetini bölge halkına sunmalıdır. Hastanelerde mevcut ya da yeni açılacak servisin yatak sayılarına karar verirmede en önemli faktörlerden biri ilgili hastalıkların çeşidi ve görülme sıklığıdır. Bu ise bölgenin demografik yapısını bilmekle, hastalık ile ilgili doğru ve güvenilir bir veri yapısının olması ile mümkündür. Bölgenin demografik yapısını, hasta sayısını bilmeden bir servis açmak, yatak sayısını arttırmak, bu servisi ya da yatakları yararsız kılabilir.

Yatak kapasitelerine bağlı olarak hastanelerin belirli bir sabit maliyeti bulunmaktadır. Bu maliyetin içerisine personel harcamaları, ısınma, aydınlatma, fiziki alt yapıya ilişkin giderler dahil edilebilir. Hastanede tedavi edilen hasta sayısı arttıkça, kapasite kullanım oranı artacak, dolayısıyla tedavi hasta birim maliyeti düşecektir. Bu yüzden kapasite kullanım oranı ile hasta birim maliyeti arasında ters yönde bir ilişki mevcuttur.

Her alandaki hizmet ögelerinin en iyi şekilde sunulması, kurumun verimliliğini ve tercih edilirliğini de önemli düzeyde etkilemektedir. Bu nedenle yöneticinin, hastane hizmetlerini hem kendi içerisinde (önceki yıllara göre) hemde diğer kurumlara karşı rasyonel olarak değerlendirmesini amaçlayan çeşitli oran ve hızlar geliştirilmiştir. Bu ölçütler aşağıdaki gibi sıralanabilir.

Kaba Ölüm Hızı (Hastane için)

Belirli bir süre içerisinde hastanedeki ölümlerin, taburcu edilen (ölenler dahil olmak üzere) toplam hasta sayısına bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanmaktadır.

( )

Örnek 4.19:

A hastanesinde bir yılda ölen sayısı 1.217, ölenler dahil toplam taburcu edilen hasta sayısı ise 85.190 olduğuna göre, hastanenin kaba ölüm hızını hesaplayınız

A hastanesinin kaba ölüm hızı %1,43 olarak elde edilmiştir.

Kaba ölüm hızı, kurumlar arası karşılaştırmalarda kullanılan en önemli ölçülerden biridir.

Net Ölüm Hızı

Hastaneye yatıştan sonra ilk 48 saatlik dilimdeki ölümler bu hızda dikkate alınmamaktadır. Hastaneye yatan hastanın laboratuvar tetkiklerinin yapılması, tanının konulması, gerekli olan tedaviye başlanması ve tedavinin etkinliğinin görülmesi için belli bir zamanın geçmesi gerekmektedir. Bu nedenle ilk 48 saatlik süredeki ölümler net ölüm hızında hesaplamaya katılmamaktadır. Aşağıdaki şekilde hesaplanmaktadır.

( )

105

Örnek 4.20:

A hastanesinde bir yılda ölen sayısı 1.217’dir. Fakat bunların 41 tanesinin ölüm olayı hastaneye yatışlarından itibaren ilk 48 saat içerisinde gerçekleşmiştir. Aynı hastanede ölenler dahil toplam taburcu edilen hasta sayısı ise 85.190 olduğuna göre, hastanenin net ölüm hızını hesaplayınız

A hastanesinin net ölüm hızı %1,38 olarak elde edilmiştir.

Yatak Doluluk Oranı (Kapasite Kullanım Oranı)

Yatak doluluk oranı, hastane yataklarının ne oranda kullanıldığını gösterir. Hastanenin hizmet potansiyelini ne ölçüde kullandığını gösteren önemli bir ölçüdür. Yatak sayısı baz alındığında doluluk (işgal) oranı, belirli bir zaman diliminde kullanılan yatak gün sayısının, toplam yatak gün sayısına (kapasitesine) oranıdır. Bu oran hastaneler arası performansların değerlendirilmesinde ve maliyetlerin izlenmesinde kapasite kullanım düzeyi hakkında hastane yöneticilerine bilgi vermektedir. Ayrıca Yatak doluluk oranı; hastane kullanımını gösteren ve sağlık planlayıcıları için yataklı tedavi kurumlarının yatak ihtiyaçlarının belirlenmesinde bilinmesi gereken temel ölçütlerdendir. Yatak kapasitesinin altında ya da çok üstünde çalışan hastanelerde, bu sayıların azaltılmasında ya da arttırılmasında kullanılan en önemli istatistiklerdendir. Belirli bir dönemde, yatan hastalara verilen toplam hasta bakımı gün sayısının, maksimum hasta bakım gün sayısına bölünmesi ve sonucun 100 ile çarpılması ile bulunur. Aşağıdaki şekilde hesaplanır.

( )

Örnek 4.21:

2010 yılı içinde Özel B hastanesi, yatan hastalara toplam 13.126 gün bakım hizmeti vermiştir. Hastanenin toplam yatak sayısı 50 olduğuna göre, 2010 yılı için yatak doluluk oranını hesaplayınız.

Özel B hastanesi %71,92 dolulukla 2010 yılı içerisinde hizmet vermiştir.

Yatak Devir Hızı

Bir yatağın yılda kaç hasta tarafından kullanıldığını belirten bir istatistiktir. Bir yıl içerisinde yatan hasta sayısı toplamının, yatak sayısına bölünmesi ile elde edilir. Aşağıdaki gibi hesaplanır.

Yatak Devir Aralığı

İki devir arasında yatağın ortalama kaç gün boş kaldığını gösteren bir ölçüttür. Yatak devir aralığı hesaplanırken, “kullanılmayan toplam hasta bakım gün sayısı”, toplam taburcu edilen (ölenler dahil olmak üzere) hasta sayısına bölünür ve gün olarak hesaplanır. Hastanelerdeki bir hasta yatağının ne kadar boş kaldığını gösterir. Aşağıdaki biçimde hesaplanır.

( )

106

Örnek 4.22:

2010 yılı Aralık ayı içinde Özel B hastanesi, yatan hastalara toplam 1.126 gün bakım hizmeti vermiştir. Hastanenin toplam yatak sayısı 50’dir. Aynı ay içerisinde toplam taburcu edilen hasta sayısı (ölenler dahil olmak üzere) 210 olduğuna göre yatak devir aralığını hesaplayınız.

Öncelikle Hastanenin bakım hizmeti veremediği gün sayısını hesaplamak için aşağıdaki işlem yapılır

Hastanenin bakım hizmeti vermediği gün sayısı=(30x50)-1.126=374 gün

Özel B hastanesinin 2010 yılı Aralık ayına ait yatak devir aralığı 1,78 gün olarak hesaplanmıştır

Ortalama Hasta Yatış Gün Sayısı

Bir hastanın, hastanede kaldığı ortalama gün sayısını belirtmektedir. Belli bir dönemde hastaneden taburcu olan hastaların (ölenler dahil olmak üzere) toplam yattıkları gün sayısının, aynı dönemde hastaneden taburcu olan hastaların (ölenler dahil olmak üzere) toplam sayısına bölümü ile elde edilir. Aşağıdaki şekilde hesaplanır.

( )

Örnek 4.23:

2010 yılı içerisinde B hastanesinde toplam yatılan gün sayısı 13.126’dir. Taburcu olanların sayısı 1.485 ve ölenlerin sayısı ise 143 olduğuna gore hastanede ortalama hasta yatış gün sayısını hesaplayınız.

2010 yılı içinde B hastanesinde ortalama yatış süresi 8.06 gün olarak elde edilmiştir.

Yatan Hasta Oranı

Belli bir dönemde hastanede yatan toplam hasta sayısı, acil servis ve polikliniklerden başvuran toplam hasta sayısına bölünür ve sonuç 100 ile çarpılır. Kurum yöneticisi bu istatistik ise hem kendi kurumunu yıllar içerisinde değerlendirebilir, hemde diğer sağlık kurumları ile karşılaştırma imkanı bulur. Aşağıdaki şekilde hesaplanır.

Örnek 4.24:

2010 yılı içerisinde B hastanesinde toplam yatan hasta sayısı 47.113’dür. Aynı zaman dilimi içerisinde hastanenin acil servisine 81.128 ve diğer servislerine toplam 183.196 başvuru olduğuna gore hastanenin 2010 yılı yatan hasta oranını hesaplayınız

2010 yılı için B hastanesinin yatan hasta oranı %17,82 olarak elde edilmiştir.

107

Onbin Nüfusa Düşen Yatak Sayısı

Bölgedeki hastanelerin toplam yatak sayısının, bölge nüfusuna bölümünün 10.000 ile çarpılması ile elde edilir. Her 10.000 kişiye düşen hastane yatağı sayısının belirlenmesinde kullanılır. Bölgeler arası karşılaştırmalarda kullanılır. Aşağıdaki şekilde hesaplanır.

Yukarıda hesaplanan istatistikler dışında hastanelerdeki sağlık hizmetlerinin değerlendirilmesinde

kullanılan bir çok gösterge bulunmaktadır. Bunlardan bazıları aşağıda verilmiştir.

Anestezi ölüm hızı

Ameliyat sonrası ölüm hızı

Hastanede ana ölüm hızı

Hastanede bebek ölüm hızı

Enfeksiyon hızları (kaba enfeksiyon hızı, ameliyat sonrası enfeksiyon hızı)

Otopsi hızı

Sezeryan hızı

Yukarıda sayılan istatistikler dışında hastanelerde poliklinik hizmetlerinide değerlendirmede kullanılan çalışmalarda yapılabilmektedir. Genelde poliklinik hizmetleri, muayene edilen hasta sayısı ile değerlendirilir. Bu hasta sayıları hastaların farklı demografik, hastalık, tedavi, vd. özelliklerine göre de ayrıca incelenebilmektedir.

Personel ve yatak durumları, laboratuvarlarda yapılan tetkiklerin yıllara göre dağılımı, doğumların yıllara ve oluş biçimlerine göre dağılımı, yatan hastaların yıllara ve yatış durumlarına göre dağılımları hastanelerin değerlendirilmesinde sıklıkla kullanılmaktadır. Ayrıca farklı servislerde muayene edilen hasta sayıları, yaşa ve cinsiyete göre hasta sayıları, sosyo-ekonumik ve kültürel özelliklere göre hasta sayıları, sosyal güvencelerine göre hasta sayıları vb. bir çok özelliklerine göre sayı, hız ve oranları hesaplamak mümkündür.

Hastaneler çok karmaşık bir yapıya sahip kurumlardır. Hastanelerde gerek idari gerek sağlık hizmeti veren pek çok birim bulunmaktadır. Sağlık kurumu yöneticisi özellikle ileriye dönük planlama yaparken, mevcut durumu değerlendirirken, önceki yıllara göre kıyaslama yaparken ve diğer sağlık kurumları ile kendi kurumunu karşılaştırırken tek bir ölçüye dayalı değil, bir çok ölçüden yararlanarak karşılaştırmaları yapmalıdır. Kendini sürekli olarak yenilemeli, sağlık yöneticiliği alanındaki gelişmeleri takip etmeli, kurumunu en üst seviyeye çıkarmaya çaba göstermelidir. Bu anılan faaliyetler için doğru, tam, güvenilir, kullanılabilir, güncel ve denetlenebilir verilere ihtiyaç vardır. Bu verilerin, enformasyona dönüştürülmesi işlemi istatistiksel teknikler olmadan asla yerine getirilemez. Yönetici kurumunu yönetirken, mevcudu değerlendiriken ve geleceği planlarken bunları asla gözardı etmemelidir.

108

Özet

Günlük hayatımızda sayıların önemli bir yeri vardır. Toplumlar sosyal, ekonomik, kültürel ve sağlık alanlarında çok dinamik bir şekilde ilerleme göstermektedirler. Bilgisayar teknolojisindeki gelişmelerin, toplumların özellikle sağlık düzeyindeki gelişmelere çok büyük katkı sağladığı aşikardır. Sağlıkla ilgili verilerin toplanması, hızlı bir şekilde işlenmesi ve enformasyona dönüştürülmesi işlemleri artık çok kolaylaşmıştır. Oldukça büyük veri setleri bile çok kısa zamanda işlenmekte ve sağlık planlayıcılarına her türlü bilgi kısa bir zamanda sunulmaktadır. Özellikle sağlık alanında kurumlar, bölgeler ve ülkeler arası karşılaştırmalar artık çok kolaylaşmıştır.

Unutulmamalıdır ki, periferde ki veriler doğru toplanarak kayıt altına alınmazsa, ülkeye ait hizmet yürütümü ve sağlık planlamasıda doğru olmayacaktır.

Bu kitapta sağlık alanında hizmet verecek personelin gerek duyabileceği, nüfus ve nüfusla ilgili hız ve oranlar, nüfusun dinamiklerini oluşturan evlenme, boşanma, doğum, ölüm ve hastalıklarla ilgili bazı hız ve oranlara değinilmiştir. Hastalıklara özel riskler ile ilgili açıklamalar yapılmış, hastane hizm etlerinin değerlendirilmesinde sıklıkla kullanılan yöntemler ünitenin kapsamına alınmış ve örnekler ile çözümler yapılmış, sonuçlar yorumlanmıştır.

109

Kendimizi Sınayalım 1. Bir olayın gerçekleşme olasılığının, olayın gerçekleşmeme olasılığına bölünmesi ile elde edilen hastalık riskine ne ad verilir?

a. Odds Oranı (Odds Ratio) b. Göreli risk oranı c. Atfedilen Risk d. insidans e. prevalans

2. Bir bölgenin nüfus artış hızının hesaplanmasında aşağıdakilerden hangisi/ hangileri kullanılır?

I. Yıl içindeki canlı doğum sayısı II. Yıl içindeki ölü doğum sayısı III. Yıl ortası nüfus

a. Sadece I b. Sadece III c. I, II, III d. I ve II e. II vr III

3. Bir hastalığın risk faktörü var iken görülme sıklığının, risk faktörü yok iken görülme sıklığına oranına ne ad verilir?

a. Göreli Risk Oranı b. İnsidans c. Prevelans d. Odds oranı e. Atfedilen risk

4. A bölgesinde bölgede 2011 yılı içerisinde pankreas kanserine yakalananların sayısı 320 ve aynı hastalıktan ölenlerin sayısı 196’dır. Bölgenin 2011 yılı Fatalite hızı kaçtır?

a. %50 b. %38,75 c. %100 d. %61,25 e. %163,26

5. Bir bölgedeki 2011 yılına ait toplam ölüm sayısı 18.922’dir. Bölgede kalp hastlıklarından ölenlerin sayısının 544 olduğu bilindiğine göre bölgenin ölüm nedenine göre orantılı ölüm hızı kaçtır?

a. 2.87 b. %2,87 c. %28,7 d. %50 e. %25

6. Geç Neonatal dönem bebek ölümleri için aşağıdakilerden hangisi doğrudur?

a. 0-6 günlük bebek ölümleri b. 365 günden daha büyük bebek ölümleri c. 0-27 günlük bebek ölümleri d. 7-27 günlük bebek ölümleri e. 60-364 günlük bebek ölümleri

7. Bir ülkenin 2011 yılında 30-34 yaş grubu kadınların yıl ortası nüfusu 974.150 ve 30-34 yaş grubundaki kadınlarınn yaşa özel doğurganlık hızı 78,45’dir. Ülkede 2011 yılı içinde kaç canlı doğum olmuştur?

a. 7.845 b. c. 764.220 d. 7.642,2 e.

8. Bir bölgede 200 yataklı bir devlet hastanesi ve 50 ve 45 yataklı iki özel hastane bulunmaktadır. 2011 yılı içerisinde bölge nüfusu 480.000 olduğuna göre bölgede onbin nüfusa düşen yatak sayısı kaçtır?

a. 4,17 b. 1,04 c. 6,15 d. 7,12 e. 61,50

9. 2009 yılı verilerine göre bir ülkede toplam 367.971 ölüm gerçekleşmiştir. Ülkenin aynı yıla ait Kaba Ölüm Hızı 5,07 olduğuna göre ülkenin yıl ortası nüfusu kaçtır?

a. 72.578.107 b. 1.865.613 c. 82.442.624 d. 36.797.100 e. 45.878.965

10. Sürmatüre (gecikmiş) doğum için aşağıdakilerden hangisi doğrudur? a. Gebelik süresi 37 haftadan az olan canlı

doğumlar b. Gebelik süresi 38 ile 42 hafta arası olan canlı

doğumlar c. Gebelik süresi 28 haftadan az olan canlı

doğumlar d. Gebelik süresi 42 haftadan fazla olan canlı

doğumlar e. Gebelik süresi 32 ile 38 hafta arası olan canlı

doğumlar

110


1. a Yanıtınız yanlış ise “Hastalık Riskleri” başlıklı konuyu yeniden gözden geçiriniz.

2. c Yanıtınız yanlış ise “Nüfusla ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz.

3. a Yanıtınız yanlış ise “Hastalık Riskleri” başlıklı konuyu yeniden gözden geçiriniz.

4. d Yanıtınız yanlış ise “Hastalıklarla ilgili istatistikler” başlıklı konuyu yeniden gözden geçiriniz.

5. b Yanıtınız yanlış ise “Ölümlerle ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz.

6. d Yanıtınız yanlış ise “Doğumlar” başlıklı konuyu yeniden gözden geçiriniz.

7. e Yanıtınız yanlış ise “Doğumlarla ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz.

8. c Yanıtınız yanlış ise “Hastanedeki sağlık hizmetlerinin değerlendirilmesi” başlıklı konuyu yeniden gözden geçiriniz.

9. a Yanıtınız yanlış ise “Ölümlerle ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz.

10. d Yanıtınız yanlış ise “Doğumlar” başlıklı konuyu yeniden gözden geçiriniz.


Sıra Sizde 1

Eldeki veriler formülde yerine konularak işlemler yapılırsa bölgenin o yıla ait yıl ortası nüfusu 413.725 olarak elde edilir.

Sıra Sizde 2

Eldeki veriler formülde yerine konularak işlemler yapılırsa bölgenin 2011 yılına ait yıl KBH ‰1,74 olarak elde edilir.

Sıra Sizde 3

Bölgenin 2011 yılı Genel Doğurganlık Hızı ‰77,16 olarak elde edilir

Sıra Sizde 4

Eldeki veriler formülde yerine konularak işlemler yapılırsa bölgeye ait 2010 yılı ölen sayısı 14.168 olarak elde edilir.

Sıra Sizde 5

BÖH değerinin 7 den küçük olması için canlı doğum sayısı olan paydanın hesaplanarak bulunan değerden daha fazla olması gerekmektedir. Bu açıklamaya göre işlemler yapılırsa;

Bölgeye ait 2010 yılı canlı doğum sayısının en az 7000 olması gereklidir.

111

Sıra Sizde 6

.

Bölgenin 2011 yılı AIDS hastalığına ilişkin fatalite hızı %47,49 olarak elde edilir.


Sağlık istatistikleri yıllığı (2010), T.C. Sağlık Bakanlığı, Bakanlık Yayın no: 832.

Yiğit V., Ağırbaş V.: Hastane işletmelerinde Kapasite kullanım oranının Maliyetlere etkisi: Sağlık Bakanlığı Tokat Doğum ve Çocuk Bakımevi Hastanesinde bir uygulama, Hacettepe Sağlık İdaresi Dergisi, Cilt 7, Sayı 2, 2004.

Sümbüloğlu, K, Sümbüloğlu, V. (2002). Sağlık İstatistiği, Somgür Yayıncılık, Ankara.

Sümbüloğlu, K, Sümbüloğlu, V. (1998). Sağlık Enfosmasyon Sistemleri, Somgür Yayıncılık, Ankara.

Özdamar, K. (2010) PASW ile Biyoistatistik, Kaan Kitabevi, Eskişehir.

Özdamar, K. (1993) Biyoistatistik ve Bilgisayar, Anadolu Üniversitesi Yayınları No:717, AÖF yayınları No:353, Eskişehir.

Seçim H., (1991), Hastane yönetim ve Organizasyonu, Küre Yayıncılık, İstanbul.

Polat, H. (1998).Sağlık Meslek Liseleri için Sağlık İstatistiği Ders Kitabı, Ankara.

Sümbüloğlu, K, (2000). Sağlık Alanına Özel İstatistiksel Yöntemler, ABC matbaacılık San. Tic. Ltd. Şti., Ankara.

Gür, E. Sağlık Ölçütleri, http://www.ctf.edu.tr/anabilimdallari/pdf/22/Saglik_Olcutleri.pdf (download: 19.12.2011)

http://www.tuik.gov.tr

http://www.tusak.saglik.gov.tr/saglik_istatistikleri_yilligi_2010.pdf



http://www.tuik.gov.tr/







112


Olasılık ile ilgili temel kavramlar açıklayabilecek,

Temel olasılık ilkelerini kullanarak örneklem uzayında tanımlanan herhangi bir olayın

gerçekleşme olasılığı hesaplayabilecek,

Olasılık dağılımlarını tesadüfi değişken tanımına göre sınıflayabilecek,

Binom, Poisson ve Normal dağılıma ilişkin olasılıkları hesaplayabilecek


Anahtar Kavramlar

Olasılık

Permütasyon

Örneklem Uzayı

Koşullu Olasılık

Venn Diyagramı

Olasılık Fonksiyonu

Olasılık Yoğunluk Fonksiyonu

Binom Dağılımı

Poisson Dağılımı

Normal Dağılım

İçindekiler

Giriş

Olasılığa Giriş

Olasılık Hesaplama

Olasılık Fonksiyonu

5

113

GİRİŞÖnceki ünitelerde istatistiğin betimleyici yönü üzerinde durulmuştu. Bundan sonraki ünitelerde ise örneklem istatistikleri yardımıyla ana kütle parametreleri hakkında tahmin yapma ve karar alma konuları aktarılacaktır. Örneklem ile ana kütle arasında bağıntı kurarak tahmin yapmak ancak olasılık kuramı yardımıyla yapılabileceğinden bu ünitede olasılık kuramı ile ilgili temel kavramlara ve uygulamalarda sıklıkla kullanılan kuramsal olasılık dağılımlarına yer verilmiştir.

OLASILIĞA GİRİŞİstatistik biliminin temelini oluşturan olasılık, belirsizlik durumunda karar almayı sağlar. Rassallığı içeren olasılık, herhangi bir olayın meydana gelme şansıyla ilgilenir. Genel olarak olasılık, meydana gelmesi arzu edilen olay sayısının, olayın nihai tüm sonuçlarının sayısına olan oranı olarak tanımlanır.Örneğin; immün yetmezlik virüsü pozitif olan bir sağlık personelinden hastaya bulaşması, acil hastaların sağlık kurumalarına nakli sırasında meydana gelebilecek bir kazadan refakatçinin etkilenmesi, atopik sağlık çalışanlarında lateks alerjisi gelişimi, ileri yaşlarda depresyonla karşılaşılmasına ilişkin tahminler yapılırken bir belirsizlik durumu söz konusudur. Bu tür belirsizlik durumlarında yoğun bir biçimde olasılık kuramından yararlanılır.

Belirsizliğin bir ölçüsü olarak tanımlanan olasılık, aslında bize tesadüfi deneyin çok defa tekrarlanması durumunda bu sonuçlarla hangi şansla karşılaşabileceğimizi tümdengelim yöntemiyle anlatır. Olasılık kavramını açıklayabilmek için üç temel kavramın tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi deney, örneklem uzayı ve olaydır.

Deney, Örneklem Uzayı ve OlayDeney, varsayımsal olarak belirli koşullar altında sonsuz defa tekrarlanabilen ve her denemede hangi sonucun gerçekleşeceği konusunda belirsizliğin bulunduğu en az iki sonuçtan oluşan bir süreçtir.Tesadüfi deneye örnek olarak, bir zarın veya bir paranın atılmasını örnek verebiliriz. Bir tesadüfi deneyin tüm olası sonuçlarını içeren kümeye örneklem uzayı denir ve S harfi ile gösterilir. Deney sonuçlarından her birine ise olay denir. Olay örneklem uzayındaki temel sonuçların bir alt kümesidir.

Bir deney aynı koşullar altında birçok defa tekrar edildiğinde, sonuçlar belli kurallara bağlı olmaksızın her seferinde değişebiliyorsa, bu deneyin belirli bir sonucuna bağımlı olarak gerçekleşen (ya da gerçekleşmeyen) bir olaya tesadüfi olay denir. Örneğin bir para atma deneyinde hilesiz bir paranın 4 defa üst üste atıldığını varsayalım, bu tesadüfi deneyde belli bir kurala bağlı olmaksızın her seferinde farklı bir sonuç elde edilecektir.

Bir deneyin tüm olası sonuçlarının oluşturduğu S kümesinin, örneklem uzayı olarak tanımlandığını belirtmiştik. S’nin her bir elemanına örnek nokta veya örnek denir. S’nin herhangi bir alt kümesine veya örnek sonuçlardan bazılarının kümesi olaydır. Olay A ile gösterilirse A S dir. olayına olanaksız olay, S olayı da kesin olay denir. Bir kesin olayın meydana gelme olasılığının sayısal değeri 1’ dir.

Olasılık Kuramı

114

Bir tesadüfi deneyin tüm olası sonuçlarını içeren kümeye örneklem uzayı denir ve S harfi ile gösterilir.

Örnek 5.1:

Hilesiz bir paranın üç defa atıldığını varsayalım örneklem uzayını belirleyerek olası tüm sonuçları yazınız.

Çözüm 5.1:

Bu deneyde sekiz farklı olası durum vardır. Bu sekiz olası durum, üçlü farklı sonuçlardan meydana gelmektedir.

, , , , , , ,S YYY YYT YTY TYY YTT TYT TTY TTT

Olay, basit ya da bileşik olabilmektedir. Bir deneyin nihai sonuçlarına basit olay denir. Bir bileşik olay ise birden çok sonuçtan oluşmaktadır. Uzman tabipler nöbet ve icapçı nöbet çizelgesi için iki uzman tabibin tesadüfi olarak seçildiği ve cinsiyetlerinin kaydedildiğini varsayalım. Örneklem uzayı;

, , ,S EE EK KE KK biçiminde olacaktır. Elde edilen dört nihai sonuç bu deneyin basit olaylarıdır,

basit bir olayın nihai sonuçları iE ile gösterilir ve sırasıyla 1 2 3 4, , ,E E E E şeklinde tanımlanır.

1 2 3 4( ), ( ), ( ), ( )E EE E EK E KE E KK

Uzman tabipler arasından seçilecek iki tabibin seçilmesi ve cinsiyetlerinin kaydedilmesinin dışında bir Aolayı en çok bir erkek uzman tabibin seçilmesi olarak tanımlansın. Bu durumda A olayı birden çok sonuçlu olacaktır. A olayı hiç erkek olmaması ya da bir erkeğin olması durumunda gerçekleyecektir ve bundan dolayı A olayı bir bileşik olaydır, , ,A EK KE KK .

Venn Diyagramı

Venn diyagramı örneklem uzayları ile yapılan işlemleri grafiksel olarak göstermek için kullanılır. Venn diyagramında kullanılan dikdörtgen, kare ya da daire gibi geometrik şekiller bir tesadüfi deneyin tüm sonuçlarını gösterir. Basit ve bileşik olaylar için verdiğimiz örnekten hareketle venn diyagramlarını oluşturursak.

Basit olay için;

S

Bileşik olay için;

S

Olasılık kavramını açıklayabilmek için üç temel kavramın tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi deney, örneklem uzayı ve olaydır.

EE○

EK○

KE○

KK○

EE○

KE○○

EK○

KK○

A

115

A. F. Yüzer, E. Şıklar, E. Ağaoğlu, H. Tatlıdil, A. Özmen, Editör: A. F. Yüzer (2011). İstatistik, Ünite 4, Eskişehir Anadolu Üniversitesi.

Permütasyon ve Kombinasyon

Tesadüfi bir deneyin sonuçlarına ilişkin olasılık hesabı yapılırken elverişli sonuçların sayısı ve olası tüm sonuçların sayısının bilinmesi için permütasyon ve kombinasyondan yararlanılır. Permütasyon n sayıda elemandan oluşan bir kümenin herhangi bir alt kümesinde yapılan farklı sıralamadır. n sayıda elemandan oluşan bir kümenin elemanlarının kendi aralarında sıralandığında elde edilecek permütasyon sayısı

!n nP n dir. n tane elemanın hepsini sıralamak yerine sadece r tanesine seçerek ve her sıralanışta her

elemanı sadece bir kez kullanmak koşuluyla farklı sıralanışlar yapılabilir. Kısaca permütasyon ile n

elemanın r li olarak koşuluylan r kaç farklı şekilde sıralanabileceği elde edilebilir ve

!

!n r

nP

n r

ile

gösterilir.

Kombinasyon ise n tane elaman arasından r tanesinin farklı şekilde seçilebileceğini vermektedir. n’ in r’

li kombinasyonu koşuluyla ; ; Cn

r

n nn r C veya

r r

şeklinde gösterilir.

!

! !

n

r n rformülü ile

hesaplanır. Örnek 5.2:

Bir ağız ve diş sağılığı merkezine tedavi için gelen 5 hastanın kuyrukta beklediğini varsayalım;

a. Bu beş hasta kaç farklı şekilde sıralanabilir?

b. Bu beş hasta içinden 2 hasta kaç değişik şekilde seçilebilir?

Çözüm 5.2:

Bu sorunun cevabı için permütasyon ve kombinasyon kullanılacaktır.

a. Beş hasta,

! 5! 5.4.3.2.1 120n nP n farklı şekilde sıralanabilir.

b. Bu beş hasta içinden olabilecek 2’ li seçim sayısı,

5! 5! 5.4.3!10

2! ! 2! 5 2 ! 2.1.3!

n nC C

r r n r

dur.

Örnek 5.3:

1,2,3,4 rakamlarından birbirinden faklı 2 basamaklı kaç sayı oluşturulabilir? Çözüm 5.3:

Bu örneği çözümü için permütasyon kullanılır.

4 2

! 4! 4.3.2.112

! 4 2 ! 2.1n r

nP P

n r

116

Bir hastanenin acil servisi için 6 sağlık personeli için nöbet çizelgesi hazırlanacaktır;

a. 6 sağlık personeli kaç farklı şekilde sıralanabilir?

b. 6 sağlık personeli arasından 3 personel kaç farklı şekilde seçilebilir?

OLASILIK HESAPLAMA

Bir olayın gerçekleşmesi için yapılan tesadüfi bir deneyde birbirinden farklı ve aynı anda olmayan N tane sonuç içinde bir olayın meydana gelme olasılığı P ile gösterilir ve bu bir olayın meydana gelme şansı olarak tanımlanır. Basit bir olayın olasılığı iP E ile A bileşik olayının olasılığı ise P A ile gösterilir.

Herhangi bir basit ya da bileşik olayın olasılığı sıfır ve bir aralığında yer alır; 0 1iP E ve

0 1P A . Olasılığı sıfır olan bir olay meydana gelmesi olanaksız olan olaydır. Daha öncede

belirtildiği gibi, bir olayın olasılığı bire eşit ise bu olaya kesin olay denir.

Tesadüfi bir deneyde, tüm basit olayların olasılıkları toplamı bire eşittir. Toplamı göstermek için

(sigma) simgesi kullanılır ve iP E biçiminde bir basit olayın nihai sonuçlarının toplamları

gösterilir. Örneğin hilesiz bir para atma deneyinde iki nihai sonuç varır, ,S Y T . Bu deneydeki 2 basit

olayın olasılıkları toplamı bire eşit olacaktır. Para atma deneyinde yazı gelme olasılığı 12 , tura gelme

olasılığı da aynı şekilde 12 ’ dir. O zaman,

1 2 1iP E P E P E dir.

Olasılıkta her zaman sadece tek bir olay ile ilgilenilmez. İki veya daha fazla olaya ilişkin olasıklıkların hesaplanması istenebilir. Bu durumda S örneklem uzayının A ve B olaylarına ilişkin olasılıklar

hesaplandığında; iki olayın birleşimi A B , iki olayın kesişimi A B , A olayının tümleyeni A biçiminde gösterilir. Örnek 5.4:

1,2,3,4,5,6,7,8 , 1,3,5,7 , 3,6,7,8 , C= 2,4,7S A B olsun. Aşağıda tanımlanan olaylara

ilişkin S örneklem uzayının alt kümelerini oluşturunuz.

a. A B b. A B c. B C d. B C e. B C A

Çözüm 5.4:

a. 1,3,5,7 3,6,7,8 3,7A B

b. 1,3,5,6 1,2,4,5 1,5A B

c. 3,6,7,8 2,4,7 2,3,4,6,7,8B C

d. 3,6,7,8 1,3,5,6,8 1,2,5,6,7,8B C

e. 3,6,7,8 1,3,5,6,8 1,3,5,7 1,2,5,6,7,8 1,3,5,7 1,5,7B C A

İki olay aynı anda meydana gelmiyorsa bu olaylara ayrık olaylar denir. Daha açık bir ifadeyle A ve B ile ifade edilen iki olayın kümelerinin ortak elemanları yoksa A ve B olayları ayrık olaylardır ve bu kümelerin kesişimleri boş kümedir A B . Örneğin; hilesiz bir zar atma deneyinde A olayı zarın üst

117

yüzüne 1, 4 veya 6 gelmesi, B olayı ise zarın üst yüzüne 2,3 veya 5 gelmesi olarak tanımlansın. Bu örnekte A ve B olayları ayrık olaylardır. Çünkü bu iki olayın kümelerinin ortak elemanı yoktur ve kesişimleri boş kümedir.

İki olay aynı anda meydana gelmiyorsa bu olaylara ayrık olaylar denir. iki olayın kümelerinin ortak elemanı yoktur ve kesişimleri boş kümedir.

Olasılığın Tanımı

Bir olayın ortaya çıkma olasılığına ilişkin değişik tanımlar zaman içindeki gelişim sırasına göre ele alınmaktadır. Olasılığın üç farklı tanımı bulunmaktadır: klasik olasılık, oransal frekans yaklaşımı ve çağdaş olasılık.

Klasik Olasılık Bir tesadüfi deneyde birbirinden ayrık ve ortaya çıkma bakımından hepsi eşit şansa sahip bütün olası sonuçların sayısı N olsun. Eğer A olarak tanımlanan bir olay toplam N eşit olasılıklı durumdan M tanesinde gerçekleşiyorsa, o zaman A olayının olasılığı P(A)=M/N olarak ifade edilir.

Örnek 5.5:

Hilesiz bir zar atma deneyinde tek sayı elde edilmesi olasılığını bulunuz. Çözüm 5.5:

Hilesiz bir zar atma deneyinde 1,2,3,4,5 ve 6 olmak üzere altı sonuç bulunmaktadır. Tüm sonuçlar eşit olasılıklı sonuçlardır. A olayı 1,3 ve 5 gelmesi olarak tanımlanır, 1,3,5A . Bu durumda tek sayı gelme

olasılığı,

3( ) 0,5

6P A

olarak bulunur. Örnek 5.6:

Bir sağlık kurumunda istihdam edilen sağlık 100 sağlık çalışanının 30’u 657/4B, 30’ u sözleşmeli 4924, 20’ sinin döner sermaye ve diğer 20’ sininde 657’ ye göre istihdam edildiği bilinmektedir. Bu personel arasından tesadüfi olarak biri seçildiğinde, bu kişinin;

a. Sözleşmeli 4924 personel olması olasılığını bulunuz.

b. 657’ ye tabii personel olması olasılığını bulunuz.

c. Döner sermaye personeli olması olasılığını bulunuz.

Çözüm 5.6:

Bu örnekte A, B, C ve D olmak üzere 4 olay tanımlanır.

A olayı: seçilen bir kişinin 657/4B’ ye göre istihdam edilmiş olması,

B olayı: seçilen bir kişinin sözleşmeli 4924’ e göre istihdam edilmiş olması,

C olayı: seçilen bir kişinin sözleşmeli döner sermayeye göre istihdam edilmiş olması,

D olayı: seçilen bir kişinin 657’ ye göre istihdam edilmiş olmasıdır. O halde;

118

a. 30

0,30100

P B

b. 20

0,20100

P D

c. 20

0,20100

P C

Klasik olasılık tanımı eşit olasılıklı olaylarda uygulanabilmektedir. Ancak çoğu problemde eşit şansa sahip olaylara ender rastlanır. Ayrıca M/N oranı matematiksel işlemlere de yeterince uygun değildir. Oransal Frekans Yaklaşımı Bu yaklaşımda tesadüfi deneyin aynı koşullar altında defalarca tekrarlandığı varsayılır. Aynı koşullar altında tesadüfi bir deney çok defa tekrarlandığında elde edilen sonuçlardan ilgilenilen türden olanların sayısının (f), deney sayısına (n) oranı deney sayısı sonsuza büyütüldüğünde f/n değerine yaklaşır. f/n oranının yaklaştığı bu değer ilgilenilen A olayının ortaya çıkma olasılığı olarak tanımlanır ve

( ) limN

fP A

n olarak gösterilir. Bu gösterimdeki limit matematiksel anlamda olmayıp, deneyin

olabildiğince çok tekrarlanması anlamındadır. Örneğin bir hastanede A, B, C, D poliklinikleri olsun. Bu polikliniklerden birisi için randevu alan bir hastanın A polikliniğinden randevu istemesi olasılığını hesaplayalım. Bu olasılığı hesaplamak için bir haftalık randevu siteminin örneklem olarak ele alınarak incelendiğini ve A polikliniği için 50, B için 60, C için 90 ve D için 100 hastanın randevu aldığını varsayalım. Belirlenen bu sayılar frekans olarak değerlendirilir ve P(A)= 50/200=0,25 hesaplanır. Ancak örneklem olarak bir hafta değil de bir aylık gözlenen randevular alınsaydı frekanslar değişeceğinden olasılıklarda değişecekti. Bu olasılıklardaki değişmenin azaltılması ancak örneklem hacminin arttırılması yoluyla sağlanır. Bu örnekte bir hafta ve bir ay yerine bir yıllık gözlem yapıldığında bu olasılıkların belirli sayılarda durağanlaştığı görülecektir. Kısaca doğru sonuçlara ulaşabilmemiz için çok sayıda gözlem yapmamız gerekir. Oransal frekans yaklaşımında, n sayıda deneyin aynı koşullar altında yapılmasının zorluğu ve deney sayısının kaçta sonlandırılacağının bilinememesi gibi yetersizlikler vardır. Çağdaş Olasılık Bundan önceki iki tanımın yetersizliklerini gidermek için 1933 yılında Kolmogorov bazı temel özellikler yardımıyla olasılığı matematiksel bir tabana oturtmuş ve günümüzdeki çağdaş olasılık kuramı oluşmuştur. Bu temel özellikler aşağıda verilmiştir.

Özellik 1: A, S örneklem uzayında tanımlanmış herhangi bir olay olsun. 0 1P A

Özellik 2: 1P S

Özellik 3: A ve B, S örneklem uzayında tanımlanmış iki ayrık olay olsun. Bu durumda,

P A B P A P B

Özellik 4: A, S örneklem uzayında herhangi bir olay ve A bu olayın tümleyeni ise, A olayının

gerçekleşme olasılığı 1P A P A dır.

Özellik 5: 0P

Özellik 6: A ve B, S örneklem uzayında tanımlanmış ayrık olmayan herhangi iki olay olsun. Bu durumda

P A B P A P B P A B

Özellik 7: A, B ve C olayları S örneklem uzayında tanımlanmış ayrık olmayan üç olay olsun. Bu durumda,

P A B C P A P B P C P A B P A C P B C P A B C

119

Örnek 5.7:

İki tavla zarının birlikte atıldığını varsayalım. A olayı üst yüze gelen sayıların toplamının 8 olması ve B olayı üst yüze gelen sayıların aynı olması olayları olarak tanımlansın. Bu iki olayın birleşiminin olasılığını bulunuz. Çözüm 5.7:

S örneklem uzayı 36 nihai sonuçtan meydana gelmektedir. A olayın gerçekleşme durumu,

2,6 , 3,5 , 4,4 , 5,3 , 6,2A ,

B olayının gerçekleşme durumu ise

1,1 , 2,2 , 3,3 , 4,4 , 5,5 , 6,6B olur.

Bu durumda A ve B olaylarının birleşiminin olasılığı

P A B P A P B P A B eşitliğiyle elde edilir.

5 6 1

, , 36 36 36

P A P B P A B dır.

5 6 1 10

0,2836 36 36 36

P A B bulunur.

1. Bir hastanede 30’u erkek ve 15’i kadın olmak üzere 45 sağlık personeli bulunmaktadır. Bu 45 sağlık personeli içinden tesadüfi olarak seçilen bir çalışanın erkek olma olasılığı nedir?

2. A ve B olayları için olasılıklar 2

5P A ,

2

3P B ve

1

3P A B olarak

veriliyor. P A B olasılığını bulunuz.

Koşullu Olasılık

İki bağımlı olaydan birincisinin gerçekleştiği bilindiğinde ikincisinin ona bağlı olarak gerçekleşme olasılığına koşullu olasılık denir. Bir olayın gerçekleşme şansı başka bir olayın gerçekleşmesine bağlı olduğunda koşullu olasılık kullanılmaktadır. A ve B olayları herhangi iki olay olsun. A olayının gerçekleştiği bilindiğinde, B olayının ortaya çıkma olasılığı koşullu olasılık olarak tanımlanır ve

P B A ile gösterilir. Koşullu olasılık A ve B olayları için aşağıdaki gibidir.

:P A B B olayı biliniyorken A olayının ortaya çıkma olasılığı,

:P B A A olayı biliniyorken B olayının ortaya çıkma olasılığı,

ve bu iki olasılık, , PP A B ve P A B olasılıklarına bağlı olarak,

, ( ) 0

P A BP A B P B

P B

120

, ( ) 0

P A BP B A P A

P A

şeklinde tanımlanır. Aynı zamanda bu tanımlamadan hareketle,

P A B P A B P B

ve

P A B P B A P A olur.

Örnek 5.8:

Hilesiz bir zar atıldığında zarın üst yüzüne tek sayı gelmiş ise bu sayının 3 olma olasılığı nedir? Çözüm 5.8:

S örneklem uzayı 6 nihai sonuçtan meydana gelmektedir, 1,2,3,4,5,6S . Burada A ve B olaylarının

tanımlanması gerekir. A olayı atılan zarın 3 gelmesi ve B olayı ise zarın tek sayı olmasıdır.

Zarın 3 gelmesi olasılığı 3A , 1

6P A ,

Zarın tek sayı gelmesi olasılığı 1,3,5B , 3

6P B dır.

A ve B olaylarının kesişimi ise,

1

6P A B olur.

Bu durumda atılan zar tek gelmiş ise bunun 3 olma olasılığı;

, ( ) 0

P A BP A B P B

P B

( B olayı bilindiğinde A olayının ortaya çıkma olasılığı)

1 6 1

3 6 3P A B

olarak elde edilir. Örnek 5.9:

Bir hastanedeki hastaların % 40’ ı sindirim sistemi, % 30’ u diyabet ve % 30’u kalp damar rahatsızlıkları nedeniyle tedavi edilmektedir. Ayrıca hastaların % 10’ u hem sindirim sistemi hem de kalp damar rahatsızlığı, % 20’ sinde hem diyabet hem de kalp damar rahatsızlığı vardır.

a. Tesadüfi olarak seçilen bir hasta diyabetliyse bu hastanın aynı zamanda kalp damar rahatsızlığına sahip olma olasılığı nedir?

b. Tesadüfi olarak seçilen bir hasta kalp damar rahatsızlığına sahip ise, bu hastanın sindirim sistemi rahatsızlığına sahip olma olasılığı nedir?

Çözüm 5.9:

S örneklem uzayında A, B ve C olayları öncelikle tanımlanmalıdır.

A olayı: Sindirim sistemi rahatsızlığının olması,

B olayı: Diyabetli olması,

121

C olayı: Kalp damar rahatsızlığının olması.

( ) 0,40, ( ) 0,30, ( ) 0,30P A P B P C ve bu olayların ilgili kesişimleri,

0,10P A B ve 0,20P B C tir.

Bu durumda seçilen hasta diyabetli ise aynı bunun kalp damar rahatsızlığına da sahip olma olasılığı;

0,200,67

0,30

P B CP C B

P B

dir.

Bu durumda seçilen hasta diyabetli ise aynı bunun kalp damar rahatsızlığına da sahip olma olasılığı;

0,100,33

0,30

P A CP A C

P C

tur.

Ayrık ve Bağımsız Olaylar

İki ya da daha fazla olay bir arada meydana gelemiyorsa bu olaylara ayrık olaylar denir. Bu bir olayın otomatik olarak diğer olayın meydana gelmesini engellemek anlamına gelir. Bir araştırmacı A polikliniğine gelen hastaları cinsiyetlerine (kadın, erkek) ve yaşlarına (40’ın altında, 40 ve daha üstü) sınıflandırıyor. Polikliniğe gelen hastalar arasından tesadüfi olarak seçilen bir hasta her iki özelliğe de sahip olabileceğinden bu iki olay ayrık değildir. Ayrık olaylar için A veya B’nin olasılığı

( ) ( ) ( )P A B P A P B

, ayrık olmayan olaylar için ise A veya B’nin olasılığı

( ) ( ) ( ) ( )P A B P A P B P A B şeklinde hesaplanır.

A polikliniğine gelen 100 hastanın yaş ve cinsiyetleri aşağıdaki iki yönlü tablodaki gibi verilmiş olsun. Polikliniğe gelen hastalardan birisi tesadüfi olarak seçilse, bu hastanın;

Erkek ve 40 yaş altında olma olasılığını,

Erkek veya 40 yaş altında olma olasılığını

bulalım;

Cinsiyet / Yaş Grubu 40 yaş altı 40 yaş ve üstü Toplam

Erkek 20 10 30

Kadın 40 30 70

Toplam 60 40 100

A ; Hastanın erkek olması olayı,

B ; Hastanın 40 yaş altında olması olayı

olarak tanımlansın.

Erkek ve 40 yaş altında olma olasılığı 20

( )100

P A B

Erkek veya 40 yaş altında olma olasılığı

30 60 20 70( ) ( ) ( ) ( )

100 100 100 100P A B P A P B P A B

Şeklinde hesaplanır.

A ve B gibi herhangi iki olaydan birinin gerçekleşmesi diğer olayın ortaya çıkma olasılığını etkilemiyorsa bu iki olaya bağımsız olaylar denir. Bağımsız olaylar için A olayı bir hilesiz zarın üst yüzüne gelen sayının 3 olması, B olayı ise bir madeni paranın tura gelmesi olsun. A olayının olması B

122

olayının ortaya çıkıp çıkmamasını etkilemez. Tam tersi B olayı da A olayının ortaya çıkıp çıkmamasını

etkilememektedir. Bundan dolayı A ve B olayları bağımsız olaylardır. Bu durumda P A B P A ve

P B A P B ise A ve B olayları bağımsız olaylardır. Daha önce tanımlamış olduğumuz

P A B P A B P B eşitliğinde bağımsız olaylar söz konusu olduğunda P A B P A

olduğundan eşitlik ( )P A B P A P B şeklinde olacaktır.

( ) ( ) ( )P A B P A B P B P A P B

Bu eşitlik iki olayın bağımsızlığı için gerek ve yeter koşuldur. Örnek 5.10: Bir sağlık kuruluşunda A çalışanın 30 gün içinde 4’ ten fazla nöbet tutma olasılığı % 60, B çalışanının ise 30 gün içinde 4’ ten fazla nöbet tutma olasılığı % 70’ tir. Her iki çalışanında 30 gün içinde 4’ ten fazla nöbet tutma olasılığı nedir? Çözüm 5.10: A ve B olayları öncelikle tanımlanmalıdır.

A olayı: A çalışanının 30 gün içinde 4’ ten fazla nöbet tutması, ( ) 0,60P A

B olayı: B çalışanının 30 gün içinde 4’ ten fazla nöbet tutması, ( ) 0,70P B

A ve B olayları bağımsız olaylarıdır. Bu durumda olasılık,

( ) ( ) 0,60 0,70 0,42P A B P A P B dir.

Eğer bir olayın ortaya çıkması öteki olayın ortaya çıkma olasılığını etkilemiyorsa, bu iki olaya bağımsız olaylar denir. A ve B olaylarının bağımsız

olabilmeleri için durumda P A B P A veya P B A P B koşulu sağlanmalıdır.

Bir sözleşmeli personelin daimi kadroya 2 yıl içinde geçme olasılığı 0,80 ve başka bir sözleşmeli personelin ise daimi kadroya 2 yıl içinde geçme olasılığı 0,60’ tır. Her iki sözleşmeli personelinde 2 yıl içinde daimi kadroya geçme olasılıkları nedir?

OLASILIK FONKSİYONU Olasılığa giriş ve olasılık hesaplama konularından sonra, tesadüfi değişken, olasılık fonksiyonları, birikimli olasılık fonksiyonu ve ortak olasılık fonksiyonu kavramı olasılık ile ilgili diğer önemli konulardır.

Tesadüfi Değişkenler Tesadüfi değişken, S örnek uzayındaki her bir tesadüfi olaya sayısal değerler atayan bir fonksiyondur. Bu fonksiyon aracılığıyla örnek uzayındaki her bir sonuç reel eksende bir değere taşınır. Kısaca tesadüfi değişken, S örneklem uzayının her bir olayını yalnız bir gerçek değere dönüştürür. Tesadüfi bir denemenin yapılarak olası sonuçlara sayısal değerler verileceğini düşünelim. Bir zar atma ya da bir ailenin gelirini ölçme gibi denemelerde sonuçlar doğal olarak sayısal biçimdedir. Böyle olmadığı durumlarda bile sonuçlara sayılar vermek, özellikle yalnızca iki sonuçlu denemelerde, anlamlı ve yararlı olabilir. Sözgelimi, bir işletmede üretilen bir parça “kusurlu” ya da “kusursuz” diye sınıflandırılabilir. Bu olanaklardan ilkine 1, ikincisine 0 değerini verebiliriz. O zaman tesadüfi değişken: tesadüfi bir denemenin sonuçlarına göre belirlenen sayısal değerleri alan bir değişkendir. Tesadüfi bir değişken ile onun alabileceği değerleri birbirinden ayırmak önemlidir. Simgesel olarak bunu X gibi büyük harflerle,

123

onun alabileceği değerleri ise x gibi küçük harflerle göstererek yapabiliriz. Tesadüfi değişkenin aldığı tüm değerler X’ in değer kümesini oluşturur ve X tesadüfi değişkeninin değer kümesi bir olasılık uzayıdır.

Bir X değişkeni, alabileceği her bir değeri belli bir olasılıkla alıyorsa bu değişkene tesadüfi değişken adı verilir.

Bir tesadüfi değişken yalnızca sayılabilir sayıda değerler alabiliyorsa kesiklidir. Kesikli tesadüfi değişkenlere örnekler, büyük bir parti mal içinden alınan yirmilik bir örneklemdeki kusurlu parça sayısı, bir polikliniğe bir saat içinde gelen hasta sayısı vb.

Bunların tersine, günlük hava sıcaklığıyla ilgilendiğimizi düşünelim. Sıcaklık, sürekli bir ölçekle ölçülür ve sürekli bir tesadüfi değişkendir. Bir tesadüfi değişken tanımlı bir aralıktaki tüm değerleri alabiliyorsa süreklidir. Bir ailenin yıllık geliri, ithal edilen ilaç hammadde miktarı, bir hisse senedi fiyatının aylık değişimi, bir hastaya konulan tanı ile iyileşmesi arasında geçen süre, bir kimyasal maddenin kirlilik oranı sürekli tesadüfi değişkenlere verilebilecek örneklerdir.

Olasılık Fonksiyonu Tanımları Olasılık fonksiyonu, bir değişkenin alabileceği değerler ile bu değerleri alabilmesi olasılıkları arasındaki ilişkiyi gösteren bir fonksiyondur. Bu fonksiyon bir tesadüfi değişkenin alabileceği tüm değerlere ilişkin olasılıkların tek tek gösterilmesi yerine, olasılıkların hesaplanmasında kullanılacak bir eşitliktir. Olasılık fonksiyonları tesadüfi değişken tanımına göre; kesikli olasılık fonksiyonu (olasılık fonksiyonu) ve sürekli olasılık fonksiyonu (olasılık yoğunluk fonksiyonu) olarak iki şekilde tanımlanır.

Kesikli Olasılık Fonksiyonu X , kesikli bir tesadüfi değişken bunun alabileceği değerlerden biride x olsun. X tesadüfi değişkeninin belli bir x değerini alma olasılığı P (X = x) ile gösterilir. Tesadüfi bir değişkenin, olanak içindeki bütün sonuçları olasılık fonksiyonları kullanılarak gösterilir. Bu gösterim cebirsel, çizimsel yada çizelge biçiminde olabilir. Kesikli tesadüfi değişkenler için uygun bir gösterim, olanak içindeki bütün sonuçların olasılıklarının x’in değerlerine göre dizmektir. X’ in tüm olası x değerleri için tanımlanan

( ) ( )P x P X x fonksiyonu, X değişkeninin olasılık fonksiyonu olarak tanımlanır.

X, olasılık fonksiyonu P(x) olan kesikli bir tesadüfi değişken olsun. Bu durumda,

1. Her x değeri için ( ) 0P x

2. Tekil olasılıkların toplamı 1’dir; yani ( ) 1x

P x

Buradaki gösterim x’in bütün değerleri için toplama yapıldığı anlamına gelir.

Özellik (1), yalnızca, olasılıkların negatif olamayacağını gösterir. Özellik (2), x’in bütün olanaklı değerleri için “X=x” olaylarının bağdaşmaz ve bütünü kapsayıcı olduğu olgusundan türemiştir. Dolayısıyla bu olayların olasılıkları toplamı 1 eder.

Örnek 5.11:

Bir hilesiz zar atıldığında tek sayı gelme olasılığı bulunuz. Çözüm 5.11:

Hilesiz bir zar atma deneyinde S örneklem uzayı, 1,2,3,4,5,6S dır.

A olayı zarın tek gelmesi ise, 1,3,5A dir.

1 1 1 3( ) ( ) 0,5

6 6 6 6x A

P A P x

bulunur

124

Örnek 5.11:

Bir çift hilesiz zar deneyinde, zarların yüzeyindeki sayıların toplamının 8 olması olasılığını bulunuz. Çözüm 5.11:

İki zar atıldığında 36 nihai sonuçtan oluşan bir örneklem uzayı elde edilir. Bu örneklem uzayında A olayı ise zarların üst yüzeyindeki sayıların toplamının 8 olasıdır.

2,6 , 3,5 , 4,4 , 5,3 , 6,2A

O zaman,

1 1 1 1 1 5( ) ( ) 0,14

36 36 36 36 36 36x A

P A P x

olur.

Örnek 5.12:

Bir hastanede çalışan 100 sağlık personelinin, 30’ u sağlık meslek lisesi acil tıp mezunu, 50’ si sağlık meslek lisesi hemşirelik mezunu ve 20’ si de sağlık meslek lisesi laboratuar mezunudur. Ayrıca çalışanların 60’ ı kadındır. Bu hastaneden tesadüfi olarak seçilen bir personelin;

a. Sağlık meslek lisesi acil tıp mezunu olma olasılığını,

b. Erkek çalışan olma olasılığını,

c. Sağlık meslek lisesi laboratuar mezunu olmama olasılığını bulunuz.

Çözüm 5.12:

a. 30

: Acil Tıp Mezunu 0,30100

P x

b. 40

: Erkek Çalışan 0,40100

P x

c. 80

: Laboratuar Mezunu Olmama 0,80100

P x

Sürekli Olasılık Fonksiyonu - Olasılık Yoğunluk Fonksiyonu X, sürekli bir tesadüfi değişken ve x te bu tesadüfi değişkenin alabileceği değerler aralığındaki herhangi bir sayı olsun. Bu tesadüfi değişkenin olasılık yoğunluk fonksiyonu, ( )f x , aşağıdaki özellikleri taşıyan

bir fonksiyondur:

i. x’in bütün değerleri için ( ) 0f x

ii. ( ) 1x

f x dx dir.

Sürekli bir tesadüfi değişkenin olasılık yoğunluk fonksiyonu, ( )f x dx

şeklinde ifade edilir. Bu

fonksiyon aracılığıyla X değişkeninin a ile b arasında bir değeri alma olasılığı ise,

P{ }= ile bulunur. f(x)’in sürekli olasılık fonksiyonu olabilmesi için aşağıdaki

şartları sağlaması gerekir:

bXa b

a

dxxf )(

125

I. f(x)’in integrali alınabilir ve f(x)=0 her x R için,

II. f(x) 0 her x R için ya da için,

III. ( ) 1R

f x dx

Birikimli Olasılık Fonksiyonu Bir değişkenin X gibi bir değere eşit ya da daha küçük bir değeri alabilmesi olasılığını gösteren fonksiyon birikimli dağılım fonksiyonudur. X’ in birikimli olasılık fonksiyonu gerçel sayılar kümesinde x’e eşit veya ondan küçük değerleri alan ve S örneklem uzayında X tesadüfi değişkeni ile ilişkili olan olasılıktır. Birikimli olasılık fonksiyonu F(x) ile gösterilir.

( )F x P X x

Kesikli ve sürekli tesadüfi değişkenler için birikimli olasılık fonksiyonu aşağıdaki gibidir;

Kesikli birikimli olasılık fonksiyonu: ( ) ( )F x P x

Sürekli birikimli olasılık fonksiyonu: ( ) ( )x

F x f t dt

.

Bir değişkenin a…b aralığında bir değer alabilmesi olasılığı, birikimli olasılık fonksiyonu ile aşağıdaki gibi gösterilir;

P a x b F b F a

Olasılık Dağılımları Yapılan her tesadüfi deneyde ortaya çıkan sonuçlar için yeni bir fonksiyon aramak hem emek hem de zaman kaybına yol açacağından çeşitli tesadüfi deneylerin aynı koşullar altında aynı özellikler göstermelerinden yararlanılarak kuramsal olasılık dağılımları geliştirilmiştir. Bu kuramsal olasılık dağılımları benzer özellikteki diğer deneylerde de kullanmak amacıyla genelleştirilmiştir. Çok sayıda kuramsal olasılık dağılımdan söz etmek olanaklı ise de bu ünitede kesikli olasılık dağılımlarından Binom dağılımı ve Poisson dağılımı, sürekli olasılık dağılımlarından ise Normal dağılım ele alınacaktır.

Binom Dağılımı Yapılan deneylerin sonuçları, olumlu-olumsuz, başarılı-başarısız, iyi-kötü, ölü-sağ, pozitif-negatif gibi ortaya çıkıyorsa, bu tür deneyler sonucunda elde edilen dağılımlar Binom dağılımıdır. Tesadüfi bir deneyin başarılı ve başarısız olarak iki ayrık ve bütüne tamamlayıcı bir şekilde sonuçlanabileceği ve tek bir deneydeki başarı olasılığının p olduğunu düşünelim. Eğer birbirinden bağımsız n tane deney yapılırsa, ortaya çıkan başarı sayısı X’ in dağılımına Binom dağılımı denir. Binom dağılımı kesikli olasılık dağılımıdır. Binom dağılımı, tüm denemelerin aynı koşullarda tekrarlandığı ve her tekrarda birbirinden bağımsız iki olaydan birinin meydana geldiği deneylerde ortaya çıkmaktadır. Örneğin Binom deneyine, bir kadının klasik tüp bebek işlemi sonrasında gebe kalması (başarı) veya kalmaması (başarısılık) örnek olarak verilebilir. 20 adet gebe kalma olasılığı aynı olan kadına klasik tüp bebek işlemi yapıldığını varsayalım burada tesadüfi değişkenimiz başarılı gebeliklerin sayısıdır ve Binom dağılımına sahiptir.

Bir deneyin olumlu sonuçlanma olasılığı p, olumsuz sonuçlanma olasılığı da q (1-p) ile gösterilir. Örneğin hilesiz bir para atma deneyinde ilgilenilen olay paranın tura gelmesi olsun. Bu durumda p = 0,5, q = 1-p = 0,5 ve p+q =1 olacaktır.

Binom dağılımı aşağıdaki özelliklere sahiptir:

1. Her bir deneme için yalnız iki sonuç vardır. Başarı (p) , Başarısızlık (q)

2. Başarma olasılığı p her bir deneme için aynıdır. Başarısızlık olasılığı q=1-p dir.

x

126

3. Denemeler birbirinden bağımsızdır.

4. Denemelerin sayısı n sabittir.

Aşağıdaki deneyler Binom tesadüfi değişkenleriyle ilgilidir.

1. Bir para 10 kez atılsın. X tesadüfi değişkeni gözlenen turaların sayısıdır,

2. İçinde 4 kusurlu ve 8 kusursuz parça bulunan bir kutudan iadeli 5 parça seçelim. X tesadüfi değişkeni seçilen kusurlu parçaların sayısıdır,

3. İçinde 7 kırmızı ve 5 sarı top bulunan bir kavanozdan iadeli 4 top çekilsin. X tesadüfi değişkeni çekilen kırmızı topların sayısıdır.

4. Bir aşını yan tesir gösterme olasılığı 0,10 dur. 20 kişiye bu aşının denendiği varsayılsın. X tesadüfi değişkeni yan tesir gösteren hasta sayısı olarak tanımlansın. Bu tanıma göre X Binom dağılır.

X, bir tek denemede başarma olasılığı p, başaramamanın olasılığı q olan n bağımsız deneme için Binom tesadüfi değişkeni ise,

X’in olasılık fonksiyonu;

,x 0,1,2,...,n

0 ,diğer durumlarda

x n xnp q

p x x

dir.

X kesikli tesadüfi değişkeni Binom dağılımına sahip ise ortalaması, np , varyansı 2 npq ,

standart sapması npq ve değişim katsayısı 1 p

np

dir.

Örnek 5.13:

Bir sigortacı hayat poliçesi satmak için 5 görüşme yapmaktadır. Bunların her biri için satış yapma olasılığı 0,4 olduğunu düşünelim. O zaman satış sayısı X, n=5, p=0,4 olan bir Binom dağılımına uyar.

55!( ) 0,4 (0,6)

!( )!x xP x

x n x

x=0,1,2,3,4,5 için başarı (yapılan satış) sayılarının olasılıkları

aşağıdaki gibi hesaplanır:

0 55!(0) 0,4 (0,6) 0,078

0!5!P 1 45!

(1) 0,4 (0,6) 0,2591!4!

P

(2) 0,346P (3) 0,230P (4) 0,077P (5) 0,010P

Bir sigortacının 2 ile 4 arasında satış yapma olasılığı,

(2 4) ( 2) ( 3) ( 4)

(2 4) 0,346 0,230 0,077 0,653

P X P X P X P X

P X

Sigortacının en az bir satış yapması olasılığı ise,

( 1) 1 ( 0) 1 0,078 0,922P X P X şeklinde hesaplanır.

127

Örnek 5.13 deki verilen problemin excel programında çözümü için önce fonksiyon ekle (fx) tuşuna basılarak buradan istatistiksel fonksiyonlar seçilir. Daha sonra istatistiksel fonksiyonlar arasından Binom dağılımı seçilerek aşağıda verilmiş olan resimdeki gibi ilgili alanlar belirlenerek olasılıklar hesaplanır.

Örnek 5,13 de verilen problemin Binom dağılımı yardımıyla excel çözümü yapılarak kümülatif başlığı altında olasılıklar hesaplanır. Bu hesaplanan olasılıkların daha görsel sunumu ve yorumlanması için grafik çizilmek istendiğinde ise başarı sütünü ile kümülatif sütünü seçilerek ekle grafik menüsüne basılır ve istenilen grafik türü belirlenir. Böylece hesaplanan olasılıklar ve başarıya (yapılan satışlar) ilişkin grafik aşağıda ki resimde verildiği gibi elde edilir.

128

Örnek 5.14:

Fizyoterapist eşliğindeki Plates gruplarına katılan kadınların % 40’ ı zayıflama programını tamamlayabilmektedir. Tesadüfi olarak 6 kadın seçildiğinde, bunların yarısından fazlasının zayıflama programını tamamlaması olasılığı nedir? Çözüm 5.14:

Bu olayda tamamlama ve tamamlamama olmak üzere iki sonuç vardır. X, zayıflama programını tamamlayan kadınların sayısını göstersin, 1 0,40 0,60p ’ tır. 6 kadının yarsından fazlasının

tamamlamasının olasılığı 3P X tür. O halde;

129

3 4 4 5 6P X P X P X P X P X

4 2 5 1 6 06 6 60,6 0,4 0,6 0,4 0,6 0,4

4 5 6

0,311 0,187 0,047 0,545

Binom dağılımı, tüm denemelerin aynı koşullarda tekrarlandığı ve her tekrarda birbirinden bağımsız iki olaydan birinin meydana geldiği deneylerde karşımıza çıkar.

F. Er, K.Ö, Peker, Editör: H. Sönmez (2009). Biyoistatistik, Ünite 4, Eskişehir Anadolu Üniversitesi.

Bir hastanede çalışanların % 25’ i hizmet içi eğitime katılmıştır. Tesadüfi olarak seçilen 5 kişiden 1 tanesinin hizmet içi eğitime katılmış olma olasılığını bulunuz.

Poisson Dağılımı Binom dağılımında p olasılığının oldukça küçük olması (genellikle p<0,05) durumunda Binom dağılımı uygun bir kuramsal olasılık modeli olmamaktadır. Tesadüfi değişken belli bir zaman aralığında veya belli bir mekânda çok az yinelenen olayları göstermesi durumunda ortaya çıkan olasılık dağılımı Poisson dağılımı olarak adlandırılır. Pek çok deney uzayın sürekli bir bölgesinde ya da sürekli bir zaman aralığında sonsuz sayıdaki olanaklı 0,1,2,3,... değerlerinin verilmesiyle oluşur. Birim zaman, dakika, saat, gün, hafta; birim uzay, uzunluk, alan, hacim olabilir. Poisson dağılımı sürekli uzayda kesikli veriler veren deneylere uygulanır.

Verilmiş bir zaman aralığında ya da uzayın verilmiş bir bölgesinde başarıların sayısı, X rassal değişkeni olsun. Aşağıdaki koşulları sağlayan X’e Poisson dağılmış tesadüfi değişkeni denir.

1. Farklı bir zaman veya mekân diliminde ilgilenilen türden sonuçların gerçekleşmesi birbirinden bağımsızdır.

2. Küçük bir zaman aralığı veya uzayın küçük bir bölgesi için başarı olasılığı, uzaydaki bölge ya da zaman aralığının uzunluğu ile orantılıdır.

3. Küçük bir zaman aralığı veya uzayın küçük bir bölgesinde iki ya da daha çok başarının olasılığı önemsizdir.

4. Küçük bir zaman ya da mekan diliminde ilgilenilen türde sonuçların bir defa gerçekleşme olasılığı olan p sabittir ve yaklaşık olarak p<0,05 eşitsizliğine uymaktadır.

Aşağıdaki örnekler Poisson tesadüfi değişkenleriyle ilgilidir;

1. Büyük bir şehirde ender rastlanan bir hastalıktan her yıl meydana gelen ölümlerin sayısı,

2. Bir üretimdeki kusurlu ürün sayısı,

3. Bir kitabın her bir sayfasındaki eksik basımların (yanlış basımların) sayısı.

4. Bir kentte bir hatta meydana gelen ölümcül kazaların sayısı.

5. Dahiliye polikliniğine gelen hastalarda aylık göğüs kanseri görülme sayısı.

130

X, 0,1,2,... olanaklı değerleri alabilen Poisson teadüfi değişkeni olsun, X’ in olasılık fonksiyonu,

,x 0,1,2,...; 0( ) !


xeP x x

, Poisson dağılımının tek parametresidir ve Poisson dağılımına sahip X değişkeninin ortalamasıdır. X kesikli tesadüfi değişkeni Poisson dağılımına sahip ise ortalaması , varyansı ve değişim katsayısı

1

dır.

Toplumda az sayıda ya da seyrek olarak gözlenen olayların belli bir zaman aralığındaki gözlenme sayılarının uyduğu kuramsal dağılıma Poisson dağılımı denir.

Örnek 5.15:

Bir hastanede yeni doğan servisinde akciğer enfeksiyonundan bir hafta içinde ölenlerin sayısı 4 olan Poisson dağılımına uymaktadır. Belli bir hafta içinde akciğer enfeksiyonundan hiçbir yeni doğanın ölmemiş olma olasılığı nedir? Çözüm 5.15:

X: Bir haftada akciğer enfeksiyonundan ölenlerin sayısı

( ) , x 0,1,2,...!

xeP x

x

4 ve 0X olasılık fonksiyonunda yerine konursa;

4 04( 0) 0,0183

0!

eP X

olasılığını elde ederiz. Burada e sabit bir sayı olup değeri 2,71828’ dir.

Örnek 5.16:

Bir hastanenin acil servisine Pazar günleri saat: 16.00 - 17.00 arasında 20 dakikada bir ortalama 3 acil vaka gelmektedir. Saat 16.00-17.00 arasında herhangi bir 20 dakika içinde acil servise 0,1,2,3,4 ve 5 vakanın gelmesi olasılıklarını hesaplayınız. Çözüm 5.16:

X: Acil servise Pazar günleri saat: 16.00 - 17.00 arasında 20 dakikada bir gelen hasta sayısı

( ) , x 0,1,2,...!

xeP x

x

3 ve 0,1,2,3,4,5X olasılık fonksiyonunda yerine konursa;

3 03( 0) 0,0498

0!

eP X

3 13

( 1) 0,14941!

eP X

3 23( 2) 0,2241

2!

eP X

3 33

( 3) 0,22413!

eP X

3 43( 4) 0,1681

4!

eP X

3 53

( 5) 0,10085!

eP X

olasılıkları elde edilir.

131

Örnek 5.16 deki verilen problemin excel programında çözümü için önce fonksiyon ekle (fx) tuşuna basılarak buradan istatistiksel fonksiyonlar seçilir. Daha sonra istatistiksel fonksiyonlar arasından Poisson dağılımı seçilerek aşağıda verilmiş olan resimdeki gibi ilgili alanlar belirlenerek olasılıklar hesaplanır.

Örnek 5,16 de verilen problemin Poisson dağılımı yardımıyla excel çözümü yapılarak kümülatif başlığı altında olasılıklar hesaplanır. Bu hesaplanan olasılıkların daha görsel sunumu ve yorumlanması için grafik çizilmek istendiğinde ise X sütünü ile kümülatif sütünü seçilerek ekle grafik menüsüne basılır ve istenilen grafik türü belirlenir. Böylece hesaplanan olasılıklar ve başarıya (yapılan satışlar) ilişkin grafik aşağıda ki resimde verildiği gibi elde edilir.

132

Örnek 5.17:

Bir polikliniğe 5 dakikada ortalama 2 hasta gelmektedir.

a. 5 dakikalık sürede gelen hasta sayısının olasılıklarını gösteriniz.

b. 5 dakika içinde ikiden çok hasta gelmesi olasılığını bulunuz.

Çözüm 5.17 :

Bekleme yada kuyruk oluşturma sorularının çözümünde Poisson dağılımı kullanılır. 5 dakikalık sürede gelen hasta sayısını X ile gösterelim, ortalaması 2 olan bir Poisson dağılımına uyar. Olasılık fonksiyonu:

133

a. 2 (2)

( )!

xeP x

x

x= 0, 1, 2,...........

2 0(2)( 0) 0,1353

0!

eP X

2 1(2)

( 1) 0,27061!

eP X

2 2(2)

( 2) 0,27062!

eP X

b. ( 2) 1 (0) (1) (2) 0,3233P X P P P dir.

X, Binom dağılımına sahip tesadüfi değişken olsun. Deney sayısı n’nin çok arttırıldığını ve ilgilenilen sonuçların ana kütledeki oranının çok küçük olduğunu varsayalım. Kısaca ve p 0n iken

.n p sabit bir sayı olmak üzere Binom dağılımı Poisson dağılımına yaklaşır. Bu nedenle Binom

dağılımı yerine ortalaması .n p olan Poisson dağılımı kullanılır. Örneğin, Bir serumun hastaya

verilmesi sonucu yan etkiye neden olma olasılığı 0,02 olduğu varsayılsın. 100 hastadan tesadüfi olarak seçilen 4 tanesinde ilacın yan etki göstermesi olasılığını hesaplayalım;

.n p olduğunu biliyoruz, o zaman 0,02100=2= bulunur. X, yan etki gösteren hasta sayısı

olarak tanımlandığında, =2 olan Poisson dağılımına uyar. İstenen olasılık,

2 42 0,135 16( 4) 0,09

4! 24

eP X

olarak bulunur.

Bir bölgede 1 yıllık periyotta tifodan (typhoid fever) ölen kişi sayısı ortalama 4 olarak belirlenmiştir. Bu bölgede önümüzdeki 1 yıl içinde tifodan 8 kişinin ölme olasılığı nedir?

Sağlık kuruluşlarında mesleki kazalar sonucunda her yıl ortalama olarak meydana gelen 1000 kazadan 1’i ölümcül kazadır. Bir yıl içinde 2000 sağlık personelini hiçbirinin ölümcül kaza ile karşılaşmama olasılığı nedir? Normal Dağılım İstatistikte en çok kullanılan ve çok geniş bir uygulama alanına sahip olan normal dağılım ya da Laplace-Gauss dağılımı ilk olarak 1733 yılında De Moivre tarafından ortaya atılmış, sonra 1809 da Gauss tarafından geliştirmiştir. Uygulamada ele alınan birçok değişken normale benzer bir dağılım gösterir. Örneğin, ölçme hataları, bebeklerin canlı doğum ağrılıkları, diastolik kan basıncı, hemoglobin düzeyi, kadınların yaşam süresi vb... gibi. Aslında, bu tür tesadüfî değişkenlerin dağılımları tam olarak bir normal dağılıma uymasa da yaklaştıkları görülür. Fakat uygulamada, çok sayıda birbirinden bağımsız olarak ortaya çıkan tesadüfî değişkenlerin bir normal dağılım gösterdikleri kabul edilir.

İstatistik teorisinde önemli bir yere sahip olan normal dağılım, tek değişkenli, iki değişkenli ve çok değişkenli olmak üzere üç kısım altında incelenir. Bu kitapta sadece tek değişkenli normal dağılım ele alınmaktadır. Aritmetik ortalaması ve standart sapması farklı değerler olan çok sayıda normal dağılım düşünülebilir; herhangi bir normal dağılımın özel denklemini yazabilmek için dağılımın parametreleri olan değerlerini bilmek yeterlidir.

134

X sürekli tesadüfî değişkeni, gerçel sayılar uzayında tanımlanmak üzere,

21221

, 0, , 2


x

e xf x

ise X normal dağılıma sahiptir denir. Burada; , normal dağılımın ortalaması, , normal dağılımın

standart sapması, e=2,71828 ve 3,14159 dır.

Uygulamada insanlara, hayvanlara ve bitkilere ait ölçümlerin normal dağıldıkları görülür. Ayrıca normal dağılımı olmayan bir anakütleden tesadüfi olarak seçilen yeterince büyük örneklemlerin ortalamalarının dağılımı da yaklaşık olarak normaldir.

Normal dağılımı özellikleri:

a. Normal dağılım olasılık yoğunluk fonksiyonunun, yani f(x)’ eğrisi altında kalan ve X ekseni ile sınırlanan alan 1’ e eşittir.

b. Normal dağılım ortalamaya göre simetriktir.

c. Normal dağılıma sahip bir değişkenin ortalaması, medyanı ve modu bir birbirine eşittir.

Şekil 5.1: Normal dağılım- çan eğrisi

Şekil 5.2: Normal eğri altına kalan alan

135

Şekil 5.3: Normal eğri altında kalan simetrik alan

Eğrinin altında kalan alan, ve

değerleri ile orantılı olarak, belirli % değerlerine göre

yoğunlaşmalar gösterir. Bu değerleri ve

değerlerine göre aşağıdaki gibi verebiliriz.

: toplam alanının % 34,13’ünü

: toplam alanının % 34,13’ünü

: toplam alanının % 68,26’sını

2 : toplam alanının % 95,44’ünü

1.96 : toplam alanının % 95,00’ini

2.58 : toplam alanının % 99,00’unu belirtir.

Şekil 5.4: Normal eğri altında kalan alanlar

136

Standart Normal DağılımFarklı ortalama ve standart sapmalara sahip normal dağılımlar için X tesadüfi değişkenin verilen iki değer arasında olması olasılığını hesaplamak için integral almaya gerek vardır. Her olasılık değerini hesaplamak için integral almak zor olduğundan, normal dağılım özelliğine sahip bütün tesadüfi değişkenlerin yerine standart normal değişkenler geçirilerek bir tablo hazırlanmıştır. Bahsedilen standart dağılım tablosu kitabın sonunda verilmiştir.

Normal dağılım ortalama ve varyans olmak üzere iki parametresi bulunmaktadır. Farklı ortalama ve varyanslara göre çok sayıda normal dağılım eğrisi çizilebilir. Değişen ortalama ve varyanslara göre yeni olasılıkların hesabını yapmak oldukça zordur. Bundan dolayı ortalaması ve varyansı değişmeyen standart normal dağılım için olasılıklar önceden hesaplanıp, ortalama ve varyans değerlerine göre farklılaşan normal dağılımların olasılıkları bu standart dağılım aracılığıyla hesaplanabilir. Bunun için Z harfi ile belirtilen standart bir değişken tanımlanır;

Xz

Bu Z değişkeninin dağılımı, ortalaması 0 ve varyansı 1 olan normal dağılımdır ve standart normal dağılım olarak tanımlanır. Normal dağılım olasılık yoğunluk fonksiyonunda 0 ve 1 yazılırsa

standart normal dağılım elde edilir. Standart normal dağılım 0,1Z N 0,1 Z N olarak gösterilir.

Standart normal dağılımın olasılık değerleri tablolar halinde hazırlanmıştır. Tablonun ilk sütun ve ilk satır rakamlarının bileşimi ile Z değişkeninin değeri bulunur. Tablonun gövde kısmındaki değerler olasılık değerleridir. Bu olasılık değerlerine karşılık gelen Z değerini bulmak için; söz konusu olasılık değerinin bulunduğu satırdaki ilk rakam Z değerinin ilk iki basamağını oluşturur ve olasılık değerinin bulunduğu sütunda en tepedeki rakam da Z değerinin üçüncü basamağını oluşturur. Örneğin tablodan 0,3413 olasılık değerine karşılık gelen Z değeri ilk sütunda 1,0 ve dikey olarak ilk satırdan ,00 rakamının birleştirilmesi ile 1,00 olarak bulunur.

Örnek 5.18:

Standart Z değişkeninin;

a. 1,25’ ten küçük değer alma olasılığını hesaplayınız.

b. 1,25’ ten büyük değer alma olasılığını hesaplayınız.

Çözüm 5.18:

Standart Z değişkeninin 1,25’ ten küçük ve büyük değer alma olasılıkları sırasıyla 1,25P Z ve

1,25P Z olarak gösterilir.

a. 1,25’ ten küçük değer alma olasılığı;

Z = 1,25 için olasılım değeri 0,3944’ dur. Bu olasılık değeri Z = 0 ile Z = 1,25 arasındaki alan değeridir. Sonuç itibariyle standart normal dağılım eğrisi altında kalan alanlara göre 1,25P Z olasılığı;

1,25 0,5 0,3944 0,8944P Z olarak bulunur.

137

Şekil 5.5: Normal eğri altında kalan alan: 1,25P Z

b. 1,25’ ten büyük değer alma olasılığını hesaplayınız.

1,25 0,5 0,3944 0,1056P Z olarak bulunur.

Şekil 5.6: Normal eğri altında kalan alan: 1,25P Z

Örnek 5.19: Standart normal dağılımı kullanarak aşağıdaki olasılıkları hesaplayınız.

a. (0,18 1,15)P Z

b. ( 2,00 1,85)P Z

Çözüm 5.19: Standart normal dağılımı kullanarak aşağıdaki olasılıkları hesaplayınız.

a. (0,18 1,15)P Z olasılığını hesaplanırken sırasıyla Z = 0 ile Z = 0,18 değerleri ve Z = 0 ile Z =

1,15 değerleri arasında kalan alan değerleri standart normal dağılım tablosu kullanılarak elde edilir.

Z = 0 ile Z = 0,18 arasında olasılık değeri 0,0714

Z = 0 ile Z = 1,15 arasında olasılık değeri 0,3749 dur.

O halde;

0,3749 0,0714

(0,18 1,15) (0 1,15) (0 0,18) 0,3035P Z P Z P Z

0,3749 0,0714

(0,18 1,15) (0 1,15) (0 0,18) 0,3035(0,18 1,15) (0 1,15) (0 0,18) 0,3035P Z P Z P Z(0,18 1,15) (0 1,15) (0 0,18) 0,3035(0,18 1,15) (0 1,15) (0 0,18) 0,3035 (0,18 1,15) (0 1,15) (0 0,18) 0,3035(0,18 1,15) (0 1,15) (0 0,18) 0,3035P Z P Z P Z(0,18 1,15) (0 1,15) (0 0,18) 0,3035 (0,18 1,15) (0 1,15) (0 0,18) 0,3035P Z P Z P Z(0,18 1,15) (0 1,15) (0 0,18) 0,3035

138

Şekil 5.7: Normal eğri altında kalan alan: (0,18 1,15)P Z

b. ( 2,00 1,85)P Z için a şıkkında olduğu gibi ilgili olasılık değerleri öncelikle standart normal

dağılım tablosu kullanılarak elde edilir. Standart normal dağılım tablosunda Z’ nin negatif değerleri yer almamaktadır. Böyle durumda standart normal dağılımın simetrik olma özelliğinden yararlanılır. Yani Z = 0 ile Z = 2 arasında kalan alan Z = -2 ile Z = 0 arasında kalan alana eşittir.

Z = -2 ile Z = 0 arasında olasılık değeri 0,4772

Z = 0 ile Z = 1.85 arasında olasılık değeri 0,4678 dur.

O halde;

0,4772 0,4678

( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450P Z P Z P Z

0,4772 0,4678

( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450P Z P Z P Z( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450 ( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450P Z P Z P Z( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450 ( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450P Z P Z P Z( 2,00 1,85) ( 2,00 0) (0 0,185) 0,9450 bulunur.

Şekil 5.8: Normal eğri altında kalan alan: ( 2,00 1,85)P Z

Normal dağılımlarda olasılık hesabı yapılacağı zaman öncelikle standartlaştırılmış değişken elde edilir. Standartlaştırma işleminden sonra standart normal dağılım tablosu kullanılarak istenilen olasılıklar bulunur.

Örnek 5.20:

İlaçla tedavi edilen hastaların iyileşme süresi ortalaması 30 gün ve varyansı 36 olan bir normal dağılım göstermektedir. Buna göre bir hastanın;

a. 25 günden daha fazla sürede iyileşme olasılığı nedir?

b. 36 günden daha az sürede iyileşme olasılığı nedir?

Çözüm 5.20:

İlgili olasılıkları hesaplamak için iyileşme süresi olarak tanımlanan X tesadüfi değişkeninin aldığı değerlere karşılık gelen z değerlerinin hesaplanması gerekmektedir.

139

Xz

burada 30 , 2 36 ve 6 dır.

a. 25 günden daha fazla sürede iyileşme olasılığı 25P X için öncelikle x = 25 güne karşılık

gelen z değeri hesaplanır;

25 30 50.83

6 6

Xz

tur.

Z = -0,83 ile Z = 0 arasında olasılık değeri 0,2967

0,83 0,5 0,2967 0,7967P Z

Bir hastanın 25 günden daha fazla sürede iyileşme olasılığı % 79,67’ dir.

Şekil 5.9: Standart normal eğri altında kalan alan: 0,83P Z

b. 36 günden daha az sürede iyileşme olasılığı 36P X için öncelikle x = 36 güne karşılık gelen

z değeri hesaplanır;

36 30 61,00

6 6

Xz

Z = 0 ile Z =1,00 arasında olasılık değeri 0,3413

1,00 0,5 0,3413 0,8413P Z

Bir hastanın 36 günden daha az sürede iyileşme olasılığı % 84,13’ tür.

Şekil 5.10: Standart normal eğri altında kalan alan: 1.00P Z

140

Örnek 5.21:

Şeker hastalarında küçük tansiyon ortalaması 90 mm HG varyansıda 45 mm HG olmak üzere normal dağılım göstermektedir. Buna göre seçilen bir şeker hastanın 85 mm HG ile 95 mm HG arasında olma olasılığını bulunuz. Çözüm 5.21:

İlgili olasılığı hesaplamak için X tesadüfi değişkeninin aldığı değerlere karşılık gelen z değerlerinin hesaplayalım;

11

85 900,56

9

xz

ve 2

2

95 900,56

9

xz

85 90 0,56 0,56P X P Z olasılığını elde edilir.

Z = -0,56 ile Z = 0 arasında olasılık değeri 0,2123

Z = 0 ile Z = 0,56 arasında olasılık değeri 0,2123 tur.

0,56 0,56 0,56 0 0 0,56P Z P Z P Z

0,56 0,56 0,2123 0,2123 0,4246P Z

Buna göre seçilen bir şeker hastanın 85 mm HG ile 95 mm HG arasında olma olasılığı % 42,46’ tır.

Şekil 5.11: Standart normal eğri altında kalan alan: 0,56 0,56P Z

Standart normal Z değişkeni için aşağıdaki olasılıkları bulunuz.

a. 2,2P Z b. 2,6P Z c. 1,75P Z d. 1,45 1,76P Z e. 0,97 2,21P Z

Bir bölgedeki bebeklerin canlı doğum ağırlıkları 2,85 kg ve satandart sapması da 0,25 kg dır. Ayrıca canlı doğum ağrılıklarının normal dağılım gösterdiği bilinmektedir. Yeni doğmuş bir bebeğin ağırlığının 2,80 kg ile 3,15 kg arasında olma olasılığını bulunuz.

0,4246Z=0,56

141

Özet

İstatistik biliminin temelini oluşturan olasılık, belirsizlik durumunda karar almayı sağlar. Tesadüfiliği (rassallık) içeren olasılık, herhangi bir olayın meydana gelme şansıyla ilgilenir. Genel olarak olasılık, meydana gelmesi arzu edilen olay sayısının, olayın nihai tüm sonuçlarının sayısına olan oranı olarak tanımlanır. Belirsizliğin bir ölçüsü olarak tanımlanan olasılık, aslında bize tesadüfi deneyin çok defa tekrarlanması durumunda bu sonuçlarla hangi şansla karşılaşabileceğimizi tümdengelim yöntemiyle anlatır. Olasılık kavramını açıklayabilmek için üç temel kavramın tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi deney, örneklem uzayı ve olaydır.

İki bağımlı olaydan birincisinin gerçekleştiği bilindiğinde ikincisinin ona bağlı olarak gerçekleşme olasılığına koşullu olasılık denir. Bir olayın gerçekleşme şansı başka bir olayın gerçekleşmesine bağlı olduğunda koşullu olasılık kullanılmaktadır. A ve B olayları herhangi iki olay olsun. A olayının gerçekleştiği bilindiğinde, B olayının ortaya çıkma olasılığı koşullu olasılık

olarak tanımlanır ve P B A ile gösterilir.

Tesadüfi değişken, S örnek uzayındaki her bir tesadüfi olaya sayısal değerler atayan bir fonksiyondur. Bu fonksiyon aracılığıyla örnek uzayındaki her bir sonuç reel eksende bir değere taşınır. Kısaca tesadüfi değişken, S örneklem uzayının her bir olayını yalnız bir gerçek değere dönüştürür.

Yapılan her tesadüfi deneyde ortaya çıkan sonuçlar için yeni bir fonksiyon aramak hem emek hem de zaman kaybına yol açacağından çeşitli tesadüfi deneylerin aynı koşullar altında aynı özellikler göstermelerinden yararlanılarak kuramsal olasılık dağılımları geliştirilmiştir. Bu kuramsal olasılık dağılımları benzer özellikteki diğer deneylerde de kullanmak amacıyla genelleştirilmiştir. Çok sayıda kuramsal olasılık dağılımdan söz etmek olanaklı ise de bu ünitede kesikli olasılık dağılımlarından Binom dağılımı ve Poisson dağılımı, sürekli olasılık dağılımlarından ise Normal dağılım ele alınacaktır. Uygulamada ele alınan birçok değişken normale benzer bir dağılım gösterir. Örneğin, ölçme hataları, bebeklerin canlı doğum ağrılıkları, diastolik kan basıncı, hemoglobin düzeyi, kadınların yaşam süresi vb... gibi. Aslında, bu tür tesadüfî değişkenlerin dağılımları

tam olarak bir normal dağılıma uymasa da yaklaştıkları görülür. Fakat uygulamada, çok sayıda birbirinden bağımsız olarak ortaya çıkan tesadüfî değişkenlerin bir normal dağılım gösterdikleri kabul edilir. İstatistik teorisinde önemli bir yere sahip olan normal dağılım, tek değişkenli, iki değişkenli ve çok değişkenli olmak üzere üç kısım altında incelenir. Bu kitapta sadece tek değişkenli normal dağılım ele alınmaktadır. Aritmetik ortalaması ve standart sapması farklı değerler olan çok sayıda normal dağılım düşünülebilir; herhangi bir normal dağılımın özel denklemini yazabilmek için dağılımın değerlerini bilmek yeterlidir.

Farklı ortalama ve standart sapmalara sahip normal dağılımlar için X tesadüfi değişkenin verilen iki değer arasında olması olasılığını hesaplamak için integral almaya gerek vardır.Her olasılık değerini hesaplamak için integral almak zor olduğundan, normal dağılım özelliğine sahip bütün tesadüfi değişkenlerin yerine standart normal değişkenler geçirilerek bir tablo hazırlanmıştır. Bahsedilen standart normal dağılım tablosu kitabın sonunda verilmiştir.

Normal dağılım ortalama ve varyans olmak üzere iki parametresi bulunmaktadır. Farklı ortalama ve varyanslara göre çok sayıda normal dağılım eğrisi çizilebilir. Değişen ortalama ve varyanslara göre yeni olasılıkların hesabını yapmak oldukça zordur. Bundan dolayı ortalaması ve varyansı değişmeyen standart normal dağılım için olasılıklar önceden hesaplanıp, ortalama ve varyans değerlerine göre farklılaşan normal dağılımların olasılıkları bu standart dağılım aracılığıyla hesaplanabilir. Bunun için Z harfi ile belirtilen standart bir değişken tanımlanır;

xz

Bu Z değişkeninin dağılımı, ortalaması 0 ve varyansı 1 olan normal dağılımdır ve standart normal dağılım olarak tanımlanır.

142

Kendimizi Sınayalım 1. Örneklem uzayındaki temel sonuçların bir alt kümesine ……………. denir.

a. Örneklem

b. Olay

c. Deney

d. Değişken

e. Ortalama

2. Bir çocuk hastalıkları polikliniğine tedavi için gelen 4 hasta kaç farklı şekilde sıralanabilir?

a. 24

b. 36

c. 48

d. 64

e. 112

3.

, , , , , , , , , , , , ,S a b c d e f g A a c e g B c d e

olsun. A B alt kümesini oluşturunuz.

a. , , , , , ,A B a b c d e f g

b. A B a

c. A B g

d. ,A B a g

e. , , , ,A B b c d e f

4. İki olayın kümelerinin ortak elemanı yok ve kesişimleri boş küme ise bu tür olaylara nedir?

a. Tesadüfi olay

b. Bağımsız olay

c. Ayrık olay

d. Örneklem uzayı

e. Bağımlı olay

5. İki tavla zarının birlikte atıldığını varsayalım. A olayı üst yüze gelen sayıların toplamının 8 olması ve B olayı üst yüze gelen sayıların aynı olması olayları olarak tanımlansın. Bu iki olayın birleşiminin olasılığını bulunuz.

a. 0,28

b. 0,14

c. 0,17

d. 0,46

e. 0,24

6. A ve B olayları için olasılıklar 2

3P A ,

3

4P B ve

3

5P A B olarak veriliyor.

P A B olasılığını bulunuz.

a. 0,67

b. 0,75

c.0,82

d. 0,18

e. 0,94

7. Bir toplumun 0,20’si X hastalığı taşıyıcısıdır. Bu toplumdan tesadüfi olarak seçilen 10 kişiden yarısının bu hastalığın taşıyıcısı olma olasılığını bulunuz.

a. 0,015

b. 0,026

c. 0,032

d. 0,044

e.0,075

8. Bir kırsal yerleşim alanında yılda kuduz vakası oranı 0,00003’ tür. Belli bir zaman diliminde 200000 vakadan hiçbirinde kuduz vakası ile karşılaşmama olasılığı nedir?

a. 0,0025

b. 0,02

c. 0,44

d. 0,001

e. 0,00003

143

9. Z, standart normal dağılıma sahip bir değişken olduğuna göre, 0,50 2P Z olasılığı kaçtır?

a. 0,4772

b. 0,6687

c. 0,2857

d. 0,1915

e. 0,500

10. Z, standart normal dağılıma sahip bir değişken olduğuna göre, 0,50 1,65P Z

olasılığı kaçtır?

a. 0,4505

b. 0,1915

c. 0,700

d. 0,8200

e. 0,6412


1. b Yanıtınız yanlış ise “Olasılığa Giriş” başlıklı konuyu yeniden gözden geçiriniz.

2. a Yanıtınız yanlış ise “Permütasyon” başlıklı konuyu yeniden gözden geçiriniz.

3. d Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz.

4. c Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz.

5. a Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz.

6. c Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz.

7. b Yanıtınız yanlış ise “Binom Dağılımı” başlıklı konuyu yeniden gözden geçiriniz.

8. a Yanıtınız yanlış ise “Poisson Dağlımı” başlıklı konuyu yeniden gözden geçiriniz.

9. c Yanıtınız yanlış ise “Normal Dağılım” başlıklı konuyu yeniden gözden geçiriniz.

10. e Yanıtınız yanlış ise “Normal Dağılım” başlıklı konuyu yeniden gözden geçiriniz.

144


Sıra Sizde 1

! 6! 6.5.4.3.2.1 720n nP n

6! 6! 6.5.4.3!20

3! ! 3! 6 3 ! 3!3!

n nC C

r r n r

Sıra Sizde 2 1.45 personel içinden seçilen bir kişinin erkek

olma olasılığı; 30

0,66745

P E

2. P A B P A P B P A B

eşitliğiyle hesaplanır;

2 2 1

0,735 3 3

P A B

Sıra Sizde 3

0,80 0,60 0,48P A B P A P B

Sıra Sizde 4

İlgili olasılığın hesaplanması için Binom

dağılımı kullanılır;

1 45( ) = 0,25 (0,75) 0,396

1x n xn

P x p qx

Sıra Sizde 5

4 84( ) ( 8) 0,0298

! 8!

xe eP x P x

x

Sıra Sizde 6

İlgili olasılığın hesaplanması için Poisson

dağılımı kullanılır;

2000n , olayın görülme olasılığı 1

0,0011000

p dir.

O zaman Poisson dağılımının parametresi 2000 0,001 2np dir.

2 02( ) ( 0) 0,135

! 0!

xe eP x P x

x

Sıra Sizde 7

a. 2,2 0,9861P Z

b. 2,6 0,0047P Z

c. 1,75 0,0401P Z

d. 1,45 1,76 0,8873P Z

e. 0,97 2,21 0,8204P Z

Sıra Sizde 8

11

2,80 2,850,20

0,25

xz

ve

22

3,15 2,851,20

0,25

xz

0,20 1,20 0,4642P Z

145


Anadolu Üniversitesi Açık Öğretim Fakültesi, İstatistik, Editör: Prof. Dr. Ali Fuat Yüzer, AÖF Yayın No: 771, Anadolu Üniversitesi, Eskişehir.


F. Er, K.Ö, Peker, Editör: H. Sönmez (2009). Biyoistatistik, Ünite 4, Eskişehir Anadolu Üniversitesi.

Esin, A.A., Ekni, M., ve Gamgam, H. (2006). İstatistik, Gazi Kitapevi, Ankara.

Gürsakal, N. (2007). Çıkarımsal İstatistik, Bursa: Dora Basım Yayın Dağıtım.

Lwanga, S.K. and Tye, C.Y. (1986) Teaching Health Statistics. Geneva: World Health Organization.

Serper, Ö (2004). Uygulamalı İstatistik 1 ve 2 Bursa: Ezgi Kitabevi.

146


Tam sayım ve örnekleme kavramlarını ayırt edebilecek,

Örneklemeye başvurmanın yararlarını açıklayabilecek,

Örnekleme planı hazırlayabilecek,

Bir örnek araştırma için örnekleme uygulaması yapabilecek ve istenen bilgileri üretebilecek


Anahtar Kavramlar

Tam sayım

Çerçeve

Parametre

Değişken

Örnekleme

Örneklem

İstatistik

İçindekiler

Giriş

Tam Sayım ve Örnekleme

Örnekleme Yapmayı Gerekli Kılan Nedenler

Örnekleme Sürecinin Aşamaları

Örnekleme Yöntemleri

Bazı Örnekleme Dağılımları

6

147

GİRİŞİstatistiğin önemli bir konusu olan örnekleme, bilimsel araştırma sürecinin en önemli aşamasıdır ve bu konu sürecin diğer aşamalarıyla önemli bir ilişkiye sahiptir. Örnekleme, ana kütlenin birim sayısı bakımından daha az fakat araştırmaya konu olan özellikleri bakımından ana kütlenin temsili bir modeli olan örneklemin oluşturulması ve örneklemden yararlanarak ana kütle parametrelerine ait tahminde bulunma faaliyetidir. Bütün bilim dallarında olduğu gibi sağlık bilimlerinde de yapılacak bilimsel araştırmalarda genellikle tam sayım değil örneklemeye başvurulmaktadır.

TAM SAYIM VE ÖRNEKLEMEAnahtar kelimeler başlığı altında verilen kavramlar örnekleme konusunu açıklayabilmek için de bilinmesi gereken kavramlardır. Bu kavramlar birinci ünitede açıklandığı için bu üniteye sadece tam sayım ve örnekleme kavramlarıyla ilgili hatırlatıcı bilgiler verilerek başlanmıştır.

Bu ünitedeki konuları kolayca anlayabilmeniz için birinci ünitede açıklanan temel kavramları tekrar okuyunuz.

Bilindiği gibi istatistiksel araştırmaların amacı tanımlanan ve hakkında araştırma yapılacak birimler topluluğu olan ana kütlenin özellikleriyle ilgili bilgiler üretmektir. Bu bilgiler ya tam sayım sonucu elde edilen veri kümesinin (ana kütle veri kümesinin) çözümlenmesiyle ya da örneklemden elde edilen veri kümesinin (örneklem veri kümesinin) çözümlenmesiyle üretilebilir.

Tam SayımPlanlanan bir istatistiksel araştırma için tanımlanan sonlu ana kütlenin bütün birimleri üzerinden araştırmaya konu olan değişkenler itibariyle veri derleniyorsa yapılan işleme tam sayım denir. Tam sayım sonucu elde edilen veri kümesinin çözümlenmesiyle elde edilen bilgiler (parametre değerleri) veri derleme ve çözümleme hatası işlenmemiş ise kesin ve doğru bilgilerdir.

Tam sayım sonucu elde edilen veriler kullanılarak hesaplanan sayısal değerlere parametre denir.

Tam sayım genellikle sonlu ve küçük hacimli ana kütlelere uygulanır. Bununla birlikte büyük hacimli sonlu ana kütlelerin bütün birimlerine ulaşabilmek olanaklıysa, karşılaşılan özel problemin çözümü için mümkün bütün verilerin elde edilmesine gereksinim varsa tam sayım yapılmalıdır.

Örnekleme ve Bazı Örnekleme Dağılımları

148

Örnek 6.1:

Bir tıp fakültesi hastanesinde çalışan 100 uzman hekimin uygulamaya geçen tam gün çalışma yasasına ilişkin görüşlerinin belirlenmesini konu alan bir araştırma planlanıyor. Tamsayım yapılabilir mi?

Çözüm 6.1:

Tam gün yasası ile ilgili görüşlerin alınacak hekim sayısı N=100 dür, küçük hacimli sonlu bir ana kütledir. 100 hekimden tam gün yasası ile ilgili görüşlerinin alınması mümkün ve üretilmesi istenen bilgi için zaman yeterli ise tam sayım yapılabilir.

Ancak tanımlanan ana kütlenin bütün birimleri üzerinden veri derlemek veya tam sayım yapmak her zaman izleyen kısımda açıklanacak çeşitli nedenlerle mümkün olamaz, parametre değerleri hesaplanamaz. Böyle bir durumda ana kütlenin özellikleriyle ilgili bilgiler ve genellemeler örnekleme uygulamasıyla elde edilebilir. Örnekleme Tanımlanan ana kütleden onu ilgilenilen değişkenler bakımından temsil eden sınırlı sayıda birimin belirli yöntemler kullanılarak seçilmesi ile ana kütle için tahmine dahalı bilgi edinme işlemine örnekleme, seçilen birimlerin oluşturduğu topluluğa örneklem denir.

Örnek 6.2:

Bir anaokulu işletmecisinin 5 ayrı bölgedeki okullarında 1000 öğrencisi bulunmaktadır. Bu işletmeci öğrencilerine uyguladığı beslenme programıyla ilgili öğrenci ailelerinin görüşlerini almak amacıyla bir araştırma planlıyor.

Araştırmanın Amacı: Uygulanan beslenme programıyla ilgili ailelerin görüşlerinin alınması.

Araştırmanın Ana kütlesi: 5 bölgedeki okullarda okuyan öğrencilerin ailelerinin oluşturduğu topluluktur.

Örnekleme: Her bölgedeki okuldan 20şer olmak üzere toplam n=100 aile seçiliyor. Ailelerin seçim işlemine örnekleme; seçilen 100 ailenin oluşturduğu topluluğa örneklem adı verilir.

Değişken: Öğrencilerin annelerinin beslenme programıyla ilgili görüşleri ise değişkendir.

Örnekleme Birimi, Gözlem Birimi: Seçilen ailelerin oluşturduğu topluluk örneklem, aileler örnekleme birimi ve öğrencilerin anneleri ise gözlem birimidir.

Ana kütleyi temsil eden, onun bir modeli olan örneklemden elde edilen veri kümesi kullanılarak yapılacak çözümlemenin sonucu olan bilgi (örneklem istatistiği) ana kütle bilgisi anlamında kullanılabilir. Başka bir deyişle örneklem istatistiği değeri bilinmeyen ana kütle parametre değeri hakkında genelleme yapmak amacıyla kullanılabilir. Örneklemede önemli olan, ana kütle doğru tanımlanmış ise örneklemin araştırmaya konu olan değişkenler itibariyle ana kütleyi temsil edip etmemesi konusudur. Temsili bir örneklem, ana kütlenin sadece birim sayısı bakımından küçük, özellikleri bakımından benzeri ve modeli olan örneklemdir. Eğer ilgilenilen değişkenler bakımından ana kütledeki ve örneklemdeki birimler benzer dağılım gösteriyorsa oluşturulan örneklem temsili bir örneklemdir. Örnek 6.3:

Bir ilde yaşayan ve 2010-2011 yıllarında prostat kanseri teşhisi sonucu ameliyat olan yaşları 45-70 grubundaki 500 kişinin yaşam kalitesi araştırılmak isteniyor. Bu kişilerin %40’ının 45-55 yaş grubunda olduğu biliniyor. Diyelim ki n=50 hastadan oluşan bir örneklem seçilmiş ve bu hastaların %40’ının (20 Kişinin) 45-55 yaş grubunda yer aldığı belirlenmiş ise bu örneklem yaş grubu değişkeni bakımından temsili örneklemdir.

149

Bir hastaneye başvuran kişilerin rahatsızlık türlerinin günlük dağılımını belirlemek amacıyla bir araştırma yapılması isteniyor.

Tam sayım yapılabilir mi, tartışınız.

Örneklem istatistiğinin değeri her zaman parametre değeri için bilgi niteliği taşır mı, tartışınız.

Örneklemenin temel amacı nedir, açıklayınız.

Bu ünitenin izleyen kısımlarındaki konular için A. F. Yüzer, E. Şıklar, E. Ağaoğlu, H. Tatlıdil, A. Özmen, Editör: A. F. Yüzer (2011). İstatistik, Ünite 7 ve 8, Eskişehir Anadolu Üniversitesi Yayını İsimli kitaptan, editör ve ünite yazarlarının izni alınarak yararlanılmıştır.

ÖRNEKLEME YAPMAYI GEREKLİ KILAN NEDENLER Ana kütlenin sonsuz olması durumu

Tanımlanan ana kütlenin sonsuz ana kütle olması durumunda tam sayım mümkün olmaz. Çünkü incelenecek birimler X tesadüfi değişkeninin teorik olasılık dağılımının türettiği sonuçlardır. Dolayısıyla incelencek birim sayısında ve gözlem değeri sayısında bir sınır yoktur. Bu nedenle örnekleme uygulamasına başvurmak kaçınılmazdır.

Örnek 6.4:

Bir sağlık ocağından poliklinik hizmeti alan kişilerin memnuniyeti araştırılmak isteniyor. Tamsayım yapılıp yapılamayacağını açıklayınız. Çözüm 6.4:

Sağlık ocağında verilen poliklinik hizmeti bir süreçtir. Bu hizmet geçmişte verilmiştir, bugün verilmektedir ve verilmeye de devam edecektir. Bu nedenle geçmişte poliklinik hizmeti alan, bugün almakta olanlar ve gelecekte alacak olan hastalar ana kütleyi oluşturur. Poliklinik hizmeti devam ettikçe bu hizmetten yararlananlar ana kütlesine yenileri ilave olacağı için ana kütle sonsuz ana kütledir. Söz konusu araştırma için tamsayım yapılamaz, örnekleme uygulaması zorunludur.

Neter J., Wasserman W., Whitmore G. A. (1993). Applied Statistics 4. Edition, Allyn and Bacon

Ana kütlenin sonlu olması durumu

Daha önce de açıklanmış olduğu gibi tanımlanan ana kütle sonlu ana kütle olduğunda ana kütle ile ilgili bilgiler hem tam sayım uygulayarak hem de örneklemeye başvurularak elde edilebilir. Bu durumda tam sayım mı?, örnekleme mi? uygulanacağına karar verebilmek için aşağıdaki kriterler değerlendirilir.

Maliyet: Örnekleme bütçesi, örneklemeyi tam sayıma tercih etmede en önemli belirleyicidir. Örnekleme tam sayıma göre daha az maliyetle bilgi üretme imkanı sağlar. Öte yandan eğer ana kütle hacmi küçükse veya tam sayım yapmak bütçe olanaklarıyla da mümkünse tam sayım tercih edilmelidir. Burada dikkat edilmesi gereken nokta tam sayım yapma maliyetinin, elde edilecek bilginin değerinden küçük olması gerekir. Aksi durumda örneklemeye başvurmak uygun olacaktır.

Zaman: Bir araştırma sonunda ulaşılacak bilgiye duyulan ihtiyacın zaman sınırları, araştırmanın tam sayımla mı yoksa örneklemeyle mi yapılacağına karar verirken değerlendirilecek diğer önemli bir etkendir. Örnekleme, tam sayıma göre daha kısa zamanda ve yeterli ayrıntıda bilgi elde etme olanağı verir. Örneklemenin bu özelliği ve üstünlüğü bilgiye çok hızlı gereksinim olduğu durumlarda bilhassa önemlidir.

150

Hem bir tam sayımdan hem de bir örneklemden elde edilecek bilgi için gerekli olan zaman bir alternatif maliyet üstlenmeyi de gerektirir. Çünkü bilgi elde etme süresine bağlı olarak verilecek kararın erken ya da geç oluşu kazanç kadar kayıplara da neden olabilir.

Doğru veri elde etme: Her ne kadar tam sayım yapılınca kesin, doğru bilgiye ulaşılır denilse de tam sayımın yapılabilmesi için gerekli olan sayıda ve istenen özelliklere sahip, veri derleme hatası yapmayacak gözlemci ya da görüşmeci bulmak ya da yetiştirmek oldukça zor hatta olanaksızdır

İncelenecek birimlerin fiziksel zarara uğraması: Tanımlanan ana kütlede yer alan birimlerin, gözlemi ya da ölçümü yapılırken fiziksel zarara uğratılıyorsa örneklemeye başvurmak zorunludur. Örneğin bir enjektör iğnesi üreten bir sanayi kuruluşunda belirlenen bir gün içinde üretilen enjektör iğnelerinin içerisindeki hatalı iğne oranının belirlenmesi için yapılacak bir araştırmada tam sayım benimsenirse gerekli verilerin derlenmesi amacıyla üretilen tüm iğnelerin hatasız olup olmadığının teste tabi tutulması gerekir ki bu da anlamsızdır. Bu gibi durumlarda örneklemeden yararlanmak kaçınılmaz olur.

Ana kütleyi oluşturan birimlerin değişkenliği: Ana kütleyi oluşturan birimler araştırmaya konu olan değişkenler bakımından heterojen olduğunda mümkün ise tam sayım yapmak, değil ise büyük hacimli örneklem seçmek gerekir.

Ana kütle hacmi küçük, parasal imkanların yeterli olduğu bir araştırma için tam sayım mı yoksa örnekleme mi tercih edersiniz, açıklayınız.

1,5 milyon öğrencinin olduğu Açıköğretim Sisteminin değerlendirileceği bir araştırma için gerekli olan zaman ve parasal imkanlar yeterli ise tam sayım mı yoksa örnekleme mi uygularsınız, tartışınız.

ÖRNEKLEM İÇİN BİRİM SEÇME YÖNTEMLERİ Örnekleme girecek birimlerin seçiminde kullanılan yöntemler keyfi seçim yöntemi ve tesadüfi seçim yöntemi şeklinde sınıflandırılmaktadır. Keyfi Seçim Örneklem oluşturulurken tanımlanan tanımlanan ana kütleyi oluşturan birimler arasında fark gözetilir, yani bütün birimlere bilinen bir olasılıkla seçilme şansı verilmez ise bu türden birim seçimine keyfi seçim adı verilir. Bu seçim yönteminde araştırmacı, hangi birimlerin örnekeleme seçileceğini bilerek ve isteyerek belirler. Tesadüfi Seçim Sonlu Ana kütlelerde Tesadüfi Örneklem Seçimi Sonlu ana kütlelerde tesadüfi birim seçim imkânı veren iki seçim uygulaması bulunmaktadır. Bunlar kura seçimi ve sistematik seçimdir.

Serper Ö. (2004). Uygulamalı İstatistik 2, Genişletilmiş 5. Baskı, Bursa: Ezgi Kitabevi Kura Seçimi Tesadüfi birim seçimi için kura usulü uygulanacak ise aşağıdaki adımlar izlenir:

Tanımlanan anakütle ile ilgili oluşturulacak güncel çerçevedeki bütün birimlere birden N e kadar numara verilir. Bu numaralar fişlere yazılır ve bir torbaya veya bir kaba atılır.

151

Fişler iyice karıştırıldıktan sonra n tane fişin çekilmesi işlemine başlanır. Çekilen fiş her çekilişten sonra torbaya iade edilir veya edilmez. Çekilen fiş torbaya iade ediliyorsa birim seçimine iadeli seçim, iade edilmiyorsa iadesiz seçim adı verilir.

Seçilen n sayıdaki birim örneklemi oluşturur.

Bu birim seçim uygulamasıyla ana kütleyi oluşturan çerçevede yer alan birimler arasında örneklemde yer almaları bakımından ayrıcalık yapılmamış ve eşit seçilme olasılığı tanınmış olur.

Birim seçimi iadeli yapıldığında aynı birim tekrar tekrar örnekleme seçilmiş olabilir. Bu durumda örnekleme kuramının önemli koşullarından biri olan bağımsızlık koşulu sağlanmış olur ve herhangi bir birimin seçilmesi bir başka birimin seçilmesi olasılığını etkilememiş olur.

Gerçekte uygulanan örnekleme planlarında iadeli seçim genellikle uygulanmaz. Birim seçimi iadesiz yapıldığında, seçilen bir birimin tekrar seçilmesi engellenmiş olur. Ancak, ana kütle hacmi N çok büyük, örneklem hacmi n küçük olduğunda her birimin seçiminin diğerinden bağımsız olduğu ve iadeli seçimdeki bağımsızlık koşulunun sağlanabilecek olduğu varsayılır.

Belirlenen sonlu ana kütlede yer alması gereken birim oluşturulacak çerçevede yer almıyorsa veya birden fazla yer alıyorsa kura seçiminin tesadüfîliği etkilenir. N hacimli sonlu bir ana kütlede tesadüfi iadeli seçimle Nn tane farklı örneklem seçmek mümkün iken, aynı ana kütlede iadesiz seçim

uygulandığında aynı hacimli !

!( )!N

n

N

n N nC

tane farklı örneklem seçmek mümkün olur.

Sistematik Seçim Eğer tesadüfi seçim için sistematik seçim uygun görülürse aşağıdaki aşamalar izlenir:

Güncel çerçevedeki birimler birden N ye kadar numaralandırılır.

Örneklem hacmi belirlenir.

k = N / n oranı hesaplanır. Bu oran “büyütme faktörü” olarak isimlendirilir.

1, 2, ….. , k adet sayı arasından tesadüfi olarak bir sayı çekilir. Çekilen sayı a ile gösterilsin. a, örnekleme girecek birinci birimin sıra numarasını gösterir.

a’ıncı, a + k’ıncı, ….. , a + (n – 1)k’ıncı sıra nolu birimlerin seçilmesiyle n hacimli örneklem oluşturulur.

Hem kura usulü seçimde hem de sistematik seçimde seçilecek bir birimin belirlenen n hacimli örneklemde yer alması olasılıkları aynı (n / N) olmasına rağmen olası örneklemlerden birinin incelenen

örneklem olma olasılıkları farklıdır. Bu olasılıklar kura usulü (iadesiz) seçimde 1/ NnC olduğu halde,

sistematik seçimde örneklemi oluşturabilme şansına sahip kombinasyonların her biri için eşit 1 / k , diğerlerininkinde ise 0 (sıfır) dır.

Olasılıklı örneklemenin üç önemli üstünlüğü vardır:

Örneklemden elde edilen verilerden hesaplanan istatistikler ana kütle parametreleri hakkında genelleme yapmak üzere kullanılabilir.

Örneklem hatasının büyüklüğü hakkında bilgi elde edilebilir.

Keyfi seçimde söz konusu olabilecek yanlılık (sistematik hata) giderilmiş olur.

Olasılıklı örneklem oluşturma prensibi esas olmak üzere, uygulamada ya birim seçim işlemini kolaylaştırmak ya da ana kütleyi temsil edecek daha iyi bir örneklemin oluşturulmasını sağlamak üzere çeşitli tesadüfi örnekleme yöntemleri geliştirilmiştir. Bu yöntemler izleyen başlıklar altında açıklanmıştır.

152

Bu örnekleme yöntemlerinden herhangi birini bir örnekleme uygulaması için seçerken yöntemlerin etkinlik ve doğruluk kriterlerine göre değerlendirilmesi gerekir. Örnekleme yöntemlerinin etkinlikleri farklılık gösterir. Etkinlik, örnekleme maliyeti ve doğruluğu arasındaki dengeyi yansıtan bir kavramdır. Doğruluk ise ölçülecek özelliğin belirsizliği ile ilgili düzeyi gösterir. Doğruluk ile örnekleme hataları arasında ters ilişki varken maliyetle aynı yönde ilişki vardır. Yani daha çok maliyet daha doğru bilgi, daha doğru bilgi daha az hatalı karar, tahmin demektir.

ÖRNEKLEME SÜRECİNİN AŞAMALARI Genel olarak örnekleme süreci 5 aşamadan oluşmaktadır. Birbirleriyle ve bir araştırma sürecinin diğer aşamalarıyla sıkı sıkıya ilişki içinde olan bu aşamalar Şekil 6.1 de gösterilmiştir.

Şekil 6.1: Örnekleme sürecinin aşamaları.

Kaynak: N. K. Malhotra, Marketing Research An Applied Orientation, Prentice Hall International Inc. , 1996

Ana kütlenin Tanımlanması Bir araştırma sürecinde araştırmacının ilk yapacağı işlerden biri olan örnekleme süreci ana kütlenin tanımlanmasıyla başlar. Ana kütle, araştırmacı tarafından belirlenen bir tanıma uyan ve hakkında bilgilerin üretileceği, çıkarımların yapılacağı birimlerden oluşan topluluktur. Ana kütlenin ayrıntılı bir biçimde tanımlanmasıyla, hangi birimlerin araştırma kapsamına alınacağı, hangilerinin alınmayacağı belirlenmiş olur. Bu, başka bir ifadeyle örneklemde yer alabilecek ve yer alamayacak birimlerin belirlenmesi anlamına gelir.

Ana kütlenin tanımlanması genel olarak örnekleme birimi, gözlem birimi, yer ve zaman kavramlarıyla yapılmaktadır. Araştırmanın konusunu tanımlayan değişkenlerle ilgili verilerin derlendiği birimlere gözlem birimi adı verilir. Örnekleme birimi ise örnekleme seçilecek birimlerdir.

Örnek 6.5:

Araştırmanın konusu: Bir il merkezindeki kamuya ait ilköğretim okullarında öğrenim gören öğrencilere uygulanan sağlık taraması sonucu ağız ve diş sağlığı sorunu tespit edilmiş 1200 öğrencinin ailelerinin ağız ve diş sağlığı konusundaki bilgilerinin araştırılması.

Ana kütle: Yapılan tarama sonucu ağız ve diş sağlığı sorunu olan 1200 öğrencinin ailelerinin oluşturduğu topluluktur. Sonlu bir ana kütledir. Ana kütle hacmi N=1200 ailedir.

Örnekleme Birimi: Ağız ve diş sağlığı sorunu tespit edilen her bir öğrencinin ailesi.

Gözlem Birimi: Ailede çocuğun ağız ve diş sağlığı konularında eğitimini verecek olan anne ve/veya baba.

Yer: Belirlenen il ve kamu ilköğretim okulları.

Zaman: Araştırmanın yapıldığı tarih.

153

Örnekten anlaşılabileceği gibi önce örnekleme aile seçilecek sonra ailedeki ağız ve diş sağlığı konusunda bilgisi ölçülecek anne ve/veya babadan veri derlenecektir.

Bu örnekte olduğu gibi her araştırmada gözlem birimi ve örnekleme birimi ayrımı olmayabilir. Örnekleme seçilen ve veri derlenen birim aynı olabilir. Bu durumda sadece birim kavramı kullanılır.

Örnek 6.6:

Araştırmanın Konusu: 2010-2011 öğretim yılında Anadolu Üniversitesi Sağlık Programında öğrenim gören öğrencilerin kitap okuma alışkanlığını araştırmak.

Ana kütle: 2010-2011 öğretim yılında Sağlık Programına kayıtlı olan öğrenciler topluluğudur.

Birim: Sağlık Programında kayıtlı olan her bir öğrenci hem gözlem birimi hem de örnekleme birimidir. Çünkü örnekleme seçilecek birim de, veri derlenecek birim de öğrencilerdir.

Örnekleme ve gözlem birimi aynı olduğu zaman araştırmalarda sadece birim kavramı kullanılmaktadır.

Gözlem birimi ve örnekleme birimi ayrımına gidilmesinin nedeni, gözlem birimleri ile ilgili bir çerçevenin temin edilmesinin veya hazırlanmasının zor, maliyetli ve çok zaman alacak olmasıdır. Örnekleme birimi birden çok gözlem birimini kapsayacak şekilde de tanımlanabilir. Örnek 2 üzerinden açıklamak gerekirse, beslenme programıyla ilgili öğrencinin hem annesinin hem de babasının görüşlerine başvurulabilir. Bu durumda gözlem birimi öğrencinin hem annesi hem de babası olur.

Ana kütlenin tanımlanması yukarıda yapılan açıklamalarda olduğu gibi her zaman kolay olmayabilir. Örnek 5 üzerinden açıklama yapılacak olursa ana kütle tanımı yapılırken örneğin, yabancı uyruklu olup araştırmanın yapılacağı ile merkezinde ikamet eden ve söz konusu okullarda çocuğunu okutan aileler, araştırmada ifade edilen aile tanımı içine alınacak mı yoksa alınmayacak mı karar verilmelidir. Gözlem birimi olarak ailedeki anne mi? Baba mı? olacak, yoksa çocuğunu eğitimi için görevli annenin yardımcısı olarak çalışan kişi mi seçilecektir?

Bir araştırmanın ana kütlesini tanımlarken açıklık, kesinlik, amaca uygunluk ve örnekleme uygulaması için güçlük yaratmaması gibi ilkelerin de göz önünde bulundurulması gerekir.

Çerçevenin Belirlenmesi Çerçeve sonlu bir ana kütlenin bütün birimlerinin kayıtlı olduğu bir listedir. Nüfus kayıtları, seçmen kütükleri, hasta kayıt listeleri, hastane personel listeleri, telefon rehberi, öğrenci kayıt listeleri, su, elektrik abonelik listeleri vb. çerçeve olarak kullanılabilecek araçlardır.

Sonsuz ana kütleler için yapılacak örnekleme uygulamalarında çerçeve söz konusu olmaz.

Örneklemeye başlamadan önce öncelikle amaca uygun bir çerçevenin var olup olmadığı, yoksa sağlanıp sağalanamayacağı araştırılmalıdır. Araştırmaya uygun bir çerçevenin var olması durumunda bu çerçevenin güncel olup olmadığının araştırılması da önemli bir konudur. Çerçeve olmadan ne tam sayım ne de örneklemenin yapılabileceği unutulmamalıdır.

Bir çerçeve yoksa yeni bir çerçevenin hazırlanması problemiyle karşılaşılır. Yeni bir çerçevenin hazırlanmasında çerçeve maliyeti ve kapsam hatası özellikle göz önünde tutulmalıdır. Bazen tanımlanan ana kütlenin bazı birimleri çerçevede yer almadığı gibi tanımlanan ana kütlenin dışında kalması gereken birimler de çerçevede yer alabilir ya da bazı birimler tekrar tekrar çerçevede yer alabilir. Bu özellikteki çerçevelerde kapsam hatası işlenmiş olur. Güncel çerçeve bulmak zordur. Kapsam hatası işlenen mevcut çerçevelerin de güncelleştirilmesi uzun zaman alır ve maliyetli olur. Bu nedenlerle uygulamada güncel olmayan bir çerçevenin kabul edilebilirliği onun güncelleştirilmesinin maliyeti ve sağladığı zaman

154

tasarrufu ile ilişkilendirilerek belirlenir. Çerçeve, kabul edilebilir bir çerçeve hatası düzeyinde ana kütle birimlerinin çok büyük kısmını kapsamalıdır. Şüphesiz amaç ana kütle tanımında yer alan bütün birimleri kapsayan bir çerçeve elde etmek veya oluşturmaktır.

Örnekleme Yönteminin Seçimi Örneklemeye girecek birimlerin belirlenmesine imkân veren yöntemlere örnekleme yöntemleri denir. Bu yöntemler örneklem için birim seçiminde uygulanan usulün keyfi ya da teadüfi oluşuna göre iki sınıfa ayrılır. Birinci durumda olasılıklı olmayan örnekleme, ikinci durumdaysa olasılıklı örnekleme söz konusu olur. Örnekleme yönteminin seçimiyle ilgili en önemli karar bir örnekleme planında ne tür bir örnekleme yöntemi uygulanacağıdır. Bu konu örnekleme yöntemleri başlığı altında ayrıntılı bir biçimde ele alınacaktır.

Örneklem Hacminin Belirlenmesi Örneklem hacmi, örnekleme girecek birimlerin sayısını gösterir ve “n” simgesiyle gösterilir. Bu sayının ne olacağına ilişkin kesin yanıt vermek mümkün değildir. Ancak, bu sorunun yanıtlanabilmesi için aşağıda açıklanan faktörlere ilişkin yapılacak nitel değerlendirmelere ve örnekleme dağılımı başlığı altında açıklanacak olan nicel yöntemlere başvurulur.

Malhotra N. K. (1996). Marketing Research An Applied Orientation, Prentice Hall International Inc. Örneklem Hacminin Belirlenmesine Etki Eden Faktörler

Ana kütlenin homojenliği: Ele alınan ana kütlenin ilgilenilen değişken bakımından homojen ya da heterojen olması örneklem hacminin belirlenmesine etki eder. Birimlerin özellikler bakımından farklılığı arttıkça ana kütleyi temsil edebilecek bir örneklem oluşturabilmek için örneklem hacminin de giderek büyümesi gerekir.

Araştırmada verilecek kararın önemi: Önemli kararlar için olabildiğince çok veriye ve ayrıntılı bilgiye gereksinim vardır. Bu gibi durumlar büyük hacimli bir örneklem üzerinde araştırma yapmayı gerekli kılar. Ancak örneklem hacmi arttıkça maliyet ve gereksinim duyulan zaman ve nitelikli personel sayısı da artar. Burada dikkat edilmesi gereken husus, bir yandan küçük hacimli örneklem oluşturmak suretiyle, bu örneklemin ana kütleyi temsil etmesi bakımından yetersiz kalmasını engellemek, diğer taraftan da gereksiz yere çok büyük hacimli örneklem seçerek zaman ve maliyet yönünden kayba uğramamak için uygun büyüklükte bir örneklem hacmini belirlemektir.

Araştırmanın yapısı: Araştırmanın doğası da örneklem hacmi üzerinde etkilidir. Uygulamada genellikle nitel araştırmalarda küçük hacimli örneklemlerde; nicel araştırmalarda ise örneğin betimsel araştırmalarda daha büyük hacimli örneklemlerle çalışılır. Ayrıca araştırmalarda değişken sayısı arttıkça örneklem hacminin artırılması bilginin niteliği açısından ihtiyaç olur. Örneğin çok değişkenli analiz teknikleri ve yöntemlerinin kullanıldığı araştırmalarda örneklem hacmi büyük olmalıdır.

Örneklemin Seçimi Örnekleme sürecinin bu son aşamasında örnekleme girecek birimler keyfi veya tesadüfi seçim uygulamalarıyla seçilirler. Gerekli veriler seçilen birimlerden gözlem veya ölçüm yoluyla derlenir. Bu aşamada yapılacak işlemleri; uygun özellikte büro ve çalışma ortamı ile nitelikli işgörenlerin temini gibi sayabiliriz. Önceki aşamalarda yapılan yanlış uygulamalar ve dikkatsizlikler bu aşamada büyük sorunların yaşanmasına neden olur.

155

ÖRNEKLEME YÖNTEMLERİ Örnekleme yöntemleri ana kütleden örnekleme birim seçiminde uygulanan usule göre Şekil 6.2 de gösterildiği gibi olasılıklı olmayan örnekleme yöntemleri ve olasılıklı örnekleme yöntemleri gibi iki sınıfa ayrılır.

Şekil 6.2: Örnekleme Yöntemleri.

Malhotra N. K. (1996). Marketing Research An Applied Orientation, Prentice Hall International Inc.

Olasılıklı Olmayan Örnekleme Yöntemleri Araştırmayı planlayan ya da örnekleme uygulamasını yapan kişi ya da grubun istekleri ve değer yargıları örnekleme seçilecek birimlerin ve örneklem hacminin belirlenmesinde etkili oluyorsa yapılan örnekleme olasılıklı olmayan örneklemedir.

Bu örnekleme yöntemleri, örneklem için birim seçiminde keyfi seçim usulünün uygulandığı örnekleme yöntemleridir. Örneklem oluşturulurken, tanımlanan ana kütleyi oluşturan birimler arasında fark gözetilir ve bütün birimlere, bilinen bir olasılıkla seçilme şansı verilmezse yapılan seçim keyfi seçimdir. Keyfi seçimle oluşturulan olasılıklı olmayan örneklemenin ana kütleyi temsil etmeyeceği anlamına gelmez. Ancak olasılık kuramının uygulanamayacağı anlamına gelir. Olasılıklı olmayan örnekleme uygulandığında örneklemin ana kütleyi temsil etme olasılığı bilinemez. Oysa bu bilgi araştırmacılar için çok önemlidir.

Temsili örneklem oluşturma ve uygulama kolaylığı sağlaması amacıyla çeşitli olasılıklı olmayan örnekleme yöntemleri geliştirilmiştir. Uygulamada sıkça kullanılan ve aşağıda incelenen bu yöntemlerin ortak özellikleri:

Örneklem için birim seçimi keyfidir.

Örneklem hacmi keyfi olarak belirlenir.

Örneklemden hesaplanan istatistikler ana kütle parametreleri hakkında genelleme amacıyla kullanılamaz.

Kolayda Örnekleme Burada amaç, araştırma konusu ile ilgili ve kolayca ulaşılabilir olan birimlerden bir örneklemin oluşturulmasıdır. Araştırma konusu ile ilgili olan ve doğru yerde, doğru zamanda bulunan birimler arasından keyfi olarak birimler seçiliyorsa yapılan örneklemeye kolayda örnekleme denir. Kolayda örnekleme gönüllülük esasına göre katılan birimlerden oluşur.

156

Örnek 6.7:

Daha önce ele alınan 4 numaralı örnek üzerinden kolayda örnekleme uygulamasını açıklayalım. 4 nolu örnekte sözü edilen sağlık ocağından poliklinik hizmeti almak için herhangi bir günde gelenler arasından keyfi olarak belirlenen ve araştırmanın amacıyla ilgili mülakata katılmayı kabul eden kişilere verilen hizmetten memnuniyetleri ile ilgili görüşleri soruluyor ve görüşleri alınıyorsa mülakata katılanların oluşturduğu topluluk kolayda örnekleme uygulamasıyla oluşturulmuş bir örneklemdir. Bu örnekte doğru yer ilgili sağlık ocağıdır. Doğru zaman ise, poliklinik hizmetlerinin verildiği bir günün ilgili zaman dilimidir.

Uygun görülen sokaktan, uygun görülen zamanda gelip geçen bireylerle görüşme yapılması ya da bir konferansa katılan belirli sayıdaki katılımcıdan araştırma konusuyla ilgili görüşlerinin alınması, birer kolayda örnekleme uygulamasıdır. Bu örnekleme uygulamasında örnekleme birimlerine kolayca ulaşılabilir, ilgilenilen değişkenlerle ilgili veriler kolayca derlenebilir ve birimlerle işbirliği sağlanabilir.

En kısa zamanda ve en az maliyetle bilgi üretilmesine ihtiyaç duyulduğu durumlarda kolayda örnekleme yöntemi bir seçenektir.

Bu örnekleme yönteminde en önemli sorun, seçilen örneklemin seçildiği ana kütleyi ne kadar temsil edebildiğidir. Kolayda örnekleme uygulaması ile oluşturulan örneklem, birim seçimindeki yanlılık nedeniyle tanımlanan bir ana kütleyi temsil etmeyebilir. Betimleyici ve ilişki araştırıcı araştırmalarda kolayda örnekleme uygun bir yöntem değildir. Kolayda örnekleme odak (focus) gruplar, soru kâğıtlarının (anket formlarının) ön testi veya pilot çalışmalar için kullanılabilir. Yargısal Örnekleme Bu örnekleme de bir tür kolayda örneklemedir. Yargısal örnekleme, örneklemin araştırmacının ya da örneklemecinin kişisel arzu, düşünce ve deneyimlerine göre seçilmiş olduğu örneklemedir.

Bu yöntemin kolayda örneklemeden farkı örnekleme birim seçimi için araştırmacının uzman fikirleriyle belirlediği ölçütler kullanması ve bu ölçütlerin temsili bir örneklem oluşturacak ölçütler olduğuna inanıyor olmasıdır.

Örnek 6.8:

A Üniversitesinin sorunlarını araştırmak amacıyla bu üniversitenin üst düzey yöneticilerinden seçim yapılması yargısal örnekleme için bir örnektir. Çünkü üniversitenin üst düzey yöneticileri üniversite sorunlarını en iyi bilen kişilerdir. Bu düşünceyle seçimin bu kişiler arasından yapılması temsili bir örneklem oluşturabilir.

Kolayda örneklemede olduğu gibi yargısal örneklemede de örnekleme birimlerine kolayca ulaşılabilir ve verilerin çok hızlı biçimde derlenmesi mümkün olur. Yargısal örnekleme pazarlama araştırmasında, kamuoyu araştırmalarında ve biyolojik araştırmalarda yaygın olarak kullanılmaktadır.

Eğer ana kütleyi oluşturan birimler araştırmaya konu olan değişkenler bakımından homojen ise kolayda ve yargısal örnekleme uygulamaları temsili örneklem oluşturma imkanı verir. Bu örnekleme uygulamalarının maliyeti, uzman çalıştırılacağı için kolayda örneklemeye göre daha yüksektir. Kota Örneklemesi Örneklem için birim seçiminin keyfi olarak yapıldığı yöntemlerden biri de kota örneklemesidir. Tanımlanan sonlu ana kütle heterojen özelliklere sahip birimlerden oluşuyorsa olasılıklı olmayan örnekleme yöntemleri grubundan kota örneklemesi temsili örneklem oluşturma amacıyla tercih edilmelidir. Bu yöntemin başarıyla uygulanabilmesi için;

1. Tanımlanan sonlu ana kütleyle ilgili bir çerçevenin var olması,

2. İlgili ana kütlenin homojen veya heterojen özelliğe sahip olup olmadığının sorgulanabilmesi için ana kütle hakkında öncül bilgilere sahip olunması,

157

3. Ana kütlenin heterojen olduğuna karar verilmiş ise hangi kritere göre heterojen birimlerden oluşan bu ana kütlenin homojen birimlerden oluşacak tabakalara ayırmada kullanılacak kriterin belirlenmesi,

4. tabaka hacimlerinin bilinmesi gerekir.

Kota örneklemesi sürecindeki adımlar aşağıdaki gibidir:

Ana kütle hacmi N ve tabaka hacimleri Nh , (Tabaka sayısı h = 1, 2, …) belirlenir.

Örneklem hacmi n keyfi olarak belirlenir.

Her tabakanın, ana kütle hacmi içindeki oranı Nh / N belirlenir.

Her tabakada keyfi seçimle nh = (Nh / N) . n sayıda birim seçilir ve bu seçilen birimler örneklemi oluşturur.

Örnek 6.9:

Bir hastane yönetimi 2012 yılının ilk iki ayında kardiyoloji ve dahiliye poliklinik hizmetlerinden memnun olan kişilerin oranını belirlemek amacıyla bir araştırma planlıyor. Araştırmayı gerçekleştirecek grup kota örneklemesi uygulamayı düşünmektedir. Çözüm 6.9:

Poliklinik türü tabakalama türü kriterine göre hastalara ilişkin bilgiler:

N = 600 Ana kütle hacmi.

NK = 400 Kardiyoloji polikiliniğine iki ayda başvuran hasta sayısı.

ND = 200 Dahiliye polikiliniğine iki ayda başvuran hasta sayısı.

n = 100 Örneklem hacmi.

Kardiyoloji polikliniğinden son iki ay içinde hizmet alan hastalar tabakasından (NK) seçilecek hasta sayısı:

nK = (NK / N) . n = (400 /600) . 100 = 66.67 67 kişi

Benzer hesaplama dahiliye polikliniğinden son iki ay içinde hizmet alan hastalar için de yapılırsa:

nK = 33 kişi bulunur.

Kardiyoloji ve dahiliye polikiliniklerinden hizmet alan hasta tabakalarından sırasıyla 67 ve 33 hasta keyfi seçimle seçilmek suretiyle n = 67 + 33 = 100 hacimli örneklem seçilmiş olur. Bu örneklemdeki birimler üzerinden gerekli veriler derlenir ve istenilen bilgi üretilir.

Kota örneklemesi kolayda ve yargısal örneklemeye göre daha temsili örneklem oluşturma çalışmasıdır. Ancak bu örnekleme yönteminin uygulanması sonucu oluşturulan örneklemin ana kütleyi temsil etmesinin garantisi yoktur. Çünkü kota örneklemesi uygulamasında belirlenen tabakalardaki birimlerin homojen özellikli birimlerden oluştuğunun, tabaka oranlarının doğruluğunun garantisi yoktur. Ayrıca tabakalardan birimler keyfi olarak seçildiği için yanlılık söz konusu olabilir. Bu örnekleme uygulaması sonucu oluşturulan örneklemden elde edilen bilgiler ana kütle bilgisi için genelleme amacıyla kullanılamaz.

158

Kartopu Örneklemesi Kartopu örneklemesi, özellikle bir çerçevenin mevcut olmaması ya da oluşturulmasının imkansız olduğu durumlarda faydalı bir örneklemedir. Bu yöntemde örnekleme süreci tanımlanan ana kütlede yer alan bir bireyin genellikle tesadüfi olarak seçilmesiyle başlar. Belirlenen bu birey örnekleme giren birinci birimdir. Bu bireyden aynı ana kütle tanımında yer alan tanıdığı bir bireyin olup olmadığı öğrenilir. Varsa bu bireye ulaşılır. Böylece örneklemde yer alacak ikinci birime ulaşılmış olur. Benzer şekilde bu süreç, referanslarla keyfi olarak belirlenen hacimde örnekleme ulaşılıncaya kadar sürdürülür.

Örnek 6.10:

Bir bölgedeki uyuşturucu madde kullananlar üzerinde bir araştırma yapılacak olsun. Bu bölgede uyuşturucu kullananlarla ilgili bir liste bulmak mümkün değildir. Bölgede bir ya da iki uyuşturucu kullanan tanımlanabilirse kartopu örnekleme süreci başlar. Örnekleme seçilmiş olan bu kişi ya da kişilere uyuşturucu kullanan arkadaşları ya da tanıdıklarının olup olmadığı sorulur. Varsa adresleri öğrenilir, bu kişilere ulaşılır ve bunlar da bu örnekleme seçilirler. Bu süreç keyfi olarak belirlenen n hacimli örneklem oluşturulncaya kadar sürdürülür.

Çete üyeleri ve bir ülkeye yasal olamayan yollarla girmiş kişilerle ilgili araştırmalarda, bir kentte internet üzerinden alışveriş yapanlarla ilgili araştırmalarda kartopu örneklemesi uygulanır. Bu örnekleme, endüstriyel ürün alan ve satanlar hakkında yapılacak araştırmalarda da kullanılabilir. Bu yöntem uygulandığında temsili örneklem oluşturmak olanaklıdır. Kartopu örneklemesinin maliyeti ve örneklem değişkenliği düşüktür.

Tüm olasılıklı olmayan örnekleme yöntemlerinde örnekleme girecek birimlerin seçiminin keyfi olması tek yönlü hatalara neden olur. Bu tür hatalardan kaçınmak için izleyen kısımlarda ele alınacak olan olasılıklı örnekleme yöntemleri tercih edilmelidir.

Kolayda örnekleme mi yargısal örnekleme mi daha temsili örneklem oluşturur?

Ana kütlenin birimleri ilgilenilen özellik bakımından heterojen ise hangi olasılıklı olmayan örnekleme yöntemi kullanılır? Açıklayınız.

Olasılıklı Örnekleme Yöntemleri Olasılıklı örnekleme, ilgilenilen ana kütledeki her örnekleme birimine hesaplanabilir ve sıfırdan farklı bir olasılıkla seçilme imkânı veren örneklemedir.

Tesadüfi örnekleme yöntemleri olarak da alınan bu örnekleme yöntemleri örnekleme planlarında yaygın olarak uygulanır. Bu tür örneklemede örnekleme girecek birimlerin seçimi tesadüfi olarak yapılır. Tesadüfi seçim ana kütleden örnekleme girecek birimleri seçerken herhangi bir ayrıcalığın uygulanmadığı seçimdir. Basit Tesadüfi Örnekleme Sonlu Ana kütlelerde Basit Tesadüfi Örnekleme

Serper Ö. (2004). Uygulamalı İstatistik 2, 5. Baskı, Bursa; Trochim W. M. (2001). Research Methods Knowledge Base, Cornell University

Örnekleme planlarında uygulanan en temel olasılıklı örnekleme basit tesadüfi örneklemedir. Basit tesadüfi örnekleme hacmi N olan sonlu bir ana kütleden birbirinden farklı ve n hacimli oluşturulabilecek

NnC sayıdaki olası örneklemlerin her birine incelenecek örneklem olması bakımından eşit şans tanıyan

159

örnekleme yöntemidir. Bu tanımda belirtilen özellikleri taşıyan NnC sayıdaki mümkün örneklemlerin her

birine basit tesadüfi örneklem denir. Bu örnekleme yöntemi ana kütledeki bütün birimlere hacmi n olarak

belirlenen örnekleme girmeleri bakımından bilinen ve birbirine eşit

seçilme olasılığı sağlar.

Örnek 6.11:

Kan tahlili yapılan 4 hastanın ölçülen LDL kolesterol düzeyi incelenecektir. Ölçülen sonuçlar 60, 40, 50 ve 70 mg/dl dir. Sonlu ana kütleyi oluşturan bu 4 hastayı, A, B, C ve D olarak simgelendirelim ve 2 hastadan oluşan

4

2

! 4!; 6

!( )! 2!(4 2)!N

n

N

n N nC C

tane mümkün farklı örneklem aşağıdaki gibi oluşturulabilir.

Tablo 6.1: 4 birimlik ana kütleden iadesiz seçimle oluşturulabilecek 2 hacimli mümkün örneklemler.

BİRİMLER MÜMKÜN

ÖRNEKLEMLER

A A, B

B A, C

C A, D

D B, C

B, D

C, D

Bu mümkün farklı 6 tesadüfi örneklemden birinin incelenen örneklem olması olasılığı

olur. Burada herhangi bir birimin yapılacak bir tesadüfi seçimde seçilmesi olasılığı

; herhangi bir birimin n = 2 hacimlik örneklemde yer alması olasılığı da

olacaktır.

Örnekleme uygulamalarında mümkün örneklemler oluşturulmaz; oluşturulabileceği varsayılır. Sadece bu mümkün örneklemlerin birisi oluşturulur ve araştırma bu örneklem üzerinden yapılır. Sonlu bir ana kütleden iadesiz seçimle n hacimli bir tesadüfi örneklem oluşturmak için aşağıdaki adımlar izlenir:

Güncel çerçeve temin edilir ya da hazırlanır.

Örneklem hacmi belirlenir.

Çerçevede yer alan n sayıdaki birime tanımlayıcı numara ya da işaret verilir.

Ana kütledeki her birime eşit

seçilme şansı vermek suretiyle örnekleme girecek birinci birim

tesadüfi seçim araçları kullanılarak belirlenir.

Geriye kalan (N – 1) birimin her birine yine eşit şans vermek suretiyle ikinci birim seçilir.

Bu birim seçim süreci n hacimli örneklem seçilinceye kadar tekrarlanır.

160

Açıklanan seçim sürecinde her çekilişte seçilen birim incelendikten sonra ana kütleye iade edilmediği için bu seçim sürecine iadesiz tesadüfi seçim süreci adı verilir. Eğer basit tesadüfi örnekleme planlarında önceki çekilişte seçilen birim incelendikten sonra ana kütleye iade ediliyorsa, başka bir ifadeyle birimler tekrar tekrar seçilme şansına sahipse bu seçim sürecine iadeli tesadüfi seçim süreci adı verilir. Bu seçim sürecinde ana kütle hacmi çekilişten çekilişe değişmez. Sonlu bir ana kütleden iadeli seçimle bir tesadüfi örneklem seçilirse sonsuz ana kütleden basit tesadüfi örnekleme yapılıyormuş gibi bir anlam ifade eder.

Bu çekiliş sürecinde ana kütledeki her birimin yapılacak çekilişlerin her birinde birbirine eşittir.

olan

seçilme olasılığına sahiptir ve birbirini izleyen çekilişler bağımsızdır. Sonlu ana kütlelerde ana kütle hacminin büyük ya da küçük oluşu iadeli ya da iadesiz seçimler için önemli farklılıklar gösterir. Ana

kütle hacmi büyük, örnekleme oranı

küçük olduğu zaman iadeli ve iadesiz örneklemler benzer

özellikler gösterirler. Çünkü iadeli çekiliş uygulandığında önceki çekilişlerde seçilmiş olan bir birimin yeniden örnekleme seçilmiş olma olasılığı çok küçüktür. Ancak ana kütle hacmi küçükse iadeli ve iadesiz tesadüfi seçimlerle oluşturulan aynı hacimli örneklemler için hesaplanan örneklem istatistikleri ile ana kütle parametreleri karşılaştırılırsa iadesiz basit tesadüfi seçimle oluşturulan örneklem iadeli olana göre daha az hatayla tahminleme imkanı sağlar. Bu özellik nedeniyle de iadesiz tesadüfi seçim uygulamada genellikle başvurulan yöntem olmaktadır.

İlgilenilen özellik bakımından ana kütlenin homojen olması durumunda basit tesadüfi örnekleme tercih edilmesi gereken bir yöntemdir. Örnekleme planlarında basit tesadüfi örnekleme yöntemlerinin tercihlerini etkileyen önemli sınırlayıcılar vardır. Bunlardan birincisi güncel bir çerçeve oluşturma ya da hazırlama güçlüğüdür. İkincisi ana kütlenin birimleri geniş bir coğrafi alana yayılmışsa basit tesadüfi örnekleme uygulaması çok zaman alır ve veri derleme maliyeti giderek artar. Üçüncüsü ana kütle homojen değilse basit tesadüfi örneklem sonuçlarının başarısı diğer olasılıklı örnekleme yöntemleri sonuçlarının başarısından düşüktür.

Sonsuz Ana kütlelerde Basit Tesadüfi Örnekleme Daha önce açıklandığı gibi sonsuz ana kütle “aynı koşullar altında işleyen bir sürecin sonuçlarının oluşturduğu topluluktur” şeklinde tanımlanmıştı ve bir sağlık ocağında verilen poliklinik hizmeti süreci örnek verilmişti. Bu sağlık ocağında verilen poliklinik hizmeti sonucu olan her bir hizmet (hizmet verilen her bir hasta) bir birim, poliklinik hizmeti süreci devam ettikçe hizmet alan yeni hastalar ana kütleye dahil olduğu için bu sürecin sonuçları olan poliklinik hizmeti alan hastalar sonsuz ana kütleyi oluşturur. Örnekten de anlaşılabileceği gibi sonsuz ana kütledeki bir başka ifadeyle aynı koşullar altında işleyen bir sürecin bütün sonuçları listelenemez. Bütün birimlerle ilgili bir çerçeve hazırlanamaz, bunun yerine bu birimlerin ilgilenilen bir değişken X için bir teorik olasılık dağılımı tarif edilebilir. Tarif edilen bu teorik olasılık dağılımına sonsuz ana kütle adı verilir.

Sonsuz ana kütlelerde basit tesadüfi örnekleme ile ilgili bilgiler için Neter J., Wasserman W., Whitmore G. A. (1993). Applied Statistics, (Boston: Fourth Edition, Allyn and Bacon) adlı kitaptan yararlanmıştır.

Sonsuz ana kütlenin birimlerinin X değişkeni için ölçümlenen değerleri (gözlem değerleri) bu birimler için X değişkeninin gerçekleşen değerleridir. Eğer sonsuz ana kütlenin birimleri kararlı (aynı koşullar altında meydana gelen) bir sürecin sonuçları, birimleri ise n sayıdaki birimin ilgilenilen X değişkeni bakımından aldığı x1 x2, … , xn değerleri (gözlem değerleri), X1, X2, … Xn tesadüfi değişkenlerinin birer gerçekleşmesi olduğu düşünülür. Buna göre, bir süreç tarafından türetilen birbirinden bağımsız ve benzer olasılık dağılımına sahip n sayıdaki X1, X2, … Xn tesadüfi değişkenlerinin oluşturduğu topluluğa sonsuz ana kütleden seçilmiş basit tesadüfi örneklem denir. Bu tesadüfi değişkenlerin teorik olasılık dağılımına sonsuz ana kütle adı verilir.

161

Örnek 6.12:

Bir hastanede yataklı tedavi gören hastaların hastanede yatma sürelerinin ortalamasını hesaplamak amaçlanıyor. Yataklı tedavi gören hastaların hastanede kalış süresi kararlı bir süreçtir. Aynı koşullar altında işleyen bir süreçtir. Yataklı tedavi gören, görmekte olan ve görecek olan her bir hasta sonsuz ana kütlenin birimleridir. İncelenen değişken yataklı tedavi gören ve görecek olan hastaların yatma süreleridir. Bu hastalardan tesadüfi olarak seçilecek n tanesinin hastanedeki yatma süreleri x1 x2, … , xn

sırasıyla X1, X2, … Xn tesadüfi değişkenlerinin gerçekleşmeleridir. Buna göre hastaların hastanede kalış sürecinden tesadüfi olarak seçilen n tane hastanın ölçülen kalış sürelerini kullanılarak hesaplanan olasılık dağılımı X1, X2, … Xn teorik olasılık dağılımını ifade eden sonsuz ana kütleden seçilmiş basit tesadüfi örneklemi oluşturduğu söylenebilir. Tabakalı Örnekleme Tanımlanan ana kütlenin birimleri araştırmaya konu olan değişkenler bakımından heterojen ise, önemli farklılıklar gösteriyorsa tabakalı örnekleme temsili örneklem oluşturabilmek için tercih edilmelidir. Tabakalı örnekleme ana kütle birimlerinin tabakalara ayrıldığı ve her tabakadan tesadüfi seçimle örneklemin oluşturulduğu örneklemedir.

Tabakalı örnekleme, üzerinde araştırma yapılacak ana kütle ilgilenilen değişkenler yönünden heterojen olduğunda örnekleme dağılımının varyansın olabildiğince küçük olmasını sağlayan bir örnekleme yöntemidir.

Tabakalı örnekleme 4 aşamalı bir süreçtir.

Tabakalama kriterinin belirlenmesi.

Tabakalı örnekleme uygulaması yapacak araştırmacı önce incelenecek değişkenler açısından önemli farklılıklar gösteren N hacimli ana kütlenin birimlerini homojen birimlerden oluşacak tabakalara ayırmada kullanılacak kriter belirler. Burada önemli olan belirlenecek kriterin tabakalar içindeki birimleri olabildiğince homojen, tabakalar arasında ise birimlerin heterojen olmasını sağlayacak kriter olmasıdır. Aynı zamanda bu kriterin uygulama ve ölçme kolaylığı da sağlamak suretiyle maliyet artırmadan tahminleme hatasını azaltması gerekir. Tabakalama kriteri ilgilenilen parametre ile sıkı sıkıya ilişki içindedir. Belirlenen tabakalama kriterinin uygunluğu örneklem değişkenliğinin etkinliği üzerinde olumlu yönde etkilidir. Bu nedenle asimetrik bölünmeye sahip ana kütlelerde tabakalı örnekleme uygulamasını tercih etmek bir zorunluluktur. Tabakalama amacıyla kullanılabilecek kriterlere demografik özellik (yaş, cinsiyet…vb), tüketici türü, sosyoekonomik sınıf, meslek grubu, firma büyüklüğü, coğrafi yerleşim yeri, fakülte türü vb. örnek olarak gösterilebilir.

Tabakaların oluşturulması.

Belirlenen tabakalama kriteri itibariyle N hacimli bir ana kütle daha homojen, L sayıda ve hacimleri N1 , N2 , …. , NL olan tabakalara ayrılır. Bu aşamada önemli olan tanımlanan ana kütledeki her bir birimin yalnız bir tabakaya ait olması ve hiçbir birimin açıkta kalmamasının sağlanmasıdır. Başka bir ifadeyle

1 21

L

L hh

N N N N N

olmalıdır. Tabaka sayısı L arttıkça tabakaların homojenliği de artacağından tabaka varyansları giderek küçülecek ve buna bağlı olarak da tahminlerin güvenilirliği giderek artacaktır. Tabaka sayısının artması maliyetleri yükseltir ve uygulama zorluğu yaratır. Bu nedenlerle tabaka sayısı L belirlenirken tabaka sayısının yaratacağı maliyet, uygulama zorluğu ve elde edilecek tahminlerin güvenilirliği birlikte değerlendirilmelidir. Deneyimler ve uygulamalar tabaka sayısının 6 ’dan fazla olmamasını önermektedir.

Tabakalardan birimlerin seçilmesi.

162

Her tabakadan basit tesadüfi seçimle sırasıyla n1 , n2 , … , nL hacimli alt örneklemler oluşturulur. Alt örneklem hacimleri toplamı örneklem hacmine eşittir. Başka bir ifadeyle n örneklem hacmini göstermek üzere

1 2 1

L

L hh

n n n n n

olmalıdır.

Verilerin derlenmesi.

Oluşturulan alt örneklem birimleri üzerinden veriler derlenir, bu veriler kullanılarak araştırma amaçları için gerekli olan istatistikler hesaplanır ve bu istatstiklere dayanarak istatistiksel çıkarımlar yapılır.

Daha önce de vurgulandığı gibi tabakalar içi homojenlik arttıkça tabakalar içi varyanslar küçülür. Bu da ilgili ana kütle parametre tahminleyicisinin varyansını küçültür. Bu sonuca göre heterojen ana kütlelerde aynı örneklem hacmi için basit tesadüfi örnekleme uygulamasının örnekleme hatası, tabakalı örneklemenin örnekleme hatasından büyük olur. Heterojen ana kütleler için tabakalı örnekleme yöntemi daha etkindir.

Tabakalı örneklemenin diğer bir üstünlüğü ilgilenilen ana kütlenin yanısıra her tabaka içinde ayrı bilgi elde etme olanağı sağlamasıdır. Uygulamada ana kütleye göre tabakalar için çerçeve oluşturmak daha kolay olabilir. Ancak sağladığı kolaylıklara rağmen tabakalı örneklemenin bazı güçlükleri de vardır. Örneğin tabaka hacimleri ve bunların toplamı olan ana kütle hacminin bilinmesi gerekir. Bu her zaman mümkün olamamaktadır. Ayrıca ilgilenilen ana kütlenin homojenliğinin sorgulanması için de bu ana kütle hakkında pek çok öncül bilgiye gereksinim vardır. Bu öncül bilgilerin yetersizliği ve geçersizliği oluşturulacak örneklemin temsil niteliğini olumsuz yönde etkiler. Tabakalı örnekleme sürecinin adımlarıyla ilgili yukarıdaki kuramsal bilgileri örnek araştırma üzerinde uygulayalım.

Örnek 6.13: Araştırmanın Amacı: Türkiye’de guatr hastalığının genel ve coğrafi bölgeler itibariyle dağılımını araştırmak.

Ana kütle: Bu araştırma için Türkiye’nin N1, N2, N3 ve N4 olmak üzere dört coğrafi bölgeye ayrıldığını düşünelim. Araştırma için bu coğrafi bölgelerdeki sağlık kuruluşlarına son bir hafta içerisinde başvuran hastalardan oluşan topluluğun ana kütle olarak tanımlandığını düşünelim. Tanımlanan bu ana kütle sonlu bir ana kütledir, varsayalım ki hacmi N= 10000 hastadır.

Örnekleme Yöntemi: Ana kütle, sonlu ana kütle olduğu için araştırmacı tam sayım da uygulayabilir, örneklemeye de başvurabilir. Araştırmacı örnekleme yapmayı gerekli kılan nedenleri değerlendirmiş ve örnekleme yapmaya karar vermiştir. Araştırmacının gözlemlerine ve öncül bilgilerine göre bölgeler itibariyle guatr hasta dağılımı farklılık göstermektedir. Çünkü araştırmacının öncül bilgilere göre bazı coğrafi bölgelerde guatr hasta sayısı düşükken bazı bölgelerde yüksek olduğu kanaati bulunmaktadır. Başka bir ifadeyle guatr hasta sayısı değişkeni bakımından coğrafi bölgeler heterojen özelliğe sahiptir. Bu değerlendirmeye göre araştırmacı tabakalı örnekleme yöntemini örnekleme amacıyla tercih etmiş ve uygulama adımlarını aşağıdaki gibi izlemiştir:

Heterojen birimlerden oluşan ana kütlenin coğrafi bölge kriterine göre guatr hasta sayısı bakımından homojen tabakalara ayrılabileceği düşünülmüştür.

Tabakalar (coğrafi bölgeler) N1, N2, N3 ve N4 şeklinde isimlendirilmiş olsun. Elde edilen bilgilere göre tabaka hacimleri N1 = 4000, N2 = 3000 , N3 = 2000 ve N4 = 1000 birimden oluştuğu düşünülsün.

163

n = 1000 olarak belirlenen örneklem hacmi tabaka hacimlerinin (Nh) ana kütle hacmi N=10000 içindeki paylarıyla orantılı olarak aşağıdaki şekilde dağıtılır:

nh = (

) . n

n1 = (

) . n = (4000 / 10000) . 1000 = 400

Burada h tabaka numarasıdır. Örneğimizde h = 1, 2, 3, 4 değerlerini alır.

Benzer şekilde h = 2, 3, 4 için hesaplama yapılırsa n2 = 300, n3 = 200, n4 = 100 bulunur.

Her tabakadan (coğrafi bölgeden) yukarıda hesaplanan sayıda tesadüfi seçimle birim (hasta) seçilir,

(n1 = 400 )+ (n2 = 300) +( n3 = 200) + (n4 = 100) = n = 1000 hasta örneklemi oluşturur.

Seçilen birimler (hastalar) üzerinden guatr hastası olup olmadığı değişkeni itibariyle birinci elden veri derleme yöntemiyle veriler derlenip çözümleme yapılır ve gerekli bilgiler üretilebilir. Sistematik Örnekleme Örneklem için birim seçimi aşağıda ele alınan bir sistematiğe uygun olarak yapıldığı örnekleme sürecine sistematik örnekleme adı verilir. Bu yöntemin sınırlayıcıları ilgili ana kütleye ilişkin bir çerçevenin var olup olmaması veya birimlerin doğal bir sıraya sahip olup olmamasıdır.

Bir sistematik örneklem oluşturmak için aşağıdaki adımlar izlenir:

Ana kütledeki birimler 1’den N’ye kadar numaralandırılır.

Araştırma için yeterli olacak örneklem hacmi n belirlenir.

k =

büyütme faktörü hesaplanır. Bu oran örnekleme aralığını gösterir.

1 ile k arasında bir tamsayı tesadüfi olarak seçilir. Bu sayı a ile gösterilirse, a örnekleme girecek birinci birimin sıra numarası olur.

a‘ıncı birimi k aralıklarıyla izleyen a + k’ıncı , a + 2k’ıncı , … , a + (n - 1)k’ıncı sıra nolu birimler örnekleme seçilir ve n hacimli sistematik örneklem oluşturulur.

Oluşturulan örneklemden elde edilen veriler kullanılarak gerekli istatistikler hesaplanır.

Bütün bu adımları daha açık bir şekilde bir örnek üzerinden gösterelim:

Örneğin,

Ana kütledeki birim sayısı N = 1000 sağlık personeli çalışanı olsun. Bu personelin ünvan türü, soyadı sırası itibariyle listelenip 1’den N’ye kadar numaralandırılır.

Diyelim ki n = 100 birimlik bir örneklem seçileceği tasarlandı. k = 1000 / 100 = 10, hesaplandı. Bunun anlamı, her 10’uncu birim örnekleme alınacak demektir.

1, 2, … , 10 arasından tesadüfi olarak bir sayı seçildi. Seçilen sayı 4 olsun. A = 4. Sıradaki sağlık personeli çalışanı örnekleme girecek birinci birimdir.

Sıra nolu sağlık personeli çalışanından başlayarak her 10. ( 4, 14, 24, 34,…) sıra nolu sağlık personeli çalışanı örnekleme alınarak n = 100 birimlik tesadüfi örneklem oluşturulmuş olur.

164

Tablo 6.2: Örnek problem için sistematik örnekleme uygulama tablosu.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . 1000

Sistematik örneklemede uygulanacak sistematiğin belirlenmesi her zaman yukarıdaki hesaplamalarda

olduğu gibi yapılmayabilir. Ana kütleyi oluşturan birimlere sıra numarası verilemiyorsa veya numaralandırma çok zaman alıyor ve masraflı oluyorsa ve fakat sonlu veya sonsuz ana kütle birimleri rastgele dizilişlere veya gelişlere sahip ise sistematik örnekleme uygulanabilir. Örneğin bir üniversitenin 20.000 öğrencisi üzerinde yapılacak bir araştırma için haftanın seçilen bir öğretim günü saat 8:30 da başlayıp her yarım saat aralıklarla üniversite kampüs kapısından giren öğrencinin örnekleme alınması uygulaması da bir sistematik seçimdir. Bir süpermarketten ayrılan her k’ıncı müşteriyle görüşme yapılarak yürütülen araştırmalar da bu örneklemin uygulandığı araştırmalardır. Sistematik örnekleme ana kütledeki her birimin örneklemde yer alma olasılığı bakımından basit tesadüfi örneklemeye benzer ve bu olasılık n / N dir. Ancak mümkün örneklemlerden herhangi birinin incelenen örneklem olması olasılığı

basit tesadüfi örneklemede 1/ NnC olduğu halde sistematik örneklemede belirlenen sistematiğe göre

örneklem olma şansına sahip kombinasyonların her biri için eşit 1 / k diğerlerininki için 0’dır.

Sistematik örnekleme uygulaması sonucu oluşturulacak örneklemin temsil niteliği ana kütle birimlerinin sıralandırılması ve k aralığı ile ilişkilidir. Bu sıralandırma araştırmaya konu olan değişkenlerle ilişkilendirilerek yapılırsa sistematik örnekleme basit tesadüfi örneklemeye göre daha temsili örneklem oluşturma imkanı verir. Örneğin firmaların düşük ciroya sahip olandan büyük ciroya sahip olana doğru sıralanması, otellerin yıldız sayıları bakımından büyükten küçüğe doğru sıralanması, öğrencilerin küçük boyludan büyük boyluya doğru sıralandırılması durumunda sistematik örnekleme her gruptan birimin örnekleme girmesini temin edebilir. Ancak örnekleme aralığının uygun şekilde belirlenememesi halinde sistematik örneklemenin basit tesadüfi örneklemeye olan yukarıda açıklanan üstünlüğü ortadan kalkar. Çünkü belirli özelliğe sahip birimlerin gereksiz oranda örnekleme girmesi söz konusu olabilir. Bu durum örneklemin temsil niteliğini olumsuz yönde etkiler.

Sistematik örnekleme önceki tesadüfi örnekleme yöntemlerine göre daha az maliyetli ve uygulaması kolaydır.

Çerçevenin doğal yapısında tekrarlamalar varsa sistematik örnekleme kullanılmamalıdır. Örneğin, veriler aylık olarak düzenlenmiş ve k = 12 alınmışsa her yılın aynı ayı örnekleme gireceğinden bu tür bir uygulama tek yönlü hatalara neden olabilir.

Tek Aşamalı ve Çok Aşamalı Küme Örneklemesi Tabakalı örneklemede olduğu gibi ana kütlenin birimleri küme adı verilen gruplara ayrılır. Bu gruplar genellikle doğal olarak vardır. Her küme bir örnekleme birimi olarak tanımlanır. Kümeler arasından tesadüfi olarak belirli sayıda küme seçilir ve seçilen kümelerdeki gözlem birimlerinin tamamı örneklemi oluşturur. Örneğin bir organize sanayi bölgesinde faaliyette bulunan işyerlerinde çalışan işgörenler hakkında bir araştırma planlandığında bu organize sanayi bölgesinde her bir işyerinde çalışan işgörenler bir küme olarak tanımlanabilir. Hanehalkı geliriyle ilgili bir araştırmada her mahalledeki hanehalkı topluluğu bir küme olarak tanımlanır. Örneklerden de anlaşılabileceği gibi kümeler genellikle bir coğrafi kritere göre tanımlanmaktadır.

Küme örneklemesi bir ve daha fazla kümeleme aşamaları ile de uygulanabilir. Bir kümeleme aşaması ile gözlem birimlerine ulaşılıyorsa tek aşamalı kümeleme; iki veya daha fazla kümeleme aşaması ile gözlem birimlerine ulaşılıyorsa çok aşamalı kümeleme adı verilir.

165

Bu örnekleme yöntemleri ana kütledeki birimlerin homojen, hacimlerinin çok büyük ve geniş bir coğrafi alana yayılmış olmaları ya da örnekleme girecek birimlere ilişkin bir çerçeve oluşturmanın mümkün olmadığı durumlarda tercih edilmesi gereken yöntemlerdir.

Tek aşamalı (küme) örneklemesi sürecinde aşağıdaki adımlar izlenir.

İlgilenilen ana kütledeki birimler genellikle coğrafi kritere göre kümelere ayrılır. Bu, birinci düzey kümelemedir. Kümeler doğal olarak bir mekânda var olan birimlerden oluşur. Küme sayısı “M” simgesiyle gösterilir. Üniversiteler, sağlık ocakları, araştırma ve uygulama hastaneleri, kamu kurumları, ortaöğretim okulları birer kümedir. Çünkü örneğin sağlık ocakları ele alalım. Bu kuruluşlarda çalışan işgörenler kümeleri oluşturur.

Kümeler arasından tesadüfi seçimle “m” sayıda küme seçilir.

Seçilen kümelerdeki birimlerin toplamı tek aşamalı küme hacmini gösterir.

Tanımlanan birinci aşama kümelerine, benzer kritere göre ikinci, üçüncü ve n’inci aşama kümelere ayrılır ve son kümeleme aşamasındaki kümeler arasından tesadüfi seçimle m sayılı küme seçilir ve seçilen kümelerdeki birimlerden örneklem oluşturulursa yapılan örneklemeye çok aşamalı küme örneklemesi denir.

Tek ve çok aşamalı küme örneklemesi ile ilgili kuramsal açıklamaları bir araştırma örneği üzerinden açıklayalım. Örnek 6.14:

Araştırmanın Amacı: Türkiye’deki tıp fakülteleri hastanelerinde görev yapan uzman hekimlerin tam gün yasası uygulaması ile ilgili görüşlerini araştırmak.

Ana kütle: Bu araştırmanın ana kütlesi Türkiye’de tıp fakülteleri hastanelerinde uzman hekimlerin oluşturduğu topluluktur. Sonlu ve büyük hacimli bir ana kütledir. Ana kütle hacminin büyük olması, bütün uzman hekimlere ulaşmanın güçlükleri gibi nedenlerle araştırma için örneklemeye başvurulması düşünülmüştür.

Örnekleme Yöntemi: Uzman hekimler Türkiye’de pek çok ilde kurulmuş üniversitelerin bünyesinde açılmış olan tıp fakültelerinde görev yapmaktadırlar. Yani coğrafi olarak ülkenin büyük bir kısmına yayılmış durumdadırlar. Araştırmacı, tıp fakültelerinde görev yapan bu uzman hekimlerin tam gün yasasını değerlendirmeleri bakımından homojen olduğu öncül bilgisine sahiptir. Bu değerlendirmelere göre araştırma için uygun örnekleme yöntemi olarak önce tek aşamalı, sonra iki aşamalı örnekleme yöntemi seçilmiştir.

Tek aşamalı örnekleme uygulamasının adımları:

Uzman hekimler görev yaptıkları üniversite türü kriterine göre kümelere ayrılmıştır. Kümeler örneğin Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Hacettepe Üniversitesi Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi, İnönü Üniversitesi Tıp Fakültesi, Gazi Üniversitesi Tıp Fakültesi, İstanbul Üniversitesi Çapa Tıp Fakültesi vb. uzman hekimleri topluluğu şeklinde tanımlanabilir. Bu tanıma göre küme sayısı M=6 ‘dır.

M=6 tıp fakülteleri arasından m=2 fakülte tesadüfi olarak seçilir. Varsayalım ki seçilen 2 fakülte Hacettepe Üniversitesi Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi olsun. Seçilen birinci fakültedeki uzman hekimlerin tamamı N1=250 ve ikinci fakültedeki uzman hekimlerin tamamı N4=300 ise örneklem hacmi n=N1+N4=250+300=550 uzman hekim olur.

İki aşamalı örnekleme uygulaması benimsendiğinde birinci aşamada seçilen Hacettepe Üniversitesi Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi uzman hekimleri anabilimdalı türü kriterine göre tekrar kümelere ayrılırsa ikinci aşama kümeleme yapılmış olur. İkinci aşamada her iki üniversitenin oluşturulan kümeleri (anabilimdalları) arasından tesadüfi seçimle m2 sayıda anabilimdalı seçilir ve bu anabilim dallarındaki bütün uzman hekimler örneklemi oluşturur. Bu uzman hekimlerin tam gün yasası ile ilgili görüşlerine ilişkin veriler derlenir.

Tek ve çok aşamalı örnekleme uygulamasında tanımlanan kümeler örnekleme birimi olarak benimsendiğinden basit tesadüfi örneklemede olduğu gibi ana kütle ile ilgili bir çerçeveye gerek yoktur.

166

Sadece seçilen kümelerle ilgili çerçeveye gereksinim vardır. Bu durum örnekleme uygulamasında zaman, maliyet tasarrufu yanında uygulama kolaylığı sağlamaktadır.

Eğer birimler kümeler arasında homojen değilse seçilen kümelerdeki birimlerden oluşacak örneklemin ana kütleyii temsil niteliği tartışılır, çünkü ana kütleyi oluşturan her türden birim örnekleme girmemiş olur.

Tek aşamalı ve çok aşamalı örnekleme yöntemleri örnekleme maliyetini azaltarak onun etkinliğini artırırken tabakalı örnekleme doğruluğu artırmaktadır. Küme örneklemesinde kümelerdeki birimlerin mümkün oldukça heterojen olması, tabakalı örneklemede tanımlanan tabakaların ise mümkün oldukça homojen olması istenir.

Olasılıklı örnekleme ile olasılıklı olmayan örneklem yöntemleri arasındaki temel fark nedir, açıklayınız.

ÖRNEKLEME DAĞILIMI Daha önce de değinildiği gibi tanımlanan ana kütleye ilişkin sayısal karakteristiklere parametre adı verilir ve parametre genel olarak θ (theta) simgesiyle gösterilir. Tam sayım yapılamadığı durumlarda araştırmacılar istatistiksel tahminleme ve karar verme (istatistiksel çıkarım) problemleri ile karşılaşırlar. Bu çıkarımlar örneklem istatistiklerine dayanır. Örneklem istatistiklerinin genel gösterimi daha önce ifade

edildiği gibi ˆ simgesiyle yapılır. Örneklem istatistiği bilindiği gibi tesadüfi olarak seçilen n hacimli örneklemden elde edilen x1, x2, … ,xn gözlem değerlerinin kullanılmasıyla hesaplanan karakteristiklerin genel adıdır.

Örnekleme sürecinde tesadüfi olarak seçilen n hacimli bir örneklem için hesaplanan istatistikler sadece ait oldukları örneklem için bilgi niteliğindedirler. Çünkü incelenen n hacimli bir örneklem aynı hacimli ve fakat farklı birimlerden oluşabilecek mümkün örneklemlerden sadece birisidir ve mümkün örneklemlerin her biri için hesaplanacak istatistikler birbirinden farklı ve ana kütle parametre değerlerine

eşit ( ˆ ) , büyük ( ˆ ) veya küçük ( ˆ ) olabilir. Bu nedenle örneklem istatistiklerinden

yararlanarak ana kütle parametreleri hakkında tahminleme ve karar verme sürecinde tesadüfi olarak seçilen n hacimli bir örneklemin hesaplanan test istatistiğinden değil; o istatistiğin mümkün örneklemlerde alacağı değerlerin dağılımından ve bu dağılımın özelliklerinden yararlanılır.

N hacimli sonlu bir ana kütleden iadesiz seçimle tesadüfi olarak seçilebilecek n hacimli N

nC

sayıdaki mümkün bütün örneklemlerin seçildiğini ve her örneklem için 1 2, , , ˆ ˆ ˆNnC

istatistiklerin

hesaplandığını varsayalım. Hesaplandığını varsaydığımız bu istatistiklerin dağılımına örnekleme dağılımı denir.

Tesadüfi örneklemden hesaplanan istatistiğinin olasılık dağılımına bu istatistiğin örnekleme dağılımı denir.

Eğer N hacimli ana kütleden n hacimli örneklemler iadeli seçimle oluşturulursa mümkün örneklem sayısı ve hesaplanacak istatistik sayısı Nn olacaktır.

Uygulamada, n hacimli bir tek örneklem seçilir ve bu örneklem için tahminlenecek veya karar verilecek parametre hakkında bilgi üreten istatistik hesaplanır. n hacimli mümkün örneklemler seçilmez, örneklem istatistikleri hesaplanmaz ve bu istatistiğin dağılımı oluşturulmaz. Mümkün örneklemler seçilmiş gibi düşünülerek bu istatistiğin varsayımsal dağılımından yararlanmak suretiyle ana kütle parametreleri hakkında çıkarımlar yapılabilir. Bu durum, örneklem istatistiğinin aynı hacimli örneklemden örnekleme farklı değerler alan tesadüfi değişken olduğu esasına dayanır. Bir ana kütleden örneklem seçilmeden önce örneklem gözlem değerleri x1 , x2 , … , xn tesadüfi değişkenlerdir ve bu gözlem değerlerinden hesaplanan istatistikleri de bir tesadüfi değişkendir. Yapılan açıklama bağlamında

167

örnekleme dağılımı bir tesadüfi değişken olan örneklem istatistiğinin olasılık dağılımı şeklinde yapılabilir.

Çeşitli amaçlar için örnekleme karar verildiği zaman dikkatlerin en çok odaklandığı parametreler ana kütle aritmetik ortalaması (µ) ve ana kütle oranı (π) olmaktadır. Bu nedenle bu ünitenin izleyen kısımlarında bu parametreler hakkında bilgi üreten örneklem istatistiklerinin sırasıyla örneklem aritmetik

ortalaması ve örneklem oranı p ‘nin örnekleme dağılımları ve özellikleri incelenecektir.

Ortalamanın ( X Örnekleme Dağılımı

Bir örneklem istatistiği olan örneklem aritmetik ortalaması ( X ) tesadüfi bir değişkendir. X tesadüfi değişkeninin olasılık dağılımına ortalamanın örnekleme dağılımı adı verilir. Bir başka anlatımla

tanımlanan ana kütleden n hacimli bir tesadüfi örneklem değil de aynı hacimli N

nC (veya Nn) sayıdaki

mümkün tesadüfi örneklemlerin seçildiğini ve her mümkün örneklem için X hesaplandığını varsaydığımızda iX dan oluşan bir frekans dağılımı elde edilebilir. Bu dağılıma ortalamanın

örnekleme dağılımı adı verilir. Bir örnek üzerinde X nın örnekleme dağılımını oluşturalım. Örnek 6.14:

Kan tahlili yapılan 4 hastanın ölçülen LDL kolesterol düzeyi incelenecektir. Bu hastaların simgesel

isimleri ve kolesterol ölçüm değerleri aşağıda verilmiştir. Ana kütle ortalamasını hesaplayınız ve X nın örnekleme dağılımını oluşturunuz.

Hastalar (Birimler) LDL Kolesterol Değerleri

A 90

B 80

C 60

D 70

Toplam=300 Çözüm 6.15:

Ana kütle ortalaması µ, tam sayım yapıldığında, gözlem değerleri x1 , x2 , … , xN olarak gösterildiğinde ve yukarıdaki veriler kullanıldığında;

1 30075 mg/dl

4

N

ii

x

N

şeklinde hesaplanır. Hesaplama hatası yapılmamış ise, 75 mg/dl kesin, doğru olan ortalama kolesterol düzeyini gösterir.

Tam sayım yapılamadığı durumlarda açıktır ki, yukarıdaki kolesterol düzeyleri (xi değerleri) derlenememiş ve µ=75 mg/dl bilgisi hesaplanamamış olur. Bu durumda µ hakkında tahminleme ve karar verme (istatistiksel çıkarım) problemleriyle karşılaşılır. Bu türden problemlerin çözümlenebilmesi için µ

hakkında bilgi üreten örneklem istatistiği X nın örnekleme dağılımının özellikleriyle ilgili bilgilere gereksinim vardır.

168

ların örnekleme dağılımının oluşturulması için aşağıdaki adımlar izlenir.

N=4 birimlik ana kütleden iadeli veya iadesiz seçimle belirlenen n hacimli mümkün örneklemler seçilir. Örneğin n=2 için iadesiz seçimle oluşturulabilecek mümkün örneklem sayısı;

!

!( )!N

n

N

n N nC

4

2

4!6 adet

2!(4 2)!C

olup aşağıdaki tabloda verilmiştir.

Tablo 6.3: N=4 hacimli ana kütleden n=2 hacimli mümkün örneklemlerin larının örnekleme dağılımı.

Örneklem No Mümkün Örneklemler

Örneklem Gözlem Değerleri

1 A, B 90, 80 85

2 A, C 90, 60 75

3 A, D 90, 70 80

4 B, C 80, 60 70

5 B, D 80, 70 75

6 C, D 60, 70 65

450

lar serisinin dağılımına, nın örnekleme dağılımı adı verilir. Bu dağılımın ortalaması

simgesiyle gösterilir ve aşağıdaki gibi hesaplanır:

1 45075 mg/dl

6

N

n

ii

Nxn

CX

C

Görüldüğü gibi ana kütle ortalaması µ, nın örnekleme dağılımının ortalaması ya eşittir ve

75 mg/dlx

şeklinde yazılır. Tablo 6.3 teki lar frekans dağılımı olarak düzenlendiğinde n=2 hacimli farklı örneklem ortalamalarının olasılığı Tablo 6.4 teki gibi gösterilmiş olur.

169

Tablo 6.4: N=4 hacimli ana kütleden n=2 hacimli mümkün örneklemlerin larının frekans dağılımı.

ni Örneklem Ortalamalarının Elde Edilmesi Olasılıkları

65 1 1/6 = 0,167

70 1 1/6 = 0,167

75 2 2/6 = 0,333

80 1 1/6 = 0,167

85 1 1/6 = 0,166*

Toplam 6 1,000

*: Olasılıklar toplamını 1’e eşitlemek için düzeltme yapılmıştır.

Tablodaki bilgilere göre, örneğin =75 puan değerini elde etme olasılığı %33,3’tür bilgisi üretilebilir.

Örnekleme girecek birimlerin seçimi iadeli yapılmış olsaydı, N=4 birimden, n=2 birimlik Tablo 6.5

teki Nn = 42 = 16 farklı örneklem oluşurdu. 16 farklı örneklem için yukarıdaki işlemler yapılırsa ların örnekleme dağılımı oluşturulabilir. Bu durumda da

75 puanx

olduğu görülebilir.

Tablo 6.5: N=4 birimlik ana kütleden iadeli seçimle oluşturulabilecek mümkün örneklemler.

A B C D

A A, A A, B A, C A, D

B B, A B, B B, C B, D

C C, A C, B C, C C, D

D D, A D, B D, C D, D

Özetle;

Her örneklem hacmi için bir istatistiğe ilişkin örnekleme dağılımı olduğu düşünülür.

Örnekleme birim seçimi iadeli de yapılsa, iadesiz de yapılsa hesaplanan örneklem ortalamalarının dağılımı ana kütle ortalamasına eşit olur.

Ancak, hiçbir araştırmada istatistiksel çıkarsama amacıyla yukarıda açıkladığımız işlemler yapılmaz.

Bunun yerine, n hacimli tek bir örneklem seçilir, bunun X ortalaması hesaplanır ve örnekleme dağılımı

ile ilgili yukarıda açıklanan bilgilerden yararlanılarak µ hakkında çıkarım yapılır.

170

X ‘nın Dağılımının Özellikleri

X tesadüfi değişkeninin örnekleme dağılımının özellikleri, bu dağılımın ortalaması µ (ana kütle

ortalaması, X nın örnekleme dağılımının ortalaması x ya eşit olduğu için x yerine µ kullanılmıştır)

ve standart sapması x (standart hata) ile açıklanır. Standart hatanın karesi ise ortalamalar örnekleme

dağılımının varyansı olarak isimlendirilir ve 2x simgesi ile gösterilir.

X ‘nın Dağılımının Ortalaması

X nın örnekleme dağılımının ortalaması veya aynı anlama gelen, X nın beklenen değeri ( )E Xşeklinde gösterilirse;

( )E X

yazılabilir. Bu sonuca göre X nın örnekleme dağılımının ortalaması ile ilgili aşağıdaki değerlendirmeler yapılabilir;

Örneklem hacmi n arttıkça X nın örnekleme dağılımının ortalaması ana kütle ortalamasına yaklaşır.

Ana kütlenin dağılım şekli çarpık bir dağılım gösterse bile, örneklem hacmi arttıkça X nın dağılımı normal dağılıma yaklaşır.

Örneğin, kolesterol ölçümü yapılan hastalarlarla ilgili örnek ele alındığında ve tesadüfi olarak seçilen n=2 hacimli örneklemdeki birimler A ve D birimleri olduğunda örneklem ortalaması;

2

1 1 90 70X= 80 mg/dl

2 2

n

i ii i

x x

n

olarak hesaplanır ve µ nün tahmini ( ) 80 /E X µ mg dl şeklinde yazılabilir.

X ‘nın Dağılımının Standart Hatası

X nın standart sapması veya aynı anlama gelecek şekilde, X nın örnekleme dağılımının standart hatası

x simgesiyle gösterilir ve standart hata olarak da isimlendirilir.

Standart hata x ortalamanın örnekleme dağılımının değişkenliğini gösterir. Yani, mümkün örneklem

ortalamalarının ( la' r n)iX ı ana kütle ortalamasından farklarının ( hata)i µX ortalama ölçüsüdür.

Standart hatanın karesi 2( )x

ise X nın dağılımının varyansını ifade eder.

Ana kütle, sonsuz bir ana kütle ise basit tesadüfi örneklemede birim seçimi iadeli seçimle yapılıyorsa

örneklem hacmi n 30 birim veya örnekleme oranı n/N 0,05 ise x aşağıdaki eşitlik yardımıyla

hesaplanır.

x n

Bu eşitliklerden x nın özellikleri ile ilgili aşağıdaki değerlendirmeler yapılabilir.

Standart hata ana kütle standart sapması σ ya ve örneklem hacmi n’e bağlıdır. Bir başka ifadeyle

ana kütle değişkenliği σ büyük ise herhangi bir örneklem hacmi için x da büyük olur.

171

Örneklem hacmi arttıkça, örneklem istatistiğinden yararlanarak µ hakkında daha az hatalı, daha güvenilir bilgi üretmek mümkün olur.

Örneklem hacminin karekökü ile x arasında ters yönde ilişki vardır. Yani örneklem hacmini

artırdıkça x küçülür. Ancak örneklem hacmini artırarak x yı düşürmeye çalışmak

örnekleme başvurmayı gerekli kılan nedenlerden dolayı bazı güçlüklere yol açar. Örneğin n=100

birim iken X standart sapmasını yarıya indirebilmek için örneklem hacmi 4 kat artırılmalıdır.

Ana kütle standart sapması genellikle bilinmediğinden x hesaplanırken yerine onun yansız bir

taminleyicisi olan örneklem standart sapması s kullanılır. Bu durumda standart hata xs simgesiyle

gösterilir ve x

s

ns eşitliğiyle hesaplanır. Burada “s” hesaplanan örneklem standart sapma değeri

serinin değişkenlik ölçüsüdür. Ancak ana kütlenin standart sapması ( ) tahmini amacıyla kullanılacağı

zaman örneklem standart sapması hesaplanırken formülde payda da n yerine n-1 yazılarak hesaplanır.

Örneklem standart sapması,

2

1

( )n

ii

x Xs

n

Ana kütle standart sapması tahmini için hesaplanan örneklem standart sapması ise,

2

1

( )

1

n

ii

x Xs

n

şeklinde hesaplanır.

Eğer ilgilenilen ana kütle sonlu bir ana kütle ve örnekleme oranı n/N 0,05 ise standart hata

hesaplanırken 1

N n

N

şeklindeki bir çarpan, düzeltme faktörü olarak kullanılır ve standart hata

hesaplanması

x

.1

N n

Nn

veya

1x

s N n

Nns

eşitlikleriyle yapılır.

Basit tesadüfi örneklemede örneklem hacmi arttıkça X nın örnekleme dağılımı normal dağılıma yaklaşır. Bu sonuca, istatistikte önemli bir yeri olan aşağıdaki teorem yardımıyla ulaşılır: Merkezi Limit Teoremi

Ana kütlenin dağılım şekli ne olursa olsun, örneklem hacmi büyüdükçe, X nın örneklem dağılımı normal dağılıma yaklaşır. Bu dağılımın ortalaması µ, varyansı / n dir. Örneklem hacmi n için yeterli büyüklük,kesin olmamakla birlikte uygulamada n 30 birim olarak kabul edilmektedir.

172

Eğer X ortalaması µ ve varyansı olan normal dağılımlı bir ana kütleden seçilmiş n hacimlik basit

bir tesadüfi örneklemin ortalaması ise, ortalamalar örnekleme dağılımı, ortalaması µ ve varyansı / n olan bir normal dağılımdır.

X tesadüfi değişkeninin dağılımı normal olduğunda,

/i

i

Xnz

Eşitliğiyle standart değişkene dönüştürülür. Böylece, normal dağılımın özellikleri kullanılarak

örneklem aritmetik ortalamasından ana kütle aritmetik ortalaması hakkında bilgi üretmek kolaylaşır.

Normal dağılan bir ana kütleden, tesadüfi olarak seçilebilecek birbirinden farklı birimlik

mümkün bütün örneklemlerin seçildiğini, her örneklem için iX ları ve onların i

x

X

s standart

değerlerini hesaplandığını düşünelim. Değerler aralığı

x

X

s

olan istatistiğin dağılımı

( 1)n serbestlik derecesi (sd = n-1) ile t dağılımı adı verilen sürekli bir dağılım gösterir ve bu istatistik

x

Xt

s

şeklinde hesaplanır. t dağılımı ortalaması sıfır olan tek modlu ve simetrik bir dağılımdır. Dağılımın şekli standart normal

dağılıma benzer fakat değişkenliği daha büyüktür. Bu değişkenlik serbestlik derecesi ile ters orantılıdır.

Örneklem hacmi artarken, (sd = n-1) büyür, t değerinin hesaplanmasında xs nın kullanılması nedeniyle

ortaya çıkan değişkenlik küçülür ve t dağılımı standart normal dağılım (z dağılımına) yaklaşır. t örnekleme dağılımının özelliklerinden yararlanarak ana kütle ortalaması µ ile ilgili bilgilerin nasıl üretileceği de izleyen ünitede örneklerle açıklanacaktır.

Örnek 6.16:

Bir hastanede belirli bir hastalıktan şikayetçi olarak hastaneye yatan hastaların ortalama olarak kaç gün kaldıkları tahminlenmek isteniyor. Bu amaçla tesadüfi olarak n=100 hasta seçiliyor. Seçilen bu hastaların ortalama kalış süresi 5,4 gün ve standart sapması 2 gün olarak hesaplanmıştır. Bu hastanede daha önce yapılan araştırmalara göre hastaların ortalama kalış süresinin 6,4 gün olduğu bilinmektedir.

Bu bilgileri kullanarak;

X nın örnekleme dağılımının ortalaması nedir? Hesaplayınız.

İstenen tahminleme yapılırken işlenebilecek hata nedir? Hesaplayınız.

X nın standart z değerini hesaplayınız. Çözüm 16:

( ) 5,4 günE X

hasta olduğu için standart hata (ana kütle standart sapması bilinmediği için)

2 2

0,2 gün10100x

s

ns

173

hesaplanır. Hastaların ortalama kalış süresini yukarıdaki verilere göre tahminlerken işlenebilecek hata düzeyi 0,2 gündür bilgisi elde edilebilir.

5,4 6,45

0,2x

XZ

s

Örneklem Oranı p’nin Örnekleme Dağılımı Örnekleme planlarında ele alınan ana kütlenin araştırılmak istenen değişkenin düzeyleri (şıkları) iki, üç dört,…… sayıda olabilir. Uygulamalarda çoğunlukla ilgilenilen değişken iki düzeye sahip olmaktadır. Örneğin bir fabrikada üretilen ürünler, hatalı ya da hatasız ürün, bir fakültedeki öğrenciler, başarılı ya da başarısız öğrenci olmak üzere iki grupta toplanabilir. Bu iki sonuçtan birinde örneğin A sonucunda yer alan birimlerin oranıyla ilgilenilebilir. Bu durumda ana kütle oranı ana kütlenin birimleri içindeki ilgilenilen türden özelliğe sahip olanların oranı biçiminde tanımlanır.

Örnek 6.17:

Y sınıfındaki öğrencilerin genel başarı durumu aşağıda verilmiştir. Bu sınıfın başarılı öğrenci oranı nedir?

ÖĞRENCİ ADI BAŞARI DURUMU

A Başarılı

B Başarısız

C Başarılı

D Başarılı

Örnekte sınıftaki başarılı öğrenci oranı, ana kütle oranıdır ve П ile gösterilir. Bu ana kütledeki ilgilenilen türden özelliğe sahip (başarılı) birim (öğrenci) sayısı R ile gösterilirse, ana kütle oranı П,

Eşitliği ile hesaplanır. Burada R = 0, 1, 2, … , N değerlerini alabileceği için nin değer aralığı

olur. Sınıftaki başarısız öğrenci saısı (ilgilenilmeyen türden özelliğe sahip birim sayısı) N-R olduğu için, başarısız öğrenci oranı Q,

Olur.

Yukarıdaki örnekte başarılıöğrenci sayısı, R=3 olduğu için

=

Olarak bulunur. Bu sonuca göre sınıftaki öğrencilerin %75 i başarılıdır. Bu kesin bir sonuçtur.

Tam sayım yapılamadığı zaman R bilinemez ve hesaplanamaz. Örnekleme planlarında

parametresi hakkında bilgi, bu parametre hakkında bilgi reten örneklem istatistiklerinden yararlanılarak üretilebilir.

Hacmi n olan bir basit tesadüfi örneklemden, bu örneklemin seçildiği ana kütlenin parametresi hakkında bilgi üretebilmek için iki örneklem istatistiği söz konusudur. Birincisi, hacmi n olan bir basit tesadüfi örneklemdeki ilgilenilen türden özelliğe sahip olan birimlerin sayısıdır ve r ile gösterilir. İkincisi,

174

ilgilenilen türden özelliğe sahip olan örneklemdeki birimlerin oranıdır. Örneklem oranı p simgesiyle gösterilir ve

p =

eşitliği ile hesaplanır. Burada r =0, 1, 2, … , n değerlerini alabilir. r’nin değerlerine bağlı olarak p de aralığında bir değer alır. Örneklemi oluşturan birimler arasında ilgilenilen türden sonuca sahip olmayan birimlerin oranıysa q ile gösterilir. Bu sonuca sahip birimlerin sayısı n- r olduğu için,

olur.

Yukarıda verilen örnekte ele alınan N=4 birimlik bir ana kütleden basit tesadüfi örneklemeyle hacmi n=2 olan bir örneklem seçildiğinde ve örneklemdeki birimler öğrenci B ve C olduğunda başarılı öğrenci oranı,

olarak hesaplanmış olur.

Öte yandan, ana kütle oranına ilişkin varyans,

şeklinde ifade edilir. Varyansın karekökü de standart sapmayı verdiğinden,

π (1 π)

şeklinde yazılır.

örneklem varyansı ve standart sapması da benzer şekilde sırasıyla

2 (1 )s p p

ve

(1 )s p p

olarak gösterilir.

İki sonuçlu bir ana kütleden, mümkün bütün n hacimli basit tesadüfi örneklemlerin seçildiğini ve her örneklem için p oranının hesaplandığı varsayıldığında pi oranlarından oluşan bir dağılım elde edilir. Bir ana kütleden seçilebilecek aynı hacimli mümkün bütün örneklemler için hesaplanan örneklem oranlarının oluşturduğu dağılıma oranların örnekleme dağılımı adı verilir.

Örnekleme planlarında tanımlanan ana kütleden tesadüfi olarak n hacimli sadece tek bir örneklem oluşturulur ve bu örneklem için p oranı hesaplanır. Bu p oranı bir rasal değişkenin gerçekleşen bir değeridir. Buna göre P tesadüfi değişkeninin çekilmesi mümkün bütün n hacimli örneklemlerde aldığı değerlerin dağılımına “oranların örnekleme dağılımı” adı verilir.

Ortalama ve Varyans

Ana kütle oranı hakkında araştırılmak istenin bilgi n hacimli tek bir örneklem için hesaplanan p istatistiğine değil, bir tesadüfi değişken olan p istatistiğinin örnekleme dağılımının özelliklerinden yararlanılarak üretilir. Bu dağılımın özellikleri dağılımın aritmetik ortalaması ve varyansıyla belirlenebilir.

175

Sonsuz bir ana kütleden seçilen n hacimli basit tesadüfi örneklem için hesaplanan p oranının

örnekleme dağılımının aritmetik ortalaması µp ana kütle oranı ye eşittir. Bu durum örneklem oranı

p’nin ana kütle oranı nin yansız (sistematik hata içermeyen) tahminleyicisi olduğunu göserir. Bu sonuca göre, p’nin beklenen değeri

E(p) =

yazılır.

Sonsuz ana kütlelere ya da örnekleme oranı n/N 0,05 olan bütün sonlu ana kütlelere uygulanan basit

tesadüfi örnekleme planlarında örneklem oranı p nin dağılımının varyansı ve standart hatası da ile

gösterilir.

Oranlar örnekleme dağılımının statndart sapması;

Eğer ana kütle varyansı biliniyorsa,

π (1 π) p n

eşitlikleriyle, ana kütle varyansı bilinmiyorsa,

(1 ) p

p ps

n

eşitlikleriyle hesaplanır. Dağılım Şekli ve Merkezi Limit Teoremi

Oranların örnekleme dağılımının şekli eğer E(p) = < 0,5 ise sağa çarpık, E(p) = > 0,5 ise sola çarpık ve E(p) = = 0.5 ise simetrik bir dağılım gösterir. Kolaylıkla görülebileceği gibi, E(p) = nin değeri 0 ve 1 e yaklaşırken dağılımın çarpıklığı artar.

Merkezi limit teoremine göre bir örnekleme planında seçilen basit tesadüfi örneklemin hacmi n

büyürken örneklem oranı p’nin örnekleme dağılımı normal dağılıma yaklaşır. Uygulamada (n 5

ve [n (1- )] 5 koşullarını birlikte sağlayan örneklem büyüklüğü, yeterli örneklem büyüklüğü olarak

kabul edilir. Aynı teoreme göre tesadüfi örneklem hacmi birim olması ve ana kütle oranı nin 0 ya da 1 e yakın değerler almaması koşuluyla oranların örnekleme dağılımı normal dağılıma yaklaşır. Bu koşulları sağlayan oranların örnekleme dağılımıyla ilgili problemlerin çözümlerinde normal dağılımın özelliklerinden yararlanılır. Bu amaçla örneklem oranı p standartlaştırılmış Z değişkenine

Z =

şeklinde dönüştürülerek çeşitli olasılıklar hesaplanabilir ve istatistiksel çıkarımlar kolayca yapılır.

Örnekleme dağılımı kavramını açıklayınız.

Merkezi limit teoremi istatistiğe ne tür kolaylıklar getirmiştir, açıklayınız.

176

Örnek 6.18:

Bir hastaneye çeşitli hastalık şikâyetleri nedeniyle yılda 8000 kişi başvurmuştur. Hastane yönetimi ilgili yılda hastaneye başvuranlardan yataklı tedavi görenlerin oranları tahminlemek amacıyla 100 başvuru tesadüfi olarak seçiyor. Seçilen başvuruların 15 tanesinin yataklı tedavi gören hasta olduğu belirlenmiştir. Bu verileri kullanarak istenen tahminleme yapılırken işlenecek hata düzeyi nedir? Çözüm 6.18:

Bilindiği gibi, tahminleme yaparken işlenebilecek hata düzeyini belirleme imkânı veren istatistik standart hatadır. Bu;

(1 ) P

P Ps

n

eşitliği ile hesaplanır. Burada;

ve

0,15 . 0,85 0,127 0,032

100 100Ps

Bu bilgilere göre, söz konusu hastaneye başvuran hastaların içerisinde yataklı tedavi gören hasta oranını tahminlerken işlenebilecek hata düzeyi ortalama olarak SP = 0,032 gün olacaktır.

Örneklem Hacminin Belirlenmesinde Nicel Yöntemler Karşılanabilecek Maliyeti Esas Alan Yöntem: Örneklem hacmi n, araştırma bütçesine bağlı olarak,

n

eşitliği ile hesaplanır. Burada,

C = Araştırma bütçesini,

= Araştırmanın sabit maliyetini,

= Örnekleme birimi için değişken maliyeti gösterir.

Örnek 6.19:

Araştırma bütçesinin 2200 TL. ile sınırlı olduğu bir araştırmada, sabit maliyet 800 TL. ve örnekleme

seçilecek her örnekleme birimi için maliyet ise 5 TL. dır. Bu bütçeyle oluşturulabilecek örneklem hacmi

en fazla ne olabilir?

Çözüm 6.19:

n

280 birim

Örneklem hacmi en az 280 birim olmalıdır.

Kabul Edilebilir Hata Düzeyini Esas Alan Yöntem: Örneklem istatistiğinin dağılımının normal olduğu

varsayımı altında bu yöntemle örneklem hacminin belirlenmesi için aşağıdaki eşitlikten yararlanılır.

177

Kabul Edilebilir Hata Düzeyi ( ) X µ d Olduğunda;

Kabul Edilebilir Hata Düzeyi ( Olduğunda;

2

2

[ (1 )]zn

d

Bu eşitliklerde

= Örneklem hacmini

( )d X µ veya ( araştırmacının belirlediği kabul edilebilir değeri

= Belirlenen 1 güven düzeyinde standart normal dağılım tablo değerini

σ = Standart sapmayı

= Ana kütle oranını

gösterir.

Örneğin, kabul edilebilir hata düzeyi ( )d X µ esas alındığında örneklem hacminin

eşitliği ile hesaplanabilmesi için araştırmacının α anlamlılık düzeyini ve değerini belirlemesi ve ana

kütle varyansı hakkında bilgiye sahip olması gerekir. Ana kütle varyansı genellikle bilinmez. Bu

durumda, ile ilgili bilgi geçmiş yıllarda yapılmış olan aynı ya da benzer konudaki çalışmalardan elde

edilebileceği gibi, bir pilot çalışmadan ya da en büyük değerli gözlem değeri xenb ve en küçük değerli

gözlem değeri xenk biliniyorsa ve xi tesadüfi değişkeni normal dağılıyorsa, α=0,01 için

tahmincisi kullanılarak da hesaplanabilir.

Örnek 6.20:

Bir araştırmacı X ilinin merkeç ilçesinde ikamet eden ailelerin ortalama aylık mutfak harcama tutarını

tahminlemek istiyor. Ayrıca bu tahminlemede 0,05 anlamlılık düzeyinde 10 TL’lik bir yanılgı payı

amaçlıyor. Örneklem hacmi ne olmalıdır? Benzer amaçla bu il merkezinde yapılan araştırmalardan

ailelerin aylık mutfak giderleriyle ilgili standart sapmanın 150 TL olduğu öğrenilmiştir.

Çözüm 20:

d = 10 TL.

z = 1,96, α= 0,05

σ= 150 TL.

n

864.36 865 birim

en az 865 aile tesadüfi olarak seçilmelidir.

178

Özet

Ana kütle sonlu ana kütle ise gerekli bilgilerin üretilebilmesi için tam sayım yapılabilir veya örneklemeye başvurulur. Araştırma için gerekli zamana, ekonomik imkanlara ve araçlara sahip olunduğunda tam sayım yapılmalıdır. Çünkü tam sayım sonucu elde edilen verileri kullanarak hesaplanan bilgiler kesin bilgilerdir. Tanımlanan ana kütle sonsuz ana kütle ise, örnekleme zoruludur. Tam sayım uygulamasının imkansız, örneklemeye başvurmanın gerekli olduğu durumlarda örneklemeye başvurmak kaçınılmazdır.

Örneklemeye başvurulduğunda araştırmacı zaman ve ekonomik tasarruf sağlar. Ayrıca tam sayım yapmayı engelleyen diğer nedenlerin varlığında örnekleme araştırma yapmaya imkan verir.

Örnekleme planı beş aşamalı bir süreçtir. Bu aşamalarda araştırmacı araştırma yapacağı anakütleyi tanımlar. Bu ana kütle sonlu ana kütleolduğunda ana kütle ile ilgili güncel bir çerçeve hazırlar veya belirli bir kaynaktan nasıl temin edilebileceğini belirler. Daha sonra olasılıklı ve olasılıklı olmayan örnekleme yöntemlerinden hangisini temsili bir örneklem oluşturma amacıyla araştırmasında kullanacağına karar verir. Seçilecek örneklem hacminin ne olacağını belirler ve örnekleme uygulaması sonucu oluşturduğu örneklemdeki birimler üzerinden araştırmaya konu olan değişkenler itibariyle veriler derlenir.

Örneklemden derlenen veriler için araştırmada istenen bilgileri üreten istatistikler; örneklem aritmetik ortalaması, örneklem oranı vb. gibi istatistikler hesaplanır. Bu istatistikler ve bu istatistiklerle ilgili dağılımın özellikleri kullanılarak bu istatistiklerin bilgi ürettiği parametreler; ana kütle aritmetik ortalaması µ, ana kütle oranı π için gerekli çıkarım bilgileri üretilebilir.

179

Kendimizi Sınayalım

1. Bir örneklemin özelliklerine ilişkin değerlere ne ad verilir?

a. Örnek istatistiği

b. Ana kütle

c. Anlamlı fark

d. Örnekleme

e. Parametre

2. Bir ana kütleden rastgele seçilen birden fazla örneğin sonuçlarının birbirinden farklı olduğu gözlenmiştir.

Bu farklılığın nedeni aşağıdakilerden hangisidir?

a. Beklenen frekans

b. Yöntem farklılığı

c. Örnek değişkenliği

d. Örnek istatistiği

e. Parametre

3. İki sonuçlu bir ana kütleden, mümkün n hacimli basit tesadüfi örneklemlerin seildiğini ve her iki örneklem için p oranı hesaplandığı varsayımı altında, lerin dağılımına (i=1, 2, … , n) ne ad verilir?

a. Oranların örnekleme dağılımı

b. Örneklem istatistiği

c. Binom dağılımı

d. Normal dağılım

e. Ortalamaların örnekleme dağılımı

4. Aşağıdakilerden hangisi olasılıklı örnekleme yöntemlerinden biri değildir?

a. Tabakalı örnekleme

b. Basit tesadüfi örnekleme

c. Kartopu örneklemesi

d. Küme örneklemesi

e. Sistematik örnekleme

5. X tesadüfi değişkeni, ortalaması (µ) 50 ve standart sapması (σ) 10 olmak üzere normal dağılmıştır. Buna göre, hacmi n=100 olan

örneklemin ortalaması 55 X değerinin standart normal değeri (z) kaçtır?

a. 0,5

b. 1

c. 1,5

d. 2

e. 5

6. Örneklem oranının değer aralığı aşağıdakilerden hangisidir?

a.

b.

c.

d.

e.

7. Bir örneklemin gözlem değerleri için hesaplanan karakteristik değerlere ne ad verilir?

a. Ortalama

b. İstatistik

c. Frekans

d. Anlamlı fark

e. Parametre

8. Aşağıdakilerden hangisi, tam sayım yapmayı engelleyen nedenlerden biri değildir?

a. Maliyet

b. Ölçüm için birimlerin tahrip edilmesi olasılığı

c. Ana kütle hacminin küçük olması

d. Zaman

e. Ana kütle hacminin sonsuz sayıda olması

180

9. Tabaka hacimleri sırasıyla 50, 250 ve 200 birimden oluşan bir ana kütleden kota örneklemesiyle 50 birimlik örneklem oluşturulmak istenmektedir. Bu örneklem hacmi tabaka hacimlerinin ana kütle içindeki paylarıyla orantılı olarak dağıtılırsa üçüncü sıradaki tabakadan seçilecek birim sayısı kaç olmalıdır?

a. 4

b. 15

c. 20

d. 35

e. 40 10. Ana kütle hacmi küçük olduğunda, örnekleme seçilen bir birimin diğerlerinin seçilme şansını etkilememesi için aşağıdaki seçim yöntemlerinden hangisi kullanılır?

a. Tesadüfi

b. Kolayda

c. Kartopu ve sistematik birlikte

d .Keyfi ve sistematik birlikte

e. Keyfi


1. a Cevabınız yanlışsa “Tam Sayım ve Örnekleme” tanımlarını yeniden gözden geçiriniz.

2. c Cevabınız yanlışsa “Olasılıklı Örnekleme ve Örnekleme Dağılımı” konularını yeniden gözden geçiriniz.

3. a Cevabınız yanlışsa “Oranların Örnekleme Dağılımı” tanımını yeniden gözden geçiriniz.

4. c Cevabınız yanlışsa, “Olasılıklı ve Olasılıklı Olmayan Örnekleme” tanımlarını yeniden gözden geçiriniz.

5. e Cevabınız yanlışsa, “Ortalamanın Örnekleme Dağılımının özelliklerini” yeniden gözden geçiriniz.

6. a Cevabınız yanlışsa, “Oranların Örnekleme Dağılımının Özellikleri” ile ilgili bilgileri yeniden gözden geçiriniz.

7. b Cevabınız yanlışsa, “Örneklem ve Örneklemenin Amaçları” ile ilgili bilgileri yeniden gözden geçriniz.

8. c Cevabınız yanlışsa, “Örnekleme Başvurma Nedenlerini” yeniden gözden geçiriniz.

9. c Cevabınız yanlışsa, “Kota Örneklemesi uygulaması” ile ilgili açıklamaları yeniden gözden geçiriniz.

10. a Cevabınız yanlışsa, “Keyfi ve Tesadüfi Seçim” uygulamalarıyla ilgili açıklamaları yeniden gözden geçiriniz.

181


Sıra Sizde 1

Tam sayım yapılamaz. Çünkü hastaneye gelen hastalar ana kütleyi sonsuz ana kütledir.

Örnekleme giren birimlerin tesadüfi olarak seçilmesi ve örneklemin temsil örneklem olması durumunda örneklem istatistikleri ana kütle parametreleri için bilgi niteliğindedir.

Örneklemin temel amacı temsili örneklem oluşturmaktır.

Sıra Sizde 2

Tam sayım yapmayı imkansız kılan nedenler söz konusu olmadıkça ve kesin bilgi istediği sürece tam sayım yapılır.

Her ne kadar tam sayım için gerekli koşullar mümkün ise de örneklemeye başvurulur. Çünkü, öğrencilerin bazılarına ulaşmak imkansız olabilir, ulaşılsa bile bazıları bilgi vermeyebilir.

Sıra Sizde 3

Yargısal örnekleme daha temsili örneklem oluşturur. Çünkü, bu örnekleme uygulamasında örnekleme birim seçimini yapacak kişi incelenecek ana kütle ile ilgili temsili örneklem oluşturma bakımından öncül bilgilere sahiptir.

Kota örneklemesi seçilir.

Sıra Sizde 4 Temel fark, olasılıklı olmayan örnekleme

yöntemlerinde birim seçimi keyfi yapılırken bu örneklem uygulamaları ile oluşturulan örneklem için hesaplanan istatistiklerin ana kütle parametreleri hakkında genelleme yapmak amacıyla kullanılmamasıdır. Olasılıklı örnekleme uygulandığında birim seçimi tesadüfi yapılır ve örneklem istatistikleri parametreler hakkında genelleme amacıyla kullanılır.

Sıra Sizde 5

N sonlu bir ana kütleden tesadüfi olarak n hacimli bir örneklem değil de mümkün aynı hacimli bütün örneklemleri seçtiğimiz ve her örneklem için bir istatistik hesapladığımızda meydana gelen dağılıma örnekleme dağılımı denir.

Bu teorem herhangi bir örnekleme uygulamasında hesaplanan n hacimli bir örneklem için hesaplanan istatistiğin dağılım şekli ve özellikleri ile ilgili ispatlanmış bilgileri verdiği için istatistiksel çıkarımlar bu teoreme dayandırılmaktadır.


Fink, A. (1995). How To Sampling in Surveys, London: Sage Publication.

Gürsakal, N. (1997). Bilgisayar Uygulamalı İstatistik 1, Bursa: Marmara Kitabevi.

Malhotra, N. K. (1996). Marketing Research An Applied Orientation, New Jersey: Prentice Hall International.

Neter, J., Wasserman, W., Whitmore, G. A. (1993). Applied Statistics, Boston: Simon and Schuster.

Serper, Ö., Aytaç, M. (2000). Örnekleme, Bursa: Ezgi Kitabevi

Serper, Ö. (1986). Uygulamalı İstatistik 2, İstanbul: Filiz Kitabevi

Tryfos, P. (1996). Sampling Methods for Applied Research, New York: John Wiley and Sons Inc.

Trochim, W. M. (2001). Research Methods Knowledge Base, Cornell University.

Hirsch, W. Z. (1963). Introduction to Modern Statistics, New York: The Macmillan Company

182


İstatistiksel tahmin ve hipotez testi kavramlarını açıklayabilecek,

Bir hipotez testi problemini aşamalarıyla gerçekleştirebilecek,

Varyans analizi problemlerini çözümleyebilecek,

Ki-Kare analizini gerçekleştirebilecek


Anahtar Kavramlar

İstatistiksel tahmin

Güven aralığı

Hipotez testi

Varyans analizi

Ki-kare testi

I. ve II. Tip hata

Anlamlılık düzeyi

Serbestlik derecesi

İçindekiler

Giriş

İstatistiksel Tahmin

Hipotez Testleri

Tek-Yönlü Varyans Analizi

Ki-Kare 2 Testi

7

183

GİRİŞİstatistiksel tahmin ve örnekleme iç içe kavramlardır. Ana kütleyi oluşturan birimlerin sayısının çok fazla olması durumunda çeşitli nedenlerden dolayı birimlerin tamamına ulaşılamadığında örneklemeye başvurmanın gerekliliği önceki bölümde belirtilmişti. Örneklem istatistiklerine dayanarak ana kütle parametrelerine ilişkin çıkarsama yapma, örnekleme yaklaşımı olmakla birlikte bir tahmin işlemidir. İstatistiksel tahmin belirli bir ana kütleden tesadüfi olarak alınan örneklemden yararlanarak, ana kütlenin belirli bir parametresi ya da parametrelerinin değerinin araştırılması işlemidir. Dolayısıyla ana kütle parametreleri, örneklem istatistikleri yardımıyla tahmin edilmektedir. Tahmin işlemi istatistiğin çıkarsama işlevi ile ilgilidir.

İstatistiksel tahmin gibi örneklem istatistiklerinden yararlanarak ana kütle parametrelerine ilişkin hipotezlerin test edilmesi çıkarsama işlevinin bir başka konusudur. Hipotez testlerinde araştırmanın amacına göre kullanılacak uygun testin seçimi oldukça önemli bir konudur. Kullanılacak testin koşullarının sağlanıp sağlanmamasına göre testin seçimi önem kazanır. Buna göre testler parametrik ve parametrik olmayan biçiminde iki gruba ayrılır. Parametrik testler, bazı varsayımları gerektiren testlerdir ve incelenen değişkenin en az aralıklı ölçme düzeyinde ölçülmüş olmasını gerektirirler. Parametrik olmayan testler, iddialı varsayım ileri sürmezler ve genellikle sınıflayıcı ve sıralayıcı ölçme düzeyindeki verilere uygulanırlar. Bu ünitede açıklanan t-testi, z-testi ve varyans analizi parametrik testlerdir. Ki-Kare testi ise parametrik olmayan testlerdendir.

t-testi ve z-testi tek ve iki ana kütle aritmetik ortalamasına ilişkin testlerdir. İkiden çok ana kütleortalamasına ilişkin test ise varyans analizi olarak adlandırılmaktadır. Ki-Kare testi iki ya da daha fazla grubun sınıflayıcı veya sıralayıcı ölçme düzeyinde ölçülmüş değişken bakımından farklılığını araştıran bir testtir.

Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesinin önemli olduğu ilk ünitede belirtilmişti. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir.

Bu ünitede istatistiksel tahmin ve parametrik hipotez testleri konuları ele alınacaktır. Parametrik olmayan testlerden sadece Ki-Kare testine yer verilecektir.

İSTATİSTİKSEL TAHMİNBir ana kütle parametresinin değerinin örneklem istatistiğinden yararlanarak belirlenmeye çalışılması istatistiksel tahmindir. İstatistiksel tahminde “nokta tahmin” ve “aralık tahmini” olmak üzere iki tür tahmin söz konusudur.

Nokta (Tek Değer) TahminAna kütle parametresini çekilen örneklemden elde edilecek örneklem istatistiğinden hareketle tek bir değerle tahmin etmek nokta tahmin(tek değer tahmin) olarak adlandırılır. Genel gösterim olarak ana kütle

parametresi “ ”, örneklem istatistiği ise “T” simgeleri ile gösterilecektir. Örneğin; bir ana kütle aritmetik

İstatistiksel Tahmin ve Hipotez Testleri

184

ortalaması tahmin edilmek istendiğinde örneklem ortalaması x , ana kütle oranı tahmin edilmek

istendiğinde p , ya da ana kütle varyansı 2 tahmin edilmek istendiğinde örneklemden hesaplanan 2syardımıyla nokta tahmin işlemi gerçekleştirilir. Nokta tahmininde genel olarak ana kütle ortalaması, ana kütle oranı ya da bunlar arasındaki farklar için tahmin yapılır. Sözü edilen tahminlerde kullanılacak eşitlikler aşağıdaki gibi gösterilebilir.

1ˆ

n

ii

xX

n

ˆ

rpn

2

2 2 1

( )

1

n

ii

x Xs

n

2 2s s s

Nokta tahmin işleminin başarılı sayılabilmesi için nokta tahmininin belirli bazı özelliklere sahip olması gerekir. Bu özellikler tahminleri değerlendirmede kullanılan ölçütler olarak da nitelendirilmektedir. Nokta tahmininin “sapmasızlık”, “tutarlılık”, “etkinlik” ve “yeterlilik” olmak üzere dört özelliğinden söz edilir. Sapmasızlık bir ana kütle parametresinin tahmincisi olan örneklem ortalamasının bu parametreye eşit olması özelliğidir. Sapmasızlık şu şekilde de açıklanabilir: eğer örneklem istatistikliğinin beklenen değerinin tahmin edilmek istenen ana kütle parametresine eşit ise, söz konusu istatistik ana kütle parametresinin sapmasız bir tahminidir. Sözü edilen eşitlik gerçekleşmiyorsa

tahmin yanlı olacaktır. Örneğin E x ifadesi örneklem ortalamasının ana kütle ortalamasının

sapmasız bir tahmin olduğunu göstermektedir. Örneklem hacmi n, ana kütle hacmine yaklaşacak biçimde arttırıldığında örneklem istatistiğiyle ana kütle parametresi arasındaki farkın azalarak sıfıra yaklaştığı görülür. Bu durumda tahmin tutarlı bir tahmin olarak değerlendirilir. Tutarlılık özelliği “ ” çok küçük pozitif bir sayı olmak üzere,

lim Pr 1n N

T

biçiminde gösterilebilir. Etkinlik tahminlerin örnekleme dağılımının

varyansı ile ilgilidir. Bir ana kütle parametresinin alternatif tahminleri arasında varyansı küçük olanın etkin olduğu ifade edilmektedir. Örneğin ana kütle aritmetik ortalamasının iki tahmincisi örneklem ortalaması ve medyanıdır. Bu tahminciler hem sapmasız hem de tutarlılık özelliklerine sahiptir. Örneklem

hacmi n yeterince büyük olduğunda aritmetik ortalamaların örnekleme dağılımının varyansı 2

n

,

medyanlarınki ise2

n

dir. “ =3,14” olduğundan örneklem aritmetik ortalaması, varyansı daha

küçük olduğundan örneklem meydanına göre daha etkin bir tahmincidir. Yeterlilik özelliği, tahmin değerinin hesaplanmasında örneklem verilerinin tamamının kullanılıp kullanılmadığı ile ilgilidir.Örneklem verilerinin tamamının kullanılması ilgili tahminin yeterli olduğunu göstermektedir. Bilindiği gibi örneklem ortalamasının hesaplanmasında tüm örneklem verileri, mod ve medyanın hesaplanmasında ise bazı örneklem verileri kullanılmaktadır. Bu durumda örneklem ortalamasının yeterli bir tahminci olduğu görülmektedir.

Aralık Tahmini

Nokta tahmin, ana kütle parametresinin tahmininde kullanılan genel bir yaklaşımdır. Ancak kesin değildir. Dolayısıyla, gerçekleştirilen bir nokta tahmini sonucunda tahminin gerçek parametre değerine ne kadar yakın olduğu bilinemez. Bundan dolayı güvenilir bir tahmin yapma gerekliliği doğar. Güvenilirliğin somut olarak ortaya konulması için “güven aralığı” kavramı geliştirilmiştir. Bu nedenle güvenilir bir tahmin yapılabilmesi için aralık tahmini yaklaşımı geliştirilmiştir.

Ana kütle parametresinin değerinin örneklem istatistiğinden hareketle bir aralık biçiminde tahmin edilmesi “aralık tahmin” olarak tanımlanır. Aralık tahmininde, ana kütle parametresinin belirli bir olasılık düzeyinde içerisinde yer alabileceği simetrik bir aralık belirlenir. Belirtilen olasılık düzeyi, tahminin doğruluğundan ne kadar emin olunacağını belirtir ve aralığı oluşturan güven sınırlarının belirlenmesinde kullanılır. Aralık tahmininde oluşacak aralığa “güven aralığı”, aralığın alt ve üst sınır değerlerine ise “güven sınırları” adı verilir. Bilindiği gibi bir ana kütleden çekilen “n” birimlik mümkün örneklemlerin

185

içerisinde bir tanesi tesadüfi olarak çekilir ve elde edilen verilerden hareketle ana kütle hakkında çıkarsama yapılmaktadır. Herhangi bir ana kütleden çekilen farklı örneklemler için hesaplanan güven aralıklarının bir kısmı değeri araştırılan ana kütle parametresini kapsamaz. Dolayısıyla ana kütle parametresinin tahmininde güven aralığı yaklaşımı kullanıldığında, yapılan tahminin doğruluk derecesi, yani hesaplanan güven aralığının ana kütle parametresini içermesi olasılığı (1-α) belirlenebilmektedir. Bu olasılık “güven düzeyi” olarak adlandırılır. Burada α tahminin hata payını ifade etmektedir. Böylece yukarıda belirtildiği gibi, aralık tahminini oluşturan güven sınırları güven düzeyine göre belirlenmektedir. Örneğin, aralık tahminin %95 olasılıkla (güven düzeyinde) yapılması, belirlenen güven aralığının ana kütle parametresini içermesi olasılığı 0,95 olacaktır.

Aralık tahmininde güven aralığının genişliğini güven düzeyi belirler: güven düzeyi yükseldikçe güven aralığı genişler. Buna bağlı olarak doğru tahmin yapma şansı artar, ancak tahminin duyarlılığı azalır. Bundan dolayı, güven aralığının mümkün olduğunca dar tutulması arzulanır. Bunun için ya güven düzeyi düşürülür ya da tahminin standart hatası küçültülmeye çalışılır. Örneklem hacminin mümkün olduğu kadar büyütülmesiyle standart hata küçültülebilir. Uygulamada genellikle alışkanlığa bağlı olarak 0,95 ve 0,99 güven düzeyleri kullanılmaktadır. İzleyen kesimlerde ana kütle aritmetik ortalaması, ana kütle oranı, ortalamalar arasındaki fark ve oranlar arasındaki fark için güven aralıkları incelenecektir.

“Güven aralığı” kavramını açıklayınız

ANA KÜTLE PARAMETRESİNİN ARALIK TAHMİNİ Aralık tahmininde ana kütle parametresinin güven sınırlarının belirlenmesinde ilgili örneklem istatistiğinin örnekleme dağılımının şeklinin bilinmesine gereksinim vardır. İlgili ana kütle parametrelerine ilişkin güven sınırları güven düzeyi de belirtilerek aşağıdaki genel biçimiyle ifade edilebilir:

Pr (Alt sınır< < Üst sınır) = 1- (Eşitlikte “Pr”, “olasılık” için kullanılmıştır)

Alt ve üst sınırlar, örnekleme dağılımına bağlı olarak güven düzeyi ve standart hata değeriyle belirlenir.

Ana Kütle Ortalaması µ’nün Aralık Tahmini

Ana kütle aritmetik ortalamasının aralık tahmininde örneklem hacminin yeterince büyük olup olmamasına göre iki farklı dağılımın olasılık kurallarından yararlanılır. İzleyen kesimlerde μ nün aralık

tahmini “büyük örneklemler (n 30)” ve “küçük örneklemler (n<30)” için ayrı ayrı ele alınacaktır.

Büyük Örneklemler İçin µ’nün Aralık Tahmini Ortalamalar örnekleme dağılımının normal olabilmesi için, ana kütlenin normal dağılması ya da örneklem

hacminin yeterince büyük olması (n 30) gerektiği önceki ünitede belirtilmişti. Bu dağılımın olasılık kurallarından yararlanarak, ana kütleden tesadüfi olarak çekilecek tek bir örneklem yardımıyla örneklem aritmetik ortalaması kullanılarak ana kütle aritmetik ortalaması µ için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir.

Pr( ) 1x xX z X z veya xX z

Yukarıdaki formülde z değeri, başlangıçta belirlenen güven düzeyine karşılık gelen standart normal eğri alanları tablosundan bulunacak değerdir. Aralık tahmininde genellikle %95 ve %99 güven düzeylerinin kullanıldığı daha önce ifade edilmişti. Bu güven düzeyleri için güven sınırları aşağıdaki gibidir:

186

Ana kütle ortalamasının güven sınırları

(n 30)

%95 Güven Düzeyinde 1,96 xX

%99 Güven Düzeyinde 2,58 xX

Ana kütle aritmetik ortalamasının tahmincisi olan örneklem aritmetik ortalamasının standart hatası

x , ana kütle standart sapması bilindiğinde,

xn

eşitliğinden elde edilir.

Ana kütle aritmetik ortalamasının tahmini ile ilgili açıklamalar Ana kütle standart sapması “σ” nın bilinmesi durumunda geçerli olmaktadır. Günlük yaşamda bazı ender durumlar dışında karşılaşılan problemlerin çözümünde genel olarak “σ” bilinmemektedir. Bu durumda Ana kütle standart sapması yerine onun sapmasız tahmincisi olan örneklem standart sapması “ s ” kullanılır. Bu tahminci aşağıdaki eşitlikle hesaplanır:

2

1

( )

1

n

ii

x Xs

n

Ortalamaların örnekleme dağılımı “merkezi limit teoremi” uyarınca 30n olduğunda normale

uyduğu daha önce belirtilmişti. Buna göre, Ana kütle aritmetik ortalaması μ’nün aralık tahmini aşağıdaki eşitlikle bulunur:

Pr( ) 1x xX zs X zs

Ortalamanın standart hatasının tahmini, örneklem standart hatası kullanılarak

x

ss

n

eşitliğinden yararlanarak gerçekleştirilir.

Örnek 7.1:

Belirli bir bölgede canlı doğum ağırlık ortalamasını tahmin etmek amacıyla tesadüfi olarak 100 doğum ağırlığı belirlenmiştir. Ortalama doğum ağırlığı 3250 gr, standart sapma ise 450 gr olarak hesaplanmıştır. Buna göre söz konusu bölgedeki canlı doğum ağırlık ortalamasını %99 güvenle tahmin ediniz.

İlgili araştırmada,

n =100 doğum

X = 3250 gr ve s = 450 gr olarak belirlenmiştir.

Tahmin %99 güvenle yapılacağından, ana kütle ortalamasının tahmininin güven düzeyi (1- ) 0,99 olacaktır. Örneklem hacmi yeterince büyüktür (n>30). Buna göre, yukarıda da belirtildiği gibi standart

normal dağılım tablosundan /2z =0,01

2

z = 2,58 değeri belirlenir. Ana kütle standart sapması

bilinmediğinden örneklem standart sapmasından yararlanarak %99 güven sınırları aşağıdaki gibi belirlenir:

187

x

ss

n = 450

100= 45 gr

Pr( ) 1x xX zs X zs Pr(3250-(2,58)(45)< <3250+(2,58)(45))=0,99

Pr(3133,9< <3366,1)=0,99

Söz konusu bölgede ortalama canlı doğum ağırlığı, %99 güvenle 3133,9 gr ile 3366,1 gr arasında herhangi bir değer alır.

Küçük Örneklemler İçin µ’nün Aralık Tahmini Örneklem hacminin küçük (n<30) olması durumunda büyük örneklemler için söz konusu olan açıklamalar geçerli olmaz. Normal dağılan bir ana kütleden çekilmesi mümkün tüm “n” birimlik küçük örneklemlerin çekildiği ve her biri için,

x

Xt

s

biçimindeki t istatistiği hesaplandığı düşünülsün. Tanım aralığı “- ve + ” arasında olan bu istatistikler önceki ünitede anlatıldığı gibi Student-t Dağılımı adı verilen sürekli bir dağılım oluşturur. Küçük örneklemler durumunda t dağılımından yararlanarak µ’nün Aralık Tahmininde z değerleri yerine, ilgili güven düzeyi ve n-1 serbestlik derecesi için “kritik t değerleri tablosu”ndan bulunacak t değerleri kullanılır. Bu değerler,

;( 1)2

nt

biçiminde gösterilir. Ana kütle aritmetik ortalaması µ için aralık tahmini

aşağıdaki güven sınırlarıyla yapılabilir.

;( 1) ;( 1)2 2

Pr 1x xn n

X t s X t s

veya

;( 1)2

xn

X t s

Örnek 7.2

Örnek 7.1’deki çalışmanın n= 25 birimlik bir örneklemle yapıldığı düşünülsün. Ortalama doğum ağırlığı 3200 gr, standart sapma ise 550 gr olarak hesaplanmıştır. Buna göre söz konusu bölgedeki canlı doğum ağırlık ortalamasını %95 güvenle tahmin ediniz.

İlgili araştırmada,

n = 25 doğum

x = 3200 gr ve s = 550 gr olarak belirlenmiştir.

Tahmin %95 güvenle yapılacağından, ana kütle ortalamasının tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacmi yeterince küçüktür (n<30). Buna göre, yukarıda da belirtildiği gibi Student-t

dağılım tablosundan (çift yönlü =0,05) ;( 1)

2n

t

= 0.025;(25 1)t = 2,064 değeri belirlenir. Ana kütle

standart sapması bilinmediğinden örneklem standart sapmasından yararlanarak %95 güven sınırları aşağıdaki gibi belirlenir:

x

ss

n = 550

25= 110 gr

;( 1) ;( 1)2 2

Pr 1x xn n

X t s X t s

Pr(3200-(2,064)(110)< <3200+(2,064)(110))=0,99

Pr(2972,96< <3427,04)=0,95

Söz konusu bölgede ortalama canlı doğum ağırlığı, %95 güvenle 2972,96gr ile 3427,04gr arasında herhangi bir değer alır.

188

ANA KÜTLE PARAMETRELERİ ARASINDAKİ FARKIN ARALIK TAHMİNİ N1 ve N2 hacimlik iki farklı ana kütleden tesadüfi olarak ve birbirinden bağımsız olarak çekilen n1 ve n2 birimlik örneklemler için hesaplanan istatistikler T1 ve T2 biçiminde gösterilsin. Ana kütle parametreleri

arasındaki farkın 1 2 aralık tahmininin yapılabilmesi için, T1- T2 istatistiğinin örnekleme

dağılımının bilinmesi gerekir. İlgili dağılımın olasılık kurallarından hareketle seçilen güven düzeyinde, ana kütle parametreleri arasındaki farkın aralık tahmini aşağıdaki biçimde genel olarak yapılabilir.

Pr (Alt sınır< 1 2 < Üst sınır) = 1-α

Ana kütle Ortalamaları Arasındaki Farkın 1 2 Aralık Tahmini

Ana kütle ortalamaları arasındaki farkın aralık tahmininde de örneklemlerin büyük ya da küçük örneklem

olmaları durumları dikkate alınacaktır. İzleyen kısımlarda büyük örneklemler için ve küçük örneklemler

için 1 2 ‘in aralık tahmini aktarılacaktır.

Büyük Örneklemler İçin 1 2 ’nin Aralık Tahmini

Ortalama farklarının örnekleme dağılımının normal olabilmesi için, ana kütlelerinin normal dağılması ya

da örneklemlerin hacminin yeterince büyük olması (n1,n2 30) gerekmektedir. Bu dağılımın olasılık kurallarından yararlanarak, ilgili ana kütlelerden tesadüfi olarak çekilecek birer örneklem yardımıyla

örneklem aritmetik ortalamaları arasındaki fark 1 2X X kullanılarak, ana kütle aritmetik ortalamaları

arasındaki fark 1 2 için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir.

1 2 1 21 2 1 2 1 2Pr[( ) ( ) ] 1x x x xX X z X X z

veya 1 21 2( ) x xX X z

Yukarıdaki formülde z değerinin, başlangıçta belirlenen güven düzeyine karşılık gelen standart normal eğri alanları tablosundan bulunacak değer olduğu önceki kesimde açıklanmıştı. %95 ve %99 düzeyleri için µ1-µ2’nin güven sınırları aşağıdaki gibidir:

Ana kütle ortalamaları arasındaki

farkın güven sınırları

(n1,n2 30)

%95 Güven Düzeyinde 1 21 2( ) 1,96 x xX X

%99 Güven Düzeyinde 1 21 2( ) 2,58 x xX X

Güven sınırlarındaki ortalama farklarının standart hatası 1 2x x , ana kütle standart sapmaları

bilindiğinde,

1 2

2 21 2

1 2x x n n

eşitlğine göre hesaplanır.

Yukarıda yapılan açıklamalar ana kütle standart sapmaları “σ1 ve σ2” nin bilinmesi durumunda geçerli olmaktadır. Günlük yaşamda bazı ender durumlar dışında karşılaşılan problemlerin çözümünde genel olarak “σ1 ve σ2” bilinmemektedir. Bu durumda ana kütle standart sapmaları yerine onun sapmasız

189

tahmincileri olan örneklem standart sapmaları “s1 ve s2” kullanılır. Buna göre, ana kütle aritmetik

ortalamaları arasındaki fark 1 2 için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir:

1 2 1 21 2 1 2 1 2Pr[( ) ( ) ] 1x x x xX X zs X X zs

Ana kütle standart sapmaları bilinmediği durumda ortalamalar arasındaki farkın standart hatasının

tahmini 1 2x xs aşağıdaki gibi belirlenir:

1 2

2 21 2

1 2x x

s ss

n n

Örnek 7.3

A ve B gibi iki ilacın ortalama etki süreleri arasındaki farkı tahmin etmek isteyen bir araştırmacı, A ilacını uyguladığı 35, B ilacını uyguladığı 50 hasta için elde ettiği etki sürelerinden hareketle aşağıdaki bulgulara ulaşmıştır. Buna göre iki ilacın ortalama etki süresi arasındaki farkı %95 güvenle tahmin ediniz.

A İlacı (1) B İlacı (2)

1X =15 dk. 2X =11 dk.

21s =12,25 dk. 2

2s =5,29 dk.

1n =35 2n =50

Tahmin %95 güvenle yapılacağından, ana kütle ortalamaları arasındaki farkın tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacimleri yeterince büyüktür (n1 ve n2>30). Buna göre, yukarıda

da belirtildiği gibi standart normal dağılım tablosundan 2

z = 0,052

z = 1,96 değeri belirlenir. Ana kütle

standart sapmaları bilinmediğinden örneklem standart sapmalarından yararlanarak %95 güven sınırları aşağıdaki gibi belirlenir:

1 2

2 21 2

1 2x x

s ss

n n 12,25 5,29

35 50 = 0,46 = 0,68

1 2 1 21 2 1 2 1 2Pr[( ) ( ) ] 1x x x xX X zs X X zs

Pr((15-11)-(1,96)(0,68)< 1 2 <(15-11)-(1,96)(0,68))=0,95

Pr(2,67< <5,33)=0,95

A ve B gibi iki ilacın ortalama etki sürelerinin arasındaki fark, %95 güvenle 2,67 dk ile 5,33 dk arasında herhangi bir değer alır.

Küçük Örneklemler İçin 1 2 ’nin Aralık Tahmini

Örneklem hacmlerinin küçük (n1,n2<30) olması durumunda büyük örneklemlerdekine benzer biçimde ana kütle ortalamaları arasındaki farkın aralık tahmini gerçekleştirilebilir. Bu durumda, t dağılımından

yararlanarak, ilgili güven düzeyi ve 1 2 2n n serbestlik derecesi için “kritik t değerleri tablosu”ndan

190

bulunacak t değerleri kullanılır. Bu değerler, 1 2;( 2)

2n n

t

biçiminde gösterilir. Ana kütle aritmetik

ortalamaları arasındaki fark 1 2 için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir:

1 2 1 21 2 1 2

1 2 1 2 1 2;( 2) ;( 2)

2 2

Pr ( ) ( ) 1x x x xn n n n

X X t s X X t s

veya

1 21 2

1 2;( 2)

2

( ) x xn n

X X t s

Yukarıda verilen güven aralığındaki ortalamalar arasındaki farkın standart hatasının tahmini 1 2x xs

aşağıdaki gibi belirlenir:

1 2

2 21 1 2 2

1 2 1 2

( 1) ( 1) 1 12x x

n s n ss

n n n n

Örnek 7.3’te n1=16 n2=12 kabul ederek %99 güven sınırlarını bulunuz

Ana kütle Oranı ’nin Aralık Tahmini

Sayısal olmayan değişkenler için ölçme düzeyi sınıflayıcı (kategorik) olduğunda söz konusu olan ana kütle oranı, önceki ünitede “ana kütlenin birimleri içindeki ilgilenilen türden özelliğe sahip olanların oranı” biçiminde tanımlanmıştı. Ana kütle oranı için güven aralıkları, ana kütle ortalamasının aralık tahminine paralel olarak gerçekleştirilebilir. Böyle bir tahminin yapılabilmesi için, örneklem hacminin yeterince büyük (n≥30) olması gerekmektedir. Bu durumda oranların örnekleme dağılımı merkezi limit teoremi uyarınca normale yaklaşım gösterir. Örneklem oranı p kullanılarak ana kütle oranı için

aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir.

Pr( . . ) 1p pP z s P z s veya . pp z s

Yukarıdaki formülde z değerleri, %95 ve %99 güven düzeyleri için kullanıldığında güven sınırları aşağıdaki gibidir:

Ana kütle oranının güven sınırları

(n 30)

%95 Güven Düzeyinde 1,96. pp s

%99 Güven Düzeyinde 2,58. pp s

Oranın standart hatasının tahmini ps ,

(1 )p

p ps

n

eşitliğinden hesaplanır.

Örnek 7.4

Gelişmiş ülkelerde sigara içme oranı hızla düşerken, Türkiye'de sigaraya başlayanların sayısı sürekli artmaktadır ve bu önemli bir sağlık sorunu olarak kabul edilmektedir. Sağlık Bakanlığı'nın ilk ve orta dereceli okullarda yaptığı araştırmaya 61 ilden 202 okul ve bu okullarda öğrenim gören 15957 öğrenci katılmıştır. Bu öğrencilerden 4628 i sigara içtiğini belirtmiştir. Buna göre sigara içenlerin oranını %95 güven düzeyinde tahmin ediniz.

191

Araştırmada, n=15957 öğrenci ve sigara içen sayısı r = 4628 buradan,

rp

n = 4628

15957= 0,29

Tahmin %95 güvenle yapılacağından, ana kütle oranının tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacmi yeterince büyüktür (n>30). Buna göre, yukarıda da belirtildiği gibi standart

normal dağılım tablosundan 2

z = 0,052

z = 1,96 değeri belirlenir. Burada örneklem oranından yararlanarak

ana kütle oranı için %95 güven sınırları aşağıdaki gibi belirlenir:

(1 )p

p ps

n

=

0,29(1 0,29)

15957ps

=0,004

Pr( . . ) 1p pp z s p z s Pr(0,29-(1,96)(0,004)< <0,29+(1,96)(0,004))=0,95

Pr(0,282< <0,298)=0,95

Bu sonuca göre sigara içen öğrencilerin ana kütle düzeyindeki oranı %95 güvenle 0,282 ile 0,298 arasında bir değer alır.

Ana Kütle Oranları Arasındaki Farkın 1 2 Aralık Tahmini

Ana kütle oranları arasındaki farkı için güven aralıkları, ana kütle ortalamaları arasındaki farkın aralık tahminine paralel olarak gerçekleştirilebilir. Böyle bir tahminin yapılabilmesi için, örneklem hacmlerinin

yeterince büyük (n1,n2>30) olması gerekmektedir. Ana kütle oranları arasındaki fark 1 2 için

aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir.

1 2 1 21 2 1 2 1 2Pr ( ) ( ) 1p p p pp p zs p p zs veya

1 21 2( ) p pp p zs

Oranlar arasındaki farkın standart hatasının tahmini 1 2P Ps ,

1 2

1 1 2 2

1 2

(1 ) (1 )p p

p p p ps

n n

eşitlğine göre hesaplanır.

Örnek 7.5

Özel bir sağlık kuruluşu, büyük bir ildeki iki hastanesi arasındaki memnuniyet farkını araştırmak amacıyla bir araştırma yaptırmıştır. A hastanesinden tesadüfi olarak belirlenen 500 hastadan 350’si, B hastanesinden tesadüfi olarak belirlenen 450 hastadan ise 270’i memnun olduklarını belirtmişlerdir. Bu duruma göre iki hastane arasındaki memnuniyet oranları arasındaki farkın güven sınırlarını %95 olasılıkla belirleyiniz.

Araştırmada memnuniyet oranları arasındaki farkın güven sınırları istenmektedir. Bu durumda aralık

tahmini söz konusudur. 1n =500 hasta ve memnun olan sayısı r1=350, 2n =450 ve memnun olan sayısı

r2=270 buradan,

11

1

rp

n = 350

500= 0,70 2

22

rp

n = 270

450= 0,60

192

Tahmin %95 güvenle yapılacağından, ana kütle oranının tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacimleri yeterince büyüktür (n1 ve nn>30). Buna göre, yukarıda da belirtildiği gibi

standart normal dağılım tablosundan /2z = 0,05/2z = 1,96 değeri belirlenir. Burada örneklem oranından

yararlanarak ana kütle oranları arasındaki fark için %95 güven sınırları aşağıdaki gibi belirlenir:

1 2

1 1 2 2

1 2

(1 ) (1 )p p

p p p ps

n n

0,70(1 0,70) 0,60(1 0,60)

500 450

=0,03

1 2 1 21 2 1 2 1 2Pr ( ) ( ) 1p p p pp p zs p p zs

Pr((0,70-0,60)-(1,96)(0,03)< 1 2 <(0,70-0,60)-(1,96)(0,03))=0,95

Pr(0,04< 1 2 <0,16)=0,95

Bu sonuca göre iki hastane arasındaki memnuniyet oranları arasındaki farkın güven sınırları %95 olasılıkla 0,04 ile 0,16 olarak belirlenir.

HİPOTEZ TESTLERİ Hipotez testleri, istatistiğin çeşitli bilim dallarındaki uygulamalı çalışmalarda yoğun bir biçimde kullanılan önemli bir dalıdır. Hipotez testleri de istatistiksel tahminde olduğu gibi örnekleme konusu ile iç içe kavramlardır. Örnekleme yapan bir araştırmacının genel olarak ana kütle parametrelerine ilişkin çeşitli kararları örneklem istatistiklerinden elde edilen bilgilere dayanarak vermesi gerekmektedir. Bağlı olarak tahmin sürecinde olduğu gibi hipotez testlerinde de ana kütle parametreleri hakkında çıkarsamalarda bulunulur.

Tasarlanan araştırmanın amacına göre, cevaplanması gereken çok sayıda soru akla gelebilir. Örneğin bir ilaç firması uygulayacağı bir yeniliğin üretim miktarını artırıp artırmadığını araştırmak isteyebilir. Hastane yönetimi müşteri memnuniyet oranın önceden bilinen orandan daha yükseğe çıkarılıp çıkarılmadığını araştırmak isteyebilir. Bir araştırmacı uyguladığı bir tedavi yönteminin ilgili hastalığa ilişkin ölçümleri değiştirip değiştirmediğini araştırmak isteyebilir. Bu tür soruların cevaplarını İstatistiksel Hipotez Testleri yardımıyla verebiliriz.

Hipotez, genel olarak belirli bir konuda ileri sürülen iddia (önerme) dır. İstatistiksel Hipotez ise, bir araştırmada araştırma amacına uygun olarak ilgilenilen bir veya daha fazla ana kütle parametresi hakkında ileri sürülen, doğruluğu konusunda kuşku duyulan ve bundan dolayı doğruluğu (veya geçerliliği) olasılık kurallarına göre test edilme gerekliliği olan özel önermelerdir.

Sıfır Hipotezi ve Karşıt Hipotez Hipotez testlerinde, araştırmacının doğruluğundan kuşku duyduğu hipotez sıfır hipotezi (yokluk hipotezi), doğru olduğuna inandığı hipotez ise karşıt hipotez (alternatif hipotez) adı verilir. Ana kütle parametresinin belirli bir değere eşitliği, iki ya da daha fazla ana kütle parametresi arasında fark olmadığı

biçimindeki hipotez; sıfır hipotezidir ve 0H ile gösterilir. Buna karşın, ana kütlenin ilgilenilen

parametresinin belirli bir değerden farklılığını, iki ya da daha fazla ana kütle parametresi arasında fark

olduğunu ifade eden hipotez ise karşıt hipotezdir ve 1H ile gösterilir.

Sözü edilen hipotezler, ana kütle parametresi, 0 ana kütle parametresi için iddia edilen değeri

olmak üzere tek bir ana kütle parametresi için genel biçimde aşağıdaki gibi ifade edilirler:

193

0H : 0

1H :

0

0

0

Yukarıda görüldüğü gibi, test için eşitlik biçiminde kurulabilecek bir tane sıfır hipotezi kurulmasına karşın, alternatif hipotez araştırmanın amacına uygun olarak üç durumdan biriyle ifade edilir. Farklı bir ifadeyle, sıfır hipotezi ana kütle parametresinin değişmezliğini ifade eder ve bütün karar alma problemleri için geçerli olan standart bir eşitliğe sahiptir. Buna karşılık olarak, karşıt hipotez verilecek kararın niteliğine göre çeşitli problemlerde üç farklı durumdan biri ile ifade edilir.

BİRİNCİ VE İKİNCİ TİP HATALAR Hipotez testlerinde de aralık tahmininde olduğu gibi belirli bir güven düzeyinde karar verilir. Dolayısıyla

varılan kararın bir hata içermesi söz konusudur. Araştırmacı araştırmanın amacına uygun olarak 0H ’ı

reddetmeye çalışır. Sıfır hipotezinin gerçekte doğru olup olmadığı bilinememektedir. Hipotez testi sonucunda ise sıfır hipotezi ya reddedilecek ya da reddedilemeyecektir (Başka bir ifade ile, sıfır hipotezini reddetmek için yeterli kanıt olmadığına karar verilecektir). O halde hipotez testinde örneklem istatistiği kanıt olarak kullanıldığında şu dört karar durumuyla karşı karşıya kalınacaktır:

I. Sıfır hipotezi gerçekte doğrudur, reddedilememiştir.

II. Sıfır hipotezi gerçekte doğrudur, reddedilmiştir.

III. Sıfır hipotezi gerçekte yanlıştır, reddedilememiştir.

IV. Sıfır hipotezi gerçekte yanlıştır, reddedilmiştir.

Bu karar durumlarının ikisinde doğru karar, diğer ikisinde ise yanlış karar söz konusu olur. Bunu aşağıdaki tabloda açıklamak mümkündür.

Tablo 7.1: Hipotez testinde hata tipleri

Hipotez Testi Sonucu Karar

Sıfır Hipotezinin Gerçek Durumu

0H Doğru 0H Yanlış

0H Reddedilir YANLIŞ KARAR I. TİP HATA

(∝)

VERİLEN KARAR DOĞRU

(1-∝)

0HReddedilemez

VERİLEN KARAR DOĞRU (1- β)

YANLIŞ KARAR II. TİP HATA

(β)

Tablo 7.1’de görüldüğü gibi dört karar durumundan ikisinde yanlış karar verilmesi söz konusudur,

yani iki tip hata yapılmaktadır. Bu hatalar şu biçimde tanımlanabilir:

I. TİP HATA: Gerçekte doğru olan sıfır hipotezini test sonucunda yanlıştır diye reddetmeye I. Tip Hata adı verilir. α-Hatası olarak da adlandırılan bu hatayı işleme olasılığı tabloda belirtildiği gibi α kadardır.

II. TİP HATA: Gerçekte yanlış olan sıfır hipotezini test sonucunda doğrudur diye “reddedilemez” kararı vermeye II. Tip Hata adı verilir. β-Hatası olarak da adlandırılan bu hatayı işleme olasılığı da β kadardır. Dolayısıyla tablodaki;

194

α: Birinci tip hatayı işleme olasılığı,

β: İkinci tip hatayı işleme olasılığı,

1-α: 0H gerçekte doğru olduğunda onu reddetmeme olasılığıdır ve aralık tahmininde olduğu gibi

“Güven Düzeyi” olarak adlandırılır.

1-β: 0H gerçekte yanlış olduğunda onu reddetme olasılığıdır ve “Testin Gücü” olarak adlandırılır.

Hipotez testlerinde, α hatası üzerinde daha çok durulur ve bu hatayı işlemekten kaçınılır. Uygulamada bu hatayı işleme olasılığı araştırmacı tarafından belirlenebilmektedir.

I. ve II. Tip hatayı ve bunlara ilişkin olasılıkları açıklayınız

Hipotez Testinin Aşamaları Araştırmanın amacına uygun olarak yürütülecek bir hipotez testinde genel olarak izlenecek aşamalar şu biçimde sıralanabilir:

1. Sıfır hipotezi ve alternatif hipotezin ifade edilmesi

2. Anlamlılık düzeyi nın seçilmesi

3. Örnekleme dağılımının belirlenmesi

4. Red bölgesinin (kritik değerin) belirlenmesi

5. Uygun test istatistiğinin hesaplanması

6. İstatistiksel kararın verilmesi

Hipotez testinin belirtilen aşamaları izleyen kesimde “Tek Ana kütle Ortalamasına İlişkin Hipotez Testleri” başlığı altında ayrıntılı olarak anlatılacaktır.

Ana Kütle Ortalamasına İlişkin Hipotez Testleri Bu bölümde ana kütle ortalamasına ilişkin uygulamada çoğunlukla kullanılan tek ana kütle ortalamasına ve iki ana kütle ortalaması arasındaki farka ilişkin olarak gerçekleştirilen testlere değinilecektir. Bu testler anlatılırken, büyük örneklem-küçük örneklem ve ana kütle varyanslarının bilirip bilinmemesi ayrımları dikkate alınacaktır. İzleyen kesimde tek ana kütle ortalamasına ilişkin hipotez testi ayrıntılı olarak ele alınacak, diğer testler mümkün olduğunca kısaltılarak verilecektir.

Tek Ana Kütle Ortalamasına İlişkin Hipotez Testi Tek bir ana kütle aritmetik ortalamasına ilişkin hipotez testinde, ilgili ana kütle aritmetik ortalamasının

belirli bir değere 0 eşitliği biçiminde ifade edilen sıfır hipotezinin test edilmesi işlemleri

gerçekleştirilir. Sözü edilen test, hipotez testi aşamaları izlenerek aşağıdaki gibi uygulanır:

1. Sıfır Hipotezi ve Alternatif Hipotezin İfade Edilmesi Sıfır hipotezi her zaman eşitlik şeklinde ifade edilir. Alternatif hipotez ise bizim araştırmak istediğimiz hipotezdir. Daha sonra testin tek taraflı mı yoksa çift taraflı mı olacağına, dolayısıyla alternatif hipotezin yönüne karar verilir. Ana kütle ortalamasının iddia edilen değerden büyük olduğu ya da küçük olduğu biçimindeki iddialar için test tek taraflı olarak adlandırılır. Yön belirtilmeden ana kütle ortalamasının iddia edilen değerden farklı olduğu ileri sürülecekse alternatif hipotez eşitsizlik biçiminde kurulur ve testin çift taraflı olduğu ifade edilir. Tek taraflı testlerde eşitsizliğin yönü belirlenirken dikkat edilmelidir. Hipotezler aşağıdaki gibi kurulur:

195

0 0:H 0 0:H 0 0:H

1 0:H 1 0:H 1 0:H

Çift Taraflı Test Tek Taraflı Test Tek Taraflı Test

Yukarıda da belirtildiği gibi belirli bir araştırmada, araştırmanın amacına uygun olarak bu üç hipotez çiftinden biri kurulur.

2. Anlamlılık Düzeyi nın Seçilmesi

Anlamlılık düzeyi, bir hipotez testinde I. Tip hatayı işleme olasılığı idi. Bu hata miktarı çoğunlukla 0,05 ve 0,01 olarak belirlenir. Ancak, araştırmanın önemi dikkate alınarak daha büyük ya da küçük bir değer de belirlenebilir. Anlamlılık düzeyine bağlı olarak testin güven düzeyi de belirlenmiş olur. Buna göre

0.05 1 0.95 ve 0.01 1 0.99Güven düzeyi Güven düzeyi

olarak belirlenmiş olur.

3. Örnekleme Dağılımının Belirlenmesi Önceki ünitede anlatıldığı gibi, örneklemeye başvurulduğunda, istatistiksel tahminde olduğu gibi hipotez testlerinde de, örneklem istatistiğinin örnekleme dağılımından ve onun olasılık kurallarından yararlanılmaktadır. Dolayısıyla araştırmanın amacına uygun olarak hangi örnekleme dağılımından yararlanılacağı bu aşamada belirlenir ve örneklem istatistikleri ( x ve s gibi) kullanılarak standart hata hesaplanır.

4. Red Bölgesinin (Kritik Değerin) Belirlenmesi Test istatistiğinin hesaplanan değerlerinin bizi sıfır hipotezinin reddi kararına götüreceği değerler kümesi red bölgesidir. Red bölgesinin sınırında bulunan değere kritik değer adı verilir. Red bölgesinin büyüklüğü Tip I hata olasılığı olan α’ya bağlıdır. Buna göre anlamlılık düzeyinin belirlenmesiyle red bölgesinin büyüklüğü de ortaya çıkmış olur. Karşıt hipotez ise, red bölgesinin yerini belirlemede yardımcı olur. Karşıt hipotez, ana kütle ortalamasının iddia edilen değerinden büyük ya da küçük bir değer olduğu biçiminde ise, yani tek taraflı bir test gerçekleştirilecekse, red bölgesi birinci durumda dağılımın pozitif (sağ) ucunda yer alır. İkinci durumda ise dağılımın sol ucunda gösterilir. Eğer karşıt hipotez ana kütle ortalamasının iddia edilen değerinden farklı olduğu biçiminde ise, red bölgesi dağılımın iki ucunda olmak üzere iki eşit bölgede yer alır. Tek taraflı, sağ veya sol uçtaki testler için red bölgesinin alanı α’ya; `çift

taraflı testler için ise 2

‘ye eşittir. Bu açıklamalar, normal dağılım eğrisinden yararlanılarak aşağıdaki

gibi gösterilebilir.

Şekil 7.1: Çift taraflı test için red bölgesi 1 0:H

196

Şekil 7.2: Tek (sol uç) taraflı test için red bölgesi 1 0:H

Şekil 7.3: Tek (sağ uç) taraflı test için red bölgesi 1 0:H

Red bölgesinin sınırında bulunan kritik değer/değerler, anlamlılık düzeyine ve testin tek ya da çift taraflı oluşuna göre değişik değerler alır. Büyük örneklemler için z tablo değerleri, küçük örneklemler için de t tablo değerleri kullanılır. Örneğin, tek taraflı bir test kullanıldığında ve 0,05 anlamlılık düzeyi belirlendiğinde, büyük örneklemler için kritik z değeri 1,64 olarak belirlenir. Bazı kritik z değerleri aşağıdaki gibi tablolaştırılabilir:

Bazı kritik z değerleri

Testin Yönü

Anlamlılık Düzeyi

0,05 0,01

Tek Taraflı Test z =1,64 z =2,33

Çift Taraflı Test z =1,96 z =2,58

5. Uygun Test İstatistiğinin Hesaplanması İstatistiksel karar, örneklemden elde edilen ortalama ile ana kütle ortalamasının iddia edilen değeri arasındaki farkın istatistiksel olarak anlamlı olup olmadığı biçiminde verilecektir. Bunun için, sözü edilen farkın standart hataya göre standartlaştırılarak elde edilen değer olan test istatistiğine gereksinim vardır. Test istatistiği tek ana kütle ortalamasına ilişkin test için büyük örneklem durumunda, ana kütle varyansı bilindiğinde:

0

x

Xz

eşitliği yardımıyla hesaplanır. Burada x bilindiği gibi aşağıdaki eşitlik yardımıyla hesaplanır.

xn

Uygulamada ana kütle varyansının genellikle bilinmediği daha önce belirtilmişti. Bu durumda aralık tahmininde olduğu gibi ana kütle varyansının tahmincisi olan örneklem varyansından yararlanılır. Dolayısıyla, test istatistiği aşağıdaki gibi olacaktır.

197

0

x

Xz

s

Burada xs da aşağıdaki gibi hesaplanır:

x

ss

n

6. İstatistiksel Kararın Verilmesi Hesaplanan test istatistiğinin daha önce belirlenen red bölgesinin içinde yer alıp almamasına göre birinci aşamada ileri sürülen sıfır hipotezinin reddedilip reddedilemeyeceği, hipotez testinin son aşaması olan istatistiksel kararı ifade eder. Sıfır hipotezinin reddedilmesi durumunda ana kütle ortalamasının iddia edilen değerden farklı olduğuna, hipotezin reddedilememesi durumunda ise sıfır hipotezini reddetmek için yeterli kanıt bulunamadığına, yani ana kütle aritmetik ortalamasının iddia edilen değerden farklı olmadığına belirlenen güven düzeyinde karar verilir.

İstatistiksel kararın verilmesinde hesaplanan test istatistiğinin red bölgesine düşüp düşmediğinin belirlenmesinde pratik bir yol; test istatistiğinin mutlak değerinin kritik değerden büyük olup olmadığının belirlenmesidir. Bu durumda karar kuralı aşağıdaki gibi tanımlanabilir.

Tek taraflı test için:

hesapz z 0H Reddedilir hesapz z 0H Reddedilemez

İki taraflı test için:

2

hesapz z 0H Reddedilir 2

hesapz z 0H Reddedilemez

Örnek 7.6

En az 20 kez milli olmuş, 18 yaşın üzerindeki erkek orta mesafe yüzücülerinin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığı araştırılmak istenmiştir. Bu amaçla, belirtilen özelliklere sahip yüzücüler içerisinden 36’sı tesadüfi olarak seçilmiştir. Örnekleme seçilen 36 yüzücünün oksijen tüketim kapasiteleri ölçülmüş ve ortalama 62, varyans tahmini 29,38 ml/kg/dk olarak belirlenmiştir. %99 güven düzeyinde sözü edilen yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığını araştırınız.

Hipotez testleri için verilen ilk örnek olduğundan çözümleme hipotez testi adımları belirtilerek verilecektir.

68

X =62

2s =29,38 s =5,42

n =36

Araştırmada tek örneklem ile çalışılmıştır ve örneklem hacmi büyüktür. Bundan dolayı büyük örneklemler için ana kütle ortalamasına ilişkin hipotez testi gerçekleştirilecektir. Ayrıca ana kütle standart sapmasına ilişkin bir bilgi bulunmamaktadır.

198

1) Sıfır hipotezi ve alternatif hipotezin ifade edilmesi;

0 0: 68H

1 0: 68H biçiminde olacaktır.

Araştırmada sözü edilen yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığı araştırıldığı için çift taraflı test uygulanacaktır.

2) Anlamlılık düzeyinin belirlenmesi;

Karar %99 güvenle verileceğinden anlamlılık düzeyi =0,01 olarak belirlenir.

3) Örnekleme dağılımı

Ana kütle ortalamasına ilişkin hipotez testi gerçekleştirileceğinden, ortalamaların örnekleme dağılımı kullanılacaktır. Ayrıca büyük örneklemlerden yararlanıldığından standart normal dağılım olan z dağılımından ve olasılık kurallarından yararlanılacaktır.

4) Red Bölgesi;

Red bölgesinin belirlenmesinde anlamlılık düzeyi ve 1H ’in yönü dikkate alınıyordu. Çift taraflı

bir test uygulanacağından red bölgesi dağılımın her iki ucunda 2

kadar olmak üzere toplam

kadardır. Buna göre kritik z değerleri tablosundan 2

z = 0,025z =1,96 belirlenir.

5) Test İstatistiğinin hesaplanması;

x

ss

n

5,42

36 0,9 olmak üzere,

0

x

Xz

s

62 68

0,9

= -6,67 , 6,67hesapz

Olarak hesaplanır.

6) İstatistiksel kararın verilmesi;

hesapz =6,67>2

z =1,96 0H Reddedilir. Dolayısıyla, %99 güven düzeyinde sözü edilen

yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olmadığı söylenebilir.

Hipotez testlerinde red bölgesi neye göre belirlenir?

Küçük Örneklemler Durumu Küçük örneklem durumunda (n<30), yukarıda izlenen aşamalar benzer biçimde gerçekleştirilir. Kullanılacak test istatistiği, örnekleme dağılımı (n-1) serbestlik dereceli Student-t dağılımına uygun olarak,

0

x

Xt

s

biçiminde olacaktır.

Hesaplanan test istatistiği tek taraflı test için ; 1nt , iki taraflı test için ; 1

2n

t

kritik değeri ile yukarıdaki

gibi karşılaştırılarak karar verilir. Yukarıda verilen pratik yol t-testi için de geçerlidir.

199

Ana Kütle Ortalamaları Arasındaki Farka 1 2 İlişkin hipotez Testi

Uygulamada genellikle birbirinden bağımsız iki grubun, iki türün, iki işletmenin, iki ilacın v.b. incelenen sayısal değişken bakımından karşılaştırıldığı problemler ve bunların çözümlenmesi ile sıklıkla karşılaşılır. Bu tür problemlerde iki ana kütle ortalaması arasındaki farkın karşılaştırılması genellikle uygulanan hipotez testidir. Hipotezler aşağıdaki gibi kurulur.

0 1 2:H 0 1 2:H 0 1 2:H

1 1 2:H 1 1 2:H 1 1 2:H

Çift Taraflı Test Tek Taraflı Test Tek Taraflı Test İki ana kütle ortalaması arasındaki farkın test edilmesinde ilişkin test için büyük örneklemler

durumunda, ana kütle varyansları bilindiğinde kullanılacak test istatistiği aşağıdaki gibidir:

1 2

2 21 2

1 2

X Xz

n n

Ana kütle varyansları bilinmediğinde ise test istatistiği, bunların tahmincileri olan 21s ve 2

2s

yardımıyla hesaplanır.

1 2

2 21 2

1 2

X Xz

s sn n

Küçük Örneklemler Durumu İki ana kütle ortalaması arasındaki farkın aralık tahmininde olduğu gibi hipotez testinde de örneklemler yeterince büyük değilse (n1,n2<30), Student t dağılımından yararlanılır. Bu durumda test istatistiği aşağıdaki gibi olacaktır:

1 2

2 21 1 2 2

1 2 1 2

( 1) ( 1) 1 12

X Xt

n s n sn n n n

Testin diğer aşamaları benzer biçimdedir. Burada istatistiksel kararın verilmesi aşamasında, hesaplanan

test istatistiğinin karşılaştırılacağı kritik değer tek taraflı test için 1 2; 2n nt , iki taraflı test için

1 2;( 2)2

n nt

olacaktır.

Örnek 7.7 Bir araştırmacı akü fabrikasında çalışan işçiler ile tekstil fabrikasında çalışan işçiler arasında kandaki kurşun konsantrasyonu bakımından farklılık olup olmadığını araştırmak istemiştir. Bu amaçla akü fabrikasından 17, tekstil fabrikasından 10 işçiyi tesadüfi olarak seçmiş ve kandaki kurşun konsantrasyonu değerlerini( mg/100gr)*100 olarak kaydetmiştir. Verilerden hareketle her işçi grubu için aşağıdaki bulguları elde etmiştir. Buna göre iki işçi grubu arasında sözü edilen değerler bakımından farklılık olup olmadığını %95 güven düzeyinde belirleyiniz.

200

Akü Fabrikası (1) Tekstil Fabrikası(2)

1X =8,157 2X =3,943

21s =0,45 2

2s =0,13

1n =17 2n =10

Araştırmada iki örneklem ile çalışılmıştır ve örneklem hacimleri küçüktür. Bundan dolayı küçük örneklemler için ana kütle ortalamaları arasındaki farka ilişkin hipotez testi gerçekleştirilecektir. Ayrıca ana kütle standart sapmalarına ilişkin bir bilgi bulunmamaktadır.

1) Hipotezler;

0 1 2:H

1 1 2:H biçiminde olacaktır. Buna göre çift taraflı test uygulanacaktır.

2) Anlamlılık Düzeyi;

Karar %95 güvenle verileceğinden anlamlılık düzeyi =0,05 olarak belirlenir.


Ana kütle ortalamaları arasındaki farka ilişkin hipotez testi gerçekleştirileceğinden, ortalama farklarının örnekleme dağılımı kullanılacaktır. Ayrıca küçük örneklemlerden yararlanıldığından

1 2 2n n serbestlik dereceli Student-t dağılımından ve olasılık kurallarından yararlanılacaktır.

4) Red Bölgesi;

Red bölgesinin belirlenmesinde anlamlılık düzeyi ve 1H ’in yönü dikkate alınıyordu. Buna göre

red bölgesi dağılımın her iki ucunda / 2 kadar olmak üzere toplam kadardır. Küçük örneklemler

ile çalışıldığından Student-t dağılımından yararlanılacaktır. Buna göre kritik değer 1 2;( 2)

2n n

t

=

0,025;17 10 2t =2,06

5) Test İstatistiği;

1 2

2 21 1 2 2

1 2 1 2

8,157 3,943

(17 1)(0,45) (10 1)(0,13) 1 1( 1) ( 1) 1 117 10 2 17 102

4,21418,32

0,23

X Xt

n s n sn n n n

6) İstatistiksel karar;

hesapt =18,32> 0,025;17 10 2t =2,06 0H Reddedilir. Dolayısıyla, akü fabrikasında çalışan işçiler ile

tekstil fabrikasında çalışan işçiler arasında kandaki kurşun konsantrasyonu bakımından istatistiksel olarak anlamlı bir farklılık olduğu söylenebilir.

201

Tek Ana Kütle Oranına İlişkin Hipotez Testi

Tek bir ana kütle oranına ilişkin hipotez testinde, ilgili ana kütle oranının belirli bir değere 0

eşitliği biçiminde ifade edilen sıfır hipotezinin test edilmesi işlemleri gerçekleştirilir. Sözü edilen test için hipotezler aşağıdaki gibi kurulur:

0 0:H 0 0:H 0 0:H

1 0:H 1 0:H 1 0:H


Burada da anlamlılık düzeyinin belirlenmesi, örneklem hacminin belirlenmesi ve red bölgesinin belirlenmesi aşamaları “ana kütle ortalamasına ilişkin test” başlığındaki gibidir. Büyük örneklem durumu için test istatistiği aşağıdaki gibi hesaplanır:

0

P

Pz

Oranın standart hatası ise, ana kütle oranı için iddia edilen değeri kullanılarak aşağıdaki gibi hesaplanır:

0 0(1 )P n

Örnek 7.8

Belirli bir bölgede faaliyet gösteren devlet hastanelerinde görevli hemşirelerin işi bırakma niyeti oranı 0,15’ten büyük olduğu iddia edilmektedir. Bu iddianın doğruluğunu araştırmak amacıyla yapılan bir araştırmada tesadüfi olarak seçilen 350 hemşireye bir anket uygulanmıştır. “işten ayrılmayı düşünüyor musunuz?” sorusuna “evet” diyen hemşirelerin sayısı 73 olarak belirlenmiştir. İddianın doğruluğunu 0,01 anlamlılık düzeyinde araştırınız.

n =350 hemşire ve r = 73 olarak belirlenmiştir. Buradan, 73350

rp

n 0,21 olarak hesaplanır.

Araştırmada tek örneklem ile çalışılmıştır ve örneklem hacmi büyüktür. Bundan dolayı büyük örneklemler için ana kütle oranına ilişkin hipotez testi gerçekleştirilecektir

1) Sıfır hipotezi ve alternatif hipotezin ifade edilmesi;

0 0:H 0 : 0,15H

1 0 1: : 0,15 H H biçiminde olacaktır. Araştırmada sözü edilen hemşirelerin işi

bırakma niyeti oranının 0,15’ten büyük olduğu iddia edildiğinden tek taraflı test uygulanacaktır.

2) Anlamlılık düzeyinin belirlenmesi;

Anlamlılık düzeyi =0,01 olarak verilmiştir.


Ana kütle oranına ilişkin hipotez testi gerçekleştirileceğinden, oranların örnekleme dağılımı kullanılacaktır. Ayrıca büyük örneklemlerden yararlanıldığından standart normal dağılım olan z dağılımından ve olasılık kurallarından yararlanılacaktır.

202

4) Red Bölgesi;

Red bölgesinin belirlenmesinde anlamlılık düzeyi ve 1H ’in yönü dikkate alınıyordu. Tek taraflı

bir test uygulanacağından ve 1 0 1: : 0,15 H H biçiminde olduğundan red bölgesi

dağılımın sağ ucunda kadar olmak üzere toplam kadardır. Buna göre kritik z değerleri

tablosundan z = 0,01z =2,33 belirlenir.

5) Test İstatistiğinin hesaplanması;

0 0(1 )P n

0.15(1 0,15)

350

0,019 olmak üzere,

0

P

Pz

0,21 0,15

0,019

= 3,16

olarak hesaplanır.

6) İstatistiksel kararın verilmesi;

hesapz =3,16> z =2,33 0H Reddedilir. Dolayısıyla, %99 güven düzeyinde belirtilen bölgede

faaliyet gösteren devlet hastanelerinde görevli hemşirelerin işi bırakma niyeti oranı 0,15’ten büyük olduğuna karar verilir.

Ana Kütle Oranları Arasındaki Farka 1 2 İlişkin Hipotez Testi

Ana kütle oranları arasındaki farka ilişkin hipotez testlerinde aralık tahmininde belirtildiği gibi, ana kütlelerden tesadüfi olarak çekilen birbirinden bağımsız n1 ve n2 hacimli örneklemler yeterince büyük olduğunda oran farklarının örnekleme dağılımı normal dağılıma uymaktadır. Buna göre hipotezler ve test istatistiği aşağıdaki gibi olacaktır.

0 1 2:H 0 1 2:H 0 1 2:H

1 1 2:H 1 1 2:H 1 1 2:H


1 2

1 1 2 2

1 2

(1 ) (1 )

p pz

p p p pn n

Tek-Yönlü Varyans Analizi

Önceki kesimlerde, tek ana kütle ve iki ana kütle aritmetik ortalamalası arasındaki farka ilişkin hipotez testlerine değinilmişti. Uygulamada ikiden çok ana kütle ortalamasının karşılaştırılması problemleriyle yoğun bir biçimde karşılaşılmaktadır. Başka bir ifadeyle, ikiden çok grubun incelenen değişken bakımından karşılaştırılması söz konusu olabilir. Özellikle deneysel araştırmalarda grup değişkeni olarak tanımlanan bağımsız değişkenin incelenen bağımlı değişken üzerindeki etkisi, grup ortalamaları arasındaki farklılığın belirlenmesiyle ortaya konabilir. Bu amaçla kullanılan çözümleme yaklaşımı Varyans Analizi olarak adlandırılmaktadır. Çözümleme bağımlı değişkendeki toplam değişimi unsurlarına ayrıştırmayı amaçlamaktadır. Böylece bağımsız değişkenin bağımlı değişken üzerindeki salt etkileri ortaya çıkarılabilmektedir. Araştırmanın amacına uygun olarak çeşitli varyans analizi yaklaşımları söz konusudur. Burada, tek bir bağımsız değişkenin varlığı durumundaki Tek-Yönlü Varyans Analizi (Tek-Yönlü ANOVA) açıklanacaktır.

203

Tek-Yönlü Varyans Analizi, bağımlı değişken üzerinde sadece bir bağımsız değişkenin etkisinin araştırıldığı, dolayısıyla bağımsız değişkenin düzeyleri olarak ortaya çıkan gruplar arasındaki farkların istatistiksel olarak anlamlılığının araştırıldığı bir yaklaşımdır. Çözümlemede F-Testinden yararlanılır. Bu amaçla test istatistiği olarak F istatistiği kullanılır. F istatistiği, aynı varyansın bağımsız iki tahmincisinin

birbirine oranıdır. Bu oran, pyın serbestlik derecesi 1 =(k-1) ve paydanın serbestlik derecesi 2 =(N-k)

serbestlik dereceleriyle dağılan F örnekleme dağılımının bir terimidir.

Tek-Yönlü Varyans Analizinde, her hangi bir gözlem değerinin bileşenlerini gösteren doğrusal toplamsal model aşağıdaki gibidir:

i=1,2,...,k

j=1,2,...,n

ij j ij

j

y

Burada;

ijy : Ana kütlenin herhangi bir terimi (j’inci gruptaki i’nci birimin aldığı değer)

: Genel ortalama

j : Grup etkisi

ij : Deneysel hatadır.

Tek-Yönlü Varyans Analizinde, “kareler toplamı” ve “kareler ortalaması” kavramları özel önem taşımaktadır. Söz konusu kareler toplamı verideki toplam değişkenliği açıklar. Özellikle deneysel araştırmalarda belirlenen gözlemlerin genel ortalamadan olan sapmalarının kareleri toplamını, bu sapmalara neden olan öğelere göre kısımlara ayırmak ve çözümlemek, varyans analizinin temelini oluşturmaktadır. Buna göre toplam değişim aşağıdaki gibi iki öğeye ayrılır:

= ( )Toplam Değişim Gruplararası Değişim Gruplariçi Değişim Hata Toplam değişim ve unsurlarını hesaplamada kullanılan formülleri oluşturmada kullanılmak üzere

aşağıdaki üç temel nicelik tanımlanabilir.

2

1 1

ink

iji j

A y

2

1

ki

i i

YT

n

2Y

CN

Burada; ijy gözlem değerlerini, iY i’nci gruptaki gözlem değerleri toplamını, Y tüm gözlemlerin

toplamını ve in ise i’nci gruptaki gözlem değeri (terim) sayısını ifade etmektedir. Buna göre kareler

toplamları;

Gruplararası kareler toplamı : T C (k-1 serbestlik dereceli)

Gruplariçi (Hata) kareler toplamı: A T (N-k serbestlik dereceli)

Genel kareler toplamı : A C (N-1 serbestlik dereceli) biçiminde yazılabilir. Burada toplam değişimin ifadesi olan genel kareler toplamının diğer iki kareler toplamının toplamı olduğuna dikkat edilmelidir.

Kareler toplamlarının serbestlik derecesine oranlanmasıyla kareler ortalamalarına ulaşılır.

Gruplararası kareler ortalaması 2Bs ve gruplariçi kareler ortalaması 2

Ws aşağıdaki gibi yazılabilir:

2

1B

T Cs

k

2W

A Ts

N k

204

Buradan Tek-Yönlü Varyans Analizi için hipotezler aşağıdaki gibi yazılabilir.

0 : 0iH ya da 0 1 2: ... kH

1 : 0iH En az bir ya da 1 1 2: , ..., ' kH ların en az biri farklıdır

Çözümlemede kullanılacak test istatistiği yukarıda açıklanan iki varyans tahmincisinin birbirine oranı biçiminde şu biçimde yazılabilir.

2

2B

W

sF

s

Varyans analizinde yukarıda açıklanan çeşitli hesaplamalar genel olarak aşağıdaki tabloda topluca gösterilebilir.

Tablo 7.2: Tek-Yönlü varyans analizi tablosu

Değişim Kaynağı Serbestlik Derecesi

Kareler Toplamı

Kareler Ortalaması

F Değeri

Gruplar Arası 1 =k-1 T C 2

1B

T Cs

k

2

2B

W

sF

s

Gruplar İçi (Hata) 2 =N-k A T 2

W

A Ts

N k

Genel N-1 A C

Hesaplanan F istatistiğinin anlamlılığının belirlenmesinde F-Dağılımının anlamlılık düzeyi, (k-1)

ve (N-k) serbestlik dereceli kritik değerinden yararlanılır. Red bölgesi dağılımın sağ ucunda yer

alır. Buna göre,

0; 1 , .hesap k N kF F H Reddedilir

Şekil 7.4: F dağılımı için red bölgesi

Varyans analizi bütünleşik bir çözümlemedir. Yani, 0H reddedildiğinde gruplar arasındaki farkın

anlamlı olduğunu belirtir, buna karşın hangi gruplar arasında farklılığın bulunduğu konusunda bilgi içermez. Bunun için farklı grupların belirlenmesi amacıyla çeşitli yaklaşımlar geliştirilmiştir. Burada bu konuya değinilmeyecektir.

Çömlekçi, N. (2003). Deney Tasarımı İlke ve Teknikleri, Alfa Yayınları

205

Örnek 7. 9

Bir araştırmacı, üç farklı hastalık grubunun (Kronik hepatit (1), Siroz (2) ve Malignite (3) ) hastaların albüminleri (gr/dl) bakımından farklı olup olmadığını araştırmak istemiştir. Her bir grup hastalardan tesadüfi olarak 15 hasta için sözü edilen ölçümleri almıştır. Veriler aşağıdaki tabloda sunulmuştur. Hastalık grupları arasında albümin ölçümleri bakımından farklılık olup olmadığını 0,05 anlamlılık düzeyinde belirleyiniz.

Tablo 7.3: Hastalık gruplarına ilişkin Örnek 7.9 verileri

Hastalık Grupları

Kronik Hepatit Siroz Malignite

5,0

5,1

4,5

4,7

5,3

4,7

4,5

3,6

2,8

3,8

3,0

4,3

3,4

1,8

2,2

2,7

2,5

3,1

2,8

2,2

0,8

1,3

2,2

2,7

1,9

1,4

2,5

1,0

1,5

0,7

Toplam Yi Y1=44 Y2=28 Y3=16

Y=88

1) Hipotezler;

0 : 0iH ya da 0 1 2 3:H

1 : 0iH En az bir ya da 1 1 2 3: , , ' H lerin en az biri farklıdır

2) Anlamlılık düzeyi;

Anlamlılık düzeyi soruda 0,05 olarak verilmiştir. Dolayısıyla %95 güven düzeyinde karar verilecektir.

3) Örnekleme dağılımı;

İkiden çok grup ortalamasının karşılaştırılması söz konusu olduğundan gruplararası değişimin gruplariçi değişime oranlanmasından yararlanılacaktır. Bu nedenle F-testi uygulanacak, bağlı olarak F dağılımından yararlanılacaktır.

4) Red bölgesi;

F dağılımı 0 ile ∞ arasında tanımlı bir dağılımdır. Dolayısıyla red bölgesi dağılımın sağ ucunda yer alacaktır. Karar kuralı aşağıdaki biçimde ifade edilmişti:

0; 1 , .hesap k N kF F H Reddedilir

Bu durumda örneğimiz için F tablo değeri;

0.05; 3 1 , 30 3F

=3,35 olarak belirlenir.

5) Test istatistiği;

Test istatistiği için önce toplam değişimin unsurlarının elde edilmesi gerekir. Önce yukarıda tanımlanan temel nicelikler aşağıdaki gibi hesaplanır.

206

A temel niceliği tüm gözlem değerlerinin kareleri toplamından oluşur,

2

1 1

ink

iji j

A y

=[(5,0)2+(5,1)2+…+(3,0)2+(4,3)2+…+(0,8)2+(1,3)2+…+(1,5)2+(0,7)2]=312

T temel niceliği grup toplamlarına dayandırılmıştır,

2

1

ki

i i

YT

n

= 2 2 2

44 28 16

10 10 10

=297,6

C niceliği ise terimler toplamına dayandırılmıştır,

2 28830

YC

N 258,13 olarak hesaplanır. Burada A>T>C sıralaması daima gerçekleşir.

Hesaplamalar varyans analizi tablosunda özetlenir:

Tablo 7.4: Örnek 7.9 verileri için varyans analizi tablosu

Değişim Kaynağı

Serbestlik Derecesi

Kareler Toplamı Kareler Ortalaması

F Değeri

Gruplar Arası

(Hastalık Grupları)

1 =k-1

3-1=2

T C =297,6-258,13

= 39,47

2

2

139,47

19,742

B

B

T Cs

k

s

2

2B

W

sF

s

19,7437,25

0,53F

Gruplar İçi

(Hata) 2 =N-k

30-3 =27

A T =312-297,6

= 14,4

2

2 14,40,53

27

W

W

A Ts

N k

s

Genel N-1

30-1 =29

A C =312-258,13

= 53,87

6) İstatistiksel karar;

0; 1 ,37,25 3,35 .hesap k N kF F H Reddedilir

Buna göre Üç hastalık grubundaki

hastaların albumin ölçümleri arasındaki farkın istatistiksel olarak anlamlı olduğuna karar verilir.

Ki-Kare ( 2 ) Testi

Önceki kesimlerde anlatılan hipotez testleri, sayısal değişkenlere ilişkin testler idi. Uygulamada sayısal olmayan, başka bir ifadeyle sınıflayıcı ve sıralayıcı ölçekle ölçülmüş veri setleri ile sıkça

karşılaşılmaktadır. Bu durumda sık başvurulan hipotez testi yaklaşımı 2 Testidir. Bu test, uygunluk,

bağımsızlık ve homojenlik testi olmak üzere üç biçimde uygulanmaktadır. Ki-Kare Uygunluk Testi, n birimlik bir örneklemin belirli bir teorik dağılıma uyan bir ana kütleden gelip gelmediğinin belirlenmesinde kullanılır. Ki-Kare Bağımsızlık Testi, sınıflayıcı ya da sıralayıcı ölçekle ölçülmüş iki veya daha fazla düzeye sahip iki sayısal olmayan değişken arasında ilişki olup olmadığının belirlenmesinde kullanılır. Ki- Kare Homojenlik testi ise, birbirinden bağımsız olarak seçilen iki veya daha fazla örneklemin aynı ana kütleden gelip gelmediği konusunda karar verilmeye çalışılır. Burada önceki testlere paralel olarak Homojenlik testi açıklanacaktır.

Ki-Kare Homojenlik testinde biri örneklemlerin ait olduğu değişken (grup değişkeni), diğeri incelenen değişken olmak üzere, birinin düzeyleri satırlarda diğerinin düzeyleri de sütunlarda olacak biçimde çapraz

207

tablo (kontenjans tablosu) olarak adlandırılan tablo oluşturulur. Bu çapraz tabloda oluşan hücrelerde ilgili birim sayısına (hücre frekansı) yer verilir.

Ki-Kare homojenlik testi aşağıda verilen örnekle açıklanacaktır.

Örnek 7.10

200 yetişkinden oluşan bir örneklem için sigara içme durumunun cinsiyete göre değişiklik gösterip göstermediğinin araştırıldığı bir çalışmada aşağıdaki gibi bir çapraz tablo oluşturulabilir:

Tablo 7.5: 2x2 lik çapraz tablo

Cinsiyet

Sigara İçme Durumu

TOPLAM İçiyor İçmiyor

Erkek 55 34 25 46 80

Bayan 30 51 90 69 120

TOPLAM 85 115 200

Oluşturulan çapraz tabloda, gözlenen frekanslara karşılık beklenen (teorik) frekanslar hesaplanır ve gözlenen frekanslar ile beklenen frekanslar arasındaki farklara dayanan bir test istatistiği hesaplanır. Beklenen frekanslar şu şekilde hesaplanır: Örneğin erkek*içiyor hücresi için 55 gözlenen frekansa karşılık beklenen frekans, ilgili hücrenin satır toplamı ile sütun toplamı çarpılır ve toplam birim sayısı olan 200 değerine bölünür. Bu işlem yapıldığında beklenen frekans,

(80)(85)/200 = 34 olarak hesaplanır. Diğer hücrelerin beklenen frekansları da benzer biçimde hesaplanır. Beklenen frekanslar da tabloda hücrelerin sağında italik olarak yazılmıştır.

Test için hipotezler şu biçimde kurulur:

0H = Erkek ve bayanlar sigara içme durumu bakımından homojendir.

1H = Erkek ve bayanlar sigara içme durumu bakımından heterojendir.

= 0,05 alalım. Serbestlik derecesi, R satır sayısı, C sütun sayısı olmak üzere (R-1)(C-1)= (2-1)(2-1)= 1 olarak belirlenir.

Test istatistiği aşağıdaki eşitlik yardımıyla hesaplanır:

2

2

1 1

( )R Cij ij

i j ij

G B

B

Formülde ijG : Gözlenen frekanslar, ijB : Beklenen frekanslardır. Buna göre örneğimiz için test

istatistiği,

2 2 2 2

2 (55 34) (25 46) (30 51) (90 69)34 46 51 69

= 37,6 olarak bulunur.

Hesaplanan test istatistiği Ki-Kare tablo değeri, 2( ;( 1)( 1))R C

tablo kritik değeri ile karşılaştırılarak

karar verilir. Örneğimiz için 20,05;1 = 3,84 olarak belirlenir. Bu durumda, 2

hesap =37,6> 20,05;1 = 3,84

olduğundan 0H reddedilir. Sonuç olarak erkek ve bayanların sigara içme durumu bakımından heterojen

olduklarına (birbirine benzemediklerine) %95 güvenle karar verilir.

208

Özet

İstatistiksel tahmin ve hipotez testleri istatistiğin çıkarsama işlevi ile ilgilidir. İstatistiksel tahmin, ana kütle parametrelerinin değerinin örneklem istatistikleri yardımıyla araştırılması çalışmalarıdır. İstatistiksel tahmin, nokta tahmini ve aralık tahmini olmak üzere iki grupta incelenmektedir.

İstatistiksel hipotez, ana kütle parametreleri hakkında belirli bir amaca yönelik olarak ileri sürülen iddialardır. Hipotez testi, ana kütleparametreleri hakkındaki iddiaların doğruluğunun örneklem istatistikleri ve onların örnekleme dağılımının olasılık kurallarından yararlanarak test edilmesi işlemlerini gerçekleştirir. Hipotez testlerinde iki tür hata söz konusudur. Gerçekte doğru olan sıfır hipotezinin test sonucunda reddedilmesi I. Tip hata olarak adlandırılır. Bu hatayı işleme olasılığı anlamlılık düzeyidir. II. Tip hata gerçekte yanlış olan sıfır hipotezini reddetmemektir. Hipotez testinde şu aşamalar izlenir:

1. Hipotezlerin ifade edilmesi

2. Anlamlılık düzeyi nın seçilmesi

3. Örnekleme dağılımının belirlenmesi

4. Red bölgesinin belirlenmesi

5. Test istatistiğinin Hesaplanması

6. İstatistiksel kararın verilmesi

Hipotez testleri parametrik ve parametrik olmayan testler biçiminde iki temel gruba ayrılır. Parametrik testler, bazı varsayımları gerektiren testlerdir ve incelenen değişkenin en az aralıklı ölçme düzeyinde ölçülmüş olmasını gerektirirler. Parametrik olmayan testler, iddialı varsayım ileri sürmezler ve genellikle sınıflayıcı ve sıralayıcı ölçme düzeyindeki verilere uygulanırlar. Bu ünitede açıklanan t-testi, z-testi ve varyans analizi parametrik testlerdir. Ki-Kare testi ise parametrik olmayan testlerdendir.

t-testi ve z-testi tek ve iki ana kütle aritmetik ortalamasına ilişkin testlerdir. İkiden çok ana kütle ortalamasına ilişkin test ise varyans analizi olarak adlandırılmaktadır. Ki-Kare testi iki ya da daha fazla grubun sınıflayıcı veya sıralayıcı ölçme düzeyinde ölçülmüş değişken bakımından farklılığını araştıran bir testtir.

Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesinin önemli olduğu ilk ünitede belirtilmişti. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir.

209

Kendimizi Sınayalım 1. Gerçekte doğru olan sıfır hipotezinin test sonucu reddedilmesi durumunda hangi hata işlenmiş olur?

a. Sistematik hata

b. Tesadüfi hata

c. hatası

d. hatası

e. Standart hata

2-4. sorular aşağıdaki probleme göre cevaplandırılacaktır.

Bir hastanede hasta memnuniyet oranı tahmin edilmek istenmektedir. Bu amaçla tesadüfi olarak 500 hasta ile görüşülmüştür. 300 hasta memnun olduğunu belirtmiştir.

2. Hastanenin memnuniyet oranının %95 güven sınırlarından üst sınır değeri kaçtır?

a. 0,75

b. 0,95

c. 0,56

d. 0,64

e. 0,05

3. Oranın standart hatasının tahmin değeri aşağıdakilerden hangisidir?

a. 0,05

b. 0,04

c. 0,02

d. 0,06

e. 0,5

4. Hastanenin memnuniyet oranının nokta tahmini kaçtır?

a. 0,75

b. 0,70

c. 0,90

d. 0,60

e. 0,80

5. Anlamlılık düzeyi hangi hatayı işleme olasılığıdır?

a. hatası

b. hatası

c. Standart hata

d. Tesadüfi hata

e. Sistematik hata

6-8. sorular aşağıdaki probleme göre cevaplandırılacaktır.

Zamanında doğum yapan, sigara içen kadınların çocuklarına ilişkin baş çevresi ortalamasının içmeyenlerin çocuklarına göre küçük olup olmadığı araştırılmak istenmiştir. Her iki gruptan tesadüfi olarak seçilen 10’ar kadının çocuklarının baş çevresi ölçümleri sonuçları aşağıdaki gibidir:

Sigara içen (1) Sigara içmeyen (2)

1X =34 2X =37

21s =2,25 2

2s =4,0

1n =10 2n =10

6. Bu test için karşıt hipotez aşağıdakilerden hangisidir?

a. 1 2

b. 1 2

c. 1 2

d. 1 2

e. 1 2

7. Bu test için hesaplanacak test istatistiğinin değeri aşağıdakilerden hangisidir?

a. 3,80

b. -3,80

c. -4,80

d. 4,80

e. -2,80

210

8. 0,05 anlamlılık düzeyindeki test sonucunda aşağıdaki kararlardan hangisi doğrudur?

a. Sigara içen kadınların çocuklarına ilişkin baş çevresi ortalaması içmeyenlerin çocuklarına göre daha küçüktür

b. Sigara içen kadınların çocuklarına ilişkin baş çevresi ortalaması içmeyenlerin çocuklarına göre daha büyüktür

c. Sigara içen kadınların çocukları ile içmeyenlerin çocuklarının baş çevresi ortalaması aynıdır

d. Sigara içen kadınların çocukları ile içmeyenlerin çocuklarının baş çevresi ortalaması farklıdır

e. Sigara içen kadınların çocukları ile içmeyenlerin çocuklarının baş çevresi ortalaması benzerdir

9. Hipotez testlerinde işlenebilecek II.Tip Hata aşağıdakilerden hangisidir?

a. Gerçekte doğru olan sıfır hipotezinin reddedilmesi

b. Gerçekte doğru olan sıfır hipotezinin reddedilememesi

c. Gerçekte doğru olan karşıt hipotezinin reddedilmesi

d. Gerçekte yanlış olan sıfır hipotezinin reddedilmesi

e. Gerçekte yanlış olan sıfır hipotezinin reddedilememesi

10. İkiden çok ana kütle ortalamasına ilişkin test aşağıdakilerden hangisidir?

a. t-testi

b. z-testi

c. F-testi

d. Ki-Kare testi

e. Oran testi


1. c Yanıtınız yanlış ise “Hipotez Testleri” başlıklı konuyu yeniden gözden geçiriniz.

2. d Yanıtınız yanlış ise “Ana kütle Oranına İlişkin Aralık Tahmini ” başlıklı konuyu yeniden gözden geçiriniz.

3. c Yanıtınız yanlış ise “Ana kütle Oranına İlişkin Aralık Tahmini” başlıklı konuyu yeniden gözden geçiriniz.

4. d Yanıtınız yanlış ise “Nokta Tahmin” başlıklı konuyu yeniden gözden geçiriniz.

5. a Yanıtınız yanlış ise “Hipotez Testleri” başlıklı konuyu yeniden gözden geçiriniz.

6. d Yanıtınız yanlış ise “İki ana kütle ortalaması arasındaki farkın hipotez testi” başlıklı konuyu yeniden gözden geçiriniz.

7. b Yanıtınız yanlış ise “İki ana kütle ortalaması arasındaki farkın hipotez testi” başlıklı konuyu yeniden gözden geçiriniz.

8. a Yanıtınız yanlış ise “İki ana kütle ortalaması arasındaki farkın hipotez testi” başlıklı konuyu yeniden gözden geçiriniz.

9. e Yanıtınız yanlış ise “Hipotez Testleri” başlıklı konuyu yeniden gözden geçiriniz.

10. c Yanıtınız yanlış ise “Varyans analizi” başlıklı konuyu yeniden gözden geçiriniz.


Sıra Sizde 1 Aralık tahmininde, ana kütle parametresinin belirli bir olasılık düzeyinde içerisinde yer alabileceği bir aralık belirlenir. Belirtilen olasılık düzeyi, tahminin doğruluğundan ne kadar emin olunacağını belirtir ve aralığı oluşturan güven sınırlarının belirlenmesinde kullanılır. Aralık tahmininde oluşacak aralığa “güven aralığı”, aralığın alt ve üst sınır değerlerine ise “güven sınırları” adı verilir.

211

Sıra Sizde 2 A İlacı (1) B İlacı (2)

1X =15 dk. 2X =11dk.

21s =12,25 dk. 2

2s =5,29 dk.

1n =16 2n =12

Tahmin %99 güvenle yapılacağından, ana kütle ortalamaları arasındaki farkın tahmininin güven düzeyi (1- ) 0,99 olacaktır. Örneklem hacimleri küçüktür (n1 ve n2<30). Bu durumda, t dağılımından yararlanarak, ilgili güven düzeyi ve

1 2 2n n serbestlik derecesi için “kritik t

değerleri tablosu”ndan bulunacak t değerleri kullanılır. Buna göre,

1 20.005;(16 12 2);( 2)2 n n

t t = 2,779 değeri

belirlenir. Ana kütle standart sapmaları bilinmediğinden örneklem standart sapmalarından yararlanarak %95 güven sınırları aşağıdaki gibi belirlenir:

1 2

2 21 1 2 2

1 2 1 2

( 1) ( 1) 1 12x x

n s n ss

n n n n

=

(16 1)12,25 (12 1)5,29 1 1

16 12 2 16 12

= 1,36

= 1,16

1 2 1 21 2 1 21 2 1 2 1 2;( 2) ;( 2)2 2

P[( ) ( ) ] 1x x x xn n n nX X t s X X t s

Pr((15-11)-(2,779)(1,16) < 1 2 <

(15-11)+(2,779)(1,16))=0,99

Pr(0,78< 1 2 <7,22)=0,99

A ve B gibi iki ilacın ortalama etki sürelerinin arasındaki fark, %99 güvenle 0,78 dk ile 7,22 dk arasında herhangi bir değer alır.

Sıra Sizde 3 I. TİP HATA: Gerçekte doğru olan sıfır hipotezini test sonucunda yanlıştır diye reddetmeye I. Tip Hata adı verilir. α-Hatası olarak da adlandırılan bu hatayı işleme olasılığı α kadardır.

II. TİP HATA: Gerçekte yanlış olan sıfır hipotezini test sonucunda doğrudur diye “reddedilemez” kararı vermeye II. Tip Hata adı verilir. β-Hatası olarak da adlandırılan bu hatayı işleme olasılığı da β kadardır. Dolayısıyla;

α: Birinci tip hatayı işleme olasılığı,

β: İkinci tip hatayı işleme olasılığı,

1-α: 0H

gerçekte doğru olduğunda onu

reddetmeme olasılığıdır ve aralık tahmininde olduğu gibi “Güven Düzeyi” olarak adlandırılır.

1-β: 0H

gerçekte yanlış olduğunda onu

reddetme olasılığıdır ve “Testin Gücü” olarak adlandırılır.

Sıra Sizde 4 Red bölgesinin büyüklüğü Tip I hata olasılığı olan α’ya bağlıdır. Buna göre anlamlılık düzeyinin belirlenmesiyle red bölgesinin büyüklüğü de ortaya çıkmış olur. Karşıt hipotez ise, red bölgesinin yerini belirlemede yardımcı olur. Karşıt hipotez, ana kütle ortalamasının iddia edilen değerinden büyük ya da küçük bir değer olduğu biçiminde ise, yani tek taraflı bir test gerçekleştirilecekse, red bölgesi birinci durumda dağılımın pozitif (sağ) ucunda yer alır. İkinci durumda ise dağılımın sağ ucunda gösterilir. Eğer karşıt hipotez ana kütle ortalamasının iddia edilen değerinden farklı olduğu biçiminde ise, red bölgesi dağılımın iki ucunda olmak üzere iki eşit bölgede yer alır.


Alpar, R. (2011). Uygulamalı Çok Değişkenli İstatistiksel Yöntemler. Ankara: Detay Yayıncılık.

Çömlekçi, N. (1998). Temel İstatistik İlke ve Teknikleri. İstanbul: Bilim Teknik Yayınevi.

Çömlekçi, N. (2003). Deney Tasarımı İlke ve Teknikleri. İstanbul: Alfa Basım Yayın Dağıtım.

Gürsakal, N. (2007). Çıkarımsal İstatistik, Bursa: Dora Basım Yayın Dağıtım.

Lwanga, S.K. and Tye, C.Y. (1986) Teaching Health Statistics. Geneva: World Health Organization.

Serper, Ö (2004). Uygulamalı İstatistik 2. Bursa: Ezgi Kitabevi.

212


Korelasyon ve regresyon kavramlarını açıklayabilecek,

İki değişken arasındaki korelasyonu hesaplayabilecek,

Regresyon denkleminin nasıl kurulacağını ifade edebilecek


Anahtar Kavramlar

Korelasyon

Sıra korelasyon

Regresyon

Belirlilik katsayısı

Bağımlı değişken

Bağımsız değişken

İçindekiler

Giriş

Korelasyon kuramı

Pozitif ve negatif korelasyon

Ana kütle ve örneklemden korelasyon katsayısı

Sıra korelasyon katsayısı

Basit doğrusal regresyon analizi

Belirlilik katsayısı

Eğim katsayısının anlamlılık testi

Excel uygulamaları

8

213

GİRİŞBölüm 7’de sözel değişkenler arasındaki ilişkinin Ki-Kare analiziyle belirlenebileceği ifade edilmişti. Eğer değişkenler sayısal ise, bu değişkenler arasındaki ilişkinin belirlenmesi “korelasyon analizi” nin konusudur. Korelasyon analizi x ve y gibi herhangi iki değişken arasındaki ilişkinin yönünü (aynı veya ters yönlü) ve derecesini (kuvvetli veya zayıf) verir. Oysa çoğu analizde, değişkenler arasındaki ilişkinin matematiksel bir fonksiyonla da ifade edilmesi istenir. Yani bağımlı ve bağımsız değişken(ler) arasındaki ilişkinin sabit terimi ve eğim katsayısı belirlenmek istenir. İşte bunu sağlayan analize de “regresyon analizi” adı verilir. Bu ünitede de önce korelasyon analizi anlatılacak, daha sonra da korelasyonun yeterli olmadığı durumlardan bahsedilerek, daha ayrıntılı analizler yapılmasını sağlayan regresyon analizi açıklanacaktır.

KORELASYON KURAMI Aralarında ilişki araştırılan değişkenlerden birinde değerler azalırken, diğerinin değerleri de azalıyorsa ya da değişkenlerden birinin değerleri artarken diğerinin değerleri de artıyorsa (veya zıt yönlü değişmeler gösteriyorsa), bu değişkenler arasında bir ilişki olduğu söylenebilir. Çünkü bu durumda değişkenlerin birinin değerlerindeki değişmeler diğerinin değerlerindeki değişmelerden etkileniyor demektir. Buna karşılık birinin değerleri azalır veya çoğalırken diğerinin değerleri hiç değişmiyorsa, değişkenler arasında bir ilişkinin varlığından söz edilemez. Örneğin öğrencilerin bir derse ilişkin çalışma süresi arttıkça, başarı notları da yükselecektir. Buna karşın özel hastanelerin tedavi ücretleri arttıkça, bu hastaneye olan talep azalacaktır.

Değişkenler arasında var olan ilişkileri ölçmek için çeşitli teknikler kullanılabilir. Bunlardan en basiti ise “korelasyon analizi” dir. Korelasyon iki ya da daha çok değişken arasındaki ilişkinin derecesi olarak tanımlanabilir. İki değişken arasındaki ilişkinin derecesine ise ”basit korelasyon” denir. Bir serpilme çiziminde (diyagramında), bütün (xi,yi) noktaları bir doğruya yakın yerlerde toplanıyorlarsa korelasyon “doğrusaldır”. Anlaşılacağı gibi eğer değişkenler arasında bir ilişki varsa, bu ilişki pozitif (aynı yönlü) veya negatif (ters yönlü) olabilir.

Pozitif ve Negatif Korelasyon

İki değişken aynı yönde birlikte değişiyorlarsa, yani değerleri birlikte artıp birlikte azalıyorlarsa, aralarında pozitif korelasyon var demektir. Örneğin, büyük bir yerleşim yerinde nüfus arttıkça, hastane sayısı da artar. Dolayısıyla bir yerleşim yerinin nüfusuyla, hastane sayısı arasında aynı yönlü yani pozitif bir ilişki var demektir. Örneğin, y ve x değişkenleri için veriler Tablo 8.1’deki gibi elde edilmiş olsun. Tablo 8.1’deki veriler incelendiğinde değişkenlerin her ikisinin de birlikte arttığı görülmektedir. Bu verilerin bir grafiği çizildiğinde de Şekil 1’deki gibi doğrusal artan bir grafik elde edilecektir.

Korelasyon ve RegresyonAnalizi

214

Tablo 8.1: Pozitif Doğrusal Korelasyon İçin Veri Tablosu

yi xi

5 120

8 123

12 125

15 128

17 132

20 134

22 138

25 140

28 145

30 152

Şekil 8.1: Pozitif Doğrusal Korelasyon Grafiği

İki değişken ters yönlerde değişme eğilimi gösteriyorlarsa, negatif korelasyonlu oldukları ifade edilir. (xi) arttığında (yi) azalıyorsa ya da tersi söz konusu olduğunda x ve y değişkenleri arasında ters yönlü yani negatif bir ilişki var demektir. Örneğin özel bir hastanenin hastalara sunduğu hizmet bedeli arttığında hasta sayısında bir azalma oluyorsa, bu durumda bu değişkenler arasında negatif yönlü bir ilişkiden söz edilir. Tablo 8.2’deki verilerin grafiği Şekil 8.2’de verilmiştir. Şekil 8.2’den de görüleceği gibi değişkenler arsında ters yönlü bir ilişki vardır.

Tablo 8.2: Negatif Doğrusal Korelasyon İçin Veri Tablosu

yi xi

5 152

8 145

12 140

15 138

17 134

20 132

22 128

25 125

28 123

30 120

215

Şekil 8.2: Negatif Doğrusal Korelasyon Grafiği

Ana Kütle ve Örneklem Korelasyon Katsayısı İki değişken arasındaki korelasyonun yönünü, doğrudan serpilme çizimine bakarak belirleyebiliriz. Ancak, bir serpilme çiziminin incelenmesi, x ve y değişkenleri arasındaki ilişki hakkında yaklaşık bir fikir verebilir. x ve y değişkenleri arasındaki korelasyonun derecesini tam ve sayısal olarak ölçmek için “korelasyon katsayısı” adıyla anılan ve genellikle Yunanca harf " " (ro) ile gösterilen bir parametre kullanılır. , ana

kütle korelasyon katsayısını ifade eder. Bunun belli bir örneklemden kestiricisi (tahmincisi) ise “r” harfiyle gösterilir.

Korelasyon katsayısı x ve y değişkenlerinin ne derece birlikte değiştiklerinin bir ölçüsüdür ve alabileceği değerler –1 ve 1 arasında değişir. Korelasyon katsayısı pozitif ise, x ve y birlikte artar ya da azalırlar. Korelasyon katsayısının negatif olması ise x ve y arasında ters yönlü bir ilişki olduğunu ifade eder. Korelasyon katsayısının +1 ya da –1 değerlerine yakın olması değişkenler arasında çok kuvvetli bir ilişki olduğunu, sıfıra yakın olması ise değişkenler arasında hiç bir ilişki olmadığını ifade eder.

Ana kütle korelasyon katsayısı,

N

i

yi

N

i

xi

N

i

yixi

yx

yx

22 )()(

))((

veya

( Xii xx ' , Yii yy ' ) olmak üzere

2'2'

''

ii

ii

yx

yx

şeklinde belirlenir.

Ancak çoğu durumda ana kütle verileri elde edilemeyeceğinden, örneklem korelasyon katsayısı benzer şekilde aşağıdaki gibi hesaplanır:

22 )()(

))((

yyxx

yyxx

rn

i

i

n

i

i

n

i

ii

=

2'2'

''

ii

ii

yx

yx

( xxx ii ' , yyy ii ' )

216

Örnek 8.1:

Özel bir hastanenin yıllık reklam harcamaları ve hastaneye gelen hasta sayıları Tablo 8.1’deki gibi elde edilmiş olsun. Buna göre bu iki değişken arasındaki örneklem korelasyon katsayısını hesaplayarak yorumlayınız. (Bu unite içinde aksi belirtilmedikçe, tüm soru ve örnek verileri, örneklem için olacaktır.)

Tablo 8.3 Reklam Harcamaları ve Hasta Sayıları

Hasta Sayısı (Bin Kişi) (yi)

Reklam Harcaması (Milyon TL) (xi)

10 1,2 12 1,5 13 2,2 15 2,6 17 3,2 19 3,5 22 3,6

Çözüm 8.1

Korelasyon katsayısının hesaplanabilmesi için öncelikle değişkenlere ait ortalamalara ihtiyaç vardır. Bu ortalamalar hesaplandığında 2,56x , 15,43y olarak bulunacaktır. Ortalamalardan sapmalar ve

diğer gerekli hesaplamalar da Tablo 8.4’de verilmiştir.

Tablo 8.4: Örneklem Korelasyon Katsayısı İçin Gerekli İşlemler Tablosu

yi xi yyy ii ' xxx ii '

'2iy

'2ix

' 'i ix y

10 1,2 -5,43 -1,36 29,48 1,85 7,38 12 1,5 -3,43 -1,06 11,76 1,12 3,64 13 2,2 -2,43 -0,36 5,90 0,13 0,87 15 2,7 -0,43 0,14 0,18 0,02 -0,06 17 3,2 1,57 0,64 2,46 0,41 1 19 3,5 3,57 0,94 12,74 0,88 3,36 22 3,6 6,57 1,04 43,16 1,08 6,83

Toplam 105,68 5,49 23,02

Gerekli toplamlar örneklem korelasyon formülünde yerine yazıldığında korelasyon katsayısı,

' '

'2 '2

23,02 23,022,34(10,28)5,49. 105,68

i i

i i

x yr

x y

23,020,96

24,06r

olarak hesaplanır. Görüldüğü gibi korelasyon katsayısının değeri pozitif ve oldukça yüksek bir değerdir (1’e çok yakındır). O halde, reklam harcamalarıyla hastaneye gelen hasta sayıları arasında aynı yönlü (pozitif) ve oldukça kuvvetli bir ilişki vardır.

217

Aşağıdaki veriler için korelasyon katsayısını hesaplayarak yorumlayınız.

yi: 81 85 88 92 95 102 105 110

xi: 28 25 20 18 19 16 12 10

Sıra Korelasyon Katsayısı

Birçok durumda değişkenler sayısal olarak ölçülemez. Örneğin meslek, hastanın sosyal güvence durumu, çeşitli marka tercihleri v.b değişkenler sözel değişkenlerdir. Diğer taraftan, bazı durumlarda gözlem değerlerine “sıra numarası“ verilmesi daha uygun olabilir veya gözlem değerleri herhangi bir ölçüte göre zaten sıralanmış olabilir. Değişkenlerin değerleri yerine sıralarının önem kazandığı böyle durumlarda doğrusal korelasyon katsayısı yerine, “sıra korelasyon katsayısı“ (Spearman korelasyon katsayısı) kullanılır.

Sıra korelasyon katsayısının hesaplanmasında gözlemler, büyüklük, önem vb. özelliklerine göre sıraya dizilir. Bir başka deyişle verilere sıra numarası verilir ve gerçek sayısal değerleri yerine bu sıra numaraları arasındaki ilişki belirlenmeye çalışılır. Bazen de veriler zaten sıralanmış olarak elde edilir. Örneğin hastalar A bölgesinde bulunan hastaneleri, çeşitli kriterlere göre 1 nci, 3 ncü, 4 ncü v.b sıralayabilirler.

Sıra korelasyon katsayısı aşağıdaki formülle hesaplanır:

)1(

61

2

2

nn

dr

i

s

Formüldeki,

di:sıralamalar arasındaki fark,

n:gözlem sayısı’dır. Örnek 8.2:

Z hastanesinde yatarak tedavi gören hastalar için bir X ürünü kullanılmaktadır. Ancak bu X ürününün 6 faklı markası bulunmaktadır. Hastane yönetimi bu ürünleri iki hastaya uygulayarak, memnuniyet derecelerine göre, tercihlerini sıralamalarını istemiştir. İki hasta bu 6 farklı ürün için tercihlerini Tablo 8,5’deki gibi sıralamışlardır. Tercih sıralamaları arasında bir ilişki olup olmadığını belirleyiniz.

Tablo 8.5: İki Hastanın Tercih Sıralamaları

Markalar 1.Hastanın Tercih Sıralaması 2.Hastanın Tercih Sıralaması A 5 6 B 3 3 C 1 1 D 6 5 E 2 2 F 4 4

Çözüm 8.2:

Sıra korelasyon katsayısının hesaplanabilmesi için öncelikle tercih sıralamaları arasındaki farkın

( id ) belirlenmesi gerekir. Daha sonra da 2id

değerleri hesaplanarak, bunların toplamı alınacaktır. Bu

işlemleri Tablo 8.6’ da verilmiştir.

218

Tablo 8.6: Sıra Korelasyon İçin Gerekli İşlemler Tablosu

Markalar 1.Hastanın Tercih Sıralaması

2.Hastanın Tercih Sıralaması id

2id

A 5 4 -1 1 B 3 3 0 0 C 1 1 0 0 D 6 5 1 1 E 2 2 0 0 F 4 6 2 4

Toplam 6

n=6 ve 2 6id olduğuna göre sıra korelasyon katsayısının değeri,

)1(

61

2

2

nn

dr

i

s 2

6(6) 36 361 1 1 1 0,17

6(6 1) 6(35) 210

0,87sr

olarak hesaplanacaktır. Bu durumda, iki hastanın tercih sıralamaları arasında aynı yölü ve kuvvetli bir ilişki vardır.

Korelasyon katsayısı, değişkenlerin birlikte değişiminin bir ölçüsü olmakla birlikte, ilgili değişkenler arasında fonksiyonel bir ilişki kurmaz. Yani hangi değişkenin bağımlı, hangi değişkenin bağımsız değişken olduğunu göstermez. Sadece değişkenler arasındaki ilişkinin yönünü ve derecesini vermektedir. Ayrıca korelasyon analizi ilişkinin katsayıları hakkında sayısal değerler vermez. Yani fonksiyonun eğimi ve sabit terimi için tahminler yapmaz. Bundan dolayı, sayısal iki değişken arasındaki ilişkinin matematiksel bir fonksiyonla ifade edilmesini sağlayacak olan, regresyon analiziyle çözümleme yapılır.

BASİT DOĞRUSAL REGRESYON ANALİZİ Korelasyon analizinde bir değişkenin bağımlı veya bağımsız değişken konumunda olması hiç önemli olmamasına rağmen, regresyon analizinde bağımlı ve bağımsız değişken kavramları çok önemlidir. O halde bağımlı ve bağımsız değişken kavramlarını kısaca tanımlayalım. Sonuç niteliğindeki değişkene “bağımlı (açıklanan) değişken”, “neden” niteliğindeki değişkene ise “bağımsız (açıklayan) değişken” adı verilir. Örneğin, özel bir hastaneye gelen hasta sayısı arttıkça, hastanenin geliri de artacaktır. O halde hasta sayısı “neden” durumunda olduğu için “bağımsız değişken”, hastane geliri de “sonuç” niteliğinde olduğu için “bağımlı değişken” konumunda olacaktır.

Bağımlı değişken “y”, bağımsız değişken de “x” olmak üzere, N birimli bir ana kütle için regresyon denklemi

0 1ˆ i=1, 2, 3,..........., Ni iy b b x

şeklinde yazılır. Bu denkleme “y’nin x’e göre regresyon doğrusu” adı verilir. Denklemdeki;

0b :Sabit terim (y eksenini kestiği nokta),

1b : Eğim katsayısı’dır. Bu katsayı bağımsız değişkendeki bir birimlik değişimin, bağımlı değişken

üzerindeki artış veya azalış olarak yaptığı etkiyi gösterir.

219

Ancak tüm istatistik çalışmalarında olduğu gibi, genellikle ana kütlenin tamamı gözlemlenemediğinden, n birimlik örneklem seçilerek analiz yapılır. n birimlik örneklem için regresyon doğrusu denklemi ise “en küçük kareler tekniği” ne göre aşağıdaki gibi tahmin edilir:

0 1ˆ ˆˆ i=1, 2, 3, ............., ni iy b b x

Denklemdeki;

iy :x’in belli bir değeri için y’nin kestiricisi,

0b :b0’ın kestiricisi,

1b :b1’ın kestiricisi’dir.

Regresyon doğrusu denklemi için önce eğim katsayısı ( 1b ) değeri

2'

''

1i

ii

x

yxb

formülüyle belirlenir. Eğim katsayısı, “regresyon katsayısı” olarak da isimlendirilir. Daha sonra da sabit terim aşağıdaki gibi hesaplanır:

xbyb 10

ˆˆ

Örnek 8.3:

Örnek 8.1’deki veriler için örneklem regresyon denklemini belirleyiniz. Çözüm 8.3:

Regresyon denkleminin belirlenebilmesi için eğim (regresyon) katsayısı ve sabit terim için formüllerdeki gerekli toplamlar Tablo 8.4’te verilmişti. O halde bu toplamlar yardımıyla önce eğim katsayısı hesaplanacaktır.

' '

1 '2

23,02ˆ 4,195,49

i i

i

x yb

x

Değişkenlere ait ortalamalar da daha önce,

2,56x , 15,43y

olarak elde edilmişti. O halde bu değerler sabit terim formülünde yerine yazıldığında, sabit terimin kestirim değeri aşağıdaki gibi bulunacaktır:

0 1ˆ ˆ 15,43 (4,19).2,56 15,43 10,73 4,70b y b x

Dolayısıyla regresyon denklemi,

4,19ˆ 4,70 .i iy x

olacaktır. Bu denklemin anlamı şudur: Bağımsız değişken (x) bir birim arttığında (azaldığında bağımlı değişken 4,19 birim artacaktır (azalacaktır). Başka bir ifadeyle reklam harcamalarındaki 1 milyon TL’lik bir artış hastaneye gelen hasta sayısını 4,19 birim (4,19*1000=4190 kişi) artıracaktır. Herhangi bir reklam harcaması yapılmadığında ise (x=0 olduğunda) hastaneye gelen hasta sayısının 4,70 birim (4,70*1000=4700 kişi) olması beklenir.

220

Sıra sizde 1”deki veriler için örneklem regresyon doğrusu

denklemini belirleyiniz.

Belirlilik Katsayısı (r2) Regresyon doğrusu belirlendikten sonra bağımsız değişkenin, bağımlı değişkeni hangi oranda açıkladığının da bilinmesi gerekir. Eğer bağımsız değişkenin, bağımlı değişkeni açıklama oranı yüksek ise, bağımsız değişken önemli bir değişken demektir ve denklemde yer almalıdır. Bağımsız değişkenin, bağımlı değişkeni açıklama oranı ise, korelasyon katsayısının karesi olan ve “Belirlilik Katsayısı” olarak

isimlendirilen r2 değeridir. Belirlilik katsayısının sınırları da 10 2 r dir. Örnek 8.4:

Örnek 8.1’deki veriler için belirlilik katsayısını hesaplayarak yorumlayınız. Çözüm 8.4:

Örnek 8.1’deki veriler için korelasyon katsayısı 0,96 olarak hesaplanmıştı. Belirlilik katsayısı da korelasyon katsayısının karesi olduğuna göre,

2 20,96 0,92r

olarak hesaplanacaktır. O halde bağımsız değişken (reklam harcaması), bağımlı değişkeni (hastaneye gelen hasta sayısı) % 92 oranında açıklamaktadır. Bu oldukça yüksek bir orandır. Dolayısıyla hastane için yapılan reklam harcamaları, hastaneye gelen hasta sayılarındaki artış için oldukça etkilidir.

Belirlilik katsayısı, bağımsız değişkenin bağımlı değişken üzerindeki etkisi konusunda bir fikir vermekle beraber, bağımsız değişkenin anlamlı (önemli) olduğunu kesin olarak belirtmez. Bunun için de eğim katsayısının anlamlılık testi yapılmalıdır.

Eğim (Regresyon) Katsayısının Anlamlılık Testi

Regresyon denklemindeki tüm katsayıların anlamlılık testleri yapılabilir. Ancak sabit terimin anlamlılığı çok önemli olmadığından bu ünitede sadece eğim katsayısının anlamlılık testi anlatılacaktır. Eğer eğim katsayısı anlamlıysa, bağlı olduğu bağımsız değişken anlamlı demektir. Dolayısıyla bu bağımsız değişken, bağımlı değişkeni açıklamada önemli bir değişkendir.

Eğim katsayısının anlamlılık sınamaları da iki şekilde yapılır. Bunlar z ve t sınamalarıdır. Ancak ana kütle varyansı genellikle bilinmediğinden ve n<30 olduğundan, t testi uygulanır.

Hipotezler,

H0:b1=0 (katsayı anlamsız)

H1:b1 0 (katsayı anlamlı)

olmak üzere, test istatistiği ise,

1

1

ˆ

ˆ

ˆh

b

bt

olarak belirlenecektir. Test istatistiğinin paydasında yer alan değere ise standart hata kestiricisi denir ve aşağıdaki gibi belirlenir:

1 '2

1ˆ eb

i

sx

221

Artıkların standart sapması olan es değeri de,

2 2ˆ( )

2 2i i i

e

y y es

n n

formülüyle belirlenir. Buna “tahminin standart hatası” da denir. ie = î iy y olarak hesaplanır ve “artık

terimi” olarak ifade edilir. Formülden de görüldüğü gibi artık terimleri bağımlı değişkenin gözlem değerlerinden, regresyon denklemi yardımıyla tahmin edilen değerlerin çıkartılmasıyla elde edilirler. Şunu unutmamak gerekir ki artık değerlerinin toplamı daima sıfırdır. Bunların kareleri toplamına ise “artık kareler toplamı” denir ( 2

ie ) .

Test istatistiğinin değeri de belirli bir anlam düzeyi ve (n-2) serbestlik derecesi ile tablo değeriyle karşılaştırılır. Eğer sıfır hipotezi reddedilirse eğim katsayısının anlamlı, yani bağımsız değişkenin bağımlı değişkeni açıklamakta önemli olduğu sonucuna varılır. Örnek 8.5:

Örnek 8.1’deki veriler için îy , artık ( ie )değerlerini ve artık kareler toplamını hesaplayınız.

Çözüm 8.5:

Bundan önce de ifade edildiği gibi îy değerleri regresyon denklemi yardımıyla hesaplanacak

değerlerdir. Daha önce regresyon denklemi

4,19ˆ 4,70 .i iy x

şeklinde elde edilmişti. Bağımsız değişkenin değerleri denklemde yerine yazılarak, y’nin kestirim değerleri hesaplanır. O halde 1. kestirim değeri

1 1

1

1

1

4,19

4,19

5,03

ˆ 4,70 .

ˆ 4,70 .(1,2)

ˆ 4,70

ˆ 9,73

y x

y

y

y

olarak hesaplanacaktır. x2’nin değeri olan 1,5 denklemde yerine yazıldığında da

2

2

2

4,19

6, 29

ˆ 4,70 .(1,5)

ˆ 4,70

ˆ 10,99

y

y

y

değeri bulunur. Daha sonra sırasıyla bağımsız değişkenin değerleri denklemde yerine yazıldığında, Tablo 8.7’deki değerler elde edilecektir.

Artık değerlerinin ise

î i ie y y formülüyle belirleneceği ifade edilmişti. O halde 1. artık değeri

1 1 1

1

1

ˆ

10 9,73

0,27

e y y

e

e

olacaktır. 2. Artık değeri ise benzer şekilde aşağıdaki gibi hesaplanır:

222

2

2

12 10,99

1,01

e

e

Diğer artık değerleri ve bunların kareleri yine Tablo 8.7’de verilmiştir. Artıkların kareleri alınarak toplandığında da artık kareler toplamı,

2 9,26ie

olarak bulunur.

Tablo 8.7: ˆiy , artık ( ie ) ve artık karelerinin değerleri.

yi xi ˆiy ie

2ie

10 1,2 9,73 0,27 0,07 12 1,5 10,99 1,01 1,02 13 2,2 13,92 -0,92 0,85 15 2,7 16,01 -1,01 1,02 17 3,2 18,11 -1,11 1,23 19 3,5 19,37 -0,37 0,14 22 3,6 19,78 2,22 4,93

Toplam 9,26

Örnek 8.6

Örnek 8.1’deki veriler için eğim katsayısının anlamlılığını %5 anlam düzeyinde test ediniz. Çözüm 8.6

Bu bir hipotez testi olduğuna göre önce hipotezler yazılmalıdır. Hipotezler ise konunun başında belirtildiği gibi,

H0:b1=0 (eğim katsayı anlamsız)

H1:b1 0 (eğim katsayı anlamlı)

şeklinde ifade edilir. Ana kütle varyansı bilinmediği için ve n<30 olduğundan dolayı

1

1

ˆ

ˆ

ˆh

b

bt

test istatistiği kullanılacaktır. Eğim katsayısı 4,19 olarak bulunmuştu. O halde paydada yer alan1

ˆb

değerinin hesaplanması gerekir. Bunun için de öncelikle es değeri belirlenmelidir. Artık kareler toplamı

9,26 olduğuna göre,

2 9,26 9,26

2 7 2 5

1,85 1,36

ie

e

es

n

s

değeri elde edilecektir. Dolayısıyla eğim katsayısı için standart hatanın kestirim değeri de

223

1

1

ˆ '2

ˆ

1 1ˆ 1,36

5,49

ˆ 0,58

ebi

b

sx

olarak hesaplanır. Buradan da test istatistiğinin değeri aşağıdaki gibi bulunur:

1

1

ˆ

ˆ 4,19=

ˆ 0,58

7,22

h

b

h

bt

t

Hesaplanan test istatistiğinin 7,22 değeri, %5 anlam düzeyi ve n-2=7-2=5 serbestlik dereceli Student t tablo değeri 2,571’den büyük olduğundan, sıfır hipotezi reddedilecektir. Dolayısıyla eğim katsayısının anlamlı olduğuna karar verilecektir. Buradan da bağımsız değişken olan reklam harcamalarının, hastaneye gelen hasta sayısında etkili olduğu sonucuna ulaşılacaktır.

Ayrıca bu denklem x’in çeşitli değerleri için, y’nin alabileceği değerlerin tahmininde de kullanılabilir demektir. Örneğin reklam harcaması 4 milyon TL olduğunda, hastaneye gelecek hasta sayısı

4,19

20,95

ˆ 4,70 .(5)

ˆ 4,70

ˆ 25,65

y

y

y

(25,65*1000)=21460 kişi olarak tahmin edilir.

“Sıra sizde 1”deki verileri kullanarak, eğim katsayısının anlamlılığı için test istatistiğinin (t) değerini hesaplayınız.

224

EXCEL UYGULAMALARI Excel’de regresyon analizinin yapılabilmesi için “veri çözümleme” nin kurulu olması gerekir. Her zaman olduğu gibi yeni bir çalışma sayfası açılarak önce veriler girilir. Örnek uygulama için Tablo 8.3’deki verileri girelim. Önce “veri” menüsü, daha sonra da “veri çözümleme” menüsü tıklanır. Karşımıza çıkan pencereden yapmak istediğimiz analiz olan “korelasyon” tıklanır. Daha sonra korelasyonu hesaplanacak değişkenler seçilir ve “Tamam” tıklanarak sonuca ulaşılır. Bu işlemler ayrıca aşağıda da gösterilmiştir.

225

Tablo 8.8: Korelasyon İçin Excel Çıktısı

Bu değer yuvarlatıldığında 0,96 olacaktır. Örnek çözümde de 0,96 olarak bulunduğu görülecektir.

226

Şimdi de Tablo 8.3.’deki veriler için regresyon analizi uygulaması yapalım. Regresyon analizi için de, “veri” ve “veri çözümleme” menüsü tıklanır. Karşımıza çıkan pencereden yapmak istediğimiz analiz olan “regresyon” tıklanır. Daha sonra bağımlı değişken “Y Giriş Aralığı”na, bağımsız değişken de “X Veri Aralığı”na girilir. “Tamam” tıklanarak “ÖZET ÇIKIŞI” olarak belirtilen sonuç tablosuna ulaşılır. Bu işlemler de yine aşağıda ayrıntılı olarak gösterilmiştir

227

Tablo 8.9: Basit Regresyon İçin Excel Çıktısı

228

Tablo 8.9’daki “Özet Çıkışı” olarak ifade edilen sonuçların ne anlama geldiğini kısaca açıklayalım:

Çoklu R : r değeridir. Bu değer örnek çözümde de 0,96 olarak hesaplanmıştı. (Çoklu R, çoklu korelasyon katsayısı olmasına rağmen, basit korelasyon için de aynı şekilde ifade edilmektedir. Bu ayırımı analizi yapan kişi yapacaktır).

R Kare: r2 değeridir.

Ayarlı R Kare: Düzeltilmiş çoklu belirlilik katsayısıdır ve çoklu regresyon analizinde kullanılır.

Standart Hata: se değeridir.

“Katsayılar sütunu”, denklemin sabit terimini ve değişkenlere ait tahmin edilen katsayıları verir . Sabit terim 4,72 ve eğim katsayısı ise 4,19’dur. Örnek çözümde sabit terim 4,70 olarak bulunmuştu. Meydana gelen bu çok az fark, ortalamalar ve eğim katsayısının yuvarlatılmış değerler alınmasındandır. Bu değerler tam olarak alınırsa yine 4,72 olarak bulunacaktır.

“Standart hata” sütunu ise katsayılara ilişkin standart hata kestirimlerini verir (1

ˆ 0,58b

). Katsayılar

sütunu standart hata sütunundaki değerler bölündüğünde ise test istatistiği olan t değerleri elde edilir. “F” denklemdeki tüm katsayıların aynı anda anlamlılığı için hesaplanan test istatistiğidir. “P değeri” sütunu ise katsayıların anlamlı olup olmadığını belirtir. 1-P değeri katsayıların % kaç anlamlı olduğunu ifade eder.

Gerçek uygulamalarda ise, bağımlı değişkeni etkileyen çok sayıda bağımsız değişken alınarak analiz yapılır. Bağımsız değişken sayısının iki ve daha fazla olduğu regresyon analizine ise “çoklu regresyon” adı verilir. Bağımsız değişken sayısının üç veya daha fazla olması durumunda ise elle çözüm yapmak neredeyse imkansız hale gelir. Böyle durumlarda istatistik paket programlarının veya Excel’in kullanılması zorunludur. Burada da iki bağımsız değişken için bir analiz yapılacaktır. Çoklu regresyon konusunda ayrıntılı bilgi sahibi olmak isteyen öğrenciler, aşağıda belirtilen kaynaktan yararlanabilirler.

Basit regresyon ve çoklu regresyon hakkında daha ayrıntılı bilgi sahibi olabilmek için Ümit Şenesen ve Gülay Günlük Şenesen’nin çevirisini yaptığı, A. Koutsoyiannis’in Verso yayınevi tarafından basılmış olan “Ekonometri Kuramı (1999) adlı kitabını okuyabilirsiniz.

Tablo 8.10: Çoklu Regresyon Analiz Verileri.

yi x1i x2i 125 700 23 139 715 24 135 723 25 142 732 26 178 740 26 196 751 27 198 756 29 200 762 29 219 768 30 225 775 32

Çoklu regresyon analizi için işlemler aynı basit regresyondaki gibidir. Farklı olarak sadece bağımsız değişkelerin her ikisi (ya da daha fazla) de “X Veri Aralığı”na girilir. “Tamam” tıklanarak “ÖZET ÇIKIŞI” olarak belirtilen sonuç tablosu elde edilir.

229

Tablo 8.11: Çoklu Regresyon İçin Excel Çıktısı

Çıktı sonuçlarından da görüldüğü gibi, tek bağımsız değişkenli analizden farklı olarak “X değişkeni 2” satırı görülmektedir. Sonuçlara ilişkin açıklamalar basit regresyon içinde verildiğinden, burada tekrar edilmeyecektir.

230

Özet

Sayısal değişkenler arasındaki ilişkinin analizi iki şekilde yapılabilir. Bunlar korelasyon ve regresyon analizidir. Korelasyon analizinde bağımlı ve bağımsız değişken ayırımı olmaksızın, sadece değişkenler arasındaki ilişkinin yönü ve derecesi belirlenir. Korelasyon katsayısının değeri sıfıra yakınsa, değişkenler arasında bir

ilişki yok demektir. 11 değerlerine yakınsa,

değişkenler arasında aynı veya zıt yönlü kuvvetli bir ilişki olduğu ifade edilir.

Bazen de değişkenler sözel değişken olabilir ya da değişkenlerin gözlem değerleri yerine, sıralamaları arasındaki ilişki önemli olabilir. Böyle durumlarda da “sıra korelasyon katsayısı” hesaplanır.

Çoğu zaman değişkenler arasındaki ilişkinin yönü ve derecesi dışında, daha ayrıntılı analizlere ihtiyaç duyulur. Böyle durumlarda da “regresyon analizi” ne başvurulur. Regresyon analizinde amaç, önceden belirlenen bağımlı değişken ve bağımsız değişken (değişkenler) arasındaki ilişkiyi, matematiksel bir fonksiyonla yazmaktır. Değişkenler arasındaki regresyon denklemi belirlendikten sonra, bu denklemin anlamlı olup olmadığının belirlenmesi gerekir. Bu ölçütlerden bir tanesi, bağımsız değişkenin bağımlı değişkeni açıklama oranı olan “belirlilik katsayısıdır”. Ancak belirlilik katsayısı denklemin anlamlılığı konusunda kesin bir ölçüt değildir. Bununla beraber eğim (regresyon) katsayısının anlamlılık testi yapılır. Eğer eğim katsayısı anlamlı ise bağımsız değişkenin, bağımlı değişken üzerinde etkili olduğu ve denklemde yer alması gerektiği sonucuna varılır. Denklem anlamlı ise artık bu denklem tahminler için kullanılabilir demektir.

231

Kendimizi Sınayalım 1. İki değişken arasındaki korelasyon -0,85 olduğuna göre aşağıdaki ifadelerden hangisi doğrudur?

a. İki değişken arasında aynı yönlü kuvvetli bir ilişki vardır.

b. İki değişken arasında ters yönlü kuvvetli bir ilişki vardır.

c. İki değişken arasında aynı yönlü zayıf bir ilişki vardır.

d. İki değişken arasında ters yönlü zayıf bir ilişki vardır.

e. İki değişken arasında hiç ilişki yoktur.

2. 2 0,76r değerinin yorumu için aşağıdaki

ifadelerden hangisi doğrudur?

a. Bağımsız değişkenin bağımlı değişkeni açıklama oranı%76’dir.

b. Bağımlı değişkenin bağımsız değişkenin açıklama oranı %76’dir.

c. İki değişken arasında ters yönlü kuvvetli bir ilişki vardır.

d. İki değişken arasında ters yönlü zayıf bir ilişki vardır.

e. İki değişken arasında aynı yönlü zayıf bir ilişki vardır.

3. 4ˆ 8 .i iy x

denklemi için x bir birim

arttığında, y’nin değeri ne olur?

a. 8 birim azalır

b. 4 birim azalır

c. 4 birim artar

d. 5 birim artar

e. 8 birim artar

4. n=12 için ˆ 3,8 5,6.i iy x

denklemi elde

edilmiştir. Bu denklem için 1

ˆ 0,42b

olarak

hesaplandığına göre test istatistiğinin değeri aşağıdakilerden hangisidir?

a. -13,33

b. 13,33

c. 9,05

d. 10

e. 25

5. n= 14 ve 2 325id olduğuna göre sıra

korelasyon değeri aşağıdakilerden hangisidir?

a. 0,98

b. 0,51

c. 0,42

d. 0,29

e. 0,65

6 ve 7. soruları aşağıdaki verilere göre cevaplandırınız:

yi xi

22 3

24 5

28 7

32 8

35 11

38 14

6. Eğim katsayısının kestirim değeri

aşağıdakilerden hangisidir?

a. -2,43

b. 5,87

c. 1,54

d. 17,51

e. 4,67

232

7. Sabit terimin kestirim değeri aşağıdakilerden hangisidir?

a. -2,43

b. 5,87

c. 1,54

d. 17,51

e. 4,67

8.-10. soruları aşağıdaki verilere göre cevaplandırınız:

yi xi

10 34

13 36

16 40

18 46

20 49

24 52

28 55

Yukarıdaki veriler için 0,75ˆ 15 .i iy x

denklemi elde edimiştir. Bu denklem için 2 10,62ie olarak hesaplandığına göre;

8. 3y değeri aşağıdakilerden hangisidir?

a. 10,5

b. 12

c. 15

d. 19,5

e. 24

9. 3e değeri aşağıdakilerden hangisidir?

a. -0,5

b. 1

c. -1,5

d. 1,75

e. 0

10. es değeri aşağıdakilerden hangisidir?

a. 2,12

b. 0,66

c. 4,6

d. 1,46

e. 0,47

233


1. b Yanıtınız yanlış ise “korelasyon kuramı” başlıklı konuyu yeniden gözden geçiriniz.

2. a Yanıtınız yanlış ise “belirlilik katsayısı” başlıklı konuyu yeniden gözden geçiriniz.

3. c Yanıtınız yanlış ise “basit doğrusal regresyon analizi” başlıklı konuyu yeniden gözden geçiriniz.

4. a Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz.

5. d Yanıtınız yanlış ise “sıra korelasyon katsayısı” başlıklı konuyu yeniden gözden geçiriniz.

6. c Yanıtınız yanlış ise “basit doğrusal regresyon analizi” başlıklı konuyu yeniden gözden geçiriniz.

7. d Yanıtınız yanlış ise “basit doğrusal regresyon analizi” başlıklı konuyu yeniden gözden geçiriniz.

8. c Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz.

9. b Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz.

10. d Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz.


Sıra Sizde 1

yi xi 'iy '

ix

81 28 -13,75 9,5 85 25 -9,75 6,5 88 20 -6,75 1,5 92 18 -2,75 -0,5 95 19 0,25 0,5 102 16 7,25 -2,5 105 12 10,25 -6,5 110 10 15,25 -8,5

94,75y 18,5x

'2 256ix '2 727,48iy

' ' 417,02i ix y

' '

'2 '2

417,02 417,0216.(26,97)256. 727,48

i i

i i

x yr

x y

417,020,97

431,52r

x ve y değişkenleri arasında arasında ters yönlü ve oldukça kuvvetli bir ilişki vardır.

Sıra Sizde 2

' '

1 '2

417,02ˆ 1,63256

i i

i

x yb

x

0 1

0

ˆ ˆ 94,75 ( 1,63).18,5

ˆ 94,75 30,16 124,91

b y b x

b

124,91ˆ 1,63.i iy x

234

Sıra Sizde 3

ˆiy ie

2ie

79,27 1,73 2,99 84,16 0,84 0,71 92,31 -4,31 18,58 95,57 -3,57 12,74 93,94 1,06 1,12 98,83 3,17 10,05

105,35 -0,35 0,12 108,61 1,39 1,93

Toplam 48,24

2 48,24 48,24

2 8 2 6

8,04 2,84

ie

e

es

n

s

1

1

ˆ '2

ˆ

1 1ˆ 2,84

256

ˆ 0,18

ebi

b

sx

1

1

ˆ

ˆ 1,63=

ˆ 0,18

9,06

h

b

h

bt

t


Koutsoyiannis, A. (1999). Ekonometri Kuramı, Verso Yayıncılık, Ankara.

Montgomery, D.C. and Peck, E.A. (1991). Introduction to Linear Regression Analysis, John Wiley & Sons, New York.

Serper, Ö. (2004). Uygulamalı İstatistik 2, Ezgi Kitabevi, Bursa.

235

TIBBİ İSTATİSTİK SORULARININ CEVAPLANMASINDA GEREKLİ OLABİLECEK TABLOLAR

Tablo 1. Normal Eğri Alanları

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

236

Tablo 2. Kritik t Değerleri Tablosu

α (Anlam düzeyi) Tek Yönlü

Test 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,025 0,01 0,005 Çift Yönlü

Test 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01

V

1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657

2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925

3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841

4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604

5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032

6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707

7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499

8 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355

9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250

10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169

11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106

12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055

13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012

14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977

15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947

16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921

17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898

18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878

19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861

20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845

21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831

22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819

23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807

24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797

25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787

26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779

27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771

28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763

29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756

30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750

0,1257 0,2533 0,3853 0,5244 0,6745 0,8416 1,0364 1,2816 1,6449 1,9600 2,3264 2,5759 V; Serbestlik Derecesi

237

Tablo 3. Ki-kare Tablosu

α V

0,995 0,990 0,975 0,950 0,050 0,025 0,010 0,005 0,001

1 0,000039 0,0002 0,0010 0,0039 3,8415 5,0239 6,6349 7,8794 10,8276

2 0,0100 0,0201 0,0506 0,1026 5,9915 7,3778 9,2103 10,5966 13,8155

3 0,0717 0,1148 0,2158 0,3518 7,8147 9,3484 11,3449 12,8382 16,2662

4 0,2070 0,2971 0,4844 0,7107 9,4877 11,1433 13,2767 14,8603 18,4668

5 0,4117 0,5543 0,8312 1,1455 11,0705 12,8325 15,0863 16,7496 20,5150

6 0,6757 0,8721 1,2373 1,6354 12,5916 14,4494 16,8119 18,5476 22,4577

7 0,9893 1,2390 1,6899 2,1673 14,0671 16,0128 18,4753 20,2777 24,3219

8 1,3444 1,6465 2,1797 2,7326 15,5073 17,5345 20,0902 21,9550 26,1245

9 1,7349 2,0879 2,7004 3,3251 16,9190 19,0228 21,6660 23,5894 27,8772

10 2,1559 2,5582 3,2470 3,9403 18,3070 20,4832 23,2093 25,1882 29,5883

11 2,6032 3,0535 3,8157 4,5748 19,6751 21,9200 24,7250 26,7568 31,2641

12 3,0738 3,5706 4,4038 5,2260 21,0261 23,3367 26,2170 28,2995 32,9095

13 3,5650 4,1069 5,0088 5,8919 22,3620 24,7356 27,6882 29,8195 34,5282

14 4,0747 4,6604 5,6287 6,5706 23,6848 26,1189 29,1412 31,3193 36,1233

15 4,6009 5,2293 6,2621 7,2609 24,9958 27,4884 30,5779 32,8013 37,6973

16 5,1422 5,8122 6,9077 7,9616 26,2962 28,8454 31,9999 34,2672 39,2524

17 5,6972 6,4078 7,5642 8,6718 27,5871 30,1910 33,4087 35,7185 40,7902

18 6,2648 7,0149 8,2307 9,3905 28,8693 31,5264 34,8053 37,1565 42,3124

19 6,8440 7,6327 8,9065 10,1170 30,1435 32,8523 36,1909 38,5823 43,8202

20 7,4338 8,2604 9,5908 10,8508 31,4104 34,1696 37,5662 39,9968 45,3147

21 8,0337 8,8972 10,2829 11,5913 32,6706 35,4789 38,9322 41,4011 46,7970

22 8,6427 9,5425 10,9823 12,3380 33,9244 36,7807 40,2894 42,7957 48,2679

23 9,2604 10,1957 11,6886 13,0905 35,1725 38,0756 41,6384 44,1813 49,7282

24 9,8862 10,8564 12,4012 13,8484 36,4150 39,3641 42,9798 45,5585 51,1786

25 10,5197 11,5240 13,1197 14,6114 37,6525 40,6465 44,3141 46,9279 52,6197

26 11,1602 12,1981 13,8439 15,3792 38,8851 41,9232 45,6417 48,2899 54,0520

27 11,8076 12,8785 14,5734 16,1514 40,1133 43,1945 46,9629 49,6449 55,4760

28 12,4613 13,5647 15,3079 16,9279 41,3371 44,4608 48,2782 50,9934 56,8923

29 13,1211 14,2565 16,0471 17,7084 42,5570 45,7223 49,5879 52,3356 58,3012

30 13,7867 14,9535 16,7908 18,4927 43,7730 46,9792 50,8922 53,6720 59,7031

40 20,7065 22,1643 24,4330 26,5093 55,7585 59,3417 63,6907 66,7660 73,4020

50 27,9907 29,7067 32,3574 34,7643 67,5048 71,4202 76,1539 79,4900 86,6608

100 67,3276 70,0649 74,2219 77,9295 124,3421 129,5612 135,8067 140,1695 149,4493 V; Serbestlik Derecesi α; Anlam düzeyi

238

1

2

:

:

Pay için serbestlik derecesi

Payda için serbestlik derecesivv

Tablo 4. F Tablo Değerleri Anlam düzeyi = α = 0,05)

Ho Red Bölgesi

α

Serbestlik derecesi

1v

2v 1 2 3 4 5 6 7 8 12 24 ∞

5 661 579 541 519 5,05 4,95 4,88 4,82 4,68 4,53 4,37

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,00 3,84 3,67

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,57 3,41 3,23

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,28 3,12 2,93

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,07 2,90 2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 2,91 2,74 2,54

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,79 2,61 2,41

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,69 2,51 2,30

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,60 2,42 2,21

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,53 2,35 2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,48 2,29 2,07

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,42 2,24 2,01

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,38 2,19 1,96

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,34 2,15 1,92

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,31 2,11 1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,28 2,08 1,84

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,25 2,05 1,81

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,23 2,03 1,78

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,20 2,01 1,76

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,18 1,98 1,73

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,16 1,96 1,71

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,15 1,95 1,69

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,13 1,93 1,67

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,12 1,91 1,66

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,10 1,90 1,64

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,09 1,89 1,62

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,00 1,79 1,51

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 1,92 1,70 1,39

80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 1,88 1,65 1,33

100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,85 1,63 1,28

120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,83 1,61 1,26

∞ 3,84 3,00 2,61 2,37 2,22 2,10 2,01 1,94 1,75 1,52 1,00

239

1

2

:

:

Pay için serbestlik derecesi

Payda için serbestlik derecesivv

Tablo 5. F Tablo Değerleri (Anlam düzeyi= α = 0,01)

Ho Red Bölgesi

α

Serbestlik derecesi

1v

2v 1 2 3 4 5 6 7 8 12 24 ∞

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 9,89 9,47 9,02

6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,72 7,31 6,88

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,47 6,07 5,65

8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,67 5,28 4,86

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,71 4,33 3,91

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,40 4,02 3,60

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,16 3,78 3,36

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 3,96 3,59 3,17

14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 3,80 3,43 3,01

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,67 3,29 2,87

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,55 3,18 2,75

17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,46 3,08 2,65

18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,37 3,00 2,57

19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,30 2,92 2,49

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,23 2,86 2,42

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,17 2,80 2,36

22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,12 2,75 2,31

23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,07 2,70 2,26

24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,03 2,66 2,21

25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 2,99 2,62 2,17

26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 2,96 2,58 2,13

27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 2,93 2,55 2,10

28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 2,90 2,52 2,07

29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 2,87 2,49 2,04

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 2,84 2,47 2,01

40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,66 2,29 1,81

60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,50 2,12 1,60

80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,42 2,03 1,50

100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,37 1,98 1,43

120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,34 1,95 1,38

∞ 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,19 1,79 1,00

TIBBİ İSTATİSTİK -...

Documents

Transcript of TIBBİ İSTATİSTİK -...