Becslés
description
Transcript of Becslés
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Becslés
Dr. Varga Beatrix
egy. docens
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Mintából való következtetés
Hipotézisvizsgálat
Becslés: A sokaság bizonyos jellemzőinek, paraméterének közelítő megállapításával foglalkozik.
Hipotézisvizsgálat: A sokaságra vonatkozó valamely állítás helyességét ellenőrzi.
Becslés
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Becslési alapfogalmak I.
• Parameter (Θ)→ a sokaság valamely jellemzője→ pl.: várható érték, arány, szórás
• BecslőfüggvényOlyan függvény, mely alkalmas a sokasági paraméter értékének mintából történő meghatározására
• Standard hibaA becslő függvény valamennyi lehetséges mintából számított értékeinek a szórása
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Statisztikai hiba
• Nem mintavételi hiba• lefedési hiba• feldolgozási hiba• nem megfelelő adatszolgáltatás
• Mintavételi hiba• A sokaság minden egységéről való lemondás
ára• Nagysága matematikai eszközökkel
becsülhető
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
A mintavételi hiba függ
• Az alapsokaság eloszlásától
• Az alkalmazott mintavételi eljárástól
• A vizsgált mutatószám fajtájától
• A minta nagyságától
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Becslési alapfogalmak II.
• PontbecslésA becslőfüggvény mintából számított konkrét értéke
• IntervallumbecslésAdott megbízhatósági szinthez tartozó intervallum alsó és felső határának meghatározása
• Konfidencia-intervallum
)( faPr
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Paraméter és konfidencia-intervallumok
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Mintából számított bármely mutató értékei
• mintáról mintára változnak
• a megfelelő sokasági jellemzők körül ingadoznak
• szóródásuk a mintanagyság növelésével csökken
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Becslőfüggvény tulajdonságai• torzítatlan
ha várható értéke megegyezik a becsülni kívánt paraméterrel
• aszimptotikusan torzítatlanha a mintanagysággal a végtelenbe tartva a torzítás eltűnik
• konzisztens
a mintanagyság növelésével a becslés nagy valószínűséggel a paraméter felé tart.
• hatásos
Minimális varianciájú torzítatlan becslőfüggvény
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
A torzítás különféle esetei
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Példa a torzítás eseteire
• Egy kisvállalkozásnak 4 alkalmazottja van, nettó átlagjövedelmük (eFt): 180, 90, 36, 30
• Becsüljük meg az átlagjövedelmüket különböző becslőfüggvény segítségével:
mintaátlag
minta-medián
terjedelemközép (maximális és minimális mintaelem átlaga)
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
A minták jellemzői
Ssz. Elemek Átlag Medián Terjedelemközép
1. 30, 36, 90 52 36 60
2. 30, 36, 180 82 36 105
3. 30, 90, 180 100 90 105
4. 36, 90, 180 102 90 108
A várható érték 84 63 94,5
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Két becslőfüggvény hatásossága
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
A konzisztencia fogalma
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Becslés
Sokaság Minta
elemei X1, X2, … , XN, … x1, x2, … , xn
átlag μ
szórás σ s
arány P p
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Várható érték becslése
Becslőfüggvény: a mintaátlag
i
ii
f
xfx
n
xx
i
A konfidencia intervallum meghatározása függ: az x változó alapsokasági eloszlásától ismert-e az alapsokaság szórása a minta nagyságától
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
1.) sokaság eloszlása normális, ismert a sokasági szórás, mintanagyság tetszőleges
2.) sokaság eloszlása nem ismert, nem ismert a sokasági szórás, nagy minta
3.) sokaság eloszlása normális, nem ismert a sokasági szórás, n < 100
σ z x μ x π
s z x μ xπ
s t x μ xπ
x μ x
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
• ahol:
a becslőfüggvény mintából számított konkrét értéke
standard normális eloszlású valószínűségi változó
a mintaátlag standard hibája ( a mintaátlagok szórása)
=n-1 szabadságfokú Student-eloszlású valószínűségi változó
A Student-féle t eloszlás a szabadságfok növelésével a normálishoz tart.
z
x
t
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
A várható érték standard hibája
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Ha nem tételezhető fel, hogy az x változó normális eloszlású, csak nagy minta alkalmazható
Központi határeloszlás tétel:
Független valószínűségi változók eloszlása akkor is közelítőleg normális eloszlást követ, ha a változók nem normális eloszlásúak, feltéve, hogy a minta-elemszám elég nagy.
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Nagy minta:
általában: n 100
unimodális, gyengén ferde eloszlásnál:
n 30
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Rétegzett minta• heterogén sokaság esetén, ha közel homogén
rétegeket tudunk képezni• az egyes rétegekből egyszerű véletlen minták• a rétegzés javíthatja a minta reprezentativitását
• Jelölések: rétegek elemszáma az alapsokaságban:
N = N1 + N2 + N3 + ... + NH-1 + NH
rétegek elemszáma a mintában:
n = n1 + n2 + n3 + ... + nH-1 + nH
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Várható érték becslése rétegzett mintából
ahol
xszx
ii x
N
Nx
2
22
ixi
x sN
Ns
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
x (x) x (x) x (x) x (x) x (x)0,00 0,5000 0,52 0,6985 1,04 0,8508 1,56 0,9406 2,40 0,99180,02 0,5080 0,54 0,7054 1,06 0,8554 1,58 0,9429 2,50 0,99380,04 0,5160 0,56 0,7123 1,08 0,8599 1,60 0,9452 2,60 0,99530,06 0,5239 0,58 0,7190 1,10 0,8643 1,62 0,9474 2,70 0,99650,08 0,5319 0,60 0,7257 1,12 0,8686 1,64 0,9495 2,80 0,99740,10 0,5398 0,62 0,7324 1,14 0,8729 1,66 0,9515 2,90 0,99810,12 0,5478 0,64 0,7389 1,16 0,8770 1,68 0,9535 3,00 0,99870,14 0,5557 0,66 0,7454 1,18 0,8810 1,70 0,9554 3,20 0,99930,16 0,5636 0,68 0,7517 1,20 0,8849 1,72 0,9572 3,40 0,99960,18 0,5714 0,70 0,7580 1,22 0,8888 1,74 0,9591 3,60 0,99980,20 0,5793 0,72 0,7642 1,24 0,8925 1,76 0,9608 3,8 0,99990,22 0,5871 0,74 0,7703 1,26 0,8962 1,78 0,9625
z-test
0,24 0,5948 0,76 0,7764 1,28 0,8997 1,80 0,96410,26 0,6026 0,78 0,7823 1,30 0,9032 1,82 0,96560,28 0,6103 0,80 0,7881 1,32 0,9066 1,84 0,96710,30 0,6179 0,82 0,7939 1,34 0,9099 1,86 0,96860,32 0,6255 0,84 0,7995 1,36 0,9131 1,88 0,96990,34 0,6331 0,86 0,8051 1,38 0,9162 1,90 0,97130,36 0,6406 0,88 0,8106 1,40 0,9192 1,92 0,97260,38 0,6480 0,90 0,8159 1,42 0,9222 1,94 0,97480,40 0,6554 0,92 0,8212 1,44 0,9251 1,96 0,97500,42 0,6628 0,94 0,8264 1,46 0,9279 1,98 0,97610,44 0,6700 0,96 0,8315 1,48 0,9306 2,00 0,97720,46 0,6772 0,98 0,8365 1,50 0,9332 2,10 0,98210,48 0,6844 1,00 0,8413 1,52 0,9357 2,20 0,98610,50 0,6915 1,02 0,8461 1,54 0,9382 2,30 0,9893
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Student’s t-testDf 0,55 0,60 0,70 0,75 0,80 0,90 0,95 0,975 0,99 0,9951 0,158 0,325 0,727 1,000 1,376 3,08 6,31 12,71 31,82 63,662 0,142 0,289 0,617 0,816 1,061 1,89 2,92 4,30 6,96 9,923 0,137 0,277 0,584 0,765 0,978 1,64 2,35 3,18 4,54 5,844 0,134 0,271 0,569 0,741 0,941 1,53 2,13 2,78 3,75 4,605 0,132 0,267 0,559 0,727 0,920 1,48 2,02 2,57 3,36 4,036 0,131 0,265 0,553 0,718 0,906 1,44 1,94 2,45 3,14 3,717 0,130 0,263 0,549 0,711 0,896 1,42 1,90 2,36 3,00 3,508 0,130 0,262 0,546 0,706 0,889 1,40 1,86 2,31 2,90 3,369 0,129 0,261 0,543 0,703 0,883 1,38 1,83 2,26 2,82 3,2510 0,129 0,260 0,542 0,700 0,879 1,37 1,81 2,23 2,76 3,1711 0,129 0,260 0,540 0,697 0,876 1,36 1,80 2,20 2,72 3,1112 0,128 0,259 0,539 0,695 0,873 1,36 1,78 2,18 2,68 3,0613 0,128 0,259 0,538 0,694 0,870 1,35 1,77 2,16 2,65 3,0114 0,128 0,258 0,537 0,692 0,868 1,34 1,76 2,14 2,62 2,9815 0,128 0,258 0,536 0,691 0,866 1,34 1,75 2,13 2,60 2,9516 0,128 0,258 0,535 0,690 0,865 1,34 1,75 2,12 2,58 2,9217 0,128 0,257 0,534 0,689 0,863 1,33 1,74 2,11 2,57 2,9018 0,127 0,257 0,534 0,688 0,862 1,33 1,73 2,10 2,55 2,8819 0,127 0,257 0,533 0,688 0,861 1,33 1,73 2,09 2,54 2,8620 0,127 0,257 0,533 0,687 0,860 1,32 1,72 2,09 2,53 2,8421 0,127 0,257 0,532 0,686 0,859 1,32 1,72 2,08 2,52 2,8322 0,127 0,256 0,532 0,686 0,858 1,32 1,72 2,07 2,51 2,8223 0,127 0,256 0,532 0,685 0,858 1,32 1,71 2,07 2,50 2,8124 0,127 0,256 0,531 0,685 0,857 1,32 1,71 2,06 2,49 2,8025 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,7926 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,7827 0,127 0,256 0,531 0,684 0,855 1,31 1,70 2,05 2,47 2,7728 0,127 0,256 0,530 0,683 0,855 1,31 1,70 2,05 2,47 2,7629 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,7630 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,7540 0,126 0,255 0,529 0,681 0,851 1,30 1,68 2,02 2,42 2,7060 0,126 0,254 0,527 0,679 0,848 1,30 1,67 2,00 2,39 2,66
120 0,126 0,254 0,526 0,677 0,845 1,29 1,66 1,98 2,36 2,62 0,126 0,253 0,524 0,674 0,842 1,28 1,645 1,96 2,33 2,58
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Valószínűség vagy arány becslése
Becslőfüggvény: mintabeli relatív gyakoriság
n
kp
A relatív gyakoriság valószínűség-eloszlása a binomiális típusból származtatható. Nagy mintából számított relatív gyakoriság eloszlása közelítőleg normálisnak tekinthető
Feltétel: nagy minta
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Konfidenciaintervallum:
)Pr( pp szpPszp
N
n
n
qps p 1
ahol: p – mintabeli relatív gyakoriság q=1-p
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Szórásnégyzet, szórás becslése
Becslőfüggvény: korrigált tapasztalati szórás
1
)( 2
i
ii
f
xxfs
vagy
1
)( 2
n
xxs i
Feltétel: normális eloszlású alapsokaság mintanagyság tetszőleges
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
ahol: s - korrigált tapasztalati szórásnégyzet 2 - =n-1 szabadságfokú változó - =1- az a kockázat, hogy a sokasági paraméter
a konfidencia intervallumon kívül található
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
χ2
Df 0,005 0,01 0,025 0,05 0,10 0,25 0,50 0,75 0,90 0,95 0,975 0,99 0,995
1 0,0000 0,0002 0,0010 0,039 0,0158 0,102 0,455 1,32 2,71 3,84 5,02 6,63 7,88
2 0,0100 0,0201 0,0506 0,103 0,211 0,575 1,39 2,77 4,61 5,99 7,38 9,21 10,63 0,072 0,115 0,216 0,352 0,584 1,21 2,37 4,11 6,25 7,81 9,35 11,3 12,84 0,207 0,297 0,484 0,711 1,06 1,92 3,36 5,39 7,78 9,49 11,1 13,3 14,95 0,412 0,554 0,831 1,15 1,61 2,67 4,35 6,63 9,24 11,1 12,8 15,1 16,76 0,676 0,872 1,24 1,64 2,20 3,45 5,35 7,84 10,6 12,6 14,4 16,8 18,57 0,989 1,24 1,69 2,17 2,83 4,25 6,35 9,04 12,0 14,1 16,0 18,5 20,38 1,34 1,65 2,18 2,73 3,49 5,07 7,34 10,2 13,4 15,5 17,5 20,1 22,09 1,73 2,09 2,70 3,33 4,17 5,90 8,34 11,4 14,7 16,9 19,0 21,7 23,6
10 2,16 2,56 3,25 3,94 4,87 6,74 9,34 12,5 16,0 18,3 20,5 23,2 25,211 2,60 3,05 3,82 4,57 5,58 7,58 10,3 13,7 17,3 19,7 21,9 24,7 26,812 3,07 3,57 4,40 5,23 6,30 8,44 11,3 14,8 18,5 21,0 23,3 26,2 28,313 3,57 4,11 5,01 5,89 7,04 9,30 12,3 16,0 19,8 22,4 24,7 27,7 29,814 4,07 4,66 5,63 6,57 7,79 10,2 13,3 17,1 21,1 23,7 26,1 29,1 31,315 4,60 5,23 6,26 7,26 8,55 11,0 14,3 18,2 22,3 25,0 27,5 30,6 32,816 5,14 5,81 6,91 7,96 9,31 11,9 15,3 19,4 23,5 26,3 28,8 32,0 34,317 5,70 6,41 7,56 8,67 10,1 12,8 16,3 20,5 24,8 27,6 30,2 33,4 35,718 6,26 7,01 8,23 9,39 10,9 13,7 17,3 21,6 26,0 28,9 31,5 34,8 37,219 6,84 7,63 8,91 10,1 11,7 14,6 18,3 22,7 27,2 30,1 32,9 36,2 38,620 7,43 8,26 9,59 10,9 12,4 15,5 19,3 23,8 28,4 31,4 34,2 37,6 40,021 8,03 8,90 10,3 11,6 13,2 16,3 20,3 24,9 29,6 32,7 35,5 38,9 41,422 8,64 9,54 11,0 12,3 14,0 17,2 21,3 26,0 30,8 33,9 36,8 40,3 42,823 9,26 10,2 11,7 13,1 14,8 18,1 22,3 27,1 32,0 35,2 38,1 41,6 44,224 9,89 10,9 12,4 13,8 15,7 19,0 23,3 28,2 33,2 36,4 39,4 43,0 45,625 10,5 11,5 13,1 14,6 16,5 19,9 24,3 29,3 34,4 37,7 40,6 44,3 46,926 11,2 12,2 13,8 15,4 17,3 20,8 25,3 30,4 35,6 38,9 41,9 45,6 48,327 11,8 12,9 14,6 16,2 18,1 21,7 26,3 31,5 36,7 40,1 43,2 47,0 49,628 12,5 13,6 15,3 16,9 18,9 22,7 27,3 32,6 37,9 41,3 44,5 48,3 51,029 13,1 14,3 16,0 17,7 19,8 23,6 28,3 33,7 39,1 42,6 45,7 49,6 52,330 13,8 15,0 16,8 18,5 20,6 24,5 29,3 34,8 40,3 43,8 47,0 50,9 53,740 20,7 22,2 24,4 26,5 29,1 33,7 39,3 45,6 51,8 55,8 59,3 63,7 66,850 28,0 29,7 32,4 34,8 37,7 42,9 49,3 56,3 63,2 67,5 71,4 76,2 79,5 60 35,5 37,5 40,5 43,2 46,5 52,3 59,3 67,0 74,4 79,1 83,3 88,4 92,0 70 43,3 45,4 48,8 51,7 55,3 61,7 69,3 77,6 85,5 90,5 95,0 100,4 104,280 51,2 53,5 57,2 60,4 64,3 71,1 79,3 88,1 96,6 101,9 106,6 112,3 116,390 59,2 61,8 65,6 69,1 73,3 80,6 89,3 98,6 107,6 113,1 118,1 124,1 128,3
100 67,3 70,1 74,2 77,9 82,4 90,1 99,3 109,1 118,5 124,3 129,6 135,8 140,2
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Példa 1
• A BSc hallgatók közül véletlenszerűen kiválasztottunk 15 elemű mintát.
• π = 95 %
• A minta adatai (nap):
5, 8, 12, 4, 9, 11, 12, 14, 9, 7, 6, 11, 9, 8, 10
A) Készítsen becslést az átlagos tanulási időre!
B) Becsülje meg az átlagos tanulási idő szórását!
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Feltétel: normál alapeloszlásA) 1) ismert, hogy az alapsokaság szórása: 2 nap
2) – nem ismerjük az alapsokaság szórását- a mintabeli korrigált tapasztalati szórás:s = 2.7
B) Szórás becslése
15
2 1.96 9 μ
15
2.7 2.14 9 μ
2 214 2.7 14 2.7 1.98 σ 4.26
26.1 5.63
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Példa 2.Egy 250 g kávét csomagoló gép működésének ellenőrzéséhez 100 elemű véletlen mintát vettek. Korábbi felmérések alapján feltételezhetjük, hogy a töltőtömeg normális eloszlást követ.
A csomagok töltési tömege (g) A csomagok száma (db)
– 239,9 8
240,0 – 244,9 22
245,0 – 249,9 32
250,0 – 254,9 28
255,0 – 10
Összesen 100
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet 1. Feltételezve, hogy a töltősúly normális eloszlást követ,
becsüljük meg az átlagos töltőtömeget! (π = 95 %)2. Milyen minta elemszámra lenne szükség ahhoz, hogy a
maximális hibát felére csökkentsük? 3. Milyen minta elemszámra lenne szükség ahhoz, hogy a
maximális hibát 20%-kal csökkentsük, és 98%-os megbízhatóságra van szükségünk?
4. Feltételezve, hogy a töltősúly normális eloszlást követ, készítsünk intervallumbecslést a töltőtömeg szórására! (π = 95 %)
5. Mennyi kávéra van szükség naponta, ha a gép folyamatos műszakban termel, és műszakonként 12.000 csomagot tölt meg? (π = 95 %)
6. Egy műszakban hány olyan kávécsomag készül, melynek tömege nem éri el az előírt 250 grammot? (π = 99 %)
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Köszönöm a figyelmet!