3.előadás (1)

29
STATISZTIKA II. Becslőfüggvények értékelése Az átlag és értékösszeg becslése rétegzett mintából 3. előadás

description

számvitel előadás anyaga

Transcript of 3.előadás (1)

Page 1: 3.előadás (1)

STATISZTIKA II.

Becslőfüggvények értékeléseAz átlag és értékösszeg becslése rétegzett mintából

3. előadás

Page 2: 3.előadás (1)

Becslési kritériumok

� Torzítatlanság

� Hatásosság

� Konzisztencia

Page 3: 3.előadás (1)

Becslési kritériumok

Torzítatlanság (becslőfüggvény várható értéke megegyezik a becsülni kívánt sokasági jellemzővel):

Torzítás mértéke:

θθ )ˆ( =E

θθθ −= )ˆ()ˆ( EBs

Page 4: 3.előadás (1)

Becslési kritériumok

Becslés varianciája, pontossága

� Torzítatlan becslőfüggvény esetén:

� Torzított becslőfüggvény esetén (átlagos négyzetes hiba):

)ˆ()ˆ()ˆ( 2 θθθ BsVarMSE +=

)ˆ(θVar

Page 5: 3.előadás (1)

Becslési kritériumok

Minimális variancia kritérium� Két torzítatlan becslőfüggvény közül azt tekintjük jobbnak,

melynek összes lehetséges mintán értelmezett varianciája kisebb.

� Torzított becslőfüggvények, illetve torzított és torzítatlan becslőfüggvények összehasonlítására az átlagos négyzetes hibát használjuk:

)ˆ()ˆ()ˆ( 2 θθθ BsVarMSE +=

)ˆ()ˆ( 21 θθ VarVar ⟨

Page 6: 3.előadás (1)

Nagymintás kritériumok � Aszimptotikusan torzítatlan:

� KonzisztenciaHa torzítatlan, vagy legalább aszimptotikusan torzítatlan és

( ) θθ =nE ˆ lim

( ) 0ˆlim =nVar θ

)( ∞→n

)( ∞→n

Page 7: 3.előadás (1)

FAE és EV minta összehasonlítása

� Várható érték

� Variancia

µ=)( FAEyE µ=)( EVyE

nyVar FAE

2

)(σ=

−≅N

n

nyVar EV 1)(

2σ≥( )( ) 1

1

1 ≥−

N

nyVar

yVar

EV

FAE

A FAE becslés hibája nagyobb (legfeljebb ugyanakkora)mint az EVbecslésé.

Page 8: 3.előadás (1)

FAE és EV minta összehasonlítása

Valamely nagyvárosban a háztartások megtakarítási hajlandóságának becslésére (N=8500) 400 elemű FAE mintát vettek. Mekkora mintára lenne szükség ugyanakkora pontosság és megbízhatóság mellett EV-kiválasztás esetén?

∆=⋅FAE

pn

zFAEσ

:

N

n

nnEV

EVFAE

−⋅= 111

∆=−⋅⋅N

n

nzEV EV

EV

p 1:σ

N

nn

nFAE

FAEEV

+=

1

→ 382≈EVn

8500400

1

400

+=EVn

Page 9: 3.előadás (1)

Rétegzett mintavétel

Véges, heterogén (inhomogén) sokaság esetén használjuk. Először a sokaságot többé-kevésbé homogén rétegekbe soroljuk, majd a rétegekből egymástól függetlenül EV (ritkábban FAE) mintát veszünk.

Page 10: 3.előadás (1)

Rétegzett mintavétel

� Cél: a mintavételi hiba csökkentése.

� Heterogén sokaságok esetén (ha jól választjuk meg a rétegképző ismérvet) azonos mintanagyság mellett kisebb mintavételi hibát eredményez, mint az EV kiválasztás. (Rétegenbelüli homogenitás előnyös tulajdonság.)

� További előny: az egyes rétegekre külön-külön is lehet becsléseket készíteni.

Page 11: 3.előadás (1)

Jelölések

M a rétegek száma

N a sokaság számossága

a j-edik réteg nagysága

n a minta nagysága

a minta nagysága a j-edik rétegben

jN

jn

Page 12: 3.előadás (1)

Minta elosztása a rétegek között

1. Egyenletes elosztás

M

nn j =

2. Arányos elosztás (önsúlyozó minta)

N

Nn

N

Nnn j

M

j j

jj ⋅=⋅=

∑ =1

N

N

n

n jj =

Page 13: 3.előadás (1)

Minta elosztása a rétegek között

3. Neymann-féle optimális elosztás

∑ =

⋅=M

j jj

jjj

N

Nnn

σ

4. Költségoptimáliselosztás

j

M

j j

M

j jjj

jjjj

nC

ahol

N

Nnn

=

=−

=

⋅=

1

1

2/1

2/1

π

πσπσ

Page 14: 3.előadás (1)

Minta elosztása (példa)

Évfolyam I. II. III.

Hallgatók %-os megoszlása 38 32 30

Tanulási idő szórása (óra) 2,3 2,0 1,5

Tegyük fel, hogy valamely főiskola 4200 nappali tagozatos hallgatója közül 300 fős, évfolyam szerint rétegezett mintát veszünk és a napi átlagos egyéni tanulási időt becsüljük egy előre kijelölt hétköznapi napra vonatkozóan.Ismeretes a hallgatók évfolyam szerinti megoszlása, továbbá szakértői becslésből a tanulási idő szórása évfolyamonként.

Page 15: 3.előadás (1)

Minta elosztása (példa)

133445,03005,13,00,232,03,238,0

3,238,0300 ≅⋅=

⋅+⋅+⋅⋅⋅=In

98326,03005,13,00,232,03,238,0

0,232,0300 ≅⋅=

⋅+⋅+⋅⋅⋅=IIn

69229,03005,13,00,232,03,238,0

5,13,0300 ≅⋅=

⋅+⋅+⋅⋅⋅=IIIn

ÉvfolyamA rétegek aránya a sokaságon belül

(%)

Egyenletes elosztás

Arányos elosztás

Optimális elosztás

I. 38 100 114 133II. 32 100 96 98III. 30 100 90 69Összesen 100 300 300 300

M

nn j =

N

Nnn j

j ⋅=∑ =

⋅= M

j jj

jjj

N

Nnn

σ

Page 16: 3.előadás (1)

Sokasági átlag becslése rétegzett mintából

� Becslés tárgya:

� Becslőfüggvény:

jMj

jjMj

N

YNY

1

1

=

=

∑=

jjMj

M

jjj

M

jj

jj

M

jRR yW

N

yN

N

yNyY 1

1

1

1ˆ=

=

=

= ∑=∑

=∑

∑==

N

NW j

j =ahol:

Page 17: 3.előadás (1)

� A főátlag varianciája:

Sokasági átlag becslése rétegzett mintából

−⋅∑≅

∑=

== j

j

j

jM

jj

M

jjjR N

n

nWyWVarYVar 1)ˆ(

2

1

2

1

σ

ahol: )(12

jj

j

j

j yVarN

n

n≅

σ

Page 18: 3.előadás (1)

� Az átlagbecslés becsült standard hibája:

� Intervallumbecslés:

Sokasági átlag becslése rétegzett mintából

RyRR szyYInt ⋅+= −− 2/11 )( αα

Nagy minták esetén feltételezzük az átlagbecslés közelítőleg normális eloszlását.

−⋅∑==

= j

j

j

jM

jjyY N

n

n

sWss

RR

12

1

Page 19: 3.előadás (1)

Sokasági átlag becslése rétegzett mintából (példa)

Egy gazdaságnak 6000 termő almafája van, melyből 4350 golden(G), 1650 idared (I) fajta. Közvetlen szüret előtt rétegzett mintavétellel becslik a várható össztermést. A felvétel eredményeit az alábbi táblázat tartalmazza:

Feladat:

Becsülje a várható össztermés határait 95%-os megbízhatósággal!

Fajtája elemszáma (fa)

átlag (kg/fa)

szórás (kg/fa)

Golden 240 104 28

Idared 160 92 20

Page 20: 3.előadás (1)

GOLDEN

IDARED

Átlag becslése az egyes rétegekre

086,34350

2401

240

28)(

2

=

−≅GyVar

258,21650

1601

160

20)(

2

=

−≅IyVar

757,1086,3)( ==Gys

( ) 503,1258,2 ==Iys

44,37,100757,196,1104 ±→⋅±

95,292503,196,192 ±→⋅±

Page 21: 3.előadás (1)

Sokasági átlag becslése rétegzett mintából (példa)

7,10092275,0104725,06000

9216501044350 =⋅+⋅=⋅+⋅=Ry

=

−⋅+

−⋅=1650

1601

160

20275,0

4350

2401

240

28725,0)ˆ(

22

22

RYVar

793,1258,2275,0086,3725,0)ˆ( 22 =⋅+⋅=RYVar

)( GyVar )( IyVar

Page 22: 3.előadás (1)

Intervallumbecslés (átlag):

Intervallumbecslés (értékösszeg):

Sokasági átlag becslése rétegzett mintából

→±→⋅± 32,103;08,9862,27,100339,196,17,100

339,1793,1 ==Rys

tonna

=

⋅ 92,619;48,58832,103;08,986000

Page 23: 3.előadás (1)

Arányos rétegzés:

� A sokasági átlag becslése:

� Az átlagbecslés varianciája:

jjj W

n

n

N

N==

∑∑

==∑

==

== M

j

M

jjj

jj

M

jjj

AR n

yn

yWN

yN

Y1

11ˆ

−⋅∑

=

N

n

nn

nYVar

j

jjAR 1)ˆ(

22 σ

∑⋅

−=n

n

N

n

nYVar

jjAR

2

11

)ˆ(σ

−=

−=N

n

nN

n

nB

B 111 2

2 σσ

Page 24: 3.előadás (1)

Arányos rétegzés

∑⋅

−=n

n

N

n

nYVar

jjAR

2

11

)ˆ(σ

1

)( 212

−−∑

= =

j

jijni

j n

yys

j

−=N

n

nB 12σ

Szórások becslése a mintából:

∑= −

−=

M

j

jjB n

sns

1

22

1

)1(

Page 25: 3.előadás (1)

Az átlagbecslés varianciáinak összehasonlítása

� FAE minta:

� EV minta:

� Arányos rétegzés:

−+=

−≅N

n

nN

n

nyVar KB

EV 11)(222 σσσ

nyVar FAE

2

)(σ=

−=N

n

nyVar B

AR 1(2

Nagyságrendi viszony adott n mellett:

)()()( AREVFAE yVaryVaryVar ≥≥

Page 26: 3.előadás (1)

Varianciák összehasonlítása

( )( ) 1

1

1

22

2

2

2

2

2

≤+

==

=KB

BB

B

EV

AR

Nn

n

Nn

nyVar

yVar

σσσ

σσ

σ

σ

21 H−ahol:

a belső (rétegeken belüli) szórás

a külső (rétegek közötti) szórás

Page 27: 3.előadás (1)

PÉLDA: Közvéleménykutatást végzünk egy politikus népszerűségéről EV minta alapján. Keressük a sokasági átlag 95,5%-os megbízhatósági szintű konfidencia-intervallumát.

Adatok:

n=1000

50

25

4,5% 2

Konfidencia intervallum:

A kiválasztási arány alacsony, a korrekciós faktor elhagyható.

=y=σ=α =z

58,1501000

25250)(5,95 ±=⋅±=EVYInt

Page 28: 3.előadás (1)

AR minta alapján végzett közvéleménykutatásRétegezés pártszimpátia alapján

Számítás:

32,0501000

5250)(

2562560025

5,24600)5020(4,0)5070(6,0

5252,64,046,0

5,95

222

222

222

±=⋅±=

=σ⇒=+=σ+σ=σ

≅σ⇒=−⋅+−⋅=σ

=σ⇒≅⋅+⋅=σ

AR

KB

KK

BB

YInt

Page 29: 3.előadás (1)

Rétegezés a nem ismérve alapján

58,1501000

25250)(

256250625

00)5050(5,0)5050(5,0

2525255,0255,0

5,95

222

222

2222

±=⋅±=

=σ⇒=+=σ+σ=σ

=σ⇒=−⋅+−⋅=σ

=σ⇒≅⋅+⋅=σ

AR

KB

KK

BB

YInt

Számítás: