Väntevärde, standardavvikelse och...
Transcript of Väntevärde, standardavvikelse och...
Tillämpad matematik III/Statistik - Sida 61Mats Gunnarsson
Ett statistiskt material kan sammanfattas med medelvärde
och standardavvikelse (varians), �̅ochs��.
På liknande sätt kan en sannolikhetsfördelning med kända
förutsättningar sammanfattas med väntevärde, µ, och
standardavvikelse, σ.
µ anger vilket medelvärde och
σ anger vilken standardavvikelse man kan förvänta sig att få
om mäter många gånger.
Väntevärde, standardavvikelse och varians
Tillämpad matematik III/Statistik - Sida 62Mats Gunnarsson
Väntevärde, standardavvikelse och varians
Οm ξ är en diskret stokastisk variabel med utfallsrummet{xi, i = 1,...}.
Väntevärdet för ξ, E[ξ], ofta betecknat µ, definieras då som
Variansen för ξ, ofta betecknad σ2, definieras som
Standardavvikelsen, ofta betecknad med σ, definieras som
E x P xi i
i
[ ] ( )ξ ξ= =∑
2222 )()()(])[(][ µξξµµξξ −==−=−= ∑ ExPxEVi
ii
σξξ == )(][ DV
Tillämpad matematik III/Statistik - Sida 63Mats Gunnarsson
Väntevärde, standardavvikelse och varians
Om ξ är en kontinuerlig stokastisk variabel med frekvensfunktionen
f(x). Väntevärdet för ξ, E[ξ], ofta betecknad µ, definieras då som
Variansen för ξ, ofta betecknad σ2 definieras som
Standardavvikelsen, ofta betecknad med σ, definieras som
][][ ξξσ DV ==
∫∞
∞−
== dxxxfE )(][ξµ
22222 ][)()(])[(][ µξµµξξσ −=−=−== ∫∞
∞−
EdxxfxEV
Tillämpad matematik III/Statistik - Sida 64Mats Gunnarsson
Median, kvartil och percentilDen stokastiska variabeln ξ har fördelningsfunktionen F(x).
Medianen definieras som det tal, m, som uppfyller
F(m) = 0,5
Den stokastiska variabeln ξ har fördelningsfunktionen F(x). Den p:te
percentilen definieras som det tal Lp som uppfyller
F(Lp) = p% = (p/100)
Med kvartiler avses Q1 = L25 , Q2 = L50 (medianen) och Q3 = L75.
p%(100-p)%
Lp
f(x)
Tillämpad matematik III/Statistik - Sida 65Mats Gunnarsson
ξ diskret stokastisk variabel med utfall � , �, … , �� och
given sannolikhetsfunktion p(xk).
Med Mathematica beräknas väntevärde och varians enligt.
x={x1,x2,.., xn}
px={p(x1),p(x2),.., p(xn)}
my=x.px (skalärprodukt)
varians=x2.px-my2
Väntevärde, standardavvikelse m.m med
Mathematica
Tillämpad matematik III/Statistik - Sida 66Mats Gunnarsson
ξ kontinuerlig stokastisk variabel med utfall � � � � �och given frekvensfunktion f(x).
Med Mathematica beräknas väntevärde och varians direkt
med definitionen
my=� ������
���
varians=� �������
���-my2
Väntevärde, standardavvikelse m.m med
Mathematica
Tillämpad matematik III/Statistik - Sida 67Mats Gunnarsson
För de ”kända” fördelningarna använder man
my=Mean[fördelning]resp.
varians=Variance[fördelning]
median=Median[fördelning]
kvartiler=Quartiles[fördelning]
ex.
Mean[BinomialDistribution[n,p]]
Variance[ExponentialDistribution[λ]]
Median[PoissonDistribution[λ]]
Quartiles[NormalDistribution[µ,σ]]
Väntevärde, standardavvikelse m.m med
Mathematica
Tillämpad matematik III/Statistik - Sida 68Mats Gunnarsson
Några vanliga fördelningar
Tillämpad matematik III/Statistik - Sida 69Mats Gunnarsson
Oberoende stokastiska variabler
Vi har 2 stokastiska variabler ξ1,och ξ2
Om P(ξ1<x1 och ξ2<x2) = P(ξ1<x1 )P(ξ2<x2 )
för alla tal x1 och x2
så sägs ξ1 och ξ2 vara oberoende stokastiska variabler.
Jämför: Om A = (ξ1<x1) och B = (ξ2<x2),
A och B oberoende händelser gäller
P(ξ1<x1 och ξ2<x2) = P(A∩B) = P(A)P(B) =
= P(ξ1<x1 )P(ξ2<x2 )
Tillämpad matematik III/Statistik - Sida 70Mats Gunnarsson
Oberoende stokastiska variabler
Vi har n stokastiska variabler ξ1, ξ2, ..., ξn
Om
P(ξ1<x1 och ξ2<x2 och ... och ξn<xn) =
= P(ξ1<x1 )P(ξ2<x2 ) ... P(ξn<xn)
för alla tal x1, x2, ... xn
så är ξ1, ξ2, ..., ξn oberoende stokastiska variabler
Sannolikheten för att ξi<xi påverkar inte sannolikheten för de
övriga.
Tillämpad matematik III/Statistik - Sida 71Mats Gunnarsson
Räkneregler för väntevärde och varians
för funktioner av stokastiska variabler
nde är oberoen
, ... , om
],n
V[n
a ... ] V[ a] n
a ... V[a
]n
E[n
a ... ] E[ an] n
a ... E[a
nde är oberoe och ], om V[] V[] V[
] E[] E[] E[
]V[ ab] V[ab] aE[b] E[a
ξξ
ξξξξ
ξξξξ
ξξξξξξ
ξξξξ
ξξξξ
1
21
2111
2
1111
212121
2121
2
++=++•
++=++•
+=+•
+=+•
=+•+=+•
Sats 5A-C
Tillämpad matematik III/Statistik - Sida 72Mats Gunnarsson
Medelvärde av oberoende försök
Vi har n oberoende stokastiska variabler ξ1, ξ2, ..., ξn
Alla har samma väntevärde: E[ξi] = µAlla har samma varians: V[ξi] = σ2
Sätt
Då gäller
∑=
=n
i
iξn
ξ1
1
E och V n[ ] [ ] /ξ µ ξ σ= = 2
Detta är tillämpligt vid till exempel upprepade mätningar på samma variabel
Tillämpad matematik III/Statistik - Sida 73Mats Gunnarsson
Normalfördelningen
Normalfördelningen är vanligt förekommande
– Den bestäms av två parametrar, väntevärde, µ, samt standardavvikelse, σ
f x e x( ) ( ) /( )= − −1
2
2 22
σ πµ σ
F x e dtt
x
( ) ( ) /( )= − −
−∞∫
1
2
2 22
σ πµ σ
ξ µ σ∈ N ( , )
Tillämpad matematik III/Statistik - Sida 74Mats Gunnarsson
Normalfördelningen
För normalfördelningen är F(x) omöjlig att beräkna utan numeriska
metoder (den går inte att lösa algebraiskt)
Därför finns tabeller för N(0,1), vilken har fördelningsfunktionen
För denna finns tabeller
∫∞−
−=x
/t dteπ
Φ(x) 22
2
1
−Φ=≤∈
σµ
ξσµξx
xPattgällersåNOm )( ),(
Φ(x)x)Φ( −=− 1ξ µσ−
∈ N ( , )0 1
Tillämpad matematik III/Statistik - Sida 75Mats Gunnarsson
Allmänna egenskaper
Sats
Sats
Om ξ œ N(µ,σ) då är E(ξ)=µ och D(ξ) = σ.Dessutom gäller
Y = aξ + b œ N(aµ + b; |a|σ)
).1,0(blir Då
och ),( Om
NY
YN
∈
−=∈
σµξ
σµξ
Tillämpad matematik III/Statistik - Sida 76Mats Gunnarsson
Allmänna egenskaper forts.
För alla normalfördelningar gäller:
P(m-σ <ξ < m +σ) = 0.682 P(m-2σ <ξ < m +2σ) = 0.954P(m-3σ <ξ < m +3σ) = 0.997
P(m-1.96σ <ξ < m +1.96σ) = 0.95P(m-2.58σ <ξ < m +2.58σ) = 0.99P(m-3.29σ <ξ < m +3.29σ) = 0.999
Tillämpad matematik III/Statistik - Sida 77Mats Gunnarsson
Fler egenskaperSats
Sats
);
);
gäller
oberoende och , Om
2
2
2
12121
2
2
2
12121
222111
(
(
σσµµξξ
σσµµξξ
+−∈−
++∈+
∈∈
N
N
);σN(µξ);σN(µξ
( ) ( )nNnnN
ccN
nicN
i
i
n
i
ii
n
i
iii
iii
/;och ;
fås med;
gäller
,...,1 givna,är och samt oberoendeoch );( Om
n
1i
n
1i 1
22
1
i
σµξσµξ
µµσµξ
σµξ
∈∈
=
∈
=ℜ∈∈
∑
∑ ∑∑
=
= ==
Tillämpad matematik III/Statistik - Sida 78Mats Gunnarsson
Centrala gränsvärdessatsen
Vi har n oberoende likafördelade stokastiska variabler
ξ1, ξ2, ..., ξn, med väntevärdet µ och standardavvikelsen σ
Om n går mot oändligheten gäller att
Praktiskt: summan av antal slumpvariabler är approximativt
normalfördelade om n är stort. (Tumregel n ≥ 30)
Normalapproximationer är mycket användbara
Φ(x)xnσ
nµξ
P
n
i
i
→
≤−∑
=1
Tillämpad matematik III/Statistik - Sida 79Mats Gunnarsson
och
Oavsett bakomliggande fördelning, bara n är tillräckligt
stort, tum regel: n > 30
Följder av centrala gränsvärdessatsen
)n/,N(ivt approximatär att gäller Det σµξ
),( eladnormalfördivt approximatär 1
nnNn
ii
σµξ∑=
Tillämpad matematik III/Statistik - Sida 80Mats Gunnarsson
Följder av centrala gränsvärdessatsen
( ).15)( :egelstort tumrär om
,gäller så )(
>=
≈∈
λξλλλξ
Vn
NξPoOm
( ).10)1()( : tumregelstort,är om
)1(,gäller så ),(
>−=
−≈∈
pnpVn
pnpnpNξpnBinOm
ξ
ξ
.101
)1()( : tumregelstort,är om
1)1(,gäller så ),,(
>
−−
−=
−−
−≈∈
N
nNpnpVn
N
nNpnpnpNξpnNHypOm
ξ
ξ
Tillämpad matematik III/Statistik - Sida 81Mats Gunnarsson
Approximationsregler - centrala gränsvärdessatsen
Hyp(N, n, p)
Bin(n, p) Po(λ)λ = np
n > 10
p < 0,1
λ = np
p+n/N < 0,1
n > 10
n/N < 0,1 N(µ, σ)
np(1-p)>10
λ>15
(N-n)np(1-p) /(N-1)>10