Post on 15-Oct-2019
Senger – Induktive Statistik
Dr. Jürgen Senger
INDUKTIVE STATISTIK Wahrscheinlichkeitstheorie, Schätz- und Testverfahren
ÜBUNG 10 - LÖSUNGEN
1. Konfidenzintervall für den Mittelwert einer normalverteilten Grundgesamt-heit bei gegebener Varianz
a. Gegeben sind
Stichprobenumfang n = 36 > 30
Stichprobenmittel 4,18=x
Varianz 69,12 =σ
Das arithmetische Mittel der Stichproben aus einer normalverteilten Grundge-samtheit ist unabhängig vom Stichprobenumfang normalverteilt
)/;();( nNN XX σμσμ =
Bestimmung eines 95%-Konfidenzintervalls für μ :
[1] Festlegung der Konfidenzzahl: 99,01 =−α (hier gegeben)
[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle
576,2)995,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Berechnung des Stichprobenmittels aus den Stichprobenwerten (gegeben)
4,18361 36
1== ∑
=iixx
[4] Berechnung des Zufallsfehlers
558,063,1576,2
363,1576,2 =⋅=⋅==Δ
nc σμ
[5] Angabe des Konfidenzintervalls
ncx
ncx σμσ
+≤≤−
ÜBUNG 10 - LÖSUNGEN 2
Senger – Induktive Statistik
96,1884,17
558,04,18558,04,18
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
[6] Interpretation:
Mit der Wahrscheinlichkeit von 99% liegt der wahre Parameterwert μ der Grundgesamtheit zwischen 17,84 und 18,96.
Analog ergibt sich für die Konfidenzzahl 95,01 =−α das Konfidenzintervall
825,18975,17425,04,18425,04,18
363,196,14,18
363,196,14,18
≤≤+≤≤−
⋅+≤≤⋅−
Δ+≤≤Δ−
μμ
μ
μμμ xx
Bei gegebenem Stichprobenumfang führt die Reduktion der Sicherheitswahr-scheinlichkeit 1–α von 99 auf 95% zu einem kleineren Zufallsfehler und zu ei-nem kleineren Konfidenzintervall, d.h. zu einer genaueren Schätzung. Offenbar besteht ein Konflikt zwischen Sicherheit und Genauigkeit.
b. Es wurde eine Stichprobe im Umfang n = 225 aus einer normalverteilten Grundgesamtheit gezogen. Das Stichprobenmittel (Punktschätzung) beträgt
26,7=x
Es soll ein Konfidenzintervall für μ bestimmt werden:
[1] Festlegung der Konfidenzzahl: 99,01 =−α (hier gegeben)
[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle
576,2)995,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Berechnung des Stichprobenmittels aus den Stichprobenwerten (gegeben)
26,72251 225
1== ∑
=iixx
[4] Berechnung des Zufallsfehlers
412,015
4,12576,2225
4,2576,2 =⋅=⋅==Δn
c σμ
ÜBUNG 10 - LÖSUNGEN 3
Senger – Induktive Statistik
[5] Angabe des Konfidenzintervalls
672,7848,6
412,026,7412,026,7
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
[6] Interpretation:
Mit der Wahrscheinlichkeit von 99% liegt der Mittelwert μ der Grundge-samtheit zwischen 6,848 und 7,672.
Analog ergibt sich für die Konfidenzzahl 95,01 =−α das Konfidenzintervall
574,7946,6
314,026,7314,026,7
2254,296,126,7
2254,296,126,7
≤≤
+≤≤−
⋅+≤≤⋅−
μ
μ
μ
c. Mit Hilfe einer Stichprobe soll der Mittelwert einer normalverteilten Grundge-samtheit geschätzt werden. Eine Stichprobe im Umfang n = 100 hat den fol-genden Schätzwert 5ˆ == xμ ergeben.
Es soll die Punktschätzung nun durch eine Intervallschätzung ergänzt werden, die Aufschluß über die Zuverlässigkeit der Schätzung gibt.
Bestimmung eines Konfidenzintervalls für μ:
[1] Festlegung der Konfidenzzahl: 99,01 =−α (hier gegeben)
[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle
576,2)995,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Berechnung des Stichprobenmittels aus den Stichprobenwerten (gegeben)
5100
1 100
1== ∑
=iixx
[4] Berechnung des Zufallsfehlers
773,0103576,2
1003576,2 =⋅=⋅==Δ
nc σμ
ÜBUNG 10 - LÖSUNGEN 4
Senger – Induktive Statistik
[5] Angabe des Konfidenzintervalls
773,5227,4
773,05773,05
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
[6] Interpretation
Mit der Wahrscheinlichkeit von 99% liegt der wahre Parameterwert μ, also der Mittelwert der Grundgesamtheit, zwischen 4,227 und 5,773.
Analog ergibt sich für die Konfidenzzahl 95,01 =−α das Konfidenzintervall
588,5412,4
588,05588,05
100396,15
100396,15
≤≤
+≤≤−
⋅+≤≤⋅−
μ
μ
μ
2. Überprüfung einer Maschineneinstellung mit Hilfe einer Stichprobe
Durch eine Stichprobe soll die durchschnittliche Länge der Bleche, die auf einer bestimmten Maschine zugeschnitten werden, geschätzt werden.
Gegeben sind
Stichprobenumfang n = 40 > 30
Stichprobenmittel 5,80=x cm
Standardabweichung σ = 2,2 cm (Maschinenkonstante)
Obwohl keine Angaben über die Verteilung der Grundgesamtheit, d.h. der Länge der geschnittenen Bleche, gemacht werden, wissen wir, daß das Stichprobenmittel asymptotisch normalverteilt ist, da der Stichprobenumfang größer als 30 ist.
Bestimmung eines Konfidenzintervalls für μ :
[1] Konfidenzzahl 95,01 =−α (gegeben)
[2] Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle
96,1)975,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
ÜBUNG 10 - LÖSUNGEN 5
Senger – Induktive Statistik
[3] Stichprobenmittel
5,80401 40
1== ∑
=iixx
[4] Zufallsfehler
682,0402,296,1 =⋅==Δ
nc σμ
[5] Konfidenzintervall
182,81818,79
682,05,80682,05,80
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
[6] Interpretation:
Mit der Wahrscheinlichkeit von 95% liegt die durchschnittliche Länge μ aller Bleche, die auf dieser Maschine zugeschnitten werden, zwischen 79,818 und 81,182 cm.
3. Schätzung der spezifischen Kilometerleistung eines PKW
Gegeben sind
Stichprobenumfang n = 50 > 30
Stichprobenmittel 50=x km/Füllmenge
Standardabweichung s = 7 km/Füllmenge
Das Stichprobenmittel ist näherungsweise normalverteilt, da der Stichprobenum-fang größer als 30 ist. Da die Standardabweichung der Grundgesamtheit nicht be-kannt ist, sondern durch die Standardabweichung der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden. Für n > 30 ist aber die N(0;1)-Verteilung ei-ne gute Approximation der t-Verteilung und kann anstelle der t-Verteilung verwen-det werden.
Bestimmung eines Konfidenzintervalls für μ :
[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)
[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle
96,1)975,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
ÜBUNG 10 - LÖSUNGEN 6
Senger – Induktive Statistik
[3] Berechnung des Stichprobenmittels (gegeben)
50501 50
1== ∑
=iixx
und der Stichprobenvarianz aus den Stichprobenwerten (gegeben)
49)(491 50
1
22 =−= ∑=i
i xxs
[4] Berechnung des Zufallsfehlers
940,150796,1 =⋅==Δ
nscμ
[5] Angabe des Konfidenzintervalls
94,5106,48
94,15094,150
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
Mit der t-Verteilung ergibt sich zum Vergleich
99,5101,48 ≤≤ μ
[6] Interpretation:
Mit der Wahrscheinlichkeit von 95% liegt die durchschnittliche spezifi-sche km-Leistung μ aller PKW dieses Typs zwischen 48,01 und 51,99 km/Füllmenge.
4. Konfidenzintervall für den mittleren Durchmesser von Schrauben
Gegeben sind
Stichprobenumfang n = 200 > 30
Stichprobenmittel 824,0=x cm
Standardabweichung s = 0,042 cm
Das Stichprobenmittel ist näherungsweise normalverteilt, da der Stichprobenum-fang größer als 30 ist. Da die Standardabweichung der Grundgesamtheit durch die Standardabweichung der Stichprobe geschätzt werden muß, ist die t-Verteilung an-zuwenden. Für n > 30 ist aber die N(0;1)-Verteilung eine gute Approximation der t-Verteilung und kann anstelle der t-Verteilung verwendet werden.
ÜBUNG 10 - LÖSUNGEN 7
Senger – Induktive Statistik
Bestimmung eines Konfidenzintervalls für μ :
[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)
[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle
96,1)975,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Berechnung des Stichprobenmittels (gegeben)
824,02001 200
1== ∑
=iixx
und der Stichprobenvarianz aus den Stichprobenwerten (gegeben)
2200
1
22 042,0)824,0(199
1=−= ∑
=iixs
[4] Berechnung des Zufallsfehlers
0058,0200042,096,1 =⋅==Δ
nscμ
[5] Angabe des Konfidenzintervalls
8298,08182,00058,0824,00058,0824,0
≤≤+≤≤−
Δ+≤≤Δ−
μμ
μμμ xx
8299,08181,0 ≤≤ μ (zum Vergleich mit t-Verteilung)
[6] Interpretation:
Mit der Wahrscheinlichkeit von 95% liegt der mittlere Durchmesser μ al-ler Schrauben, die auf dieser Maschine hergestellt werden, zwischen 0,8182 und 0,8298 cm.
Analog ergibt sich für 99,01 =−α das Konfidenzintervall
8317,08163,0
00765,0824,000765,0824,0
200042,0576,2824,0
200042,0576,2824,0
≤≤
+≤≤−
⋅+≤≤⋅−
μ
μ
μ
ÜBUNG 10 - LÖSUNGEN 8
Senger – Induktive Statistik
5. Konfidenzintervall für das Durchschnittseinkommen von Studenten
Gegeben sind
Stichprobenumfang n = 81 > 30
Stichprobenmittel 543=x Euro
Standardabweichung s = 72 Euro
Das Stichprobenmittel ist näherungsweise normalverteilt, da die Grundgesamtheit näherungsweise normalverteilt ist. Da die Varianz der Grundgesamtheit durch die Varianz der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden. Wegen des großen Stichprobenumfangs n > 30, kann die N(0;1)-Verteilung anstel-le der t-Verteilung verwendet werden.
Bestimmung eines Konfidenzintervalls für μ :
[1] Festlegung der Konfidenzzahl: 90,01 =−α (gegeben)
[2] Bestimmung der Quantile für die Standardnormalverteilung aus der N(0;1)-Tabelle
645,1)95,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Berechnung des Stichprobenmittels (gegeben)
543811 81
1== ∑
=iixx
und der Stichprobenvarianz aus den Stichprobenwerten (gegeben)
281
1
22 72)543(801
=−= ∑=i
ixs
[4] Berechnung des Zufallsfehlers
16,138645,181
72645,1 =⋅=⋅==Δnscμ
[5] Angabe des Konfidenzintervalls
16,55684,529
16,1354316,13543
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
ÜBUNG 10 - LÖSUNGEN 9
Senger – Induktive Statistik
[6] Interpretation:
Mit der Wahrscheinlichkeit von 90% liegt das mittlere Monatseinkommen μ aller Studenten der UNI Kassel zwischen 529,84 und 556,16 Euro.
6. Konfidenzintervalle der Aufgabe 1 bei unbekannter Varianz
Wenn die Varianz der normalverteilten Grundgesamtheit nicht gegeben ist, sondern durch die Stichprobenvarianz geschätzt werden muß, ist grundsätzlich die t-Verteilung anzuwenden. Da die t-Verteilung aber schnell gegen die N(0;1)-Verteilung konvergiert, kann die N(0;1)-Verteilung bereits ab n > 30 anstelle der t-Verteilung verwendet werden.
In den Aufgaben 1a bis 1c ist der Stichprobenumfang größer als 30. Daher kann die N(0;1)-Verteilung auch dann verwendet werden, wenn die Varianz der Grundge-samtheit aus der Stichprobe geschätzt wird.
Zur Übung und zum Vergleich sollen die Konfidenzintervalle noch einmal mit der t-Verteilung berechnet werden.
a. 4,18=x ; 69,12 =s ; n = 36
Konfidenzzahl: 99,01 =−α
Quantile: 7238,2)35;995,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα (t-Tabelle)
Konfidenzintervall:
99,1881,17
59,04,1859,04,18
363,172,24,18
363,172,24,18
≤≤
+≤≤−
⋅+≤≤⋅−
+≤≤−
μ
μ
μ
μnstx
nstx
Und alternativ für 95%
Konfidenzzahl: 95,01 =−α
Quantile: 0301,2)35;975,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα aus t-Tabelle
ÜBUNG 10 - LÖSUNGEN 10
Senger – Induktive Statistik
Konfidenzintervall:
nstx
nstx +≤≤− μ
84,1896,17
44,04,1844,04,18
363,103,24,18
363,103,24,18
≤≤
+≤≤−
⋅+≤≤⋅−
μ
μ
μ
b. 26,7=x ; 76,52 =s ; n = 225
Konfidenzzahl: 99,01 =−α
Quantile: 598,2)224;995,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα (t-Tabelle)
Konfidenzintervall:
676,7844,6
416,026,7416,026,7
22576,56,226,7
22576,56,226,7
≤≤
+≤≤−
⋅+≤≤⋅−
+≤≤−
μ
μ
μ
μnstx
nstx
Und alternativ für 95%
Konfidenzzahl: 95,01 =−α
Quantile: 9706,1)224;975,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα (t-Tabelle)
Konfidenzintervall:
575,7945,6
315,026,7315,026,7
22576,597,126,7
22576,597,126,7
≤≤
+≤≤−
⋅+≤≤⋅−
μ
μ
μ
ÜBUNG 10 - LÖSUNGEN 11
Senger – Induktive Statistik
c. 5=x ; 92 =s ; n = 100
Konfidenzzahl: 99,01 =−α
Quantile: 6264,2)99;995,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα (t-Tabelle)
Konfidenzintervall:
789,5211,4
789,05789,05
100963,25
100963,25
≤≤
+≤≤−
⋅+≤≤⋅−
+≤≤−
μ
μ
μ
μnstx
nstx
und alternativ für 95%
Konfidenzzahl: 95,01 =−α
Quantile: 9842,1)99;975,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα (t-Tabelle)
Konfidenzintervall:
594,5406,4
594,05594,05
100998,15
100998,15
≤≤
+≤≤−
⋅+≤≤⋅−
μ
μ
μ
Der Vergleich mit den Ergebnissen in Aufgabe 1 zeigt, daß der Zufallsfehler und die Länge des Konfidenzintervalls geringfügig kleiner sind, wenn wir die N(0;1)-Verteilung anstelle der t-Verteilung verwenden. Diese Ungenauigkeit, ist die Folge der Approximation der t-Verteilung durch die N(0;1)-Verteilung.
Die t-Verteilung führt generell zu längeren Konfidenzintervallen also ungenaueren Schätzungen, weil sie auf einer Schätzung der unbekannten Standardabweichung
s=≈σσ ˆ beruht.
Die t-Werte der Student-Verteilung liegen über den entsprechenden c-Werten der Normalverteilung, wie der Tabellenvergleich zeigt. Der Unterschied ist um so grö-ßer, je kleiner die Stichprobe und damit die Zahl der Freiheitsgrade n – 1 ist und kann für n > 30 vernachlässigt werden.
ÜBUNG 10 - LÖSUNGEN 12
Senger – Induktive Statistik
7. Schätzung des durchschnittlichen Gewichts von Schokoriegeln
Gegeben sind
Stichprobenumfang n = 5 < 30
Stichprobenwerte xi : 55, 57, 53, 56, 54 g
Das Stichprobenmittel ist näherungsweise normalverteilt, da die Grundgesamtheit näherungsweise normalverteilt ist. Da die Varianz der Grundgesamtheit nicht be-kannt ist, sondern durch die Varianz der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden.
Bestimmung eines Konfidenzintervalls für μ :
[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)
[2] Bestimmung der Quantile aus der Tabelle für die t-Verteilung mit n–1 Freiheitsgraden
7764,2)4;975,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα
[3] Berechnung des Stichprobenmittels
55)5456535755(51
51 5
1=++++== ∑
=iixx
und der Stichprobenvarianz aus den Stichprobenwerten
5,2)11440(41))1()1()2()2()0((
41
))5554()5556()5553()5557()5555((41
)(41
22222
22222
5
1
22
=++++=−++−++=
−+−+−+−+−=
−= ∑=i
i xxs
[4] Berechnung des Zufallsfehlers
963,155,278,2 =⋅==Δ
nstμ
[5] Angabe des Konfidenzintervalls
963,56037,53
963,155963,155
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
ÜBUNG 10 - LÖSUNGEN 13
Senger – Induktive Statistik
[6] Interpretation:
Mit der Wahrscheinlichkeit von 95% liegt das durchschnittliche Gewicht μ aller Schokoriegel, die auf dieser Maschine hergestellt werden, zwischen 53 und 57g.
8. Schätzung des durchschnittlichen Füllgewichts von Müsli-Paketen
Gegeben sind
Stichprobenumfang n = 10 < 30
Stichprobenwerte xi : 1004, 1010, 1001, 1005, 1007,
998, 1012, 1005, 1008, 1010 g.
Das Stichprobenmittel ist näherungsweise normalverteilt, da die Grundgesamtheit näherungsweise normalverteilt ist. Da die Varianz der Grundgesamtheit nicht be-kannt ist, sondern durch die Varianz der Stichprobe geschätzt werden muß, ist die t-Verteilung anzuwenden.
a. Bestimmung eines Konfidenzintervalls für μ :
[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)
[2] Bestimmung der Quantile aus der Tabelle für die t-Verteilung mit n–1 Freiheitsgraden
26,2)9;975,0(1;2
11;2
==⎟⎠⎞
⎜⎝⎛ −−=⎟
⎠⎞
⎜⎝⎛ −− tntnt αα
[3] Berechnung des Stichprobenmittels
1006) 1010100810051012998
10071005100110101004(101
101 10
1
=+++++
++++== ∑=i
ixx
und der Stichprobenvarianz aus den Stichprobenwerten
222
2222
222
10
1
22
)10061010()10061008()10061005(
)10061012()1006998()10061007()10061005(
)10061001()10061010()10061004((91
)(91
−+−+−+
−+−+−+−+
−+−+−=
−= ∑=i
i xxs
ÜBUNG 10 - LÖSUNGEN 14
Senger – Induktive Statistik
67,18
)164136641125164(91
))4()2()1()6()8(
)1()1()5()4()2((91
22222
222222
=
+++++++++=
++−++−+
+−+−++−=s
[4] Berechnung des Zufallsfehlers
087,31032,426,2
1067,1826,2 =⋅=⋅==Δ
nstμ
[5] Angabe des Konfidenzintervalls
1,10099,1002
1,310061,31006
≤≤
+≤≤−
Δ+≤≤Δ−
μ
μ
μμμ xx
[6] Interpretation:
Mit der Wahrscheinlichkeit von 95% liegt das durchschnittliche Füllge-wicht μ aller Müslipakete, die auf dieser Maschine abgefüllt werden, zwi-schen 1002,9 und 1009,1g.
b. Berechnung des notwendigen Stichprobenumfangs
Der Zufallsfehler beträgt
nstt X ==Δ σμ ˆ
daraus ergibt sich durch Umformung der notwendige Stichprobenumfang
248,232
67,1826,2)( 2
22
22 ≈==Δ
=μstn
Der Stichprobenumfang einer erneuten Stichprobe müßte mindestens n = 24 betragen, wenn der Schätzfehler höchstens 2g sein soll.
ÜBUNG 10 - LÖSUNGEN 15
Senger – Induktive Statistik
9. Schätzung des Anteils der Einheimischen bei einem Open-air-Konzert
Durch eine Zufallsstichprobe soll der Anteil der einheimischen Besucher eines O-pen-air-Konzerts geschätzt werden.
Die Zufallsvariable X ist die Anzahl der Einheimischen in einer Stichprobe vom Umfang n.
Gegeben sind
n = 196 (N = 31.763) x = 49
Daraus ergibt sich der Anteilswert in der Stichprobe
25,019649
===nxp
und die Stichprobenvarianz
000957,01961875,0
19675,025,0)1(
1)1(ˆ 2 ==
⋅=
−≈
−−
=n
ppn
ppPσ
Es soll ein 98%-Konfidenzintervall für π berechnet werden.
[1] Konfidenzzahl: 98,01 =−α
[2] Quantile:
Die Anwendungsvoraussetzungen für die Normalverteilung (Approximati-on der Binomialverteilung durch die Normalverteilung) sind erfüllt:
514775,0196)1(54925,0196
>=⋅=−>=⋅=
pnnp
Aus der N(0;1)-Tabelle entnehmen wir die Werte der Quantile
326,2)99,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Stichprobenanteil:
p = 0,25
Standardabweichung
031,00309,01961875,0
19675,025,0)1(ˆ ≈==
⋅=
−=
npp
Pσ
ÜBUNG 10 - LÖSUNGEN 16
Senger – Induktive Statistik
[4] Zufallsfehler:
0719,00309,0326,2000957,0326,2)1(=⋅=⋅=
−=Δ
nppcπ
[5] Konfidenzintervall:
322,0178,0
0719,025,00719,025,0
≤≤
+≤≤−
Δ+≤≤Δ−
π
π
πππ pp
[6] Interpretation:
Mit der Wahrscheinlichkeit von 98% lag der Anteil π aller einheimischen Besucher bei diesem Open-air-Konzert zwischen 17,8% und 32,2%.
10. Konfidenzintervall für den Anteil aller Wähler eines Kandidaten
Durch eine Stichprobe wird der Anteil der Wahlberechtigten, die für einen be-stimmten Kandidaten sind, geschätzt.
Die Zufallsvariable X ist die Anzahl der Wähler in einer Stichprobe vom Umfang n, die für den Kandidaten sind.
Gegeben sind
n = 100 x = 55
Daraus ergibt sich der Anteilswert in der Stichprobe
55,010055
===nxp
und die Stichprobenvarianz
002475,01002475,0
10045,055,0)1(
1)1(ˆ 2 ==
⋅=
−≈
−−
=n
ppn
ppPσ
Bestimmung eines Konfidenzintervalls für π :
a. [1] Konfidenzzahl: 95,01 =−α (gegeben)
[2] Quantile:
Die Anwendungsvoraussetzungen für die Normalverteilung (Approximati-on der Binomialverteilung durch die Normalverteilung) sind erfüllt:
ÜBUNG 10 - LÖSUNGEN 17
Senger – Induktive Statistik
54545,0100)1(55555,0100
>=⋅=−>=⋅=
pnnp
Aus der N(0;1)-Tabelle entnehmen wir die Werte der Quantile
96,1)975,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Stichprobenanteil
55,0=p
Standardabweichung
05,004975,0104975,0
10045,055,0)1(ˆ ≈==
⋅=
−=
npp
Pσ
[3] Zufallsfehler:
098,005,096,10025,096,1)1(=⋅=⋅=
−=Δ
nppcπ
[4] Konfidenzintervall:
648,0452,0098,055,0098,055,0
≤≤+≤≤−Δ+≤≤Δ−
ππ
πππ pp
[5] Interpretation:
Mit der Wahrscheinlichkeit von 95% liegt der Anteil π aller Wahlberech-tigten des Wahlkreises, die für diesen Kandidaten sind, zwischen 45,2% und 64,8%.
Für die Konfidenzzahl 99,01 =−α ergibt sich analog das Konfidenzintervall
6788,04212,01288,055,01288,055,0
10045,055,0576,2
10045,055,0576,2
)1()1(
≤≤+≤≤−
⋅+≤≤
⋅−
−+≤≤
−−
ππ
π
π
pp
nppcp
nppcp
ÜBUNG 10 - LÖSUNGEN 18
Senger – Induktive Statistik
Für die Konfidenzzahl 9973,01 =−α ergibt sich das Konfidenzintervall
70,040,015,055,015,055,0
10045,055,00,3
10045,055,00,3
)1()1(
≤≤+≤≤−
⋅+≤≤
⋅−
−+≤≤
−−
ππ
π
π
pp
nppcp
nppcp
Die Schätzung des Anteilswerts ist bei einem so kleinen Stichprobenumfang sehr ungenau. Die Schätzung des Anteilswerts ist bei gegebenem Stichprobenumfang um so genauer, je kleiner die Sicherheitswahrscheinlichkeit ist.
11. Konfidenzintervall für die Wahrscheinlichkeit eine 5 oder 6 zu würfeln.
Durch eine Stichprobe soll die Wahrscheinlichkeit, bei einem einzelnen Wurf eine 5 oder 6 zu würfeln, geschätzt werden. Beim Werfen des Würfels handelt es sich, wie wir wissen, um ein Laplace-Experiment. Die Laplace-Wahrscheinlichkeit, eine 5 oder 6 zu würfeln, entspricht dem Verhältnis der Zahl der günstigen 2 zur Zahl der möglichen Fälle 6 und kann berechnet werden, ohne den Würfel zu werfen.
Diese Wahrscheinlichkeit soll nun durch eine Stichprobe geschätzt werden. Die Zu-fallsvariable X ist die Anzahl der Würfe in einer Stichprobe vom Umfang n, bei de-nen die 5 oder 6 fällt. Bei 30 Würfen des Würfels seien die 5 und die 6 insgesamt 11 mal gefallen.
Gegeben sind dann
n = 30 x = 11
Daraus ergibt sich der Anteilswert in der Stichprobe
367,03011
===nxp
und die Stichprobenvarianz
007741,030
223,030
)63,01(63,0)1(
008008,029
223,029
36,063,0130
)63,01(63,01
)1(ˆ 2
==−
=−
≈
==⋅
=−−
=−−
=
npp
npp
Pσ
Die Näherung ist bei diesem niedrigen Stichprobenumfang zwar noch sehr unge-nau, kann aber verwendet werden.
ÜBUNG 10 - LÖSUNGEN 19
Senger – Induktive Statistik
Es soll ein 90%-Konfidenzintervall für π berechnet werden.
[1] Konfidenzzahl: 90,01 =−α
[2] Quantile:
Die Anwendungsvoraussetzungen für die Normalverteilung (Approximati-on der Binomialverteilung durch die Normalverteilung) sind erfüllt:
519301930)1(
511301130
>=⋅=−
>=⋅=
pn
np
Aus der N(0;1)-Tabelle entnehmen wir die Werte der Quantile
645,1)95,0(2
12
==⎟⎠⎞
⎜⎝⎛ −=⎟
⎠⎞
⎜⎝⎛− ccc αα
[3] Stichprobenanteil
p = 0,367
Standardabweichung
08798,0007741,030
)63,01(63,0)1(ˆ ==−
=−
=n
ppPσ
[4] Zufallsfehler:
1447,0007741,0645,1)1(=⋅=
−=Δ
nppcπ
mit n–1:
1472,0008008,0645,11
)1(=⋅=
−−
=Δn
ppcπ
[5] Konfidenzintervall:
512,0222,0
145,0367,0145,0367,0
≤≤
+≤≤−
Δ+≤≤Δ−
π
π
πππ pp
ÜBUNG 10 - LÖSUNGEN 20
Senger – Induktive Statistik
[6] Interpretation:
Mit der Wahrscheinlichkeit von 90% liegt die Wahrscheinlichkeit π, eine 5 oder 6 zu würfeln, zwischen 22,2% und 51,2%.
Auch in diesem Beispiel sehen wir, daß ein so kleiner Stichprobenumfang zu unge-nauen Schätzungen führt. Wegen der großen Standardabweichung von 9% ist nicht nur die Punktschätzung selbst ungenau (große Abweichungen vom wahren Parame-terwert sind wahrscheinlich), sondern auch das Konfidenzintervall sehr lang.
12. Berechnung des notwendigen Stichprobenumfangs
Durch eine Stichprobe soll der Marktanteil eines Softwareprodukts geschätzt wer-den.
Gegeben sind
Δπ = 0,02 maximaler Schätzfehler
1–α = 0,95 Sicherheitswahrscheinlichkeit
3,0ˆ == pπ Marktanteil bei früherer Erhebung
a. Berechnung des notwendigen Stichprobenumfangs
Der Zufallsfehler beträgt
nppcc P
)1(ˆ −==Δ σπ
daraus ergibt sich durch Umformung der notwendige Stichprobenumfang
201784,201652596,102,0
7,03,096,1)(
)1( 22
22
2 ≈=⋅=⋅
=Δ
−=
πppcn
Der Stichprobenumfang müßte mindestens n = 2017 betragen, wenn der Schätzfehler höchstens 2% sein soll.
b. Wenn der Stichprobenumfang aus Kostengründen auf n = 1000 reduziert wer-den müßte, dann wäre der Schätzfehler:
0284,00145,096,11000
7,03,096,1)1(ˆ =⋅=⋅
⋅=−
==Δn
ppcc Pσπ
Der Schätzfehler würde also von 2% auf 2,84% steigen.
c. Wenn der Stichprobenumfang bei unveränderter Sicherheitswahrscheinlichkeit von 95% reduziert werden würde, dann würde sich die Irrtumswahrscheinlich-keit nicht verändern. Die Irrtumswahrscheinlichkeit läge also unverändert bei 5%.
ÜBUNG 10 - LÖSUNGEN 21
Senger – Induktive Statistik
13. Konfidenzintervall für die Varianz der Brenndauer von Glühbirnen
Die Brenndauer der Glühbirnen ist annahmegemäß näherungsweise normalverteilt.
In einer Stichprobe von 50 Glühbirnen betrage die Standardabweichung der Brenn-dauer 120 Stunden.
Gegeben sind also
Stichprobenumfang n = 50
Standardabweichung s = 120
Bestimmung eines Konfidenzintervalls für σ 2 und σ
a. Sicherheitswahrscheinlichkeit 95%
[1] Festlegung der Konfidenzzahl: 95,01 =−α (gegeben)
[2] Bestimmung der Quantile aus der Tabelle der Chiquadrat-Verteilung für n – 1 = 49 Freiheitsgrade. Da die Chiquadrat-Verteilung asymmetrisch ist, müssen das untere und das obere Quantil gesondert ermittelt werden.
2,70)49;975,0()1,2
1
6,31)49;025,0(1,2
22
222
21
211
==⎟⎠⎞
⎜⎝⎛ −−=
==⎟⎠⎞
⎜⎝⎛ −=
χαχ
χαχ
nc
nc
[3] Berechnung der Stichprobenvarianz:
400.14120)(491 22
50
1
2 ==−= ∑=
xxsi
i
[4] Berechnung der Konfidenzgrenzen:
223296,31
1440049)1(
100512,70
1440049)1(
1
22
2
=⋅=−
=⋅=−
csn
csn
[5] Angabe des Konfidenzintervall:
1491002232910048
)1()1(
21
22
2
2
≤≤≤≤
−≤≤−
σσ
σcsn
csn
ÜBUNG 10 - LÖSUNGEN 22
Senger – Induktive Statistik
[6] Interpretation:
Mit der Wahrscheinlichkeit von 95% liegt die Varianz der Brenndauer al-ler Glühbirnen zwischen 10.051 und 22.329 Quadratstunden.
Mit der Wahrscheinlichkeit von 95% liegt die Standardabweichung der Brenndauer aller Glühbirnen zwischen 100 und 149 Stunden.
b. Sicherheitswahrscheinlichkeit 99%
[1] Konfidenzzahl: 99,01 =−α
[2] Quantile aus der Tabelle der Chiquadrat-Verteilung für n – 1 = 49 Frei-heitsgrade:
23,78)49;995,0()1,2
1
27,27)49;005,0(1,2
22
222
21
211
==⎟⎠⎞
⎜⎝⎛ −−=
==⎟⎠⎞
⎜⎝⎛ −=
χαχ
χαχ
nc
nc
[3] Stichprobenvarianz: 144002 =s
[4] Konfidenzgrenzen:
6,2587427,27
1440049)1(
6,901923,78
1440049)1(
1
22
2
=⋅=−
=⋅=−
csn
csn
[5] Konfidenzintervall:
16195258759020
)1()1(
21
22
2
2
≤≤≤≤
−≤≤−
σσ
σcsn
csn
[6] Interpretation:
Mit der Wahrscheinlichkeit von 99% liegt die Varianz der Brenndauer al-ler Glühbirnen zwischen 9020 und 25875 Quadratstunden und die Stan-dardabweichung zwischen 95 und 161 Stunden.
Erwartungsgemäß ergibt sich bei der höheren Sicherheitswahrscheinlich-keit ein längeres Konfidenzintervall, d.h. eine ungenauere Schätzung.