Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte...
Transcript of Carsten Rezny - iam.uni-bonn.de fileStatistikpraktikum Carsten Rezny Institut f ur angewandte...
Statistikpraktikum
Carsten Rezny
Institut fur angewandte MathematikUniversitat Bonn
Sommersemester 2014
Multivariate Statistik
Mehrdimensionale Datensatze:
x11 · · · x1m...
. . ....
xn1 · · · xnm
Grafische Darstellung:
XY- (Scatter-) Plot
Q-Q-Plot
Multivariate Statistik
Mehrdimensionale Datensatze: x11 · · · x1m...
. . ....
xn1 · · · xnm
Grafische Darstellung:
XY- (Scatter-) Plot
Q-Q-Plot
Multivariate Statistik
Mehrdimensionale Datensatze: x11 · · · x1m...
. . ....
xn1 · · · xnm
Grafische Darstellung:
XY- (Scatter-) Plot
Q-Q-Plot
Multivariate Statistik
Mehrdimensionale Datensatze: x11 · · · x1m...
. . ....
xn1 · · · xnm
Grafische Darstellung:
XY- (Scatter-) Plot
Q-Q-Plot
Multivariate Statistik
Mehrdimensionale Datensatze: x11 · · · x1m...
. . ....
xn1 · · · xnm
Grafische Darstellung:
XY- (Scatter-) Plot
Q-Q-Plot
Quantil-Quantil-Plot
Grafischer Vergleich der Verteilung zweier Datensatze
1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%
2 bestimme Quantile (”Unterschreitungsanteile“)
nxi (p) und nyi (p): p-Quantil der xi bzw. yi
3 plotte nyi (p) gegen nxi (p)
Quantil-Quantil-Plot
Grafischer Vergleich der Verteilung zweier Datensatze
1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%
2 bestimme Quantile (”Unterschreitungsanteile“)
nxi (p) und nyi (p): p-Quantil der xi bzw. yi
3 plotte nyi (p) gegen nxi (p)
Quantil-Quantil-Plot
Grafischer Vergleich der Verteilung zweier Datensatze
1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%
2 bestimme Quantile (”Unterschreitungsanteile“)
nxi (p) und nyi (p): p-Quantil der xi bzw. yi
3 plotte nyi (p) gegen nxi (p)
Quantil-Quantil-Plot
Grafischer Vergleich der Verteilung zweier Datensatze
1 wahle Quantilstufen, z.B. 10%, 20%, . . . , 100%
2 bestimme Quantile (”Unterschreitungsanteile“)
nxi (p) und nyi (p): p-Quantil der xi bzw. yi
3 plotte nyi (p) gegen nxi (p)
Lineare Regression
Gesucht: Zusammenhang zwischen m Variablen Xk und Y
Modell:
y = β0 +m∑
k=1
βkxk + u
y abhangige (”erklarte“)Variable
xk m unabhangige (”erklarende“)Variable
β0, βk Regressionsparameter
u Residuum
Lineare Regression
Gesucht: Zusammenhang zwischen m Variablen Xk und Y
Modell:
y = β0 +m∑
k=1
βkxk + u
y abhangige (”erklarte“)Variable
xk m unabhangige (”erklarende“)Variable
β0, βk Regressionsparameter
u Residuum
Lineare Regression
Gesucht: Zusammenhang zwischen m Variablen Xk und Y
Modell:
y = β0 +m∑
k=1
βkxk + u
y abhangige (”erklarte“)Variable
xk m unabhangige (”erklarende“)Variable
β0, βk Regressionsparameter
u Residuum
Lineare Regression
Gesucht: Zusammenhang zwischen m Variablen Xk und Y
Modell:
y = β0 +m∑
k=1
βkxk + u
y abhangige (”erklarte“)Variable
xk m unabhangige (”erklarende“)Variable
β0, βk Regressionsparameter
u Residuum
Lineare Regression
Gesucht: Zusammenhang zwischen m Variablen Xk und Y
Modell:
y = β0 +m∑
k=1
βkxk + u
y abhangige (”erklarte“)Variable
xk m unabhangige (”erklarende“)Variable
β0, βk Regressionsparameter
u Residuum
Lineare Regression
Gesucht: Zusammenhang zwischen m Variablen Xk und Y
Modell:
y = β0 +m∑
k=1
βkxk + u
y abhangige (”erklarte“)Variable
xk m unabhangige (”erklarende“)Variable
β0, βk Regressionsparameter
u Residuum
Lineare Regression
Mit n Messwerten yi :
lineares Gleichungssystem y1...yn
=
1 x11 · · · x1m...
......
1 xn1 · · · xnm
β0
...βm
+
u1...un
oder:
y = Xb + u
Lineare Regression
Mit n Messwerten yi : lineares Gleichungssystem
y1...yn
=
1 x11 · · · x1m...
......
1 xn1 · · · xnm
β0
...βm
+
u1...un
oder:
y = Xb + u
Lineare Regression
Mit n Messwerten yi : lineares Gleichungssystem y1...yn
=
1 x11 · · · x1m...
......
1 xn1 · · · xnm
β0
...βm
+
u1...un
oder:y = Xb + u
Lineare Regression
Mit n Messwerten yi : lineares Gleichungssystem y1...yn
=
1 x11 · · · x1m...
......
1 xn1 · · · xnm
β0
...βm
+
u1...un
oder:
y = Xb + u
Lineare Regression
Ansatz: Methode der kleinsten Quadrate
Betrachte Residuen u als Funktion von b:
u(b) = (y − Xb)
minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer
b = (XTX)−1XTy
Lineare Regression
Ansatz: Methode der kleinsten Quadrate
Betrachte Residuen u als Funktion von b:
u(b) = (y − Xb)
minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer
b = (XTX)−1XTy
Lineare Regression
Ansatz: Methode der kleinsten Quadrate
Betrachte Residuen u als Funktion von b:
u(b) = (y − Xb)
minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer
b = (XTX)−1XTy
Lineare Regression
Ansatz: Methode der kleinsten Quadrate
Betrachte Residuen u als Funktion von b:
u(b) = (y − Xb)
minimiere ||u(b)||2:
→ Kleinst-Quadrate-Schatzer
b = (XTX)−1XTy
Lineare Regression
Ansatz: Methode der kleinsten Quadrate
Betrachte Residuen u als Funktion von b:
u(b) = (y − Xb)
minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer
b = (XTX)−1XTy
Lineare Regression
Ansatz: Methode der kleinsten Quadrate
Betrachte Residuen u als Funktion von b:
u(b) = (y − Xb)
minimiere ||u(b)||2: → Kleinst-Quadrate-Schatzer
b = (XTX)−1XTy
Lineare Regression
Excel/OpenOffice:
RGP(y data; x data; type; stats)
y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte
x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten
typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt
statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben
(engl.: LINEST(...))
Lineare Regression
Excel/OpenOffice:
RGP(y data; x data; type; stats)
y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte
x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten
typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt
statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben
(engl.: LINEST(...))
Lineare Regression
Excel/OpenOffice:
RGP(y data; x data; type; stats)
y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte
x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten
typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt
statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben
(engl.: LINEST(...))
Lineare Regression
Excel/OpenOffice:
RGP(y data; x data; type; stats)
y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte
x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten
typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt
statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben
(engl.: LINEST(...))
Lineare Regression
Excel/OpenOffice:
RGP(y data; x data; type; stats)
y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte
x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten
typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt
statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben
(engl.: LINEST(...))
Lineare Regression
Excel/OpenOffice:
RGP(y data; x data; type; stats)
y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte
x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten
typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt
statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben
(engl.: LINEST(...))
Lineare Regression
Excel/OpenOffice:
RGP(y data; x data; type; stats)
y data Werte der abhangigen Variablen; einzelne Zeile oderSpalte
x data Werte der m unabhangigen Variablen; m Zeilen oderSpalten
typeFALSE: β0 = 0TRUE: β0 wird durch Regression bestimmt
statsFALSE: nur Regressionsparameter ausgebenTRUE: zusatzlich statistische Parameter ausgeben
(engl.: LINEST(...))
Lineare Regression
RGP(y data; x data; FALSE
; TRUE
)
βm βm−1 . . . β1
β0
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; FALSE
; TRUE
)
βm βm−1 . . . β1
β0
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE
; TRUE
)
βm βm−1 . . . β1 β0
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE; TRUE)
βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df
ssreg ssres
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE; TRUE)
βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df
ssreg ssres
σi Standardfehler der Schatzung von βi
r2 Bestimmtheitsmaß (Quadrat desKorrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE; TRUE)
βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df
ssreg ssres
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE; TRUE)
βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df
ssreg ssres
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE; TRUE)
βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df
ssreg ssres
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE; TRUE)
βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df
ssreg ssres
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen
Lineare Regression
RGP(y data; x data; TRUE; TRUE)
βm βm−1 . . . β1 β0σm σm−1 . . . σ1 σ0r2 σyF df
ssreg ssres
σi Standardfehler der Schatzung von βir2 Bestimmtheitsmaß (Quadrat des
Korrelationskoeffizienten)
σy Standardfehler der Schatzung von y
F Teststatistik fur die Hypothese H0 : r2 = 0(Fm,n−m-verteilt)
df = n −m: Nenner-Freiheitsgrade von F
ssreg , ssres Quadratsummen der Regressionswerte bzw. Residuen