Forschungsbericht gliederung aktualisierung...
Transcript of Forschungsbericht gliederung aktualisierung...
Fachhochschule Stralsund
Forschungsbericht
Analyse und Kurzfristprognose von Zeitreihen für Ener-gie- und Rohstoffmärkte mit Hilfe stochastischer nichtli-
nearer Mehrgleichungsmodelle
Prof. Dr. Wolfgang Götze
II
Die Grafiken und Tabellen des Berichts sind urheberechtlich geschützt und dürfen nur zum Zweck der Ausbildung an der Fachhochschule Stralsund verwendet werden.
III
Abstract
Der vorliegende Bericht ist im Verlauf eines Forschungsfreisemesters an der Fachhochschule Stralsund entstanden. Er stützt sich auf eine Literaturrecherche zu empirischen Untersuchun-gen an Zeitreihen aus dem Bereich des Energie- und Rohstoffhandels in den USA und setzt sich vor allem mit den methodischen Ansätzen verschiedener Autoren auseinander. Im ersten Teil des Berichts wird eine Methodik zur Modellierung autoregressiver Prozesse mit GARCH-Residuen vorgestellt, die vor allem für sehr volatile Stunden- und Tagesreihen auf den Energiemärkten geeignet und in dieser Form bisher nicht publiziert worden ist. Im zweiten Teil des Berichts wird eine Methodik zur Spezifikation von Zeitreihen-Struktur-Modellen präsentiert und an Monatsreihen aus dem Rohstoff- und Energiebereich erprobt. Die prognostischen Eigenschaften der verschiedenen nichtlinearen Mehrgleichungsmodelle wer-den durch Experimente mit Einschritt-Vorhersagen am aktuellen Rand untermauert und mit den Ergebnissen aus der Literatur verglichen. Die empirischen Untersuchungen stützen sich auf 61 Zeitreihen mit 88.464 Beobachtungen, darunter 18 Stundenreihen, 11 Tagesreihen und 32 Monatsreihen. Besonderer Wert wird auf die Erläuterung von Fachbegriffen aus der US-Energie-Statistik gelegt. Über den Energie- und Rohstoffbereich hinaus werden auch einige volatile Zeitreihen der internationalen Fi-nanzmärkte und der Labornutzung im Fachbereich Wirtschaft modelliert. Für die verwendeten Programmpakete EViews 5.0, ITSM 2000 und GivWin/STAMP 6.0 werden einführende Beispiele und ein Überblick zum jeweiligen methodischen Leistungsum-fang gegeben. Die Stärken und Schwächen der drei Softwareprodukte sind einander gegen-über gestellt. Der Bericht ist so strukturiert, dass er begleitend für eine Lehrveranstaltung Quantitative Me-thoden im Rahmen des Master Studiengangs „Business Informatics“ eingesetzt werden kann. Stralsund, März 2005
Eine Aktualisierung der Literaturquellen und eine Verfeinerung der GARCH-Spezifikation mit Hilfe des BDS-Tests sind inzwischen hinzugekommen. Darüber hinaus wurden modell-seitige Erweiterungen mit Hilfe von Dummy-Variablen für Tageszeiten und Tagesspitzen eingeführt und die Verbesserung der Prognosegüte dokumentiert. Stralsund, Juni 2006
Im Anhang des überarbeiteten Berichts sind Übungsaufgaben für das PC-Labor, Zusatzpro-gramme für EViews und technische Erweiterungen von EViews 6 gegenüber EViews 5 ent-halten. Stralsund, Januar 2007
Einige formale Korrekturen sind vorgenommen worden. Stralsund, März 2011
IV
Gliederung Teil 1: Methodik zur Spezifikation autoregressiver Modelle mit GARCH-Residuen 1. Überblick zur Literatur ............................................................................................. 1 2. Theoretische Grundlagen .......................................................................................... 3 3. Stufen der Modellspezifikation ................................................................................. 9 4. Erläuterung der untersuchten Datenbestände ........................................................... 12 5. Demonstration eines Beispiels .................................................................................. 18 6. Interpretation der empirischen Ergebnisse ............................................................... 32 7. Zur Prognosegüte ausgewählter Zweigleichungsmodelle mit GARCH-Struktur ..... 60 8. Einführung in das Paket EViews 5.0 ........................................................................ 63 9. Paketvergleich von EViews 5.0 mit ITSM 2000 ...................................................... 69
Teil 2: Methodik zur Spezifikation von Zeitreihen-Struktur-Modellen
10. Theoretische Grundlagen .......................................................................................... 81 11. Stufen der Modellspezifikation ................................................................................. 87 12. Erläuterung der untersuchten Datenbestände ........................................................... 88 13. Demonstration eines Beispiels .................................................................................. 89 14. Interpretation der empirischen Ergebnisse ............................................................... 99 15. Zur Prognosegüte von Strukturgleichungsmodellen ................................................. 111 16. Einführung in das Programmpaket STAMP 6 .......................................................... 113 17. Paketvergleich von STAMP 6.0/GivWin mit EViews 5.0 ....................................... 119 Literaturverzeichnis und Datenquellen ............................................................................... 123 Sonstige Quellen und Abkürzungen .................................................................................... 125 Bilderverzeichnis ................................................................................................................. 127 Tabellenverzeichnis ............................................................................................................. 129 Deutsch-Englische Begriffsabgrenzung .............................................................................. 131 Anlagen Übungsaufgaben für das PC-Labor ..................................................................................... 134 Funktionaler Zuwachs von EViews 6 gegenüber EViews 5 ............................................... 135 Programmerweiterung für EViews (ab Version 5.0) .......................................................... 136 Ergänzende Quellen ............................................................................................................ 141
Kapitel 1 1
1. Überblick zur Literatur GARCH-Modelle haben sich in den letzten Jahren vor allem bei der Modellierung von Fi-nanzmarktdaten bewährt (siehe Clements [2004]). Der Grund dafür bestand darin, dass Zeit-reihen von Aktienkursen, Wechselkursen etc. als Random Walk aufgefasst werden können (vgl. Schlittgen [1995] S. 93 ff.). Da die Varianz eines Random Walks zeitvariabel (volatil) ist, ergeben sich zeitabhängige Prognoseintervalle für die Einschritt- und die Mehrschritt-prognose (siehe Götze [2000], S. 183 ff.). Um die Risikodynamik beschreiben zu können, wurde zur Gleichung für den Erwartungswert (Punktprognose) eine weitere Gleichung für die Varianz (Intervallprognose) hinzu gefügt (vgl. Brockwell u. A. [2002], S. 349 ff.). Im Zusammenhang mit der Deregulierung der Energiemärkte in Amerika und Europa sind in den letzten Jahren Strombörsen und unabhängige Systemdienste (ISO: Independent System Operator) entstanden (siehe NYISO [2003], OMEL [2003], CAISO [2004], PJM [2004], NE-ISO [2005])1. In diesem Zusammenhang entstand ein Bedarf an effizienten Techniken zur Vorhersage von Stunden- und Tagespreisen für regionale Energieangebote. In verschiedenen Studien wurden
• ARIMA-Modelle (siehe Contreras u. A. [2002]),
• AR-Modelle mit GARCH-Residuen (Garcia u. A. [2003] ),
• Dynamische Regressionsmodelle mit GARCH-Residuen (siehe Nogales u. A. [2002], Guirguis u. A. [2004])
auf ihre Prognosetauglichkeit für Elektroenergiepreise untersucht. Parallel dazu sind auch alternative Ansätze, wie z. B. ARFIMA-Modelle, Kalman-Filter, Kointegrationsmodelle, In-put-Output-Modelle oder neuronale Netze, in die Diskussion einbezogen worden (vgl. Carnero u. A. [2003], Hinz [2003], Serletis u. A. [2004], MateoGonzales u. A.[2005], Rodri-guez u. A. [2004]). Eine Literaturrecherche zeigte, dass vor allem die Spezifikation von Reg-ressionsmodellen mit GARCH-Residuen zu überzeugenden Anwendungsergebnissen führt, aber methodisch noch nicht so ausgereift ist, wie z. B. die klassische Box-Jenkins-Technik für ARIMA-Modelle (vgl. Götze [2000], S. 192 ff.). Es fiel vor allem auf, dass
• eher selten mit überprüfbaren statistischen Hypothesen gearbeitet,
• dem Prinzip der sparsamen Parametrisierung zu wenig Aufmerksamkeit geschenkt,
• der mittlere quadratische Vorhersagefehler der Punktprognose bei der Evaluierung über-betont wird.
Das begann mit dem Beitrag von Contreras u. A. [2002] und setzte sich bei Garcia [2003] fort. Letzterer stellte eine eher pragmatische Modellanpassung für GARCH-Prozesse vor, die weitgehend auf eine statistische Modellüberprüfung verzichtet. Im Gegensatz dazu gab Guirguis [2004] verschiedene Testverfahren und Gütekriterien zur Spezifikation bivariater GARCH-Modelle an, konnte aber noch keine in sich geschlossene Methodik vorweisen. Die folgende empirische Untersuchung soll dazu beitragen, die methodische Lücke zu schlie-ßen. Die Anwendungsbeispiele stammen aus dem Bereich des Business und umfassen in be-sonderem Maße Stundenprognosen für Elektroenergiepreise in Kalifornien, New York, New
1 NYISO und CAISO sind die unabhängigen Systemdienste der US Bundesstaaten New York bzw. Kalifornien.
PJM ist eine regionale Stromverbund Organisation von 13 US Bundesstaaten. Die New England ISO umfasst 6 US Bundesstaaten im Nordosten der USA. OMEL ist eine spanische Stromhandelsorganisation.
2 Kapitel 1
England und Spanien, aber auch einige Tagesprognosen für wichtige Finanzmarktdaten. Da-rüber hinaus wurden Monatsdaten für den Elektroenergieverbrauch in Kalifornien untersucht. Dabei sollte festgestellt werden, inwieweit sich GARCH-Modelle auch auf Monatsdaten an-wenden lassen. Analysiert wurden auch ausgewählte Rohstoffpreise, die nachweislich Ein-fluss auf die Energiepreise haben. Abgerundet wurde die Untersuchung mit einigen Zeitreihen aus dem Laborbetrieb im Fachbereich Wirtschaft. Eine Auswahl von Verlaufsmustern der untersuchten Zeitreihen enthält die folgende Tabelle.
Tabelle 1.1 Beispiele für Zeitreihen mit zeitvariabler Varianz
0
100
200
300
400
500
600
700
800
900
1000 2000 3000 4000 5000 6000 7000
GOLD
0
2
4
6
8
10
12
1000 2000 3000 4000 5000 6000 7000 8000
CENTPROKWH
0.0
0.4
0.8
1.2
1.6
2.0
2.4
50 100 150 200 250
E1
0
100
200
300
400
500
600
700
76 78 80 82 84 86 88 90 92 94 96 98 00 02
GAS_1
9.6
10.0
10.4
10.8
11.2
11.6
12.0
12.4
12.8
13.2
90 91 92 93 94 95 96 97 98 99 00 01 02
R11
0
20
40
60
80
100
120
25 50 75 100
POOL
Kapitel 2 3
2. Theoretische Grundlagen 2.1 Einführung von ARCH- und GARCH-Prozessen Sei {Xt} eine geometrische Irrfahrt, d.h. ein identisch unabhängig verteilter Zufallsprozess
,X ttt ε+µ=
wobei
E(Xt) = µt und E(εtXt) = 0. Wird die Irrfahrt durch eine zusätzliche Gleichung für eine zeitvariable Varianz σ2
t ergänzt, dann entsteht ein sogenannter ARCH (autoregressive conditional heteroscedasticity) Modell-prozess. Beispiel 2.1 ARCH(1)-Modell für {εt}
,21t
2t −ε⋅α+ω=σ
wobei ω > 0 , α ≥ 0 und Var ([εtXt) = σ t
2 . Es wird meist εt ∼ N.V. (0, σt
2) voraus gesetzt. Die logarithmierte, bedingte Likelihood-Funktion für normalverteilte Residuen {εt} lautet
( ) ∑∑= −=
− ε⋅α+ωε
−ε⋅α+ω−π⋅−
−=αωn
2t2
1t
2t
n
2t
21t
b
2
1ln
2
12ln
2
1n),(lnL
und ist bis auf die logarithmierten Dichten von εt , die ohnehin nicht bekannt und zudem für große n vernachlässigbar sind, mit der unbedingten Log-Likelihood-Funktion identisch. Eine konsistente ML-Schätzung ist unter den drei Bedingungen
( )
( )
( ) 0lnE3
,1E2
,0E1
2
2
2
2
t
t
t
t
t
t
<
σ
ε⋅α
=
σ
ε
=
σε
möglich. Die dritte Bedingung sichert sogar strenge Stationarität für die standardisierte Residuenfolge εt/σt .
4 Kapitel 2
Die Verallgemeinerung auf ein GARCH (generalised autoregressive conditional heteroscedasticity) Modell besteht darin, dass in die Volatilitätsgleichung zeitverzögerte Va-rianzen einbezogen werden. Auf diese Weise ist oft es möglich, die Anzahl der zu schätzen-den Parameter zu reduzieren Beispiel 2.2 GARCH(1, 1)-Modell für {εt} mit sparsamer Parametrisierung
,21t
21t
2t −− σ⋅β+ε⋅α+ω=σ
wobei ω > 0, α ≥ 0, β ≥ 0 und Var (εtXt) = σ t
2. Die logarithmierte, bedingte Likelihood-Funktion für normalverteilte Residuen {εt} lautet
( ) ∑∑== σ
ε−σ−π⋅
−−=αω
n
2t2t
2t
n
2t
2t
b
2
1ln
2
12ln
2
1n),(lnL
und ist bis auf die logarithmierten Dichten von εt , die ohnehin nicht bekannt und zudem für große n vernachlässigbar sind, mit der unbedingten Log-Likelihood-Funktion identisch.
Nachteilig wirkt sich bei gewöhnlichen GARCH-Modellen aus, dass eine unterschiedliche Wirkung des Vorzeichens auf die Volatilität nicht berücksichtigt werden kann. Schlechte Nachrichten haben folglich bei Betragsgleichheit dieselbe Auswirkung wie gute Nachrichten. Deshalb sind verschiedene Ansätze entwickelt worden, um gewöhnliche GARCH-Modelle zu verfeinern.
2.2 Erweiterung der gewöhnlichen ARCH- und GACH-Modellprozesse Eine Möglichkeit zur Berücksichtigung des Vorzeichens der Innovationen εt besteht darin, die Quadrate aus der Varianzgleichung heraus zu nehmen. Beispiel 2.3 EGARCH (exponential GARCH) Modell
( ) ( ) ( ) ( ) ,ZZlnln 1t1t2
1t2t −−− γ+⋅θ+σ+ω=σ
wobei
t
ttZ
σε
=
identisch verteilt ist mit dem Erwartungswert 0 und der Varianz 1. Der Parameter θ beschreibt den Vorzeicheneffekt und der Parameter γ den Größeneffekt von Schocks auf die Volatilität (Varianzdynamik). Zum Schätzen wird die MA(∞)-Darstellung in ein ARMA(p, q)-Struktur überführt
( ) ( ) ( ) ,ZgBlnB t2t Θ+ω=σΦ
wobei p die Ordnung des Operatorpolynoms Φ(B) und q die Ordnung des Operatorpolynoms Θ(B) ist.
Kapitel 2 5
Eine weitere Möglichkeit, den Einfluss positiver und negativer Innovation auf die Varianz zu modellieren, besteht darin, eine Indikatorfunktion I(t) einzuführen, die zwei oder mehrere verschiedene Modellvarianten generiert: Beispiel 2.4 TGARCH(1, 1)
,)t(I21t
21t
21t
2t ⋅ε⋅γ+σ⋅β+ε⋅α+ω=σ −−−
wobei I(t) = 1 für εt < 0 und I(t) = 0 sonst. Die Abkürzung TGARCH wird für Schwellwert GARCH-Modelle verwendet. Das T bezieht sich auf Threshold (engl. Schwelle). Eine Verallgemeinerung auf beliebige Potenzen der Standardabweichung führt auf das soge-nannte PGARCH-Modell (Power ARCH). Beispiel 2.5 PGARCH(1, 1)
( ) ,1t1t1ttδ−
δ−−
δ σ⋅β+ε⋅γ−ε⋅α+ω=σ
wobei δ > 0, γ ≤ 1. Für δ = 2 und γ = 0 entsteht das GARCH(1, 1)-Modell. Für δ = 1 ergibt sich ein Modell für die Standardabweichung. Mit γ ≠ 0 lassen sich asymmetrische Effekte erfassen. Ein GARCH-Modell mit zeitvariabler Mittelwertfunktion mt ist das sogenannte CGARCH-(component GARCH) Modell. Es dient zur Modellierung einer langfristigen Volatilitätsdy-namik. Beispiel 2.6 CGARCH(1, 1)
( ) ( )( ) ( ) ,mm
m2
1t2
1t1tt
21t
21tt
2t
−−−
−−
σ−ε⋅φ+ω−⋅ρ+ω=
ω−σ⋅β+ω−ε⋅α+ω=−σ
wobei 0,99 ≤ ρ ≤ 1 die Konvergenzgeschwindigkeit von {mt} gegen ω bestimmt. Oft werden GARCH-Modelle verwendet, um die Residuen eines Regressionsmodells mit sto-chastischen Regressoren zu untersuchen, die jeweils zeitverzögert in den Ansatz eingehen. Beispiel 2.7 Autoregression mit einer zusätzlichen, zeitverzögert wirkenden Einflussgröße und mit GARCH(1, 1)-Residuen
.
YcXddX2
1t2
1t2t
t1t11t10t
−−
−−
σ⋅β+ε⋅α+ω=σ
ε+⋅+⋅+=
Eine spezielle Erweiterung der Irrfahrtgleichung ist das GARCH-M (GARCH in Mean)-Modell.
6 Kapitel 2
Beispiel 2.8 GARCH-M(1, 1) mit Standardabweichung
.
XddX2
1t2
1t2t
tt1t10t
−−
−
σ⋅β+ε⋅α+ω=σ
ε+σ⋅λ+⋅+=
Mitunter wird anstelle der Standardabweichung auch die logarithmierte Varianz in die Reg-ressionsgleichung eingesetzt. 2.3 Bestimmung der Lag-Struktur in einem GARCH(p, q)-Modell Verallgemeinert auf beliebige Lags in den quadrierten Residuen bzw. den Varianzen ergibt sich als GARCH(p, q)-Modell
( ) ( ) ,p
1j
2jtj
q
1i
2iti
2t ∑∑
=−
=− σ⋅β+ε⋅α+ω=σ
wobei ω > 0, αi ≥ 0, βj ≥ 0 und Var (εtXt) = σ t
2. Es gilt folgender Satz:
Sei {εt} ein stationärer GARCH(p, q)-Prozess mit endlichen Momenten vierter Ordnung, d.h. E(ε4
t) = c < ∞, dann folgt {ε2t} einem ARMA(m, p) Prozess mit m = max(p, q).
Der Beweis wird für den Spezialfall ARCH(1) ausgeführt.1
Wegen
( ) t2
1t2t
2t
2t
2t
2t
2t 1ZZ η+ε⋅α+ω=−⋅σ+σ=⋅σ=ε −
sind für {ηt} die Eigenschaften des „weißen Rauschens“ zu zeigen:
( ) ( ) ( ) 01ZEEE 2t
2tt =−⋅σ=η
( ) ( ) [ ] ( ) [ ]( ) ( )( ) .const2EE2
2E2E1ZEEVar
41t
221t
2
221t
4t
22t
4tt
=⋅εα+εαω+ω=
⋅
ε⋅α+ω=⋅σ=
−⋅σ=η
−−
−
( ) ( ) ( )( ) ( )( ) ( ) ,01ZE1ZE1Z1ZE,Cov 2st
2st
2t
2t
2st
2st
2t
2tstt =−⋅σ⋅−⋅σ=−⋅σ⋅−⋅σ=ηη +++++
für s > 0. Für GARCH-Modelle wird analog verfahren.
1 Der Beweis für ARCH(p) ist z. B. bei Schlittgen [1996], S. 451 ff. nachzulesen.
Kapitel 2 7
Dieser Satz lässt folgende Strukturidentifikation eines GARCH-Modells zu: • Ein Cut der Autokorrelationen der quadrierten Residuenfolge {ε2
t} legt die Zeitverzöge-rungen der Varianzen fest.
• Ein vergleichsweise mindestens ebenso großer Cut der partiellen Autokorrelationen be-
stimmt die Zeitverzögerungen der Residuenquadrate. Andernfalls legt das Muster der Au-tokorrelationen auch die Lag-Struktur der quadrierten Residuen fest.
2.4 Modellüberprüfung mit dem ARCH-LM-Test (Lagrange Multiplier Test) Um zu prüfen, ob die Residuen eines AR-Modells tatsächlich ARCH-Strukturen enthalten, wird ein so genannter ARCH-LM-Test durchgeführt. Die beiden Hypothesen lauten:
H0: Es liegt keine ARCH-Struktur bis zum Lag q vor. HA: Es liegt eine ARCH-Struktur bis zum Lag q vor.
Es wird dann ein Autoregressionsmodell für die quadrierten Residuen geschätzt
t
q
1i
2iti0
2t a+ε⋅β+β=ε ∑
=−
und die zugehörige Engle-Statistik n⋅R2 (Anzahl der Beobachtungen mal Bestimmtheitsmaß) ausgewertet, die asymptotisch χ2-verteilt ist mit q Freiheitsgraden. Mit Hilfe des LM-Tests kann die Eingrenzung der Lags nach der visuellen Inspektion der Korrelogramme quadrierter Residuen statistisch überprüft werden. Der LM-Test kann auch auf die Residuen der autoregressiven Gleichung einer zweistufigen Schätzung angewendet werden, um zu prüfen, ob die entsprechende Varianzgleichung um einen quadratischen Fehlerterm erweitert werden sollte. Er neigt in der Phase der Spezifikati-on allerdings zur Unterschätzung der Modellordnung, so dass die begleitenden Optimie-rungskriterien das jeweilige Testergebnis durchaus aufheben können. 2.5 Modellüberprüfung mit dem BDS-Test Weit verbreitet ist der von Brock, Dechert und Scheikman 1987 vorgeschlagene BDS-Test (vgl. www.faculty.washington.edu/ezivot/econ584/notes/nonlinear.pdf). Er funktioniert unab-hängig von der Verteilung der Residuen und kann sowohl als Test auf nichtlineare Strukturen als auch als Test auf eine Fehlspezifikation von GARCH-Modellen eingesetzt werden. Der BDS-Test ist in einer jüngeren Simulationsstudie von Caporale u. A. noch einmal auf seine Zuverlässigkeit untersucht. worden. Dabei wurden logarithmierte standardisierte Residuen eines GARCH(1,1)-Prozesses analysiert (vgl. Caporale u. A. [2005]). Der BDS-Test basiert auf dem so genannten Korrelationsintegral Cm,ε für T Beobachtungen, einem Set von m ausgewählten Beobachtungen und einer Fehlerschranke Epsilon
8 Kapitel 2
∑ ∑ ∏+−
=
+−
+=
−
=++εε −
=1mT
1s
1mT
1st
1m
0jjtjs
mm
,m ).X,X(I)1T(T
2C
Das Korrelationsintegral misst die Wahrscheinlichkeit, mit der sich unter m unabhängigen Beobachtungen zwei beliebige Beobachtungen um weniger ε unterscheiden, und nutzt dazu eine Indikatorfunktion Iε
ε<−
=ε.sonst0
yxif1)y,x(I
Die BDS-Statistik
ε
εε
ε−
=,m
m,m
,m s
CCTV ,1
mit dem Standardfehler sm, ε des Zählers ist für unabhängige Beobachtungen approximativ N.V.(0,1) verteilt. Die Nullhypothese (H0: Abwesenheit von nichtlinearer Korrelation.) wird auf dem 5% Signifikanzniveau verworfen, wenn Vm,ε > 1,96 ist. Anders ausgedrückt ist das Modell korrekt spezifiziert, wenn die ausgewiesene Grenzwahrscheinlichkeit zum Verwerfen der Nullhypothese kleiner als 5% ist. Bei der praktischen Durchführung des Tests werden für m meist die Werte von 2 bis 5 für m untersucht und ein Epsilon von 0,7 gewählt. 2.6 Verallgemeinerung der Modellklassen ARCH und GARCH Schlittgen macht auf die Klasse der CHARMA(p, q, r, s)- (conditional heteroscedasticity ARMA) Prozesse von Tsay als einer sehr weit gefassten Verallgemeinerung von ARCH(p)-Prozessen aufmerksam (vgl. Schlittgen [1996], S. 454). Dabei sind zwei Modellgleichungen zu schätzen:
( )( ) ( ) .XBB
)B(XB
ttstr
tqtp
η+Β=εΑ
εΘ=Φ
Die Koeffizienten der ersten Modellgleichung (Beobachtungsgleichung) sind konstant, die der zweiten Modellgleichung (Innovationsgleichung) sind „weißes Rauschen“ mit einem Erwar-tungswert gleich Null und konstanten Kovarianz-Matrizen. Der ARCH(p)-Prozess entspricht einem CHARMA(0, 0, p, 0)-Prozess. Augenfällig ist die Erweiterungsmöglichkeit auf ARMA-Strukturen in der ersten Gleichung und auf zeitverzögerte Einschritt-Prognosen in der Innovationsgleichung. GARCH-Prozesse lassen sich in diesen Ansatz allerdings nicht einbet-ten.
Kapitel 3 9
3. Methodik zur Spezifikation von autoregressiven (integrierten) -Modellen mit
GARCH-Residuen Die Spezifikation von Eingleichungsmodellen für die Klasse multiplikativer ARIMA Prozes-se folgt einer mehrstufigen Auswahlprozedur, die in der Literatur beschrieben ist (vgl. Götze [2000], S. 198). Eine grafische Darstellung ist in Bild 3.1 zu sehen.
Bild 3.1 Modellspezifikation für multiplikative ARIMA-Modelle Für den Fall autoregressiver Modelle mit GARCH-Residuen ist ein zweistufiges Verfahren entwickelt worden. Zuerst werden Einheitswurzel, Differenzen und Time-Lags der Autore-gression bestimmt (vgl. Bild 3.2). Das führt im ersten Schritt auf die sogenannte Beobach-tungsgleichung für Xt. Durch Auswertung der Korrelogramme der quadrierten Residuen in Verbindung mit dem LM-Test wird eine GARCH-Struktur maximaler Dimension identifi-ziert. Daran schließt sich die Spezifikation eines optimal parametrisierten GARCH-Modells an (vgl. Bild 3.3), was zu einer zusätzlichen Varianzgleichung führt. Dabei kann sich die Lag-Struktur der Beobachtungsgleichung noch einmal verändern. Mit Hilfe des entstehenden Zweigleichungsmodells werden dann Vergleichsprognosen erstellt, um die prognostischen Eigenschaften am aktuellen Rand zu evaluieren.
Modelleingrenzung Auswahlkriterien
RMSE%Prognosemodell RMAX%
Vergleichs- Trefferquoten prognose
Portmanteau-Testkorrekt spezifizierte Durbin-Watson-StatistikModelle Modellüberprüfung Kumuliertes Periodogramm
Overfitting
Modelle optimaler Signifikanz-Test der ModellparameterKompliziertheit Modellschätzung Minimierung von AIC bzw. SBC
Auswertung von:Ensemble Autokorrelationenidentifizierter Modellidentifikation partiellen AutokorrelationenModelle Periodogramm
Mean-Range-Diagramm Differenzen
Histogramm und QQ-Plot
Modellklasse ARIMA (p,d,q)(pm,dm,qm)m
10 Kapitel 3
Bild 3.2 Spezifikation eines autoregressiven (integrierten) Modells mit stochastischen Reg-
ressoren Die Arbeitsetappen des zweistufigen Auswahlverfahrens sind nachfolgend dargelegt: • Bestimmung der Saisonstruktur mit Hilfe des Periodogramms und der Autokorre-
lationsfunktionen. • Einheitswurzeltest nach Dickey-Fuller und Phillips-Perron für die Originaldaten. • Wiederholung des Einheitswurzeltest für die saisonbereinigten Daten. • Beseitigung der Einheitswurzeln mittel Differenzenbildung. • Bestimmung der Lag-Struktur für ein autoregressives Modell mit Hilfe der partiellen Au-
tokorrelationen pacf. • Schätzung eines parametersparsamen Modells mit signifikanten Parametern (Beobach-
tungsgleichung). • Auswertung der Autokorrelationen acf und der partiellen Autokorrelationen pacf der
quadrierten Residuenfolge {εt2}.
Kapitel 3 11
• Identifikation eines GARCH-Modells für die zeitvariablen Varianzen nach folgender Re-gel: Ein Cut in der acf bestimmt das maximale Lag der Varianzfolge. Das Maximum der Cuts in acf und pacf begrenzt die Lags der quadrierten Residuen.
• Lagrange-Multiplier-Test zur Abgrenzung gegen höhere Lags in der Varianzgleichung. • Schätzung eines parametersparsamen autoregressiven (integrierten) Modells mit
GARCH-Residuen (Beobachtungsgleichung und Varianzgleichung). • Wechsel der Modellklasse auf EGARCH oder PGARCH bei Konvergenzproblemen mit
der Schätzroutine. • Überprüfung der Autokorrelation der Residuen mit Hilfe der Durbin-Watson-Statistik. • Überprüfung der Schiefe und des Q-Q-Plots der Residuen. • Erneuter LM-Test zur Abgrenzung gegen höhere Lags im Varianzmodell • BDS-Test zur Prüfung auf weitere nichtlineare Strukturen in den Residuen.
Modelleingrenzung Auswahlkriterien
Prognosemodell Varianz- RMSE% und RMAX% Vergleichs- prognose
BDS-Test, LM-Testkorrekt spezifizierte Q-StatistikModelle Modellüberprüfung Durbin-Watson-Statistik
Verteilungsparameter, QQ-Plot
Modelle optimaler Signifikanz-Test der ModellparameterKompliziertheit zweistufige Minimierung von AIC bzw. SBC
Modellschätzung Konvergenzgeschwindigkeit prüfenModellkorrekturen
Ensemble identifizierter Autokorrelationen undModelle Modellidentifikation partielle Autokorrelationen
der quadrierten Residuenaus der Autoregression
Teil 2 GARCH-Spezifikation
Bild 3.3 Erweiterung eines autoregressiven (integrierten) Modells durch ein GARCH-
Modell
12 Kapitel 3
• Vergleich der Einschritt-Punkt- und Intervallprognose mit den Ist-Werten am aktuellen Rand.
• Prognose der Varianz des Einschritt-Prognose-Fehlers. • Vergleich mit den Prognoseergebnissen des autoregressiven (integrierten)
Eingleichungsmodells. Beim Vergleich der Prognosegüte zwischen Eingleichungs- und Zweigleichungsmodell ist zu beachten, dass die Unterschiede zwischen den Fehlern der Punktprognose meistens gering ausfallen und der eigentliche Gewinn in der zusätzlichen Varianzprognose liegt, mit der sich das Risiko für die Punktschätzung quantifizieren lässt. Größere Unterschiede zwischen den Fehlern der Punktprognose können sich vor allem bei saisonalen Reihen ergeben, wenn die Lag-Struktur mit oder ohne multiplikative Modellterme abgebildet oder wenn die Varianz als externe Größe mit in die Beobachtungsgleichung einbezogen wird. 4. Erläuterung der untersuchten Datenbestände In die Untersuchung sind insgesamt 61 Zeitreihen mit 88.464 Beobachtungen eingegangen. Untergliedert nach der Periodisierung wurden modelliert
• 18 Stundenreihen,
• 11 Tagesreihen,
• 1 Wochenreihe,
• 31 Monatsreihen. Unterteilt nach Anwendungsfeldern wurden modelliert:
• 17 Energiepreisreihen aus den USA und Spanien,
• 5 Finanzmarktreihen weltweit,
• 15 Elektroenergieumsatz- und -absatzreihen aus den USA,
• 7 Reihen zu Ölpreisen in den USA und weltweit,
• 6 Reihen zum Erdgaspreisen in den USA,
• 1 Reihe zum Absatz von Margarine eines Lebensmittelherstellers,
• 10 Reihen zum Zugang in PC-Labore der FH Stralsund. Die Beschreibung der Zeitreihen ist in den folgenden Tabellen 4.1 bis 4.7 zu finden.
Kapitel 4 13
Tabelle 4.1 Durchschnittpreise für Elektroenergie pro Stunde in den USA und Spanien
Bezeich-ner
Abgrenzung Werte von bis Werte- anzahl
Quelle
USP10 Preis der ISO in Cent pro KWh1 10/2002-7/2003 7296 UCEI
USP20 Preis für Absenken der Last für den Folgetag in Cent pro KWh
10/2002-7/2003 7296 UCEI
USP3 Preis für Hochfahren der Last für den Folgetag in Cent pro KWh
10/2002-7/2003 7296 UCEI
USP4 Preis für Absenken der Last für die Folgestunde in Cent pro KWh
10/2002-7/2003 7296 UCEI
USP5 Preis für Hochfahren der Last für die Folgestunde in Cent pro KWh
10/2002-7/2003 7296 UCEI
USP6 Ersatzmenge für die Folgestunde in KWh
10/2002-7/2003 7296 UCEI
EASTNY Preis für Elektroenergie in $/MWh2 für New York East 3
5.11.04 00.00-29.12.04 23.00
1320 NYISO
EAST101 Preis für Elektroenergie in $/MWh aus der ständig im 10-Minuten-Takt verfügbaren Kapazitätsreser-ve
5.11.04 00.00-29.12.04 23.00
1320 NYISO
EAST102 Preis für Elektroenergie in $/MWh aus der fallweise im 10-Minuten-Takt verfügbaren Kapazitätsreser-ve
5.11.04 00.00-29.12.04 23.00
1320 NYISO
EAST30 Preis für Elektroenergie in $/MWh aus der operativen Reserve für 30 Minuten
5.11.04 00.00-29.12.04 23.00
1320 NYISO
NEHP RCP-Preis in $/MWh 1.11.04-17.1.05 1872 NE-ISO
NEHD DACD-Nachfrage in MWh 1.11.04-17.1.05 1872 NE-ISO
ESP Preis in Cent pro KWh 10/2002-9/2003 8760 Omel
1 KWh 103 Wattstunden 2 MWh 106 Wattstunden 3 Es gibt zwei Regulierungsgebiete für den Staat New York: EAST und WEST. Die Preise weisen aber im
Untersuchungszeitraum keinen Unterschied auf.
14 Kapitel 4
Tabelle 4.2 Ausgewählte Finanzmarkt- und sonstige Daten
Bezeich-ner
Abgrenzung Werte von bis Werte- anzahl
Quelle
DY97T Dollar-Yen-Kurs Tagesabschluss 2.1.97-30.12.97 249 Markt-Daten
GDH Goldpreis in Dollar Tagesab-schluss
2.1.73-20.10.04 7962 Markt-Daten
DJT Dow Jones Tagesabschluss 2.1.90-20.10.04 3725 Markt-Daten
DAXT DAX Tagesabschluss 2.1.90-20.10.04 3723 Markt-Daten
OPT Rohölpreis Tagesabschluss 22.1.97-30.9.02 1423 Turtletrader
IBMT IBM-Aktie Tagesabschluss 17.5.61 ff. 369 Jenkins/Watts
MARW Absatz Margarine und Backfett in Tonnen wöchentlich
1/81-12/83
147 Eigene Erhe-bung, festtags-bereinigt
Tabelle 4.3 Labornutzung im Fachbereich Wirtschaft der FH Stralsund
Bezeich-ner
Abgrenzung Werte von bis Werte- anzahl
Quelle
PoolT Pool- Eintritte pro Tag Sep.-Dez. 2001 122 FHS
Lab1T Labor 1- Eintritte pro Tag Sep.-Dez. 2001 122 FHS
Lab2T Labor 2- Eintritte pro Tag Sep.-Dez. 2001 122 FHS
Lab3T Labor 3- Eintritte pro Tag Sep.-Dez. 2001 122 FHS
EH21T Eingangseintritte pro Tag Haus 21 Sep.-Dez. 2001 122 FHS
PoolH Pool- Eintritte pro Stunde 9/01-12/01 2928 FHS
Lab1H Labor 1- Eintritte pro Stunde 9/01-12/01 2928 FHS
Lab2H Labor 2- Eintritte pro Stunde 9/01-12/01 2928 FHS
Lab3H Labor 3- Eintritte pro Stunde 9/01-12/01 2928 FHS
EH21H Eingangseintritte pro Stunde Haus 21 9/01-12/01 2928 FHS
Kapitel 4 15
Tabelle 4.4 Monatliches Energiegeschäft im US-Bundesstaat Kalifornien
Bezeich-ner
Abgrenzung Werte von bis
Anzahl Werte
Quelle
R1 Umsatz Elektroenergie in TDollar4: Sektor Haushalte
1/90-7/03 163 EIA
R2 Umsatz Elektroenergie in TDollar: Sektor Handel
1/90-7/03 163 EIA
R3 Umsatz Elektroenergie in TDollar: Sektor Industrie
1/90-7/03 163 EIA
R4 Umsatz Elektroenergie in TDollar: Sektor Sonstige Bereiche
1/90-7/03 163 EIA
R5 Umsatz Elektroenergie in TDollar: Gesamt 1/90-7/03 163 EIA
R6 Absatz Elektroenergie in MWh: Sektor Haushalte
1/90-7/03 163 EIA
R7 Absatz Elektroenergie in MWh: Sektor Handel
1/90-7/03 163 EIA
R8 Absatz Elektroenergie in MWh: Sektor In-dustrie
1/90-7/03 163 EIA
R9 Absatz Elektroenergie in MWh: Sektor Sonstige Bereiche
1/90-7/03 163 EIA
R10 Absatz Elektroenergie in MWh: Gesamt 1/90-7/03 163 EIA
R11 Erlöse in Dollar/KWh: Sektor Haushalte 1/90-7/03 163 EIA
R12 Erlöse in Dollar/KWh: Sektor Handel 1/90-7/03 163 EIA
R13 Erlöse in Dollar/KWh: Sektor Industrie 1/90-7/03 163 EIA
R14 Erlöse in Dollar/KWh: Sektor Sonstige Be-reiche
1/90-7/03 163 EIA
R15 Erlöse in Dollar/KWh: Gesamt 1/90-7/03 163 EIA
4 TDollar 103 Dollar
16 Kapitel 4
Tabelle 4.5 Rohölpreise in den USA
Bezeichner Abgrenzung für US-Reihen Werte von bis
Anzahl Werte
Quelle
CODPUUS Erster Einkaufspreis für inländi-sches Rohöl: Cent per Barrel5
1/74-7/04 367 EIA
COFMUUS Einkaufspreis für importiertes Roh-öl (incl. Transportkosten): Cent per Barrel
1/74-7/04 367 EIA
COIMUUS Einkaufspreis für Importiertes Roh-öl (incl. Sämtliche Bezugskosten6): Cent per Barrel
1/74-7/04 367 EIA
RADMUUS Aufkaufpreis von Raffinerien für inländisches Rohöl: Cent per Barrel
1/74-7/04 367 EIA
RAIMUUS Aufkaufpreis von Raffinerien für importiertes Rohöl: Cent per Barrel
1/74-7/04 367 EIA
RACPUUS Aufkaufpreis von Raffinerien für Rohöl insgesamt: Cent per Barrel
1/74-7/04 367 EIA
Tabelle 4.6 Erdgaspreise in den USA
Bezeichner Abgrenzung für US-Reihen Werte von bis
Anzahl Werte
Quelle
NGWPUUS Erdgaspreis ab Förderstelle: Cent per 1000 cubic feet7
1/76-7/04 343 EIA
NGCGUUS Erdgaspreis ab Zuleitung: Cent per 1000 cubic feet
1/84-7/04 247 EIA
NGRCUUS Erdgaspreis für Abnehmer aus dem Sektor Haushalte: Cent per 1000 cubic feet
1/81-7/04 283 EIA
NGCCUUS Erdgaspreis für Abnehmer aus dem Sektor Handel: Cent per 1000 cubic feet
1/84-7/04 247 EIA
NGINUUS Erdgaspreis für Abnehmer aus dem Sektor Industrie: Cent per 1000 cubic feet
1/84-7/04 247 EIA
NGEIUUS Erdgaspreis für Abnehmer aus dem Sektor Energieerzeugung: Cent per 1000 cubic feet
1/79-6/04 306 EIA
5 1 Barrel entspricht 0,1589873 m3 6 Produktpreis, Transportkosten, Zoll, Steuern, Abgaben 7 1 cubic foot entspricht 0,3048 m3
Kapitel 4 17
Tabelle 4.7 Preise für Elektroenergie in den USA
Bezeichner Abgrenzung für US-Reihen Werte von bis
Anzahl Werte
Quelle
ESRCUUS Durchschnittpreis für Elektroener-gie in 100 Cent per KWh: Sektor Haushalte
1/01-7/04 43 EIA
ESCMUUS Durchschnittpreis für Elektroener-gie in 100 Cent per KWh: Sektor Handel
1/01-7/04 43 EIA
ESICUUS Durchschnittpreis für Elektroener-gie in 100 Cent per KWh: Sektor Industrie
1/01-7/04 43 EIA
ESTCUUS Durchschnittpreis für Elektroener-gie in 100 Cent per KWh: Gesamt
1/01-7/04 43 EIA
18 Kapitel 5
5. Demonstrationsbeispiel GARCH Als Demonstrationsbeispiel wird die Zeitreihe „Stündlicher Preis für Elektroenergie in Cent pro kWh für Spanien“ (vgl. Tabelle 4.1) modelliert. Die Beobachtungen reichen vom 1.10.2002 bis zum 30.9.2003 und umfassen 8760 Werte. Bild 5.1 gibt einen optischen Ein-druck der Preisdynamik. Da sich die Beobachtungen offensichtlich nicht in ein Intervall mit konstanter Breite einpassen lassen, ist von einer zeitvariablen Varianz auszugehen.
0
2
4
6
8
10
12
1000 2000 3000 4000 5000 6000 7000 8000
Bild 5.1 Zeitreihe ESP (Preis Cent pro kWh für Spanien) Die Frequenzanalyse deutet im Periodogramm (vgl. Bild 5.2) und noch deutlicher im geglätte-ten Periodogramm (Bild 5.3) mit Peaks (engl. Spitze) bei 0,00594 = 1/168 und 0,04167 = 1/24 auf zwei sich überlagernde Zyklen hin. Es handelt sich dabei um den 24-Stunden-Rhythmus und den Wochentagsrhythmus von 168 Stunden. Die Harmonischen der ersten Peaks sind als weitere Spitzen bei den höheren Frequenzen zu erkennen. Sie können aber vernachlässigt werden. Der Monatszyklus bei der Frequenz 0,0015 = 1/672 spielt nur eine untergeordnete Rolle und wird bei der Modellierung nicht berücksichtigt. Die beiden Einheitswurzeltests nach Dickey-Fuller (vgl. Tabelle 5.1) und Phillips-Perron (vgl. Tabelle 5.2) lehnen die Nullhypothese ab. Demzufolge müssen keine einfachen Differenzen vorgeschaltet werden. Die Sichtprüfung der Reihe lässt zudem keinen Trend erkennen. Zur Modellierung der Saisonalität wird auf Saisondifferenzen verzichtet. Denn diese enthalten implizit einfache Differenzen. Hinzu kommt, dass Differenzen über sehr viele Beobachtun-gen, wie hier über 24 oder 168 Perioden, die Prognosegüte erfahrungsgemäß ganz erheblich schmälern können. In dem Zusammenhang ist auch zu beachten, dass EViews 5 eine Integra-tion von differenzierten Reihen mit zwei unterschiedlichen saisonalen Differenzen nicht un-terstützt.
Kapitel 5 19
Bild 5.2 Frequenzzerlegung der Varianz mit Peaks bei 0,00594 = 1/168 und 0,04167 = 1/24
Bild 5.3 Frequenzzerlegung der Varianz (geglättet)
20 Kapitel 5
Tabelle 5.1 Einheitswurzeltest nach Dickey-Fuller
Null Hypothesis: CENTPROKWH has a unit root Exogenous: Constant
Lag Length: 24 (Automatic based on SIC
MAXLAG=24)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -7.500.892 0.0000 Test critical values: 1% level -3.430.937
5% level -2.861.684 10% level -2.566.888
*MacKinnon (1996) one-sided p-values.
H0 : Die Zeitreihe hat eine Einheitswurzel (erste Differenz). HA : Die Zeitreihe hat keine Einheitswurzel.
Testverteilung: Augmented Dickey-Fuller (ADF)- Statistik Prüfgröße: Parameter d1 im ARI(1)-Modell ohne Absolutglied. Entscheidungsregel für eine Irrtumswahrscheinlichkeit α:
- H0 wird verworfen, falls der kritische Wert größer als die Teststatistik tα ist. - H0 wird nicht verworfen, falls der kritische Wert kleiner als die Teststatistik tα ist.
Im Beispiel gilt für α = 0,05:
-7,5 < -2,861 ⇒ H0 wird verworfen.
Tabelle 5.2 Einheitswurzeltest nach Phillips-Perron1
Null Hypothesis: CENTPROKWH has a unit root Exogenous: Constant
Bandwidth: 128 (Newey-West using Bartlett kernel)
Adj. t-Stat Prob.*
Phillips-Perron test statistic -22.092.020 0.0000 Test critical values: 1% level -3.430.935
5% level -2.861.683
10% level -2.566.888
*MacKinnon (1996) one-sided p-values.
1 Es handelt sich hierbei um einen nichtparametrischen Test auf serielle Korrelation, bei dem eine Kerndichte-
oder Spektraldichteschätzung verwendet wird (vgl. EViews 5 S. 508 ff.) Der Hypothesenaufbau und die Ent-scheidungsregel entsprechen dem ADF-Test.
Kapitel 5 21
Deshalb werden die Zyklen mit Hilfe der partiellen Autokorrelationen an den jeweils signifi-kanten Lags gesetzt. Der Vorteil gegenüber einem multiplikativen ARIMA-Modell (vgl. Contreras u. A. [2002]) besteht darin, dass die Modellgleichung wesentlich weniger Terme umfasst. Das erleichtert die Handhabung und die Interpretation eines Modells ganz erheblich.
Tabelle 5.3 Schätzung des autoregressiven Modells
Dependent Variable: Method: Least Squares
CENTPROKWH
Date: 10/14/04 Time: 13:05
Sample (adjusted): 194 8592
Included observations: 8399 after adjustments
Model Equation
Variable Coefficient Std. Error t-Statistic Prob.
C 0.048395 0.012190 3.970.087 0.0001 CENTPROKWH(-1) 0.871781 0.005421 1.608.057 0.0000 CENTPROKWH(-24) 0.314691 0.010523 2.990.547 0.0000
CENTPROKWH(-25) -0.260802 0.010665 -2.445.342 0.0000
CENTPROKWH(-168) 0.376141 0.010250 3.669.839 0.0000
CENTPROKWH(-169) -0.299481 0.010579 -2.830.909 0.0000
CENTPROKWH(-192) 0.111535 0.010901 1.023.189 0.0000
CENTPROKWH(-193) -0.127470 0.010844 -1.175.447 0.0000
R-squared 0.930874 Mean dependent var 3.552.557 Adjusted R-squared 0.930816 S.D. dependent var 1.364.982
S.E. of regression 0.359029 Akaike info criterion 0.790125
Sum squared resid 1.081.615 Schwarz criterion 0.796826
Log likelihood -3.310.128 F-statistic 16142.24
Durbin-Watson stat 2.077.976 Prob(F-statistic) 0.000000
Die Modellgleichung nimmt explizit folgende Gestalt an:
.X127,0X112,0X299,0
X376,0X261,0X315,0X872,0048,0X
t193t192t169t
168t25t24t1tt
ε+⋅−⋅+⋅−
⋅+⋅−⋅+⋅+=
−−−
−−−− LL
Die Wahrscheinlichkeiten der kritischen Werte des t-Tests sind bei allen Parametern kleiner als 5%. Folglich sind alle Parameter statistisch gesichert. Die Minimierungskriterien AIC und SBC liegen mit 0,79 und 0,80 fast gleichauf. Die Durbin-Watson-Statistik wird mit 2,078 ausgewiesen. Demzufolge ist in den Residuen des Modells keine Autokorrelation erster Ord-nung nachweisbar. Das Bestimmtheitsmaß beträgt 93%. Folglich kann das gewählte Modell 93% der Varianz der untersuchten Zeitreihe erklären. Um die maximalen Lags für das GARCH-Modell zu bestimmen, werden die Korrelogramme der quadrierten Residuen εt
2 des autoregressiven Modells (vgl. Tabelle 5.4) ausgewertet.
22 Kapitel 5
Tabelle 5.4 Korrelogramme der quadrierten Residuen des autoregressiven Modells
Date: 11/10/04 Time: 13:24
Sample: 194 8592
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
|** | |** | 1 0.208 0.208 363.90 0.000 |* | | | 2 0.094 0.053 437.77 0.000
| | | | 3 0.038 0.009 449.90 0.000
| | | | 4 0.012 -0.002 451.20 0.000
| | | | 5 0.004 -0.001 451.36 0.000
| | | | 6 0.032 0.031 459.71 0.000 | | | | 7 0.054 0.044 484.49 0.000
| | | | 8 0.064 0.043 518.63 0.000
| | | | 9 0.043 0.016 534.18 0.000
|* | | | 10 0.076 0.059 582.66 0.000
| | | | 11 0.054 0.024 607.00 0.000
| | | | 12 0.030 0.005 614.43 0.000
| | | | 13 0.031 0.016 622.57 0.000
| | | | 14 0.036 0.021 633.71 0.000
| | | | 15 0.024 0.005 638.40 0.000
| | | | 16 0.041 0.026 652.68 0.000
| | | | 17 0.045 0.023 669.86 0.000
| | | | 18 -0.000 -0.028 669.86 0.000 | | | | 19 -0.016 -0.025 672.11 0.000
| | | | 20 -0.012 -0.013 673.38 0.000
| | | | 21 0.008 0.008 673.87 0.000
| | | | 22 0.045 0.039 690.58 0.000
|* | |* | 23 0.095 0.074 766.31 0.000
|** | |* | 24 0.225 0.191 1192.3 0.000
Nach der im Kapitel 2 formulierten heuristischen Entscheidungsregel für ein GARCH(p, q)- Modell deuten die beiden Spitzen beim Lag 1 in beiden Korrelogrammen auf ein GARCH(1, 1)- Modell hin. Der LM-Test plädiert für eine Erweiterung der Lag-Struktur hinsichtlich der quadrierten Re-siduen im Varianzmodell (vgl. Tabelle 5.5). Ausgehend von einem GARCH(2, 2)-Ansatz wird schrittweise auf GARCH(1, 1) abgerüstet mit Hilfe der Kriterien von Akaike und Schwarz
,T
Tlnk
T
L2SBC
T
k2
T
L2AIC
⋅+
⋅−=
⋅+
⋅−=
wobei L die Log-Likelihood Funktion ist
⋅
ε+π+⋅−= ∑
=
T
1t
2tT
1ln2ln1
2
TL
Kapitel 5 23
Tabelle 5.5 LM-Test für die Residuen des AR-Modells
ARCH Test
F-statistic 1.357.272 Probability 0.000000 Obs*R-squared 3.885.243 Probability 0.000000
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/20/06 Time: 18:57 Sample (adjusted): 197 8592 Included observations: 8396 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.095845 0.004630 2.070.097 0.0000
RESID^2(-1) 0.197087 0.010916 1.805.547 0.0000
RESID^2(-2) 0.051073 0.011112 4.596.364 0.0000 RESID^2(-3) 0.009217 0.010916 0.844363 0.3985
R-squared 0.046275 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
0.129061
Adjusted R-squared 0.045934 0.388940
S.E. of regression 0.379902 0.902668
Sum squared resid 1.211.178 0.906020
Log likelihood -3.785.401 1.357.272 Durbin-Watson stat 1.999.976 0.000000
Die optimale Parameteranzahl wird durch Minimieren des AIC- bzw. des SBC-Wertes ermit-telt. Beide Optimierungskriterien, sowohl das nach Akaike als auch das nach Schwarz, emp-fehlen ein GARCH(2, 2)-Modell.
Tabelle 5.6 Auswahl eines Modells optimaler Kompliziertheit
Statistik/Modell GARCH(1,1) GARCH(1,2) GARCH(2,2)
AIC 0,6516 0,5854 0,5808 SBC 0,6600 0,5947 0,5908 DW 2,0486 2,0656 2,0659
Die Durbin-Watson-Statistik wächst mit der Parameteranzahl, ohne dass der Test auf Auto-korrelation erster Ordnung anschlägt.
24 Kapitel 5
Tabelle 5.7 Schätzung des Zweigleichungsmodells
Dependent Variable: CENTPROKWH
Method: ML - ARCH
Date: 10/14/04 Time: 12:27
Sample (adjusted): 194 8592
Included observations: 8399 after adjustments
Convergence achieved after 16 iterations Variance backcast: ON
GARCH = C(8) + C(9)*RESID(-1)^2 + C(10)*RESID(-2)^2 + C(11) *GARCH(-1) + C(12)*GARCH(-2)
Model Equation
Variable Coefficient Std. Error z-Statistic Prob.
CENTPROKWH(-1) 0.871072 0.004060 2.145.688 0.0000 CENTPROKWH(-24) 0.371137 0.006952 5.338.725 0.0000 CENTPROKWH(-25) -0.308725 0.007458 -4.139.589 0.0000 CENTPROKWH(-168) 0.341728 0.005954 5.739.657 0.0000 CENTPROKWH(-169) -0.260033 0.007006 -3.711.592 0.0000 CENTPROKWH(-192) 0.102246 0.007099 1.440.381 0.0000 CENTPROKWH(-193) -0.118492 0.007355 -1.610.968 0.0000
Variance Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 7.87E-05 1.19E-05 6.606.104 0.0000
RESID(-1)^2 0.324110 0.013640 2.376.254 0.0000
RESID(-2)^2 -0.312190 0.013396 -2.330.460 0.0000
GARCH(-1) 1.132187 0.017547 6.452.184 0.0000 GARCH(-2) -0.143745 0.017245 -8.335.479 0.0000
R-squared 0.930476 Mean dependent var 3.552.557 Adjusted R-squared 0.930385 S.D. dependent var 1.364.982 S.E. of regression 0.360147 Akaike info criterion 0.580787 Sum squared resid 1.087.842 Schwarz criterion 0.590839 Log likelihood -2.427.013 Durbin-Watson stat 2.065.888
Die Beobachtungsgleichung mit den GARCH-Residuen εt lautet
.X118,0X102,0
X260,0X342,0X309,0X371,0X871,0X
t193t192t
169t168t25t24t1tt
ε+⋅−⋅+⋅−⋅+⋅−⋅+⋅=
−−
−−−−−
Die Varianzgleichung nimmt explizit folgende Gestalt an:
.312,0324,0144,0132,1 22t
21t
22t
21t
2t −−−− ε⋅−ε⋅+σ⋅−σ⋅=σ
Die Wahrscheinlichkeiten der kritischen Werte des t-Tests sind bei allen Parametern kleiner als 5%. Folglich sind alle Parameter statistisch gesichert. Im Unterschied zum autoregressiven Modell ist das Absolutglied in der Beobachtungsgleichung nicht signifikant. Die Schätzwerte für die Parameter weichen geringfügig voneinander ab. Die Minimierungskriterien AIC und SBC liegen mit 0,58 und 0,59 ebenfalls fast gleichauf. Ihre Werte sinken unter die entspre-
Kapitel 5 25
chenden Größen des autoregressiven Modells. Die Durbin-Watson-Statistik wird mit 2,066 auch etwas niedriger ausgewiesen. Auch in diesem Fall ist in den Modellresiduen keine Auto-korrelation erster Ordnung nachweisbar. Das Bestimmtheitsmaß bleibt nahezu unverändert bei 93%, so dass sich mit dem Zweigleichungsmodell ebenfalls 93% der Varianz der unter-suchten Zeitreihe erklären lassen. Anschließend werden die GARCH-Residuen des spezifizierten Zweigleichungsmodells auf Autokorrelation höherer Ordnung untersucht (vgl. Tabelle 5.8 und 5.9 sowie Bild 5.4). Mit Hilfe der Q-Statistik von Box und Ljung (vgl. Götze [2000], S. 150) wird ein entsprechen-der Test aufgebaut. Die entscheidende Inputgröße ist die empirische Autokorrelation rk der Residuen εt
2 des autoregressiven Modells:
( ) ( )
( ).r
T
1t
2t
T
1ktktt
k
∑
∑
=
+=−
ε−ε
ε−ε⋅ε−ε
=
Die Zahl der eingehenden Werte T ist gegenüber der Anzahl der Beobachtungen n um das maximale Lag der Autoregression reduziert. Der zugehörige Test ist folgendermaßen aufge-baut:
H0 : Es liegt keine Autokorrelation bis zum Lag k vor. HA : Es gibt Autokorrelation bis zum Lag k.
Testfunktion: ∑= −
⋅+⋅=k
1j
2j
*jT
r)1T(TQ
Testverteilung unter H0: χ2-Verteilung mit k - p Freiheitsgraden (asymptotisch), wobei
p die Anzahl der Parameter des Modells ohne das Absolutglied ist.
Die Entscheidungsregel lautet:
Ist für eine gegebene Irrtumswahrscheinlichkeit α der Wert von Q* kleiner als der zuge-hörige Vergleichswert, dann kann die Nullhypothese nicht verworfen werden. Es liegt keine Autokorrelation der quadrierten Residuen vor. Ist der Wert von Q* größer oder gleich dem Vergleichswert, dann wird die Nullhypothese verworfen.
Im Beispiel liegt der Prüfwert für k = 24 mit 218,46 deutlich über dem Wert 22,263 des 5%-Quantils der χ2-Verteilung für 24 – 11 Freiheitsgrade, so dass die Nullhypothese verworfen wird. Die Ursache hierfür ist in der sehr großen Stichprobe des Beispiels zu sehen, deren Um-fang T quadratisch in die Testgröße eingeht. Da es nur eine Autokorrelation gibt, die beim Lag 24 am Rand der 2σ-Grenzen liegt, lässt den Testausgang in einem anderen Licht erscheinen.
2 Die Residuen {εt} sind wegen ihrer zeitvariablen Varianz kein „Weißes Rauschen“ {at}.
26 Kapitel 5
Tabelle 5.8 Korrelogramm der Residuen des GARCH-Modells
Date: 06/29/06 Time: 18:14
Sample: 194 8592
Included observations: 8399
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
| | | | 1 0.015 0.015 19.425 0.163 | | | | 2 0.014 0.013 34.777 0.176 | | | | 3 0.001 0.000 34.814 0.323 | | | | 4 -0.000 -0.000 34.821 0.481 | | | | 5 0.002 0.002 35.176 0.621 | | | | 6 -0.018 -0.018 62.908 0.391 | | | | 7 0.031 0.032 14.458 0.044 | | | | 8 0.041 0.041 28.662 0.000 | | | | 9 0.051 0.049 50.790 0.000 | | | | 10 0.059 0.057 79.862 0.000 | | | | 11 0.033 0.031 88.946 0.000 | | | | 12 -0.003 -0.006 89.038 0.000 | | | | 13 -0.019 -0.019 92.223 0.000 | | | | 14 -0.004 -0.003 92.345 0.000 | | | | 15 0.011 0.010 93.274 0.000 | | | | 16 -0.032 -0.035 101.82 0.000 | | | | 17 -0.029 -0.035 108.78 0.000 | | | | 18 -0.001 -0.009 108.79 0.000 | | | | 19 0.025 0.017 114.19 0.000 | | | | 20 0.018 0.013 116.82 0.000 | | | | 21 0.028 0.027 123.31 0.000 | | | | 22 0.038 0.038 135.60 0.000 | | | | 23 0.055 0.058 161.31 0.000 *| | *| | 24 -0.082 -0.080 218.46 0.000
Es schließt sich ein Test auf Normalverteilung nach Jarque-Bera (vgl. Bild 5.4) an. Dieser Test ist wie folgt aufgebaut:
H0 : Die Residuen εt sind normalverteilt. HA : Die Residuen εt sind nicht normalverteilt.
Testfunktion:
( )
−+
−4
3gg
6
kT2
221
mit der Schiefe g1 und Wölbung g2, sowie T Residuenwerten und k geschätzten Modellpara-metern. Testverteilung unter H0: χ2-Verteilung mit 2 Freiheitsgraden. Entscheidungsregel: Ist die ausgewiesene Wahrscheinlichkeit kleiner als 5%, dann ist H0 zu verwerfen. Ist hingegen die ausgewiesene Wahrscheinlichkeit größer gleich 5%, dann kann H0 nicht verworfen werden.
Kapitel 5 27
0
400
800
1200
1600
2000
2400
-6 -4 -2 0 2 4 6 8
Series: Standardized ResidualsSample 194 8592Observations 8399
Mean 0.011052Median 0.005264Maximum 8.022713Minimum -6.820220Std. Dev. 1.002624Skewness 0.382261Kurtosis 8.600527
Jarque-Bera 11181.31Probability 0.000000
Bild 5.4 Parameter und Verteilung der Residuen Im Beispiel wird als Prüfwert 11181 ausgewiesen, der größer als das Quantil Chi-Quadrat-Verteilung für 2 Freiheitsgrade ist. Die Grenzwahrscheinlichkeit zum Verwerfen der Nullhy-pothese verschwindet. Dass die Normalverteilungshypothese zu verwerfen ist unterstützen auch P-P-Plot und der Q-Q-Plot der Residuen (vgl. Bild 5.5 und 5.6).
-5 0 5 10
Standardisierter beobachteter Wert
-4
-2
0
2
4
Erw
art
ete
r W
ert
vo
n N
orm
al
Q-Q-Diagramm von Normal von Res Garch (2,2)
Bild 5.5 Q-Q-Plot der GARCH-Residuen Bild 5.6 P-P-Plot der GARCH-Residuen Der folgende BDS-Test (vgl. Tabelle 5.9) weist darauf hin, dass das Modell korrekt spezifi-ziert worden ist und keine weiteren Parameter zur Modellierung nichtlinearer Strukturen in den Residuen in die Varianzgleichung aufgenommen werden sollten. Die entsprechende V-Statistik liegt sowohl bei Paarvergleich als auch beim Tripelvergleich deutlich unter dem 5%-Quantil der Normalverteilung von 1,96.
0,0 0,2 0,4 0,6 0,8 1,0
Beobachtete Kum. Wahrsch.
0,0
0,2
0,4
0,6
0,8
1,0
Erw
art
ete
Ku
m. W
ah
rsch
.
P-P-Diagramm von Normal von Res Garch (2,2)
28 Kapitel 5
Tabelle 5.9 BDS-Test für die Residuen des GARCH-Modells
BDS Test for RESID22 Date: 06/29/06 Time: 15:31 Sample: 1 8592 Included observations: 8592
Dimension BDS Statistic Std. Error z-Statistic Prob.
2 0.027445 0.001189 2.308.665 0.0000
3 0.047636 0.001890 2.520.536 0.0000
4 0.057357 0.002252 2.546.697 0.0000
5 0.058724 0.002350 2.499.227 0.0000 6 0.055283 0.002268 2.437.075 0.0000
Raw epsilon 0.425077
Pairs within epsilon V-statistic 0.703235 Triples within epsilon V-statistic 0.549010
Auch eine abschließende Anwendung des LM-Tests auf die quadrierten Residuen (vgl. Tabel-le 5.10) bringt keine neuen Erkenntnisse. Die Nullhypothese (H0: Korrelation der quadrierten Residuen) wird erst ab einer Irrtumswahrscheinlichkeit von 16,24% abgelehnt. Zulässig wä-ren 5%. Eine zusätzliche Erweiterung der Varianzgleichung kommt somit nicht in Frage. Tabelle 5.10 Ergebnisse des LM-Test für die GARCH-Residuen
ARCH Test:
F-statistic 1.952.218 Probability 0.162385 Obs*R-squared 1.952.229 Probability 0.162347
Test Equation:
Dependent Variable: STD_RESID^2
Method: Least Squares
Date: 06/29/06 Time: 15:25
Sample (adjusted): 195 8592 Included observations: 8398 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 1.020.577 0.032201 3.169.374 0.0000 STD_RESID^2(-1) -0.015247 0.010912 -1.397.218 0.1624
R-squared 0.000232 Mean dependent var 1.005.249
Adjusted R-squared 0.000113 S.D. dependent var 2.774.553
S.E. of regression 2.774.396 Akaike info criterion 4.878.981
Sum squared resid 64626.30 Schwarz criterion 4.880.657
Log likelihood -20484.84 F-statistic 1.952.218 Durbin-Watson stat 2.000.232 Prob(F-statistic) 0.162385
Eine Modellerweiterung hätten alle drei Testverfahren (DW-Statistik, BDS-Test und LM-Test) allerdings auch für sparsamer parametrisierte Modelle vom Typ GARCH(1, 1) und GARCH(1, 2) abgelehnt (vgl. Tabelle 5.11). Deshalb ist es wichtig, den LM-Test vor der Schätzung der Varianzgleichung durchzuführen und beim Abrüsten des Modells die Optimie-
Kapitel 5 29
rungskriterien anzuwenden. Insgesamt enthält das Zweigleichungsmodell (incl. Absolutglied) 12 Parameter, d. h. vier Parameter mehr als die Autoregression. Tabelle 5.11 Testvergleich
Statistik/Modell GARCH(1,1) GARCH(1,2) GARCH(2,2)
LM-Test H0 H0 H0 BDS-Test H0 H0 H0 DW H0 H0 H0
Der mittlere quadratische Prognosefehler wird im EViews 5 leider nur absolut ausgewiesen (vgl. Bild 5.7). Um ihn relativ zum Mittelwert auszudrücken, wird der Mittelwert der Be-obachtungen im Vergleichszeitraum benötigt. Das kann mit Hilfe eines Samples geschehen, dass von der Beobachtung 8593 bis zur Beobachtung 8760 reicht. Der entsprechende Wert beträgt 4,816. Einen Vergleich der Fehlerkriterien zeigt Tabelle 5.12. Tabelle 5.12 Vergleich von Einschritt-Prognosefehlern
Fehler AR-Modell GARCH(1, 1) GARCH(2, 2)
RMSE 0,341 0,341 0,341
RMSE % 7,080 7,090 7,087
MAE 0,249 0,249 0,251
MAPE % 5,215 5,208 5,237
Für einen Vergleichszeitraum von t = T,...., T + h mit den Beobachtungswerten xt und den Schätzwerten tx sind die Fehler aus der Tabelle 5.12 wie folgt definiert:
( )
.x
xx
h
100%MAPE
,xxh
1MAE
100x
h
1RMSE
%RMSE
,xxh
1RMSE
hT
1Tt t
tt
hT
1Tttt
hT
1Ttt
hT
1Tt
2
tt
∑
∑
∑
∑
+
+=
+
+=
+
+=
+
+=
−⋅=
−⋅=
⋅⋅
=
−⋅=
30 Kapitel 5
Die Prognosefehler der Modelle in Tabelle 5.12 unterscheiden sich im Zeilenvergleich nur geringfügig. Gegenüber dem autoregressiven Modell tritt ein leichter Fehleranstieg ein, der beim korrekt spezifizierten GARCH(2, 2)-Ansatz geringfügig höher ausfällt, als bei einem unterparametrisierten GARCH(1, 1)-Ansatz. Das ist angesichts der geringen Änderungen bei der Parameterschätzung des autoregressiven Modells nicht weiter verwunderlich und zeigt, dass die Überlegenheit eines Zweigleichungs-modells, bestehend aus einer Beobachtungsgleichung autoregressiver Struktur und einer Va-rianzgleichung mit einer GARCH-Struktur, nicht an den Fehlern der Punktprognose festge-macht werden kann. Der Vorteil des Zweigleichungsmodells besteht vielmehr darin, dass Zusatzinformationen über die Risikodynamik erhältlich sind (vgl. Bild 5.7). Der Nutzer kann mit ihrer Hilfe die Zuverlässigkeit der Punktprognosen besser einschätzen und unter Einbeziehung von entspre-chendem Fachwissen den ausgewiesenen Erwartungswert innerhalb des Prognoseintervalls verschieben.
1
2
3
4
5
6
7
8
9
8600 8625 8650 8675 8700 8725 8750
CENTPROKWHF_GARC
Forecast: CENTPROKWHF_GARCActual: CENTPROKWH
Forecast sample: 8593 8760Included observations: 168
Root Mean Squared Error 0.341330Mean Absolute Error 0.250563
Mean Abs. Percent Error 5.237366
Theil Inequality Coefficient 0.034571 Bias Proportion 0.010938
Variance Proportion 0.011294 Covariance Proportion 0.977768
.0
.1
.2
.3
.4
.5
.6
.7
8600 8625 8650 8675 8700 8725 8750
Forecast of Variance
Bild 5.7 Einschrittprognose mit dem GARCH-Modell für eine Woche
Kapitel 5 31
Die Vergleichsprognose für das autoregressive Modell enthält Bild 5.8. Eine Überlagerung der Punktprognose aus dem Zweigleichungsmodell mit den Ist-Werten zeigt das Bild 5.9.
1
2
3
4
5
6
7
8
8600 8625 8650 8675 8700 8725 8750
CENTPROKWHF_ARMA
Forecast: CENTPROKWHF_ARMAActual: CENTPROKWHForecast sample: 8593 8760Included observations: 168
Root Mean Squared Error 0.340794Mean Absolute Error 0.249474Mean Abs. Percent Error 5.214904Theil Inequality Coefficient 0.034559 Bias Proportion 0.017614 Variance Proportion 0.019738 Covariance Proportion 0.962648
Bild 5.8 Einschrittprognose mit dem autoregressiven Modell für eine Woche
0
1.000.000
2.000.000
3.000.000
4.000.000
5.000.000
6.000.000
7.000.000
8.000.000
1 25 49 73 97 121 145
Ist Spanien ESP Garch
Bild 5.9 Vergleich der Einschrittprognose (GARCH) mit den Ist-Werten
32 Kapitel 6
6. Interpretation der empirischen Ergebnisse 6.1 Analyse der Stundendaten für Elektroenergie Die stündliche Preisentwicklung für Elektroenergie wies Zyklen über einen Tag (24 Beobach-tungen) und über eine Woche (164 Beobachtungen) auf. Demgegenüber spielten monatliche und kalenderbedingte Schwankungen eine untergeordnete Rolle. Ein Trend war nicht erkenn-bar. Alle Einheitswurzeltests verwarfen die Nullhypothese. Gegenüber den Untersuchungen von Garcia [2003] wurden durch die zusätzliche Signifikanzprüfung insgesamt wesentlich weniger Parameter pro Modell geschätzt. Zwischen den einzelnen Reihen für ein Territorium und zwischen den Territorien waren je-doch wesentliche Unterschiede in der Modellstruktur festzustellen. • Die 6 Reihen von der ISO Kalifornien wiesen ein besonders heterogenes Bild auf. Drei
Modelle enthielten im autoregressiven Modell Terme beim Lag 1, beim Tages-Lag 24 bzw. 25, beim Wochen-Lag 164 bzw. 165 und zusätzlich einem gemischten Tages-Wochen-Lag von 192 bzw. 194. Letzteres weist auf die sogenannten multiplikativen Mo-dellstrukturen von Box und Jenkins hin (siehe Götze [2000], S. 134). Die Varianzglei-chungen waren höchstens von der Ordnung GARCH(2, 2). Drei Modelle enthielten aller-dings gar keine Wochen-Terme. Dafür gab es ein Modell mit autoregressiven Termen bis zum Lag 3 (siehe Tabelle 6.3). Die Bestimmtheitsmaße fielen bei allen Reihen etwas ab, wenn die Varianzgleichung zur Beobachtungsgleichung hinzu gefügt worden sind. Das ist nicht weiter verwunderlich, weil das Minimum der Kleinste-Quadrate-Schätzung für das autoregressive Modell meistens verlassen wird.
• Die 4 Reihen von der ISO aus New York hatten eine nahezu identische Modellstruktur (vgl. Tabelle 6.3). Die autoregressive Beobachtungsgleichung enthielt Terme beim Lag 1, beim Tages-Lag 24 bzw. 35 und beim Wochen-Lag 164 bzw. 165. Die Varianzgleichun-gen waren höchstens von Typ GARCH(1, 1). Insgesamt war eine geringere Parameteraus-stattung der Modelle gegenüber den für Kalifornien zu verzeichnen. Die Bestimmtheits-maße fielen beim Übergang zur zweistufigen Schätzung ebenfalls etwas ab.
• Die zwei Reihen von der ISO aus New England unterschieden sich nur geringfügig in der Modellstruktur (siehe Tabelle 6.3). Es traten Terme zum Lag 1, zum Tages-Lag 24 und zum Wochen-Lag 168 auf. Die Nachfragegleichungen enthielten zusätzlich einen Term zum Lag 2. Ein wesentlicher Unterschied bestand bei der Schätzgüte. Während die Nach-frage mit einem Bestimmtheitsmaß von 98,7% erklärt werden konnte, so gelang das für den Preis nur mit einem Bestimmtheitsmaß von 41,9%. Der Modellierungsversuch mit der Nachfrage als exogener Variabler führte zu keiner Verbesserung der Erklärungsgüte.
• Die Reihe von OMEL aus Spanien enthielt im AR-Teil des Modells Terme zum Lag 1, zum Tages-Lag 24 und zum Wochen-Lag 168. Darüber hinaus waren auch Terme am vermischten Tages-Wochen-Lag 192 bzw. 193 signifikant. Für die Varianzgleichung ergab sich ein Modell des Typs GARCH(1, 1). Der Verlust an Erklärungsgüte beim Übergang zum Zweigleichungsmodell war marginal. Im Gegensatz zu den US-Reihen konnte ein sehr hohes Bestimmtheitsmaß von über 90% erreicht werden (vgl. Tabelle 6.3).
Eine mögliche Ursache für die niedrigen Bestimmheitsmaße der Preismodelle für Kalifornien, New England und New York hängt mit der Datenstruktur zusammen. Die US-Preis-Reihen enthielten zahlreiche singuläre Ausreißer. So fiel z. B. ein häufig wieder kehrender Wert 17,49 Dollar/kWh in den New Yorker Daten auf, der sich jeweils erheblich vom Vorgänger- und Nachfolgerpreis unterschied und nur während der nachfrageschwachen Nachtstunden
Kapitel 6 33
auftrat. Die verfügbaren Unterlagen gaben allerdings keinen Aufschluss darüber, ob es sich bei dem besagten Wert um eine zufallsbedingte Preisschwankung oder einen Festpreis han-delte, welcher in Stunden mit geringfügiger Nachfrage gesetzt wurde. Zahlreiche Fehlstellen und teilweise sogar negative Preise, wie in den Daten aus Kalifornien, wiesen zudem auf mögliche softwaretechnische Probleme hin. Ein Vergleich der verschiedenen Standardabwei-chungen und Variationskoeffizienten für die US-Reihen (CA bezeichnet Kalifornien und NY New York) und die Spanienreihe (ESP) belegte auf die erheblichen Volatilitätsunterschiede zwischen den Daten.
Tabelle 6.1 Vergleich von Streumaßen für Stundenreihen
ESP CA1 CA2 CA3 CA4 CA5 CA6 NY1 NY2 NY3 NY4 s 1,378 24,180 12,159 10,752 13,626 8,108 6,640 22,119 2,774 0,240 0,206 v 0,383 0,681 0,692 0,623 0,763 1,353 0,292 0,679 0,919 0,772 0,698 Angesichts der hervorragenden Ergebnisse bei der Nachfragemodellierung in New England wird ein entsprechendes Zweigleichungsmodell vorgestellt. Die Zeitreihe stündliche Nachfra-ge nach Elektroenergie (EE) in MWh ist in Bild 6.1 zu sehen. Die Ergebnisse der Modell-schätzung enthält Tabelle 6.2. Die Punkt- und Intervallprognosen sind dem Bild 6.2 zu ent-nehmen.
8000
10000
12000
14000
16000
18000
20000
250 500 750 1000 1250 1500
Bild 6.1 EE-Nachfrage in New England vom 1.11.2004 bis zum 10.1.2005 Die Beobachtungsgleichung lautet
.X501,0
X534,0X384,0X407,0X057,0X992,0171,126X
t169t
168t25t24t2t1tt
ε+⋅−⋅+⋅−⋅+⋅−⋅+=
−
−−−−−
Die zugehörige Varianzgleichung hat die Gestalt
.343,046,51094 21t
2t −ε⋅+=σ
34 Kapitel 6
Tabelle 6.2 Modellschätzung für die EE-Nachfrage in New England
Dependent Variable: Nachfrage Included observations: 1535 after adjust- Method: ML - ARCH (Marquardt) - Normal distribution ments
Date: 01/24/05 Time: 11:58 Convergence achieved after 24 iterations
Sample (adjusted): 170 1704 Variance backcast: ON
Model Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 126,170600 47,669960 2,646752 0,0081
NACHFRAGE(-1) 0,992049 0,013035 76,108370 0,0000 NACHFRAGE(-2) -0,056724 0,010263 -5.526957 0,0000
NACHFRAGE(-24) 0,407146 0,010296 39,544490 0,0000
NACHFRAGE(-25) -0,383743 0,011483 -33,419290 0,0000
NACHFRAGE(-168) 0,533572 0,011068 48,207360 0,0000 NACHFRAGE(-169) -0,500680 0,012233 -40,928740 0,0000
Variance Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 51094,46 1743,276 29,30945 0,0000 RESID(-1)^2 0,343215 0,034218 10,03031 ,.0000
R-squared 0,986990 Mean dependent var 14278,820 Adjusted R-squared 0,986921 S.D. dependent var 2328,517 S.E. of regression 266,2923 Akaike info criterion 13,95924 Sum squared resid 1,08E+08 Schwarz criterion 13,99053 Log likelihood -10704,72 Durbin-Watson stat 1,887118
8000
10000
12000
14000
16000
18000
20000
1725 1750 1775 1800 1825 1850
NACHFRAGEFNEU
Forecast: NACHFRAGEFNEUActual: NACHFRAGEForecast sample: 1705 1872Included observations: 168
Root Mean Squared Error 298.0686Mean Absolute Error 204.5688Mean Abs. Percent Error 1.485390
Theil Inequality Coefficient 0.010151 Bias Proportion 0.001624 Variance Proportion 0.000000 Covariance Proportion 0.998376
0
100000
200000
300000
400000
500000
600000
700000
1725 1750 1775 1800 1825 1850
Forecast of Variance
Bild 6.2 Prognose der EE-Nachfrage in New England vom 11.1. bis 17.1.2005
Kapitel 6 35
36 Kapitel 6
Kapitel 6 37
38 Kapitel 6
6.2 Analyse ausgewählter täglicher Finanzmarktdaten Bei der Analyse täglicher Finanzmarktdaten (vgl. Tabelle 6.5) zeigten die Einheitswurzeltests an, dass einfache Differenzen aufzulegen sind. Die Beobachtungsgleichung war zumeist au-toregressiv von erster Ordnung. Nur beim Rohölpreis wurde das Modell um einen Gleitmittel-term erster Ordnung auf ARIMA(1, 1, 1) erweitert. Die Korrelogramme der quadrierten Resi-duen wiesen nicht in jedem Fall einen Cut auf, der zur Identifikation der Modellstruktur des Varianzmodells hätte verwendet werden können. In diesen Fällen wurde der Standardansatz GARCH(1,1) genutzt. Die Bestimmtheitsmaße der spezifizierten Modelle betrugen mindes-tens 95%. Die Schiefe lag bei allen Reihen betragsmäßig unter eins. Bei der DAX-Reihe ließ sich die Schiefe durch Logarithmieren etwas verringern, und zwar von 0,69 auf 0,16. Auf die Model-struktur hatte das aber keinen Einfluss. Auch der RMSE% bliebt unverändert bei 0,85%. Exemplarisch wird ein Zweigleichungsmodell für den Goldpreis in Dollar (Tagesabschluss) vorgestellt. Die Zeitreihendarstellung ist Bild 6.3 zu entnehmen. Die Ergebnisse der Modell-schätzung fasst Tabelle 6.4 zusammen. Die Modellgleichungen werden explizit angegeben. Die Intervall- und Varianzprognosen zeigt Bild 6.4.
0
100
200
300
400
500
600
700
800
900
1000 2000 3000 4000 5000 6000 7000
Bild 6.3 Entwicklung des Goldpreises vom 2.1.97 bis zum 31.8.04 Die spezifizierte Beobachtungsgleichung (vgl. Tabelle 6.3) lautet
.X055,0X055,1X t2t1tt ε+⋅−⋅= −−
Die zugehörige Varianzgleichung hat die Gestalt
.104,0170,0936,0044,0 22t
21t
21t
2t −−− ε⋅−ε⋅+σ⋅+=σ
Kapitel 6 39
Tabelle 6.4 Modellschätzung zur Reihe Goldpreis in Dollar
Dependent Variable: D(GOLD,1,0) Sample (adjusted): 3 7926 Method: ML - ARCH (Marquardt) - Normal distribution
Included observations: 7924 after adjustments Convergence achieved after 24 iterations
Date: 12/31/04 Time: 18:25 Variance backcast: ON
Model Equation
Variable Coefficient Std. Error z-Statistic Prob.
D(GOLD(-1),1,0) -0,055551 0,013457 -4,128031 0
Variance Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 0,044317 0,003523 12,57857 0 RESID(-1)^2 0,169702 0,008612 19,7055 0
RESID(-2)^2 -0,104377 0,008763 -11,91054 0
GARCH(-1) 0,936445 0,001937 483,4864 0
R-squared 0,002873 Mean dependent var 0,043154 Adjusted R-squared 0,00237 S.D. dependent var 5,336048
S.E. of regression 5,329722 Akaike info criterion 5,124481
Sum squared resid 224946,6 Schwarz criterion 5,128883
Log likelihood -20298,19 Durbin-Watson stat 1,99898
390
400
410
420
430
7930 7935 7940 7945 7950 7955 7960
GOLDFNEU
Forecast: GOLDFNEU
Actual: GOLD
Forecast sample: 7927 7962Included observations: 36
Root Mean Squared Error 3.232548Mean Absolute Error 2.697303
Mean Abs. Percent Error 0.657098
Theil Inequality Coefficient 0.003942 Bias Proportion 0.021697
Variance Proportion 0.013993
Covariance Proportion 0.964310
8
9
10
11
12
13
14
15
16
17
7930 7935 7940 7945 7950 7955 7960
Forecast of Variance
Bild 6.4 Prognose des Goldpreises vom 1.9.04 bis zum 20.10.04
40 Kapitel 6
Kapitel 6 41
6.3 Analyse der Labornutzung am Fachbereich Wirtschaft der FH Stralsund Die Analyse der Eintrittshäufigkeit in das Gebäude und in die PC-Labore des FB Wirtschaft der FH Stralsund führte auf einen Zyklus über 24 Beobachtungen für Stundendaten (Tages-zyklus) und auf einen Zyklus über 7 Beobachtungen für Tagesdaten (Wochenzyklus) auf. Die angesetzten Einheitswurzeltests verwarfen die Nullhypothese, so dass keine Differenzen auf-gelegt werden müssten. Die Varianzgleichungen reichten bis zum Modelltyp GARCH(2, 2). Die identifizierten Modellstrukturen wiesen bemerkenswerte Unterschiede sowohl zwischen den Eintrittsbereichen als auch zwischen den Stunden- und den Tagesaufzeichnung auf. • Für die 6 Stundenreihen (vgl. Tabelle 6.7) wurden überwiegend autoregressive Modelle
mit Termen am Lag 1 und am Lag 2, sowie am Tages-Lag 24 identifiziert. Eine Ausnah-me davon bildete das Labor 1, bei dem der Parameter für das Lag 1, nicht aber der für das Lag 2 signifikant geschätzt werden konnte. Modellerweiterungen am Tages-Lag waren beim Übungspool (Term für Lag 25) und bei der Eingangstür (Terme für Lag 25) zu ver-zeichnen. Die Erklärungsgüte lag für alle vier Pools unter 15%. Lediglich das Modell für den Hauseintritt erreichte ein Bestimmtheitsmaß von 53% im Eingleichungsansatz und von 46% im Zweigleichungsansatz. Die GARCH-Strukturen umfassten zwischen einem und vier Parameter. Im Fall von Labor 1 musste auf ein EGARCH-Modell ausgewichen werden, um statistisch signifikante Parameterschätzungen zu erhalten.
• Für die 6 Tagesreihen (vgl. Tabelle 6.8) ergaben sich sparsam parametrisierte Modelle.
Neben dem Wochen-Lag 7, das allerdings in der Reihe für den Eingang zum Gebäude nicht signifikant war, traten Terme zum Lag 1 für Labor 3, den Übungspool und den Ein-gang auf. Bei Labor 2 wurde darüber hinaus der Parameter für Lag 5 und beim Eingang zusätzlich der Parameter für Lag 3 signifikant. Die einstellbare Parameteranzahl in den Varianzmodellen reichten von 1 beim Pool bis zu 4 beim Labor 2. Schätzprobleme beim Standardansatz führten dazu, dass bei Labor 3 auf ein EGARCH(1, 1)-Modell und bei Labor 2 auf ein CGARCH(2, 2)-Modell ausgewichen werden musste. Die Erklärungsgüte lag beim Eingleichungsansatz unter 30% und bei Zweigleichungsansatz unter 20%.
Exemplarisch wird das Stunden-Modell für den Eingang von Haus 21 vorgestellt. Die Zeitrei-he ist im Bild 6.5 dargestellt. Auffällig sind zahlreiche Nullen in der Zeit vom 17.9.91 bis 29.9.91, als durch einen Softwarefehler die Aufzeichnung ausfiel. Die Modellspezifikation beginnt deshalb erst am 29.9.91 um 13 Uhr mit der Beobachtung 686. Die Ergebnisse der Modellschätzung sind in Tabelle 6.6 enthalten. Die Modellgleichungen werden explizit for-muliert. Die Intervall- und Varianzprognosen zeigt Bild 6.6. Der mittlere quadratische Vor-hersagefehler ist höher als der Mittelwert im Vergleichszeitraum. Es wird deshalb auf dem MAPE verwiesen, der mit 32,98% relativ hoch ausfällt. Wird die Lücke im Beobachtungszeitraum belassen, dann ändert sich die Modellstruktur nur geringfügig. In der Beobachtungsgleichung tritt ein zusätzlicher Term bei Lag 26 auf. Das Varianzmodell wächst um zwei Parameter auf GARCH(2, 2). Die Änderungen in den Para-meterschätzwerten fallen vor allem beim Varianzmodell ins Gewicht.
42 Kapitel 6
0
5
10
15
20
25
500 1000 1500 2000 2500
Bild 6.5 Häufigkeit des Eintretens in Haus 21 (FB Wirtschaft) vom 1.9.01 bis zum 31.12.01 Tabelle 6.6 Modellschätzung zum Eintrittsverhalten in Haus 21
Dependent Variable: EINGANG Sample: 686 2760 Method: ML - ARCH (Marquardt) - Normal distribu-tion
Included observations: 2075 Convergence achieved after 52 iterations
Date: 01/05/05 Time: 12:59 Variance backcast: ON
Model Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 0,142416 0,041903 3,398710 0,0007 EINGANG(-1) 0,346533 0,026869 1,289731 0,0000
EINGANG(-2) 0,080147 0,019819 4,043955 0,0001
EINGANG(-24) 0,351586 0,009409 3,736743 0,0000
EINGANG(-25) 0,047983 0,012947 3,705994 0,0002
Variance Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 1,330609 0,052972 2,511910 0 RESID(-1)^2 0,748913 0,041372 1,810173 0
GARCH(-1) 0,329831 0,018428 1,789846 0
R-squared 0,459706 Mean dependent var 2,800964 Adjusted R-squared 0,457876 S.D. dependent var 3,977080
S.E. of regression 2,928286 Akaike info criterion 4,609782
Sum squared resid 17724,24 Schwarz criterion 4,631517
Log likelihood -4,774648 F-statistic 2,512421
Durbin-Watson stat 1,424405 Prob(F-statistic) 0
Kapitel 6 43
Die Beobachtungsgleichung lautet
.X048,0X352,0X0810,0X347,0142,0X t25t24t2t1tt ε+⋅+⋅+⋅+⋅+= −−−−
Die zugehörige Varianzgleichung hat die Gestalt
.749,0330,0331,1 21t
21t
2t −− ε⋅+σ⋅+=σ
-12
-8
-4
0
4
8
12
16
20
2775 2800 2825 2850 2875 2900 2925
EINGANGFKURZGARCH
Forecast: EINGANGFKURZGARCHActual: EINGANG
Forecast sample: 2761 2928Included observations: 168
Root Mean Squared Error 1.580579Mean Absolute Error 1.049404
Mean Abs. Percent Error 32.98215
Theil Inequality Coefficient 0.390543 Bias Proportion 0.005143
Variance Proportion 0.161971 Covariance Proportion 0.832886
0
10
20
30
40
50
60
2775 2800 2825 2850 2875 2900 2925
Forecast of Variance
Bild 6.6 Intervall- und Varianzprognose für das Eintretens in Haus 21 (FB Wirtschaft) vom bis zum 25.12. bis 31.12.01
44 Kapitel 6
Kapitel 6 45
46 Kapitel 6
6.4 Analyse des monatlichen Elektroenergiehandels im US-Bundesstaat Kalifornien Bei den Monatsreihen aus dem US-Bundesstaat Kalifornien wurden Einheitswurzeltests und Korrelogramme zur Identifikation der Differenzenstruktur durchgeführt. Dem ersten Ein-heitswurzeltest, angewendet auf die Ausgangsdaten, folgte ein zweiter Test, angewendet auf die saisonalen Differenzen, sofern in den Korrelogrammen Ausschläge beim Saison-Lag 12 zu verzeichnen waren. In 5 Fällen wurden gemischte einfache und saisonale Differenzen, in 3 Fällen nur saisonale Differenzen und in einem Fall lediglich eine einfache Differenz aufge-legt. In weiteren 5 Fällen wurde auf eine Differenzenbildung verzichtet. Die autoregressive Beobachtungsgleichung enthielt zumeist Terme am Lag 1 und am Saison-Lag 12. Nur bei zwei Reihen (R9 und R11) fehlte jeweils ein saisonaler Term. Bei der Reihe R4 wurde der Saisoneinfluss mit Hilfe eines Terms beim Lag 24 modelliert. Ein solcher Term trat zusätzlich bei drei anderen Reihen auf (R10, R11, R15). Bei 12 von 15 Modellen wurde eine Erklä-rungsgüte von mehr als 75% erreicht. Unter 50% lagen nur die Modelle zur Reihe R8. Die Korrelogramme der quadrierten Residuen wiesen mitunter Cuts bei Lag 2 oder Lag 3 auf. Die Parameterschätzung schloss höhere Lags im Varianzmodell aber meistens aus. Die Struktur GARCH(2, 2) konnte nur einmal signifikant geschätzt werden. Am häufigsten wurde das Mo-dell GARCH(0, 1) für insgesamt 7 Reihen ausgewiesen. Auf Platz 2 folgte das Standardmo-dell GARCH(1, 1) für vier Reihen (vgl. Tabelle 6.11). Neben den Zweigleichungsmodellen wurden auch multiplikative ARIMA-Modelle von Box-Jenkins als spezielle Eingleichungsmodelle angepasst. Letztere spielen bei Anwendern nach wie vor eine große Rolle. Die Parameteranzahl lag fast immer unter der beim entsprechenden Zweigleichungsmodell (vgl. Tabelle 6.9), wohingegen das Bestimmtheitsmaß vergleichsweise meistens etwas höher ausfiel (vgl. Tabelle 6.11). Tabelle 6.9 Parameteranzahl im Zweigleichungsmodell (ZGM) und im Eingleichungsmodell
(EGM)
R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15
pZGM 4 3 3 3 6 3 3 4 3 4 6 5 3 3 5
pEGM 2 3 2 1 2 1 3 3 3 2 2 2 2 2 2
Für eine inhaltliche Analyse musste die Struktur der Daten etwas näher betrachtet werden: • Bei der Analyse der fünf monetären Reihen R1 bis R5 (Elektroenergieumsatz in Tausend
Dollar, sektoral untergliedert nach Haushalten, Handel, Industrie und Sonstigen Berei-chen, sowie Sektoren insgesamt) fielen insbesondere die Modelle für die Sektoren Indust-rie und Sonstige Bereiche mit einer relativ niedrigen Erklärungsgüte und einem geringen RSME% bei der Vergleichsprognose auf. Typisch war die Kombination von einfachen und saisonalen Differenzen in den Modellen für die Sektoren Handel und Industrie, sowie das Gesamtmodell. Dem gegenüber stand die ausschließlich saisonale Differenz im Mo-dell für den Sektor Haushalte. Das spricht für eine progressive Preisentwicklung in den Sektoren Handel bzw. Industrie einerseits und eine lineare Preisentwicklung für den Sek-tor Haushalte.
• Die fünf entsprechenden Mengenreihen R6 bis R10 (Elektroenergieabsatz in MWh,
sektoral untergliedert nach Haushalten, Handel, Industrie und Sonstigen Bereichen, sowie Sektoren insgesamt) wiesen ähnliche Unterschiede bei der Modellierung auf, wobei der Sektor Industrie durch eine Kombination von sehr niedrigem Bestimmtheitsmaß und sehr hohem RMSE% besonders auffiel. Diese niedrige Bestimmtheit ist auf Trendbrüchen zu-
Kapitel 6 47
rück zu führen, die dem Rationalisierungsschub nach der ersten Ölkrise und Strukturver-änderungen in den letzten Jahren geschuldet sind. Bemerkenswert war ferner, dass die Differenzenstruktur aus der Analyse der monetären Reihen lediglich für den Sektor Haus-halte und den Sektor Sonstige Bereiche übernommen wurde. Vor allem einfache Diffe-renzen traten nicht mehr auf. Das spricht für eine höchstens lineare Zunahme des Elektro-energieverbrauchs.
• Bei der Modellierung der fünf Erlösreihen R10 bis R15 (Umsatz pro Mengeneinheit) setz-
ten sind die sektoralen. Unterschiede bei der Modellierung fort. Die Erlöse für den Sektor Sonstige Bereiche ließen sich deutlich schwerer erfassen, als z. B. die Erlöse für den Sek-tor Haushalte oder die Erlöse für alle Sektoren zusammen.
Exemplarisch wird ein Zweigleichungsmodell für den Elektroenergieumsatz in Tausend Dol-lar (TDollar) im Sektor Sonstige Bereiche des US-Bundesstaates Kalifornien vorgestellt. Der Zeitreihenverlauf ist Bild 6.7 zu entnehmen. Die grafische Darstellung der Einschrittprognose zeigt Bild 6.8. Die Ergebnisse der Modellschätzung sind in der Tabelle 6.10 zusammen ge-fasst. Die Modellgleichungen werden explizit angegeben.
0
20000
40000
60000
80000
100000
120000
90 91 92 93 94 95 96 97 98 99 00 01 02
Bild 6.7 Energieumsatz in Kalifornien (Sektor Sonstige Bereiche in TDollar) 1/90-12/02 Die spezifizierte Beobachtungsgleichung lautet
.aX098,0X927,0X t24t1tt +⋅+⋅= −−
Die zugehörige Varianzgleichung hat die Gestalt
.171,2726.130.16 21t
2t −ε⋅+=σ
48 Kapitel 6
Tabelle 6.10 Ergebnisse der Modellschätzung zum Elektroenergieumsatz in Kalifornien
Dependent Variable: R4 Included observations: 132 after adjustments Method: ML - ARCH Convergence achieved after 26 iterations
Date: 11/03/04 Time: 10:58 Variance backcast: ON
Sample (adjusted): 1992M01 2002M12
Model Equation
Variable Coefficient Std. Error z-Statistic Prob.
R4(-1) 0,927449 0,010396 89,21472 0 R4(-24) 0,097646 0,016301 5,990155 0
Variance Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 16130726 2860096 5,639925 0 RESID(-1)^2 2,170993 0,284417 7,633135 0
R-squared 0,758758 Mean dependent var 38620,09 Adjusted R-squared 0,753104 S.D. dependent var 15650,54
S.E. of regression 7776,546 Akaike info criterion 20,58431
Sum squared resid 7,74E+09 Schwarz criterion 20,67167
Log likelihood -1354,565 Durbin-Watson stat 1,891754
0
10000
20000
30000
40000
50000
60000
70000
03M01 03M02 03M03 03M04 03M05 03M06 03M07
R4FTEXT
Forecast: R4FTEXTActual: R4
Forecast sample: 2003M01 2003M07Included observations: 7
Root Mean Squared Error 4606.018
Mean Absolute Error 3810.148
Mean Abs. Percent Error 11.86220Theil Inequality Coefficient 0.065325
Bias Proportion 0.684278
Variance Proportion 0.003286
Covariance Proportion 0.312437
0.00E+00
4.00E+07
8.00E+07
1.20E+08
1.60E+08
2.00E+08
03M01 03M02 03M03 03M04 03M05 03M06 03M07
Forecast of Variance
Bild 6.8 Intervallprognose und Varianzprognose für den Elektroenergieumsatz in Kaliforni-en (Sektor Sonstige Bereiche in TDollar) vom 1.1.2003 bis zum 30.7.2003
Kapitel 6 49
50 Kapitel 6
Kapitel 6 51
52 Kapitel 6
6.5 Analyse monatlicher Preise für Rohöl, Erdgas und Elektroenergie in den USA • Die 5 Preisreihen für Rohöl auf dem US-Markt zeichneten sich jeweils durch eine Ein-
heitswurzel aus. Es waren mithin einfache Differenzen zu bilden. Saisonale Einflüsse wa-ren nicht nachweisbar. Die autoregressiven Modelle hatten stets die Ordnung 2. Die Korrelogramme der entsprechenden quadrierten Residuen wiesen Cuts nach einem Lag (Reihe 1 bis 3 und Reihe 3) und nach Lag 3 (Reihe 4 und Reihe 5) auf. Die GARCH-Modelle hatten zwischen zwei und vier signifikante Parameter. Die Bestimmtheitsmaße lagen stets über 97% (vgl. Tabelle 6.13).
Die Modellierung der Rohölpreise für den Handel mit Inlandöl und importiertem Öl (nur mit Transportkosten und mit vollständigen Bezugskosten) als auch der drei Aufkaufpreise von Raffinerien (für Inlandöl, Importöl, Rohöl gesamt) ergab leichte Unterschiede in der Volatilität zwischen den Preisen für Rohöl aus eigenem Aufkommen und für importiertes Rohöl. Die entsprechenden Inlandmodelle umfassten vergleichsweise mehr Parameter. Für den Inlandölpreis wurde zur Untersuchung der Modellrobustheit ein Probelauf auf verkürztem Datensatz (1/74 bis 12/98) durchgeführt. Die Autoregression der Modellglei-chung ging dabei über das Lag 1 nicht hinaus. Auch das Varianzmodell hatte lediglich die Struktur GARCH(1, 1), obwohl der Cut bei den partiellen Autokorrelationen erst bei Lag 4 lag. Doch die Parameter zu den höheren Lags ließen sich nicht signifikant schätzen. Das Bestimmtheitsmaß betrug für den verkürzten Zeitraum 97,7%. Offensichtlich hatte die Volatilität der Preisentwicklung seit Ende der 90er Jahre zugenommen. Das schlug sich in einer höheren Parametrisierung sowohl der Beobachtungsgleichung als auch der Varianz-gleichung und in einem verminderten Bestimmtheitsmaß nieder.
• Die Preisreihen für Erdgas auf dem US-Markt verfügten bis auf die Reihe 6 ebenfalls über Einheitswurzeln. Bei Reihe 3 war zudem im Korrelogramm ein saisonaler Einfluss erkennbar. Es wurden einfache Differenzen für die Reihen 1, 2, 4 und 5 aufgelegt. Für die saisonalen Differenzen von Reihe 3 wurde die Nullhypothese für eine Einheitswurzel verworfen, so dass keine einfache Differenz zusätzlich aufgelegt werden mussten. Die Lag-Struktur der autoregressiven Modelle fiel sehr unterschiedlich aus. Bei der Reihe 5 war nicht einmal der Parameter zum Lag 1 signifikant. Alle anderen Reihen wiesen Mo-dell-Terme beim Lag 1, teilweise auch beim Lag 2 (Reihe 1, Reihe 3 und Reihe 6) auf. Die saisonale Reihe 3 verfügte darüber hinaus über Terme beim einfachen Monats-Lag 12 und beim doppelten Monats-Lag 24. Die Bestimmtheitsmaße fielen etwas niedriger als bei den Rohölreihen aus, lagen aber stets deutlich über 80% (vgl. Tabelle 6.14).
Für die beiden Erdgaspreise (ab Förderstelle und ab Zuleitung) ergaben sich unterschied-liche Modelle. Der Erdgaspreis bei Lieferung aus der Leitung (City Gate Price) wurde modellseitig niedriger parametrisiert als der Erdgaspreis ab Bohrloch (Wellhead Compo-site Price). Die Erklärungsgüte stieg mit der Parameteranzahl, wobei die Güte der Ver-gleichsprognose gleichzeitig sank. Bei der sektoralen Betrachtung fiel das saisonale Ab-nahmeverhalten der Haushalte auf, was bei den anderen Sektoren nicht erkennbar war. Für den Handel und die Industrie ergab sich zudem eine etwas höher parametrisierte Va-rianzgleichung, was auf ein anderes Volatilitätsmuster schließen ließ. Auffällig war die vergleichsweise schwache Vergleichsprognose für die Preisentwicklung des Erdgasver-kaufs an die Versorger (Energieerzeugung).
• Die vier Preisreihen für Elektroenergie auf dem US-Markt wiesen keine Einheitswurzeln, wohl aber saisonale Einflüsse auf. Die Lag-Struktur der autoregressiven Modelle bestand aus Termen erster Ordnung, teilweise auch zweiter Ordnung, wie bei der Reihe 1 und der
Kapitel 6 53
Reihe 4, und saisonalen Termen beim Monats-Lag 12, teilweise in Verbindung mit dem benachbarten Lag 13, wie bei der Reihe 2 und der Reihe 4, oder sogar beim doppelten Monats-Lag 24, verbunden mit dem benachbarten Lag 25, wie bei Reihe 3. Die Be-stimmtheitsmaße lagen stets über 80% (vgl. Tabelle 6.15).
Der Modellvergleich zwischen den Sektoren Haushalte, Handel und Industrie offenbarte eine recht unterschiedliche Volatilität. Das Modell für den Sektor Haushalte gewann durch Einführung der logarithmierten Varianz in die Beobachtungsgleichung eine deutlich höhe-re Bestimmtheit gegenüber dem Eingleichungsmodell. Die Varianzgleichung für den In-dustriesektor war am niedrigsten parametrisiert. Offenbar schlug die Autokorrelation der Preise über zwei Jahre aus der Beobachtungsgleichung auf die Varianzgleichung durch.
Exemplarisch wird ein Zweigleichungsmodell für den durchschnittlichen Erdgaspreis für Haushalte in Cent pro 1000 cubic foot (vgl. Tabelle 4.6) vorgestellt. Die grafische Darstellung dieser Zeitreihe zeigt das Bild 6.9. Die Ergebnisse der Modellschätzung fasst die Tabelle 6.12 zusammen. Die beiden Modellgleichungen werden explizit angegeben. Die Intervall- und die Varianzprognose sind im Bild 6.10 zu sehen. Weitere Schätz- und Prognoseergebnisse sind der Tabelle 6.12 zu entnehmen.
200
400
600
800
1000
1200
1400
82 84 86 88 90 92 94 96 98 00 02
Bild 6.9 Erdgaspreis für US-Haushalte im Zeitraum 1/82 – 12/02
Die spezifizierte Beobachtungsgleichung lautet
.X371,0X371,0
X554,0X554,0X127,0X319,0X192,1X
t25t24t
13t12t3t2t1tt
ε+⋅−⋅+⋅−⋅+⋅+⋅−⋅=
−−
−−−−−
Die zugehörige Varianzgleichung ist
.189,0823,0949,10 21t
21t
2t −− ε⋅+σ⋅+=σ
54 Kapitel 6
Tabelle 6.12 Ergebnisse der Modellschätzung zum Beispiel Erdgaspreis US-Haushalte
Dependent Variable: D(GAS_3,1,0) Included observations: 251 after adjust- Method: ML - ARCH (Marquardt) - Normal distribution ments
Date: 12/31/04 Time: 19:06 Convergence achieved after 71 iterations
Sample (adjusted): 1983M02 2003M12 Variance backcast: ON
Model Equation
Variable Coefficient Std. Error z-Statistic Prob.
D(GAS_3(-1),1,0) 0,192106 0,051078 3,761037 0,0002 D(GAS_3(-2),1,0) -0,127372 0,044213 -2,880843 0,004
D(GAS_3(-12),1,0) 0,554251 0,053391 10,38104 0
D(GAS_3(-24),1,0) 0,371288 0,056717 6,546322 0
Variance Equation
Variable Coefficient Std. Error z-Statistic Prob.
C 10,94949 5,62947 1,94503 0,0518 RESID(-1)^2 0,188738 0,041483 4,549782 0
GARCH(-1) 0,82345 0,036706 22,43397 0
R-squared 0,709707 Mean dependent var 1,410359 Adjusted R-squared 0,702569 S.D. dependent var 52,83297
S.E. of regression 28,81366 Akaike info criterion 9,105848
Sum squared resid 202575,4 Schwarz criterion 9,204167
Log likelihood -1135,784 Durbin-Watson stat 1,93881
800
900
1000
1100
1200
1300
1400
1500
04M01 04M02 04M03 04M04 04M05 04M06 04M07
GAS_3FTEXT
Forecast: GAS_3FTEXTActual: GAS_3Forecast sample: 2004M01 2004M07
Included observations: 7
Root Mean Squared Error 29.24778
Mean Absolute Error 24.68023Mean Abs. Percent Error 2.173880Theil Inequality Coefficient 0.012981 Bias Proportion 0.014024
Variance Proportion 0.006244 Covariance Proportion 0.979732
850
900
950
1000
1050
1100
1150
1200
1250
04M01 04M02 04M03 04M04 04M05 04M06 04M07
Forecast of Variance
Bild 6.10 Intervall- und Varianzprognose zum Beispiel Erdgaspreise für US-Haushalte von Januar bis Juli 2004
Kapitel 6 55
56 Kapitel 6
Kapitel 6 57
58 Kapitel 6
6.6 Analyse der Absatzreihe Margarine Die Wochenreihe zum Margarineabsatz eines Lebensmittelherstellers reichte über drei Jahre (vgl. Bild 6.11) und zeichnete sich durch eine hohe Volatilität aus. Sie besaß keine Einheits-wurzeln und es gabt auch keinen Hinweise auf saisonale Einflüsse. Kalenderbedingte Fest-tagsspitzen für die Wochen vor Ostern und Weihnachten sind heraus gerechnet worden. Das autoregressive Modell umfasste Terme zum Lag 1 und zum Lag 2. Das Varianzmodell hatte die Struktur GARCH(1, 1). Das Bestimmtheitsmaß betrug allerdings nur 24% (vgl. Tabelle 6.16). Die Prognosegüte für die zweite bis vierte Dezemberwoche fiel mit einem RMSE% von 18,94% ebenfalls bescheiden aus (vgl. Bild 6.12).
2000
2500
3000
3500
4000
4500
5000
25 50 75 100 125
Bild 6.11 Wöchentlicher Margarineabsatz über drei Jahre Die spezifizierte Beobachtungsgleichung lautete
.X196,0X392,0412,1407X t2t1tt ε+⋅+⋅+= −−
Die zugehörige Varianzgleichung hatte die Gestalt
.145,0672,088,26750 21t
21t
2t −− ε⋅+σ⋅+=σ
Kapitel 6 59
Tabelle 6.16 Ergebnisse der Modellschätzung zum Beispiel Margarineabsatz
Dependent Variable: MARGA Included observations: 141 after adjustments Method: ML - ARCH Convergence achieved after 37 iterations
Date: 11/03/04 Time: 09:59 Variance backcast: ON
Sample (adjusted): 3 143
Model Equation
Coefficient Std. Error z-Statistic Prob.
C 1407,412 292,6245 4,80962 0 MARGA(-1) 0,392444 0,095495 4,109583 0
MARGA(-2) 0,19622 0,09395 2,08856 0,0367
Variance Equation
Coefficient Std. Error z-Statistic Prob.
C 26750,88 24559,66 1,08922 0,2761 RESID(-1)^2 0,145209 0,104295 1,392294 0,1638
GARCH(-1) 0,672501 0,212476 3,165061 0,0016
R-squared 0,24133 Mean dependent var 3415,66 Adjusted R-squared 0,213231 S.D. dependent var 444,1354
S.E. of regression 393,948 Akaike info criterion 14,77758
Sum squared resid 20951332 Schwarz criterion 14,90306
Log likelihood -1035,819 F-statistic 8,588606
Durbin-Watson stat 2,069352 Prob(F-statistic) 0
2000
2500
3000
3500
4000
4500
5000
5500
144 145 146 147
MARGAF
Forecast: MARGAFActual: MARGAForecast sample: 144 147
Included observations: 4
Root Mean Squared Error 752.4408Mean Absolute Error 644.0498
Mean Abs. Percent Error 15.79304Theil Inequality Coefficient 0.095713
Bias Proportion 0.101285 Variance Proportion 0.279258
Covariance Proportion 0.619458
120000
160000
200000
240000
280000
320000
360000
144 145 146 147
Forecast of Variance
Bild 6.12 Intervall- und Varianzprognose zum Beispiel Margarineabsatz für die 3 Wochen
60 Kapitel 7
7. Zur Prognosegüte ausgewählter Zweigleichungsmodelle mit GARCH-Struktur Die zum Teil umstrittenen Erkenntnisse aus den umfangreichen empirischen Prognosevergleichen mit konkurrierenden Modellen, wie z. B. in der M3-Studie (siehe Makridakis [2000]), haben in den letzten Jahren sowohl zu methodischer als auch inhaltlicher Weiterentwicklung geführt. Vor allem die Aussage, dass Prognosen mit einfachen Modellen nicht grundsätzlich schlechter als solche mit komplizierten Modellen ausfallen würden, ist auf Kritik gestoßen. In einem Überblicksartikel diskutieren Clements u. A. [2004] das Für und Wider einer nichtlinearen Modellbildung und geben einen verhalten optimistischen Ausblick auf zukünftige Anwendungen vor allem für Preis- und Kursdaten. Sie stützen sich dabei vor allem auf die Erkenntnis, dass viele Prozesse speziell auf den Finanzmärkten als nichtlinear anzusehen sind und dementsprechend auch nichtlinear modelliert werden sollten. Boero u. A. [2004] vergleichen Prognosen für den täglichen Euro-Kurs, die mit (nichtlinearen) Modellen der Schwellwertautoregression (SETAR) und GARCH-Modellen erstellt worden sind, und kommen zu dem Schluss, dass letztere für eine Intervall- und Dichteprognose vorzuziehen sind. Einen empirischen Vergleich von Tageskursen auf internationalen Finanzmärkten stellt Taylor [2004] vor. Er zeigt, dass die Volatilitätsprognose von diversen GARCH-Modellen mit Hilfe zusätzlicher Glättungstechniken noch verbessert werden kann. Eine systematische Ein-führung in Fehlermaße von Punkt-, Intervall- und Dichteprognosen gibt Küster [2004]. Er verweist darauf, dass Prognosewettbewerbe nur unzureichend über die Eignung bestimmter Modellklassen Auskunft geben können und die Anwendungsentscheidung letztlich von einer Vergleichsprognose am aktuellen Rand abhängt. Die Prognosegüte der in Kapitel 6 vorgestellten Zweigleichungsmodelle ist sehr unterschied-lich ausgefallen. Für die Stundenreihe aus Spanien (vgl. Tabelle 7.1) konnten die guten Er-gebnisse von Garcia gemessen am RMSE% bestätigt werden. Seine GARCH Modelle wiesen, bezogen jeweils auf das Jahr 2000, für eine Mai-Woche Fehler zwischen 2,9% und 7,6%, für eine August-Wochen Fehler zwischen 4,81% und 10,1% und für eine November-Woche Feh-ler zwischen 5,47% und 10,2% aus (Garcia u.A. [2003], Tabelle I bis III). Tabelle 7.1 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Spanien1
Reihe/RMSE% Mi Do Fr Sa So Mo Di
ESP 4,65 6,48 6,05 7,34 6,86 10,66 5,01
Für die Stundenreihe aus Kalifornien (siehe Tabelle 7.2) hingegen konnten die Ergebnisse von Garcia für das Jahr 2000 nicht bestätigt werden, der für eine Aprilwoche Fehler von unter 5% offerierte (Garcia u.A. [2003], Tabelle IV). Beachtet werden muss dabei allerdings, dass unterschiedliche Wochen in 2000 und in 2003 ausgewertet wurden und die jeweils verwende-ten Prognosemodelle sich in der Parameteranzahl erheblich unterscheiden. Tabelle 7.2 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Kalifornien2
Reihe/RMSE% Fr Sa So Mo Di Mi Do
USP10 23,93 18,24 21,96 35,13 13,23 20,99 13,88
1 24.9. bis 30.9.2003 2 25.7. bis 31.7.2003
Kapitel 7 61
In den meisten Fällen erwies sich die Prognose für einen Montag als besonders kompliziert. Diese Erfahrung aus der vorliegenden empirischen Untersuchung stimmt mit den Ergebnissen von Garcia überein. Für die New Yorker Preisdaten (vgl. Tabelle 7.3) sind eine Woche vor Weihnachten und die anschließende Festwoche ausgewertet worden. Der tägliche RMSE% war dabei so hoch, dass die spezifizierten Modelle nicht als praktikable angesehen werden konnten. Als besonders problematisch für eine Preisprognose erwiesen sich im Falle von New York die Freitage. Tabelle 7.3 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für New York
Reihe/Tag Mo Di Mi Do Fr Sa So
EASTNY3 31,05 59,32 49,94 46,80 71,39 22,47 43,07
EAST101 44,26 45,78 67,52 69,92 133,35 62,75 175,90
EAST102 48,43 56,21 31,45 15,20 79,41 29,77 69,88
EAST30 27,35 31,42 24,32 21,52 68,75 33,02 32,08
EASTNY4 44,06 41,41 50,89 48,84 55,82 21,92 44,53
EAST101 68,84 122,21 143,88 259,03 183,52 23,23 149,78
EAST102 72,22 72,92 55,07 25,58 86,03 25,13 47,21
EAST30 41,42 64,54 42,59 36,21 74,48 33,02 21,67
Eine Verbesserung der Prognosegüte für New York kann nach Guirguis u. A. dadurch erreicht werden, dass erklärende Variable, wie der Gaspreis, eingebaut und vor allem Ausreißer sys-tematisch beseitigt werden. Allein die Ausreißerbeseitigung lässt eine Fehlersenkung um mehr als 50% zu (vgl. Guirguis u. A. [2004], S. 163). Besonders auffällig im New Yorker Zeitreihenmuster waren wiederholte Preissprünge gegen 7.00 Uhr und gegen 17.00 Uhr, die von den angesetzten autoregressiven Modellen aber nicht erfasst worden sind. An den ent-sprechenden Lags ließen sich jedenfalls keine signifikanten Parameter schätzen.
Zu beachten ist auch, dass der relative mittlere quadratische Fehler bezogen auf den Mittel-wert RMSE% zwar ein statistisch interessantes Fehlermaß ist, aber nicht unbedingt einen ho-hen praktischen Stellenwert besitzt. In den Reports des PJM-Verbundes von 13 Bundesstaaten wird immer wieder auf die Bedarfsspitze von 107,820 MW hingewiesen (vgl. Reynolds [2004], S. 84). Offenbar spielen vor allem die Preisspitzen in den Morgen- und Abendstunden eine besondere Rolle. Die Fehlergüte in den Nachtstunden, aber auch die Schwankungen zwi-schen den Tagesspitzen sind, abgesehen von Temperaturstürzen, eher von geringerem Interes-se. Dabei muss aber auch berücksichtigt werden, dass in einem Stromverbund von Flächen-staaten, wie dem von PJM, die Spitzen einer Zeitverschiebung unterliegen und zeitlich etwas anders liegen, als etwa in New York. Die NYISO gibt z. B. als durchschnittlichen absoluten Fehler für tägliche Nachfrageprognosen im Monat August 2004 den Wert 2,53% an (vgl. Fer-nandez [2004], S. 16). Gemeint ist dabei der durchschnittliche Fehler für die Nachfragespit-
3 vom 14.12. bis zum 20.12.2004 4 vom 21.12. bis zum 27.12.2004
62 Kapitel 7
zen pro Tag. Für die Preisprognosen werden allerdings keine Fehlerangaben gemacht. Es wird aber auf vergleichende Untersuchungen hinsichtlich der Ergebnisse von PJM und des Ver-bundes der New England Staaten (Data and Reports NE-ISO [2005]) hingewiesen. Interessant sind die Fehlerunterschiede zwischen einer Preis- und einer Nachfrageprognose für Elektroenergie. Am Beispiel des New England Verbundes (siehe Tabelle 7.4) wird deut-lich, dass die tägliche Nachfrage im Mittel wesentlich genauer als der tagesdurchschnittliche Preis prognostiziert werden kann. Bei der Preisprognose fällt der Maximalfehler für den Mon-tag auf. Die Nachfrageprognose hingegen scheint eher für das Wochenende schwierig zu sein. Danach folgt im Fehlerranking aber auch schon der Montag. Tabelle 7.4 Prognoseergebnisse für stündliche Nachfrage und Preise an Elektroenergie pro
Tag in den Bundesstaaten von New England
Reihe/Tag Di Mi Do Fr Sa So Mo
NEHP Preis univariat
16,81 15,93 14,57 18,23 17,37 24,27 30,62
NEHP Preis bivariat mit Einflussgröße NEHD
16,67 15,93 14,19 18,16 17,05 23,67 30,34
NEHD Nach-frage univariat
1,92 1,53 1,43 1,69 2,30 1,67 1,30
Die Einbeziehung der Nachfrage als erklärender Variablen Y änderte nur wenig am RMSE%.
Das spezifizierte bivariate Modellsystem
21t
21t
2t
t25t24t25t24t1tt
316,0074,0306,23
Y642,0Y499,0X158,0X355,0X497,0343,9X
−−
−−−−−
ε⋅σ⋅+=σ
ε+⋅−⋅+⋅−⋅+⋅+=
ist demzufolge keine Alternative zum univariaten Ansatz.
Kapitel 8 63
8. Einführung in das Paket EViews 5.0 Das Programmpaket EViews wird von der Firma Quantitative Micro Software aus Irvine USA angeboten und weltweit vertrieben (www.eviews.com). Es ist ein spezielles Tool zur Analyse und Prognose von Zeitreihen mit Hilfe diverser einstellbarer Modelle. Es umfasst im methodischen Bereich sowohl Eingleichungs- als auch Mehrgleichungsmodelle und bietet neben der individuellen Modellspezifikation durch den Nutzer auch methodischen Support für Standardverfahren, wie z. B. für X11-ARIMA. Die Dateneingabe ist aus verschiedenen Umgebungen heraus möglich. Sind z. B. Zeitreihen-daten aus einer EXCEL-Tabelle zu importieren, dann wird zunächst ein interner Workfile angelegt und bezeichnet (vgl. Bild 8.1). Die Periodisierung der Daten lässt sich ab einem Er-fassungszeitraum von einem Tag kalendermäßig einstellen. Für Stundendaten ist die Option Integer Date hilfreich, bei der nur die Werteanzahl abgefragt wird (vgl. Bild 8.2). Beim Im-port aus einer EXCEL-Tabelle (vgl. Bild 8.3) in einen bestehenden Workfile wird nur jeweils eine Spalte übernommen. Die Auswahl erfolgt mit Hilfe der Spaltenkodierung von Excel. Die importierte Reihe ist gesondert zu bezeichnen. Die gewählte Bezeichnung sollte nicht zu lang sein, weil mit ihrer Hilfe die Modellgleichungen formuliert werden.
Bild 8.1 Einrichten eines Workfiles für den Datenimport Für die importierte Reihe stehen zahlreiche deskriptive Auswertungstechniken zu Verfügung (vgl. Bild 8.4). Sie reichen von der Tabellenanzeige bis zu verschiedenen Darstellungsformen im Untermenü Graphics. Meist begnügt man sich mit einer Liniendarstellung. Darüber hin-aus können einzelne Saisonzyklen jeweils getrennt oder überlagert angezeigt werden. Aus der Zeitreihe lässt sich eine Teilreihe (Sample) auswählen. Auf diese Weise kann man z.B. einen Teil der Beobachtungen am aktuellen Rand von der Modellspezifikation ausschließen und für eine spätere Vergleichsprognose zurück halten. Dabei sind der Beginn und das Ende der Stichprobe einzugeben. Die deskriptive Auswertung kann für Teilreihen genau so umfang-reich wie für den gesamten Datensatz durchgeführt werden. Zu diesem Zweck wird im Un-termenü Stats Table das entsprechende Sample definiert.
64 Kapitel 8
Bild 8.2 Einstellung der Periodisierung für nicht vordefinierte Intervalle
Bild 8.3 Datenimport aus einer Excel-Datei Zur deskriptiven Auswertung (siehe Bild 8.4) gehören Histogramme, Box-Plots und Tabellen mit Maßzahlen. Es werden Parametertests für das arithmetische Mittel, die Varianz und den Median angeboten. Verteilungstests sind für alle gängigen Wahrscheinlichkeitsverteilungen verfügbar. Hinzu kommen Quantilplots und Kerndichteschätzer. Für die Zeitreihenanalyse sind vor allem Korrelogramme (acf und pacf) für die Originaldaten und deren erste und zwei-te Differenzen wichtig. Um die Ordnung der Differenzenbildung zu prüfen oder zwischen
Kapitel 8 65
trendstationären Prozessen und Irrfahrtprozessen zu unterscheiden, können 6 verschiedene Einheitswurzeltests herangezogen werden. Die Tests sind anwendbar auf die Originaldaten, aber auch auf die ersten und zweiten Differenzen (vgl. Bild 8.5).
Bild 8.4 Deskriptive Auswertung der Zeitreihendaten
Bild 8.5 Einstellung eines Einheitswurzeltests nach Phillips Perron
66 Kapitel 8
Jedes Modell wird als Objekt definiert. Die Eingabe der formalisierten Modellstruktur erfolgt über den Menüpunkt Equation, der auch den Zugriff auf die 8 Schätzroutinen von EViews ermöglicht (siehe Bild 8.6 bis 8.8).
Bild 8.6 Objektspezifikation Bild 8.7 Anlegen einer Modellgleichung
Die Formeldeklaration (vgl. Bild 8.8) beginnt mit der linken Seite, hier ds4, gefolgt vom Absolutglied, hier c, und der um ein Lag verzögerten Einflussgröße ds4(-1). Bild 8.8 Ausfüllen der Modellgleichung und Vorbereitung der Schätzung
Kapitel 8 67
Eine vorgeschaltete logarithmische Transformation und eine nachfolgende einfache Differenz werden mit Hilfe der Funktion dlog(reihe, 1) realisiert. Gemischte Differenzen lassen sich mit Hilfe der Funktionen d(reihe, d, m) bilden, wobei d die Ordnung der einfachen Differenz und m für eine saisonale Differenz erster Ordnung bei m Saisonperioden steht. Darüber hinaus können Rauschterme vom Typ AR(p) oder MA(q) eingefügt werden (vgl. Bild 8.9).
Bild 8.9 Aufbau eines ARIMA-Modells (1,1,1)(0,1,0)12 mit Absolutglied und logarithmi-scher Transformation der Daten
Weitere wichtige Objekttypen sind mit Sample und VAR bezeichnet. Im Menü SAMPLE können Stichproben gezogen und als gesonderte Tabellen angelegt werden. Über das Unter-menü VAR erfolgt der Zugang zur multivariaten Analyse einschließlich Kointegration.
Die sich an die Schätzung anschließende Modellüberprüfung umfasst zahlreiche grafische und statistische Komponenten. Dazu gehören die Korrelogramme der Residuen und der quadrier-ten Residuen mit den entsprechenden Q-Statistiken, das Histogramm mit einem Test auf Normalverteilung und der Lagrange Multiplier Test für ARCH Strukturterme (vgl. Bild 8.10). Den Abschluss der Untersuchung bilden Vergleichsvorhersagen, um die Prognosegüte am aktuellen Rand zu ermitteln. Die Vergleichsvorhersage wird als gesonderter File abgespei-chert. Für jedes Experiment ist demzufolge ein entsprechender Bezeichner zu wählen. Es kann zwischen einer Mehrschrittvorhersage (Dynamic Forecasting) und einer Einschrittvorhersage (Static Forecasting) gewählt werden. Im Fenster Forecast Sample ist der Prognosezeitraum abgesteckt. Ist die Modellierung mit einem verkürzten Datensatz durchge-führt worden, so muss der verbleibende Datensatz am aktuellen Rand gesondert eingestellt werden (vgl. Bild 8.11).
68 Kapitel 8
Bild 8.10 Abtesten der Modellresiduen
Bild 8.11 Einstellen des Prognosealgorithmus Im Demonstrationsbeispiel (vgl. Bild 8.11) ist für den korrigierten Vergleichszeitraum (Forecast Sample) als Anfangsbeobachtung 8593 und als Endbeobachtung 8760 zu setzen.
Kapitel 8 69
Falls Transformationen der linken Seite zurück gerechnet werden müssen, wird ein erweiter-tes Prognosemenü angezeigt (vgl. Bild 8.12). Darin kann wahlweise für die Originaldaten oder die transformierten Daten vorhergesagt werden.
Bild 8.12 Rückrechnung der Transformationen bei der Prognose eines ARIMA-Modells
9. Vergleich der Programmpakete EVIEWS 5.0 und ITSM 2000 Neben EViews 5.0 wurde mit ITSM 2000 (siehe Brockwell u. Davies [2002]) ein weiteres Programmpaket zur Zeitreihenanalyse getestet. Einen Vergleich der Stärken und Schwächen beider Softwareprodukte enthält die Tabelle 9.1. Daran schließt sich ein Demonstrationsbeispiel zur Handhabung von ITSM 2000 an.
70 Kapitel 9
Tabelle 9.1 Stärken-Schwächen-Vergleich EViews 5.0 versus ITSM 2000
Merkmal EViews 5.0 ITSM 2000
Datenimport
Schnittstellen
Periodisierung
EXCEL, LOTUS, DB, DRI
Jahres- bis Tagesdaten
ASCII-Dateien name.dat
fehlt
Datenvorbehandlung
Lücke
Histogramm
Maßzahlen
Box-Plot
Verteilungsplot
Sample-Funktion
4 Saisonbereinigungsverfah-ren
Exponentielle Glättung
Filtertechniken
Simulation
Histogramm
Sample-Funktion
Simulation
Box-Cox-Transformation
Exponentielle Glättung
Tabellenanzeige
Modellidentifikation
Lücken
3 Einstichprobentests
3 Zweistichprobentests
6 Unit-Root-Tests
acf, pacf, ccf
Differenzen
Verteilungstests, incl. QQ-Plot
2 Kointegrationstests
Periodogramm fehlt
acf, pacf, ccf
Differenzen
QQ-Plot
Spektralanalyse
Kapitel 9 71
Tabelle 9.1 Stärken-Schwächen-Vergleich EViews 5.0 versus ITSM 2000 (Fortsetzung)
Merkmal EViews 5.0 ITSM 2000
Methodenangebot univariat
Lücken
ARMA-Modelle
GARCH-Modelle und Derivate
Ausschlussmöglichkeit von Zwischenwerten
Fraktional integrierte Modelle
ARMA-Modelle
Fraktional integrierte Modelle
GARCH-Modelle
Derivate von GARCH-Modellen
Einschränkung bei der Autoregression mit zykli-schen Peaks
Keine Autoregression mit zeitverzögerten Einfluss-größen
Methodenangebot multivariat Mehrgleichungsmodelle mit definierbarer Struktur
Vektorautoregression
Inputmodelle
Transferfunktionen
Residuen-Modelle
Multivariate Yule-Walker-Gleichungen
Modellschätzung für kardinale Daten
Modellschätzung für diskrete Daten
Lücke
LS, MLS, TSLS, GMM, GARCH
BINARY, ORDERED, CENSORED, COUNT
LS, MLS, GARCH
Modelle für diskrete Da-ten
Automatische Modellgenerierung nein ja
72 Kapitel 9
Tabelle 9.1 Stärken-Schwächen-Vergleich EViews 5.0 versus ITSM 2000 (Fortsetzung)
Merkmal EViews 5.0 ITSM 2000
Modellüberprüfung
Lücken
4 Testverfahren für Pa-rameter, z.B. Konfidenz-Ellipse, Likelihood-Ratio-Test
6 Testverfahren für Resi-duen, z.B. ARCH-LM-Test, Verteilungstest, Serielle Korrelation
Histogramm, acf, pacf, acf der Quadrate,
4 Stabilitätstests, z.B. Chow Breakpoint Test
Kumuliertes Periodogramm
2 Testverfahren für Resi-duen auf Korrelation und Gauß-Verteilung
QQ-Plot, Histogramm,
acf, pacf, acf der Absolutbeträge und Quadrate,
Keine Parameter- und Stabilitätstests
Kein ARCH-LM-Test
Vergleichsprognose
Lücke
Einschritt- und Mehr-schritt-Modus
Diverse Fehlermaße
RMSE% fehlt
Mehrschrittprognose
Keine Fehlermaße
Qualität der Grafiken
Nachberarbeitung
Exportfilter
6 Grafiktypen
Grafikeditor
3 Ausgabeformate
1 Grafiktyp
Farbeinstellung
ASCII-File
Clipboard
Qualität der Tabellen gut Nachberarbeitung nötig
Übersichtlichkeit der Menüs gut bis sehr gut befriedigend
Trennung von Modellen und Daten definierbar vorgegeben
Preis
Lücke
895 Dollar Version 4.0
245 Dollar Upgrade auf 5.0
Aktuelle Studenten-Version
150 Dollar
Professional Version
Kapitel 9 73
Ein Demonstrationsbeispiel zur Handhabung von ITSM 2000 Untersucht wird die Zeitreihe „Stündlicher Preis für Elektroenergie im US Staat Kalifornien“ (vgl. Tabelle 4.1). Der Datenimport erfolgt aus einer EXCEL-Datei mit dem Attribut CSV, in der die Zeitreihen spaltenweise ohne Bezeichnerzeile und ohne Datumsspalte abgelegt sind, wahlweise in ein univariates oder ein multivariates Projekt mit der Bezeichnung „name.tsm“. Für das multiva-riate Projekt ist die Anzahl der zu übernehmenden Spalten anzugeben. Die Dateneingabe führt unmittelbar zur Visualisierung der Zeitreihe (vgl. Bild 9.1).
-250.
-200.
-150.
-100.
-50.
0.
50.
100.
150.
200.
1000 3000 5000 7000
Series
Bild 9.1 Zeitreihendiagramm Kalifornien Zur deskriptiven Auswertung werden zwei Menüs angeboten. Unter Statistics sind die Korrelogramme, der QQ-Plot, das Histogramm und die Spektraldichtefunktion zu finden. Die Frequenzanalyse kann darüber hinaus im Menü Spectrum vertieft werden. Wählbar sind das Periodogramm, das geglättete Periodogramm, die logarithmierte Spectraldichtefunktion und die kumulierte Spektraldichtefunktion (incl. kumuliertes Periodogramm). Einige wichtige Ergebnisplots zum Beispiel liefern die Bilder 9.2 bis 9.4. Im Menü Transform können darüber hinaus eine Box-Cox-Transformation, einfache Diffe-renzen, eine Dekomposition, eine Normierung oder Teilfolgenbestimmung vorgenommen werden. Im Menü Model wird über die Option Specify die Modellgleichung eingegeben (vgl. Bild 9.5), über Estimate eine ggf. zweistufige Schätzung oder alternativ ein Autofitting, d.h. eine automatisierte Modellspezifikation, angeboten. Letztere kann der Nutzer als Einstieg in die Modellierung verwenden und sich danach systematisch einer Strukturverfeinerung zu wen-den. Eine Besonderheit bietet der Korrelationsplot, bei dem empirische und theoretische Kor-relationen mit Hilfe der Einstellung Sample/Model jeweils in grün und rot einander gegenüber gestellt sind. Die theoretischen Korrelationen beziehen sich auf die Modellempfehlung aus dem Autofit (vgl. Bild 9.7) .
74 Kapitel 9
0.
2000.
4000.
6000.
8000.
10000.
12000.
.0 .5 1.0 1.5 2.0 2.5 3.0
Periodogram/2pi Model Spectrum
Bild 9.2 Periodogramm Kalifornien
200.
400.
600.
800.
1000.
1200.
1400.
1600.
1800.
2000.
-200 -100 0 100 200
Bild 9.3 Histogramm Kalifornien Unter dem Menü Garch kann ein Modell aus zeitverzögerten Varianzen und Quadratfehlern spezifiziert und überprüft werden (vgl. Bild 9.8 und 9.9). Dabei wird die Struktur das zuvor ermittelten ARMA-Modells auf die Beobachtungsgleichung übertragen. Zur Überprüfung werden verschiedene Grafiken angeboten: Residuenplot (vgl. Bild 9.10), Korrelogrammplots der Residuen und der quadrierten Residuen (vgl. Bild 9.11) und zwei QQ-Plots, einer auf Normalverteilung und einer auf t-Verteilung (vgl. Bild 9.12). An Testverfahren sind die Box-Ljung-Statistik, der McLeod Li Test auf Normalverteilung, ein Ranktest auf Unabhängigkeit und der Jarque-Bera-Test ebenfalls auf Normalverteilung vorgesehen (vgl. Bild 9.13)
Kapitel 9 75
-250.
-200.
-150.
-100.
-50.
0.
50.
100.
150.
200.
-3 -2 -1 0 1 2 3
Q-Q (Normal) Plot, R^2 = .978968
Bild 9.4 QQ-Plot Kalifornien
Bild 9.5 Parametereinstellung für ein ARMA-Modell
76 Kapitel 9
======================================== ITSM::(Maximum likelihood estimates) ======================================== Method: Maximum Likelihood ARMA Model: X(t) = .6390 X(t-1) + .0000 X(t-2) + Z(t) WN Variance = .635660E+03 AR Coefficients .638990 .000000 Standard Error of AR Coefficients .009128 .000000 (Residual SS)/N = .635660E+03 AICC = .660187E+05 BIC = .660237E+05 FPE = .635839E+03 -2Log(Likelihood) = .660147E+05 Accuracy parameter = .00640000 Number of iterations = 1 Number of function evaluations = 11 Uncertain minimum.
Bild 9.6 Output der automatisierten AR-Schätzung
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
Sample ACF Model ACF
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
Sample PACF Model PACF
Bild 9.7 Korrelogramme der Daten (grün) und des AR-Modells (rot)
Kapitel 9 77
Bild 9.8 Parametereinstellung für ein GARCH-Modell ========== ITSM::(INFO) ========== # of Data Points = 7104 Subtracted Mean = -.0062 Sample Variance = .107422E+04 Std.Error(Sample Mean) = .627301 (square root of (1/n)SUM{(1-|h|/r)acvf(h)}, |h|<r=[sqrt(n)]) ARMA Model: X(t) = .6390 X(t-1) + Z(t) WN Variance = .635660E+03 Garch Model for Z(t): Z(t) = sqrt(h(t)) e(t) h(t) = .2885653E+03 + .2111485 Z^2(t-1) + .3388223 h(t-1) {e(t)} is IID N(0,1) Bild 9.9 Output eines geschätzten GARCH(1, 1)-Modells
78 Kapitel 9
-6.
-4.
-2.
0.
2.
4.
1000 3000 5000 7000
Garch Residuals
Bild 9.10 Residuenplot eines GARCH(1, 1)-Modells
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
Garch residual ACF: Abs values
-1.00
-.80
-.60
-.40
-.20
.00
.20
.40
.60
.80
1.00
0 5 10 15 20 25 30 35 40
Garch residual ACF: Squares
Bild 9.11 Autokorrelationen von εt und ε2
t aus dem AR(1)-Prozess
Kapitel 9 79
-6.
-4.
-2.
0.
2.
4.
-6 -4 -2 0 2 4 6
Q-Q (t-distr with 10.00 df) Plot Garch Residuals, R^2 = .995307
Bild 9.12 QQ-Plot von Residuen eines GARCH(1, 1)-Modells ============================================ ITSM::(Tests of randomness on Garch residuals) ============================================ Ljung - Box statistic = 77.031 Chi-Square ( 22 ), p-value = .00000 McLeod - Li statistic = 51.854 Chi-Square ( 22 ), p-value = .00033 # Turning points = .47680E+04~AN(.47347E+04,sd = 35.533), p-value = .34820 # Diff sign points = .35920E+04~AN(.35515E+04,sd = 24.333), p-value = .09603 Rank test statistic = .12611E+08~AN(.12615E+08,sd = .99804E+05), p-value = .96960 Jarque-Bera test statistic (for normality) = .10621E+04 Chi-Square (2), p-value = .00000 Order of Min AICC YW Model for Garch Residuals = 10 Bild 9.13 Residuentests für ein GARCH(1, 1)-Modell Die sämtliche Verteilungstests lehnen im Beispiel die Normalverteilungshypothese ab, da die Irrtumswahrscheinlichkeit zum Verwerfen der Nullhypothese unter 5%, hier sogar unter 1% liegt. Zur Illustration der Prognoseeigenschaften wird ein Volatilitätsplot angeboten, aus dem sich die Varianzdynamik erschließt (siehe Bild 9.14). Die Zeitreihe, das Modell und die wichtigs-ten Kennfunktionen lassen sich als File oder Grafik in einen ASCII-File exportieren (vgl. Bild 9.15).
80 Kapitel 9
20.
30.
40.
50.
60.
70.
1000 3000 5000 7000
Garch Stochastic Volatility
Bild 9.14 Volatilitätsplot eines GARCH(1, 1)-Modells
Bild 9.15 Exportfenster für ein Zeitreihenmodell
Kapitel 10 81
10. Theoretische Grundlagen Eine alternative Methode zur Box-Jenkins-Technik hat A. C. Harvey 1981 vorgeschlagen. Sein Ansatz verzichtet auf die oft schwierige Auswertung von Korrelogrammen und eine zur Mehrdeutigkeit neigende Auswahl von Modellen mit zahlreichen einzustellenden Parametern. Er besitzt ferner den Vorteil, dass bei geringfügig veränderten Bedingungen auf eine erneute Modellspezifikation verzichtet werden kann. Die Modellfortschreibung mit Hilfe eines Zu-standsraummodells (Kalman Filter) sichert eine entsprechende Güte vor allem bei Einschritt-Prognosen. Nachteilig ist die weitgehende Eingrenzung auf instationäre Modellprozesse mit Einheitswurzeln. Die Idee von Harvey bestand darin, den Trend, die Saison und sonstige Zyk-len mit Hilfe spezieller Random Walks zu modellieren und zu einem sogenannten Unobserved Components Model (UCM) zusammen zu fassen (vgl. Harvey [1990], S. 31 ff.). Mit einem derartigen Ansatz wird die Modellvielfalt zwangsläufig erheblich einge-schränkt. Aus praktischer Sicht sind diese Einschränkungen jedoch oft hinnehmbar, wovon zahlreiche erfolgreiche Anwendungen in den letzten Jahren zeugen, z. B. zur Untersuchung täglicher Steuereinnahmen (Koopman u. A. [2003]). In jüngster Zeit sind einige Publikationen zur methodischen Weiterentwicklung der UCM vor allem für heteroskedastische Prozesse erschienen (vgl. Koopman u. A. [2004], Proietti [2004]). Im deutschsprachigen Raum ist al-ternativ zu Unobserved Components Models der Begriff Zeitreihen-Struktur-Modelle ver-breitet (vgl. Pauly in Edel u. A. [1997], S. 45 ff.). 10.1 Standardmodell für die Trend-Saison-Überlagerung Für eine Quartalsreihen (m = 4) mit starrer Saison und einem linearen Trend werden vier Dif-ferenzengleichungen angesetzt und fortgeschrieben:
Dabei bezeichnet {Xt}den Modellprozess, {Nt}den Niveauprozess, {Tt}den Trendprozess und {St}den Saisonprozess1. Die vier Störprozesse {at}, {bt}, {ct} und {dt} sind paarweise unkorreliert und jeweils normalverteilt mit dem Erwartungswert null, aber verschiedenen Va-rianzen σa
2 , σb2 , σc
2 , σd2, die zunächst unbekannt sind. Die erste Gleichung wird als Beo-
bachtungsgleichung und die drei folgenden Gleichungen für das Niveau, den Trend und die Saison werden als Zustandsgleichungen bezeichnet. Fasst man die einzelnen Komponenten zu einem Zustandsvektor f(t), die Störprozesse zu einem Störvektor h(t) und die Struktur der Differenzengleichungen zu einer Matrix A zusammen, so ergibt sich folgende rekursive Dar-stellung (Zustandsraummodell oder Kalman-Filter)
( )
,)t()1t()t(
a)t(00101X tt
hfAf
f
+−⋅=
+⋅=
1 Nt wird meist nur als Niveau, Tt als Trendänderung und St schlicht als Saison bezeichnet.
.dSSSS
cTT
bTNN
aSNX
t3t2t1tt
t1tt
t1t1tt
tttt
+−−−=+=
++=++=
−−−
−
−−
82 Kapitel 10
wobei
.
0
0
d
c
b
)t(
S
S
S
T
N
)t(
01000
00100
11100
00010
00011
t
t
t
2t
1t
t
t
t
=
=
−−−=
−
−
hfA
Mit gegebenen Anfangswerten N0, N-1, T0, S0, S-1, S-2 sowie b0, c0 und d0 kann die rekursive Modellfortschreibung gestartet werden. Es ist möglich, die Anfangswerte mit Hilfe der Me-thode der kleinsten Quadrate geeignet zu schätzen (vgl. Pauly in Stier u. A.[1997], S. 54). Die Starrheitsbedingung für die Saisonausschläge St, die mitunter auch als Saisondummies bezeichnet werden, lässt sich mit Hilfe einer Bedingung für die Saisonstörung dt
E(dt) = 0 realisieren. Bei der Prognose wird das Saisonmuster nach der letzten Beobachtung unverän-dert fortgeschrieben. Da in den Gleichungen keine zu spezifizierenden Modellparameter enthalten sind, reduziert sich die Schätzung auf die Varianzverhältnisse (Hyperparameter). Zur Modellidentifikation werden nur die drei folgenden Verhältnisse benötigt:
Jedes Varianzverhältnis kann mit Hilfe eines Likelihood-Ratio-Tests auf signifikante Ab-weichung von null getestet werden. Kann die Null-Hypothese nicht verworfen werden, dann ist der zugehörige Prozess aus den Zustandsgleichungen (Niveau, Trend oder Saison ) als de-terministisch anzusehen. Als Prüfgröße LR wird das gewichtete, logarithmierte Verhältnis der beiden Restvarianzen der Beobachtungsgleichung unter der Nullhypothese bzw. unter der Alternativhypothese verwendet. Der Gewichtsfaktor ergibt sich aus dem Stichprobenumfang n, vermindert um die Anzahl der gebildeten Differenzen. Der Wert von LR ist zu vergleichen mit dem Quantil der Chi-Quadrat-Verteilung für zwei Freiheitsgrade (Anzahl der Zustands-gleichungen unter H0) und eine Irrtumswahrscheinlichkeit α. Soll beispielsweise auf einen stochastischen Trend getestet werden, so lauten die Hypothesen
H0: σc2 = 0 HA: σc
2 ≠ 0. Die Prüfgröße ergibt sich für den Fall, dass keine Differenzen auf die Beobachtungen ange-wendet worden sind, aus
σ
σ⋅=
A2a
02a
H
HlnnLR
und der entsprechende Vergleichswert ist χ2
(2; 0,05) = 5,991.
.2a
2d
2a
2c
2a
2b
σσ
σσ
σσ
Kapitel 10 83
10.2 Erweiterungen des Standardmodells Modifikationen des Standardmodells sind in mehrfacher Hinsicht möglich. Die Beobach-tungsgleichung lässt sich durch
• eine oder mehrere zyklische Komponenten, • eine Kalenderkomponente, • eine autoregressive Komponente, • eine oder mehrere erklärende Variablen,
erweitern, die ihrerseits speziellen Strukturgleichungen folgen können. Aber auch die Struk-turgleichungen selbst können zusätzliche Terme in Gestalt korrelierter Störprozesse enthalten, um eine Schockfortwirkung zu modellieren. 10.2.1 Modellierung von Zyklen Die Random Walks beschreiben instationäre Prozesse mit einem zeitvariablem Erwartungs-wert und/oder einer zeitvariabler Varianz. Es ist möglich, sich überlagernde Zyklen mit Hilfe verschiedener saisonaler Random Walks zu modellieren. Für einen Zyklus, der über die Sai-son hinaus geht, wird eine spezielle trigonometrische Differenzengleichung mit einem Dämp-fungsfaktor d eingeführt. Die Beobachtungsgleichung für das Niveau Nt und den Zyklus Zt lautet
tttt aZNX ++= . Die rekursive Darstellung für die Fortschreibung eines Zyklus Zt über mz Perioden (Frequenz fz) hat in Matrixgestalt folgende Form (Cosinoid-Ansatz):
+
⋅
ππ−ππ
⋅=
−
−*t
t
*1t
1t
ZZ
ZZ
*t
t
e
e
Z
Z
f2cosf2sin
f2sinf2cosd
Z
Z.
Die Störprozesse et bzw. et* sind paarweise unkorreliertes „weißes Rauschen“ mit einer ge-meinsamen Varianz σe
2. Zwischen der Varianz der Störprozesse und der Varianz des Zyklus gilt folgende Beziehung
2Z
22e )d1( σ⋅−=σ .
Geht der Dämpfungsparameter d gegen 1, dann verschwindet die Varianz der Störprozesse und der Zyklus Zt geht in eine deterministische Schwingung über, d.h.
tf2sinZtf2cosZZ Z*0Z0t ⋅π⋅+⋅π⋅= .2
Die Zufallsvariablen Z0 bzw. Z0* haben den Mittelwert 0 und die Varianz σZ
2. Eine Überla-gerung von Zyklen unterschiedlicher Länge wird mit Hilfe mehrerer trigonometrischer Diffe-renzengleichungen mit verschiedenen Dämpfungsfaktoren und entsprechenden Störprozessen modelliert.
2 Durch Potenzieren der Transformationsmatrix vervielfacht sich das Argument der trigonometrischen Funktio-nen auf t⋅2πfz.
84 Kapitel 10
Die Matrixdarstellung für ein Strukturgleichungsmodell mit Niveau- und Zyklengleichungen lautet
( )
,)t()1t()t(
a)t(00101X tt
hfAf
f
+−⋅=
+⋅=
wobei
.
e
e
c
b
)t(
Z
Z
T
N
)t(
f2cosdf2sind00
f2sindf2cosd00
0010
0011
t
t
t
t
t
t
t
t
ZZ
ZZ
=
=
π⋅π⋅−π⋅π⋅
=
∗∗
hfA
10.2.2 Modellierung der Saisonkomponente als harmonischer Schwingung Der Cosinoid-Ansatz wird oft auch zur Saisonmodellierung genutzt. Der Saisonausschlag ergibt als sich als Summe zyklischer Komponenten KSt(j)
∑
==
2
m
1jtt
s
)j(KSS
aller Frequenzen λj
=π
=λ2
m...,,1j
m
j2 s
sj
zum Saisonzyklus ms. Für jede zyklische Komponente KS(j) gilt die Transformation aus dem Cosinoid-Ansatz mit der Dämpfung 1 als Bedingung für eine starre Saison, d.h.
.)j(e
)j(e
)j(KS
)j(KS
cossin
sincos
)j(KS
)j(KS*t
t*
1t
1t
jj
jj*t
t
+
⋅
λλ−λλ
=
−
−
Die mit einem Stern gekennzeichnete Komponente KS*(j) spielt nur die Rolle einer Hilfsgrö-ße. Die Störprozesse et(j) und et*(j) sind „weißes Rauschen“. Ihr Erwartungswert ist gleich null. Sie sind nicht miteinander korreliert und haben jeweils die gemeinsame Varianz σe
2(j). Für einen Quartalszyklus mit ms = 4 setzt sich der Saisonausschlag St nur aus jeweils zwei Summanden KSt(j) zusammen
.)2(KS)1(KSS ttt +=
Kapitel 10 85
Die Bewegungsgleichung der zweiten Komponente reduziert sich auf
.)j(ecos)2(KS)2(KS t21tt +λ⋅= −
In diesem Beispiel ergibt sich für das Strukturgleichungsmodell mit Trend und Saison folgen-de Matrixstruktur
.
)2(e
)1(e
)1(e
c
b
)t(
)2(KS
)1(KS
)1(KS
T
N
)t(
10000
00100
01000
00010
00011
t
t
t
t
t
t
t
t
t
t
=
=
−−
=∗∗
hfA
10.2.3 Modellierung fortwirkender Schocks Die Erweiterung der Strukturgleichungen durch MA-Terme dient zur Modellierung einer Schockfortwirkung. Für ein rein saisonales Modell mit einer (saisonalen) Schockfortwirkung über zwei Perioden in Dummy-Darstellung
ergibt sich dann folgende Matrizengleichung
( ) )t(,)1t()t( 21 hBfAf ⋅θθ+−⋅=
bzw.
⋅
θθ+
⋅
−−−=
−
−
−
−
−
−
−
2t
1t
t21
3t
2t
1t
2t
1t
t
d
d
d
000
000
1
S
S
S
010
001
111
S
S
S
.
Die Matrix B enthält die beiden zusätzlich zu schätzenden Parameter θ1 und θ2. 10.2.4 Modellierung von Autoregression Die Autoregression kann mit Hilfe einer zusätzlichen Variablen Yt in der Beobachtungsglei-chung und einer entsprechenden Zustandsgleichung eingeführt werden. Der Formelsatz mit einem zeitvariablen Level und einer Autoregression über p Perioden laut:
2t21t1t3t2t1tt
ttt
dddSSSS
aSX
−−−−− ⋅θ+⋅θ++−−−=+=
86 Kapitel 10
.wY...YYY
bNN
YNX
tptp2t21t1t
t1tt
ttt
+⋅φ++⋅φ+⋅φ=+=
+=
−−−
−
In vektorieller Form entsteht
( )
,)t()1t()t(
)t(00011X t
hfAf
f
+−⋅=
⋅=
wobei
.
0
0
0
w
b
)t(
Y
Y
Y
Y
N
)t(
01000
00100
00010
0
00001
t
t
3t
2t
1t
t
t
4321
=
=
φφφφ=
−
−
− hfA
Alternativ könnte auch der gewichtete, zeitverzögerte Prozess {Xt} unmittelbar in die Beo-bachtungsgleichung eingehen. Das wird sich vor allem dann anbieten, wenn deterministische exogene Einflussgrößen zu beachten sind. Darüber hinaus können aber auch zeitverzögerte Regressor- als auch Regressandenprozesse gleichzeitig modelliert werden. 10.2.5 Weitere Modellbestandteile und Schätzverfahren Zusätzliche Einflussgrößen Et werden in die Beobachtungsgleichung aufgenommen und ge-wichtet mitgeführt. Das trifft auch auf Dummy-Variable zu, die Sprünge im Zeitverlauf cha-rakterisieren sollen. Man spricht in diesem Zusammenhang auch von Interventionstermen. Der Zustandsvektor f(t) ist entsprechend um die neuen Variablen zu erweitern. Zur Modellierung von Kalendereinflüssen werden Tagesgewichte geschätzt und auf die Er-fassungsperioden (Monat, Quartal) umgelegt (vgl. Götze [2000], S. 47 ff). Es kann alternativ auch für jeden Tag ein Random Walk definiert werden (vgl. Harvey [1990], S. 173). Der Ka-lendereinfluss wird meist nur als exogene Größe in die Beobachtungsgleichung eingefügt und eher selten mit Hilfe von Zustandsgleichungen untersetzt. Mit Hilfe geeigneter Startwerte erzeugt das rekursive Gleichungssystem, bestehend aus Beo-bachtungsgleichung und Zustandsgleichungen, für jede Periode t eine Einschrittprognose. Der Einschritt-Prognose-Fehler wird mit Hilfe von Optimierungskriterien ausgewertet. Das kön-nen verschiedene Likelihood-Funktionen (vgl. Harvey [1990] S. 168 ff.) oder eine verallge-meinerte Kleinste Quadrate Schätzungen sein (vgl. Pauly: in Edel u. A.[1997], S. 69 ff.). Ein speziell für den Kalman-Filter entwickelter Algorithmus geht auf Engle zurück (siehe Koopman u. A. [2000], S. 157 ff.). Dieser sogenannte EM-Algorithmus basiert auf geglätte-ten Residuen.
Kapitel 11 87
11. Stufen der Modellspezifikation Die Spezifikation von Strukturgleichungsmodellen weist im Vergleich zur Spezifikation von multiplikativen ARIMA-Modellen (vgl. Bild 3.1) sowohl Gemeinsamkeiten als auch Unter-schiede auf. • Beiden Spezifikationstechniken gemeinsam ist der stufenweise geführte Auswahlprozess,
in dessen Ergebnis ein statistisch geprüftes Modell mit überlegener prognostischer Eig-nung ermittelt wird.
• Die Unterschiede liegen vor allem in der Phase der Modellidentifikation, da die fragli-
chen Strukturgleichungen weitgehend vorgegeben und kaum parametrisiert sind. Aller-dings wird dieser Vorteil durch eine umfangreichere Modellüberprüfung wieder ausgegli-chen. Die Schätzung muss öfter wiederholt werden als bei den multiplikativen ARIMA-Modellen. Das hängt vor allem mit der Entscheidung darüber zusammen, ob eine Modell-komponente als deterministisch oder stochastisch anzusehen ist. Dazu dient der in Kapitel 10 erläuterte LR-Test. Die Wahrscheinlichkeit einer Fehlspezifikation kann mit Hilfe vor-geschalteter Einheitswurzeltests wesentlich verringert werden. Einfacher gestaltet sich hingegen die Schätzprozedur selbst, weil wesentlich weniger Signifikanzprüfungen durch-zuführen sind.
Bild 11.1 Modellspezifikation für stochastische Komponentenmodelle
Modelleingrenzung Auswahlkriterien
RMSE%RMAX%
Prognosemodell Prognosetests Vergleichs- prognose
LR-Testkorrekt spezifizierte Heterosketastie-StatistikModelle Durbin-Watson-Statistik
Modellüberprüfung Box-Ljung-StatistikKumuliertes PeriodogrammVerteilungstest
Modelle optimaler Signifikanz-Test der ModellparameterKompliziertheit Modellschätzung Minimierung von AIC bzw. SBC
Maximierung von RT2 bzw. RS
2
Ensemble Einheitswurzeltestsidentifizierter Modellidentifikation PeriodogrammModelle Autokorrelationen
Mean-Range-Diagramm
Strukturgleichungsmodell
88 Kapitel 12
12. Erläuterung der untersuchten Datenbestände Es wurden zunächst die 16 Monatszeitreihen aus dem Bereich des Handels mit Elektro-energie (EE) in Kalifornien (vgl. Tabelle 4.4) betrachtet, die überwiegend Trend- und Sai-sonkomponenten aufweisen. Danach wurden die monatlichen Rohölpreise in den USA (Tabelle 4.5), die monatlichen Erdgas-Preise in den USA (vgl. Tabelle 4.6) und die monatlichen Elektroenergiepreise in den USA (vgl. Tabelle 4.7) analysiert. Für die Auswahl der Rohöl- und Erdgaspreise spra-chen die nachgewiesenen Einheitswurzeln (vgl. Tabelle 6.13 und 6.14). Bei den Elektro-energiepreisen war von Interesse, wie die Strukturgleichungsmodelle im Fall saisonaler Einflüsse ohne Einheitswurzeln funktionieren. Darüber hinaus wurden Tagesreihen zur Labornutzung untersucht (vgl. Tabelle 4.3), um die Modellierung von nichtsaisonalen Zyklen mit STAMP näher zu betrachten. Eine Stundenreihe aus Kalifornien (vgl. Tabelle 4.1) und eine Wochenreihe (vgl. Tabelle 4.2) komplettierten die Auswahl. Bei der Stundenreihe wurde die Möglichkeit einer Zyklenüberlagerung mit STAMP überprüft. Die Ausgewählten Zeitreihen sind in der Tabelle 12.1 zusammen gestellt. Tabelle 12.1 Auswahl von Zeitreihen zur Anwendung von Strukturgleichungsmodellen
Reihen Bezeichnung Werteanzahl
Monatsreihen EE- Handel in Kalifornien
R 1 bis R 15 163
Monatsreihen Rohölpreise in den USA
CODPUUS, COFMUUS, COIMUUS, RADMUUS, RAIMUUS, RACPUUS
367
Monatsreihen Erdgaspreise in den USA
NGWPUUS, NGCGUUS, NGRCUUS, NGCCUUS, NGINUUS, NGEIUUS.
343, 247, 283, 247, 247, 306.
Monatsreihe EE-Preise in den USA
ESRCUUS, ESCMUUS, ESICUUS, ESTCUUS.
43
Tagesreihen Laborzutritt FH Stralsund
PoolT, Lab1T, Lab2T, Lab3T, EH21T. 122
Wochenreihe Margarineab-satz
MARW 147
Stundenreihe EE-Preis ISO Kalifornien
USP10 7296
Kapitel 13 89
13. Demonstration eines Beispiels Die Modellierung von univariaten Strukturgleichungsmodellen wird am Beispiel des monatli-chen Umsatzes von Elektroenergie im US-Bundesstaat Kalifornien im Sektor Haushalte (Rei-he R1) demonstriert. Die Zeitreihe beginnt im Januar 1999 und endet im Juli 2003.
Bild 13.1 Monatlicher Umsatz von Elektroenergie im Sektor Haushalte (Reihe R1) Es wird ein Strukturgleichungsmodell, bestehend aus Beobachtungsgleichung, Niveauglei-chung, Trendgleichung und trigonometrischer Saisongleichung angesetzt:
In die Maximum Likelihood Schätzung geht ein um 7 Beobachtungen am aktuellen Rand ver-kürzter Datensatz ein. Die abgeschnittenen Daten werden für eine Vergleichsprognose zurück gehalten. Mit den Störvarianzen der einzelnen Gleichungen sind 4 (Hyper-) Parameter zu schätzen. Das Iterationsverfahren bricht nach 7 Schritten ab. Ein zusammenfassender Report zur Modelldiagnose enthält Tabelle 13.2. Tabelle 13.1 Estimation report
Model with 4 parameters ( 2 restrictions).
Parameter estimation sample is 1990. 1 - 2002.12 T = 156 Log-likelihood kernel -3.536225 Very strong convergence in 7 iterations likelihood cvg 2.511657e-016 gradient cvg 2.264855e-009 parameter cvg 2.013248e-012
).6(KS...)2(KS)1(KSS
cTT
bTNN
aSNX
tttt
t1tt
t1t1tt
tttt
+++=+=
++=++=
−
−−
1990 1995 2000
500
600
700
800
900
1000
r1
90 Kapitel 13
Tabelle 13.2 Diagnostic summary report
Estimation sample
Log-Likelihood
Prediction error variance
1990. 1 - 2002.12 T = 156, n = 143
-551.651 -2 LogL = 1103.3
1531.97
Standard error 39,14 Normality 9,4620 H(47) 2,7087 r(1) 0,11704 r(11) 0,041309 DW 1,756600 Q(11,8) 7,9913 Rs
2 0,22903
• Die Anzahl der eingehenden Beobachtungen T beträgt 156. Davon ist die Zahl der Frei-
heitsgrade, bestehend aus s - 1 Saisonausschlägen St (s = 12) und zwei nichtsaisonalen Va-rianzverhältnissen für Niveau und Trend, abzuziehen. Das führt auf einen Wert n = 143.
• Der ausgewiesene Standardfehler ist die Wurzel aus der (geschätzten) Restvarianz σa2.
• Die Jarque-Bera-Statistik N beträgt 9,462. Sie ist mit dem Quantil der Chi-Quadrat-Verteilung χ2
(2; 0,05) = 5,991 zu vergleichen. Die Nullhypothese (H0: Normalverteilung liegt vor.) wird wegen 9,462 > 5,991 verworfen.
• Das Verhältnis H(47) der Quadratsumme aus den ersten und letzten 47 Residuen
∑
∑++
+=
+−==h1d
11dt
2t
n
1hnt
2t
a
a
)h(H
ist mit dem Quantil der F-Verteilung F(47, 47; 0,05) = 1,64 zu vergleichen (vgl. Koopman u. A. [2000], S. 183). Die Nullhypothese (H0: Die Varianz ist zeitunabhängig.) wird wegen 2,7087 > 1,64 verworfen.
• Die beiden Autokorrelationen der Residuen zum Lag 1 und zum Lag 11, r(1) und r(11), sind wegen der für große Stichproben gültigen Näherung sr
2~ 1/T zu vergleichen mit dem Quantil der N.V.(0, 1/T) für α = 0,05, d. h. mit 0,158 (siehe Koopman u. A. [2000], S. 173).
• Die Durbin-Watson-Statistik beträgt 1,7556 und ist zu vergleichen mit dem Quantil der N.V. (2; 4/T) für α = 0,05, d.h. mit 2,314 (siehe Koopman u. A. [2000], S. 173). Die Null-hypothese (H0: Autokorrelation erster Ordnung liegt nicht vor.) wird wegen 4 - 2,314 < 1,7556 < 2,314 nicht verworfen.
• Die Box-Ljung-Statistik zur Anzeige serieller Korrelation bis zum Lag 11 beträgt 7,9913 und ist mit dem Quantil der Chi-Quadrat-Verteilung χ2
(8; 0,05) = 15,507 zu vergleichen. Die Nullhypothese (H0: Serielle Korrelation bis zum Lag 11 liegt nicht vor.) wird folglich nicht verworfen.
• Das saisonale Bestimmtheitsmaß beträgt 22,9%. Es setzt die Restvarianz σa2 ins Verhält-
nis zur Varianz der Saisondifferenzen der Beobachtungen.
Die Residualvarianzen der einzelnen Gleichungen werden jeweils auf die Restvarianz der Beobachtungsgleichung bezogen (vgl. q - ratio in Tabelle 13.3). Auf die Niveaugleichung entfällt danach ein Erklärungsanteil von 5,87% und auf die Saisongleichung ein Erklärungs-
Kapitel 13 91
anteil von unter 1%. Die Trendänderungsgleichung leistet keinen Beitrag zur Varianzerklä-rung. Der Trendzuwachs wird demzufolge als nicht stochastisch eingestuft. Die entsprechende Gleichung ist überflüssig. Die gewählte Saisonmodellierung könnte mit Hilfe eines LR-Tests mit den Alternativen (Dummy-Ansatz bzw. konstante Ausschläge in der Beobachtungsglei-chung) verglichen werden.1 Tabelle 13.3 Estimated variances of disturbances
Component variance q-ratio
Irregular 1052,9 1,0000 Level 61,758 0,0587 Slope 0,00000 0,0000 Seasonal 0,82786 0,0008 Für die Standardabweichungen sind die entsprechenden Verhältniszahlen (q - ratio) in Tabelle 13.4 aufgelistet. Tabelle 13.4 Estimated standard deviations of disturbances
Component Standard deviation q-ratio
Irregular 32,448 1,0000 Level 7,8586 0,2422 Slope 0,00000 0,0000 Seasonal 0,90987 0,0280 Die Schätzung des Zustandsraumvektors am Ende des Analysezeitraums enthält Tabelle 13.5. Das Niveau, der Trendzuwachs und 5 der modifizierten Saisonausschläge sind signifikant geschätzt. Die modifizierten Saisonausschläge 1, 3, 7, 9 und 11 hingegen lassen sich nicht signifikant schätzen. Tabelle 13.5 Estimated coefficients of final state vector
Variable Coefficient R.m.s.e. t-value p-value
Level 804,81000 15,70500 51,24500 0,0000 Slope 1,60270 0,64778 2,47420 0,0145 Sea_ 1 0,78449 6,78640 0,11560 0,9081 Sea_ 2 -59,51100 6,90630 -8,61700 0,0000 Sea_ 3 -3,19890 6,53840 -0,48924 0,6254 Sea_ 4 84,21500 6,61070 12,73900 0,0000 Sea_ 5 20,48600 6,49030 3,15640 0,0019 Sea_ 6 13,15900 6,55230 2,00820 0,0465 Sea_ 7 3,38560 6,47430 0,52293 0,6018 Sea_ 8 17,52600 6,53330 2,68260 0,0082 Sea_ 9 1,70720 6,46970 0,26387 0,7923 Sea_10 20,31900 6,53000 3,11160 0,0022 Sea_11 0,98623 5,44470 0,18114 0,8565
1 Der Standardfehler für ein Modell mit Dummy-Saison beträgt 37,771. Der LR-Wert 10,153 liegt über dem Ver- gleichswert 7,815 der Chi-Quadrat-Statistik. Der Dummy-Ansatz ist somit vorzuziehen.
92 Kapitel 13
Zur Saisonanalyse gehören ein Test auf Saisonalität und eine Liste der Saisonausschläge (vgl. Tabelle 13.6). Der Test auf saisonalen Einfluss geht von folgenden Hypothesen aus:
H0: Die s – 1 Saisonkomponenten im Schätzvektor sind identisch.
HA: Die s – 1 Saisonkomponenten sind signifikant verschieden voneinander. Die Teststatistik SC mit dem Vektor der s – 1 Saisonkomponenten a und der Matrix P der Mean Square Error-Schätzung ergibt sich aus
aPa ' ⋅⋅= −1SC und wird mit dem Quantil der Chi-Quadrat-Verteilung χ2
(s - 1; 0,05) verglichen. Im Beispiel gilt SC = 298.333 > χ2
(11; 0,05) = 19,675. Folglich ist H0 zu verwerfen. Das Saisonmuster zeigt positive Ausschläge in den Wintermonaten Januar und Dezember (Heizperiode), sowie in den Sommermonaten Juli bis September (Klimatisierungsperiode). Tabelle 13.6 Saisonausschläge
Seas 1 Seas 2 Seas 3 Seas 4 Seas 5 Seas 6
Value 76,595 -29,728 -46,753 -106,76 -98,027 -21,805
Seas 7 Seas 8 Seas 9 Seas 10 Seas 11 Seas 12
Value 91,068 147,020 57,949 -6,9665 -86,750 24,151
Das Testen auf Normalverteilung kann weiter verfeinert werden, indem Schiefe und Wölbung jeweils einzeln oder gemeinsam nach Bowman/Shenton bzw. Jarque/Bera (BS) bzw. weiter verfeinert nach Doornik/Hansen (DH) abgetestet werden (siehe Koopman u. A. [2000], S. 139). Die Vergleichswerte der Chi-Quadrat-Statistik betragen für α = 0,05 und einen Frei-heitsgrad 3,841 bzw. 5,991 für zwei Freiheitsgrade. Die Nullhypothese (H0: Normalverteilung liegt vor.) wird in allen vier Fällen auf einem Signifikanzniveau von unter 5% verworfen.
Tabelle 13.7 Normality test for Residuals
Maßzahl Schätzwert P - value
Sample Size 143 Mean -0,039716 Std.Devn. 0,999211 Skewness 0,649390 Excess Kurtosis 0,855871 Minimum -2,471899 Maximum 3,414540 Skewness Chi^2(1) 10,0510 0,0015 Kurtosis Chi^2(1) 4,3646 0,0367 Normal-BS Chi^2(2) 14,4150 0,0007 Normal-DH Chi^2(2) 9,4620 0,0088
Kapitel 13 93
Einige weitere Gütemaße sind in Tabelle 13.8 zu sehen. Neben der Restvarianz pev , sind die mittlere absolute Abweichung md
und das Verhältnis aus Restvarianz und dem Quadrat der mittleren absoluten Abweichung aufgeführt. Letzteres sollte bei korrekter Spezifiktion näherungsweise gleich 1 sein. Das trifft offensichtlich zu. Tabelle 13.8 Goodness-of-fit results and serial correlation statistics for residuals
Maßzahl Wert
Prediction error variance (p.e.v) 1531,968274
Prediction error mean deviation (m.d) 1177,412957
Ratio p.e.v. / m.d in squares 1,077760
Coefficient of determination R2 0,852309
... based on differences RD2 0,777104
... based on diff around seas mean RS2 0,229034
Information criterion of Akaike AIC 7,539437 Information criterion of Schwartz (Bayes) BIC 7,852243
Durbin-Watson 1,75663 Asymptotic deviation for correlation 0,0836242
Die drei Bestimmtheitsmaße R2, RD
2 und RS2
t12
t2sx
2a2
Stt2dx
2a2
D2x
2a2 X)B1(SX1RX)B1(DX1R1R ⋅−=
σσ
−=⋅−=σσ
−=σσ
−=
geben Aufschluss über die Erklärungsgüte, wobei insbesondere RS
2 zu beachten ist, weil die Reihe über Trend und Saison verfügt. Diese Maßzahl zeigt an, wie viel Varianz das Modell über die durch Trend und Saison verursachte Variation hinaus erklären kann. Die beiden Gütemaße für Modelle optimaler Kompliziertheit von Akaike und Bayes-Schwartz
liegen mit 7,539 und 7,852 dicht beieinander. Die Durbin-Watson-Statistik wurde bereits im Zusammenhang mit der Tabelle 13.2 ausgewertet. Die asymptotische Standardabweichung sr der Autokorrelationen rk ist der Kehrwert der Wurzel aus n = 143 und beträgt 0,0836. Mit ihrer Hilfe kann ein Konfidenzband um die Autokorrelationen der Residuen gezogen und ein Test auf identische Normalverteilung mit N.V.(0, 1/n) durchgeführt werden. Da gemäß Tabel-le 13.9 weniger als 5% der rk außerhalb der 2-Sigma-Grenzen ±1,96·0,0836 = ±0,1639 lie-gen2, ist die Nullhypothese (H0: Identische Normalverteilung.) zu verwerfen.
2 Es dürften maximal 2 Werte außerhalb liegen. Tatsächlich fällt aber gar kein Wert aus dem Konfidenzband
heraus.
∑+=−
σ=σ=
T
1dtt
2a a
dTmdpev
T
mTlnlnBIC
T
m2lnAIC 2
a2a ⋅+σ=⋅+σ=
94 Kapitel 13
Die Box-Ljung-Statistik für Lag 31 (siehe Tabelle 13.9) ist bei vier Hyperparametern mit dem Wert der Chi-Quadrat-Statistik für 31 – 4 + 1 = 28 Freiheitsgraden, d. h. 41,337 bei α = 0,05 zu vergleichen (siehe Koopman u. A. [2000], S. 182). Die Nullhypothese (H0: Serielle Korre-lation bis zum Lag 31 liegt nicht vor.) wird wegen 19,0571 < 41,337 nicht verworfen. Tabelle 13.9 Korrelogramm der Residuen
Lag dF SerCorr BoxLjung ProbChi2(dF)
1 0 0,1170 2 0 -0,1130 3 0 0,0092 4 0 -0,0654 5 1 0,0296 4,6591 0,0309 6 2 -0,0328 4,8220 0,0897 7 3 0,0492 5,1918 0,1583 8 4 -0,1193 7,3782 0,1172 9 5 -0,0438 7,6750 0,1751
10 6 0,0176 7,7233 0,2591 11 7 0,0413 7,9913 0,3334 12 8 0,0027 7,9925 0,4342 13 9 0,0402 8,2507 0,5091 14 10 0,1585 12,2879 0,2663 15 11 -0,0281 12,4159 0,3332 16 12 0,0148 12,4518 0,4101 17 13 -0,0351 12,6548 0,4748 18 14 -0,0338 12,8447 0,5388 19 15 0,0166 12,8911 0,6107 20 16 -0,0145 12,9264 0,6781 21 17 0,0071 12,9349 0,7405 22 18 -0,0560 13,4729 0,7628 23 19 0,0561 14,0166 0,7827 24 20 0,0102 14,0347 0,8287 25 21 0,0653 14,7831 0,8337 26 22 -0,0353 15,0043 0,8621 27 23 -0,0784 16,1035 0,8508 28 24 -0,0056 16,1091 0,8841 29 25 -0,1043 18,0891 0,8386 30 26 -0,0087 18,1028 0,8720 31 27 -0,0718 19,0571 0,8679
Das kumulative Periodogramm (vgl. Götze [2000], S. 151) wird für [n/2] = 71 Werte be-rechnet und im Einheitsquadrat abgetragen (vgl. Bild 13.2). Der maximale Abstand von der Diagonalen ist bei der Periodogrammordinate 44 zu verzeichnen und beträgt 0,17306. Kriti-sche Werte für einen zweiseitigen Test nach Durbin sind 0,44 für T ~ 80, 0,4 für T ~ 100 und 0,3 für T ~ 200 (siehe Koopman u. A. [2000], S. 183). Danach wird die Nullhypothese (H0: Ein Saisoneinfluss in den Residuen ist nicht vorhanden.) wegen 0,17306 < 0,3 nicht abge-lehnt. Ein entsprechendes Konfidenzband würde das kumulative Periodogramm im Bild 13.2 vollständig einhüllen.
Kapitel 13 95
Bild 13.2 Diagramme zur Residuenanalyse Ein grafische Darstellung des Verlaufs der geschätzten Trend-, Saison- und Restkomponente offeriert das Bild 13.3.
Bild 13.3 Diagramme der Komponenten Durch eine Glättung der Residuen aus der Beobachtungsgleichung und aus der Niveauglei-chung (vgl. Koopman u. A. [2000], S. 60) kann die Wirkung von Ausreißern und Trendbrü-chen auf die Testergebnisse untersucht werden (siehe Tabelle 13.10 und Bild 13.4). Offen-sichtlich wird für die geglätteten Fehler in der Beobachtungsgleichung (IrrRes) die Nullhypo-these auf Normalverteilung nicht mehr durchweg verworfen, da zumindest der Prüfwert bezo-gen auf die Schiefe mit 2,732 unter dem Vergleichswert 3,841 der Chi-Quadratverteilung
1995 2000
0.0
2.5Residual r1
0 10 20 30
0
1Correlogram
Residual r1
0 20 40 60 80
0.25
0.50Pergr Spectrum
-2 0 2 4
0.2
0.4
DensityN(s=0.999)
-2 -1 0 1 2
0.0
2.5
QQ plotnormal
0 20 40 60 80
0.5
1.0Residual CusumPergr2
1990 1995 2000
600
800
1000r1 Trend_r1
1990 1995 2000
-100
0
100 Seas_r1
1990 1995 2000
-50
0
50
100 Irr_r1
96 Kapitel 13
liegt. Die Residuen der Niveaugleichung folgen in allen vier Testverfahren einer Normalver-teilung. Tabelle 13.10 Normality tests for smoothed residuals
Komponente Maßzahl Wert Standard-fehler
Normality test for Sample Size 156 IrrRes Mean -0,000293 Std.Devn. 1,001539 Skewness 0,324155 Excess Kurtosis 1,064985 Minimum -2,974751 Maximum 3,035828 Skewness Chi^2(1) 2,732 0,0984 Kurtosis Chi^2(1) 7,3723 0,0066 Normal-BS Chi^2(2) 10,104 0,0064 Normal-DH Chi^2(2) 8,3612 0,0153
Normality test for Sample Size 156 LvlRes Mean -0,000106 Std.Devn. 0,991810 Skewness -0,167669 Excess Kurtosis 0,408778 Minimum -3,022720 Maximum 2,335930 Skewness Chi^2(1) 0,73093 0,3926 Kurtosis Chi^2(1) 1,08610 0,2973 Normal-BS Chi^2(2) 1,81710 0,4031
Bild 13.4 Diagramme der geglätteten Residuen für Niveau und Trend
1990 1995 2000
-2.5
0.0
2.5IrrRes r1
-4 -2 0 2 4
0.25
0.50
DensityN(s=1)
-2 -1 0 1 2
-2.5
0.0
2.5
QQ plotnormal
1990 1995 2000
-2
0
2LvlRes r1
-4 -3 -2 -1 0 1 2 3
0.2
0.4
DensityN(s=0.992)
-2 -1 0 1 2
-2.5
0.0
2.5QQ plot
normal
Kapitel 13 97
Im Bild 13.5 sind die Vergleichsprognosen für die ersten 7 Monate des Jahres 2003 bezogen auf die Beobachtungen und auf die geschätzten Trend- und Saisonkomponenten aufgeführt.
Bild 13.5 Diagramme zur Vergleichsprognose mit Komponenten Die Fehler der Einschritt-Vergleichsprognosen sind der Tabelle 13.11 zu entnehmen (Spalte Error). Dividiert durch die fortgeschriebene Restvarianz (RMSE) ergeben sich daraus die Re-siduen (Spalte Residual). Deren Summe (Cusum) bzw. deren Quadratsumme (Cusum2) wer-
den jeweils noch einmal abgetestet, um Hinweise auf eine mögliche Fehlspezifikation des Modells zu erhalten (vgl. Koopman u. A. [2000], S. 184 ff.). • Die Summe der Residuen, dividiert durch Wurzel aus 7, folgt approximativ einer Student-
Verteilung mit 156 - 7 Freiheitsgraden. Da der Prüfwert 1,622 unter dem Wert der t-Statistik 1,65 für α = 5% liegt, wird die Nullhypothese (H0: Das ist Modell korrekt spezi-fiziert.) nicht verworfen.
• Die Quadratsumme der Residuen folgt approximativ einer Chi-Quadrat-Verteilung mit 7
Freiheitsgraden. Da der Prüfwert von 27,64 über dem Vergleichswert von χ2(7 ; 0,05) =
14,067 liegt, wird die Nullhypothese (H0: Das Modell ist korrekt spezifiziert.) hiernach verworfen.
Es ergibt sich ferner ein mittlerer quadratischer Fehler relativ zum Mittelwert von 10%. Der Wert erscheint allerdings nicht im Output. Er liegt um 3% höher als beim entsprechenden GARCH-Ansatz in Kapitel 7. Die Vergleichsprognose liegt nicht vollständig im Konfidenzband (vgl. Bild 13.6). Sie bricht im Januar und im Juli aus. Das deutet auf die Nachfragespitzen im Winter und im Hochsom-mer hin.
1997 1998 1999 2000 2001 2002 2003 2004
600
800
1000 F-r1 Forecast
1997 1998 1999 2000 2001 2002 2003 2004
600
800
1000F-r1 F-Trend_r1
1997 1998 1999 2000 2001 2002 2003 2004
-100
0
100F-Seas_r1
98 Kapitel 13
Tabelle 13.11 7 post-sample predictions
Period Error R.m.s.e. Residual Cusum Cusum2
2003.1 93,28 41,02 2,274 2,274 5,172
2003.2 -71,47 41,01 -1,743 0,5317 8,209
2003.3 -78,60 41,01 -1,917 -1,385 11,88
2003.4 21,52 41,01 0,5248 -0,8602 12,16
2003.5 11,65 41,01 0,2842 -0,5759 12,34
2003.6 45,15 41,00 1,101 0,5251 13,45 2003.7 154,5 41,00 3,767 4,293 27,64
Failure Chi2(7) test is 27.6449 [0.0003] Cusum t(7) test is 1.62244 [0.1487]
Bild 13.6 Punkt- und Intervallprognose am aktuellen Rand
1990 1995 2000
600
800
1000r1 Fitted
2003
700
800
900
1000
1100r1 Forecast
Kapitel 14 99
14. Interpretation der empirischen Ergebnisse Nachfolgend werden Strukturgleichungsmodelle für ausgewählte Monatsreihen vorgestellt. Dazu gehören Umsatz- und Absatzreihen des Elektroenergiehandels in Kalifornien und Preis-reihen für Erdöl, Erdgas und Elektroenergie für die USA insgesamt. Daran schließen sich zwei Versuche mit Wochen- und Tagesdaten an. Es handelt sich um die Modellierung einer Wochenreihe zum Margarineabsatz und einer täglichen Preisreihe für Elektroenergie im US Bundesstaat Kalifornien. Den Abschluss bilden Untersuchungen von Tagesreihen für die Labornutzung an der Fach-hochschule Stralsund, die sich bei der GARCH-Modellierung im ersten Teil der Studie als besonders schwierig heraus gestellt haben. 14.1 Analyse des monatlichen Elektroenergiehandels im US-Bundesstaat Kalifornien • Es wurden zunächst nur jene 11 Monatszeitreihen untersucht, bei denen Ausschläge im
Korrelogramm beim Lag 12 und verschiedene Einheitswurzeltests auf saisonale Differen-zen bzw. eine Kombination von saisonalen mit einfachen Differenzen hingewiesen haben (Gruppe 1).
• In einem zweiten Modelllauf wurden solche Reihen untersucht, bei denen beide Einheits-
wurzeltest die Nullhypothese jeweils abgelehnt haben, aber im Korrelogramm Ausschläge beim Saisonlag oder bei Vielfachen des Saisonlags, z. B. beim Lag 24, zu beobachten wa-ren (Gruppe 2).
• Am Schluss wurde auch noch die Reihe R 9 betrachtet, bei der weder die Korrelogramme,
noch das Periodogramm Aufschluss über ein Trend- bzw. Saisonmuster geliefert und da-rüber hinaus beide Einheitswurzeltests die Nullhypothese abgelehnt haben.
Tabelle 14.1 Gruppeneinteilung der untersuchten Zeitreihen
Einheitswurzeltests
Test 1 Test 2
Peaks am Saison-lag 12 in zwei Kennfunktionen1
Differenzen Reihen
j n j (1 – B12) R 1, R 6, R 7, R 10, R 13, R 14
j j j (1 – B)(1 – B12) R 2, R 3, R 5, R 12, R 15
n n j keine R 4, R 8, R 11
n n n keine R 9
In der ersten Gruppe wurde in acht Fällen eine stochastische Saison festgestellt, d.h. die Va-rianz der Saisonkomponenten wurden jeweils als von null verschieden ausgewiesen (vgl. Ta-belle 14.2). Das betraf die Umsatzreihen R1, R2, R3 und R5, sowie die Erlösreihen R12, R13, R14 und R15. Die Absatzreihen hingegen wiesen keine stochastischen Saisonkomponenten auf. Die Saisonvarianzen wurden entsprechend mit null ausgewiesen.
1 Im partiellen Korrelogramm und im Periodogramm
100 Kapitel 14
Das saisonale Bestimmtheitsmaß lag bei den Umsatzreihen zwischen 11,38% und 22,9%, bei den Erlösreihen hingegen nur zwischen 0,55% und 2,99%. Bei den Absatzreihen fiel das sai-sonale Bestimmtheitsmaß wesentlich höher aus und schwankte zwischen 33% und 45%. Ein stochastischer Trend wurde nur bei der Umsatzreihe R2 und der zugehörigen Absatzreihe R 7 festgestellt. Beide Reihen beziehen sich auf den Sektor Handel. Eine Kombination von sto-chastischer Saison mit stochastischem Trend konnte nur einmal ermittelt werden und zwar für die Reihe R2. Die größte Varianz trat bei 9 von 11 Reihen in der Beobachtungsgleichung auf. Eine Ausnahme bildeten die Erlösreihen R12 und R15. Dort trat die höchste Varianz in der Niveau-Gleichung auf. Mit Ausnahme der Reihe R14 lagen die Bestimmtheitsmaße stets deutlich über 80%. Insgesamt ließ sich für die erste Gruppe feststellen: • Es dominierte die stochastische Saison gegenüber dem stochastischen Trend.
• Die höchste Varianz wurde überwiegend in der Beobachtungsgleichung ausgewiesen.
• Die Bestimmtheit lag meist deutlich über 80%. In der zweiten Gruppe traten negative saisonale Bestimmtheitsmaße bei den Reihen R4 und R11 auf. Bei beiden Reihen wurde die höchste Varianz für die Niveaukomponente ausgewie-sen. Bei der Reihe R8 fiel das allgemeine Bestimmtheitsmaß mit 67,5% deutlich ab gegen-über den Vergleichswerten der anderen Reihen. Insgesamt ließ sich für die zweite Gruppe feststellen: • Eine Dominanz der stochastischen Saison gegenüber dem Trend war nicht erkennbar.
• Die höchste Varianz wurde zumeist in der Niveaugleichung ausgewiesen.
• Die verschiedenen Bestimmtheitsmaße lagen unter denen der Gruppe 1. Die dritte Gruppe enthielt mit der Variablen R9 eine Zeitreihe ohne stochastische Saison und ohne stochastischen Trend. Es ergaben sich nur ein sehr niedriges allgemeines Be-stimmtheitsmaß und negative Bestimmtheitsmaße für den Trend und die Saison. Da die höchste Varianz für die Niveaugleichung ausgewiesen wurde, bestand zudem wenig Hoff-nung, durch zusätzlich Strukturgleichungen eine bessere Anpassungsgüte zu erreichen. Ein weitere Erkenntnis bezog sich auf die Einheitswurzeltests: Vorgeschaltete Einheitswurzeltests halfen speziell bei saisonalen Zeitreihen, die Struktur der stochastischen Komponenten zu identifizieren. Wurden die Nullhypothesen der Einheitswur-zeltest abgelehnt, so traten Probleme bei der Modellbildung auf. Die angepassten Struktur-gleichungsmodelle wiesen in solchen Fällen meist besonders niedrige Bestimmtheitsmaße auf.
Kapitel 14 101
102 Kapitel 14
Kapitel 14 103
104 Kapitel 14
14.2 Analyse monatlicher Preise für Rohöl, Erdgas und Elektroenergie in den USA
Die Anpassung von Strukturgleichungsmodellen an die nichtsaisonalen, monatlichen Rohölp-reise führte jeweils auf eine stochastische Niveau- und eine stochastische Trendkomponente. Den Ausgangspunkt bildete ein Einheitswurzeltest, der die Nullhypothese nicht verwerfen konnte. Die höchste Varianz entfiel stets auf die Trendkomponente. Für die Beobachtungs-gleichung jeder Reihe wurde eine verschwindende Restvarianz ausgewiesen. Das allgemeine Bestimmtheitsmaß betrug jeweils mehr als 95%. Die Trendbestimmtheit fiel stets negativ aus (siehe Tabelle 14.4).
Bei der Modellierung von Erdgaspreisen waren drei Fälle zu unterscheiden: • Vier Reihen mit einer einfachen Einheitswurzel. • Eine Reihe mit einer Saisonalen Einheitswurzel. • Eine Reihe ohne Einheitswurzel. Tabelle 14.3 Fallunterscheidung bei den monatlichen Erdgaspreisen
Einheitswurzeltests
Test 1 Test 2
Peaks am Saisonlag in Kennfunktionen2
Differenzen Reihen
j n j (1 – B12) NGWPUUS, NGCGUUS, NGCCUUS, NGINUUS
j - j keine NGRCUUS
n - n keine NGEIUUS
• Die Strukturgleichungsmodelle bestanden im Fall 1 bis auf eine Reihe aus einer Beobach-
tungsgleichung und einer Niveaugleichung. Auf die Niveaukomponente entfiel dabei die höchste Varianz. Das allgemeine Bestimmtheitsmaß betrug mindesten 75%. Die formal mitgeführte Saisonkomponente führte weder eine von 0 verschiedene Varianz noch auf ein positives saisonales Bestimmtheitsmaß (vgl. Tabelle 14.5). Sie kann folglich entfallen. An der Modellspezifikation ändert sich nichts.
• Die Modellierung im Fall 2 führte auf eine stochastische Niveau- und eine stochastische Saisonkomponente. Das allgemeine Bestimmtheitsmaß war mit 97% vergleichsweise hoch und das saisonale Bestimmtheitsmaß fiel positiv aus. Die größte Varianz trat ebenfalls bei der Niveaukomponente auf.
• Im Fall 3 resultierte aus der Modellbildung lediglich eine stochastische Niveaukomponen-te. Das allgemeine Bestimmtheitsmaß grenzte an 90%. Die Trendbestimmtheit hatte einen positiven, die Saisonbestimmtheit folgerichtig einen negativen Wert.
Die Modellbildung für Elektroenergiepreise (vgl. Tabelle 14.6) zeigte deutlich, dass neben den Einheitswurzeltests auch die Kennfunktionen (Korrelogramme, Periodogramm etc.) zu beachten sind. Obwohl von den Einheitswurzeltests die Nullhypothese stets verworfen wurde, machte es eingedenk der Ausschläge in den Korrelogrammen am Saisonlag 12 und der Peaks in den Periodogrammen bei der Frequenz 0,0833 (gleich 1/12) doch Sinn, eine Saisonkompo-nente anzusetzen. Alle vier Reihen wiesen somit eine stochastische Niveau- und ein stochasti-sche Saisonkomponenten auf. Die allgemeinen Bestimmtheitsmaße überstiegen 90%. Die Trendbestimmtheit betrug mindestens 70%. Die Saisonbestimmtheit fiel allerdings überall negativ aus. Das lag an den vergleichsweise sehr niedrigen Saisonvarianzen.
2 Im partiellen Korrelogramm und im Periodogramm
Kapitel 14 105
106 Kapitel 14
Kapitel 14 107
108 Kapitel 14
14.3 Analyse einer Wochen- und einer Tagesreihe Die wöchentliche Absatzreihe eines Margarineproduzenten enthielt keine Einheitswurzel und keine Hinweise auf saisonale Einflüsse. Das Strukturgleichungsmodell bestand aus einer sto-chastischen Beobachtungsgleichung und einer stochastischen Niveaugleichung (vgl. Tabelle 14.7). Die allgemeine Bestimmtheit fiel mäßig aus und lag noch unter der Trendbestimmtheit. Offenbar hätten erklärende Variablen hinzu gezogen werden müssen, um eine bessere Anpas-sungsgüte zu erreichen. Die Stundenzeitreihe USP10 wurde mit Hilfe eines Viergleichungsmodells abgebildet. Zu der Niveau- und der Trendkomponente gesellte sich noch eine zyklische Komponente für den 24-Stunden-Rhythmus hinzu. Der Wochenzyklus konnte wegen seiner Periodenlänge von 168 Stunden in STAMP leider nicht berücksichtigt werden3. Die allgemeine Bestimmtheit erreich-te nicht einmal 30%. Der Hauptteil der Varianz wurde von der Beobachtungsgleichung getra-gen (vgl. Tabelle 14.7). Die schlechten Ergebnisse waren auch vor dem Hintergrund des Ein-heitswurzeltests zu sehen, welche die Nullhypothese jeweils ablehnten. 14.4 Analyse der täglichen Labornutzung am Fachbereich Wirtschaft der FH Stralsund Die tägliche Labornutzung im Haus 21 wurde mit einem Wochenzyklus von 7 Tagen model-liert, der aber nur bei zwei der fünf Reihen als stochastische Komponente ausgewiesen wor-den ist: Beim Labor 3 und beim Übungspool (vgl. Tabelle 14.8). Die allgemeine Bestimmtheit wurde auf diese Weise aber nur für das Labor 3 leicht verbessert. Die Kombinationen aus stochastischer Beobachtungsgleichung und Niveaugleichung führte im Fall von Labor 2 und vom Hauseingang auf Bestimmtheitsmaße von 11% bzw. 23%. Insgesamt dominierte jeweils die Varianz der Beobachtungsgleichung. Im Fall von Labor 1 wurde sogar nur diese Glei-chung im Output ausgewiesen. Offensichtlich konnte ohne weitere erklärende Variablen keine höhere Anpassungsgüte erreicht werden.
3 Das Eingabefeld für die Zyklenlänge nimmt nur zweistellige Werte an.
Kapitel 14 109
110 Kapitel 14
Kapitel 15 111
15. Zur Prognosegüte von Strukturgleichungsmodellen Die Prognosegüte der mit STAMP spezifizierten Strukturgleichungsmodelle wurde mit der Prognosegüte der mit EViews spezifizierten Zweigleichungsmodelle unter Berücksichtigung von GARCH-Residuen verglichen (siehe Tabelle 15.1).
Tabelle 15.1 Fehlervergleich zwischen STAMP und EViews Prognosen
Zeitreihe RMSE% STAMP RMSE% GARCH Vergleich1
R1 9,97 6,83 - R2 6,67 7,09 0 R3 5,18 14,03 + R4 9,56 13,92 + R5 6,75 6,86 0 R6 7,85 7,19 0 R7 5,00 3,78 - R8 6,41 6,80 0 R9 23,13 22,98 0 R10 5,71 4,13 - R11 4,49 4,95 0 R12 5,36 9,44 + R13 7,34 11,49 + R14 24,89 26,73 + R15 4,75 7,45 + CODPUUS 5,82 6,99 + COFMUUS 5,62 6,29 0 COIMUUS 3,17 4,63 + RADMUUS 3,95 4,00 0 RAIMUUS 5,43 7,03 + RACPUUS 5,28 6,70 + NGWPUUS 5,29 5,60 0 NGCGUUS 3,37 4,13 0 NGRCUUS 2,78 2,80 0 NGCCUUS 2,50 3,11 0 NGINUUS 3,98 6,88 + NGEIUUS 7,80 9,01 + ESRCUUS 0,75 1,64 0 ESCMUUS 0,97 1,51 0 ESICUUS 1,74 1,75 0 ESTCUUS 1,46 1,00 0 Labor 1 434,32 354,60 - Labor 2 441,32 611,10 + Labor 3 170,54 208,63 + Pool 70,08 62,03 - Eingang Haus 21 46,04 47,14 + MARW 16,68 18,94 + USP10 37,08 22,12 -
1 - Nachteil STAMP, + Vorteil STAMP, 0 Gleichwertigkeit (Betrag der Fehlerdifferenz kleiner als 1%)
112 Kapitel 15
In der Summe ergaben sich 16 herausragende Prognosen mit Strukturgleichungsmodellen, gegenüber 6 herausragenden Prognosen mit GARCH-Ansätzen. In weiteren 16 Fällen war Gleichwertigkeit festzustellen (absolute Fehlerdifferenz kleiner als 1%). Bei näherer Betrach-tung ergab sich ein sehr differenziertes Bild: • Bei den Umsatzreihen R1 bis R5 dominierten die Strukturgleichungsmodelle zum Teil mit
spektakulären Vorteilen in der Prognosegüte, z.B. bei R3 mit einem Plus von 8,84%. Bei den Absatzreihen R6 bis R10 lagen hingegen die GARCH-Ansätze leicht vorne. Bei den Erlösen R11 bis R15 wiederum dominierten mehrheitlich die Strukturgleichungsmodelle.
• Bei den Rohölreihen waren leichte Vorteile bei den Strukturgleichungsmodellen zu er-
kennen, die sich aber bei den Gasreihen verringerten und bei den Elektroenergiereihen na-hezu verloren.
• Bei den Laborreihen waren die Prognoseergebnisse aus praktischer Sicht gleichermaßen
unbrauchbar. • Bei der Wochenreihe gelang mit STAMP eine leichte Fehlersenkung, die aber praktisch
nicht relevant war. • Bei der exemplarisch untersuchten Stundenreihe für Elektroenergie-Preise in Kalifornien
schnitten die Strukturgleichungsmodelle erheblich schlechter ab. Ein Vergleich der Tages-fehler unterstreicht diese Feststellung (siehe Tabelle 15.2). Bei der gravierenden Fehl-prognose für den Mittwoch ist zu beachten, dass mit STAMP lediglich der Tageszyklus nicht aber der Wochenzyklus erfasst wurde.
Tabelle 15.2 Prognosefehler für stündliche Elektroenergiepreise im US-Staat Kalifornien2
Reihe/Tag Fr Sa So Mo Di Mi Do
USP10/Eviews 23,93 18,24 21,96 35,13 13,23 20,99 13,88
USP10/STAMP 7,99 24,49 52,77 301,45 20,94 27,14 21,16
Insgesamt legt der empirische Vergleich nahe, dass mit Strukturgleichungsmodellen und STAMP zumindest für Monatsreihen mit Trend- und Saisoneinfluss etwas niedrigere Fehler bei der vergleichenden Punktprognose erreichbar sein könnten als mit autoregressiven Model-len und GARCH-Residuen. Die Aussagekraft der Intervallprognosen bleibt dahinter aber er-heblich zurück, da eine zeitvariable Varianz in STAMP nur mit großen modellseitigen Ein-schränkungen realisiert werden kann. Vom analytischen Gesichtspunkt aus birgt der Ansatz mit den Strukturgleichungsmodellen zumindest die Gefahr, dass statistische Untersuchungen an der Zeitreihe im Rahmen der Modellidentifikation nicht gründlich genug durchgeführt werden. Derartige Untersuchungen scheinen angesichts der einfachen Modellstruktur mit Random Walks und einer sehr sparsamen, meist sogar überflüssigen Parametrisierung ver-zichtbar, was sich aber spätestens bei der Interpretation von Ergebnissen als Irrtum heraus stellen dürfte. Ungeeignet scheinen Strukturgleichungsmodelle für die Prognose von Stun-dendaten auf dem Elektroenergiemarkt zu sein. Der interessante Vorschlag zur Modellierung mit Spline-Polynomen (vgl. Harvey u.A. [1993], der sich mit STAMP realisieren lässt, wurde in der Literatur der letzten Jahre nicht mehr erwähnt. Die typischen Anwendungen liegen meist im Bereich von Monats- und Quartalsdaten (vgl. Proietti [2004]). In den letzten Jahren sind im Bereich der Forschung aber auch Untersuchungen von Tagesreihen aus dem Bereich der Steuereinnahmen von Kommunen durchgeführt worden (vgl. Koopman [2004]).
2 25.7. bis 31.7.2003
Kapitel 16 113
16. Einführung in das Programmpaket STAMP Das Programmsystem STAMP ist unter der Federführung von A. C. Harvey am Ende der achtziger Jahre an der London School entwickelt und seither systematisch erweitert worden. Die jüngste Kreation besteht in der Oberfläche GiveWin zur empirischen Modellierung, an der u.a. D. Hendry mitgewirkt hat. Beide Programme werden im Paket von der Firma Timberlake Consultants Ltd. in London vertrieben, die auch weitere Angebote, wie z.B. Da-tenbestände und Schulungen zu den Programmen und Methoden offeriert. 16.1 Schrittfolge der Dateneingabe und Elemente der Datenmanipulation mit GiveWin • Definieren einer neuen Datenbasis. • Festlegen der Periodisierung, der ersten und letzten Periode. • Import der Spalten aus einem EXCEL-Tableau. • Korrektur der Spaltenbezeichner. • Umrechnung auf neue Einheiten. • Abspeichern der Datenbasis name.in7.
Bild 16.1 Vorbereitung der Dateneingabe in GiveWin Eine Tabelle für Tages- oder Stundendaten wird über die Spezifikation Other 1 mit Beobach-tung 1 (anstelle des Startjahres) und Beobachtung n (anstelle des Endjahres) aufgebaut.
114 Kapitel 16
Bild 16.2 Abschließen der Dateneingabe in GiveWin
Modellierung
Bild 16.3 Datenmanipulation mit GiveWin
Die Umrechnungsvorschriften im Un-termenü Algebra Code sind jeweils mit einem Semikolon abzuschließen. Ein Überspeichern der Variablen ist möglich.
Kapitel 16 115
16.2 Grafische Datenauswertung mit GiveWin Zur grafischen Datenanalyse werden im Menüpunkt Graphics eine oder mehrere Variablen geladen und dann über Next: choose graph aus einem Angebot von 8 Untermenüs mit jeweils mehreren Angeboten ein passender Grafikset zusammen gestellt und unter name.emf abge-speichert (vgl. Bild 16.4 und Bild 16.5).
Bild 16.4 Grafische Datenanalyse in GiveWin
Bild 16.5 Grafikoutput für eine Zeitreihe Zu einzelnen Darstellungen werden auch noch Untermenüs über die Option Next angeboten. So kann z.B. beim Q-Q-Plot zwischen einer Chi-Quadrat-Verteilung, einer F-Verteilung, ei-ner Normalverteilung, einer t-Verteilung und einer Gleichverteilung gewählt werden.
1990 1995 2000
500
750
1000 r1
5 10
500
750
1000 r1
1990 1995 2000
6.25
6.50
6.75
7.00Lr1
1990 1995 2000
-200
0
200 Dr1
500 750 1000
0.001
0.002
0.003
0.004Density
r1
500 750 1000
50
100
150
r1
500
750
1000
r1
0 5 10
0.5
1.0ACF-r1
0 5 10
0
1PACF-r1
0.0 0.5 1.0
0.25
0.50
Spectral densityr1
0.0 0.5 1.0
10000
20000
30000
Periodogramr1
400 600 800
500
750
1000
QQ plotr1 × normal
116 Kapitel 16
16.3 Schrittfolge der Modellbildung und Prognose mit STAMP • Aktivieren des Tools STAMP in der Oberfläche von GiveWin. • Formulieren des Modells im Untermenü Model von STAMP. • Laden der abhängigen und unabhängigen Variablen mit Doppelklick. • Auswahl der Komponenten. • Wahl der Schätzmethode und abschneiden von Vergleichswerten am aktuellen Rand. • Ausgabe des Standardoutputs. • Ausgabe des erweiterter Output (Zustandsraummodell und Regressionsstatistik). • Ausgabe von Text und Bild zu den Teststatistiken für die Residuen. • Ausgabe von Text und Bild zu den Teststatistiken für die geglättete Residuen. • Ausgabe von Text und Bild für die Vergleichsprognose. • Ausgabe von Text und Bild für die Prognose. Bild 16.6 Aktivieren von STAMP und Vorbereitung der Modellspezifikation Die Texte werden unter „name.out“ und die Grafiken unter „name.emf“ abgespeichert.
Kapitel 16 117
Doppelklick auf die Variable in der Daten-basis und Einstellen der maximalen Zeit-verzögerung im Mo-dell.
Auswahl der Zustands-gleichungen und des Typs der Modellbildung in je-der Gleichung. Es können nur Zyklen mit einer zweistelligen Perio-denanzahl betrachtet wer-den (Eingabefeld: Period).
Abtrennen von 7 Werten am aktuellen Rand (Feld: Less Forecast) und Auswahl der Schätzroutine.
Bild 16.7 Auswahl der Variablen
Bild 16.8 Auswahl der Komponenten
Bild 16.9 Auswahl der Schätz-methode
118 Kapitel 16
Erweiterte Auswahl von Test-statistiken für die Residuen der Beobachtungsgleichung.
Auswertung der geglätteten Residualstatistiken der ein-zelnen Zustandsgleichun-gen.
Bild 16.10 Erweiterte Ausgabe
Bild 16.11 Residuenanalyse Teil 1
Bild 16.12 Residuenanalyse Teil 2
Kapitel 16 119
17. Paketvergleich von STAMP/GiveWin mit EViews 5.0 Der nachfolgende Vergleich wird den beiden Paketen insofern nicht gerecht, als dass unter der Oberfläche von GiveWin neben STAMP zahlreiche andere Programmsysteme, wie z. B. TSP, vertrieben werden, die eine erhebliche methodische Erweiterung zulassen. Diese Pro-gramme können je nach Bedarf hinzu gekauft werden. Sie standen aber für die vorliegende Untersuchung nicht zur Verfügung. Aber auch mit dieser Einschränkung vermittelt die an-schließende Tabelle 17.1 einen mehr als informativen Einblick in Stärken und Schwächen beider Systeme, die sich jeweils einer großen Marktnachfrage erfreuen.
Einstellung des Modus der Vergleichsprognose und der Fehlerausgabe.
Bild 16.13 Prognose Teil 1
Bild 16.14 Prognose Teil 2
Grafische und tabellari-sche Ausgabe von Prog-nosen, incl. Rückrechnung von Transformationen.
120 Kapitel 17
Tabelle 17.1 Stärken-Schwächen-Vergleich EViews 5.0 versus GiveWin/STAMP 6
Merkmal EViews 5.0 GiveWin/STAMP 6
Datenimport
Schnittstellen
Periodisierung
Excel, Lotus, DB, DRI
Jahres- bis Tagesdaten
Excel, Lotus, ASCII, Gauss, Stata Jahres- bis Tagesdaten
Datenvorbehandlung
Lücken
Histogramm
Maßzahlen
Box-Plot
Verteilungsplot
Sampelfunktion
4 Saisonbereinigungsverfahren
Exponentielle Glättung
Filtertechniken
Simulation
7 Zeitreihendarstellungen
7 grafische Transformationen (ln, Diff. etc.)
5 Kennfunktionen (acf, pacf, ccf, sdf, pg)
6 Verteilungsplots
3 Q-Q-Plots für 5 verschie-dene Verteilungen
Box-Plot
6 Scatterplots
5 3D-Plots
Box-Cox-Transformation
Hodrick-Prescott Filter
Tabellenanzeigen
Modellidentifikation
Lücken
3 Einstichprobentests
3 Zweistichprobentests
6 Unit-Root-Tests
acf, pacf, ccf
Differenzen
Verteilungstests, incl. QQ-Plot
2 Cointegrationstests
Periodogramm fehlt
Grafische Datenanalyse mit-tels Kennfunktionen
Testverfahren und Tabellen fehlen
Kapitel 17 121
Tabelle 17.1 Stärken-Schwächen-Vergleich EViews 5.0 versus GiveWin/STAMP 6 (Fort-setzung)
1 Das Verfahren ist nur über mehrere Transformationen realisierbar und beruht auf einer heuristischen Annah-
men für zwei Parameter. Es wird vorbereitet durch eine logarithmische Transformation der Quadrate der Be-obachtungen im Menü Transformationen ((Stochastic volatility).
2 Maximum Likelihood Schätzung mit Maximierungskontrolle. Geschätzte Parameter können verändert und die Schätzung neu gestartet werden
Merkmal EViews 5.0 GiveWin/STAMP 6
Methodenangebot univariat
Lücken
ARMA-Modelle
GARCH-Modelle und Derivate
Ausschlussmöglichkeit von Zwischenwerten
Fraktional integrierte Modelle fehlen
Strukturgleichungsmodelle
Incl. Niveau, Trend, Sai-son, drei Zyklen, Autore-gression erster Ordnung und Interventionen
AR-Modelle
GARCH(1, 1)- Modell1
Zyklen mit dreistelliger Periodenanzahl
Allg. GARCH-Modelle
Methodenangebot multivariat Mehrgleichungsmodelle mit definierbarer Struktur
Vektorautoregression
Mehrgleichungsmodelle mit vorgegebener Struktur und Lags in der endogenen Variablen
Modellschätzung für kardinale Da-ten
Modellschätzung für diskrete Daten
Lücke
OLS, MLS, TSLS, GMM, GARCH
BINARY, ORDERED, CENSORED, COUNT
OLS, MLS, MLSC2, MLS mit vorgegebenen Parame-terbereichen
Modelle für diskrete Daten
Automatische Modellgenerierung nein nein
122 Kapitel 17
Tabelle 17.1 Stärken-Schwächen-Vergleich EViews 5.0 versus versus GiveWin/STAMP 6 (Fortsetzung)
Merkmal EViews 5.0 GiveWin/STAMP 6
Modellüberprüfung
Lücken
4 Testverfahren für Pa-rameter, z.B. Konfidenz-Ellipse, Likelihood-Ratio-Test
6 Testverfahren für Resi-duen, z.B. ARCH-LM-Test, Verteilungstest, serielle Korrelation
Histogramm, acf, pacf, acf der Quadrate,
4 Stabilitätstests, z. B. Chow Breakpoint Test Kumuliertes Periodogramm fehlt
5 Testverfahren für Resi-duen, z.B. Verteilungs-test, Heteroskedastie, se-rielle Korrelation, kumu-latives Periodogramm QQ-Plot, Histogramm, acf und Spektrum der Re-siduen und der geglätte-ten Residuen
Parametertests fehlen
Vergleichsprognose
Lücken
Einschritt- und Mehr-schritt-Modus
Diverse Fehlermaße RMSE% fehlt
Einschritt- und Mehr-schritt-Modus
2 Stabilitätstests Keine globalen Fehler-maße
Qualität der Grafiken
Nachberarbeitung
Exportfilter
6 Grafiktypen
Grafikeditor
3 Ausgabeformate
1 Grafiktyp
Grafikeditor
4 Ausgabeformate
Qualität der Tabellen gut Nachberarbeitung nötig
Übersichtlichkeit der Menüs gut bis sehr gut gut bis sehr gut
Trennung von Modellen und Daten definierbar vorgegeben
Programmierung Kommandosprache Kommandosprache
Preis
Lücke
895 Dollar Version 4.0
245 Dollar Upgrade auf 5.0
Studenten-Version
850 Dollar Version 6.0
275 Euro Upgrade von Version 5.0
Literaturverzeichnis 123
Verwendete Literatur- und Datenquellen (Stand 6/06) Bienwald, B.; Steinhurst, W.; White, D.; Roschelle, A.: A Comparison of Wholesale Power Costs in the PJM Market to Indexed Generation Service Costs, Synapse Energy Economics, Cambridge, 3.6.2004 Boero G.; Marrocu, E.: The performance of SETAR models: a regime conditional evaluation of point, interval and density forecasts, Int. Journal of Forecasting, 20(2004), 305-320 Brockwell, P. J.; Davis, R. A.: Introduction to Time Series and Forecasting, Springer Verlag 2002 California ISO, 2004 Summer Assessment California ISO, Market Analysis Report for July and August 2004 California ISO, Market Analysis Report for September 2004 Carnero, A.; Koopman, S. J.; Ooms, M.: Periodic heteroskedastic RegARFIMA models for daily electricity prices, Technical Report 03-071/4, Tinbergen Institute, Amsterdam, 2003 Caporale, G. M., Ntantamis, Ch.; Pantelidis, Th.; Pittis, N.: The BDS Test as a Test for the Adequacy of a GARCH(1,1) Specification: A Monte Carlo Study, Journal of Financial Econometrics 32(2005), S. 282-309 Clements, M. P.; Franses, H. P.; Swanson, N. R.: Forecasting economic and financial time-series with non-linear models, Int. Journal of Forecasting, 20(2004), 169-183 Conejo, A. C.; Plazas, M. A.; Espinola, R.; Molina, A. B.: Day-Ahead Electricity Price Fore-casting Using the Wavelet Transform and ARIMA Models, IEEE Trans. On Power Systems, 20(2005)2, S. 1034- 1042 Contreras, J.; Espinola, R.; Nogales, F. J.; Conejo, A. J.: ARIMA Models to predict Next-Day Electricity Prices, IEEE Trans. On Power Systems, 18(2002)3, 1014-1020 DeLurgio, A. St.: Forecasting Principles and Applications, Mc Graw-Hill 1998 Doornik, J. A.; Hendry, D. H.: GiveWin- an interface to empirical modelling, TCL 2001 Dube, St.: Visualisierung und Analyse des liberalisierten Elektrizitätsmarktes der USA, Dip-lomarbeit, FH Stralsund, 2006 Edel, K.; Schäffer, K.-A.; Stier, W.: Analyse saisonaler Zeitreihen, Physica-Verlag, 1997 Energy Information Administration (EIA): Annual Energy Outlook 2004 Energy Information Administration (EIA): National Energy Modeling System, 4.3.2003 Espinoza, M.; Joye, C.; Belmans, R.: Short –Term Load Forecasting, Profile Identification, and Customer Segmentation: A Methodology Based on Periodic Time Series, IEEE Trans. On Power Systems, 20(2005)3, S. 1622-1631 EViews 5 User’s Guide, 9.3.2004 Fernandez, R.: NYISO Monthly Report, New York, August 2004 Figueiredo, V.; Rodrigues, F.; Vale, Z.: An Electric Energy Consumer Characterization Framework Based on Data Mining Techniques, IEEE Trans. On Power Systems 20(2005)2, S. 596-602 Garcia, R. C.; Contreras, J.; van Akkeren, M.; Garcia, J. B. C.: A Garch Forecasting Model to Predict Day-Ahead Electricity Prices; Paper, Workshop of Applied Infrastructure, TU Ber-lin, 11.10. 2003 (wip.tu-berlin.de/workshop/2003/papers, accepted by IEEE Trans. Power Systems 2005) Garcia, R.; Contreras, J.; van Akkeren, M.; Garcia, J. B. C.: A GARCH Forecasting Model to Predict Day-Ahead Electricity Prices, IEEE Trans. On Power Systems, 20(2005)2, S. 867- 874 Götze, W.: Vorhersageorientierte Modellwahl zur Vorausberechnung von Zeitreihen aus Le-bensmittelkombinaten, Messen Steuern Regeln 34(1991)4, S.267-271 Götze, W.: Specification and Forecasting Basic Structural Time Series Models, Wissenschaft-liche Zeitschrift der Humboldt-Universität, Geistes- und Sozialwissenschaften, 2/1992, S.31-44 Götze, W.: Techniken des Business Forecasting, Oldenbourg Verlag 2000
124 Literaturverzeichnis
Götze, W.; Deutschmann, C.; Link, H.: Statistik, Oldenbourg Verlag 2002 Götze, W.: Modellierung des Personaleinsatzes auf dem Flughafen Helsinki-Vantaa mit Hilfe von ARMA-Prozessen, wiss. Schriftenreihe der FH Stralsund, Heft 3, 2004, S. 45-54 Granger, C., W., J.: Forecasting Business and Economics, 2. Edition, Academic Press, 1989 Green, W. H.: Econometric Analysis, Prentice Hall International Inc., 2000 Guirguis, H. S.; Felder, F. A.: Further Advances in Forecasting Day-Ahead Electricity Prices Using Time Series Models, KIEE Int. Trans. On PE, 4-A(2004)3, 159-166 Gunnarshaug, J.; Ellerman, D.: Natural Gas Pricing in the Northeastern U.S., CEEPR MIT, 1998, web.mit.edu/ceepr/www/98012.pdf Harvey, A. C.: Forecasting structural time series models and the Kalman filter, Cambridge University Press 1990 Harvey, A. C.; Koopman, S. J.: Forecasting hourly electricity demand using time-varying splines, Journal of the American Statistical Association 88 (1993), S. 1228-1237. Hinz, J.: Modeling day-ahead electricity prices, Paper, TU Dresden 11.5.2003 Hor, C.: Analyzing the Impact of Weather Variables on Monthly Electricity Demand, IEEE Trans. On Power Systems 20(2005)4, S. 2078-2085 IEA: Key World Energy Statistics 2004 IEA: Energy Statistics Manual 2004 Koopman, S. J.; Harvey, A. C.; Doornik, J. A.; Shephard, N.: Stamp – Structural time series analyser, modeller and predictor, TCL 2000 Koopman, S. J.; Ooms, M.: Time Series Modelling of daily tax revenues, Statistica Neer-landica 57(2003), 439-469. Koopman, S. J.; Ooms, M.: Forecasting daily time series using periodic unobserved compo-nents time series models, paper 2. OxMetrics User Conference, Cass Business Scholl, Lon-don, 26.-27.8.2004 Küsters, U.: Evaluation, Kombination und Auswahl betriebswirtschaftlicher Prognoseverfahren, Paper 46. Sitzung der AG Prognoseverfahren der GOR, 1.-2-.4 2004, Eltville Makridakis, S.; Hibon, M.: The M3-Competition: results, conclusions and implications, Int. Journal of Forecasting 16(2000), 451-476 MateoGonzales, A.; MunozsanRoque, A.; Garcia-Gonzales, J.: Modeling and Forecasting Electricity Prices with Input/Output Hidden Markov Models, IEEE Trans. On Power Systems, 20(2005)1, 13-24 Nogales, F. J.; Contreras, J.; Conejo, A. J.; Espinola, R.: Forecasting Next-Day Electricity Prices by Time Series Models, IEEE Trans. On Power Systems, 17(2002)2, 342-348 New York Independent System Operator (NYISO), Annual Report 2002 New York Independent System Operator (NYISO), Annual Report 2003 Operator del Mercado Iberico de Energia-Polo Espanol (OMEL), Annual Report 2003 Rodriguez, C. P.; Anders, G. J.: Energy price forecasting in the Ontario competitive power system market, IEEE Trans. On Power Systems, 19(2004)1, 366-374 Proietti, T.: Seasonal Specific Structural Time Series, Studies in Nonlinear Dynamics and Econometrics 8(2), Article 16, 2004, http://www.bepress.com/snde/vol8/iss2/art16. Reynolds, J. M.: PJM Load Forecast Report – Supplemental Tables, 28.4.2004 Ryan, D. W.: A Comparison of Natural Gas Spot Price Linear Regression Forecasting Models, Thesis, 6.5.2001, Polytechnic Institute of the Virginia State University, http://scholar.lib.vt.edu/theses Schlittgen, R.; Streitberg, B. H. J.: Zeitreihenanalyse, Oldenbourg Verlag, 6. Auflage 1995 Serletis, A.; Shahmoradi, A.: Business Cycles and Natural Gas Prices, Discussion paper 2004-19, University of Calgary Canada, http://www.econ.ucalgary.ca/research Soares, L. J.; Medeiros, M. C.: Modeling and forecasting short-term electric load demand: a two step methodology, Discussion Paper Nr. 495 2005 (www.econ.puc-rio.br)
Literaturverzeichnis 125
Soares, L. J.; Souza, L. R.: Forecasting electricity demand using generalized long memory, Int. Journal of Forecasting, 22(2006)1, S. 17-28 Suenaga, H.; Williams, J.: The Natural Number of Forward Markets for Electricity, Paper, University of California, 19.5.2004 (http://www.ucei.berkeley.edu/ucei/conf 2004) Taylor, J. W.: Volatility forecasting with smooth transition exponential smoothing, Int. Jour-nal of Forecasting 20(2004), 273-286 Taylor, J. W.; de Menezes, L. M.; McSharry, P. E.: A comparison of univariate methods for forecasting electricity demand up to a day ahead, Study 2005 Taylor, J. W.; de Menezes, L. M.; McSharry, P. E.: A comparison of univariate methods for forecasting electricity demand up to a day ahead, Int. Journal of Forecasting, 22(2006)1, S. 1-16 Yaffe, R.: Structural Time Series Modeling with SAS Proc UCM and STAMP, New York University, Spring 2003 Edition, http:// www.nyu.edu/its/pubs/connect/spring03. Daten-Quellen Energiedaten Spanien (http://www.omel.es) Energiedaten der USA (www.eia.doe.gov) Energiedaten des US-Staates New York (www.nyiso.com) Energiedaten des US-Staates Kalifornien (www.caiso.com) Finanzmarktdaten (www.markt-daten.de) Energiedaten der OECD (www.iea.org) Historische Daten (www.turtletrader.com) Jahresdaten zum Energieverbrauch (www.economagic.com/em-cgi/data.exe) Sonstige Quellen American Petroleum Institute (http://api-ep.api.org/economics) DRI/McGraw-Hill Data Files (http://www.lib.uconn.edu/online/databases) Energy Dictionary (http://www.energyvortex.com/energydictionary) Data and Reports of ISO New England, 17.1.2005 (http://www.iso-ne.com) Morgan Energy Market Information (www.morganenergy.com) PJM Manual 11: Scheduling Operations, 19.10.04 (http://www.pjm.com) PJM Territory Served, 27.12.04 (http://www.pjm.com/about/territory-served.html) PJM Energiedaten(pjm.com/markets/jsp/lmp.jsp) Strombörse (http://bgs-aution.com) University of California Energy Institute (http://www.ucei.berkeley.edu/datamine/datamine.htm) University of Washington (http://www.faculty.washington.edu/ezivot/econ584/notes/nonlinear.pdf) US Department of Energy, Office of Fossil Energy (http://www.fe.doe.gov) US Energy Information Administration (http://www.eia.doe.gov/eneaf/electricity/epa/epa_sprdshts.html) XploRe e-books HU-Wiwifak (http://www.quantlet.de/scripts/sfm/html) Energiedaten Ontario (www.ieso.ca) Energiedaten EU (www.eex.de) Abkürzungen ACF Autocorrelation Function AECO Atlantic Electric Company
126 Literaturverzeichnis
AEP American Electric Power Company Inc. AIC Akaike Information Criterium API American Petroleum Institute APS Allegheny Power Systems ARIMA Autoregressive Integrated Moving Average ARFIMA Autoregressive Fractional Integrated Moving Average BDS Test auf Fehlspezifikation eines GARCH-Modells BGE Baltimore Gas & Electric Company CAISO California Independent System Operator COMED Commonwealth Edison Company DACD Day Ahead Cleared Demand DAY Dayton Power & Light Company DOM Dominion DPL Delmarva Power & Light Company DUQ Duquesne Light EIA Energy Information Administration USA ERCT Electric Reliability Council of Texas FERC Federal Energy Regulatory Commission ERCOD Electric Reliability Council of Texas GARCH Generalized Autoregressive Conditional Heteroscedasticity GIS Geographisches Informationssystem ICAO International Civil Aviation Organisation IEA International Energy Agency OECD und EUROSTAT JCPL Jersey Central Power & Light Company KwH Kilowatt per Hour LM Test auf nichtlineare Strukturen im AR-Modell LMP Locational Marginal Price MAPE Mean Absolute Percent Error MAX Maximum Error METED Metropolitan Edison Company MLC Marginal Loss Component MwH Megawatt per Hour MW-ISO Midwest Independent System Operator NE-ISO New England Independent System Operator NYISO New York Independent System Operator OMEL Operator del Mercado Iberico de Energia-Polo Espanol PACF Partial Autocorrelation Function PECO Philadelphia Electric Company PENELEC Pennsylvania Electric Company PEPCO Potomac Electric Power Company PJM Pennsylvania-New Jersey-Maryland PPL Pennsylvania Power & Light Electric Ulitities PSEG Public Service Electric & Gas Company PURPA Public Utility Regulatory Policies Act RECO Rockland Electric Company RCP Regulation Clearing Price RMSE Root Mean Square Error RTO Regional Transmission Organization SBC Schwartz-Bayes Criterium UTM Universal Transverse Mercator WGS World Geodetic System
Bilder- und Tabellenverzeichnis 127
Bilder Bild 3.1 Modellspezifikation für multipliktive ARIMA-Modelle ................................. 8 Bild 3.2 Spezifikation eines autoregressiven (integrierten) Modells mit stochastischen Regressoren .............................................................................. 9 Bild 3.3 Erweiterung eines autoregressiven (integrierten) Modells durch ein GARCH-Modell ............................................................................... 10 Bild 5.1 Zeitreihe ESP (Preis Cent pro kWh für Spanien) ............................................. 17 Bild 5.2 Frequenzzerlegung der Varianz mit Peaks bei 0,00594 = 1/168 und 0,04167 = 1/24 .................................................................................................. 18 Bild 5.3 Frequenzzerlegung der Varianz (geglättet) ...................................................... 18 Bild 5.4 Parameter und Verteilung der GARCH-Residuen ........................................... 25 Bild 5.5 Einschrittprognose mit dem GARCH-Modell für eine Woche ........................ 26 Bild 5.6 Einschrittprognose mit dem autoregressiven Modell für eine Woche ............. 28 Bild 5.7 Vergleich der Einschrittprognose (GARCH) mit den Ist-Werten .................... 28 Bild 6.1 EE-Nachfrage in New England vom 1.11.2004 bis zum 10.1.2005 ................ 30 Bild 6.2 Prognose der EE-Nachfrage in New England vom 11.1. bis 17.1.2005 .......... 31 Bild 6.3 Entwicklung des Goldpreises vom 2.1.97 bis zum 31.8.04 ............................. 35 Bild 6.4 Prognose des Goldpreises vom 1.9.04 bis zum 20.10.04 ................................. 36 Bild 6.5 Häufigkeit des Eintretens in Haus 21 (FB Wirtschaft) vom 1.9.01 bis zum 31.12.01 .............................................................................................. 39 Bild 6.6 Intervall- und Varianzprognose für das Eintretens in Haus 21 (FB Wirtschaft) vom bis zum 25.12. bis 31.12.01 ........................................... 40 Bild 6.7 Elektroenergieumsatz in Kalifornien (anderweitige Sektoren in TDollar) 1/90-12/02 ........................................................................................................ 44 Bild 6.8 Intervallprognose und Varianzprognose für den Elektroenergieumsatz in Kalifornien (anderweitige Sektoren in TDollar) vom 1.1.2003 bis zum 30.7.2003 ............................................................................................ 45 Bild 6.9 Erdgaspreis für US-Haushalte im Zeitraum 1/82 – 12/02 ............................... 50 Bild 6.10 Intervall- und Varianzprognose zum Beispiel Erdgaspreise für US-Haushalte von Januar bis Juli 2004 ............................................................ 51 Bild 6.11 Wöchentlicher Margarineabsatz über drei Jahre .............................................. 55 Bild 6.12 Intervall- und Varianzprognose zum Beispiel Margarineabsatz für 3 Wochen .................................................................................................... 56 Bild 8.1 Einrichten eines Workfiles für den Datenimport ............................................. 60 Bild 8.2 Einstellung der Periodisierung für nicht vordefinierte Intervalle ..................... 61 Bild 8.3 Datenimport aus einer Excel-Datei .................................................................. 61 Bild 8.4 Deskriptive Auswertung der Zeitreihendaten ................................................... 62 Bild 8.5 Einstellung eines Einheitswurzeltests nach Phillips Perron ............................. 62 Bild 8.6 Objektspezifikation .......................................................................................... 63 Bild 8.7 Anlegen einer Modellgleichung ...................................................................... 63 Bild 8.8 Ausfüllen der Modellgleichung und Vorbereitung der Schätzung ................... 63 Bild 8.9 Aufbau eines ARIMA-Modells (1,1,1)(0,1,0)12 mit Absolutglied und logarithmischer Transformation der Daten ...................................................... 64 Bild 8.10 Abtesten der Modellresiduen ............................................................................ 65 Bild 8.11 Einstellen des Prognosealgorithmus ................................................................. 65 Bild 8.12 Rückrechnung der Transformationen bei der Prognose eines ARIMA-Modells .............................................................................................. 66
128 Bilder- und Tabellenverzeichnis
Bild 9.1 Zeitreihendiagramm Kalifornien ...................................................................... 70 Bild 9.2 Periodogramm Kalifornien ............................................................................... 71 Bild 9.3 Histogramm Kalifornien ................................................................................... 71 Bild 9.4 QQ-Plot Kalifornien ......................................................................................... 72 Bild 9.5 Parametereinstellung für ein ARMA-Modell ................................................... 72 Bild 9.6 Output eines AR(1)-Modells ............................................................................ 73 Bild 9.7 Korrelogramme der Daten (grün) und des AR-Modells (rot) .......................... 73 Bild 9.8 Parametereinstellung für ein GARCH-Modell ................................................. 74 Bild 9.9 Output eines geschätzten GARCH(1, 1)-Modells ............................................ 74 Bild 9.10 Residuenplot eines GARCH(1, 1)-Modells ...................................................... 75 Bild 9.11 Autokorrelationen von εt und ε2
t aus dem AR(1)-Prozess ............................. 75 Bild 9.12 QQ-Plot von Residuen eines GARCH(1, 1)-Modells ...................................... 76 Bild 9.13 Residuentests für ein GARCH(1, 1)-Modell .................................................... 76 Bild 9.14 Volatilitätsplot eines GARCH(1, 1)-Modells ................................................... 77 Bild 9.15 Exportfenster für ein Zeitreihenmodell ............................................................ 77 Bild 11.1 Modellspezifikation für stochastische Komponentenmodelle ......................... 84 Bild 13.1 Monatlicher Umsatz von Elektroenergie im Sektor Haushalte (Reihe R1) ..... 86 Bild 13.2 Diagramme zur Residuenanalyse ..................................................................... 92 Bild 13.3 Diagramme der Komponenten ......................................................................... 92 Bild 13.4 Diagramme der geglätteten Residuen für Niveau und Trend ........................... 93 Bild 13.5 Diagramme zur Vergleichsprognose mit Komponenten .................................. 94 Bild 13.6 Punkt- und Intervallprognose am aktuellen Rand ............................................ 95 Bild 16.1 Vorbereitung der Dateneingabe in GiveWin .................................................... 110 Bild 16.2 Abschließen der Dateneingabe in GiveWin ..................................................... 111 Bild 16.3 Datenmanipulation mit GiveWin ..................................................................... 111 Bild 16.4 Grafische Datenanalyse in GiveWin ................................................................ 112 Bild 16.5 Grafikoutput für eine Zeitreihe ......................................................................... 112 Bild 16.6 Aktivieren von STAMP und Vorbereitung der Modellspezifikation ............... 113 Bild 16.7 Auswahl der Variablen ..................................................................................... 114 Bild 16.8 Auswahl der Komponenten .............................................................................. 114 Bild 16.9 Auswahl der Schätzmethode ............................................................................ 114 Bild 16.10 Erweiterte Ausgabe ......................................................................................... 115 Bild 16.11 Residuenanalyse Teil 1 ..................................................................................... 115 Bild 16.12 Residuenanlyse Teil 2 ...................................................................................... 115 Bild 16.13 Prognose Teil 1 ................................................................................................. 116 Bild 16.14 Prognose Teil 2 ................................................................................................. 116 Bild A1 Programmentwurf in der EViews-Umgebung .................................................. 137 Bild A2 Quellcode und Run-Option .............................................................................. 137 Bild A3 Vorbereitung des Programmstarts .................................................................... 138 Bild A4 Ablage von Outputdateien in einem Workfile von EViews ............................. 138 Bild A5 Vergleichsprognose und Ist-Werte mit dynamischen Konfidenzintervallen ... 139 Bild A7 Ausgabe positiver und negativer Prognosefehler ............................................. 139
Bilder- und Tabellenverzeichnis 129
Tabellen Tabelle 1.1 Beispiele für Zeitreihen mit zeitvariabler Varianz ...................................... 2 Tabelle 4.1 Durchschnittpreise für Elektroenergie pro Stunde in den USA und Spanien ................................................................................................. 12 Tabelle 4.2 Ausgewählte Finanzmarkt- und sonstige Daten .......................................... 13 Tabelle 4.3 Labornutzung im Fachbereich Wirtschaft der FH Stralsund ....................... 13 Tabelle 4.4 Monatliches Energiegeschäft im US-Bundesstaat Kalifornien ................... 14 Tabelle 4.5 Rohölpreise in den USA .............................................................................. 15 Tabelle 4.6 Erdgaspreise in den USA ............................................................................. 15 Tabelle 4.7 Preise für Elektroenergie in den USA ......................................................... 16 Tabelle 5.1 Einheitswurzeltest nach Dickey-Fuller ........................................................ 19 Tabelle 5.2 Einheitswurzeltest nach Phillips-Perron ...................................................... 19 Tabelle 5.3 Schätzung des autoregressiven Modells ...................................................... 20 Tabelle 5.4 Korrelogramme der quadrierten Residuen des autoregressiven Modells .... 21 Tabelle 5.5 Schätzung des GARCH-Modells ................................................................. 22 Tabelle 5.6 Korrelogramm der GARCH-Residuen ........................................................ 24 Tabelle 5.7 LM-Test ....................................................................................................... 25 Tabelle 5.8 Vergleich von Einschritt-Prognosefehlern .................................................. 27 Tabelle 6.1 Vergleich von Streumaßen für Stundenreihen ............................................. 30 Tabelle 6.2 Modellschätzung für die EE-Nachfrage in New England ........................... 31 Tabelle 6.3 Analyse- und Prognoseergebnisse für stündliche Energiepreise in den USA und Spanien .................................................................................. 32 Tabelle 6.4 Modellschätzung zur Reihe Goldpreis in Dollar ......................................... 36 Tabelle 6.5 Analyse- und Prognoseergebnisse für tägliche Finanzmarktdaten .............. 37 Tabelle 6.6 Modellschätzung zum Eintrittsverhalten in Haus 21 ................................... 39 Tabelle 6.7 Analyse- und Prognoseergebnisse für die stündliche Labornutzung im Haus 21 ........................................................................................................ 41 Tabelle 6.8 Analyse- und Prognoseergebnisse für die tägliche Labornutzung im Haus 21 ........................................................................................................ 42 Tabelle 6.9 Parameteranzahl p im Zweigleichungsmodell (ZGM) und im Eingleichungsmodell (EGM) ....................................................................... 43 Tabelle 6.10 Ergebnisse der Modellschätzung zum Elektroenergieumsatz in Kalifornien ................................................................................................... 45 Tabelle 6.11 Analyse- und Prognoseergebnisse für den monatlichen Elektroenergie- umsatz und -absatz in Kalifornien ............................................................... 46 Tabelle 6.12 Ergebnisse der Modellschätzung zum Beispiel Erdgaspreis US-Haushalte ............................................................................................... 51 Tabelle 6.13 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Roh- ölpreisen in den USA ................................................................................... 52 Tabelle 6.14 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Erdgaspreisen in den USA ........................................................................... 53 Tabelle 6.15 Analyse- und Prognoseergebnisse von monatsdurch- schnittlichen Elektroenergiepreisen in den USA ......................................... 54 Tabelle 6.16 Ergebnisse der Modellschätzung zum Beispiel Margarineabsatz ............... 56 Tabelle 7.1 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Spanien ........................................................................................................ 57
130 Bilder- und Tabellenverzeichnis
Tabelle 7.2 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Kalifornien ............................................................................................. 57 Tabelle 7.3 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für New York ............................................................................................... 58 Tabelle 7.4 Prognoseergebnisse für stündliche Nachfrage und Preise an Elektroenergie pro Tag in den Bundesstaaten von New England ............... 59 Tabelle 9.1 Stärken-Schwächen-Vergleich .................................................................... 67 Tabelle 12.1 Auswahl von Zeitreihen zur Anwendung von Strukturgleichungs- modellen ...................................................................................................... 85 Tabelle 13.1 Estimation report ......................................................................................... 86 Tabelle 13.2 Diagnostic summary report ......................................................................... 87 Tabelle 13.3 Estimated variances of disturbances ............................................................ 88 Tabelle 13.4 Estimated standard deviations of disturbances ............................................ 88 Tabelle 13.5 Estimated coefficients of final state vector .................................................. 88 Tabelle 13.6 Saisonausschläge ......................................................................................... 89 Tabelle 13.7 Normality test for Residuals ........................................................................ 89 Tabelle 13.8 Goodness-of-fit results and serial correlation statistics for residuals .......... 90 Tabelle 13.9 Korrelogramm der Residuen ....................................................................... 91 Tabelle 13.10 Normality tests for smoothed residuals ....................................................... 93 Tabelle 13.11 7 post-sample predictions ............................................................................ 95 Tabelle 14.1 Gruppeneinteilung der untersuchten Zeitreihen .......................................... 96 Tabelle 14.2 Analyse- und Prognoseergebnisse für den monatlichen Elektro- energieumsatz und -absatz in Kalifornien .................................................. 97 Tabelle 14.3 Fallunterscheidung bei den monatlichen Erdgaspreisen ............................. 101 Tabelle 14.4 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Rohölpreisen in den USA ............................................................................ 102 Tabelle 14.5 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Erdgaspreisen in den USA ........................................................................... 103 Tabelle 14.6 Analyse- und Prognoseergebnisse von monatsdurch- schnittlichen Elektroenergiepreisen in den USA ......................................... 104 Tabelle 14.7 Analyse von Wochen- und Stundendaten ................................................... 106 Tabelle 14.8 Analyse- und Prognoseergebnisse für die tägliche Labornutzung im Haus 21 ................................................................................................... 107 Tabelle 15.1 Fehlervergleich zwischen STAMP und EViews Prognosen ....................... 108 Tabelle 15.2 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Kalifornien ................................................................................................... 109 Tabelle 17.1 Stärken-Schwächen-Vergleich EViews 5.0 versus GiveWin/STAMP 6 ..................................................................................... 117 Tabelle A1 Programmübersicht………………………………………………………...136
Deutsch-Englische Begriffsabgrenzung 131
Deutsch-Englische Begriffsabgrenzung
Abgrenzung deutschsprachig Abgrenzung englischsprachig/
Preis der ISO in Cent pro KWh Price in ISO for NP15
Preis für Absenken der Last für den Folgetag in Cent pro KWh
Ancillary Services: Price of Regulation Down Day Ahead in NP15
Preis für Hochfahren der Last für den Folgetag in Cent pro KWh
Ancillary Services: Price of Regulation Up Day Ahead in NP15
Preis für Absenken der Last für die Folgestunde in Cent pro KWh
Ancillary Services: Price of Regulation Down Hour Ahead in NP15
Preis für Hochfahren der Last für die Folgestunde in Cent pro KWh
Ancillary Services: Price of Regulation Up Hour Ahead in NP15
Ersatzmenge für die Folgestunde in KWh Ancillary Services: Quantity of Replacement Hour Ahead
Preis für Elektroenergie in $/MWh aus der ständig im 10-Minuten-Takt verfügbaren Kapazitätsreserve
East 10 Min Spinning Reserve ($/MWH)
Preis für Elektroenergie in $/MWh aus der fallweise im 10-Minuten-Takt verfügbaren Kapazitätsreserve
East 10 Min Non-Synchronous Reserve
Preis für Elektroenergie in $/MWh aus der operativen Reserve für 30 Minuten
East 30 Min Operating Reserve ($/MWH)
Preis für Elektroenergie in $/MWh für New York East 1
East Regulation ($/MWH)
Handelspreis in Cent pro KWh Precios (cent/kWh) a efectos del articulo
1 Es gibt zwei Regulierungsgebiete für den Staat New York: EAST und WEST. Die Preise weisen aber im
Untersuchungszeitraum keinen Unterschied aus.
132 Deutsch-Englische Begriffsabgrenzung
Deutsch-Englische Begriffsabgrenzung (Fortsetzung)
Abgrenzung deutschsprachig Abgrenzung englischsprachig
Umsatz Elektroenergie in TDollar: Sektor Haushalte
Residential Revenue (Thousand $)
Umsatz Elektroenergie in TDollar: Sektor Handel
Commercial Revenue (Thousand $)
Umsatz Elektroenergie in TDollar: Sektor Industrie
Industrial Revenue (Thousand $)
Umsatz Elektroenergie in TDollar: Sektor Sonstige Bereiche
Other Revenue (Thousand $)
Umsatz Elektroenergie in TDollar: Gesamt Revenue All Sectors (Thousand $)
Absatz Elektroenergie in MWh: Sektor Haushalte
Residential Sales (MwH)
Absatz Elektroenergie in MWh: Sektor Handel
Commercial Sales (MwH)
Absatz Elektroenergie in MWh: Sektor Industrie
Industrial Sales (MwH)
Absatz Elektroenergie in MWh: Sektor Sonstige Bereiche
Other Sales (MwH)
Absatz Elektroenergie in MWh: Gesamt Sales All Sector (MwH)
Erlöse in Dollar/KWh: Sektor Haushalte Avg Revenue Per KWH -Residential (¢/KwH)
Erlöse in Dollar/KWh: Sektor Handel Avg Revenue Per KWH -Commercial (¢/KwH)
Erlöse in Dollar/KWh: Sektor Industrie Avg Revenue Per KWH -Industrial (¢/KwH)
Erlöse in Dollar/KWh: Sektor Sonstige Bereiche
Avg Revenue Per KWH -Other (¢/KwH)
Erlöse in Dollar/KWh: Gesamt Avg Revenue Per KWH -All Sectors (¢/KwH)
Deutsch-Englische Begriffsabgrenzung 133
Deutsch-Englische Begriffsabgrenzung (Fortsetzung)
Abgrenzung deutschsprachig Abgrenzung englischsprachig
Erster Einkaufspreis für inländisches Rohöl: Cent per Barrel
Crude Oil Domestic First Purchase Price: Cent per Barrel
Einkaufspreis für importiertes Rohöl (incl. Transportkosten): Cent per Barrel
FOB Cost of Crude Oil Imports: Cent per Barrel
Einkaufspreis für Importiertes Rohöl (incl. Sämtliche Bezugskosten2): Cent per Barrel
Landed Cost of Crude Oil Imports: Cent per Barrel
Aufkaufpreis von Raffinerien für inländisches Rohöl: Cent per Barrel
Refiner Acquisition Cost of Crude Oil, Domestic: Cent per Barrel
Aufkaufpreis von Raffinerien für importiertes Rohöl: Cent per Barrel
Refiner Acquisition Cost of Crude Oil, Imported: Cent per Barrel
Aufkaufpreis von Raffinerien für Rohöl insgesamt: Cent per Barrel
Refiner Acquisition Cost of Crude Oil, Composite: Cent per Barrel
Erdgaspreis ab Förderstelle: Cent per 1000 cubic feet
Natural Gas Price, Wellhead Composite: Cent per 1000 cubic feet
Erdgaspreis ab Zuleitung: Cent per 1000 cubic feet
Natural Gas Price City Gate: Cent per 1000 cubic feet
Erdgaspreis für Abnehmer aus dem Sektor Haushalte: Cent per 1000 cubic feet
Natural Gas Price, Delivered to Consumers, Residential: Cent per 1000 cubic feet
Erdgaspreis für Abnehmer aus dem Sektor Handel: Cent per 1000 cubic feet
Natural Gas Price, Delivered to Consumers, Commercial: Cent per 1000 cubic feet
Erdgaspreis für Abnehmer aus dem Sektor Industrie: Cent per 1000 cubic feet
Natural Gas Price, Delivered to Consumers, Industrial: Cent per 1000 cubic feet
Erdgaspreis für Abnehmer aus dem Sektor Energieerzeugung: Cent per 1000 cubic feet
Natural Gas Price, Delivered to Electric Power Sector: Cent per 1000 cubic feet
Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Sektor Haushalte
Average Retail Price of Electricity, Residential: 100 Cent per kWh
Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Sektor Handel
Average Retail Price of Electricity, Commercial: 100 Cent per kWh
Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Sektor Industrie
Average Retail Price of Electricity, Industrial: 100 Cent per kWh
Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Gesamt
Average Retail Price of Electricity, Total: 100 Cent per kWh
2 Produktpreis, Transportkosten, Zoll, Steuern, Abgaben
134 Anlagen 1 - 4
Anlage 1 Übungsaufgaben für das PC-Labor
1) Übungskomplex AR-Modelle mit GARCH-Residuen (Tool EViews) a) Platintrader von Jan 99 bis Jun 04 (1376 Tageswerte der Frankfurter Börse) - Optionsanteil auf Aktien (OS/Aktien) ab 4.1.99 - Aktienkursgewinne (Rendite) ab 5.1.99 Ziel: GARCH-Modellierung und Vergleichsprognose für die letzten 20 Werte b) Elektroenergiehandel in New England Staaten von Nov 04 bis Jan 05 (1872 Stun-
denwerte der ISO NE) - EE Verbrauch in MWh - EE Durchschnittspreis in Dollar pro MWh Ziel: GARCH-Modellierung mit Spitzen Dummies und Vergleichsprognose für die
letzten 168 Werte
2) Übungskomplex UCM (Tools STAMP und SPSS) Ziele: Modellierung mit Hilfe von STAMP und SPSS
Vergleich der Prognose Fehler für das jeweils letzte Jahr
a) Einzelhandelsindex der BRD für Bekleidung, Schuhe, Lederwaren (1994M01 – 2005M08)
b) Einnahmen und Ausgaben der öffentlichen Haushalte in der BRD (Quartalsdaten vom 1991Q1 - 2005/Q1)
c) Hausbaustarts in den USA, gesamt (1959M01 – 2005M09)
d) Hausbaustarts in den USA, EFH (1959M01 – 2005M09)
e) Preismedian bei Hausverkäufen in den USA (1968M01 – 2005M09)
f) Mengen- und wertmäßiger Elektroenergieverbrauch von Haushalten in Kalifornien
( 1990M01 – 2003M08)
Anhang 1 135
Anlage 2 Funktionaler Zuwachs von EViews 6 gegenüber EViews 5
1. Excel-Dateien können per Mausklick aus dem Explorer in den EViews-Rahmen gezo-gen und als Workfile formatiert werden.
2. Grafiken können nunmehr in allen gängigen Ausgabeformaten incl. GIF, JPEC und
PNG exportiert werden.
3. Der ARCH-LM-Test auf Heteroskedastie ist um vier weitere Testverfahren auf Va-rianzhomogenität ergänzt worden. Die Testverfahren sind auf ARMA-Residuen und auf GARCH-Residuen anwendbar.
4. Für ARMA-Residuen ist zusätzlich ein LM-Test auf serielle Korrelation anwendbar.
5. Der Test auf Normalverteilung für Residuen von VAR- bzw. Kointegrationsmodellen
kann neben der simultanen Betrachtung von Schiefe und Windung (Jarque-Bera) auch gesondert nur als Test auf Schiefe bzw. nur als Test auf Windung (Aufspaltung nach Lütkepol)
6. Im Grafik Menü sind Quantil-Plots und Box-Plots hinzu gekommen.
7. Die Prognose Techniken sind nun auch auf Modelle mit MA-Termen anwendbar.
Darüber hinaus sind zahlreiche weitere Schätz- und Testverfahren für diskrete Variable und Paneldaten verfügbar (siehe EViews 6 Getting Started, January 30, 2007).
136 Anlagen 1 - 4
Anlage 3 Programmerweiterungen für EViews (ab 5.0) In einer ersten Arbeitsetappe wurden im SS 2007 vier Zusatzprogramme für EViews 5.0 er-stellt (vgl. Dorloff [2007]1) und im Lehrbetrieb während des Wintersemesters 2007/08 er-probt. Es handelt sich um Programme zur Berechnung bzw. Visualisierung
• des Periodogramms und der Spektraldichtefunktion (perspc.prg) • des kumulativen Periodogramms (kumper.prg) • von 11 verschiedenen Fehlermaßen für die Vergleichsprognose (errors.prg) • von Intervallprognose und Beobachtungsreihe im Vergleichszeitraum unter Beachtung
des Vorzeichens beim Prognose Fehler (verprog.prg). Die Programme sind in einem speziellen, unter EViews verfügbaren Visual Basic Dialekt geschrieben und auf dem Dozenten Laufwerk abgelegt. Die Eingabeparameter und Ausgabedateien weist Tabelle A1 aus. Tabelle A1 Programmübersicht
Programm Input-Output-Funktion Input-Output-Dateien
perspc.prg Eingabeparameter Beobachtungsreihe Anfangszeitpunkt Endzeitpunkt
Ausgabedateien Periodogramm (Typ: Matrix) Spektraldichtefunktion (Typ: Matrix)
kumper.prg Eingabeparameter Periodogramm-Matrix Startzeitpunkt Endzeitpunkt
Ausgabedateien Kumper (Typ: Matrix)
errors.prg Eingabeparameter Prognose Reihe Beobachtungsreihe Anfangspunkt Vergleichszeitraum Endpunkt Vergleichszeitraum
Ausgabedateien Errors (Typ: Pool)
verprog.prg Eingabeparameter Vergleichsprognose Ist-Werte Beginn Vergleichszeitraum Ende Vergleichszeitraum Varianzen der Prognose Fehler
Ausgabedateien Progrisk (Typ: Matrix) Verprog (Typ: Matrix)
1 Dorloff, J.: Programmierung von Makros in EViews, FH Stralsund, Hausarbeit QM I, SS 07
Anhang 1 137
Der Programmaufruf in EViews erfolgt über den Menüpunkt File/Open/Programm (vgl. Bild A1) und wird mit dem Befehl RUN ausgelöst (vgl. Bild A2). Danach erscheint ein Fenster mit dem Verweis auf das Verzeichnis des Quellcodes und einem Eingabefenster für die Parame-ter. Bild A1 Programmaufruf in der EViews-Umgebung
Bild A2 Quellcode und Run-Option
Um die Berechnungen zu beschleunigen sollte sogleich der schnelle Abarbeitungsmodus ein-gestellt werden (vgl. Bild A3). Die erzeugten Ausgabedateien sind über das Arbeitsfenster von EViews aufzurufen (vgl. Bild A4).
138 Anlagen 1 - 4
Bild A3 Vorbereitung des Programmstarts
Bild A4 Ablage von Output Dateien in einem Workfile von EViews
Das Programm zur Visualisierung der Vergleichsprognosen ist inzwischen vom Autor noch einmal korrigiert worden, um die gewünschten zeitvariablen Prognose Intervalle für den GARCH-Ansatz zu erhalten. Dazu müssen nunmehr die Varianzen der Prognose Fehler für den Vergleichszeitraum eingegeben werden, welche zuvor im Untermenü Proc mit Make GARCH Variance Series als Output erzeugt worden sind. Die entsprechenden Grafiken sind in Bild A5 und Bild A6 zu sehen.
Anhang 1 139
Bild A5 Vergleichsprognose und Istwerte mit dynamischen Konfidenzintervallen
-10
0
10
20
30
40
50
60
70
80
1725 1750 1775 1800 1825 1850
PREISF $/MWh
INTU INTO
Bild A7 Ausgabe positiver und negativer Prognosefehler
-30
-20
-10
0
10
20
30
1725 1750 1775 1800 1825 1850
RISKUP RISKDOWN
140 Anlagen 1 - 4
In einer zweiten Phase sind weitere Programmerweiterungen geplant:
• Erweiterung der Datumsangaben um Stunden,
• Erweiterung der Periodogrammglättung,
• Erweiterung der grafischen Zeitreihenanalyse (Durchschnittskurven, Abschnittsver-gleiche).
Anhang 1 141
Anlage 4 Hinweise auf weitere Quellen
Götze, W.: Modellspezifikation und Kurzfristprognose von Elektroenergiezeitrei-hen auf liberalisierten Strommärkten, Vortrag auf der Tagung der GOR Arbeits-gruppe Prognose Verfahren am 5.10.2006 in Berlin (50 Folien, siehe Homepage Götze).