Testiranje statistickih hipoteza Materijali za nastavu iz Statistike
7. Primena verovatnoće i statistike u...
Transcript of 7. Primena verovatnoće i statistike u...
12.4.2017.
1
7. Primena verovatnoće i statistike u hidrologiji
HIDROLOGIJA Univerzitet u Beogradu – Građevinski fakultet
Građevinarstvo, modul HVE IV semestar
1
2
Sadržaj
Uvod • Karakter hidroloških procesa
• Hidrološki nizovi
Preliminarne analize podataka • Grafička predstava podataka
• Numerički pokazatelji skupa podataka
• Podaci u parovima
Osnovni pojmovi iz verovatnoće • Definicije
• Slučajna promenljiva
• Raspodela slučajne promenljive
• Osobine slučajne promenljive
Statistička analiza u hidrologiji • Prilagođavanje teorijskih raspodela za slucajne
nizove – empirijska raspodela
– ocena parametara teorijskih raspodela
– dijagrami verovatnoce
• Testiranje statistickih hipoteza
– testiranje saglasnosti
– testiranje homogenosti, slucajnosti
• Intervali poverenja
– parametara raspodela
– kvantila
Korelacija i regresija
12.4.2017.
2
Uvod: Karakter hidroloških procesa
Hidrološki procesi odvijaju se u prostoru i vremenu • delom predvidivo (deterministički)
• delom nepredvidivo (slučajno, stohastički)
0
50
100
150
200
250
300
350
1.1.1997 1.1.1998 1.1.1999 1.1.2000 31.12.2000
Q (
m3/s
)
Lopatnica Lakat / Ibar
dnevni podaci
mesečni podaci
Uvod: Karakter hidroloških procesa
Protoci kao vremenske serije • izražena međuzavisnost podataka (autokorelacija)
• redosled podataka je bitan
0
50
100
150
200
250
300
350
1.1.2000 1.2.2000 1.3.2000 1.4.2000 1.5.2000 1.6.2000 1.7.2000 1.8.2000 1.9.2000 1.10.2000 1.11.2000 1.12.2000
Q (
m3/s
)
Lopatnica Lakat / Ibar
Qi Qi+k
autokorelacija
k Qi Qi+k
k
12.4.2017.
3
Uvod: Karakter hidroloških procesa
Čisto slučajan proces: jedan podatak osmatranja ne zavisi od prethodnih ili narednih osmatranja • redosled podataka nije bitan
• pogodno za ekstremne hidrološke pojave (velike/male vode)
0
50
100
150
200
250
300
350
1.1.1997 1.1.1998 1.1.1999 1.1.2000 31.12.2000
Q (
m3/s
)
Lopatnica Lakat / Ibar
Maksimalni godišnji protoci
nezavisni podaci
Uvod: Karakter hidroloških procesa
Složeni proces: • determinističke komponente (trend, skokovi, periodičnost)
• slučajne komponente (opisivanje međuzavisnosti i čisto slučajna komponenta)
Trend
Skok
Periodičnost
12.4.2017.
4
Uvod: Hidrološki nizovi
U ovom kursu bavimo se nizovima nezavisnih podataka (potpuno slučajni proces) • najčešće nizovi godišnjih vrednosti
HIDROLOŠKI PODACI Kompletne serije
Nezavisni podaci – NIZOVI
Nizovi godišnjih vrednosti (min,
max, srednji)
Nizovi prekoračenja
preko/ispod praga
Zavisni podaci – VREMENSKE SERIJE
Uvod: Hidrološki nizovi
Nizovi nezavisnih podataka
• Niz godišnjih maksimuma protoka
• Niz prekoračenja preko praga (parcijalne serije)
0
50
100
150
200
250
300
350
1997 1998 1999 2000 2000
Q (
m3/s
)
Lopatnica Lakat / Ibar
baza = 100 m3/s
0
50
100
150
200
250
300
350
1997 1998 1999 2000 2000
Q (
m3/s
)
Lopatnica Lakat / Ibar
12.4.2017.
5
Uvod: Hidrološki nizovi
Prikupljeni hidrološki podaci čine uzorak iz nepoznate populacije • uzorak je podskup populacije
Zaključivanje o populaciji na osnovu uzorka • Reprezentativan uzorak?
• Prost slučajni uzorak: onaj u kome su elementi nezavisni i isto raspoređeni (slučajnost i homogenost uzorka); tada je analiza najjednostavnija
Zapadna Morava / Miločaj 1955-2010
0
500
1000
1500
1950 1960 1970 1980 1990 2000 2010 2020
Qm
ax,g
od
(m
3/s
) UZORAK
UZORAK n – obim uzorka
POPULACIJA N – obim
populacije
Preliminarne analize podataka
Hidrološki podaci mogu biti • prekidnog (diskretnog) tipa
• neprekidnog (kontinualnog) tipa
Primeri?
11
12.4.2017.
6
12
Grafičko predstavljanje podataka
Diskretni podaci • štapićasti dijagram
0
2
4
6
8
10
0 1 2 3 4 5 6 7 8 9
Frek
ven
cije
Broj velikih voda godišnje
Broj velikih voda godišnje
Broj javljanja (frekvencija)
0 0 1 2 2 6 3 7 4 9 5 4 6 1 7 4 8 1 9 0
Velika voda je definisana kao protok veći od 300 m3/s
13
Preliminarne analize podataka: grafičko predstavljanje
Diskretni podaci
stubičasti dijagram (column chart)
linijski dijagram (line chart)
0123456789
10
0 1 2 3 4 5 6 7 8 9
Frek
ven
cija
Broj velikih voda godišnje
0123456789
10
0 1 2 3 4 5 6 7 8 9
Frek
ven
cija
Broj velikih voda godišnje
12.4.2017.
7
14
Preliminarne analize podataka: grafičko predstavljanje
Kontinualni podaci • tačkasti dijagram
0 200 400 600 800 1000 1200 1400
Protok (m3/s)
528 441 698 710 191 231 456 432
334 256 1330 312 712 426 239
Prvih 15 članova niza maksimalnih godišnjih protoka na stanici Miločaj na Zapadnoj Moravi
Preliminarne analize podataka: grafičko predstavljanje
Kontinualni podaci • Histogram = dijagram frekvencija
– podela na klase
– preporučeni broj klasa: K = 1 + 3.3. log n, K = 5 log n
• Frekvencije – apsolutne nk = broj podataka u klasi
– relativne fk = nk / n
– kumulativne relativne frekvencije Fk
15
12.4.2017.
8
Preliminarne analize podataka: grafičko predstavljanje
Kontinualni podaci • Primer: maksimalni godišnji protoci na Savi kod Sremske Mitrovice
• n = 84; broj klasa: K = 5 log 84 = 9.6, usvaja se K = 10
Klasa od
Klasa do
Frekv. ni
Kumul. frekv. Fi = Σni
2600 3000 4 4
3000 3400 10 14
3400 3800 16 30
3800 4200 17 47
4200 4600 12 59
4600 5000 11 70
5000 5400 7 77
5400 5800 4 81
5800 6200 1 82
6200 6600 2 84 16
apsolutne frekvencije ni
Preliminarne analize podataka: grafičko predstavljanje
Kontinualni podaci • Primer: maksimalni godišnji protoci na Savi kod Sremske Mitrovice
• n = 84; broj klasa: K = 5 log 84 = 9.6, usvaja se K = 10
17
Klasa od
Klasa do
Rel. frekv. ni* = ni/n
Kumul. rel. frekv. Fi* = Fi/n
2600 3000 0.048 0.048
3000 3400 0.119 0.167
3400 3800 0.190 0.357
3800 4200 0.202 0.560
4200 4600 0.143 0.702
4600 5000 0.131 0.833
5000 5400 0.083 0.917
5400 5800 0.048 0.964
5800 6200 0.012 0.976
6200 6600 0.024 1
relativne frekvencije ni*
12.4.2017.
9
18
Preliminarne analize : numerički pokazatelji skupa podataka
Mere centralne tendencije • aritmetička sredina
• medijana – centralna vrednost u uređenom nizu od n podataka
medijana
N
iix
Nx
1
1
191 231 239 256 312 334 426 432
441 456 528 698 710 712 1330
Prvih 15 članova niza maksimalnih godišnjih protoka na stanici Miločaj na Zapadnoj Moravi
19
Preliminarne analize : numerički pokazatelji skupa podataka
Mere centralne tendencije • mod – najučestalija vrednost
– često: više modalnih vrednosti
mod = (700 + 750)/2 = 725
12.4.2017.
10
20
Preliminarne analize : numerički pokazatelji skupa podataka
Mere disperzije/rasipanja
• raspon = xmax – xmin
• raspon između percentila
raspon = 800 mm
21
Preliminarne analize : numerički pokazatelji skupa podataka
Mere disperzije/rasipanja • standardna devijacija
– koren srednjeg kvadratnog odstupanja
– nepristrasna ocena
m x
malo s
veliko s
f(x)
n
i
i xxn
s1
2)(1
1
])(...)()[(1
)(1 22
2
2
1
1
2 xxxxxxn
xxn
s n
n
i
in
12.4.2017.
11
22
Preliminarne analize : numerički pokazatelji skupa podataka
Kvartili
75%
50%
25%
Q3 Q1 Q2 = Me
interkvartilni razmak Q3 – Q1
23
Preliminarne analize : numerički pokazatelji skupa podataka
Kvantil
p%
Xp%
12.4.2017.
12
Preliminarne analize : numerički pokazatelji skupa podataka
Kontinualni podaci • Primer: maksimalni godišnji protoci na Savi kod Sremske Mitrovice
broj podataka 84
srednja vrednost 4193
standardna devijacija
818
koeficijent varijacije
0.195
koeficijent asimetrije
0.634
x sx sx 24
Preliminarne analize : numerički pokazatelji skupa podataka
Kontinualni podaci • Primer: maksimalni godišnji protoci na Savi kod Sremske Mitrovice
broj podataka 84
srednja vrednost 4193
x0.25 3578
x0.5 = Me 4046
x0.75 4812
x0.25 Me = x0.5 x0.75
25
12.4.2017.
13
26
Preliminarne analize podataka: grafičko predstavljanje
Boks-plot (“box and whiskers plot”)
Q2 = Me
Q3
Q1
rasp
on
interkvartilni razmak
27
Podaci u parovima
Korelacija • veza dve promenljive
• stepen linearne povezanosti se opisuje „simultanim“ varijacijama
• Kovarijansa
• Koeficijent korelacije
N
i
iiYX yyxxn
C1
, ))((1
dijagram rasipanja (scatter diagram)
10, ,
,
, YX
Yx
YX
YX rss
Cr
500
1000
1500
2000
500 1000 1500 2000
Y
X
Godišnje padavine (mm) na stanicama X i Y
Y
X
Y
X
Y
X
rX,Y = +1 rX,Y = +0.8 rX,Y = 0