Bayesov Teorem u Praksi2
description
Transcript of Bayesov Teorem u Praksi2
Procesi zaključivanja u inženjerskoj praksi
Bayesov stav i Bayesov teorem u praksi
Prof.dr.sc. Franjo Jović ETF Osijek
Cilj izlaganja
• Približiti način zaključivanja inženjera Bayesovom modelu zaključivanja računala
• Odbaciti ikakvu mogućnost klasičnog determinizma računala iz zaključivanja inženjera
Kako zaključuju računala
• Računala zaključuju na egzaktan način, tako npr. ako se u proračunu servisnih troškova koji su primjerice 50,00 kn po satu pojavi 10 satna usluga, onda je ukupna usluga:
10*50 = 500,00 kn.• To što su usluge različite i s različitim
vremenima obrade, ne tiče se računala.• Vidimo da je tzv. egzaktno zaključivanje lako
razumljiv postupak, no “način” razmišljanja je potpuno pojednostavljen i ne odgovara inženjerskoj praksi.
Kako zaključuju inženjeri
• Inženjer zaključuje cjelovito, naoko neegzaktno jer iz dijagnoze kvara uređaja ne može izravno povlačiti akcije a da nije provjerio ostale mogućnosti.
• Takav način razmišljanja je razuman, jer simptomi kvara i kvar čine cjelinu.
Usporedba zaključivanja 1
• Zaključivanje “na način računala” pretpostavlja da su sve pojave međusobno odvojene i unificirane (kvalitetom jednake)
• Zaključivanje “na način inženjera” ukazuje na međupovezanost pojava, simptoma i dijagnoze kvara
• Što se krije u pozadini ovakvih procesa?
Usporedba zaključivanja 2
• Računarsko egzaktno zaključivanje:
- zasnovano je na “golim” podacima,
- ima jasne ekonomske
- ima jasne pravne posljedice i
- zamjenjuje posao kalkulanta – računarca
Nezgoda nastaje kada takav način zaključivanja nastojima na bez argumenata, na silu premjestiti u područje dijagnostike ili preveniranja kvarova.
Usporedba zaključivanja 3
• Inženjersko zaključivanje
- zasnovano je na ekspertnim činjenicama
- traži složeno znanje područja ekspertize
- prilagođava odluke prema činjenicama
- pravne posljedice i nisu uvijek jasne
Bayesov stav
• Britanski svećenik iz 18. stoljeća Thomas Bayes
• Bio je svećenik i matematičar - logičar te je posthumno objavljen njegov teorem.
• Puno manje referiran je njegov stav koji govori da “nema pojave koja se ne može dogoditi”. Ovaj stav je vjerojatno rezultat njegovog profesionalnog rada, a kosi se s osnovnim stavom teorije vjerojatnosti o postojanju događaja s vjerojatnosti jednakoj ništici.
• S čime se ne kosi ovaj stav?
Thomas Bayes (1702 – 1761)
Osnovni pojmovi
• Apriorna vjerojatnost pojave kvara• P(A) = očekivana učestalost pojave kvara u
danoj populaciji uređaja, softvera...prema dugogodišnjoj statistici, stacionarna pojavnost, incidencija
• Aposteriorna vjerojatnost pojave kvara
P(A)D = očekivana učestalost pojave kvara u danoj populaciji po izbijanju kvara, dinamička pojava
Bayesov teorem 2
• Bayesov teorem povezuje • Uvjetne, apriorne i aposteriorne
vjerojatnosti pojave događaja A i B, gdje B ima neku konačnu vjerojatnost:
• P(A|B) = P(B|A) P(A)/P(B)• Intuitivno Bayesov teorem opisuje
način promjene uvjerenja o pojavi A kada se opazi pojava B a ne zna se je li se to odnosi i na dotad skrivenu pojavu A. A=kvar; B=simptom kvara
Bayesov teorem 3
• P(A) je apriorna vjerojatnost pojave kvara A. A=pojam iz svijeta ideja!
• P(A|B) je uvjetna vjerojatnost pojave kvara A ako se pojavio simptom B. Naziva se i aposteriorna vjerojatnost jer se izvodi ovisno o pojavi simptoma, B.
• P(B|A) je uvjetna vjerojatnost pojave simptoma B ako se pojavio kvar A.
• P(B) je apriorna vjerojatnost pojave simptoma B. B=pojam iz svijeta objekata...
Primjena Bayesovog teorema 1
• Zamjenom: • događaj A = hipoteza npr.
pregrijavanje čipa, i • događaj B = opažena pojava, npr.
temperatura kućišta uređaja, - otvara se primjena BT-a na
određivanje slučaja pregrijavanja čipa.
Primjena Bayesovog teorema 2
• Promotrimo sada cjeloviti slučaj:• Bolest – Pregrijavanje čipa: ekspertno
znanje:• apriorna vjerojatnost pregrijavanja čipa; simptom
(pojavio se / nije se pojavio; vjerojatnost pojave simptoma ako je prisutan kvar; vjerojatnost pojave simptoma ako nije prisutan kvar);
• više simptoma npr. visoka temperatura kućišta, zastoj rada ventilatora, usporen rad čipa... .
Format baze znanja za dva simptoma• U ovom primjeru postoje dva simptoma: povišena
temperatura kućišta i zastoj rada ventilatora• Pregrijavanje čipa: apriorna vjerojatnost, p(pregr.) =
p = 0.001Vjerojatnost povišene temperature kućišta ako je pregrijavanje čipa p(temp kuć| pregr.čipa) = pda(1) =1
• Vjerojatnost povišene temperature kućišta ako nema pregrijavanja čipa p(temp kuć.| ne(pregrij.čipa)) = pne(1) = 0.01
• Vjerojatnost zastoja ventilatora ako je pregrijavanje čipa
p(zastoj vent. | pregr. čipa) = pda(2) = 0.9• Vjerojatnost zast. ventilatora ako nema pregrijavanja čipa je
p(zast.vent. | ne(pregr.čipa)) = pne(2) = 0.1
Potpuni proračun za dva simptoma • Izračun apriorne vjerojatnosti (npr.povišene
temperature), ako su poznate uvjetne vjerojatnosti:
• P(B) = P(temp.kućišta) = p(temp.k.|pregr.č.)*p(pregr.či.) + p(temp.k.|ne pregr.či.)*(1-p(pregr.či.)) = pda*p + pne*(1 – p) = 1*0,001 + 0,01*0,999 = 0,001999=0,002Dobivanje nove uvjetne vjerojatnosti:
• P(A|B) = P(pregr.či.|temp.k.) = (pda*p) / (pda*p + pne*(1 - p))=1*0,001/0,002 = 0,5 !
• Dakle izuzetan porast vjerojatnosti kvara!
Slučaj više kvarova i više simptoma
• U praksi imamo više mogućih kvarova s više simptoma.
• Tada možemo načiniti tablicu apriornih i uvjetnih vjerojatnosti za svaki kvar i svaki simptom.
• Vidimo da je ovakva cjelovita tablica sa stotinjak kvarova i stotinjak mogućih simptoma polje od 100*100=10000 kućica svaka s po dva podatka!?!
Praktična rješenja
• Smanjiti veličinu polja – specijalistički servisi u praksi
• Načiniti mogućnost određivanja dominantnog kvara primjenom izračuna najveće promjene apriornih vjerojatnosti
• To je tzv metoda “vrijednosti pravila”,
• Engleski Rule Value (RV)
Određivanje hipoteze s najviše informacije
• Iz prethodno navedene teorije definira se “vrijednost pravila” (engl. Rule Value)za nekoliko simptoma kao zbroj razlika vjerojatnosti po pojedinom simptomu:
• RV = Σ |P(Hi/daE) – P(Hi/ne(E)| , • hipoteza s najviše informacije je ona koja za neku
utvrđenu činjenicu E u izrazu za RV daje najveću razliku, (stupac na sljedećoj tablici)
• i = indeks računanja po hipotezamaRV je najveći za događaj s najviše informacije;
“| xx |” označava apsolutnu vrijednost razlike vjerojatnosti• Pitanje povezano s tom činjenicom najvećeg RV prvo
postavljamo kod testiranja uređaja/softvera
Primjer ispunjavanja tablice vjerojatnostima(podaci su proizvoljni)
Hipoteza:
kvara
>Temp Kućišta
Ekran
Neaktiv.
Ekran zamrz.
Mrežni
prekid
Tastatura van pogona
Ventilator se ne čuje
Kvar napajanja. da
p1= ne
0
0,99
0,7
0,05
0,001
0,99
0,04
0,8
0
0,9
1
0,01
Kvar matične ploče da
p2= ne
0,01
0,001
1
0,01
0,02
0,6
0,05
0,75
0,04
0,6
0,03
0,02
Kvar ventilatora da
p3= ne
0,6
0,02
-
-
0,9
0,1
0,25
0,5
-
-
0,9
0,02
Pregrij.
procesora da p4= ne
0,6
0,03
0,03
0,01
0,35
0,02
0,01
0,5
0,06
0,35
0,001
0,42
Upitnik za vježbu
• 1.Kolika je incidencija u:
p1,
p2,
p3,
p4,
Kako se mijenja šansa i vjerojatnost, kada se pojavi određeni kvar?
Određivanje šansi:
• ŠANSA Temp.k. Neak.ekr. Ekr.zamrz Mr.prek. ...• Kvar.nap. Da svi 100:1 2:1 nitko svi• Kvar.nap. Ne 3:1 50:1 5:1 200:1 malo tko • Kv.mat.pl.Da • Kv.mat.pl.NE• Kv.vent. DA• Kv.vent. Ne
Pregr.proc.Da• Pregr.proc. Ne
Primjer izračuna jednog polja• Serviser razmišlja: “Šansa da mi sada uđe korisnik s
dijagnozom pregr. čipa je jedan na tisuću(1). • (1) p(H) = 0,001 • Osim toga ako već ima pregr.čipa onda 100% ima i visoku
temperaturu kućišta(2). • (2) p(E:H) = 1• Šansa da netko ima visoku temperaturu kućišta a da
nema pregr. čipa (3)• (3)p(E:neH) = 0,01• Dolazi korisnik i računalo nema drugih simptoma! To nam
je svako stoto računalo (4).
(4) p (E) = 0,01. Gotov posao!
Primjer izračuna jednog polja
• Prema Bayesu sada grubo izračunava aposteriornu vjerojatnost pov.temp.čipa:
• P(H:E) = P(E:H) * P(H) / P(E), odnosno• P(H:E) = (1* 1/1000) / (1/100) = 100/1000
= 0,1 !• Dakle aposteriorna vjerojatnost
pregrijavanja čipa sada iznosi 100 puta više od apriorne vjerojatnosti istog kvara prije ove pojave!
Primjer izračuna jednog polja
• Zamjenjujemo apriornu vjerojatnost s aposteriornom, proglašavamo epidemiju zagrij. čipova i očekujemo sljedeću promjenu situacije u servisu:
• Ranija situacija sa P(H) = 0,001:• P(E) = P(E:H) * P(H) + P(E:neH) * (1-P(H)) = =1 * 0,001 + 0,01 * 0,999 = 0,01 Nova situacija sa P(H) = 0,1 • P(E) = 1 * 0,1 + 0,01 * 0,9 = 0,109 (dakle približno
svaki deveti korisnik će se žaliti na pregrijavanje čipa.
Rasprava
• Bayesov teorem uvjetne vjerojatnosti jedino je znanstveno dokazano uzročno posljedično pravilo. Ono je univerzalno.
• Inženjeri ga intuitivno primjenjuju, pa je dobro tu intuitivnost potpomoći u praksi.
• Ostale vrste “računarskih” egzaktnih proračuna je neznanost!