SVEUČILIŠTE U ZAGREBU FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA
description
Transcript of SVEUČILIŠTE U ZAGREBU FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA
Zagreb, 03. siječnja 2011. 1 / 16
SVEUČILIŠTE U ZAGREBUFAKULTET ELEKTROTEHNIKE I RAČUNARSTVA
Konferencija „Strojno učenje 2010”
Automatsko predviđanje ocjena filmova metodama strojnog učenja
Mladen Marović, Marko Mihoković, Mladen Mikša, Siniša Pribil, Alan Tus
Zagreb, 03. siječnja 2011. 2 / 16
Sadržaj
1. Uvod2. Srodni radovi3. Metode
▫ Sadržajne▫ Suradničke▫ Hibridne
4. Mjere i skupovi5. Rezultati6. Zaključak
Sadržaj
Zagreb, 03. siječnja 2011. 3 / 16
Uvod•Brojne usluge – ocjenjivanje predmeta•Predviđanje nepoznatih ocjena iskoristivo u praktične
svrhe:▫Internet prodaja – kupcu prikazani proizvodi koje bi
mogao kupiti▫Javne baze podataka – prikazuju se podaci zanimljivi
korisniku radi olakšavanja pretrage
•Sustavi za automatsko predviđanje ocjena▫Korišteni u brojnim poznatim uslugama▫Primjenjivi na različite vrste predmeta
Uvod
Zagreb, 03. siječnja 2011. 4 / 16
Predviđanje ocjene filma•Metode temeljene na sadržaju
▫Li i Yamada (2005) – stablo odluke▫Pazzani i Billsus (1997) – neuronska mreža
•Suradničke metode▫Resnick et al. (1994) – k najbližih susjeda▫Pennock et al. (2000) – dijagnoza osobnosti▫Hofmann (2003) – latentne varijable
•Hibridne metode▫Spiegel et al. (2009) – SVD-kNN
Srodni radovi
Zagreb, 03. siječnja 2011. 5 / 16
Metode za predviđanje ocjena•Skup svih korisnika U•Skup svih filmova I•Skup svih ocjena R
•Procijeniti funkciju:g: U × I → R
Metode
Zagreb, 03. siječnja 2011. 6 / 16
Regresijsko stablo•Metoda temeljena na sadržaju•Značajke:
▫žanrovi, glumci, redatelji i scenaristi▫organizirane u binarni vektor
•Kriterij – minimizacija kvadratne pogreške
Metode - sadržajne
Zagreb, 03. siječnja 2011. 7 / 16
Umjetna neuronska mreža•Metoda temeljena na sadržaju•Unaprijedna višeslojna neuronska mreža
▫skriveni sloj – sigmoidalne jedinice▫izlazni sloj – linearne jedinice
•Značajke: žanrovi, glumci i redatelji•Levenberg-Maquardtova modifikacija
povratnog rasprostiranja pogreške (Hagan i Menhaj, 2002)
Metode - sadržajne
Zagreb, 03. siječnja 2011. 8 / 16
K najbližih susjeda•Suradnička metoda, ocjenu računa na temelju ocjena k najsličnijih korisnika
•Sličnost među korisnicima:▫Pearsonov koeficijent korelacije▫Kosinus kuta u vektorskom prostoru
•Ocjena se predviđa prema izrazu:
Metode - suradničke
Zagreb, 03. siječnja 2011. 9 / 16
Dijagnoza osobnosti•Modelira osobnost korisnika•Gaussov šum u ocjenama korisnika:
•Reprezentativna distribucija tipova osobnosti
•Samo jedan parametar – devijacija σ
Metode - suradničke
Zagreb, 03. siječnja 2011. 10 / 16
Latentne varijable•Modeliraju uzrok ocjene•Grupiranje korisnika
•Normalna razdioba•Normalizacija ocjena•Maksimizacija očekivanja
Metode - suradničke
Zagreb, 03. siječnja 2011. 11 / 16
SVD-kNN
Metode - hibridne
Zagreb, 03. siječnja 2011. 12 / 16
Mjere i skupovi•Skupovi
▫ podatci prikupljeni sa stranice IMDb▫ naziv, žanr, godina, redatelji, scenaristi i glumci▫ metoda SviOsimJednog (Hofmann, 2003)
•Mjere▫ prosječna apsolutna devijacija (AAD)
▫ korijen srednje kvadratne pogreške
Mjere i skupovi
Zagreb, 03. siječnja 2011. 13 / 16
Rezultati
Rezultati
Zagreb, 03. siječnja 2011. 14 / 16
Rezultati - komentar•Metode temeljene na sadržaju
▫problem malog broj primjera i rijetke distribucije značajki
•Suradničke metode▫bolji rezultati▫optimalna formula:
•Hibridna metoda▫osrednja uspješnost
Rezultati
Zagreb, 03. siječnja 2011. 15 / 16
Zaključak•Proučavan problem•Usporedba nekoliko metoda•Najbolja metoda s jednostavnim izrazom
•Ispitati na reprezentativnijem skupu podataka
•Isprobati druge metode•Kombiniranje klasifikatora
Zaključak
Zagreb, 03. siječnja 2011. 16 / 16
Hvala na pažnji!
Zagreb, 03. siječnja 2011. 17 / 16
K najbližih susjeda – računanje sličnosti•Pearsonov koeficijent korelacije:
•Kosinus kuta u vektorskom prostoru:
Dodatak
Zagreb, 03. siječnja 2011. 18 / 16
SVD-kNN - formule• SVD – poopćenje svojstvenih vrijednosti i vektora
Dodatak
• dva različita koncepta pogodna za suradničke metode
• predviđanje
Zagreb, 03. siječnja 2011. 19 / 16
Dijagnoza osobnosti – formule•Pripadnost tipu osobnosti
•Vjerojatnost ocjene
Dodatak
Zagreb, 03. siječnja 2011. 20 / 16
Latentne varijable – EM koraci•E-korak
•M-korak
Dodatak