Άσκηση1 ( Vector Space )
description
Transcript of Άσκηση1 ( Vector Space )
Άσκηση1 (Vector Space )
Q = gold silver truck
Documents
D1 = Shipment of gold damaged in a fireD2 = Delivery of silver arrived in a silver truckD3 = Shipment of gold arrived in a truck
Έχουμε την παρακάτω λίστα κειμένων :
Εισάγουμε το Query:
Ranking
?
, ,
1
2 2, ,
1 1
,*
t
i j i qj i
j t tj
i j i qi i
w wd qsim d q
Q Dw w
Πρέπει να υπολογίσω το παρακάτω για όλα τα κείμενα
Q = gold silver truck
Documents
D1 = Shipment of gold damaged in a fireD2 = Delivery of silver arrived in a silver truckD3 = Shipment of gold arrived in a truck
Terms 1 2 3 4 5 6 7 8 9 10 11 shipment/ of/ gold /damaged /in /a /fire /delivery /silver /arrived / truck
Terms 1 2 3 4 5 6 7 8 9 10 11 shipment/ of/ gold /damaged /in /a /fire /delivery /silver /arrived / truck
Term Q D1 D2 D3 ni N/ni idfi Wi,q Wi,D1 Wi,D2 Wi,D3
1 0 1 0 1 2 1,5 0,1761 0 0,1761 0 0,1761
2 0 1 1 1 3 1 0 0 0 0 0
3 1 1 0 1 2 1,5 0,1761 0,1761 0,1761 0 0,1761
4 0 1 0 0 1 3 0,4771 0 0,4771 0 0
5 0 1 1 1 3 1 0 0 0 0 0
6 0 1 1 1 3 1 0 0 0 0 0
7 0 1 0 0 1 3 0,4771 0 0,4771 0 0
8 0 0 1 0 1 3 0,4771 0 0 0,4771 0
9 1 0 2 0 1 3 0,4771 0,4771 0 0,9542 0
10 0 0 1 1 2 1,5 0,1761 0 0 0,1761 0,1761
11 1 0 1 1 2 1,5 0,1761 0,1761 0 0,1761 0,1761
2 2 2 21 0,4771 0,4471 0,1761 0,1761 0,7192D
2 1,0955D
3 0,3522D
2 2 20,1761 0,4771 0,1761 0,5382Q
, ,
1
2 2, ,
1 1
,*
t
i j i qj i
j t tj
i j i qi i
w wd qsim d q
Q Dw w
2 2 2 21 0,4771 0,4471 0,1761 0,1761 0,7192D
2 1,0955D
3 0,3522D
2 2 20,1761 0,4771 0,1761 0,5382Q
, ,
1
2 2, ,
1 1
,*
t
i j i qj i
j t tj
i j i qi i
w wd qsim d q
Q Dw w
1 0,1761*0,1761 0,031d q
2 0,4771*0,9542 0,1761*0,1761 0,4862d q
3 0,1761*0,1761 0,1761*0,1761 0,0062d q
, ,
1
2 2, ,
1 1
,*
t
i j i qj i
j t tj
i j i qi i
w wd qsim d q
Q Dw w
11, 0,0801
* 1Q Dsim d qQ D
2 , 0,8246sim d q
3 , 0,3871sim d q
Rankingdoc 2doc 3doc 1
, ,
1
2 2, ,
1 1
,*
t
i j i qj i
j t tj
i j i qi i
w wd qsim d q
Q Dw w
Άσκηση 2 (Περικοπη IF)
Α) Έστω ότι περικόπτουμε το IF κατά 75% στο IP1 και μπορεί να ικανοποιήσει 40% των ερωτήσεων.Β) Έστω ότι περικόπτουμε το IF κατά 50% στο IP2 και μπορεί να ικανοποιήσει 80% των ερωτήσεων.
Μηχανή Αναζήτησης δέχεται ένα σύνολο από 5000 queries/sec. Το IF μπορεί να αποθηκευθεί σε 4 μηχανήματα. Ένα αντίγραφο του IF εξυπηρετεί 1000 queries/sec.
Ποιο πρέπει να προτιμήσουμε ;
Επίπεδο 1
Επίπεδο 2
Ip1
A)
Επίπεδο 1
Επίπεδο 2
Ip2
B)
Επίπεδο 1
Επίπεδο 2
Ip2
B)
A) 17 μηχανήματαB) 14 μηχανήματα