Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και...
-
Upload
kyla-gordon -
Category
Documents
-
view
42 -
download
2
description
Transcript of Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και...
![Page 1: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/1.jpg)
WORDNET
Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία
![Page 2: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/2.jpg)
δίκτυο που αναπαριστά σημασιολογικές σχέσεις μεταξύ εννοιών
οι κορυφές αναπαριστούν έννοιες και οι ακμές σχέσεις
μια μορφή αναπαράστασης γνώσης (knowledge representation)
Σημασιολογικά Δίκτυα
![Page 3: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/3.jpg)
![Page 4: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/4.jpg)
δημιουργήθηε στο Πανεπιστήμιο του Princeton το 1985
εποπτεία του Καθ. Ψυχολογίας George A. Miller
τρέχουσα έκδοση 3.0 διανέμεται υπό παραλλαγή της BSD άδειας
χρήσης
WordNet
![Page 5: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/5.jpg)
πρόκειται για: μεγάλη λεξικολογική βάση δεδομένων των Αγγλικών
περιέχει: ουσιαστικά, ρήματα, επίθετα, επιρήματα
διπλή φύση: λεξικού και θησαυρού
ομαδοποίηση λέξεων σε: σύνολα συνωνύμων όρων (synsets)
διασύνδεση synsets: εννοιολογική-σημασιολογική ή λεξικολογική σχέση
Εισαγωγή
![Page 6: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/6.jpg)
synset (έννοια): ένα σύνολο από συνώνυμες λέξεις ή collocations
(συνδυασμοί λέξεων με ξεχωριστό νόημα) gloss (ορισμός):
σύντομος ορισμός μιας έννοιας
Ορολογία
![Page 7: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/7.jpg)
Σημασιολογικές Σχέσεις
ουσιαστικά: υπερωνυμίας: το Y είναι υπερώνυμο του X όταν
κάθε X είναι μέρος του Y υπωνυμίας: το Y είναι υπώνυμο του X όταν κάθε Y
είναι μέρος του Y ολωνυμίας: το Y είναι ολώνυμο του X όταν το X
είναι μέρος του Y μερωνυμίας: το Y είναι μερώνυμο του X όταν το Y
είναι μέρος του X αντίστοιχες σχέσεις υπάρχουν και για τα
ρήματα, επίθετα και επιρήματα
![Page 8: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/8.jpg)
Ιεραρχίες
Τα ουσιαστικά και τα ρήματα είναι οργανωμένα σε ιεραρχίες που ορίζονται από τις σχέσεις υπερωνυμίας
![Page 9: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/9.jpg)
![Page 10: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/10.jpg)
![Page 11: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/11.jpg)
![Page 12: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/12.jpg)
Στατιστικά
PoS Μοναδικά Λήμματα Synsets Συνολικά ζεύγη λέξεων - εννοιών
Ουσιαστικά 117798 82115 146312
Ρήματα 11529 13767 25047
Επίθετα 21479 18156 30002
Επιρήματα 4481 3621 5580
Σύνολο 155287 117659 206941
![Page 13: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/13.jpg)
Σχετικά Projects
σημασιολογικά δίκτυα: σε άλλες γλώσσες (εκτός των αγγλικών)
web interfaces: πρόσβαση μέσω άλλων δικτύων
APIs: σε όλες σχεδόν τις γνωστές γλώσσες (πχ: C#, Java,
MySQL, Perl, PHP, PostgreSQL, Python, Ruby) extentions:
επέκταση των χαρακτηριστικών του ή ενσωμάτωση σε μεγαλύτερα συστήματα
mappings: μεταξύ διαφορετικών εκδόσεων
![Page 14: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/14.jpg)
Μετρικές Σημασιολογικής Ομοιότητας
δίνουν την ομοιότητα μεταξύ δύο οποιωνδήποτε όρων ως προς συγκεκριμένες έννοιες
γνωστές μετρικές ομοιότητας: Leacock-Chodorow Similarity Wu-Palmer Similarity Resnik Similarity Jiang-Conrath Similarity Lin Similarity
![Page 15: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/15.jpg)
Wu-Palmer Similarity
Συνδυάζει το βάθος ενός ζεύγους εννοιών στο WordNet και το βάθος του LCS (Least Common Subsumer) τους
![Page 16: Διαχείριση Περιεχομένου Παγκόσμιου Ιστού Και Γλωσσικά Εργαλεία](https://reader036.fdocument.pub/reader036/viewer/2022062301/568130e3550346895d96f8a3/html5/thumbnails/16.jpg)
Δικτυακοί Τόποι
WordNet official page: http://wordnet.princeton.edu/
WordNet Wikipedia page: http://en.wikipedia.org/wiki/WordNet
WordNet visualization: http://www.visuwords.com/
WordNet vocabulary helper: http://poets.notredame.ac.jp/cgi-bin/wn