Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály [email protected]

23
Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály [email protected] XML-alapú komplex korpusz- lekérdezés

description

XML-alapú komplex korpusz-lekérdezés. Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály [email protected]. Mi a Xaira ?. XML szövegek indexálása és lekérdezése Indexálás (xaira-tools.exe) Nagy mennyiségű szöveg feldolgozása Gazdag XML annotáció kezelése - PowerPoint PPT Presentation

Transcript of Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály [email protected]

Page 1: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

Héja EnikőMTA Nyelvtudományi Intézet

Korpusznyelvészeti Osztá[email protected]

XML-alapú komplex korpusz-lekérdezés

Page 2: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

Mi a Xaira?

XML szövegek indexálása és lekérdezése

Indexálás (xaira-tools.exe) Nagy mennyiségű szöveg feldolgozása Gazdag XML annotáció kezelése

Lekérdezés (xaira.exe/hxaira.exe) Kliens és részletes súgó magyarul Bonyolult lekérdezések

Page 3: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

Az indexálás minimális feltételei

Jól formált XML

<text> </text> tagbe ágyazott szöveg

A szöveg kódolása UTF-8 vagy az XML fejlécben megadott kódolás

<?xml version="1.0" encoding="iso-8859-2" ?>

Page 4: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

Egy szöveg<text>Abigél.Gina intézetbe kerül.A változás, ami életében bekövetkezett, annyi

mindentől megfosztotta, mintha bomba pusztított volna az otthonában.

Elsőnek Marszell <IGEKOTOS>tűnt el</IGEKOTOS>, akit kisasszonynak szólított, mióta csak ismerte, de akire azért sosem úgy gondolt, mint egy francia lányra, aki tizenkét esztendőn át a mellette levő szobában lakott, és őt nevelte.

Marszell mindig megértette még azt is, amit Gina nem is <IGEKOTOS>fogalmazott meg</IGEKOTOS>.

Page 5: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

I.

Page 6: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

II.

Page 7: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

III.

Page 8: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

IV.

Page 9: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

V.

Page 10: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

VI.

Page 11: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

VII.

Page 12: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

VIII.

Page 13: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

IX.

Page 14: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

X.

Page 15: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

XI.

Page 16: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

XII.

Page 17: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

XIII.

Page 18: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

XIV.

Page 19: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

XV.

Page 20: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

Egy lekérdezés (I.)

Page 21: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

II.

Page 22: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

III.

Page 23: Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály eheja@nytud.hu

www.xaira.org

Köszönöm a figyelmet!