Horváth Győző: Kutatási adatbázisok tervezése és eszközei

13
Kutatási adatbázisok tervezése és eszközei Horváth Győző ELTE Informatika Kar Média- és Oktatásinformatikai Tanszék 1

Transcript of Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Page 1: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Kutatási adatbázisok tervezése és eszközei

Horváth Győző

ELTE Informatika Kar

Média- és Oktatásinformatikai Tanszék

1

Page 2: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Tartalom

Szöveges állományok

Jegyzetelő alkalmazások

Táblázatkezelő szoftverek

Adatfájlok

Adatbáziskezelő

Egyedi keresők

2

Page 3: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Téma helye

Adatok keresése

Keresőszolgáltatások működése

Saját adatok tárolása

▪ nem informatikai szakembereknek

▪ lehetőségek

▪ rálátás

▪ közös szókincs

3

Page 4: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Szöveges állományok

szöveges állomány (txt) vagy egyéb dokumentum (pl. docx)

elválasztás

forrás, dátum feljegyzése

egyszerű, rövid távú feladatokra

▪ anyaggyűjtés, jegyzetelés, vázlatírás

Hátránya:

▪ nincs struktúra

▪ visszakereshetőség

▪ rengeteg manuális munka

▪ szinkronizálás

4

Page 5: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Jegyzet alkalmazások

Reneszánszuk

▪ rengeteg információ

▪ internet, számítógép

▪ felhőszolgáltatás

▪ automatizálás

Előny

▪ Sok platform

▪ Visszakereshetőség

▪ Csoportos munkavégzés

Evernote

Springpad

Hátrány

▪ adatok közötti összefüggés

▪ adatstruktúra

5

Page 6: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Táblázatkezelő szoftverek

Adat szerkezete megjelenik

▪ Munkafüzet

▪ Munkalap

▪ Oszlop

▪ Cella

Adattípusok

▪ szöveg

▪ szám

▪ dátum

▪ pénznem

Kapcsolatok

6

Page 7: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Táblázatkezelő szoftverek

Előny

▪ Táblázatos forma

▪ Számolások

▪ Közepes bonyolultságú feladatok

▪ Általános kompetencia

Hátrány

▪ redundáns adatok

▪ bonyolultabb kapcsolatok

▪ csoportmunka

7

Page 8: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Adatfájlok

Táblázat fájlba mentve

Fájlkezelő rendszerek

Előny

▪ adatstruktúra megadása

▪ bonyolultabb kapcsolatok

Hátrány

▪ adatintegritás

▪ másként megjelenítés

▪ elavult

8

Page 9: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Adatbázisok

Relációs adatmodell

Normálformák

Komplex feladatok

▪ bonyolult adatstruktúra

▪ nagy mennyiségű adat

Tervezés

Kapcsolatok megadása

Adatintegráció

9

Page 10: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Egyedi keresők

Egyedi keresés

▪ Privát dokumentumok

▪ Védett, általános keresőkkel nem hozzáférhető oldalakon történő keresés (pl. intranet, fórumok, közösségi oldalak)

▪ Online tartalmak speciális célú keresése, indexelése, keresése

▪ Saját adattár felépítése egy speciális téma köré.

nyílt keresés

10

Page 11: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Lehetőségek

Keresőszolgáltatások

▪ Yahoo! BOSS

▪ Twitter Search API

▪ Bing

▪ Google Custom Search API

Vertikális keresők

▪ online tartalom speciális része

▪ nagyobb találati pontosság

▪ egyedi felhasználói igények

▪ keresés indexelés visszakeresés

11

Page 12: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Lépések

Vizsgált dokumentumok

▪ dokumentumtár

▪ fókuszált keresőrobot

Dokumentum feldolgozása

▪ metaadat

▪ egyes részei

▪ teljes szöveg

Teljes szövegű keresés

▪ lineáris keresés

▪ indexelés és keresés

12

Page 13: Horváth Győző: Kutatási adatbázisok tervezése és eszközei

Keresőmotorok

Lucene és Solr

Sphinx

Xapian

13