Zebrakoha

14
ZEBRA ХАЙЛТЫН СИСТЕМ ТҮҮНИЙГ КОХАД АШИГЛАХ НЬ Н.Баттүшиг Информатикийн хүрээлэн, МТЛ эшда

Transcript of Zebrakoha

Page 1: Zebrakoha

ZEBRA ХАЙЛТЫН СИСТЕМ ТҮҮНИЙГ

КОХАД АШИГЛАХ НЬ

Н.Баттүшиг

Информатикийн хүрээлэн, МТЛ эшда

Page 2: Zebrakoha

ХАЙЛТЫН СИСТЕМҮҮД, ZEBRA ХАЙЛТЫН

СИСТЕМ

КОХАД ЗЕБРАГ АШИГЛАХ ТУХАЙ, МУИС-н

НОМЫН САНГИЙН ХӨРВҮҮЛЭЛТ

ZEBRA-г АШИГЛАХ БУСАД ХЭРЭГЛЭЭ

УЛААНБААТАР ХОТЫН ГЭРЭЛТҮҮЛГИЙН

СИСТЕМИЙН ХЯНАЛТ, УДИРДЛАГЫН ПРОГРАМ

ХАНГАМЖ

Page 3: Zebrakoha

ХАЙЛТЫН СИСТЕМҮҮДИЙН ХЭРЭГЦЭЭ

Ямар нэгэн өгөгдлийн сангийн болон вэб

сайтуудын мэдээлэл ихсэх тутамд

хэрэглэгчид мэдээллийг хайх боломжийг

олгох шаардлага зайлшгүй тулгардаг.

Програм хангамж хөгжсөн өнөө цагт

нээлттэй эх бүхий хайлтын системүүдээс

сонгож ашиглах боломжтой болсон.

Page 4: Zebrakoha

ХАЙЛТЫН СИСТЕМҮҮДИЙГ СОНГОХОД

АНХААРАХ ЗҮЙЛС

Хайлтын системүүдийг бичигдсэн

програмчлалын хэл, индексээ хэрхэн хадгалдаг,

(файл, өгөгдлийн сан гм) хайлтын боломжууд

(Булийн үйлдлүүд, үгийн үндсээр хайх),

эрэмбэлэх аргууд, индекслэх боломжтой

файлын төрлүүд (HTML, PDF, энгийн текст

файл гм) шаталсан индекслэлт хийх боломж

зэрэг олон хүчин зүйлээс нь хамааруулан

сонгож ашиглах шаардлагатай

Page 5: Zebrakoha

ХАЙЛТЫН СИСТЕМҮҮДИЙН АЖИЛЛАХ

ЕРӨНХИЙ ЗАРЧИМ

Page 6: Zebrakoha

ZEBRA SEARCH ENGINE

Zebra бол өндөр хүчин чадал бүхий

ерөнхий зориулалтын бүтэцлэгдсэн текст

индекслэлт, хайлтын систем юм. Зебра

email, XML, MARC гэх мэт олон төрлийн

бүтэцлэгдсэн өгөгдлийг импортлон авч

тэдгээрийг Булийн илэрхийлэл болон

хамааралтай шинжээр нь ангилсан

асуулгуудаар хайх боломж олгоно.

Page 7: Zebrakoha

ZEBRA ҮНДСЭН ҮЗҮҮЛЭЛТҮҮД

Хэдэн арван сая бичлэг бүхий хэдэн арван

гигабайт хэмжээтэй өгөгдлийн сангаас хайлт

хийх чадвартай

Системийн ажиллагааг зогсоолгүй

найдвартайгаар, тухай бүрт нь өгөгдлийн

сангийн шинэчлэлтийг хийх чадвартай

Мэдээлэл хайлтын Z39.50 протоколыг дэмждэг

учраас энэ протоколыг ашигладаг олон

програмуудад ашиглах боломжтой

Perl, C, C++, Java, Tcl, Visual Basic, Python, PHP

гэх мэт хэлүүдээс клиент програм бичих

боломжтой

Page 8: Zebrakoha

KOHA – OPEN SOURCE ILS

Нээлттэй эх бүхий номын сангийн

програм Integrated Library System (ILS)

Шинэ Зеландын Katipo Communications

Ltd анх 2000 онд зохиосон

perl хэл дээр програмчлагдсан

Сүүлийн хувилбар 3.2 - 2010 онд

Дэлхий даяар байх програм хангамжийн

компаниуд, номын сангийн технологийн

ажилчид хөгжүүлэлтийг хийдэг

Page 9: Zebrakoha

ЗЕБРАГ КОХАД АШИГЛАХ БОЛОМЖ

Коха системийг сурталчлан суурилуулж,

үйлчилгээ хийдэг LibLime компани

нээлттэй эх бүхий өгөгдлийн сангийн

олон шилдэг хайлтын системүүдийг

(жишээлбэл MySQL текст хайлт,

PostgreSQL, Lucene, Plucene зэрэг)

сайтар туршсаны эцэст Зебраг хайлтын

системээр сонгосон бөгөөд номын

сангийн нэгжүүдийн мэдээллийг

хадгалахаар Кохагийн 3.0 хувилбараас

эхлэн шинээр нэмж оруулсан.

Page 10: Zebrakoha

ЗЕБРАГ КОХАД АШИГЛАХАД ШИЙДВЭРЛЭХ

АСУУДЛУУД

Коха системийг суурилуулах үед номын сангийн

нийт нэгжийн тоо 100000 – с дээш бол Зебра

хайлтыг ашиглахыг зөвлөсөн байдаг.

Зебраг суурилуулсны дараа зааврын дагуу

тохируулга хийнэ.

Зебра юникод дэмждэг боловч Кохатай ажиллах

үед кирилл үсгээр хайлт хийж чаддаггүй тул

хайлтын нэмэлт тохируулга хийсэн. (sort-string-

utf, word-phrase-utf)

Page 11: Zebrakoha

МУИС – Н НОМЫН САНГИЙН ӨГӨГДЛИЙН

САН ХӨРВҮҮЛЭЛТ

МУИС-н номын сангийн 240000 гаруй

номын мэдээллийг марк21 стандарт руу

хөрвүүлэхэд 1 Gb хэмжээ бүхий архивын

файл үүссэн. Үүнээс жишээ болгож орос

номын 23000 номын мэдээлэл бүхий

8.4mb марк21 стандарт файлын бичлэгийг

Кохад оруулахад нийт 56 цаг зарцуулж

файлын хэмжээ 100mb болсон байлаа.

Энэ аргаар нийт 240000 гаруй номыг

Кохад оруулна гэдэг нь үр дүнгүй нь

харагдаж байна.

Page 12: Zebrakoha

МУИС – Н НОМЫН САНГИЙН ӨГӨГДЛИЙН

САН ХӨРВҮҮЛЭЛТ: ZEBRA

Харин Кохад хайлтын Zebra системийг

судлан тохируулга хийж номнуудаа

оруулахад өмнөх орос номын файлыг 16

минутанд оруулж нийт файлын хэмжээ

9,4mb болж байлаа. Энэ аргаараа нийт

1Gb хэмжээ бүхий 242650 номоо

хөрвүүлэхэд 2 цагийн хугацаа зарцуулж

нийт файлын хэмжээ 952mb болсон.

Page 13: Zebrakoha

NoZebra Zebra

Зарцуулсан хугацаа (цаг)

56 0.375

Өгөгдлийн сангийн хэмжээ (MB)

100 9.4

56

0.375

100

9.4

0

20

40

60

80

100

120

МУИС-н номын сангийн орос номын 23000 номын мэдээлэл

бүхий 8.4mb марк бичлэгийн өгөгдлийг Зебра ашиглаж болон

ашиглалгүйгээр Коха руу оруулахад шаардагдсан

хугацаа, үүссэн өгөгдлийн сангийн хэмжээ

Page 14: Zebrakoha

ЗЕБРАГ БУСАД СИСТЕМҮҮДЭД АШИГЛАХ

БОЛОМЖ

Ихээхэн хэмжээний текст мэдээлэл бүхий

өгөгдлийн сангаас Зебраг ашиглан хайлт

хийх бүрэн боломжтой.

Өргөдөл гомдлын систем

Хэрэглэгчдэд хандсан

үйлчилгээ, дэмжлэг (жишээ нь

email, comment анализ хийх)

Цахим хуудаснаас хайлт хийх

Хайлтын системд ашиглах (Бямбаагийн

судалгаатай хослох)