Zebrakoha
-
Upload
battushig-namsraidorj -
Category
Education
-
view
602 -
download
3
Transcript of Zebrakoha
ZEBRA ХАЙЛТЫН СИСТЕМ ТҮҮНИЙГ
КОХАД АШИГЛАХ НЬ
Н.Баттүшиг
Информатикийн хүрээлэн, МТЛ эшда
ХАЙЛТЫН СИСТЕМҮҮД, ZEBRA ХАЙЛТЫН
СИСТЕМ
КОХАД ЗЕБРАГ АШИГЛАХ ТУХАЙ, МУИС-н
НОМЫН САНГИЙН ХӨРВҮҮЛЭЛТ
ZEBRA-г АШИГЛАХ БУСАД ХЭРЭГЛЭЭ
УЛААНБААТАР ХОТЫН ГЭРЭЛТҮҮЛГИЙН
СИСТЕМИЙН ХЯНАЛТ, УДИРДЛАГЫН ПРОГРАМ
ХАНГАМЖ
ХАЙЛТЫН СИСТЕМҮҮДИЙН ХЭРЭГЦЭЭ
Ямар нэгэн өгөгдлийн сангийн болон вэб
сайтуудын мэдээлэл ихсэх тутамд
хэрэглэгчид мэдээллийг хайх боломжийг
олгох шаардлага зайлшгүй тулгардаг.
Програм хангамж хөгжсөн өнөө цагт
нээлттэй эх бүхий хайлтын системүүдээс
сонгож ашиглах боломжтой болсон.
ХАЙЛТЫН СИСТЕМҮҮДИЙГ СОНГОХОД
АНХААРАХ ЗҮЙЛС
Хайлтын системүүдийг бичигдсэн
програмчлалын хэл, индексээ хэрхэн хадгалдаг,
(файл, өгөгдлийн сан гм) хайлтын боломжууд
(Булийн үйлдлүүд, үгийн үндсээр хайх),
эрэмбэлэх аргууд, индекслэх боломжтой
файлын төрлүүд (HTML, PDF, энгийн текст
файл гм) шаталсан индекслэлт хийх боломж
зэрэг олон хүчин зүйлээс нь хамааруулан
сонгож ашиглах шаардлагатай
ХАЙЛТЫН СИСТЕМҮҮДИЙН АЖИЛЛАХ
ЕРӨНХИЙ ЗАРЧИМ
ZEBRA SEARCH ENGINE
Zebra бол өндөр хүчин чадал бүхий
ерөнхий зориулалтын бүтэцлэгдсэн текст
индекслэлт, хайлтын систем юм. Зебра
email, XML, MARC гэх мэт олон төрлийн
бүтэцлэгдсэн өгөгдлийг импортлон авч
тэдгээрийг Булийн илэрхийлэл болон
хамааралтай шинжээр нь ангилсан
асуулгуудаар хайх боломж олгоно.
ZEBRA ҮНДСЭН ҮЗҮҮЛЭЛТҮҮД
Хэдэн арван сая бичлэг бүхий хэдэн арван
гигабайт хэмжээтэй өгөгдлийн сангаас хайлт
хийх чадвартай
Системийн ажиллагааг зогсоолгүй
найдвартайгаар, тухай бүрт нь өгөгдлийн
сангийн шинэчлэлтийг хийх чадвартай
Мэдээлэл хайлтын Z39.50 протоколыг дэмждэг
учраас энэ протоколыг ашигладаг олон
програмуудад ашиглах боломжтой
Perl, C, C++, Java, Tcl, Visual Basic, Python, PHP
гэх мэт хэлүүдээс клиент програм бичих
боломжтой
KOHA – OPEN SOURCE ILS
Нээлттэй эх бүхий номын сангийн
програм Integrated Library System (ILS)
Шинэ Зеландын Katipo Communications
Ltd анх 2000 онд зохиосон
perl хэл дээр програмчлагдсан
Сүүлийн хувилбар 3.2 - 2010 онд
Дэлхий даяар байх програм хангамжийн
компаниуд, номын сангийн технологийн
ажилчид хөгжүүлэлтийг хийдэг
ЗЕБРАГ КОХАД АШИГЛАХ БОЛОМЖ
Коха системийг сурталчлан суурилуулж,
үйлчилгээ хийдэг LibLime компани
нээлттэй эх бүхий өгөгдлийн сангийн
олон шилдэг хайлтын системүүдийг
(жишээлбэл MySQL текст хайлт,
PostgreSQL, Lucene, Plucene зэрэг)
сайтар туршсаны эцэст Зебраг хайлтын
системээр сонгосон бөгөөд номын
сангийн нэгжүүдийн мэдээллийг
хадгалахаар Кохагийн 3.0 хувилбараас
эхлэн шинээр нэмж оруулсан.
ЗЕБРАГ КОХАД АШИГЛАХАД ШИЙДВЭРЛЭХ
АСУУДЛУУД
Коха системийг суурилуулах үед номын сангийн
нийт нэгжийн тоо 100000 – с дээш бол Зебра
хайлтыг ашиглахыг зөвлөсөн байдаг.
Зебраг суурилуулсны дараа зааврын дагуу
тохируулга хийнэ.
Зебра юникод дэмждэг боловч Кохатай ажиллах
үед кирилл үсгээр хайлт хийж чаддаггүй тул
хайлтын нэмэлт тохируулга хийсэн. (sort-string-
utf, word-phrase-utf)
МУИС – Н НОМЫН САНГИЙН ӨГӨГДЛИЙН
САН ХӨРВҮҮЛЭЛТ
МУИС-н номын сангийн 240000 гаруй
номын мэдээллийг марк21 стандарт руу
хөрвүүлэхэд 1 Gb хэмжээ бүхий архивын
файл үүссэн. Үүнээс жишээ болгож орос
номын 23000 номын мэдээлэл бүхий
8.4mb марк21 стандарт файлын бичлэгийг
Кохад оруулахад нийт 56 цаг зарцуулж
файлын хэмжээ 100mb болсон байлаа.
Энэ аргаар нийт 240000 гаруй номыг
Кохад оруулна гэдэг нь үр дүнгүй нь
харагдаж байна.
МУИС – Н НОМЫН САНГИЙН ӨГӨГДЛИЙН
САН ХӨРВҮҮЛЭЛТ: ZEBRA
Харин Кохад хайлтын Zebra системийг
судлан тохируулга хийж номнуудаа
оруулахад өмнөх орос номын файлыг 16
минутанд оруулж нийт файлын хэмжээ
9,4mb болж байлаа. Энэ аргаараа нийт
1Gb хэмжээ бүхий 242650 номоо
хөрвүүлэхэд 2 цагийн хугацаа зарцуулж
нийт файлын хэмжээ 952mb болсон.
NoZebra Zebra
Зарцуулсан хугацаа (цаг)
56 0.375
Өгөгдлийн сангийн хэмжээ (MB)
100 9.4
56
0.375
100
9.4
0
20
40
60
80
100
120
МУИС-н номын сангийн орос номын 23000 номын мэдээлэл
бүхий 8.4mb марк бичлэгийн өгөгдлийг Зебра ашиглаж болон
ашиглалгүйгээр Коха руу оруулахад шаардагдсан
хугацаа, үүссэн өгөгдлийн сангийн хэмжээ
ЗЕБРАГ БУСАД СИСТЕМҮҮДЭД АШИГЛАХ
БОЛОМЖ
Ихээхэн хэмжээний текст мэдээлэл бүхий
өгөгдлийн сангаас Зебраг ашиглан хайлт
хийх бүрэн боломжтой.
Өргөдөл гомдлын систем
Хэрэглэгчдэд хандсан
үйлчилгээ, дэмжлэг (жишээ нь
email, comment анализ хийх)
Цахим хуудаснаас хайлт хийх
Хайлтын системд ашиглах (Бямбаагийн
судалгаатай хослох)