Post on 01-Jun-2015
description
WIE?
PETER GROND
@PGROND
VAN ADLIB NAAR EENPUBLIEK DOORZOEKBARE
COLLECTIE
WAT IS EEN GOEDE ZOEKMACHINE?
DE GEBRUIKER KAN EENVOUDIG DE MEESTRELEVANTE GEGEVENS UIT DE DATABASE
HALEN
HOE TE ZOEKEN?
HOE TE ZOEKEN?
HOE TE ZOEKEN?Onderzoek van de UvA in het kader van Catchproject
Multiple Search Using Metadata (MuSeUM)
Zoekmethodiek moest geschikt zijn voorspecialistische en algemene gebruikers
BESTE RESULTATEN MET...Combinatie van gestructureerd enongestructureerdBeperk het aantal velden om in te zoekenBepaal relevantie op basis van beidezoekmethodesScheiding van gegevens voor zoeken en weergave
DEFINIEER DE ZOEKVELDEN
WIE, WAT, WAAR, HOE EN WANNEER
DEFINIEER MAPPING ADLIB NAAR DIEVELDEN
Wie: creation_presentation, creator,inscription.maker
Wat: description, object_name,title.short_description, title
Waar: production.place_presentation,production.place
Hoe: material, material_technique_presentation,technique
Wanneer: inscription.date, production.date.start,production.date.end, production.date_presentation,production.period
INDEXEER NIEUWE STRUCTUURWELKE TOOLS?
WAAROM DRUPAL?Belangrijkste functionaliteiten al besckikbaar
Importeren van externe dataDefiniëren van objecten en veldenUitstekende koppeling met Apache Solr
FlexibelGedegen kennis van het systeem
WAAROM APACHE SOLR?Open sourceEen van de snelste zoekmachinesBewezen staat van dienstGrote communityVolop in ontwikkelingUitstekende koppeling met Drupal
API VOOR GEBRUIK ZOEKMACHINEZoekindex geschikt voor gestructureerd en
ongestructureer zoeken
De meest relevante resultaten moeten als eerst naarboven komen
VAN ADLIB NAAR DRUPALGenerieke PHP component niet afhankelijk vanDrupalBeschikbare module uitgebreid met een Fetcher enParser voor de import in DrupalTe downloaden op Drupal.org
VAN DRUPAL NAAR SOLRBeschikbare module gebruiktVeldnamen in Solr niet dynamischVerder geen aanpassingen noodzakelijk
MUS APISimpele laag voor SolrAfhandelen van fouten en API keysOmschrijven van request naar Solr queryRelevantiebepalingCode beschikbaar op Github
RELEVANTIEBEPALINGViool gemaakt door Antonio Stradivarius uit Italië
Wie: Antonio Stradivarius
Wat: Viool
Waar: Italië
Full text: Antonio Stradivarius Viool Italië
RELEVANTIEBEPALINGStandaard scoring van Solr bleek niet geschikt
Lengte van velden hadden teveel invloed
RELEVANTIEBEPALINGStandaard Solr scoring
WieWatWaarFull text
0 2 4 6 8
Viool
Schilderij
NIEUW MODEL RELEVANTIEBEPALINGEen match in een veld levert +1 op
Relatieve score van documenten onderling die eenmatch hebben in een veld levert maximaal +0.2 op
NIEUW MODELNieuw scoring model
WieWie relatiefWatWat relatiefWaarWaar relatiefFull textFull text relatief
0 1 2 3 4
Viool
Schilderij
RELEVANTIEBEPALINGObjecten met een match in 2 velden komen altijd
hoger in de resultaten
Onverwachte relevante of gerelateerde objectenkomen naar boven
SAMENVATTINGZoek in 5 generieke velden + full textImporteer gegevens uit Adlib in DrupalIndexeer gegevens in zoekmachine Apache SolrInterface en relevantiebepaling met API
VRAGEN?@pgrond
peter@triquanta.nl