Vortex 3.0 – hva er nytt? · 9/29/2011 · treff på studiene) – Eller det pekes til...
Transcript of Vortex 3.0 – hva er nytt? · 9/29/2011 · treff på studiene) – Eller det pekes til...
29.09.2011
1
Allmøte på USIT Vortex 3.0 og nytt fritekstsøk for UiO
Tomm Eriksen Webseksjonen, USIT 29. september 2011
Vortex 3.0 – hva er nytt?
• Nytt administrasjonsgrensesnitt • Nye rapporter • Andre forbedringer
29.09.2011
2
Nytt administrasjonsgrensesnitt
• Nytt grafisk design – I tråd med UiOs design for applikasjoner – Tilnærmet alle dialoger er utformet på nytt
• Viktige funksjoner mer synlig
• Oppgaveorientert inngang mot viktigste oppgaver
29.09.2011
3
Nytt administrasjonsgrensesnitt (forts)
• Ulike tilbakemeldinger fra systemet er skilt fra hverandre
• Forbedringer i redigering – Rekkefølge på felter i redigering av forskningsprosjekt,
forskergruppe og masteroppgave er endret – Mer intituiv plassering og konsekvent navngivning for å
skru av eller på høyrekollone
Nytt administrasjonsgrensesnitt (forts)
• Mulig å redigere på mobiltelefon og lesebrett • Enklere å bytte språk
29.09.2011
4
Nye rapporter
• Oversikt over person- og enhetspresentasjoner som overstyrer informasjon fra SAPUiO
• Oversikt over innhold – På hele nettstedet – I alle mapper
29.09.2011
5
Andre forbedringer
• Mulig å legge til person i adressebok • Automatisk generering og fremvisning
miniatyrbilde for opplastet video • Egen komponent for arrangementer (med ikon for
dato slik som i arrangementsliste)
Nytt fritekstsøk
29.09.2011
6
Nytt fritekstsøk – viktigste mål • Bedre relevans • Fasettering/filtrering • Samle ulike søk i én søketjeneste • Globalt søk hele UiO.no • Lokale søk pr. enhet • Adgangsbegrenset søk
29.09.2011
7
Innhold i nytt fritekstsøk
• Datakilder – Nettsteder i Vortex - åpen og adgangsbegrenset
informasjon. – Nettsteder utenfor Vortex - kun åpen informasjon – Liste med hoster (whitelist)
• Datamengde – Ca 1 000 000 dokumenter
• Teknologi – Apache Solr- søkemotor basert på åpen kildekode – Apache ManifoldCF til crawling (for innhold utenfor
Vortex)
Konsekvenser for redaksjonelt arbeid
• Alt som er publisert i Vortex og som er åpent blir nå søkbart i fritekstsøk – Fjernes ved å avpublisere eller adgangsbegrense
innholdet – Endring i Vortex 3.0 – når du kopierer et dokument blir
kopien avpublisert – robots.txt – fungerer fortsatt for å eksludere åpent
innhold fra indeksering
29.09.2011
8
Litt om hvordan søket fungerer
• Input: Søk på ett eller flere ord – AND – søk (ved bruk av flere søkeord) – Eksakt søk (“klage på karakter” vs. klage på karakter) – (Avansert funksjonalitet for søk på ressurstype m.m.)
• Output: Dokumenter som innholder søkeordene
– Eller variasjoner av ordet (eks. søk på studier gir også treff på studiene)
– Eller det pekes til dokumentet med lenketekst som inneholder søkeord(ene)
Rangering av dokumenter i trefflisten
• Ulik vekting – ord i tittel teller mer enn ord brødtekst
• Sjeldne søkeord blir vektet mer enn høyfrekvente (slik som i, for, men, på)
• Sider fra visse underdomener er viktigere enn andre
• De mest populære eller mest besøkte sidene er viktigere enn andre
• Landingssider og topp-nivå-sider er viktigere enn undersider
29.09.2011
9
Rangering av dokumenter i trefflisten(2)
• Nye sider er viktigere enn gamle • Sider på norsk blir prioritert fremfor engelsk (men
motsatt hvis man søker fra engelsk del av siden) • Lenketekster (hva andre sier om denne siden)
teller mer enn hva siden "sier om seg selv" • Noen søk er hardkodet til å gi visse treff,
uavhengig av om siden finnes i indeksen eller ikke (quick-links)
Rangering av dokumenter i trefflisten(3)
• Innhold under /for-ansatte/ blir noe nedprioritert ved vanlig søk
• Visse dokumenttyper (zip, txt, jar, exe etc) er fjernet eller vektes kraftig ned, mens andre (doc, pdf, xls) vektes bare noe ned
• Nedprioriterer innhold som har filnavn som tilsier at det er en arbeidskopi (-(1).html, -kopi.html o.l.)
• Metadata eller keywords vektes ikke, slik heller ikke Google gjør.