Vortex 3.0 – hva er nytt? · 9/29/2011  · treff på studiene) – Eller det pekes til...

10
29.09.2011 1 Allmøte på USIT Vortex 3.0 og nytt fritekstsøk for UiO Tomm Eriksen Webseksjonen, USIT 29. september 2011 Vortex 3.0 – hva er nytt? Nytt administrasjonsgrensesnitt Nye rapporter Andre forbedringer

Transcript of Vortex 3.0 – hva er nytt? · 9/29/2011  · treff på studiene) – Eller det pekes til...

29.09.2011

1

Allmøte på USIT Vortex 3.0 og nytt fritekstsøk for UiO

Tomm Eriksen Webseksjonen, USIT 29. september 2011

Vortex 3.0 – hva er nytt?

•  Nytt administrasjonsgrensesnitt •  Nye rapporter •  Andre forbedringer

29.09.2011

2

Nytt administrasjonsgrensesnitt

•  Nytt grafisk design –  I tråd med UiOs design for applikasjoner –  Tilnærmet alle dialoger er utformet på nytt

•  Viktige funksjoner mer synlig

•  Oppgaveorientert inngang mot viktigste oppgaver

29.09.2011

3

Nytt administrasjonsgrensesnitt (forts)

•  Ulike tilbakemeldinger fra systemet er skilt fra hverandre

•  Forbedringer i redigering –  Rekkefølge på felter i redigering av forskningsprosjekt,

forskergruppe og masteroppgave er endret –  Mer intituiv plassering og konsekvent navngivning for å

skru av eller på høyrekollone

Nytt administrasjonsgrensesnitt (forts)

•  Mulig å redigere på mobiltelefon og lesebrett •  Enklere å bytte språk

29.09.2011

4

Nye rapporter

•  Oversikt over person- og enhetspresentasjoner som overstyrer informasjon fra SAPUiO

•  Oversikt over innhold –  På hele nettstedet –  I alle mapper

29.09.2011

5

Andre forbedringer

•  Mulig å legge til person i adressebok •  Automatisk generering og fremvisning

miniatyrbilde for opplastet video •  Egen komponent for arrangementer (med ikon for

dato slik som i arrangementsliste)

Nytt fritekstsøk

29.09.2011

6

Nytt fritekstsøk – viktigste mål •  Bedre relevans •  Fasettering/filtrering •  Samle ulike søk i én søketjeneste •  Globalt søk hele UiO.no •  Lokale søk pr. enhet •  Adgangsbegrenset søk

29.09.2011

7

Innhold i nytt fritekstsøk

•  Datakilder –  Nettsteder i Vortex - åpen og adgangsbegrenset

informasjon. –  Nettsteder utenfor Vortex - kun åpen informasjon –  Liste med hoster (whitelist)

•  Datamengde –  Ca 1 000 000 dokumenter

•  Teknologi –  Apache Solr- søkemotor basert på åpen kildekode –  Apache ManifoldCF til crawling (for innhold utenfor

Vortex)

Konsekvenser for redaksjonelt arbeid

•  Alt som er publisert i Vortex og som er åpent blir nå søkbart i fritekstsøk –  Fjernes ved å avpublisere eller adgangsbegrense

innholdet –  Endring i Vortex 3.0 – når du kopierer et dokument blir

kopien avpublisert –  robots.txt – fungerer fortsatt for å eksludere åpent

innhold fra indeksering

29.09.2011

8

Litt om hvordan søket fungerer

•  Input: Søk på ett eller flere ord –  AND – søk (ved bruk av flere søkeord) –  Eksakt søk (“klage på karakter” vs. klage på karakter) –  (Avansert funksjonalitet for søk på ressurstype m.m.)

•  Output: Dokumenter som innholder søkeordene

–  Eller variasjoner av ordet (eks. søk på studier gir også treff på studiene)

–  Eller det pekes til dokumentet med lenketekst som inneholder søkeord(ene)

Rangering av dokumenter i trefflisten

•  Ulik vekting – ord i tittel teller mer enn ord brødtekst

•  Sjeldne søkeord blir vektet mer enn høyfrekvente (slik som i, for, men, på)

•  Sider fra visse underdomener er viktigere enn andre

•  De mest populære eller mest besøkte sidene er viktigere enn andre

•  Landingssider og topp-nivå-sider er viktigere enn undersider

29.09.2011

9

Rangering av dokumenter i trefflisten(2)

•  Nye sider er viktigere enn gamle •  Sider på norsk blir prioritert fremfor engelsk (men

motsatt hvis man søker fra engelsk del av siden) •  Lenketekster (hva andre sier om denne siden)

teller mer enn hva siden "sier om seg selv" •  Noen søk er hardkodet til å gi visse treff,

uavhengig av om siden finnes i indeksen eller ikke (quick-links)

Rangering av dokumenter i trefflisten(3)

•  Innhold under /for-ansatte/ blir noe nedprioritert ved vanlig søk

•  Visse dokumenttyper (zip, txt, jar, exe etc) er fjernet eller vektes kraftig ned, mens andre (doc, pdf, xls) vektes bare noe ned

•  Nedprioriterer innhold som har filnavn som tilsier at det er en arbeidskopi (-(1).html, -kopi.html o.l.)

•  Metadata eller keywords vektes ikke, slik heller ikke Google gjør.

29.09.2011

10

Nytt fritekstsøk – veien videre

•  Stavekontroll – (did you mean?) •  Innebygd lokalsøk – forslag innenfor tema •  Fasetter for person- og enhetssøk •  Bedre støtte mellom bokmål og nynorsk •  Brukertest

Gi oss gjerne tilbake- melding!