Vyhľadávanie najbližších objektov nad viacrozmernými indexmi

Vyhľadávanie najbližších objektov nad viacrozmernými

indexmi

Vyhľadávanie najbližších objektov nad viacrozmernými

indexmi

Z knihy Multidimensional and Metric Data Structures

• Viacrozmerné indexy

• Best-First k nearest neighbour approach

• DFS k nearest neighbour approach

• Pruning Rules

• Záver

Viacrozmerné Indexy

• Hierarchické stromové štruktúry na indexovanie viacrozmerných dát

• Minimum bounding containers

• MBC objektov sú uložené v listoch

Viacrozmerné Indexy – Objekty a MBC

R Strom

• Pruning Rules

• Záver

kNN Dopyt

Vstupom je bod A, číslo k.

Výstupom je k najbližších objektov k tomuto bodu A.

Best First Approach knn(Bod pt, PrioritnyRad queue, int k) {

foreach (p in potomok) {

queue.add(p);

Object o = queue.poll();

if (o je datovy objekt)

vysledok.add(o)

else o.knn(pt, queue);

if (vysledok.size() == k) return vysledok;

queue.add(p);

vysledok.add(o)

queue.add(p);

vysledok.add(o)

queue.add(p);

vysledok.add(o)

queue.add(p);

vysledok.add(o)

queue.add(p);

vysledok.add(o)

queue.add(p);

vysledok.add(o)

queue.add(p);

vysledok.add(o)

Best First Approach - Worst Case

Best First Incremental Approach - R-Optimalita

• Vlastnosť zaručujúca, že pre všetky elementy e navštívené počas behu algoritmu platí

d(q,e) ≤ d(q,ok )

• Ako funkciu vzdialenosti bola zatiaľ použitá metrika MIN_DIST.

• Pruning Rules

• Záver

Depth First Approach DFS(Bod q, PrioritnyRad queue, element e, int k, reference integer Dk) {

if (e je list) {

foreach (p in potomok(e)) {

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

if (size(queue) > k) Dk = queue.elementAt(k);

else {

DFS(pt, queue, p, k, Dk);

if (e je list) {

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

if (d(q,p) < Dk) {

DFS(pt, queue, p, k, Dk); // nemusim prechádzať uzly, ktoré sú vzdialenejšie ako Dk

if (e je list) {

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

foreach (p in potomok(e)) { // nech su potomkovia zoradení podľa rastúceho d(p,q)

if (d(q,p) < Dk) {

} else {

break foreach loop; // ak nájdem jedného s väčším d(p,q), nemusím pokračovať

• Pruning Rules

• Záver

Pruning Rules - Motivácia

• Minimalizácia elementov skúmaných DFS prístupom

Pruning Rules - Motivácia

• Minimalizácia elementov skúmaných DFS prístupom

• So stúpajúcou dimenziou stúpa náročnosť výpočtu MIN_DIST (Curse of Dimensionality...)

• Každý uzol v indexe má tieto informácie o potomkoch :

• MBC(p)• Pointer(p)• Pivot(p)• Rmax(p)

Pruning Rules – Dodatočné informácie o potomkoch

Pruning Rules – MIN_DIST vs PIVOT_DIST

Pruning Rules – Rmax(p)

Pruning Rule 1 (Fukunaga and Narendra)

DFS(Bod q, PrioritnyRad queue, element e, int k, reference integer Dk) {

if (e je list) {

compute(d(q,o));

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

if (e je list) {

compute(d(q,o));

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

if ( d(q, Pivot(p)) – Rmax(p) > Dk ) then ignore p;

Rule 1 : Dk + Rmax(p) < PIVOT_DIST(p,q)

if (e je list) {

if ( d(q, Pivot(e)) – d(p, pivot(e)) > Dk ) then ignore p;

compute(d(q,p));

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

Rule 2 : Dk + PIVOT_DIST(o, p) < PIVOT_DIST(p,q)

Pruning Rule 3 (Kamgar-Parsi, Kanal)

if (e je list) {

foreach (p in potomok(e))

compute(d(q,p));

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

if ( Rmin(p) - d(q, Pivot(p)) > Dk ) then ignore p;

if (e je list) {

compute(d(q,p));

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

if ( Rmin(p)Rmin(p) - d(q, Pivot(p)) > Dk ) then ignore p;

Pruning Rule 3 (Kamgar-Parsi, Kanal) - Rmin

Rule 3 : Dk + PIVOT_DIST(q, p) < Rmin(p)

ANALÓGIA K PRAVIDLU 2, AVŠAK NA NELISTOVEJ VRSTVE

if (e je list) {

if ( d(p, Pivot(e)) – d(q, pivot(e)) > Dk ) then ignore p;

compute(d(q,p));

if (d(q,o) < Dk) {

enqueue(p, d(q,o));

else {

Rule 4 : Dk + PIVOT_DIST(q, p) < PIVOT_DIST(p,o)

Rozšírenie rule 2, ktoré by to pustilo

Pruning Rule 5 (Fukunaga and Narendra), k = 1

if (e je list) {

else {

potomok(e) nech vygeneruje zoznam utriedených prvkov podľa PIVOT_DIST(q,p), pre každé p potomok e, nech sú spracovávané v tomto poradí.

If (k = 1) {

foreach(p in potomok(e)) {

if (PIVOT_DIST(q,p) >D1) exit foreach loop;

if (PIVOT_DIST(q,p) + Rmax(p) < D1) D1 = PIVOT_DIST(q,p) + Rmax(p);

PIVOT_DIST(q,p) + Rmax(p) = MAX_DIST(p,q)

• Odhad vzdialenosti medzi najvzdialenejším potomkom uzla e a dopytovým bodom q.

Pruning Rule 5 (Larsen and Kanal), k = 1

PIVOT_DIST(q,p) + Rmax(p) = MAX_DIST(p,q)

– Odhad vzdialenosti medzi najvzdialenejším potomkom uzla e a dopytovým bodom q.

PIVOT_DIST(q,p) + Rmin(p) = MAXNEAREST_DIST(p,q)

– Odhad vzdialenosti medzi najbližším potomkom uzla e a dopytovým bodom q.

MAXNEAREST_DIST

• MAXNEAREST_DIST sa dá určiť aj za situácie, kedy Rmin nepoznáme.

• Pre indexy používajúce Minimum Bounding Sphere platí (V Euclidovskom priestore) :

MAXNEAREST_DIST(p,q) = Odmocnina(PIVOT_DIST(q,p)^2 + Rmax(p)^2)

MAXNEAREST_DIST

MAXNEAREST_DIST(p,q) = Odmocnina(PIVOT_DIST(q,p)^2 + Rmax(p)^2)

MAXNEAREST_DIST

Cena O(d^2), kde d je dimenzia

if (e je list) {

else {

If (k = 1) {

if (PIVOT_DIST(q,p) + Rmax(p) < D1) D1 = PIVOT_DIST(q,p) + Rmax(p);

Pruning Rule 5 (Larsen and Kanal), k = 1

if (e je list) {

else {

If (k = 1) {

if (PIVOT_DIST(q,p) + Rmin(p) < D1) D1 = PIVOT_DIST(q,p) + Rmin(p);

Pruning Rule 5, k = 1DFS(Bod q, PrioritnyRad queue, element e, int k, reference integer Dk) {

if (e je list) {

else {

If (k = 1) {

if (MAXNEAREST_DIST(p,q) < D1) D1 = MAXNEAREST_DIST(p,q);

Pruning Rule 5, Diskusia

• Zoznam potomkov e je lepšie triediť pomocou MIN_DIST ako hlavného kľúča a MAXNEAREST_DIST ako sekundárneho, namiesto triedenia pomocou PIVOT_DIST

• MIN_DIST, MAXNEAREST_DIST možno vypočítať z Rmax, Rmin a PIVOT_DIST.

• Pruning Rules

• Záver

Záver

• DFS algoritmus síce možno vylepšiť pomocou orezávacích pravidiel, ale nie je šanca dosiahnuť R – optimalitu ako u Best-First algoritmu.

• DFS algoritmus má teoreticky lepšiu pamäťovú zložitosť.

• Na základe prezentovaných pravidiel možno upraviť aj Best-First algoritmus.

Otázky

Vyhľadávanie najbližších objektov nad viacrozmernými indexmi

Documents

Transcript of Vyhľadávanie najbližších objektov nad viacrozmernými indexmi

Zakon o Graditvi Objektov v RS

1. 1 11 · 3.11 Montažni objekti 21 4. Enotna klasifikacija objektov 4.1 Enotna klasifikacija objektov 23 ... o razvrščanju objektov glede na zahtevnost gradnje, - Za nezahtevne

DETEKCIA AKLASIFIKÁCIA OBJEKTOV VPRÍKLADOCH a Klasifikacia Objektov v... · 2.3 Úlohy 2.3.1 Filtracné jadráˇ Napíšte matice reprezentujúce ﬁltraˇcné jadrá metód Sobel,

Univerzálne navrhovanie objektov - Implementačná agentúra … · 2016-02-16 · Univerzálne navrhovanie objektov komunitných sociálnych služieb Lea Rollová Zuzana Čerešňová

Komplexné siete a vyhľadávanie informácií

SemSets Model pre sémantické vyhľadávanie zoznamov entít

Funkcijska vrata za gradnjo objektov - storage.googleapis.com

Odeja - Katalog tekstilne opreme objektov (SLO)

Využitie teórie fuzzy množín pri zhlukovaní objektov

OBJEKTOV ORIENTOVANÉ PROGRAMOVÁNÍhunka/vyuka/javaOOP/XXOOPR.pdf · 2013-09-17 · objektov Ě orientovanÉ programovÁnÍ ur Čeno pro vzd ĚlÁvÁnÍ v akreditovanÝch studijnÍch

DENDROKRONOLOŠKE RAZISKAVE OBJEKTOV NA DOLENJSKEM ...

Sledenje objektov v robotskem nogometu

Objektov ě rela č ní databáze

Rekonstrukcija zidanih objektov

VPLIV IZGRADNJE HIDROENERGETSKIH OBJEKTOV NA …

Elaborat celovite in trajne rešitve problematike objektov ...

Technické prostriedky pre zabezpečenie ochrany objektov

Legalizacija objektov na kmetiji - kmetzav-mb.si

Paraleln é vyhľadávanie nad viacrozmernými indexmi.

STATIČNA SANACIJA IN UTRDITEV STARIH STAVB …STATIČNA SANACIJA IN UTRDITEV OBJEKTOV 2.1 STANJE OBJEKTOV PRED PRENOVO Zidovi objektov so bili zelo nehomogeni in razpokani. 6 Zidovi