Bài toán phân cụm và khai phá dữ liệu

download Bài toán phân cụm và khai phá dữ liệu

of 20

Transcript of Bài toán phân cụm và khai phá dữ liệu

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    1/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    Chng I: Gii thiu bi ton phn cm v khai ph d liuI.Gii thiu

    II. Tch tuyn tnh hoc li1.Tch tuyn tnh.2 .Tch ton phng li.

    III. Cm theo tm1.Trng hp .||),( 1 = =

    n

    j jjxaxad

    2.Trng hp .||||),(1

    2

    = =n

    j jjxaxad

    3.Ti u n iu.IV. Cm theo siu phngV.Phn cm trn mt phng v mt cu

    1. Biu Voronoi.2. bi ton k-median lin tc.3.Phn b k im trn hnh cu.

    Chng II: tng thut tonI. Cch gii quytII. Trng hp gp phi II. Trng hp gp phi

    Chng III: Phn tch v thit kI. Cc bc thc hin I. Cc bc thc hin

    II.Xy dng lp.1.Cc thuc tnh ca i tng2.Cc phng thc ca i tng.

    III. Gii thiu chng trnh

    Chng IV: Kt lunI. Nhn xt v nh gi kt qu

    1.S im n=1000; S cm 102.S im n=2000; S cm 203.S im n=3000; S cm 304.Nhn xt

    II. Kt lun

    Chng I: Gii thiu bi ton phn cm v khai ph d liu

    1

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    2/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    I.Gii thiuTrong nhiu tnh hung thc t ta gp vn sau y: ta c mt tp hp i tng no v mun chia tp ra thnh mt s cm (nhm), mi cm gm cc phn t gnnhau(ging nhau) tho mt ngha nht nh. Vn ny xut hin t lu, vo nhngnm 60 th k trc mi c ch v nghin cu bng phng php ton hc, bt u

    hai lnh vc: phn loi trong sinh hc v nhn dng trong vic dy my. Ngy nayphm vi ng dng ca bi ton chia cm bao gm nhiu lnh vc, t sinh hc, tm l hc,y hc, k thut, cho n kinh t tip th, v.vVi d:1.(Y hc) Bnh nhn l cc d liu vt l v nhng bnh nhn b nghi ung thu v v tamun da v d liu phn cc i tng thnh hai nhm u lnh v u c.2.(Kinh t) i tng l cc d liu ti chnh v nhng doanh nghip ang hot ng vta mun da vo cc d liu y phn cc i tng thnh hai nhm: Doanh nghip trn tht bi v doanh nghip ang lm n bnh thng.C nhiu cch tip cn khc nhau i vi vn nu: thng k, my mc, ti u,trong cch tip cn ti u t ra c hiu qu hn c. Vi bi ton ny chng ta tip

    cn bi ton dng ti u ton cc.II. Tch tuyn tnh hoc liBi ton t ra nh sau: cho hai tp A={ raaa ,,, 21 } v B={ rbbb ,,, 21 }, hy tm

    mt hm )(xf thuc mt lp hm cho trc F tch hai tp A,B, ngha l sao cho

    1)(

    1)(

    >

    c[j].c-c[j].d))) j=i;

    return j;}

    //tm cnh max cm x sau khi to tm x v nx chia cm x thnh //hai cum tiu nht

    void PhanCum::XDTam(int x)

    12

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    13/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    {

    int p,q;

    p=0;q=1;

    for (int i=c[x].d;i

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    14/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    for (int i=c[x].d;i

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    15/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    double PhanCum::Tinh(int x)

    {

    double E=0;

    for (int i=c[x].d;i

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    16/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    x+=d[j].td.x;

    y+=d[j].td.y;

    }

    if (k!=0){

    c[i].td.x=int(x/k);

    c[i].td.y=int(y/k);

    }

    }

    }

    //tnh li kt qu ti u cho cc cm t 1 dn nx

    double PhanCum::Tinh()

    {

    double E=0;

    for (int i=0;i

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    17/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    DIEM temp=d[i];

    d[i]=d[j];

    d[j]=temp;

    }i=0;j=0;

    int k=0;

    long x=0,y=0;

    do

    {

    if (d[j+1].c==d[j].c) {

    d[j].c=i;

    x+=d[j].td.x;

    y+=d[j].td.y;

    }

    else {

    d[j].c=i;

    x+=d[j].td.x;

    y+=d[j].td.y;

    c[i].td.x=int(x/(j-k+1));

    c[i].td.y=int(y/(j-k+1));

    x=y=0;

    c[i].d=k;

    c[i].c=j+1;

    k=j+1;

    i++;

    }

    j++;

    17

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    18/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    } while (j

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    19/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    Chng IV: Kt lun

    I. Nhn xt v nh gi kt quVi cc d liu ngu nhin:

    1.S im n=1000; S cm 10

    2.S im n=2000; S cm 20;

    19

  • 7/29/2019 Bi ton phn cm v khai ph d liu

    20/20

    Bo co thc tp SV: Nguyn Quang Thng SV: Nguyn Quang Thng

    3:S im n=3000; S cm 30;

    4.Nhn xtVi s im b tr u th cc cm phn b rt u ging nh cc t ong.

    II. Kt lunBi ton phn cm v khai ph d liu l mt bi ton hay v c nhiu cch gii

    qut khc nhau, y l mt cch gii quyt mang tnh cht tham lam na quy nhiuhn mong a n mt kt qu ti u nht. Bi ton ngy cng ti u hn sau mibc lp nn n s dng li sau mt s hu han ln.

    Cch gii quyt bi ton ny ch mang li kt qu ti u c b nhng n chy

    c d liu rt ln. Chng trnh chy n nh. Vi cc d liu nh th n rt chnhxc.Chng ta so th ci tin mt s on chng trnh chng trnh chy nhanh

    hn nh vic sp xp chng ta c th dng quicksort hay dng sp xp vun ng...Ta c th p dng bi ton ny vo mt s trng hp ti u v khong cch nh

    vic b tr cc trng hc hay bnh vin sao cho dn di li l tin nht v khong cch.