dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf ·...

Wprowadzenie do zbiorów przybli»onych

dr Agnieszka Nowak-Brzezi«ska

Instytut Informatyki, Uniwersytet �l¡ski, ul. B¦dzinska 39, Sosnowiec, PolskaTel (32) 2 918 381, Fax (32) 2 918 283

Wykªad II i III

Wst¦p

• Teoria zbiorów przybli»onych zostaªa sformuªowana przez ZdzisªawaPawlaka w 1982 roku.

• Jest to matematyczne narz¦dzie pozwalaj¡ce wnioskowa¢ w warunkachniepewno±ci o nieostrych poj¦ciach. W najwi¦kszym skrócie jest to nowepodej±cie do problemów nieostrych poj¦¢.

• Jest ona wykorzystywana jako narz¦dzie do syntezy zaawansowanych iefektywnych metod analizy oraz do redukcji zbiorów danych. Znalazªa onazastosowanie m.in. w eksploracji danych i odkrywaniu wiedzy, zªo»onychzadaniach klasy�kacji oraz w komputerowych systemach wspomaganiadecyzji.

• Metodologia zbiorów przybli»onych zyskaªa sobie du»¡ popularno±¢. Jestona przedmiotem bada« wielu osób na caªym ±wiecie. Po±wi¦cono jejprzeszªo 2000 publikacji, w tym kilkana±cie ksi¡»ek. Cyklicznie odbywaj¡si¦ na jej temat mi¦dzynarodowe konferencje i seminaria (m.in. w USA,Kanadzie i Japonii).

Zbiory przybli»one znane na caªym ±wiecie

Wprowadzenie do teorii zbiorów przybli»onychCz¦±¢ I

De�nition

Wprowadzenie do teorii zbiorów przybli»onych.Cz¦±¢ I.

System informacyjny

Istnieje szereg struktur, które mog¡ by¢ wykorzystane do przechowywaniadanych. Sposób reprezentacji danych powinien jednak posiada¢ dwiepodstawowe cechy:

• uniwersalno±¢ - (powinien pozwala¢ na gromadzenie i przechowywaniezbiorów ró»norodnych danych, opisuj¡cych badane zjawiska i procesy),

• efektywno±¢ - (powinien umo»liwia¢ w ªatwy sposób komputerow¡ analiz¦tak zapisanych danych).

Obie te cechy posiada znany i cz¦sto wykorzystywany w praktyce tablicowysposób reprezentacji danych.

System informacyjny

De�nicjaSystem informacyjny SI zde�niowany jest jako dwójka: SI = (U,A) gdzie:

• U jest niepustym, sko«czonym zbiorem obiektów,

• A jest niepustym, sko«czonym zbiorem atrybutów.

• Zbiór Va jest dziedzin¡ atrybutu a ∈ A, V =⋃

a∈A Va.

De�niuje si¦ rownie» funkcj¦ informacyjn¡. f : U × A→ V , tak¡, »e ∀a∈A,x∈U ,f (a, x) ∈ Va.

System informacyjnyJak nale»y rozumie¢ de�nicj¦ SI?

Rysunek: Jak nale»y rozumie¢ de�nicj¦ SI?

f (C2, 1) = Niski, f (C2, 2) = Wysoki, f (C1, 4) = 2,

f (C1, 2) = 1, f (S , 3) = O�, f (S , 7) = On.

f : U × A→ V : ∀a∈A,x∈U f (a, x) ∈ Va gdzie Va jest dziedzin¡ atrybutu a ∈ A.

System informacyjnySystem informacyjny a tabela bazy danych?

Rysunek: Jak nale»y rozumie¢ de�nicj¦ SI?

Poj¦cie systemu informacyjnego odpowiada poj¦ciowo poj¦ciu tabeli (relacji) wbazach danych.

System informacyjny a system decyzyjny

System decyzyjny to rodzaj systemu informacyjnego, który przydziela obiektydo pewnych klas okre±lonych za pomoc¡ jednego z atrybutów, zwanegoatrybutem decyzyjnym.

Atrybuty zawarte w zbiorze A s¡ nazywane warunkowymi albo po prostuwarunkami, za± d jest nazywane konkluzj¡ b¡d¹ po prostu decyzj¡ systemu.Zbiory te s¡ zbiorami sko«czonymi.i-ta klasa decyzyjna to zbiór obiektów Ci = {x ∈ U : d(x) = di} , gdzie di jesti -t¡ warto±ci¡ decyzji odpowiadaj¡c¡ zbiorowi warto±ci decyzjiVd = {d1, . . . , d|V

d|} .

Reguªa decyzyjna jest formuª¡: (ai1 = v1) ∧ . . . ∧ (aik= vk)⇒ (d = vd ), gdzie

1 ≤ i1 < . . . < ik ≤ m, vj ∈ Vai j .

Indukcja reguª decyzyjnych

W procesie indukcji pomocna jest funkcja rozró»nialno±ci fA, która pozwalabudowa¢ reguªy minimalne (optymalne) dla danej tablicy decyzyjnej.Funkcja rozró»nialno±ci fA dla danego systemu informacyjnego A jest funkcj¡boolowsk¡ m zmiennych boolowskich a∗1 , . . . , a

∗m (odpowiadaj¡cych atrybutom

a1, . . . , am) zde�niowanym przez:

fA =∧{∨

c∗ij |1 ≤ j ≤ i ≤ n, cij 6= ∅}

gdzie c∗ij = {a∗|a ∈ cij}.

Tablica decyzyjna

Tablic¡ decyzyjn¡ DT nazywa¢ b¦dziemy system informacyjny w postaci:DT = (U,A ∪ {d}), gdzie d /∈ A jest atrybutem decyzyjnym niezaliczanym dozbioru atrybutow A systemu.Atrybuty a ∈ A nazywamy atrybutami warunkowymi.

System informacyjny - tablica decyzyjna

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak5 tak nie wysoka nie6 nie tak normalna nie

Tabela przedstawia przykªadowy system informacyjny zawieraj¡cy wyniki bada«przeprowadzonych dla grupy pacjentów. System ten skªada si¦ z sze±ciuobiektów (1, 2, ..,6) oraz czterech atrybutów: Ból gªowy, Ból mi¦±ni,

Temperatura, Grypa.

De�nicja przykªadowego SI

Rozpatrywany system informacyjny mo»e zosta¢ zapisany w nast¦puj¡cejpostaci: SI = (U,A,V , f ) gdzie:

• U={1, 2, 3, 4, 5, 6}

• A={Ból gªowy, Ból mi¦±ni, Temperatura, Grypa}

• V = VBolglowy ∪ VBolmiesni ∪ VTemperatura ∪ VGrypa

VBolglowy = {nie, tak}VBolmiesni = {nie, tak}VTemperatura = {normalna,wysoka, bardzowysoka}VGrypa = {nie, tak}

• f : U × A→ V (np. f(1, Ból gªowy)=nie; f(3, Grypa) = tak)

Powtórka � iloczyn kartezja«ski

Iloczyn kartezja«ski zbiorów A i B to zbiór wszystkich par uporz¡dkowanych(a, b), takich, »e a nale»y do zbioru A, za± b nale»y do zbioru B. Oznacza si¦go symbolem A× B. Formalnie:

A× B = {(a, b) : a ∈ A, b ∈ B}

Iloczyn kartezja«ski mo»e by¢ zbudowany na tym samym zbiorze, np. A×A, cobywa oznaczane A2. Formalnie:

A× A = {(a, b) : a ∈ A, b ∈ A}

Iloczyn kartezja«ski dla zbioru obiektów U tablicy decyzyjnej DT :Iloczyn kartezja«ski U × U to zbiór par obiektów.

U × U = {(x , y) : x ∈ U, y ∈ U}

U×U = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6),

(3, 3), (3, 4), (3, 5), (3, 6), (4, 4), (4, 5), (4, 6), (5, 5), (5, 6), (6, 6)}

Powtórka � relacja

De�nition

Relacja pomi¦dzy elementami zbioru A a elementami zbioru B to wybranypodzbiór iloczynu kartezja«skiego A× B.

Relacj¦ tworz¡ pary elementów wybrane z iloczynu kartezja«skiego wedªugpewnego kryterium.W praktyce najpopularniejsze i najszerzej stosowane s¡ relacje dwuargumentowe(dwuczªonowe, binarne), zwykle nazywane po prostu relacjami.

De�nition

Je±li zaªo»ymy, »e relacja nazywa si¦ np. R, to zapis xRy oznacza, »e x jest wrelacji R z y .

Relacja nierozró»nialno±ci

O relacji nierozró»nialno±ci mówimy wówczas, gdy w rozpatrywanym systemiemamy do czynienia z obiektami o identycznych opisach, b¡d¹ obiektami o tejsamej warto±ci danego atrybutu (-ów [kilku, nie wszystkich]).

Analizuj¡c poszczególne obiekty z tabeli mo»na zaobserwowa¢, »e obiekty onumerach 1, 4 i 6 maj¡ te same warto±ci atrybutów: ból gªowy oraz ból mi¦±niza± obiekty o numerach 1 i 5 maj¡ t¦ sam¡ warto±¢ atrybutu temperatura. Oobiektach numer 1, 4 i 6 powiemy, »e s¡ nierozró»nialne ze wzgl¦du naatrybuty: ból gªowy oraz ból mi¦±ni , za± obiekty o numerach 1 i 5 s¡nierozró»nialne ze wzgl¦du na atrybut: temperatura.T¦ obserwacj¦ mo»na uogólni¢ i wyrazi¢ w sposób formalny stosuj¡codpowiednio zde�niowan¡ relacj¦.

Relacja nierozró»nialno±ci

Niech SI = (U,A,V , f ) b¦dzie systemem informacyjnym i niech B ⊆ A.

De�nition

Relacj¦ nie rozró»nialno±ci (ang. indiscernibility relation) na zbiorze obiektów U

generowan¡ przez zbiór atrybutów B okre±lamy jako:

IND(B) = {(x , y) ∈ U × U :∀

a ∈ Ba(x) = a(y)}

gdzie znak �=� mi¦dzy a(x) i a(y) nale»y rozumie¢ w ten sposób, »e dlaobiektów x i y , nale»¡cych do U, atrybut a przyjmuje tak¡ sam¡ warto±¢.

De�nition

Zapis w postaci: xIND(B)y oznacza, »e x jest w relacji IND(B) z y . Mówi¡ckonkretnie: obiekt x systemu informacyjnego SI jest nierozró»nialny od obiektuy tego» samego systemu, ze wzgl¦du na wybrany podzbiór atrybutów B.

Wªasno±ci relacji nierozró»nialno±ci

Poszczególne pary obiektów nale»¡ do relacji wtedy, gdy posiadaj¡ te samewarto±ci dla wszystkich atrybutów ze zbioru B.Relacja nierozró»nialno±ci IND(B) jest relacj¡ równowa»no±ci, gdy» jest relacj¡:

• zwrotn¡, gdy»: ∀u∈U (u, u) ∈ IND(B)

• symetryczn¡, gdy»: ∀u,v∈U ((u, v) ∈ IND(B)⇒ (v , u) ∈ IND(B))

• przechodni¡, gdy»:∀

u,v,w∈U ((u, v) ∈ IND(B)∧(v ,w) ∈ IND(B)⇒ (u,w) ∈ IND(B))

Relacja nierozró»nialno±ci - cd

Dla systemu informacyjnego przedstawionego w tabeli mo»na wyznaczy¢ relacjenierozró»nialno±ci generowane przez ró»ne zbiory atrybutów:


Tablica: System informacyjny / tablica decyzyjna

Niech: A1 = {g ,m, t},A2 = {t},A3 = {g ,m},A4 = {g , t, c},A5 = {g ,m, t, c}INDSI (A1) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6), (2, 5), (5, 2)}INDSI (A2) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6), (1, 2), (2, 1), (1, 5), (5, 1), (2, 5),(5, 2), (3, 4), (4, 3)}INDSI (A3) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6), (1, 4), (4, 1), (1, 6), (6, 1), (4, 6),(6, 4), (2, 5), (5, 2)}INDSI (A4) = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}

Dowód, »e IND(B) jest relacj¡ zwrotn¡

1. Niech SI = (U,A) b¦dzie systemem informacyjnym i niech B ⊆ A.

2. Relacja IND(B) jest zwrotn¡, bo:

3. We¹my dowolny obiekt x ∈ U, mamy wi¦c:

∀a∈B , a(x) = a(x)

4. a wi¦c z de�nicji:(x , x) ∈ IND(B).

Dowód, »e IND(B) jest relacj¡ symetryczn¡


2. Relacja IND(B) jest symetryczn¡, bo:

3. We¹my dowolne obiekty x , y ∈ U,

4. zaªó»my, »e:(x , y) ∈ IND(B)

5. mamy wtedy:∀a∈B , a(x) = a(y)

6. st¡d:∀a∈B , a(y) = a(x)

7. a wi¦c:(y , x) ∈ IND(B)

Dowód, »e IND(B) jest relacj¡ przechodni¡


2. Relacja IND(B) jest przechodni¡, bo:

3. We¹my dowolne obiekty x , y , z ∈ U,

4. zaªó»my, »e (x , y) ∈ IND(B) oraz (y , z) ∈ IND(B),

5. mamy wtedy:∀a∈B , (a(x) = a(y) ∧ a(y) = a(z))

6. st¡d:∀a ∈ B, a(x) = a(z)

7. a wi¦c:(x , z) ∈ IND(B).

Klasy abstrakcji

• Relacja nierozró»nialno±ci IND(B) b¦d¡c relacj¡ równowa»no±ciow¡, dzielizbiór obiektów U na rozª¡czne, niepuste klasy abstrakcji.

• Klasy abstrakcji relacji nierozró»nialno±ci IND(B) oznacza si¦ U/IND(B).

• Ka»da klasa abstrakcji relacji nierozró»nialno±ci IND(B) to zbiór obiektównierozró»nialnych ze wzgl¦du na atrybuty ze zbioru B.

• Klasy abstrakcji U/IND(B) relacji nierozró»nialno±ci IND(B) to zatemzbiór zbiorów takich obiektów, które s¡ nierozró»nialne ze wzgl¦du naatrybuty ze zbioru B.

• Klasa abstrakcji dla obiektu x ∈ U relacji IND(B) zde�niowana jestnast¦puj¡co: [x ]IND(B) = {y ∈ U, ∀a∈B , a(x) = a(y)}

Klasy abstrakcji - cd

Powy»sze relacje dziel¡ zbiór obiektów systemu informacyjnego na nast¦puj¡ceklasy abstrakcji (zbiory elementarne):

• U/IND(A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/IND(A2) = {{1, 2, 5}, {3, 4}, {6}}• U/IND(A3) = {{1, 4, 6}, {2, 5}, {3}}• U/IND(A4) = {{1}, {2}, {3}, {4}, {5}, {6}}• U/IND(A) = {U/IND(A4)}

Na tej podstawie mo»na wyznaczy¢ przykªadowe klasy abstrakcji zawieraj¡ceposzczególne obiekty systemu informacyjnego:

• ISI ,A3(1) = {1, 4, 6}• ISI ,A3(2) = {2, 5}• ISI ,A3(3) = {3}

Aproksymacja zbiorów � przybli»enie dolne, górne, brzeg zbior

Problem z jednoznaczn¡ klasy�kacj¡ obiektów do pewnego podzbioru

• Jednym z celów wnioskowania w systemach decyzyjnych jest próbastwierdzenia czy obiekt (lub ich grupa) nale»y do pewnej klasy, lub nie.Inaczej mówi¡c � czy nale»¡ do pewnego poj¦cia czy nie.

• Proces taki opiera si¦ na opisie obiektu wyra»onym przy pomocyatrybutów.

• Wybrany podzbiór atrybutów systemu informacyjnego determinuje podziaªobiektów na rozª¡czne klasy abstrakcji.

• Wa»nym problemem jest zdolno±¢ radzenia sobie z niedoskonaªymidanymi. Jednym ze ¹ródeª trudno±ci w zadaniach opisu czy klasy�kacjijest istnienie niespójno±ci w dost¦pnych danych.

• Obiekty posiadaj¡ce identyczne (lub podobne) opisy, lecz zaliczone doró»nych poj¦¢, uniemo»liwiaj¡ stworzenie jednoznacznej de�nicji tych»epoj¦¢.

• Niespójno±ci nie powinny by¢ traktowane wyª¡cznie jako wynik bª¦du czyszumu informacyjnego. Mog¡ one tak»e wynika¢ z niedost¦pno±ci cz¦±ciinformacji, naturalnej granularno±ci i niejednoznaczno±ci j¦zykareprezentacji.

Zbiory przybli»one a problem z jednoznaczn¡ klasy�kacj¡ obiektów

Teoria zbiorów przybli»onych (ang. rough sets) zaproponowana przez ZdzisªawaPawlaka jest dogodnym narz¦dziem analizy tego typu niespójno±ci informacji.Teoria oparta jest na zaªo»eniu, »e posiadaj¡c informacj¦ reprezentowan¡ zapomoc¡ atrybutów i ich warto±ci na obiektach, mo»liwe jest okre±lenie relacjizachodz¡cej pomi¦dzy tymi obiektami. Obiekty posiadaj¡ce ten sam opis,wyra»ony za pomoc¡ atrybutów, s¡ nierozró»nialne ze wzgl¦du na dost¦pn¡informacj¦.W przypadku niemo»liwo±ci precyzyjnego zde�niowania zbioru obiektów(poj¦cia, klasy decyzyjnej) tworzy ona dolne i górne przybli»enie tego zbioru napodstawie klas relacji nierozró»nialno±ci pomi¦dzy obiektami.

Poj¦cia nieostre a zbiór dokªadny oraz zbiór przybli»ony

• Operowanie poj¦ciami nieostrymi (nie±cisªymi, nieprecyzyjnymi) jest bezw¡tpienia jednym z gªównych problemów rozumowa« potocznych. Poj¦cianieostre ró»ni¡ si¦ tym od poj¦¢ ostrych, »e w przeciwie«stwie do tychostatnich nie zawsze mo»liwe jest jednoznaczne zaklasy�kowanie obiektudo poj¦cia, tzn. dla pewnej grupy obiektów z otaczaj¡cej nasrzeczywisto±ci nie mo»na � stwierdzi¢ jednoznacznie czy dany obiektnale»y do rozpatrywanego poj¦cia, czy te» nie nale»y. Na przykªad mog¡to by¢ poj¦cia takie jak: maªe dziecko, pi¦kna kobieta, wysoki czªowiek,

dobra ksi¡»ka, ªatwe zadanie itd.

• Teoria zbiorów przybli»onych proponuje zast¡pienie nieostrego(nieprecyzyjnego) poj¦cia,par¡ poj¦¢ precyzyjnych, zwanych dolnym igórnym przybli»eniem tego poj¦cia.

• Ró»nica mi¦dzy górnym i dolnym przybli»eniem jest wªa±nie tym obszaremgranicznym, do którego nale»¡ wszystkie przypadki, które nie mog¡ by¢prawidªowo zaklasy�kowane na podstawie aktualnej wiedzy. Im wi¦kszyobszar graniczny poj¦cia tym bardziej jest ono nieostre (nieprecyzyjne).

Zbiór dokªadny oraz zbiór przybli»ony

Aproksymacja - de�nicje

De�nition

Niech SI = {U,A,V , f } b¦dzie systemem informacyjnym i niech B ⊆ A.

De�nition

Mówimy, »e zbiór P ⊆ U jest zbiorem B � dokªadnym (B � de�niowalnym)wtedy, gdy jest on sko«czon¡ sum¡ zbiorów B � elementarnych.

De�nition

Ka»dy zbiór, który nie jest sko«czon¡ sum¡ zbiorów B � elementarnych jestzbiorem B � przybli»onym.

Przykªad

Niech:

• X1 = {1, 2, 3, 5}• X2 = {3, 4, 5, 6}• A1 = {g ,m, t},A2 = {t}

oraz

• U/INDSI (A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/INDSI (A2) = {{1, 2, 5}, {3, 4}, {6}}

Wówczas:

Zbiór X1 jest zbiorem A1 � dokªadnym, gdy» jest sko«czon¡ sum¡ zbiorów A1 �elementarnych: X1 = {{1} ∪ {2, 5} ∪ {3}}

Ale:

Zbiór X2 jest zbiorem A1 � przybli»onym, gdy» nie jest sko«czon¡ sum¡ zbiorów A1

� elementarnych (obiekty 2 i 5 nale»¡ do jednego zbioru B � elementarnego, za±zbiórX2 zawiera tylko obiekt numer 5, a nie zawiera obiektu numer 2)

Przykªad - cd

Niech:

• X1 = {1, 2, 3, 5}• X2 = {3, 4, 5, 6}• A1 = {g ,m, t},A2 = {t}• U/INDSI (A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/INDSI (A2) = {{1, 2, 5}, {3, 4}, {6}}

Mo»emy dalej stwierdzi¢, »e:• Zbiór X1 jest zbiorem A2 � przybli»onym, gdy» nie jest sko«czon¡ sum¡ zbiorów A2 �

elementarnych (obiekty 3 i 4 nale»¡ do jednego zbioru C � elementarnego, za± zbiór X1

zawiera tylko obiekt numer 3, a nie zawiera obiektu numer 4)

• Zbiór X2 jest zbiorem A2 � przybli»onym, gdy» nie jest sko«czon¡ sum¡ zbiorów A2 �elementarnych (obiekty 1, 2 i 5 nale»¡ do jednego zbioru C � elementarnego, za± zbiórX2 zawiera tylko obiekt numer 5, a nie zawiera obiektów numer 1 i 2)

Aproksymacja zbioru - de�nicja

Je±li SI = {U,A,V , f } jest systemem informacyjnym takim, »e B ⊆ A orazX ⊆ U to:

• B � dolnym przybli»eniem (aproksymacj¡) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

BX = {x ∈ U : ISI ,B(x) ⊆ X}

• B � górnym przybli»eniem (aproksymacj¡) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

BX = {x ∈ U : ISI ,B(x) ∩ X 6= ∅}

Aproksymacje zbiorów � interpretacja

• Za pomoc¡ dolnej i górnej aproksymacji jeste±my w stanie okre±li¢ nieostrepoj¦cie w ±cisªy sposób.

• Dolna aproksymacja poj¦cia, to wszystkie te obiekty, które nale»¡ bezw¡tpienia do poj¦cia X . Nale»¡ one bowiem do takich klas abstrakcji,które w caªo±ci zawieraj¡ si¦ w poj¦ciu X .

• Górna aproksymacja poj¦cia, to zbiór takich obiektów, co do których niemo»emy wykluczy¢, »e nale»¡ do poj¦cia X . Jest to spowodowane tym, »enale»¡ do klas abstrakcji maj¡cych niepuste przeci¦cie z poj¦ciem X . S¡zatem nierozró»nialne z pewnymi obiektami nale»¡cymi do tego poj¦cia.

• Brzeg zbioru X zawiera obiekty, których nie mo»na jednoznacznieprzydzieli¢ do X z uwagi na sprzeczny opis.

Wspóªczynniki dokªadno±ci dla aproksymacji zbioru X

Zbiór przybli»ony X mo»e by¢ scharakteryzowany ilo±ciowo za pomoc¡:

• Wspóªczynnika dokªadno±ci przybli»enia: αBX = |BX ||BX | , gdzie |X | to

liczno±¢ niepustego zbioru X ,

• Wspóªczynnika dokªadno±ci przybli»enia dolnego: αBX = |BX ||U|

• Wspóªczynnika dokªadno±ci przybli»enia górnego:αBX = |BX ||U|

Obszary pozytywne i negatywne zbiorów

• B � pozytywnym obszarem (ang. positive area) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

POSB(X ) = BX

• B � brzegiem (granic¡) (ang. boundary)zbioru X w systemieinformacyjnym SI nazywamy zbiór:

BNB(X ) = BX − BX

• B � negatywnym obszarem (ang. negative area) zbioru X w systemieinformacyjnym SI nazywamy zbiór:

NEGBX = U − BX

Interpretacja dolnego i górnego przybli»enia zbioru

De�nition

Dolne przybli»enie poj¦cia jest to wi¦c poj¦cie, do którego nale»¡ wszystkieobiekty, co do których nie ma w¡tpliwo±ci, »e s¡ one reprezentantami tegopoj¦cia w ±wietle posiadanej wiedzy.

De�nition

Do górnego przybli»enia nale»¡ obiekty, których nie mo»na wykluczy¢, »e s¡reprezentantami tego poj¦cia.

De�nition

Brzegiem za± poj¦cia s¡ wszystkie te obiekty, co do których nie wiadomo czy s¡czy nie reprezentantami danego zbioru.

Z de�nicji powy»szych mo»emy wysnu¢ nast¦puj¡ce wnioski:

• BX ⊆ X ⊆ BX

• zbiór X jest B-dokªadny, gdy: BX = BX ⇐⇒ BNBX = ∅• zbiór X jest B-przybli»ony, gdy: BX 6= BX ⇐⇒ BNBX 6= ∅


De�nition


De�nition


De�nition



• BX ⊆ X ⊆ BX

• zbiór X jest B-dokªadny, gdy: BX = BX ⇐⇒ BNBX = ∅

• zbiór X jest B-przybli»ony, gdy: BX 6= BX ⇐⇒ BNBX 6= ∅


De�nition


De�nition


De�nition



• BX ⊆ X ⊆ BX

• zbiór X jest B-dokªadny, gdy: BX = BX ⇐⇒ BNBX = ∅• zbiór X jest B-przybli»ony, gdy: BX 6= BX ⇐⇒ BNBX 6= ∅

Liczbowa charakterystyka aproksymacji zbioru

Ka»dy zbiór (przybli»ony lub dokªadny) mo»na scharakteryzowa¢ ilo±ciowo zapomoc¡ wspóªczynnika dokªadno±ci aproksymacji (przybli»enia).

De�nition

Wspóªczynnik dokªadno±ci aproksymacji zbioru X w systemie informacyjnym SI

wzgl¦dem zbioru atrybutów B wyra»a si¦ wzorem:

αB(X ) =card(POSB(X ))

card(BX )=

card(BX )

card(BX )

gdzie card(X ) oznacza liczno±¢ zbioru X .

�atwo zauwa»y¢, »e:

• 0 ≤ αB(X ) ≤ 1

• je»eli X jest zbiorem dokªadnym to: αB(X ) = 1

• je»eli X jest zbiorem przybli»onym to: 0 ≤ αB(X ) < 1

Przykªad

Je±li:

• X1 = {1, 2, 3, 5}• X2 = {3, 4, 5, 6}

oraz

• U/INDSI (A1) = {{1}, {2, 5}, {3}, {4}, {6}}• U/INDSI (A2) = {{1, 2, 5}, {3, 4}, {6}}

Liczymy teraz dokªadno±¢ aproksymacji dla zbiorów X1 oraz X2 wzgl¦demzbioru atrybutów A1:

αA1(X1) =card(A1X1)

card(A1X1)= 4

4 = 1

αA1(X2) =card(A1X2)

card(A1X2)= 3

5 = 0.6

gdzie card(X ) oznacza liczno±¢ zbioru X .

Niespójno±¢ w danych

• Niespójno±¢ danych zachodzi wówczas, gdy dla takich samych danychwej±ciowych system podj¡ªby odmienne decyzje.

• Praca z systemem o niespójnej wiedzy jest niemo»liwa.

• Niespójno±¢ nale»y usun¡¢.


Dla obiektów 2 i 5 zachodzi niespójno±¢, gdy», dla tych samych atrybutówwarunkowych zachodz¡ ró»ne decyzje:ból gªowy=tak and ból mi¦±ni=nie and temp=wysokadla obiektu 2 podano decyzj¦: Grypa=takdla obiektu 5 podano decyzj¦: Grypa=nie

Usuwanie niespójno±ci z tablicy decyzyjnej

Wyró»ni¢ mo»na 5 metod usuwania niespójno±ci w tablicach decyzyjnych:

1. Zwróci¢ si¦ do EKSPERTA aby dla obiektów 2 i 5 podj¡ª jedn¡ decyzj¦.

2. Utworzenie dwóch (lub wi¦cej w przypadku ogólnym) spójnych tablicdecyzyjnych, poprzez rozdzielenie sprzecznych obiektów.

3. Usuni¦cie obiektów b¦d¡cych przyczyn¡ niespójno±ci(metoda ilo±ciowa).

4. Mo»na posªu»y¢ si¦ tutaj równie» metod¡ jako±ciow¡.

5. Metoda tworzenia nowego atrybutu decyzyjnego (metoda uogólnionegoatrybutu decyzyjnego)

Usuwanie niespójno±ci z tablicy decyzyjnejZwrócenie si¦ do EKSPERTA

Zwrócenie si¦ do EKSPERTA

Jest to sposób najprostszy przerzucaj¡cy ci¦»ar usuni¦cia niespójno±ci z tablicyna eksperta. Niestety bardzo cz¦sto zdarza si¦, »e ekspert nie potra� podj¡¢jednoznacznej decyzji. Twierdzi np. »e dla takich atrybutów (parametrów) razpodejmuje decyzje 1 innym razem decyzje 2. W takim przypadku metoda tanie daje rezultatu.

Usuwanie niespójno±ci z tablicy decyzyjnejUtworzenie dwóch (lub wi¦cej w przypadku ogólnym) spójnych tablic decyzyjnych, poprzez

rozdzielenie sprzecznych obiektów.

Jest to jednak tylko pozorne rozwi¡zanie problemu. Powstan¡ dwa zbiory reguªdla pierwszej i drugiej tablicy. Reguªy powstaªe na podstawie obiektu 2 wtablicy pierwszej i reguªa dla obiektu 5 w tablicy drugiej, b¦d¡ sprzeczne.

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak6 nie tak normalna niePacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak5 tak nie wysoka nie6 nie tak normalna nie

Metoda jako±ciowa

Metoda jako±ciowa

Usuniemy ten obiekt, którego warto±¢ decyzja jest "mniej wa»¡ca". "Mniejwa»¡ca"to znaczy maj¡ca mniejsz¡ dokªadno±¢ dolnego lub górnegoprzybli»enia.

Dla ka»dego X ⊆ U i B ⊆ A dokªadno±¢ dolnego przybli»enia γB(X ) obliczymyze wzoru:

γB(X ) =|BX ||U|

Dokªadno±¢ górnego przybli»enia γB(X ) obliczymy ze wzoru:

γB(X ) =|BX ||U|

Wówczas usuwamy ten obiekt, dla którego dokªadno±ci (górnego b¡d¹ dolnego)przybli»enia byªa mniejsza.

Przykªad usuwania niespójno±ci metod¡ jako±ciow¡

Najpierw dzielimy zbiór obiektów X ze wzgl¦du na decyzj¦ na dwa rozª¡cznepodzbiory X1 oraz X2.X1 = {1, 2, 3, 4}X2 = {5, 6}Generujemy teraz klasy rozró»nialno±ci dla caªego zbioru atrybutówwarunkowych:U/IND(C) = {{1}, {2, 5}, {3}, {4}, {6}}.B � dolnym przybli»eniem zbioru X w systemie informacyjnym SI nazywamyzbiór:

BX = {x ∈ U : ISI ,B(x) ⊆ X}B � górnym przybli»eniem zbioru X w systemie informacyjnym SI nazywamyzbiór:

BX = {x ∈ U : ISI ,B(x) ∩ X 6= ∅}

Przykªad - cd

Teraz mo»na juz wyznaczy¢ dla ka»dego ze zbiorów klasy decyzyjnych: X1 orazX2 przybli»enie dolne oraz górne.X1 = {1, 2, 3, 4}X2 = {5, 6}U/IND(C) = {{1}, {2, 5}, {3}, {4}, {6}}.• BX1 = {1, 3, 4}• BX1 = {1, 2, 3, 4, 5}• BX2 = {6}• BX2 = {2, 5, 6}

Teraz mo»na juz przyst¡pi¢ do wyliczenia dokªadno±ci górnego oraz dolnegoprzybli»enia:

• γB(X1) =|BX1||U| = 3

6 = 12

• γB(X2) =|BX2||U| = 1

6

• γB(X1) =|BX1||U| = 5

6

• γB(X2) =|BX2||U| = 3

6 = 12

Metoda mówi, aby usun¡¢ ten obiekt, dla którego uzyskano mniejsz¡dokªadno±¢ dolnego, b¡d¹ górnego przybli»enia w zale»no±ci od wybranegowariantu. W naszym przypadku usuniemy obiekt, który powodowaª niespójno±¢i wyst¦powaª w zbiorze X2.

Spójna tablica decyzyjna

Spójna juz teraz tablica decyzyjna wygl¡da nast¦puj¡co:

Pacjent Ból gªowy (g) Ból mi¦sni (m) Temperatura (t) Grypa (c)1 nie tak wysoka tak2 tak nie wysoka tak3 tak tak bardzo wysoka tak4 nie tak bardzo wysoka tak6 nie tak normalna nie

Tablica: System informacyjny / tablica decyzyjna po usuni¦ciu niespójno±ci

Usuni¦cie obiektów b¦d¡cych przyczyn¡ niespójno±ci

Powstaje problem, który obiekt usun¡¢. Mo»na posªu»y¢ si¦ tutaj metod¡ilo±ciow¡.

Metoda ilo±coiwaWówczas usuniemy ten obiekt(-y), którego decyzja mniej razy byªapotwierdzana.

Tworzenie nowego podziaªu (Systemu informacyjnego)

Tworzenie nowego podziaªu (Systemu informacyjnego)

Decyzja d wyznacza klasy�kacj¦: ClassA(d) = {X1, ...,Xr(d)}, (gdzie (d) - toilo±¢ ró»nych warto±ci atrybutu decyzyjnego.) Tworzymy nowy podziaª:

App − ClassA(d) = {A|X1, ...,A|Xr(d)}⋃{BdA(θ) : |θ| > 1}

Ten nowy podziaª tworzy tablice decyzyjn¡ spójn¡.

Tabela nr 1, (niespójna) po dodaniu do systemu informacyjnego, nowego,uogólnionego atrybutu decyzyjnego wygl¡da nast¦puj¡co:

Macierz, tablica, funkcja oraz wektor rozró»nialno±ci dla systemuinformacyjnego

Macierz rozró»nialno±ci

De�nition

Je±li SI = {U,A,V , f } jest systemem informacyjnym takim, »eU = {u1, u2, .., un} i A = {a1, a2, .., am} , to macierz rozró»nialno±ci(odró»nialno±ci) systemu informacyjnego SI M(SI ) (ang. discernibility matrix)de�niujemy nast¦puj¡co:

M(SI ) = (Hi,j )i,j=1,..,n = {a ∈ A : f (ui , a) 6= f (uj , a)}

dla i , j = 1, .., n, gdzie n = |U|.

• Macierz rozró»nialno±ci jest dwuwymiarow¡ macierz¡ kwadratow¡ owymiarach: |U| × |U|.

• Komórka M(SI )[i , j ] zawiera zbiór tych atrybutów, dla których obiektyuniwersum ui i uj maj¡ ró»ne warto±ci (s¡ rozró»nialne przy pomocy tychatrybutów).




1 2 3 4 61 ∅2 g,m ∅3 g,t m,t ∅4 t g,m,t g ∅6 t g,m,t g,t t ∅

Tablica: Macierz rozró»nialno±ci dla system informacyjnego

Wªasno±ci macierzy rozró»nialno±ci

• macierz M(SI ) ma zawsze na przek¡tnej zbiory puste (∅),

• macierz M(SI ) jest symetryczna wzgl¦dem przek¡tnej,

• ka»dy element macierzy M(SI ) jest zbiorem,

• rozmiar macierzy ro±nie w sposób kwadratowy wraz ze wzrostem liczbyobiektów w systemie informacyjnym.

Wªasno±ci macierzy rozró»nialno±ci

• macierz M(SI ) ma zawsze na przek¡tnej zbiory puste (∅),• macierz M(SI ) jest symetryczna wzgl¦dem przek¡tnej,

• ka»dy element macierzy M(SI ) jest zbiorem,

• rozmiar macierzy ro±nie w sposób kwadratowy wraz ze wzrostem liczbyobiektów w systemie informacyjnym.

Generowanie macierzy rozró»nialno±ci

Wej±cie: A = (U,A) system informacyjny taki, »e U = {u1, .., un} iA = {a1, .., am}.Wyj±cie: M(A) = (Cij )i,j=1,..,n macierz odró»nialno±ci systemu A,przyczymM(A) ma obliczone tylko te pola Cij dla których 1 ≤ j < i ≤ n.Metoda:

For i=1 to n do

For j=1 to i-1 do

Wstaw do Cij atrybuty, na których ró»ni¡ si¦ obiekty ui i uj

Zªo»ono±¢:

• Aby obliczy¢ tablic¦ M(A), nale»y wyznaczy¢ zawarto±¢ n2−n2 pól macierzy.

• Zªo»ono±¢ obliczeniowa czasowa wyznaczania ka»dego pola jest zale»na odliczby atrybutów m.

• Dlatego zªo»ono±¢ obliczeniowa czasowa algorytmu jest rz¦du O(n2 ∗m),natomiast zªo»ono±¢ obliczeniowa pami¦ciowa algorytmu jest rz¦du O(C),gdzie C jest pewn¡ staª¡.

Powy»sze cechy sprawiaj¡, »e taka reprezentacja macierzy, jest bardzoniewygodna z programistycznego punktu widzenia. Macierz zawieraredundantne informacje, zawarto±ci komórek nie s¡ typami prostymi a ponadtonie maj¡ staªej wielko±ci (liczby elementów w zbiorze). W efekcie struktura tama bardzo du»¡ zªo»ono±¢ pami¦ciow¡, która dla systemu informacyjnegoSI = {U,A,V , f } wynosi: |U|2 ∗ |A|.

Funkcja rozró»nialno±ci

Funkcj¡ odró»nialno±ci systemu informacyjnego SI (ang. discernibility function)nazywamy funkcj¦ boolowsk¡ fSI zmiennych a∗1 , .., a

∗m odpowiadaj¡cych

odpowiednio atrybutom (systemu informacyjnego) a1, .., am zde�niowan¡nast¦puj¡co:

fSI (a∗1 , .., a

∗m) =

⋂{⋃

(Xi,j : 1 ≤ j ≤ n ∧ Hi , j 6= ∅)}

gdzie:n = |U|,m = |A|,⋃Xi,j jest alternatyw¡ wszystkich zmiennych

a∗ ∈ {a∗1 , .., a∗m} takich, »e a ∈ Hi , j .


Obliczmy funkcj¦ rozró»nialno±ci dla macierzy odró»nialno±ci:fSI (g ,m, t, c) = (g+m)∗(g+t)∗(t)∗(g+m+c)∗(t+c)∗(m+t)∗(g+m+t)∗(c)∗(g+m+t+c)∗(g)∗(m+t+c)∗(g+t+c)∗(g+m+t+c)∗(t+c)∗(g+m+t)Wyra»enie to mo»na upro±ci¢ stosuj¡c m.in. prawo pochªaniania(a+ (a ∗ b)) = a do postaci:fSI (g ,m, t, c) = (t ∗ g ∗ c)

Redukcja atrybutów � poj¦cie j¡dra i reduktów

Nadmiar informacji jest szkodliwyW celu precyzyjnego i konkretnego opisana relacji pomi¦dzy obiektamiwyst¦puj¡cymi w bazie wiedzy, stosuje si¦ redukcj¦ liczby atrybutówopisuj¡cych owe relacje.Poszukuje si¦ takich podzbiorów atrybutów, które zachowuj¡ podziaª obiektówna klasy decyzyjne taki sam, jak wszystkie atrybuty.Te zbiory atrybutów nie mog¡ by¢ wyznaczone w dowolny sposób. W teoriizbiorów przybli»onych wykorzystuje si¦ koncepcj¦ reduktu b¦d¡cegoniezale»nym podzbiorem atrybutów zachowuj¡cym taki sam podziaª na klasydecyzyjne jak wszystkie atrybuty.W¦»szym poj¦ciem jest poj¦cie j¡dra, okre±laj¡cego zbiór atrybutówniezb¦dnych dla zachowania rozró»nialno±ci obiektów w systemie.

Redukt i Rdze« zbioru atrybutów

Niech SI = {U,A,V , f } b¦dzie systemem informacyjnym oraz B ⊆ A.De�nicja. Atrybut zb¦dny (niezb¦dny)Atrybut a ⊆ B jest zb¦dny, je»eli IND(B) = IND(B − {a}).W przeciwnym wypadku (tzn. je»eli IND(B) 6= IND(B − {a}) jest niezb¦dny.De�nicja. Zbiór atrybutów niezale»nych (zale»nych)A - zbiór atrybutów jest niezale»ny wtedy i tylko wtedy, gdy dla ka»dego a ⊆ A,a jest niezb¦dny. W przeciwnym wypadku zbiór jest zale»ny.

De�nicja - Redukt i rdze« (j¡dro)

B ⊆ A nazywamy reduktem A wtedy i tylko wtedy, gdy B jest niezale»ny orazIND(B) = IND(A). Zbiór wszystkich reduktów oznaczamy przez RED(A).Zbiór wszystkich niezb¦dnych atrybutów w B b¦dziemy nazywali rdzeniem(j¡drem) B i oznaczali przez CORE(B).Powi¡zanie mi¦dzy reduktami i j¡dremZachodzi nast¦puj¡cy zwi¡zek:CORE(A) =

⋂RED(A),

gdzie RED(A) to zbiór wszystkich reduktów B, tzn. j¡dro atrybutów toprzekrój po wszystkich reduktach.

Przykªad

Zbiór wszystkich reduktów zbioru atrybutów {g ,m, t, c} systemuinformacyjnego z tabeli 1 wynosi: REDSI ({g ,m, t, c}) = {g , t, c}.Aby udowodni¢, »e zbiór {g , t, c} jest reduktem nale»y pokaza¢, »e zachodz¡warunki z de�nicji:

• INDSI ({g ,m, t, c}) = INDSI ({g , t, c}),

Mo»emy to pokaza¢, usuwaj¡c z tego zbioru kolejne atrybuty i sprawdzaj¡c czyrelacja nierozró»nialno±ci wzgl¦dem takiego okrojonego zbioru jest ró»na odrelacji nierozró»nialno±ci wzgl¦dem caªego zbioru atrybutów. Je»eli tak b¦dzie,to zbiór {g , t, c} b¦dzie reduktem.

Metody generowania reduktów i rdzenia z TD

Redukty i rdze« z tablicy decyzyjnej generuje si¦ jedn¡ z dwóch dróg:

• z de�nicji,

• z macierzy rozró»nialno±ci.

Wyznaczanie j¡dra (rdzenia) z de�nicji

• Wyznacz klasy abstrakcji relacji nierozró»nialno±ci U/IND(B), gdzie B jestto zbiór wszystkich rozwa»anych atrybutów.

• Wyznacz klasy abstrakcji z pomini¦ciem i-tego atrybutu U/IND(B − ai ) .

• Je»eli U/IND(B) = U/IND(B − ai ) to atrybut ai jest zb¦dny, wprzeciwnym wypadku ai jest niezb¦dny i wchodzi do j¡dra CORE(B).

• Powtarzaj pkt. 2, a» wykorzystane zostan¡ wszystkie atrybuty z B.

Algorytm wyznaczania j¡dra z de�nicji

Dane:B = a1, a2, a3, ...ai , ...anTablica KRS

• CORE(B) := {}• Wyznacz U/INB(B)

• Dla ka»dego a ∈ B wykonaj

• Je»eli U/INB(B) 6= U/IND(B − ai ) To CORE(B) := CORE(B) ∪ aigdzie:

• CORE(B) - j¡dro (zbiór atrybutów),

• B - rozwa»any zbiór atrybutów,

• ai - i-ty atrybut ze zbioru B,

• U/INB(B) - klasa abstrakcji relacji nierozró»nialno±ci dla peªnego zbioruatrybutów,

• U/IND(B − ai ) - klasy abstrakcji relacji nierozró»nialno±ci dla zbioruatrybutów z pomini¦ciem atrybutu ai .

Wyznaczenie rdzenia z de�nicji

• Wyznacz klasy abstrakcji U/IND(B), gdzie B jest to zbiór wszystkichrozwa»anych atrybutów.

• Sprawd¹, czy j¡dro CORE(B) nie jest reduktem.

• Poniewa» j¡dro to zbiór atrybutów niezb¦dnych, to sprawd¹, czyU/IND(B) = U/IND(CORE(B)), je»eli tak to j¡dro to jedyny redukt iprzejd¹ do Punktu 6.

• Sprawd¹ kolejne podzbiory atrybutów Bi ∈ B.

• Sprawd¹, czy podzbiór Bi jest niezale»ny. Je»eli tak, to sprawd¹ czyU/IND(B) = U/IND(Bi ), je»eli zachodzi równo±¢ to podzbiór Bi jestreduktem.

• Wypisanie reduktów.

Podzbiór atrybutów B ⊆ A nazywamy reduktem zbioru atrybutów A, gdy zbióratrybutów B jest niezale»ny oraz IND(B) = IND(A). Zbiór wszystkichreduktów oznaczamy przez RED(A). Redukt to najmniejszy zbiór atrybutów,przy którym zostaje zachowana dotychczasowa klasy�kacja (rozró»nialno±¢)obiektów.Wa»ne!Redukt musi speªnia¢ dwa kryteria:

1. musi by¢ niezale»nym zbiorem atrybutów (tylko atrybuty niezb¦dne),

2. musi zachowywa¢ tak¡ sam¡ rozró»nialno±¢ obiektów jak zbiór redukowany.

Uwaga!!!

Redukty mo»na wyznacza¢ dla dowolnego podzbioru A. Do tej pory

rozwa»ali±my zawsze jaki± podzbiór atrybutów B ⊆ A. Dla takiego

podzbiory B te» mo»emy liczy¢ redukty. Wtedy reduktem b¦dzie jaki±

podzbiór atrybutów C ⊆ B, a zbiór wszystkich reduktów B oznacza¢

b¦dziemy RED(B).

Zwi¡zek pomi¦dzy j¡drem a reduktem

J¡dro systemu informacyjnego rozpatrywanego dla podzbioru atrybutów B ⊆ A

jest cz¦±ci¡ wspóln¡ wszystkich reduktów tego systemu.

CORE(B) =⋂

RED(A).

Uwaga! To wªa±ciwo±¢ wi¡»¡ca j¡dro i redukty a nie de�nicja j¡dra!

Algorytm generowania reduktu z de�nicji

Dane:B = {a1, a2, a3, ...ai , ..., an}Tablica KRS

• Wyznacz U/IND(B)

• Wyznacz CORE(B)

• RED(B) := CORE(B)

• Je»eli U/IND(B) = U/IND(CORE(B)) To RED(B) := CORE(B),w przeciwnym wypadku Dla ka»dego podzbioru atrybutów Bi ∈ B

wykonaj: Je»eli U/IND(B) = U/IND(Bi )ToRED(B) := RED(B) ∪ Bi

Generowanie reduktu i rdzenia z de�nicji

Najpierw wyznaczamy klasy równowa»no±ci dla peªnego zbioru atrybutów:

IND(C) = {{1}, {2}, {3}, {4}, {6}}

Teraz b¦dziemy sprawdza¢ czy zmieni si¦ dotychczasowa klasy�kacja obiektów,jak¡ mamy dla peªnego zbioru atrybutów, je±li usuniemy jaki± atrybut ze zbioru.

IND((C)− {g}) = {{1}, {2}, {3, 4}, {6}}

czyli:IND((C)− {g}) 6= IND(C)

wi¦c atrybut {g} jest niezb¦dny w systemie, poniewa» je±li go usuniemy tostracimy informacje o rozró»nialno±ci dwóch obiektów 3i4.

Generowanie reduktu i rdzenia z de�nicji - cd

IND((C)− {m}) = {{1}, {2}, {3}, {4}, {6}}czyli:

IND((C)− {m}) = IND(C)

wi¦c atrybut {m} jest zb¦dny w systemie, poniewa» je±li go usuniemy to niestracimy informacji o rozró»nialno±ci obiektów.

IND((C)− {t}) = {{1, 4, 6}, {2}, {3}}czyli:

IND((C)− {t}) 6= IND(C)

wi¦c atrybut {t} jest niezb¦dny w systemie, poniewa» je±li go usuniemy tostracimy informacje o rozró»nialno±ci obiektów.

Generowanie reduktu i rdzenia z de�nicji - cd

Zatem CORE(C) to zbiór atrybutów niezb¦dnych w systemie wi¦c w naszymprzypadku stanowi¡ go dwa atrybuty:

CORE(C) = {gt}

Redukt zgodnie z de�nicj¡ jest to taki zbiór atrybutów niezb¦dnych, dlaktórego zapewniona jest dotychczasowa klasy�kacja obiektów, a wiec na pewnoredukt musi zawiera¢ w sobie j¡dro.Sprawdzamy wi¦c dla jakiej kombinacji atrybutów uzyskamy taki sam podziaªobiektów jaki daªa IND(C).

IND(gt) = {{1}, {2}, {3}, {4}, {6}}

Skoro IND(gt) = IND(C), to ten zbiór atrybutów {gt} jest reduktem zbioruatrybutów.RED(C) = {gt}.

Algorytm generacji j¡dra z macierzy rozró»nialno±ci

Dane: Macierz M[I , J]

• CORE(B) := {}• Dla I := 1 do N wykonajDla J := 1 do I − 1 wykonaj

• Je»eli card(M[I , J]) = 1 to CORE(B) := CORE(B) +M[I , J]

Wyznaczanie reduktów z macierzy

• Utworzenie wszystkich mo»liwych podzbiorów atrybutów.

• Wybranie tych, które zawieraj¡ rdze« CORE(B).

• Sprawdzenie, czy otrzymane podzbiory maj¡ niepuste przeci¦cie z ka»dymniepustym elementem macierzy rozró»nialno±ci M(S).

• Spo±ród otrzymanych podzbiorów atrybutów nale»y wybra¢ i usun¡¢ te,które stanowi¡ nadzbiory wyznaczonych reduktów.

• Pozostaªe podzbiory stanowi¡ redukty RED(B).

Generowanie reduktu i rdzenia z macierzy rozró»nialno±ci

W tym celu generujemy macierz rozró»nialno±ci dla tablicy deecyzyjnej:

M(SI ) = (Hi,j )i,j=1,..,n = {a ∈ A : f (u1, a) 6= f (uj , a)}

dla i , j = 1, .., n,gdzien = |U|.

De�nition

Macierz odró»nialno±ci jest dwuwymiarow¡ macierz¡ kwadratow¡ o wymiarach:|U| × |U|. Komórka M(SI )[i , j ] zawiera zbiór tych atrybutów, dla którychobiekty uniwersum ui i uj maj¡ ró»ne warto±ci (s¡ rozró»nialne przy pomocytych atrybutów).


Tablica: Macierz rozró»nialno±ci dla system informacyjnego

Macierz rozró»nialno±ci a redukt i rdze« zbioru atrybutów

Istniej¡ nast¦puj¡ce zwi¡zki pomi¦dzy macierz¡ rozró»nialno±ci a j¡drem ireduktami:

CORE(A) = {a ⊆ A : cij = {a}}

dla pewnego 0 < i , j < n + 1, tzn. do j¡dra wchodz¡ te atry-buty, którewyst¦puj¡ w macierzy rozró»nialno±ci pojedynczo.

De�nition

B ⊆ A jest reduktem A wtedy i tylko wtedy, gdy B jest minimalny (w sensiezawierania zbiorów) oraz z ka»dym niepustym elementem macierzynierozró»nialno±ci M(S) ma niepuste przeci¦cie.

Innymi sªowy redukt jest to najmniejszy zbiór atrybutów, przy którym zostajezachowana dotychczasowa klasy�kacja (rozró»nialno±¢) obiektów:RED(C) = {gt} oraz CORE(C) = {gt} .

Podsumowanie cz¦±ci I

1. System informacyjny a system decyzyjny.

2. Tablicowa forma systemu decyzyjnego.

3. Relacja nierozró»nialno±ci, klasa abstrakcji rozró»nialno±ci.

4. Aproksymacja zbiorów obiektów.• Dolne przybli»enie, górne przybli»enie, brzeg zbioru,• dokªadno±¢ górnego i dolnego przybli»enia.

5. Usuwanie niespójno±ci z tablicy decyzyjnej.

6. Redukcja atrybutów, generowanie RED(C) oraz CORE(C):• z de�nicji,• z macierzy rózró»nialno±ci.

Generowanie reguª minimalnych z tablic decyzyjnychCz¦±¢ II

De�nition

Generowanie reguª minimalnych z tablic decyzyjnych.Cz¦±¢ II.

Tablica decyzyjna

Szczególnym rodzajem systemów informacyjnych s¡ tablice decyzyjne (TD).Tablic¡ decyzyjn¡ nazywamy uporz¡dkowan¡ pi¡tk¦:

TD = (U,C ,D,V , f )

gdzie:

• C ,D ⊂ A;C 6= ∅;C ∪ D = A;C ∩ D = ∅,• elementy zbioru C nazywamy atrybutami warunkowymi,

• elementy zbioru D nazywamy atrybutami decyzyjnymi,

• f nazywamy funkcj¡ decyzyjn¡.

• interpretacja U oraz V jest taka sama jak w przypadku systemuinformacyjnego, ponadto poszczególne warto±ci v dziedzin atrybutówD(v ∈ VD) b¦dziemy nazywa¢ klasami decyzyjnymi.

Podstawowa ró»nica mi¦dzy tablic¡ decyzyjn¡ a systemem informacyjnympolega wi¦c na tym, »e cz¦±¢ atrybutów traktujemy jako atrybuty warunkowe(C) a cz¦±¢ jako decyzyjne (D).

PrzykªadTabel¦ 1 b¦dziemy traktowa¢ jako tablic¦ decyzyjn¡.Zbiór atrybutów systemu informacyjnego dzielimy na dwa podzbiory: podzbióratrybutów warunkowych (C) oraz podzbiór atrybutów decyzyjnych (D) wnast¦puj¡cy sposób:

• C = {Bol_glowy ,Bol_miesni ,Temperatura} = {g ,m, t}• D = {Grypa} = {c}

Tablice decyzyjne deterministyczne i niedeterministyczne

Ka»dy obiekt u ⊂ U tablicy decyzyjnej TD = (U,C ,D,V , f ) mo»e zosta¢zapisany w postaci zdania warunkowego (postaci: je»eli warunki to decyzja) iby¢ traktowany jako reguªa decyzyjna.Reguª¡ decyzyjn¡ w tablicy decyzyjnej TD nazywamy funkcje:g : C ∪ D → V

je»eli istnieje x ∈ U, taki, »e g = fx .Obci¦cie g do C (g |C) oraz g do D (g |D) nazywamy odpowiednio warunkamioraz decyzjami reguªy decyzyjnej g .

Reguªy decyzyjne

Przykªad

Z przykªadowej tablicy decyzyjnej z tabeli 1 mo»emy wyprowadzi¢ nast¦puj¡cereguªy (odpowiadaj¡ce konkretnym obiektom):

1. je»eli (g=�nie�) i (m=�tak�) i (t=�wysoka�) to (c=�tak�)

2. je»eli (g=�tak�) i (m=�nie�) i (t=�wysoka�) to (c=�tak�)

3. je»eli (g=�tak�) i (m=�tak�) i (t=�bardzo wysoka�) to (c=�tak�)

4. je»eli (g=�nie�) i (m=�tak�) i (t=�bardzo wysoka�) to (c=�tak�)

5. je»eli (g=�tak�) i (m=�nie�) i (t=�wysoka�) to (c=�nie�)

6. je»eli (g=�nie�) i (m=�tak�) i (t=�normalna�) to (c=�nie�)

Reguªy decyzyjne - rodzaje reguª

Reguªy decyzyjne mo»na dzieli¢ na wiele ró»nych grup bior¡c pod uwag¦ ró»nekryteria. Jeden z podziaªów wyró»nia dwie grupy reguª:

• reguªy deterministyczne

• reguªy niedeterministyczne

Reguªy deterministyczne

De�nition

Reguªa w tablicy decyzyjnej TD jest deterministyczna, gdy równo±¢ atrybutówwarunkowych implikuje równo±¢ atrybutów decyzyjnych.

Mówi¡c ja±niej: reguªa jest deterministyczna gdy zawsze dla tych samych

warto±ci atrybutów warunkowych podaje na wyj±cie tak¡ sam¡ decyzj¦ systemu

- czyli tak¡ sam¡ warto±¢ atrybutu decyzyjnego. Fakt ten mo»emy wyrazi¢ przypomocy nast¦puj¡cej zale»no±ci dla obiektów tablicy decyzyjnej:

∀ x,y∈Ux 6=y

(∀c ∈ C

(f (x , c) = f (y , c))⇒ ∀d ∈ D

(f (x , d) = f (y , d)))

Reguªy niedeterministyczne

Reguªa w tablicy decyzyjnej TD jest niedeterministyczna, gdy równo±¢atrybutów warunkowych nie implikuje równo±ci atrybutów decyzyjnych, como»na wyrazi¢ nast¦puj¡c¡ zale»no±ci¡ dla obiektów tablicy decyzyjnej:

∀ x,y∈Ux 6=y

(∀c ∈ C

(f (x , c) = f (y , c)) ∧ ∃d ∈ D

(f (x , d) 6= f (y , d)))

Reguªy decyzyjne: deterministyczne i niedeterministyczne

Tablica decyzyjna jest deterministyczna (dobrze okre±lona, spójna), gdywszystkie reguªy w niej zawarte s¡ deterministyczne, w przeciwnym przypadkujest niedeterministyczna (¹le okre±lona,niespójna).

Tablica decyzyjna z tabeli jest niedeterministyczna, gdy» reguªy pochodz¡ce zobiektów: 2i 5 s¡ niedeterministyczne.

∀ 2,5∈U26=5

(∀c ∈ C

(f (2, c) = f (5, c)) ∧ ∃d ∈ D

(f (2, d) 6= f (5, d)))

a dokªadniej:

f (2, c) = f (5, c) : (g = tak) ∧ (m = nie) ∧ (t = wysoka)

f (2, d) 6= f (5, d) : bo(c = tak)|2 6= (c = nie)|5

Relacja nierozró»nialno±ci wzgl¦dem decyzji

Z uwagi na rzeczywiste zastosowania tablice decyzyjne najcz¦±ciej posiadaj¡tylko jeden atrybut decyzyjny, dlatego w dalszej cz¦±ci rozwa»a« przyjmiemy, »eD = {d}. Wszystkie de�nicje mog¡ jednak w prosty sposób zosta¢ uogólnionena przypadek, kiedy zbiór atrybutów decyzyjnych posiada wi¦cej ni» jedenelement.

Center for Machine Learning and Intelligent Systems at the University ofCalifornia

Center for Machine Learning and Intelligent Systems at the University ofCalifornia

De�nition

171 zbiorów danych rzeczywistych

1. Zastosowanie: klasy�kacja (113),regresja (12),grupowanie (5),inne (43)

2. Typ atrybutów: porz¡dkowe (35), numeryczne (59), mieszane (54)

3. Typ danych: Multivariate (131), Univariate (3), ci¡gªe (8), Time-Series(13), Text (8), Domain-Theory (13), inne (21)

4. Obszar: Life Sciences (47), Physical Sciences (27),CS Engineering(26),Social Sciences (14) Business (5),Game (8),Other (43)

5. Liczba atrybutów: < 10 (39), (10, 100 > (81), > 100 (16)

6. Liczba obiektów: < 100 (10), (100, 1000 > (75), > 1000(63)

7. Format: Matrix (122), Non-Matrix (49)

Relacja nierozró»nialno±ci wzgl¦dem decyzji - rodzaje decyzji


Niech TD = (U,C , {d},V , f ) b¦dzie tablic¡ decyzyjn¡ i niech B ⊆ C .

De�nition

Relacj¦ nierozró»nialno±ci wzgl¦dem decyzji d na zbiorze obiektów U

generowan¡ przez zbiór atrybutów B de�niujemy jako:

IND(B, d) = {(x , y) ∈ U × U : (x , y) ∈ INDSI (B) ∨ f (x , d) = f (y , d)}


Relacja nierozró»nialno±ci wzgl¦dem decyzji ró»ni si¦ od relacjinierozró»nialno±ci tym, »e nie rozró»nia obiektów maj¡cych takie same warto±cidecyzji nawet wtedy, gdy obiekty te ró»ni¡ si¦ na rozwa»anym podzbiorzeatrybutów warunkowych B. Relacja nierozró»nialno±ci wzgl¦dem decyzji nie jestrelacj¡ równowa»no±ci. Jest co prawda zwrotna i symetryczna, ale nie jestprzechodnia.

Macierz, tablica, funkcja oraz wektor odró»nialno±ci dla tablicy decyzyjnej

Je±li TD = (U,C , {d},V , f ) jest tablic¡ decyzyjn¡ tak¡, »e U = {u1, .., un} iC = {c1, .., cm}, to macierz odró»nialno±ci tablicy decyzyjnej TDM(TD, d)de�niujemy nast¦puj¡co:

M(TD, d) = (Hi,j )i,j=1,..,n = {c ∈ C : f (ui , c) 6= f (uj , c)

∧f (ui , d) 6= f (uj , d)

dla i , j = 1, .., n gdzie n = |U|.

Macierz rozró»nialno±ci dla tablicy decyzyjnej - przykªad

Obliczmy macierz odró»nialno±ci dla tablicy decyzyjnej z tabeli 1.

U/U 1 2 3 4 5 61 ∅ ∅ ∅ ∅ g,m t2 ∅ ∅ ∅ ∅ ∅ g,m,t3 ∅ ∅ ∅ ∅ m,t g,t4 ∅ ∅ ∅ ∅ g,m,t t5 g,m ∅ m,t g,m,t ∅ ∅6 t g,m,t g,t t ∅ ∅

Tablica: Macierz odró»nialno±ci dla tablicy decyzyjnej

Zasada !Patrzymy tylko na te obiekty, które maj¡ przeciwn¡ decyzj¦, i wypisujemy wkomórce macierzy atrybuty warunkowe, które ró»ni¡ te obiekty.

Reguªy minimalne

Znanym algorytmem generuj¡cym reguªy na podstawie tablicy decyzyjnej jestalgorytm zamieszczony w pracy Z. Pawlaka i A. Skowrona z 1993 roku.Poniewa» algorytm dziaªa dla tablic spójnych, na pocz¡tku sprawdza si¦spójno±¢ tablicy decyzyjnej. W przypadku wyst¡pienia niespójno±ci usuwa si¦ j¡za pomoc¡ uogólnionego atrybutu decyzyjnego lub metody jako±ciowejusuwanianiespójno±ci z tablicy decyzyjnej.

Od tablicy decyzyjnej do reguª

Generowanie reguª minimalnych:

1. Doprowad¹ tablic¦ do spójno±ci, np. wprowadzaj¡c uogólniony atrybutdecyzyjny.

2. Usu« identyczne obiekty.

3. Utwórz macierz nierozró»nialno±ci

4. Dla ka»dej warto±ci atrybutu decyzyjnego:

5. Utwórz uogólnion¡ macierz nierozró»nialno±ci wzgl¦dem decyzji.

6. Zapisz funkcj¦ nierozró»nialno±ci, zminimalizuj j¡.

7. Zapisz reguª¦ decyzyjn¡ na podstawie zminimalizowanej funkcjirozró»nialno±ci.

Generowanie reguª minimalnych � przypomnienie dziaªa« w algebrze Boola

Algebra Boola jest to struktura matematyczna A = (X ,+, ∗,¬, 0, 1)speªniaj¡ca nast¦puj¡ce aksjomaty:

• ª¡czno±¢ i przemienno±¢:• x + y = y + x• x ∗ y = y ∗ x• (x + y) + z = x + (y + z)• (x ∗ y) ∗ z = x ∗ (y ∗ z)

• 0 jest elementem neutralnym dla + : x + 0 = x

• 1 jest elementem neutralnym dla ∗ : x ∗ 1 = x

• x + (¬x) = 1

• x ∗ (¬x) = 0

• rozdzielno±¢ + i ∗ wzgl¦dem siebie:• x ∗ (y + z) = (x ∗ y) + (x ∗ z)• x + (y ∗ z) = (x + y) ∗ (x + z)

• dwa dziaªania ¬ si¦ znosz¡: ¬¬x = x

• prawa de Morgana• ¬(x ∗ y) = (¬x) + (¬y)• ¬(x + y) = (¬x) ∗ (¬y)

Macierz rozró»nialno±ci dla tablicy decyzyjnej

Tablica decyzyjna

Macierz rozró»nialno±ci dla tablicy decyzyjnej1 2 3 4 6

1 ∅2 g,m ∅3 g,t m,t ∅4 t g,m,t g ∅6 t g,m,t g,t t ∅

Generujemy funkcje rozró»nialno±ci dla poszczególnych decyzjiUproszczony zapis

• funkcja dla reguªy nr 1: t

• funkcja dla reguªy nr 2: g +m + t

• funkcja dla reguªy nr 3: g + t

• funkcja dla reguªy nr 4: t

• funkcja dla reguªy nr 6: (t) ∗ (g +m + t) ∗ (g + t) ∗ (t)

co zapisujemy jako:

• fMG (A, {tak},X1) = t

• fMG (A, {tak},X2) = g +m + t

• fMG (A, {tak},X3) = g + t

• fMG (A, {tak},X4) = t

• fMG (A, {nie},X6) = (t) ∗ (g +m + t) ∗ (g + t) ∗ (t)ale po kolei...→ nast¦pna strona...

reguªy minimalne dla σA = {tak}dla obiektu X1

1. Wyliczamy reguªy minimalne dla σA = {tak} czyli reguªy postaciα⇒ σA = {tak}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu X1:MG(A, {tak},X1) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {tak},X1).

1 2 3 4 61 ∅ g,m g,t t t

3. fMG (A, {tak},X1) = t

4. Minimalizujemy funkcj¦ fMG (A, {tak},X1) - nie ma co minimalizowa¢ !

5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X1) toPRIMEMG (A, {tak},X1) = {t}

reguªy minimalne dla σA = {tak}


2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {tak},X1) = {t} ioryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. t = wysoka⇒ σA = {tak}




1 2 3 4 62 g,m ∅ m,t g,m,t g,m,t

3. fMG (A, {tak},X2) = g +m + t


5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X2) toPRIMEMG (A, {tak},X2) = {g +m + t}



2. Opieraj¡c si¦ na implikantach pierwszychPRIMEMG (A, {tak},X2) = {g +m + t} i oryginalnej tablicy mo»emyzapisa¢ 3 reguªy minimalne:

3. g = tak ⇒ σA = {tak}4. m = nie ⇒ σA = {tak}5. t = wysoka⇒ σA = {tak}




1 2 3 4 63 g,t m,t ∅ g g,t

3. fMG (A, {tak},X3) = g + t


5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X3) toPRIMEMG (A, {tak},X3) = {g + t}



2. Opieraj¡c si¦ na implikantach pierwszychPRIMEMG (A, {tak},X3) = {g + t} i oryginalnej tablicy mo»emy zapisa¢ 2reguªy minimalne:

3. g = tak ⇒ σA = {tak}4. t = bardzowysoka⇒ σA = {tak}




1 2 3 4 64 t g,m,t g ∅ t

3. fMG (A, {tak},X4) = t


5. Zatem implikanty pierwsze funkcji fMG (A, {tak},X4) toPRIMEMG (A, {tak},X4) = {t}



2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {tak},X4) = {t} ioryginalnej tablicy mo»emy zapisa¢ 1 reguª¦ minimaln¡:

3. t = bardzowysoka⇒ σA = {tak}

reguªy minimalne dla σA = {nie}dla obiektu X6

1. Wyliczamy reguªy minimalne dla σA = {nie} czyli reguªy postaciα⇒ σA = {nie}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu X6:MG(A, {nie},X6) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {nie},X6).

1 2 3 4 66 g,t m,t g g,t ∅3. fMG (A, {nie},X6) = t ∗ (g +m + t) ∗ (g + t) ∗ (t)4. Minimalizujemy funkcj¦

fMG (A, {nie},X6) = tt ∗ (g +m+ t) ∗ (g + t) = (ttg + ttm+ ttt)(g + t) =(ttgg+ tttg+ ttmg+ tttm+ tttg+ tttt) = (tg+ tg+ tmg+ tm+ tg+ t) =(tg + tmg + tm + t) = tg(1+m) + t(1+m) = tg + t = t(g + 1) = t

5. Zatem implikanty pierwsze funkcji fMG (A, {nie},X6) toPRIMEMG (A, {nie},X6) = {t}

reguªy minimalne dla σA = {nie}

1. Wyliczamy reguªy minimalne dla σA = {nie} czyli reguªy postaciα⇒ σA = {nie}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {nie},X6) = {t} ioryginalnej tablicy mo»emy zapisa¢ 1 reguª¦ minimaln¡:

3. t = normalna⇒ σA = {nie}

Wygenerowane reguªy optymalne -baza: PACJENCI

1. if t = wysoka then grypa = tak

2. if g = tak then grypa = tak

3. if m = nie then grypa = tak

4. if t = bardzo wysoka then grypa = tak

5. if t = normalna then grypa = nie

Ostatecznie otrzymamy 2 optymalne reguªy decyzyjne:

• dla decyzji c = tak:if t = wysoka ∨ g = tak ∨m = nie ∨ t = bardzo wysoka then grypa = tak

• dla decyzji c = nie:if t = normalna then grypa = nie

Przykªadowa tablica decyzyjna

Tablica jest niespójna

WniosekTablica jest niespójna!

Wprowadzamy uogólniony atrybut decyzyjny σA

Decyzja:

Wprowadzamy uogólniony atrybut decyzyjny σA

Teraz w tablicy wyst¦puj¡ powielone obiekty

Obserwacja:

Teraz w tablicy wyst¦puj¡ powielone obiekty

Eliminujemy powielone obiekty

Decyzja:

Eliminujemy powielone obiekty

Tworzymy macierz nierozró»nialno±ci

Krok algorytmu:

Tworzymy macierz nierozró»nialno±ci

reguªy minimalne dla σA = {0}

1. Wyliczamy reguªy minimalne dla σA = {0} czyli reguªy postaciα⇒ σA = {0}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektu x1:MG(A, {0}, x1) wyznaczamy funkcj¦ nierozró»nialno±ci fMG (A, {0}, x1).

3.1 2 3 4 6 8

1 ∅ b c ab abc ac

4. fMG (A, {0}, x1) = b ∗ c ∗ (a+ b) ∗ (a+ b + c) ∗ (a+ c)

5. Minimalizujemy funkcj¦ fMG (A, {0}, x1)6. fMG (A, {0}, x1) = bc(a+ b)(a+ b + c)(a+ c) =

(abc+bc)(a+b+c)(a+c) = (abc+abc+abc+abc+bc+bc)(a+c) =(abc + bc)(a+ c) = abc + abc + abc + bc = abc + bc = bc(a+ 1) = bc

7. Zatem implikanty pierwsze funkcji fMG (A, {0}, x1) toPRIMEMG (A, {0}, x1) = {bc}



2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {0}, x1) = {bc} ioryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. b = 0 ∧ c = 0⇒ σA = {0}



2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux2 : MG(A, {1}, x2) oraz x4 : MG(A, {1}, x4), wyznaczamy funkcj¦nierozró»nialno±ci fMG (A, {1}, x2) oraz fMG (A, {1}, x4).

3. Macierz i funkcja rozró»nialno±ci dla obiektu x21 2 3 4 6 8

2 b ∅ bc a ac abc

4. fMG (A, {1}, x2) = b ∗ (b + c) ∗ (a+ c) ∗ (a+ b + c)

5. Minimalizujemy funkcj¦ fMG (A, {1}, x2)6. fMG (A, {0}, x1) = b ∗ (b + c) ∗ (a+ c) ∗ (a+ b + c) =

(b + bc) ∗ (a+ c) ∗ (a+ b + c) = (ab + bc + abc + bc)(a+ b + c) =(ab+abc+bc)(a+b+c) = ab+ab+abc+abc+abc+abc+abc+bc+bc =ab + abc + bc = ab(1+ c) + bc = ab + bc

7. Zatem implikanty pierwsze funkcji fMG (A, {1}, x2) toPRIMEMG (A, {1}, x2) = {ab, bc}

reguªy minimalne dla σA = {1}Macierz i funkcja rozró»nialno±ci dla obiektu x4

1 2 3 4 6 84 ab a abc ∅ c bc

1. fMG (A, {1}, x4) = (a+ b) ∗ (a+ b + c) ∗ c ∗ (b + c)

2. Minimalizujemy funkcj¦ fMG (A, {1}, x4)3. fMG (A, {1}, x4) = (a+b)(a+b+c)c(b+c) = (a+b)(a+b+c)(bc+c) =

(a+ ab+ ac + ab+ b+ bc)(bc + c) = ac + abc + abc + abc + ac + abc +abc + bc + bc + bc + bc = abc + ac + bc = bc(a+ 1) + ac == ac + bc

4. Zatem implikanty pierwsze funkcji fMG (A, {1}, x4) toPRIMEMG (A, {1}, x2) = {ac, bc}



2. Implikanty pierwsze funkcji fMG (A, {1}, x2) toPRIMEMG (A, {1}, x2) = {ab, bc}

3. Implikanty pierwsze funkcji fMG (A, {1}, x4) toPRIMEMG (A, {1}, x4) = {ac, bc}

4. (a = 0 ∧ b = 1) ∨ (b = 1 ∧ c = 0) ∨ (a = 1 ∧ c = 0) ∨ (b = 1 ∨ c = 0)⇒σA = {1}

5. Po uproszczeniu:• (a = 0 ∧ b = 1)⇒ σA = {1}• (a = 1 ∧ c = 0)⇒ σA = {1}• (b = 1 ∧ c = 0)⇒ σA = {1}



2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux8 : MG(A, {2}, x8) wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {2}, x8).

3. fMG (A, {2}, x8) = (a+ c) ∗ (a+ b + c) ∗ a ∗ (b + c) ∗ b4. Minimalizujemy funkcj¦ fMG (A, {2}, x8)5. fMG (A, {2}, x8) = (a+ c)(a+b+ c)a(b+ c)b = (aa+ ab+ ac+ ac+bc+

cc)(abb+abc) = (aaabb+aabbb+aabbc+aabbc+abbbc+abbcc+aaabc+aabbc + aabcc + aabcc + abbcc + abccc) = ab + abc = ab(1+ c) = ab

6. Zatem implikanty pierwsze funkcji fMG (A, {2}, x8) toPRIMEMG (A, {2}, x8) = {ab}



2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {2}, x8) = {ab} ioryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. a = 1 ∧ b = 0⇒ σA = {2}

reguªy minimalne dla σA = {0, 2}

1. Wyliczamy reguªy minimalne dla σA = {0, 2} czyli reguªy postaciα⇒ σA = {o, 2}.

2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux3 : MG(A, {0, 2}, x3) , wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {0, 2}, x3).

3.1 2 3 4 6 8

3 c bc ∅ abc ab a

4. fMG (A, {0, 2}, x3) = c ∗ (b + c) ∗ (a+ b + c) ∗ (a+ b) ∗ a5. Minimalizujemy funkcj¦ fMG (A, {0, 2}, x3)6. fMG (A, {0, 2}, x3) = c(b + c)(a+ b + c)(a+ b)a =

(bc + c)(a+ ab+ ac + ab+ ab+ abc) = (abc + abc + abc + abc + abc +abc + ac + abc + ac + abc + abc + abc) = abc + ac = ac(b + 1) = ac

7. Zatem implikanty pierwsze funkcji fMG (A, {0, 2}, x3) toPRIMEMG (A, {0, 2}, x3) = {ac}


1. Wyliczamy reguªy minimalne dla σA = {0, 2} czyli reguªy postaciα⇒ σA = {0, 2}.

2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {0, 2}, x3) = {ab}i oryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. a = 0 ∧ c = 1⇒ σA = {0, 2}



2. Opieraj¡c si¦ na uogólnionej macierzy nierozró»nialno±ci dla obiektux6 : MG(A, {0, 1}, x6) , wyznaczamy funkcj¦ nierozró»nialno±cifMG (A, {0, 1}, x6).

3.1 2 3 4 6 8

6 abc ac ab c ∅ b

4. fMG (A, {0, 1}, x6) = (a+ b + c) ∗ (a+ c) ∗ (a+ b) ∗ c ∗ b5. Minimalizujemy funkcj¦ fMG (A, {0, 1}, x6)6. fMG (A, {0, 1}, x6) = (a+ b + c)(a+ c)(a+ b)cb =

(a+ ba+ ca+ ac + bc + c)(abc + bc) = (abc + abc + abc + abc + abc +abc + abc + abc + abc + abc + bc + bc) = abc + bc = bc(1+ a) = bc

7. Zatem implikanty pierwsze funkcji fMG (A, {0, 1}, x6) toPRIMEMG (A, {0, 1}, x6) = {bc}



2. Opieraj¡c si¦ na implikantach pierwszych PRIMEMG (A, {0, 1}, x6) = {bc}i oryginalnej tablicy mo»emy zapisa¢ reguª¦ minimaln¡:

3. b = 1 ∧ c = 1⇒ σA = {0, 1}

reguªy minimalne dla caªego zbioru

Otrzymujemy nast¦puj¡ce reguªy minimalne:

• b = 0 ∧ c = 0⇒ σA = {0}• (a = 0 ∧ b = 1) ∨ (a = 1 ∧ c = 0) ∨ (b = 1 ∧ c = 0)⇒ σA = {1}• a = 1 ∧ b = 0⇒ σA = {2}• a = 0 ∧ c = 0⇒ σA = {0, 2}• b = 1 ∧ c = 1⇒ σA = {0, 1}

Podsumowanie cz¦±ci II

1. Tablica decyzyjna.

2. Deterministyczna i niedeterministyczna tablica decyzyjna.

3. Deterministyczna i niedeterministyczna reguªa decyzyjna.

4. Relacja nierozró»nialno±ci wzgl¦dem decyzji.

5. Algorytm generowania reguª minimalnych.

6. Algorytm generowania reguª minimalnych - przykªad.

Zasi¦g teorii zbiorów przybli»onych

Research groups of International Rough Set Society

• Institute of Computer Science, Warsaw University of Technology

• Laboratory of Intelligent Information Systems, Pozna« University ofTechnology

• Linnaeus Centre for Bioinformatics, Uppsala, Sweden

• Group of Logic, Warsaw University

• Computational Intelligence Lab, University of Manitoba

Podsumowanie

1. System decyzyjny to system informacyjny z wyró»nionym atrybutemdecyzyjnym.

2. Metody redukcji zbioru atrybutów.

3. Usuwanie niespójno±ci z tablic decyzyjnych.

4. Generowanie reguª minimalnych z tablic decyzyjnych.

Relacja nierozró»nialno±ci � przykªadowa tablica decyzyjna

Iloczyn kartezja«ski:

U × U = {(1, 1), (1, 2), (1, 3), (1, 4), (2, 2), (2, 3), (2, 4), (3, 3), (3, 4), (4, 4)}

Ró»ne wersje relacji nierozró»nialno±ci, uzale»nione od zawarto±ci zbioru B:

• Dla B = {a} : IND(B) = {(1, 1), (2, 2), (2, 3), (3, 3), (4, 4)}• Dla B = {c} : IND(B) = {(1, 1), (1, 3), (2, 2), (2, 4), (3, 3), (4, 4)}• Dla B = {b, c} : IND(B) = {(1, 1), (1, 3), (2, 2), (3, 3), (4, 4)}

Klasy abstrakcji � przykªadowa tablica decyzyjna

• Dla B = {a} : U/IND(B) = {{1}, {2, 3}, {4}}• Dla B = {b, c} : U/IND(B) = {{1, 3}, {2}, {4}}• Dla B = {a, b, c} : U/IND(B) = {{1}, {2}, {3}, {4}}• Dla B = {c} i x = 1 : [x ]IND(B) = {1, 3}• Dla B = {c} i x = 2 : [x ]IND(B) = {2, 4}• Dla B = {a, b} i x = 1 : [x ]IND(B) = {1}

Wyznaczanie j¡dra z de�nicji

Zakªadamy, »e B = {a, b, c}1. U/IND(B) = {{1}, {2}, {3}, {4}}2. U/IND(B − a) = {{1, 3}, {2}, {4}} - a jest niezb¦dny

3. U/IND(B − b) = {{1}, {2}, {3}, {4}} - b jest zb¦dny

4. U/IND(B − c) = {{1}, {2}, {3}, {4}} - c jest zb¦dny

J¡dro CORE(B) = {a}

Wyznaczanie reduktów z de�nicji

1. Zakªadamy, »e B = {a, b, c}2. Potencjalne redukty to:{a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}

3. Ale wiemy ju», »e CORE(B) = {a}4. Skoro j¡dro utrzymuje rozró»nialno±¢ obiektów w systemie, to nie mo»emy

atrybutów z j¡dra zredukowa¢.

5. Pozwala to zaw¦zi¢ zbiór potencjalnych reduktów do:{a}, {a, b}, {a, c}, {a, b, c}

6. Samo j¡dro jest interesuj¡cym kandydatem na redukt. Z de�nicji speªniaju» pierwszy warunek dla reduktu � jest zbioremnie zale»nym.

7. Czy jednak U/IND({a}) = U/IND({a, b, c})?8. Sprawd¹my drugi warunek: U/IND({a, b, c}) = {{1}, {2}, {3}, {4}}9. U/IND({a}) = {{1}, {2, 3}, {4}}10. J¡dro CORE(B) = {a} nie jest reduktem.


Czy B1 = {a, b} jest reduktem?Czy B1 jest niezale»ny?

1. U/IND(B1) = {{1}, {2}, {3}, {4}}2. U/IND(B1− {a}) = {{1, 3}, {2}, {4}} - {a} jest niezb¦dny3. U/IND(B1− {b}) = {{1}, {2, 3}, {4}} - {b} jest niezb¦dny

Zbiór B1 jest niezale»ny, speªnia pierwszy warunek reduktu.


Czy B1 = {a, b} jest reduktem?Czy B1 zachowuje tak¡ sam¡ rozró»nialno±¢ obiektów jak B?

1. U/IND({a, b, c}) = {{1}, {2}, {3}, {4}}2. U/IND(B1) = {{1}, {2}, {3}, {4}}

Widzimy, »e:U/IND({a, b, c}) = U/IND(B1)ZatemZbiór B1 jest reduktem.


Czy B2 = {a, c} jest reduktem?Czy B2 jest niezale»ny?

1. U/IND(B2) = {{1}, {2}, {3}, {4}}2. U/IND(B2− {a}) = {{1, 3}, {2, 4}} - {a} jest niezb¦dny3. U/IND(B2− {c}) = {{1}, {2, 3}, {4}} - {c} jest niezb¦dny

Zbiór B2 jest niezale»ny, speªnia pierwszy warunek reduktu.


Czy B2 = {a, c} jest reduktem?Czy B2 zachowuje tak¡ sam¡ rozró»nialno±¢ obiektów jak B?

1. U/IND({a, b, c}) = {{1}, {2}, {3}, {4}}2. U/IND(B2) = {{1}, {2}, {3}, {4}}

Widzimy, »e:U/IND({a, b, c}) = U/IND(B2)ZatemZbiór B2 jest reduktem.


Ostatecznie, dla rozwa»anego systemu informacyjnego i zbioru B = {a, b, c}zbiór reduktów RED(B) :

RED(B) = {{a, b}, {a, c}}

Wyznaczenie j¡dra i reduktów z macierzy nierozró»nialno±ci

Wyznaczenie j¡dra i reduktow z de�nicji jest niewygodne. Wyznaczaniereduktów uªatwi macierz nierozró»nialno±ci. Dla danego systemuinformacyjnego SI = (U,A), gdzie U = {x1, x2, ..., xn} oraz podzbioruatrybutow B ⊆ A, macierz nierozró»nialno±ci M(SI ) = [cij ]nxn de�niujemynast¦puj¡co:

cij = {a ∈ A : a(xi ) 6= a(xj ), i , j = 1, 2, ..., n}

Ka»dy element macierzy cij jest zbiorem atrybutow ró»ni¡cych i-ty i j-ty obiektz U. Zakªadamy, »e B = {a, b, c}

Wyznaczenie j¡dra i reduktów z macierzy nierozró»nialno±ci

Wyznaczanie j¡dra CORE(B):Do rdzenia wchodz¡ atrybuty wyst¦puj¡ce w macierzy nierozró»nialno±cipojedynczo.

CORE(B) = {a ∈ A : cij = {a}}

, dla pewnego 1 <= i , j <= n

Wyznaczanie reduktów RED(B) :Pewien podzbiór atrybutów C ⊆ B jest reduktem je±li jest minimalny (w sensiezawierania zbiorów)oraz posiada niepuste przeci¦cie z ka»dym niepustym elementem macierzyM(SI ).

CORE(B) = {a} , bo c13 = {a}RED(B) = {{a, b}, {a, c}}poniewa»:{a, b} ∧ cij 6= ∅ i {a, c} ∧ cij 6= ∅i te zbiory s¡ minimalne.

Jeszcze jeden przykªad

a b c d e1 0 1 0 1 T2 1 0 0 1 T3 1 1 1 0 T4 1 1 1 1 T5 0 1 0 0 N

gdzie B = {a, b, c, d}

1. U/IND(B) = {{1}, {2}, {3}, {4}, {5}}2. U/IND(B − {a}) = {{1}, {2}, {3}, {4}, {5}}3. U/IND(B) = U/IND(B − {a})→ atrybut a jest zb¦dny

4. U/IND(B − {b}) = {{1}, {2}, {3}, {4}, {5}}5. U/IND(B) = U/IND(B − {b})→ atrybut b jest zb¦dny

6. U/IND(B − {c}) = {{1}, {2}, {3}, {4}, {5}}7. U/IND(B) = U/IND(B − {c}) → atrybut c jest zb¦dny

8. U/IND(B − {d}) = {{1, 5}, {2}, {3, 4}}9. U/IND(B) 6= U/IND(B − {d})→ atrybut d jest niezb¦dny,

10. CORE(B) = {d}

Zbiory przybli»one w praktyce

• proces diagnozowania encefalomiopatii mitochondrialnych jest dªugi: bodªugi jest czas potrzebny do postawienia ostatecznej diagnozy. St¡dzastosowanie systemu ekspertowego, który ma ten czas skróci¢.

• Dane na podstawie których podejmowano decyzje (stawiano diagnoz¦), jakka»de dane rzeczywiste, byªy obarczone bª¦dami:• niepeªno±¢ informacji (niektóre badania, czy te» obserwacje, nie byªy

mo»liwe do wykonania dla wszystkich pacjentów),• nieostro±¢ (nieprecyzyjno±¢) poj¦¢ (warto±ci niektórych parametry podawane

byªy w sposób nieprecyzyjny),• sprzeczno±¢ informacji (pojawiali si¦ pacjenci, u którzy przy tych samych

warto±ciach analizowanych parametrów, postawione zostaªy ró»ne diagnozy).

Zbiory przybli»one w praktyce

• baza wiedzy utworzona na podstawie wcze±niej zdiagno-zowanychpacjentów (dane treningowe).

• na podstawie bazy wiedzy powinna by¢ dokonywana klasy�kacja nowychprzypadków (pacjentów).

• W naszym przypadku zbiór treningowy zªo»ony byª z pacjentówpodejrzanych o encefalomiopatie mitochondrialne, którym postawiono ju»diagnoz¦. Dane, które byªy pó¹niej poddawane klasy�kacji to nowipacjenci podejrzani o MEM, wymagaj¡cy postawienia diagnozy.

Zastosowania teorii zbiorów przybli»onych

• Od czasu powstania w 1982 roku, teoria zbiorów przybli»onych znalazªabardzo liczne zastosowania w informatyce, w takich dziedzinach jak:systemy ekspertowe, systemy wspomagania decyzji, uczenie na podstawieprzykªadów, rozpoznawanie obrazów i wiele innych.

• Powstaªo wiele programów, zarówno dla komputerów osobistych (PC) jak istacji roboczych wykorzystuj¡cych teori¦ zbiorów przybli»onych. Programyte maj¡ zastosowanie w wielu dziedzinach »ycia, np. medycynie,farmakologii, przemy±le, naukach spoªecznych, nauce o ziemi i wieleinnych.

• Teoria zbiorów przybli»onych przewa»nie wykorzystywana jest do analizydanych. Dane te najcz¦±ciej s¡ niepeªne i/lub niepewne. Na przykªad wmedycynie warto±ci wielu parametrów takich jak temperatura ciaªa,ci±nienie krwi, itp. s¡ podawane w sposób jako±ciowy (np. temperatura wnormie, ci±nienie krwi podwy»szone, itd.), nie za± w dokªadnychwarto±ciach liczbowych (np. temperatura = 37, 1oC , ci±nienie krwi130/90). Gªówne problemy rozwi¡zywane przy pomocy teorii zbiorówprzybli»onych w analizie danych to redukcja danych, znajdowaniezale»no±ci mi¦dzy danymi, generowanie algorytmów decyzyjnych,odpowiednie klasy�kowanie danych, znajdowanie wzorców w danych i tympodobne.

• Uczenie na podstawie przykªadów (uczenie maszynowe, automatycznepozyskiwanie wiedzy, systemy ucz¡ce si¦) to nast¦pna dziedzina w którejznalazªa zastosowanie teoria zbiorów przybli»onych. Pomimo i» do tej porynie ma powszechnie akceptowanych teoretycznych podstaw ucze-niamaszynowego, zbiory przybli»one daj¡ teoretyczne postawy dorozwi¡zywania problemów pojawiaj¡cych si¦ w uczeniu maszynowym.

• Teoria zbiorów przybli»onych jest równie» wykorzystywana w metodachgenerowania i minimalizowania obwodów steruj¡cych (switching circuits),oraz w systemach diagnozowania wad - bª¦dów (fault diagnosis).

• Przetwarzanie obrazów to inne pole na którym pojawiªy si¦ aplikacjewykorzystuj¡ce teorie zbi-rów przybli»onych. Powstaªy algorytmy na bazieRS sªu»¡ce na przykªad do rozpoznawania znaków.

Pawlak Z., (1983) Information Systems - theoretical foundations [polish],WNT, W-wa.

Pawlak Z., (1982) Rough Sets. Int. J. of Information and Computer Sci11: 344-356.

Wakulicz-Deja A., Nowak A., (2007) From an Information System to aDecision Support System, Rough Sets and Intelligent Systems Paradigms,Lecture Notes in Computer Science,Springer Verlag, Volume 4585,454-464.

dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf ·...

Documents

Transcript of dr Agnieszka Nowak-Brzezi«ska - Strona Głównazsi.tech.us.edu.pl/~nowak/se/2wyklad.pdf ·...