TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE ZBATIME TË …

i

REPUBLIKA E SHQIPËRISË

UNIVERSITETI I TIRANËS

FAKULTETI I SHKENCAVE TË NATYRËS

DEPARTAMENTI I MATEMATIKËS SË APLIKUAR

PROGRAMI I STUDIMIT:

Metoda Probabilitare, Statistike dhe Metodat e Analizës Numerike

TEZË DOKTORATURE

Për gradën

“DOKTOR I SHKENCAVE"

TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE

ZBATIME TË TYRE

Kandidate: Udhëheqës shkencor:

Msc. Daniela Halidini (Qendraj) Prof. Dr. Thoma Mitre

TIRANË, 2016

ii

REPUBLIKA E SHQIPËRISË

UNIVERSITETI I TIRANËS

FAKULTETI I SHKENCAVE TË NATYRËS

DEPARTAMENTI I MATEMATIKËS SË APLIKUAR

TEZË DOKTORATURE

TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE ZBATIME TË TYRE

Kandidate: Udhëheqës shkencor:

Msc. Daniela Halidini (Qendraj) Prof. Dr. Thoma Mitre

Mbrohet më datë ____.____.2016 para komisionit të përbërë nga:

1. ____________________________________, Kryetar

2. ____________________________________, Anëtar (Oponent)

3. ____________________________________, Anëtar (Oponent)

4. ____________________________________, Anëtar

5. ____________________________________, Anëtar

TIRANË, 2016

iii

FALENDERIME

Në fund të këtij rrugëtimi të gjatë ndiej dëshirën e madhe për të falenderuar së pari gjithë

profesorët që na kanë formuar me dijet e tyre shkencore. Një falenderim i veçantë shkon për

profesorin tim udhëheqës Prof. Thoma Mitre për gjithë sugjerimet, këshillat dhe kritikat në

realizimin me sukses të këtij punimi. Gjithashtu falenderoj shumë Prof. Fatmir Hoxhën për

ndihmesën dhe mbështetjen e pakursyer në kohë.

Mirënjohja themelore është për prindërit e mi, sidomos për babain tim që edhe pse nuk jeton më,

ky sukses është vetëm i tij dhe i nënës sime.

Dëshiroj të falenderoj shumë bashkëshortin tim për përkushtimin e thellë, durimin dhe

inkurajimin e vazhdueshëm gjatë gjithë kohës së punimit për këtë temë.

I detyrohem mirënjohje dhe respekt gjithë familjes sime për mbështetjen e pakursyer që më kanë

dhënë dhe së fundmi më të voglit të familjes, djalit tim Luis.

Ju falenderoj të gjithëve pafundësisht!

iv

PËRMBAJTJA

PËRMBLEDHJE …………………………………………………………………………………………………....vi

ABSTRAKT………………………………………………………………………………………………………….vi

LISTA E TABELAVE…………………………………………………………………..………………………......vii

LISTA E FIGURAVE………………………………………………………………………………………...…....viii

HYRJE ……………………………………………………………………………………………………x

KAPITULLI 1 Një vështrim mbi problemet e optimizimit

1.1 Optimizimi matematik. Trajta e përgjithshme e një problemi optimizimi…………..…….....1

1.2 Optimizimi në rrjeta ………………………………………………………………………,.....4

1.3 Problemet e klasifikimit…………………………………………………………………...…11

1.4 Pemët e klasifikimit. Algoritmet e kërkimit të pemës minimale.............................................12

1.5 Pemët e vendimit dhe analiza e tyre........................................................................................16

1.6 Pemët binare..............................................................………….........………........…….........22

1.7 Minimizimi i numrit të kulmeve të pemës së vendimit……………………………………..28

1.8 Etiketimi i çdo kulmi me të shumtën një tipar.........................................................................29

1.9 Vështrim i përgjithshëm mbi kompleksitetin………………………….……………………..30

KAPITULLI 2 Aspekte algoritmike nё rrjetat vendim-marrёse

2.1 Teoria e rrjetave e aplikuar në pemët e vendimit……………………………………………33

2.2 Avantazhet dhe disavantazhet e pemës së vendimit……………………………………..….34

2.3 Algoritmet e rrjetave të vendimit…………………………………………………….............35

2.3.1 ID3 algoritmi bazë i vendimit………………………………………………………........36

2.3.2. Algoritmi ID3 Pseudokode.............................................................................................42

2.3.3 Algoritmi C4.5 si përmirësim i ID3……………………………………………………..43

2.3.4 Avantazhet dhe disanvantazhet e ID3 dhe C4.5………………………………………...44

2.3.5 Krahasimi midis ID3 dhe C4.5 i aplikuar në rrjetat wireles dhe sistemet inteligjente të

transportit…………………………………………………………………………………….…..45

2.3.6. Algoritmi Cart dhe indeksi Gini…………………..…………………………….….... 48

v

KAPITULLI 3 Paketa weka pёr klasifikime nё rrjeta

3.1 Paketa Weka për klasifikim…………………..……………………………………………..51

3.2 ID3 i implementuar në paketën Weka Tushar ………………………………………………52

3.2.1Vlerësimi i faktorëve për të qenë obezë. (Zbatim).......................………………...……..55

3.2.2 Klasifikimi i statusit ekonomik të familjeve shqiptare. (Zbatim)……………..……...…58

3.3 Një mënyrë e re e përmirësuar e ID3 në pemët binare me anë të Weka……………………63

KAPITULLI 4 Teoria e renditjes nga nivelet e rrjetёs

4.1 Proçesi i Analizës Hierarkike (AHP) ……………………………………………..………...69

4.2 Shkalla Saaty………………………………………………………………………………...72

4.3 Aksiomatika e AHP………………………………………………………………………….74

4.4 Matrica e krahasimeve.Vektorët e vetë………………………………………………...…….80

4.5 Qëndrueshmëria Saaty…………………………………………….……….…….………..…82

4.6 Një veti e matricave të qëndrueshme…………………………………………………….…..84

4.7 Përcaktimi i peshave globale………………………………………………………….……..84

4.8 Strukturimi i informacionit. Matjet absolute dhe relative…………………………..………85

4.9 Klasifikimi i firmave pjesëmarrëse në një tender.( Zbatim)…………………………….…...91

4.10 Vlerësimi i faktorëve të riskut për të qenë i sëmurë me anë të AHP. (Zbatim)………........96

PËRFUNDIME ………………………………………………………………………………...100

LITERATURA .. ………………………………………………………………………………102

vi

PËRMBLEDHJE

Në këtë tezë doktorature trajtohen probleme të optimizimit në rrjeta, duke u fokusuar në rrjetat vendim-

marrëse, të cilat kanë një zbatim të gjerë në të gjitha fushat e shkencës. Duke marr shkas nga zhvillimet e

kohës në teknologji dhe internet, ku sasia e të dhënave është marramendëse do të mundohemi të

klasifikojmë disi apo të propozojmë mënyra renditjeje, për të gjetur një zgjidhje optimale ose sa më afër

optimales. Trajtohen problemet e optimizimit më të ndeshura në kohë, që modelohen si probleme me

konstrukt klasifikimi në pemë. Jepet në përgjithësi struktura e një pemë vendimi dhe problema që çojnë

në këto struktura, algoritme që gjenerojnë pemë vendim-marrëse si dhe përmirësime të tyre. Janë parë

raste nga ekonomia, mjekësia, transporti, mjedisi, etj dhe është konkluduar se këto algoritma janë të

shpejtë dhe të efektshëm për një zgjidhje sa më afër optimales. Në ndihmë të klasifikimit kemi paketën

WEKA Tushar, e cila mund të përdoret në mënyrë shumë praktike. Në ndryshim nga R- Programming

dhe Matlab, kjo paketë ka algoritmin e klasifikimit ID3 si dhe algoritma të tjerë klasifikimi, të

përshtashëm për vendim-marrje, me versione të përmirësuara të vitit 2014. Është shumë e vlefshme për

klasifikim të çdo baze të dhënash, të ruajtur thjesht në një tabelë ekseli, për ta paraqitur atë si një pemë

vendimi. Një teori e re për rrjetat e vendimit është Procesi i Analizës Hierarkike (Thomas Saaty), i cili

është mjaft praktik për të renditur rezultate nga më i miri tek më i keqi ose nga më i preferuari tek ai më

pak i preferuari. Në këtë teori ka mjaft rol mënyra e formimit të matricave të krahasimit dy e nga dy

ndërmjet kritereve, si dhe llogaritja e peshave të secilit kriter.

Fjalë kyçe: Pemë vendim-marrëse, ID3 algoritëm, Weka, AHP

ABSTRACT

In this doctoral thesis we have been treated the optimization problems in networks, focusing on the

decision-making networks, which have a wide application in all scientific fields. Taking into

consideration the developments in technology and internet, where the amount of data is enormous, we

will try to classify somehow or propose ways to sort, to find an optimal solution or as near as possible

from optimal. Have been treated optimization problems encountered in the most time, which are modeled

as problems that are built in tree classification, the algorithms that generate decision trees and their

improvements. We have seen cases of economy, medicine, transport, environment, etc. and have

concluded that these algorithms are fast and effective for a solution as near as possible to optimal. In

support of the classification we have WEKA package Tushar as a new soft that can be used by everyone

in a very practical way. Compared to R-Programming and Matlab, this package has the ID3 classification

algorithm, as well as other classification algorithms suitable for decision-making, has now improved

versions of 2014.It is very valuable for classification of each database saved simply in an excel table, to

present it as a decision tree. A new theory for decision networks, represented by Analytic Hierarchic

Process (Thomas Saaty), which is quite practical to align results from best to worst, or most preferred to

the least preferred. In this theory has a big role the way of forming the comparison matrices between the

criterions selected two by two and calculation of weights each criterion.

Keywords: Decision tree, ID3 algorithm, Weka, AHP

vii

LISTA E TABELAVE

Tabela 1.1. Tabela e veprimeve dhe ngjarjeve............................................................................................19

Tabela 1.2 Tabela Gërmë-Kod...................................................................................................................23

Tabela 2.1. Bashkësia S e të dhënave.........................................................................................................38

Tabela 2.2 Të dhënat pas rrënjës në lidhje me atributin “Diell”.................................................................40

Tabela 2.3 Të dhënat pas rrënjës në lidhje me atributin “Me re”...............................................................41

Tabela 2.4 Të dhënat pas rrënjës në lidhje me atributin “Shi”...................................................................41

Tabela 2.5 Vlerat e atributeve te C4.5........................................................................................................44

Tabela 2.6 Karakteristikat e ID3 dhe C4.5.................................................................................................45

Tabela 2.7 Vlerat e indeksit GINI..............................................................................................................49

Tabela 2.8 Atributet të indeksuara me GINI.............................................................................................50

Tabela 3.1 Faktorët e obezitetit.................................................................................................................56

Tabela 3.2 Statusi ekonomik i familjeve shqiptare....................................................................................59

Tabela 3.3 Vlerat e variablave binare tek statusi ekonomik......................................................................62

Tabela 3.4 Vlerat e probabilitetit të kushtëzuar........................................................................................64

Tabela 3.5 Probabilitetet e shpërndarjes P……………………………………………………….............65

Tabela 3.6 Probabilitetet e shpërndarjes 'P ……………………………………………………………..65

Tabela 3.7 Të dhënat e punëtorëve............................................................................................................67

Tabela 4.1 Shkalla Saaty………………………………………………………………………................73

Tabela 4.2 Indeksi rastësor i qëndrueshmërisë………………………..……………………………….…83

Tabela 4.3 Universitetet në varësi të kriterit vendndodhje……………………………………................90

Tabela 4.4 Kriteret e firmave......................................................................................................................91

Tabela 4.5 Krahasimet e kritereve............................................................................................... ..............92

Tabela 4.6 Krahasimet dy e nga dy të faktorëve.......................................................................................97

Tabela 4.7 Krahasimet e sëmundjeve me faktorin duhan...........................................................................98

viii

Tabela 4.8 Krahasimet e sëmundjeve me faktorin alkol.............................................................................98

Tabela 4.9 Krahasimet e sëmundjeve me faktorin obeziteti.....................................................................98

Tabela 4.10 Krahasimet e sëmundjeve me faktorin histori familjare........................................................98

Tabela 4.11 Peshat lokale për çdo tabelë..................................................................................................99

LISTA E FIGURAVE

Figura 1.1 Klasifikimi i disiplinave të optimizimit………………………………………………...……...3

Figura 1.2 Fluksi në rrjeta...........................................................................................................................5

Figura 1.3 Caktimet një person-një objekt...................................................................................................7

Figura 1.4 Këmbimet midis tre personave……………………………………………………………......8

Figura 1.5 Pemët klasifikuese.....................................................................................................................12

Figura 1.6 Algoritmi Kruskal......................................................................................................................14

Figura 1.7 Algoritmi Prim...........................................................................................................................15

Figura 1.8 Algoritmi Boruvka.....................................................................................................................16

Figura 1.9 Shembull Vendim-marrje..........................................................................................................17

Figura 1.10 Pema veprime-ngjarje……………………………………………………………………….20

Figura 1.11 Vlerat e pritshme të veprimeve në hapin e dytë......................................................................20

Figura 1.12 Vlerat e pritshme të veprimeve tek hapi i parë........................................................................21

Figura 1.13 Paraqitja e një peme binare......................................................................................................22

Figura 1.14 Pema binare prefiks-kod.........................................................................................................24

Figura 1.15a Pema Kuq e Zi, prindi- xhaxha..............................................................................................25

Figura 1.15b Pema Kuq e Zi prindi- xhaxha..............................................................................................25

Figura 1.15c Pema Kuq e Zi, prind- xhaxha...............................................................................................25

Figura 1.16 Renditja e elementëve me anë të BST.....................................................................................27

Figura 1.17 Llojet e pemëve binare me tre kulme......................................................................................27

Figura 2.1 Paraqitja e pemës vendim-marrëse për të luajtur futboll...........................................................41

Figura 2.2 Llojet e kulmeve në rrjetat wireles............................................................................................46

Figura 2.3 Rrjeta WSN............................................................................................................. ..................46

Figura 2.4 Komunikimi WSN-GIS-ITS.....................................................................................................47

ix

Figura 2.5 Grafiku krahasues ID3 dhe C4.5..............................................................................................48

Figura 2.6 Indeksi Gini.............................................................................................................. .................49

Figura 3.1 Pamje e paketës Weka...............................................................................................................51

Figura 3.2 Të dhënat e shembullit 1 në Weka............................................................................................52

Figura 3.3 Visualizimi i atributeve ndërmjet tyre.......................................................................................52

Figura 3.4 Përzgjedhja e algoritmit ID3 si J 48 Prunned............................................................................53

Figura 3.5 Paraqitja e pemës përfundimtare...............................................................................................55

Figura 3.6 Klasifikimi i faktorëve të obeziteti............................................................................................57

Figura 3.7 Aplikimi i J 48...........................................................................................................................57

Figura 3.8 Paraqitja e pemës faktorë obeziteti............................................................................................58

Figura 3.9 Klasifikimi i familjeve në Weka................................................................................................61

Figura 3.10 Paraqitja e pemës status ekonomik me anë të Weka...............................................................61

Figura 3.11 Paraqitja e klasifikimit binare për statusin ekonomik.............................................................62

Figura 3.12 Pemët me shpërndarje............................................................................................. .................66

Figura 3.13 Pema binare e ndërtuar nga ID3.............................................................................................68

Figura 3.14 Pema binare e ndërtuar nga ID3 i modifikuar.........................................................................68

Figura 4.1 Hierarkia e problemit të Finlandës………………..…………………………………………..70

Figura 4.2 Hierarkia e universiteteve……………………………………………………………………..88

Figura 4.3 Struktura hierarkike e firmave.................................................................................... ...............92

Figura 4.4 Struktura hierarkike e sëmundjeve ………….………………………………………….….....97

x

Hyrje

Që në lashtësi njerëzit janë përpjekur të gjejnë zgjidhje sa më të mira për problemet e tyre jetike,

një pjesë e të cilave shumë vonë janë paraqitur si probleme optimizimi në rrjeta. Pikërisht këto

probleme optimizimi formulohen në struktura rrjetore dhe kanë aplikime të gjera në fusha të

ndryshme. Një fakt i pamohueshëm është se ne të gjithë jemi optimizues pasi ne marrim vendime

për të maksimizuar cilësinë e jetesës, produktivitetin në kohë, si dhe mirëqënien tonë në një

mënyrë ose një tjetër. Kjo është një luftë e vazhdueshme për të krijuar një mundësi më të mirë në

mes të shumë alternativave. Optimizimi ka qenë, është dhe do të jetë kërkesa themelore e jetës

njerëzore dhe ky fakt bën që të zhvillohen masivisht teknikat në këtë fushë. Në këtë drejtim kanë

punuar shumë filozof, matematikanë, shkencëtarë. Ekzistenca e metodave të optimizimit

gjurmohet prej kohës së Njutonit, Lagranzhit dhe Koshi. Zhvillimi i metodave llogaritëse

diferenciale për optimizimin ishte i mundur nga kontributi i Njutonit dhe Lajbnicit. Themelet e

llogaritjeve variacionale kishin të bënin me minimizimin e funksionit dhe janë bërë nga Euleri,

Lagranzhi dhe Vajershtrasi. Metodat e optimizimit të problemeve me kufizime u bënë të njohura

nga Lagranzhi. Koshi bëri aplikimin e parë të një metodë optimizimi për zgjidhjen e problemeve

pa kufizime. Nga mesi i shekullit të njëzetë zhvillimi dixhital i kompjuterave bëri të mundur

implementimin e optimizimit kompleks dhe të simulimeve me metoda të reja. Ky avancim dha

rezultat në krijimin e fushave të ndryshme të teorisë së optimizimit. Disa nga ndalesat kryesore

janë këto :

Matematikanët grekë të antikitetit kanë zgjidhur disa probleme optimizimi që kanë lidhje me

studimet e tyre gjeometrike, p.sh: Euklidi gjeti distancën minimale ndërmjet një pike dhe një

drejtëze, Zenodorus zgjidhi problemin Dido, të gjetjes së figurës me sipërfaqe maksimale për një

perimetër të dhënë. Heroni provoi se drita kur pasqyrohet në pasqyrë lëviz ndërmjet dy pikave,

në rrugën me gjatësi më të shkurtër. Më vonë në shek. 17-të J.Kepler gjeti përmasat optimale të

fuçive të verës dhe formuloi një version të ri të problemit të sekretarit ose të problemit të

martesave. P. De Fermat tregon se në pikat ekstremale derivati i funksionit anullohet dhe G.

Monge tentoi të jap zgjidhje për problemin e transportit. Gjatë shek 19-të Furie formuloi

problemin PL për të zgjidhur problemet në mekanikë dhe teorinë probabilitare kurse Koshi

prezantoi metodën e gradientit. Gjatë kësaj periudhe u botuan shumë libra me përmbledhje nga

problemet e optimizimit ku veçohet libri i H.Hankok mbi optimizimin me titull “ Teoria e

minimumit dhe maksimumit”. Më vonë K.Menger paraqet formulën themelore të problemit të

tregtarit shëtitës kurse Ford dhe Fulkerson paraqesin fillimet e problemeve të optimizimit në

rrjeta. R.Bellman prezanton principet optimal dhe N.Karmarkar tregon algoritme në kohë

polinomiale për problemet e programimit linear (PL). Shumë sisteme janë formuar nga

ndërprerja e nënsistemeve që mund të kenë qëllime optimizimi të ndryshme ose të kundërta në

lidhje me sistemin global nga i cili ato janë pjesë. Pikërisht struktura e këtyre lidhjeve influencon

në performancën globale të rrjetës. Vetitë kryesore të rrjetave dinamike të strukturuara në

mënyra të ndryshme, janë lidhur në mënyrë eksplicite me optimizim të disa funksioneve

specifike në rrjetat komplekse dhe në topologjinë e tyre. Rrjeta e parë njerëzore që të vjen në

mendje është rrjeta gjenealogjike me lidhjet midis anëtarëve të familjes. Në një qytet të madh në

jugperëndim të Gjermanisë në fillim të shekullit të 19-të, shkencetari Lipp zbuloi kur dhe si

shtimi i një sistemi elektoral prek sistemin e rrjetave farefisnore. Çuditërisht në një zonë të

njohur për reformat e saj demokratike, Lipp tregoi se një gjysmë shekulli zgjedhjesh nuk e

reduktoi fuqinë farefisnore në komunitet, në fakt fuqia farefisnore vetëm sa forcohej. Lipp e

përdori rrjetën edhe për të zbuluar aktorët e shquar të fraksioneve të vogla politike dhe si ata

xi

lidhnin individë rrotull tyre. Në këtë rast rrjetat ishin subjekti i studimit në përdorim më shumë

se sa një evidencë, një përpjekje për të parë efektet e ndryshimeve politike në strukturat e

pushtetit. Një paralele në këto kohë është edhe teoria e analizës hierarkike, e paraqitur nga

Thomas Saaty që nga vitet 1970 e deri më tani. Kjo metodë paraqet një proçes të gjatë analize e

organizimi për një vendim-marrrje sa më optimale. Aplikimi i AHP (Proçesi i Analizës

Hierarkike) është në mjaft fusha të gjera si në qeverisje, shëndetësi, biznes, ndërtime, industri

dhe edukim. Vendim-marrësi është në krye të AHP dhe ai dekompozon gjithë problemin në

hierarki e nivele, të cilat përbëjnë nënprobleme, ku secila prej tyre analizohet në mënyrë të

pavarur. Pasi ndërtohet kjo skemë, vendim-marrësi nis të bëjë krahasime midis tyre, duke i marrë

dy e nga dy. Të gjitha vlerësimet cilësore që kryen ai, kthehen në vlerësime sasiore, duke i

vendosur peshat përkatëse secilit element në këtë hierarki. Në hapin final të gjitha vlerësimet

numerike të llogaritura renditen sipas rendit zbritës të tyre. Kështu klasifikohen alternativat nga

më optimalja deri tek ajo më e papërshtatshmja. J.Ross Quinlan prezantoi në 1979 algoritmin

ID3. Metodat në lidhje me pemët vendim-marrëse janë përdorur kryesisht për klasifikim sepse

kanë një strukturë hierarkike të thjeshtë për përdoruesin që të kuptojë vendim-marrrjen. Quinlan

ka qenë një lojtar aktiv në gjysmën e dytë të vitit 1980, me një numër të madh publikimesh në të

cilat ai propozon një metodë deduktive për të provuar sjelljen e një sistemi. Por ai bëri një kthesë

domethënëse në vitet 90-të, kur ai prezantoi metodën C4.5, e cila është referenca tjetër

thelbësore, ku donte të përfshinte pemët e vendimit (1993). [29]

Sot po përjetojmë një rigjallërim, të zhvilluar dhe nga popullariteti i internetit, e vetmja rrjetë që

lidh sistemin e një bote të tërë. Konfigurimet e ndryshme të kulmeve dhe brinjëve si një strukturë

kombinatoriale paraqesin grafin, së bashku me një relacion incidence ndërmjet tyre. Grafet mund

të përdoren për të modeluar shumë lloje relacionesh dhe proçesesh në fizikë, biologji, shkenca

sociale, sisteme informacioni etj. Shumë probleme praktike mund të paraqiten me anë të grafit.

Në shkencat kompjuterike, grafet përdoren për të paraqitur rrjetat e komunikimit, organizimin e

të dhënave, devijimet kompjuterike, fluksin kompjuterik etj. Për shembull, struktura e linkut të

një faqe web mund të paraqitet me anë të një grafi të orientuar, në të cilin kulmet përfaqësojnë

faqet web ndërsa brinjët e orientuara përfaqësojnë linket nga njëra faqe në tjetrën. Me zhvillimin

algoritmik për trajtimin e grafeve, interesi ka qenë shumë i lartë në shkencat kompjuterike.

Në fokusin tonë do të trajtohen problemat e optimizimit në rrjeta me algoritmet përkatës të tyre,

të lidhura me vlerësime të alternativave të zgjedhjes dhe renditje faktorësh nga më i rëndësishmi

tek më pak i rëndësishmi, të modeluara në rrjetat vendim-marrëse, si një model mjaft praktik dhe

i rëndësishëm për jetën e përditshme. Problemi kryesor është si të ndërtojmë një pemë vendimi

sa më optimale, për një problem të dhënë. Ndërtimi i pemëve vendim-marrëse nga të dhënat

është një disiplinë e largët në kohë. Statisticienët i kanë dhënë atribute punimeve të partneritetit

Sonquist e Morgan (1963), të cilët përdornin pemët regresive në proçeset e parashikimeve. Më

pas këto punime janë ndjekur nga një familje e tërë metodash, referuar kryesisht në problemat e

klasifikimit (Thaid-Morgan and Messenger 1973, Chaid-Kass 1980). Problemat vendim-marrëse

janë zgjidhur gjerësisht me anë të modeleve të programimit linear, në të cilat numri i zgjidhjeve

të mundshme është zakonisht i madh. Nga këto modele është shumë e vështirë të evidentohen

zgjidhjet e lejueshme, pra ato alternativa që i duhen vendim-marrjes. Në metodat e MCDM edhe

pse numri i alternativave është i vogël, ato janë të disponueshme që në momentin fillestar të

shtrimit të problemit. Në praktikë kriteret e vlerësimit të alternativave mund të jenë me natyra

cilësore ose sasiore. Kur kriteret janë cilësore ato nuk mund të shprehen numerikisht, pasi

kriteret nuk kanë njësi matëse të përbashkëta. Ndaj në këto kushte problemet e vendim-marrjes

nuk mund të trajtohen me modelet e njohura lineare. [8]

1

Kapitulli 1

Një vështrim mbi problemet e optimizimit

1.1 Optimizimi matematik. Trajta e përgjithshme e një problemi optimizimi.

Problemet e optimizimit janë të zakonshme në shumë disiplina dhe fusha të

ndryshme. Në këto problema duhen gjetur zgjidhje të cilat janë optimale ose afër-

optimales në lidhje me një qëllim të caktuar. Zakonisht nuk mund të zgjidhim

probleme që në hapin e parë, por duhen ndjekur disa proçese që na drejtojnë drejt

zgjidhjes së problemit. Zakonisht proçesi i zgjidhjes është i ndarë në dy shkallë të

ndryshme që ekzekutohen njëra pas tjetrës. Njohja me këto shkallë të ndihmon në

ndërtimin dhe zgjidhjen e problemës, vlerësimin dhe implementimin e zgjidhjeve. Ka

problema të optimizimit që mendohet se nuk modelohen në rrjeta, por që janë

lehtësisht të modelueshme dhe prodhojnë rrugë të të menduarit për një model optimal.

Optimizimi i vazhduar kundrejt optimizimit diskret: Disa modele kanë kuptim vetëm

nëse variablat marrin vlerë nga një bashkësi e fundme, zakonisht një nënbashkësi e

numrave të plotë, ndërsa modele të tjera përmbajnë variabla që marrin çdo vlerë reale.

Modelet me variabla diskret janë problema të optimizimit diskret dhe modelet me

variabla të vazhduar janë problema të optimizimit të vazhdueshëm. Këto modele të

vazhdueshme kanë tendencë të jenë më të thjeshta për tu zgjidhur sesa modelet e

optimizimit diskret. Implementimi i algoritmeve me teknologjinë e avancuar

kompjuterike ka rritur kompleksitetin e problemeve diskrete të optimizimit që mund

të zgjidhen në mënyrë efikase. Algoritmet e optimizimit të vazhduar janë shumë të

rëndësishëm në optimizimin diskret pasi mjaft algoritme të optimizimit diskret

gjenerojnë një varg nënproblemesh të vazhdueshme.

Optimizimi pa kufizime kundrejt optimizimit me kufizime: Një dallim i rëndësishëm

është ndërmjet problemeve në të cilat nuk ka kufizime në variabla dhe problemeve në

të cilat ka kufizime në variabla. Problemet e optimizimit pa kufizime lindin nga

shumë aplikime praktike: ato po ashtu lindin në riformulimin e problemeve të

optimizimit të kufizuar ku kufizimet rivendosen nga një term i funksionit të qëllimit.

Problemet e optimizimit me kufizime janë nga aplikime në të cilat gjenden kufizime

eksplicite në variabla. Këto kufizime në variabla ndryshojnë shumë nga kufijtë e

thjeshtë tek sistemet e barazisë ose të mosbarazimeve që modelojnë marrëdhënien

komplekse midis variablave.

Asnjë, një ose shumë objektiva: Problemet më të shumta të optimizimit kanë vetëm

një funksion objektiv. Gjenden mjaft raste interesante kur problemat e optimizimit

nuk kanë funksion objektiv ose funksion me shumë objektiva. Problemet e fizibilitetit

janë probleme në të cilat qëllimi është të gjejmë vlerat e variablave që kënaqin

kufizimet e një modeli që nuk kanë funksion qëllimi të veçantë për të optimizuar.

Problemet e optimizimit kombinator hasin një pengesë ku variablat në përgjithësi

marrin vlera nga kufizimet shtesë dhe bashkësitë diskrete në bazë të burimeve

themelore që janë: puna, furnizimet dhe kapitalet që kufizojnë alternativat e

2

mundshme që konsiderohen të realizueshme. Zakonisht janë shumë alternativa për t'u

marr parasysh dhe një qëllim përcakton se cila nga këto alternativa është më e mira.

Një shkallë e rëndësishme në proçesin e optimizimit është klasifikimi i modelit,

përderisa algoritmet për të zgjidhur këto probleme janë përshtatur për lloje të veçanta

të problemit.

Trajta e përgjithshme e një problemi optimizimi: Për të vendosur bazat për zgjidhjen

e një problemi të optimizimit është shumë e nevojshme që ai të formulohet në një

mënyrë të tillë të reflektimit të situatës që do modelohet, por të jetë edhe i

pranueshëm për teknikat llogaritëse. [41]

Problemi bazë: Minimizimi i funksionit të qëllimit mbi një bashkësi të

specifikuar e quajtur bashkësia e mundësive.

Koncepti i zgjidhjes: Zgjidhja e mundshme : Jepet nga çdo pikë , pavarësisht

vlerave që i jep . Për të gjetur një pikë të tillë është e vështirë numerikisht, kur

kufizimet janë të komplikuara ose numerike. Kështu me të vërtetë ekzistenca e një

zgjidhjeje të mundshme mund të mbetet shpesh herë një pyetje e hapur. Këto janë

niveli i parë i rëndësishëm i zgjidhjeve. Zgjidhja optimale : Një pikë përfaqëson

vlerën minimale të në nëse për gjithë zgjidhjet e mundshme x. Në

mënyrë specifike kjo quhet një zgjidhje optimale globale. Zgjidhja optimale lokale :

Jepet nga një pikë e tillë që për ndonjë fqinjësi U të plotësohet mosbarazimi

për . Optimaliteti në këtë rast pohohet jo relativisht tek C si

një e tërë, por relativisht në fqinjësi rreth . Praktikisht është e vështirë të ndajmë kur

një metodë numerike prodhon një zgjidhje optimale globale ose vetëm një optimale

lokale. Vlera optimale: Jepet nga kufiri i përpiktë i poshtëm i vlerave të . Mund

të gjendet ose jo një pikë ku aktualisht arrin këtë vlerë. Megjithatë edhe pse

vlera optimale është e përcaktuar saktë ajo mund të mos jetë e fundme.

Po japim një perspektivë të fokusuar kryesisht tek optimizimi me një funksion

objektiv të vetëm.

3

Figura 1.1 Klasifikimi i disiplinave të optimizimit

4

1.2 Optimizimi në rrjeta

Problemet e optimizimit në rrjeta janë probleme të interesit të veçantë. Në sajë të

modelimit të tyre në konstrukt rrjetash mund të aplikojmë algoritme të llojeve të

ndryshme për të gjetur një optimum të caktuar, pjesa më e madhe e tyre në lidhje me

distancat. Gjetja e një zgjidhje efikase si proçedurë për këtë problem, ka rezultuar

gjerësisht si një aplikimin i rëndësishëm i programimit linear në probleme të

ndryshme. Optimizimi në rrjeta është mjaft i lëvruar dhe shpesh ka avantazhe

kundrejt programimit linear. Në fakt modelet e rrjetave janë përdorur në mënyrë të

dendur në praktikë, në një spektër të madh aplikimesh. Në të vërtetë probleme të tilla

si rruga më e shkurtër, caktimet, transporti, pemët, maksimizimet e flukseve etj,

ndërtojnë klasën më të madhe të problemave të optimizimit në rrjeta. Një progres i

madh është bërë në metodologjinë e problemave në rrjeta, që në fakt i detyrohet

avancimeve në teknologji dhe algoritmikë këto 20 vitet e fundit . [2]

Flukset në rrjeta. Le të kemi një graf të orientuar me kulme dhe një

bashkësi me elemente çifte kulmesh të ndarë, që i referohemi me harqe. Numri i

kulmeve dhe harqeve varion nga Bashkësisë së flukseve të

rrjetës do t’i referohemi edhe si vektori i fluksit. Vektori që i shoqërohet një vektor

fluksi është vektori N-përmasor me këto koordinata:

Pra tregon diferencën midis fluksit total që hyn në kulmin i dhe fluksit total që del

nga kulmi i dhe i referohemi me nocionin divergjencë e kulmit i. Kulmi i quhet një

burim për vektorin e fluksit x nëse .

Nëse atëherë x quhet një cirkulacion. Çdo vektor divergjencë duhet të

plotësojë këtë barazim:

Vektori i flukseve është i kufizuar midis kufirit të sipërm dhe të poshtëm të kësaj

formë:

Problemi i fluksit me kosto minimale: Ky problem konsiston në gjetjen e flukseve

të harqeve që minimizojnë një funksion kostoje linear, subjekt i kufizimeve që

prodhojnë një vektor divergjencë së bashku me kufijtë e tyre:

(min)

(kufizime)

5

(kufizime)

ku janë skalarë çfarëdo dhe quhet koefiçient i kostos,

kufijtë e fluksit të harqeve , quhet furnizim i kulmit i.

Problemi i fluksit maksimal: Problemi shihet si një rast i veçantë i problemit të

fluksit me kosto minimale duke i caktuar kosto 0 të gjithë harqeve dhe duke futur një

hark artificial me kosto (-1). Problemi ka këtë pamje:

Figura 1.2 Fluksi në rrjeta

Maksimizimi

Kufizime

Problemi mund të shkruhet edhe në formën e minimizimit të për të njëjtat

kufizime. Po ashtu mund të vendosim kufijtë e sipërm dhe të poshtëm për .

Problemi i rrugës më të shkurtër. Problemi i gjetjes së rrugës më të shkurtër është

ndër problemet më të hershme të optimizimit. Qëllimi është të gjejmë një rrugë sa më

të shkurtër nga kulmi hyrës në atë dalës, ku gjatësia e harqeve të jetë jo negative.

Aplikimet më të shpeshta janë në makineri, në rrjeta interneti, në rrjeta urbane etj. Le

të kemi një graf , dhe një funksion që quhet funksion i gjatësive

të harqeve. Le të jetë një rrugë nga kulmi i në kulmin

j, gjatësi e rrugës P quhet shuma:

6

Le të supozojmë se një harku të grafit i bashkangjisim një kosto skalare ,

duke pasur parasysh se kostoja e një rruge të ndjekur do të jetë shuma e kostove të

harqeve të saj. Për një çift kulmesh të dhënë, problemi i rrugës më të shkurtër është që

të gjejmë një rrugë që lidh këto kulme me një kosto minimale. Analogjia këtu bëhet

midis harqeve dhe kostove të tyre, siç mund të ishte edhe për rrugët e një rrjete

transporti dhe gjatësia e tyre. Konteksti i këtij problemi transporti kalon në gjetjen e

rrugës më të shkurtër midis dy pikave gjeografike. Në rrjetat e komunikimit me

mund të shënojmë mesataren e vonesave të paketës për të kaluar linkun e

komunikimit . Në çdo rast rruga më e shkurtër është minimumi i mesatares së

vonesave, që shërben për të çuar informacionin nga origjina në destinacion. Një

shembull tjetër është shënimi me i probabilitetit që një hark i dhënë i një

rrjete komunikimi të jetë i përdorshëm në mënyrë të pavarur, atëherë produkti i

probabiliteteve të harqeve të rrugës siguron një matje të rrugës. Kështu është treguar

se për të gjetur rrugën më të shkurtër ndërmjet dy kulmeve, gjatësia e tyre është

ekuivalente me [9]

Mund të formulohet problemi i rrugës më të shkurtër nga kulmi s në t si një fluks

minimal :

Minimumi

Subjekt i

ku

Algoritmat kryesorë për të gjetur rrugën më të shkurtër janë : Algoritmi Dijkstra,

Algoritmi Bellman-Ford, Algoritmi Floyd-Warshall dhe modifikime të tyre.

Algoritmet për zgjidhjen e problemeve të ndryshme në rrjeta, të vështruar nga

pikëpamja e kriterit të efikasitetit, rezultojnë të kenë vlera relative. Ky relativitet

lidhet kryesisht me konfiguracionin e vetë rrjetës e konkretisht me aspektin strukturor

të saj si dhe veçori konkrete të vetë numrave që i shoqërohen kulmeve dhe harqeve të

rrjetës. Rezulton i rëndësishëm fakti nëse gjatësitë e harqeve janë ose jo të plota si

dhe çfarë shenje kanë. Po ashtu ka rëndësi edhe ana strukturore e rrjetës nëse rrjeta

është e ngjeshur apo e rrallë, nëse ka cirkuite negativë etj.

Problemi i caktimeve për një person. Supozojmë se kemi n persona dhe n objekte,

që duhet t’i bëjmë një përkatësi një për një. Gjendet një vlerë për të konçiduar

personin i me objektin j, ku do të caktojmë personat tek objektet për të maksimizuar

totalin e benefitit. Në fakt ka edhe një kufizim tjetër, që personit “i” të mund t’i

caktohet objekti “j”, vetëm nëqoftëse i përket një bashkësie të dhënë çiftesh nga

.

7

Matematikisht duhet të gjejmë një bashkësi çiftesh person-objekt nga saqë objektet janë të gjithë të ndarë dhe funksioni total është

maksimizimi i .

Problemi i caktimeve është një kontekst shumë praktik. Rastet më të shpeshta janë

caktimet e të punësuarve dhe profesioneve, makinerive dhe taksave etj. Po ashtu

problemi i caktimeve del si një nënproblem në metodat komplekse të optimizimit

kombinator.

Figura 1.3 Caktimet një person-një objekt

Mund t’i shoqërojmë problemit të caktimeve një bashkësi variablash

ku

Vlera e këtij caktimi është . Kufizimi i një objekti për person mund të

deklarohet si për të gjitha i-të dhe për të gjitha j-të. Më pas

mund të formulojmë problemin e caktimeve si një problem programimi linear, me

funksion maksimizimi dhe me kushte si më poshtë:

Kufizimi ku tregon se divergjenca e personit/kulmi i, duhet të jetë

1, ndërsa kufizimi tregon se divergjenca e objektit/kulmi j, duhet

të jetë (-1). Me ndryshimin e shenjës problemi kalon nga maksimum në minimum. Në

fakt kufizimi do të ishte më i fortë nëse do të ishte ose 0 ose 1. Programimi i

mësipërm linear ka vetinë se nëse ka një zgjidhje reale, atëherë zgjidhja optimale

është kur të gjitha janë ose 0 ose 1. Kjo zgjidhje optimale përfshin gjithë

optimalitetet e caktimeve.

8

Problemi i caktimeve për shumë persona. Në qoftë se marrim në konsideratë

problemin e caktimeve me përmasa , duke supozuar se kemi një caktim të

realizueshëm, bashkësia e n çifteve i caktojnë çdo personi ekzaktësisht një

objekt dhe çdo objekti ekzaktësisht një person. Për të treguar caktimin në shumë

persona, mendojmë një ndërrim midis dy personave, që do të thotë zëvendësim të

çifteve dhe nga caktimi me çiftet dhe . Caktimi i

rezultuar do të jetë prapë i realizueshëm në qoftë se dhe vetëm në qoftë se :

Vërejmë se ky problem këmbimi ndërmjet dy personave, mund të identifikohet me

një cikël me katër harqe , dhe Ky cikël është diferenca

midis caktimeve para dhe caktimeve pas këmbimit, ndërsa mosbarazimi është një

cikël i vërtetë. Për fat të keq është e pamundur të përmirësosh caktimin për këmbimin

e këtyre dy personave, edhe nëse caktimi nuk është optimal. Një përmirësim mund të

bëhet në këmbime me k-persona, për , ku bashkësia e çifteve nga caktimi korrent zëvendësohet nga çiftet .

Një këmbim me k-persona i korrespondon një cikli të thjeshtë me k-harqe hyrës (në

korrespondencë me caktimet e reja të çifteve) dhe k-harqe dalës (në korrespondencë

me çiftet korrente të caktimeve pasi janë zëvendësuar). Problemi i këmbimit në k-

persona përmirëson caktimin nëqoftëse dhe vetëm nëqoftëse ,

është ekuivalent me ciklin korrespondues me vlera pozitive. Figura 3 tregon një

realizim caktimi jo optimal, që nuk mund të përafrohet me këmbimet ndërmjet dy

personave. Vlerat për çdo çift janë shënuar në harqe. Vlera e caktimeve janë të pandryshuara majtas, sipas këmbimeve midis dy

personave. Përmes këmbimeve ndërmjet tre personave kemi një caktim optimal që ka vlerën 6.

Figura 1.4 Këmbimet midis tre personave

9

Në figurën 1.4, ilustrohet shembulli i mësipërm, ku harqet dalës nga cikli janë që i korrespondojnë çifteve të caktimeve korrente. Këto këmbime

në tre persona janë vlerat e përmirësuara, sepse shuma e vlerave të harqeve pas

zëvendësimit është (2+2+2)=6, më e madhe sesa vlera e harqeve të caktimeve para

këmbimit (1+1+1)=3.

Problemi i matricave të balancuara. Këtu problemi kalon në gjetjen e një matrice

me përmasa , ku jepen shumat e kolonave dhe të rreshtave, që përafrojnë një

matricë M me përmasa në mënyra sa më optimale. Kështu, mund të formulojmë

një problem në termat e grafit me m hyrje dhe n dalje. Bashkësia e harqeve

përfaqëson çiftet për të cilët hyrja korresponduese nga matrica , duhet të

jetë jozero. [6]

Për shumat e dhëna të rreshtave dhe të kolonave, shprehim këto relacione:

Po ashtu mund të vendosim edhe kufizime për hyrjet nga X. Funksioni i kostos që

duhet optimizuar ka formën:

Ky funksion shpreh objektivin e përafrimit të hyrjeve të X në mënyrë korresponduese

me hyrjet e matricës M. Një shembull mjaft i përdorur është funksioni kuadratik, ku

janë skalarët e dhënë pozitivë.

Një shembull tjetër për funksionin kosto është logaritmi:

nga ku del se për çdo . Vërehet se ky funksion nuk është i

përcaktuar për , pra në lidhje me problemin tonë, duhet të vëmë një kufi

intervalor për , ku është një skalar çfarëdo

pozitiv.

Problemi i transportit. Problemi i transportit është i njëjtë me problemin e

caktimeve, përveç se vlerat nuk janë vetëm 1 ose (-1) dhe numri i hyrjeve dhe daljeve

nuk është i thënë të jetë i barabartë. Problemi ka formën:

10

ku dhe janë skalar pozitivë, që për fizibilitet duhet të plotësojë barazimin

Si një shembull praktik të problemit të transportit, mund të supozojmë se kemi një

terminal me m komunikime, secila e lidhur me një nga n përqëndruesit e trafikut.

Vendosim variablat të cilët marrin vlerën 1 nëse terminali i është i lidhur me

përqëndruesin j. Duke supozuar se përqëndruesi j mund të lidhet me jo më shumë se

terminale, marrim kufizimin :

Po ashtu secili terminal duhet të lidhet ekzaktësisht me një përqëndrues, kemi

kufizimin

Në qoftë se supozojmë se ka një kosto për të lidhur terminalin i me përqëndruesin

j , problemi kalon në gjetjen e kostos minimale, që është të minimizojmë shumën

në lidhje me kufizimet paraardhëse. Ky problem nuk është akoma një problem

transporti për dy arsye të forta:

a) Harqet duhet të jenë patjetër 0 ose 1.

b) Kufizimet , nuk janë kufizime barazimi.

Del se mund të injorojmë kufizimet për me vlera 0,1. Siç u pa në problemin e

rrugës më të shkurtër dhe problemi i caktimeve, edhe nëse e zbutim këtë kufizim dhe

ta zëvendësojmë atë me , gjendet një zgjidhje optimale e tillë që është

0 ose 1. Për të konvertuar mosbarazimin në barazim tek kufizimet mund të futim një

total prej terminale fiktivë që mund të lidhen me kosto 0 me të gjithë

përqëndruesit e trafikut. Po ashtu futet edhe një kulm 0 fiktiv së bashku me kufizimet

dhe ndryshojmë kufizimet mosbarazim tek

.

11

Problemi i transformuar ka strukturën e problemit të transportit dhe është ekuivalent

me problemin origjinal.

Problemi i tregtarit shëtitës: Problemi i referohet një tregtari që donte të gjente

minimumin e kostos për një udhëtim në të cilin ai mund të vizitojë secilin nga N

qytetet e dhëna vetëm një herë dhe të kthehet në fund aty ku filloi udhëtimin. Për ta

paraqitur si një problem në rrjeta, i shoqërojmë çdo qyteti një kulm dhe

futim një hark me kosto . Një udhëtim i tillë është i ngjashëm me një cikël

Hamiltonian, që është përkufizuar si një cikël i thjeshtë që përmban të gjitha kulmet e

grafit. Pra udhëtimi është një nëngraf i lidhur me N harqe që ka ekzaktësisht një hark

hyrës dhe një dalës për secilin kulm. Problemi është të gjejmë udhëtimin me shumë

minimale të kostove të harqeve. Shënojmë me fluksin e harqeve duke kërkuar

që fluksi të jetë 1 ose 0, pasi tregon që harku është ose jo pjesë e udhëtimit. Kostoja e

një udhëtimi U është:

Kufizimet ku secili kulm ka vetëm një hark hyrës dhe vetëm një hark dalës në

udhëtim jepet si më poshtë:

Nëse kufizimet nuk vendosen kështu atëherë ky do të ishte një problem caktimi i

zakonshëm.

1.3 Problemet e klasifikimit.

Problemet e klasifikimit janë parë gjithmonë si probleme optimizimi, ku qëlllimi

është të gjejmë modelin më të mirë për të parashikuar të dhënat. Këto probleme janë

ndër problemet më të studiuara për të dhëna të shumta. Në themel problemet e

klasifikimit përfshijnë realizimin e një marrëdhënieje parashikuese midis vlerave që

kemi dhe vlerave të dëshiruara. Për një bashkësi të dhënë shembujsh, qëllimi i një

algoritmi klasifikimi për të krijuar një model është të paraqes marrëdhënien midis

vlerës së atributit parashikues dhe klasës së vlerave. Po ashtu algoritmi duhet të

klasifikojë edhe shembujt e rinj në klasa në bazë të vlerave të parashikuara nga

atributi. Qëllimi kryesor i një algoritmi të klasifikimit është ndërtimi i një modeli që

maksimizon saktësinë parashikuese, numrin e parashikimeve të sakta. Po ashtu në

shumë aplikime të rëndësishme kuptueshmëria e modelit luan një rol të rëndësishëm.

Për shembull në diagnozat mjekësore modeli i klasifikimit duhet vlerësuar dhe

interpretuar nga mjekët, në kreditime të ndryshme modeli duhet intrepretuar nga

12

eksperti etj. Pra në fusha të tilla është vendimtare prodhimi i modeleve klasifikuese

kuptim-plota. Një problem klasifikimi ka këtë pamje të përgjithshme: Le të jetë

një bashkësi atributesh ku C përmban klasat e atributeve me vlera

diskrete. Shënojmë vlerat e C-së me dhe S një hapësirë

atributesh e lidhur me R. Problemi i klasifikimit është të gjejmë një pasqyrim

të tillë që për të gjithë të dhënat

. Në praktikë rrallë gjendet funksioni f që përcakton

korrektësisht për të gjitha të dhënat korrente dhe të ardhshme. Veçanërisht në fushat e

edukimit bashkësia e të dhënave përmban të dhëna jo konsistente dhe për të

cilat por . [15]

Mund të mendojmë një zgjidhje tjetër për të gjithë të dhënat , duke u caktuar

një shpërndarje probabilitare për gjithë klasat dhe pastaj të zgjedhim

klasën më të mirë të mundshme. Këto lloje klasifikuesish quhen klasifikues

probabilitar. Le të jenë R,C dhe S bashkësi atributesh si më lart dhe M një

klasifikues.

Nëse M përcakton një pasqyrim i tillë që

për , themi se M përfaqëson klasifikim diskriminant.

Nëse M përcakton një pasqyrim i tillë që

për , themi se M

përfaqëson klasifikim probabilitar.

1.5 Pemët e klasifikimit

Një model klasifikimi i përdorur gjerësisht janë edhe pemët klasifikuese, të cilat

përfaqësojnë një formë klasifikuese lehtësisht të paraqitshme grafikisht, me anë të

rregullave të klasifikimit. [40]

Figura 1.5 Pemët klasifikuese

Breiman et.al në 1984 dha një numër të shumtë shembujsh të përdorimit të pemëve të

klasifikimit. Ndër to më i përdoruri ishte rasti kur një pacient pësonte goditje në

zemër, që varej nga impulsi, presioni i gjakut etj. Një varietet informacioni tjetër

merret për moshën e pacientit dhe historinë medicinale. Do të ishte me dobi trajtimi i

pacientëve me goditje në zemër, në bazë të matjeve të marra në spital, për të

13

identifikuar riskun e lartë të sëmundjes tek pacientët që nuk jetojnë pas 30 ditësh nga

goditja e zemrës.

Një pemë klasifikimi që Breiman zhvilloi për këtë problem ishte një pemë vendimi

me tre pyetje. Ajo ishte një pemë klasifikimi binare që përshkruhet si më poshtë:

“ Nëse tensioni minimal sistolik është më i madh se 91 në periudhën fillestare prej 24

orësh, pastaj nëse mosha e pacientit është mbi 62.5 vjeç, pastaj nëse pacienti ka sinus

takikardi, atëherë dhe vetëm atëherë pacienti parashikohet që të mos mbijetojë për 30

ditët e ardhshme”. Tani është e lehtë të sjellim në mend imazhin e një “peme” me të

dhëna të tilla. Një hierarki e tërë pyetjesh janë bërë që vendimi final i marr të varet

nga përgjigjet e të gjitha pyetjeve paraardhëse.

Në mënyrë të ngjashme lidhja midis gjethes dhe pemës në të cilën ajo rritet mund të

përshkruhet me anë të hierarkisë së ndarjes së degëve, duke nisur nga trungu deri tek

dega në të cilën qëndron gjethja. Natyra hierarkike e pemëve të klasifikimit është një

nga tiparet e tyre më themelore, që del më në pah tek pemët e vendimit ku sistemi

fillon nga rrënja e vendimit deri tek gjethet e saj.

Algoritmet e kërkimit të pemës minimale.

Problemi i pemës minimale është një problem klasik, në lidhje me një graf të peshuar

me n kulme dhe m brinjë, ku brinjët kanë pesha , të gjejmë

pemën minimale në graf, me peshë totale të brinjëve minimale. [22]

Dy janë rregullat kryesore për ndërtimin e algoritmeve në pemët minimale: Rregulli i

prerjes (i njohur si rregulli blu i Tarjanit) dhe Rregulli i ciklit (i njohur si rregulli i

kuq). Rregulli i prerjes qëndron pasi për çdo prerje të grafit (ku prerje quhet një

ndarje e kulmeve në dy grupe), brinja me peshë minimale që kalon prerjen duhet të

jetë në pemën minimale. Ky rregull na ndihmon të gjejmë se çfarë të shtojmë në

pemën minimale. Ndërsa rregulli i ciklit qëndron në rastin kur kemi një cikël, brinja

me peshë më të madhe në të duhet hequr, pra kjo brinjë të mos jetë në pemën

minimale. [12]

Shënojmë me C një prerje në grafin G, që ndodh ndërmjet kulmeve s dhe t . Kjo

bashkësi përmban brinjët e tilla, që çdo rrugë ndërmjet s dhe t kalon në të paktën një

brinjë nga C. Kapaciteti i prerjeve C është shuma e të gjitha peshave të këtyre

brinjëve. Le të jetë s-t një prerje nga C= (S,T) një ndarje e V-së e tillë që dhe

. Bashkësia e prerjeve C është: dhe kapaciteti i

prerjeve do të jetë:

ku

Pra duhen përcaktuar bashkësitë S dhe T në mënyrë të tillë që kapaciteti të jetë

minimal. Si problem klasik, është parë shumë herë, por po japim një histori të

shkurtër të optimizimit në lidhje me peshat e brinjëve:

Algoritmi i Boruvkës ishte një nga algoritmat e parë të pemëve minimale që

nga 1926. Jarnik dha algoritmin e tij në 1930, më pas Kruskal e përmirësoi në

14

1956, Prim dha një version të tij në 1957, i pasuar nga Dijkstra në 1959. Të

gjithë këto mund të implementohen rregullisht në kohën Algoritmi i Yaos në 1975 arriti një kohë . Në 1984, Fredman dhe Tarjan dhanë një algoritëm me kohë . Kjo

u përmirësua nga Gabow, Galil, Spencer dhe Tarjan në 1986 për të marr

kohën . Karger,Klein dhe Tarjan arritën tek koha , por ky ishte një algoritëm i

rastësishëm, kështu që kërkimet vazhduan.

Në 1997 Chazelle dha një algoritëm deterministik në kohë , ku

është funksioni i anasjelltë Ackermann

Në 1998 Pettie dhe Ramachandran dhanë një algoritëm optimal, por dinin

kohën e tij.

Për të aplikuar algoritmin e Kruskalit së pari na duhet të renditim peshat e brinjëve

, kjo do një kohë me . Më pas veprojmë me

brinjët, duke shtuar një brinjë në qoftë se dhe vetëm në qoftë se ajo lidh dy kulme që

nuk janë të dyja njëkohësisht në të njëjtën komponente.

Figura 1.6 Algoritmi Kruskal

Në figurën 1.6 jepet një shembull se si mund të shtojmë brinjët 1,2,10,3,4,5. Shohim

se 10-ta mund të shtohet ndërsa 5-a jo. Gjendet një implementim që na lejon të bëjmë

m operacione në kohë të amortizuar, ku është funksioni i anasjelltë

Ackermann, funksion me rritje të vogël. Termi dominohet nga që merret nga renditja për të gjithë kohën e veprimeve.

Supozojmë se P është një graf i lidhur dhe me peshat, Y një nëngraf i tij që

prodhohet nga algoritmi Kruskal. Nëngrafi Y nuk mund të ketë një cikël, gjersa brinja

e fundit e shtuar në atë cikël do të kishte qenë brenda në një nënpemë dhe jo ndërmjet

dy pemëve të ndryshme. Y nuk mund të jetë i palidhur, përderisa brinja e parë e

panumëruar, që bashkon dy komponentet e Y ka qenë shtuar nga algoritmi.

Pra Y është një pemë e pjesshme e P.

Le të jetë Y1 një pemë minimale e pjesshme për P që ka numrin më të madh të

brinjëve të përbashkëta me Y. Nëse Y1=Y, atëherë Y është pema minimale e

pjesshme, në të kundërt le të jetë e brinja e parë e konsideruar nga algoritmi që

ndodhet në Y dhe jo në Y1. Le të jenë C1 dhe C2 komponente nga F ( një bashkësi

pemësh) ku e shtrihet midis hapave, ku e merret në konsideratë. Meqë Y1 është një

pemë, Y1+e përmban një cikël, ku gjenden brinjë të ndryshme f të atij cikli që

shtrihen midis C1 dhe C2. Por Y2= Y1+e-f është po ashtu një pemë e pjesshme. Derisa

e të merret para f në këtë algoritëm, pesha e e-së është pothuajse e barabartë me

peshën e f-së dhe Y1 është një pemë e pjesshme atëherë peshat e këtyre brinjëve duhet

15

të jenë të barabarta. Kështu Y2 është një pemë minimale e pjesshme që ka më shumë

brinjë të përbashkëta me Y sesa me Y1, që kundërshton supozimin tonë në lidhje me

Y1. Kjo tregon se Y do të jetë pema minimale e pjesshme.

Për algoritmin e Prim-it, marrim së pari një kulm rrënjë arbitrar r për të filluar

pemën minimale. Në çdo iteracion marrim brinjën me më pak peshë të lidhur në

pemën tonë korrente T me disa kulme që nuk janë në T, për ta shtuar këtë brinjë në T,

në vazhdim rritet numri në T një nga një. Shohim figurën 1.7 për këtë rast.

Figura 1.7 Algoritmi Prim

Do të përdorim një radhë prioritare në strukturën e të dhënave e cila gjurmon brinjët

me pesha të mëdha në T, deri tek brinjët që nuk janë në T. Secili kulm vendoset në

bashkësinë , pastaj në radhën prioritare. Vazhdon kështu algoritmi.

Le të jetë P një graf i lidhur dhe me pesha të përcaktuara. Në çdo iteracion të

algoritmit Prim, duhet gjetur një brinjë që lidh një kulm të nëngrafit me një kulm

jashtë tij. Kur P është i lidhur, gjendet gjithmonë një rrugë nëpër çdo kulm. Ajo çfarë

gjen algoritmi i Primit është një pemë Y, sepse brinjët dhe kulmet e shtuara tek Y ,

janë të lidhur me kulme dhe brinjë të tjera të Y, ku nuk gjendet një iteracion që

formon një cikël pasi çdo brinjë e shtuar lidh dy kulme në dy bashkësi të ndara. Po

ashtu Y përfshin të gjithë kulmet nga P pasi Y është një pemë me n-kulme, njësoj sa

P. Le të kemi Y1 një pemë minimale të pjesshme për P. Nëse Y=Y1 atëherë vërtetimi

është i kompletuar. Nëse jo gjendet një brinjë në Y që nuk është në Y1. Le të jetë e

brinja e parë që u shtua kur Y u ndërtua. Kemi V bashkësinë e kulmeve të Y-e. Pra

një kulm i e-së është në Y, kulmi tjetër jo. Përderisa Y1 është një pemë minimale e

pjesshme e P, gjendet një rrugë që bashkon dy kulme nga e-ja. Nëse ecim gjatë rrugës

gjejmë një brinjë f që bashkon një kulm në V me një kulm jo në V. Tek iteracioni kur

e-ja u shtua në Y , f mund të ishte shtuar po ashtu , ndoshta në vend të e-së, nëse

pesha e saj do të ishte më pak se e e-së. Gjersa f nuk është shtuar atëherë del se

Quajmë Y2 pemën që përftohet nga heqja e f-së dhe shtimi i e-së nga

Y1. Del se Y2 është një pemë që ka më shumë të përbashkëta me Y sesa Y1. Nëse

Y2=Y atëherë vërtetimi është i kompletuar. Nëse jo mund të gjejmë një pemë Y3, me

një brinjë më shumë të përbashkët me Y sesa me Y2. Duke vazhduar kështu del një

pemë me më shumë të përbashkëta me Y. Përderisa brinjët e Y janë një numër i

16

fundëm atëherë eventualisht gjendet një pemë Yh që është identike me Y. Kjo tregon

se Y është pema minimale e pjesshme.

Algoritmi Boruvka ndryshe nga Kruskal dhe Prim, shton shumë brinjë në paralel

dhe mund të implementohet pa ndonjë strukturë triviale. Thjesht hiqet brinja me

peshë më të madhe, ku nëse peshat e brinjëve janë të dallueshme qartë, kjo garanton

një pyll të tërë. Për secilën pemë në këtë pyll ,shohim në mënyrë rekursive grafin, në

gjurmët e secilës brinjë që kemi zgjedhur në çdo hap. Kjo gjë kërkon kohë dhe

gjatë kësaj kohe garantohet një tkurrje e të paktën gjysmës së kulmeve, që për këtë

koha totale është . Në figurën 1.8, brinjët me të kuqe do të zgjidhen në të

njëjtin hap, duke lënë grafin që duket në të djathtë dhe ku ngjyrat caktojnë

komponentët.

Figura 1.8 Algoritmi Boruvka

1.5 Pemët e vendimit dhe analiza e tyre.

Pemët e vendimit janë një mjet popullor dhe i fuqishëm për klasifikim dhe

parashikim. Kjo tërheqje e madhe për pemët e vendimit është e lidhur me faktin që

ndryshe nga rrjetat neurale, pemët e vendimit përfaqësojnë rregulla. Këto rregulla

mund të shprehen thjesht, që njerëzit t’i kuptojnë ato ose t’i përdorin në bazë të

dhënash, apo gjuhën e programimit SQL, që lidh të dhënat në një sistem bazë

menaxhimi.

Në mjaft aplikime saktësia e klasifikimit ose parashikimit është problemi kryesor. Në

këto situata nuk na duhet si dhe pse punon modeli, në situata të tjera mundësia për të

shpjeguar arsyen e një vendimi është vendimtare. [5]

Ka mjaft zbatime në fusha të ndryshme, sidomos në marketing për të pasur sukses në

produktet e reja. Le të shohim një shembull të thjeshtë ku kërkohet një vendim për të

hapur një dyqan të ri.

Shembull 1. Një person dëshiron të vendosë për të hapur një dyqan karamelesh apo

një tendë me pije të shtrydhura. Nëse hap dyqanin ai ka mundësi të fitojë 100$, nëse

hap tendën ai mund të fitojë 90$. Deri këtu mendon për versionin e parë. Më pas nga

zgjedhja e parë ka mundësi 50% të jetë me sukses dhe 50% për të falimentuar. Nëse

ka sukses fiton 100$, nëse humb ka (-30%). Për zgjedhjen e dytë ka 50% mundësi të

jetë me sukses dhe 50% për të humbur, por nga suksesi fiton 90$, ndërsa nga humbja

-10$. Cilën të zgjedh ai?

17

Figura 1.9 Shembull Vendim-marrje

Një vlerë mesatare për rastin e dyqanit të karameleve do të ishte :

Një vlerë mesatare për rastin e tendës është:

Në këtë rast vendim-marrësi zgjedh alternativën që mendon se është më e mirë. Këto

vlera janë jo gjithmonë njësoj, pasi varen në mënyrë probabilitare.

Një pemë vendimi është një klasifikuese në formën e një strukture pemë, ku çdo kulm

është:

Një kulm gjethe- tregon vlerën e atributit të etiketuar në një klasë.

Një kulm vendimi – specifikon disa teste të kryera në një kulm të vetëm

atributi, me një degë dhe një nën-pemë për çdo rezultat të mundshëm të testit.

Pema e vendimit përdoret për të klasifikuar një shembull duke filluar nga rrënja e

pemës dhe duke lëvizur nëpër të deri tek një kulm-gjethe, që siguron klasifikimin e

momentit. Disa karakteristika për pemët e vendimit janë:

Përshkrimi i vlerave të atributeve: Një objekt ose një rast mund të shprehet në

terma të një koleksioni të fiksuar vetish ose atributesh. Kjo do të thotë se kemi

nevojë për të bërë diskret atributet e vazhdueshëm, ose të parashikohet në

algoritme.

Atribute të klasave të etiketuara: Kategoritë në të cilat shembujt duhet të

caktohen duhet të jenë ndërtuar më përpara.

Klasa diskret: Një rast i përket ose jo një klase të veçantë, duhet të jenë më

shumë raste se klasa.

Të dhëna të mjaftueshme: Zakonisht 100 ose 1000 raste të testuara.

18

Kriter vlerësimi në algoritmet e pemëve të vendimit është përzgjedhja e atributit për

t’u testuar në secilin kulm vendimi të pemës. Qëllimi është të përzgjedhësh atributin

që është më i përdorshëm për të klasifikuar shembujt. Një masë sasiore për një atribut

është një veti statistike e quajtur IG Përftim Informacioni, që mat sa “mirë” një

atribut i dhënë ndan shembujt në klasat e tyre të etiketuara. Kjo masë përdoret për të

përzgjedhur atributet në çdo hap pasardhës, derisa pema të rritet. Algoritmi kryesor që

përdor këtë veti është ID3, si algoritëm i ndërtimit të pemëve të vendimit. Ka edhe

përmirësime të tij, që mund t’i shohim më së miri në kapitullin e dytë.

Një problem i rëndësishëm është marrja e një vendimi të vetëm në një pikë të caktuar.

Supozojmë se njohim problemin e marrjes së një vargu vendimesh përgjatë një

periudhe të caktuar. Secili nga këto vendime mund të varet në vendimet para tyre që

mund të çojnë në një bashkësi alternativash probabilitare. Duam të specifikojmë një

vendim-marrje optimale që do të mbulojë të gjitha kontigjentet. Një paraqitje grafike

e orientuar drejt zgjidhjeve të problemave të vendimit me shumë shkallë quhet analiza

e pemës së vendimit. Këtë mund ta ilustrojmë më mirë me anë të një shembulli.

Shembull 2. Kompania e prodhimit Fadko është përfshirë në prodhimin e një

produkti të ri rajonal. Ky produkt ka një natyrë të tillë që tenton të jetë sa i

suksesshëm aq i pa suksesshëm. Nëse produkti është i suksesshëm priten fitime bruto

100.000$, nëse është i pa suksesshëm vetëm 20.000$. Fadko duhet të marr një

vendim të menjëhershëm të zgjedh një nga tre mundësitë :

1. Të testojë tregun e produktit me kosto 10.000$.

2. Menjëherë të tregtojë produktin rajonal me një kosto 50.000$.

3. Të bjerë produkti.

Nëse produkti testohet në treg rezultatet do të klasifikohen si të favorshme ose jo të

favorshme dhe atëherë duhet marr vendimi kur të tregtojnë produktin rajonal ose kur

të mos e bëjnë më këtë. Nëse rezultatet e testit të tregtimit janë të favorshme

vlerësimet e manaxhimit tregojnë se probabiliteti i suksesit në tregun rajonal është

0.80, nëse është jo i favorshëm probabiliteti i suksesit është vetëm 0.30. Nga

eksperiencat e kaluara Fadko ka pasur shanse 50-50 për favorizim të rezultateve të

testimit të tregut. Pa pasur rezultatet e testimit të tregut probabiliteti i një marketingu

të suksesshëm të produktit rajonal besohet se është më pak se 0.5 , ndërsa manaxhimi

ka vendosur një probabilitet 0.45. Çfarë kursi veprimi duhet të ketë për qëllim Fadko?

Përderisa ky lloj problemi përfshin një varg vendimesh atëherë do të strukturojmë

zgjidhjet e problemit tonë. Na duhet një paraqitje grafike , e quajtur pemë e vendimit

për të gjetur lidhjen ndërmjet ngjarjeve, probabiliteteve, përftimeve dhe humbjeve.

Objektivi ynë në këtë problem është përcaktimi i vargjeve të vendimeve që do të

maksimizojnë përfitimin e pritur. Në përcaktimin e ngjarjeve dhe veprimeve do të

diferencojmë në varësi të pikave të ndryshme në kohë.

19

Pra kemi gjashtë ngjarje të ndryshme që do t’i shënojmë me :

rezultat i favorshëm i testimit në treg,

rezultat jo i favorshëm i testimit në treg,

sukses i menjëhershëm i tregtimit rajonal,

jo sukses i menjëhershëm i tregtimit rajonal,

sukses i tregtimit rajonal pas testit,

pa sukses tregtimi rajonal pas testit.

Pesë veprimet e marra në konsideratë janë:

testimi i tregut,

tregtim rajonal i menjëhershëm,

produkti të mos hidhet menjëherë,

të tregtohet në rajon pas testit të tregut,

të mos tregtohet pas testit të tregut.

Veprimet përfaqësojnë fazën e parë të vendimit, pikën më të hershme në

kohë, ndërsa veprimet që vijnë pasi të testohet tregu përfaqësojnë hapin e

dytë të vendimit në këtë problem. Për të krijuar disa ide se si do të jetë pema e

vendimit do të ndërtojmë një tabelë si më poshtë: për secilin hap vendimi do të kemi

dy kolona të quajtura e para “Veprime” dhe e dyta “Ngjarje”. Në kolonën e parë

shënojmë “Veprime” dhe lëmë pak hapësirë pastaj shënojmë “Ngjarjet”. Tek e dyta

ngjarjet e mundëshme i shoqërojmë me veprimet e kolonës së parë. I lidhim me anë të

drejtëzave këto ngjarje dhe veprime. Në kolonën e tretë vijnë veprimet dhe në

kolonën e katërt ngjarjet .

Veprime Ngjarje Veprime Ngjarje

A1 E1 A4 E5

A5 E6

E2 A4 E5

A2 E3 A5 E6

E4

A3

Tabela 1.1. Tabela e veprimeve dhe ngjarjeve

Tani mund të ndërtojmë pemën e vendimit : secila bashkësi veprimesh për një hap të

dhënë janë shënuar me numra brenda në katrorë, ndërsa ngjarjet me rrathë.

20

E5 40

A4

E6 -40

-10

A5

E1 40

E5

-40

A4 E6

E2

A1

-10

A5

A2 50

E3

A3 -30

E4

0

Figura 1.10 Pema veprime-ngjarje

Pasi është vizatuar pema bazë, shtohen vlerat e kërkuara numerike. Përftimet

vendosen në degët e ngjarjeve, kostot në degët e veprimeve. Përftimet neto në

kolonën në të djathtë janë marr nga shumimi i vlerave monetare nëpër degë. Pra kosto

e tregtimit është 10.000$, kosto e tregtimit rajoanl është 50.000$, suksesi i produktit

ka një fitim 100.000$ me një rezultat përftimi neto 40.000$. Po ashtu llogariten vlerat

e tjera.

Vlera neto e pritshme për degën 1-2-A4 është (0.8).(0.40)+(0.2).(-40)=24$, si një

vlerë e pritshme optimale në atë pikë. Ndërsa 1-3-A4 ka një përftim neto të pritshëm

(0.3)(0.40)+(0.7)(-40)=-16 (-16.000$)

A4 24

E1 A5 -10

A4 -16

A1 E2 A5 -10

A2 E3 50 2

A3 E4

-30

0

Figura 1.11 Vlerat e pritshme të veprimeve në hapin e dytë

1

2

3

1

2

3

21

Si alternativë më e mirë mbetet të hidhet produkti tek alternativa A5 me -10.000$. Po

ta rishohim proçesin me vlerat e pritshme për veprimet A1, A2, A3 duke nisur nga

rrënja kemi:

7 (0.5)(24)+(0.5)(-10)=7

A1 A2 6 (0.45)(50)+(0.55)(-30)=6

A3 0

Figura 1.12 Vlerat e pritshme të veprimeve tek hapi i parë

Në këte pikë problemi quhet i zgjidhur. Fadko duhet ta testojë tregun me një vlerë të

pritshme prej 7000$. Tani duhet të specifikojmë të gjithë vendimet optimale duke

gjetur alternativat e preferuara pas testimit të tregut. Pra më së miri duhet të zgjedhim

veprimin A1, pastaj nëse ndodh E1 do të zgjedhim veprimin A4 , nëse ndodh E2

atëherë do të zgjedhim A5.

Kthehemi pas dhe mendojmë: Çfarë do të ishte me vlerë për të pasur informacion

perfekt për këtë problem? Informacionin e duhur për suksesin ( ngjarja E3) ose të

falimentit (ngjarja E4) do të ishin me vlerë të madhe. Nëse Fadko do ta dinte atë do të

zgjidhte menjëherë A2 dhe E3, po ashtu edhe për falimentin. Duke mos pasur kontroll

mbi probabilitetet e suksesit dhe të mos suksesit të tregut, vlera e pritshme e fitimit

për vendimmarrjen shënohet . Nga rezultatet e llogaritura vlera e pritshme për

fitimin mund të përkufizohet si:

ku EPPI është vlera e pritshme e fitimit me informacion perfekt, EMW vlera e

pritshme monetare.

Ngjarje P(Ei) Veprimi optimal Përftimi Përftimi i peshuar

E3 0.45 A2 50 22.5

E4 0.55 A3 0 0

Fadko duhet të ofroj për të paguar më shumë se 15.500$ nëse kompania merr

informacion perfekt atëherë tregtimi do të jetë i suksesshëm.

Në këtë shembull vendimet duhen vlerësuar në dy pika, pra kemi dy stade vendimi.

Në pikën 1 të pemës është stadi i parë, ndërsa në pikat 2 dhe 3 të pemës stadi i dytë.

Siç shihet një paraqitje grafike kalon më shumë se 3 stade dhe më pas për të

klasifikuar kërkon llogaritje kompjuterike. Së fundmi japim një proçedurë gjenerale

për të zgjidhur problemet manualisht duke përfshirë vendimet sekuenciale.

1. Përcaktohen veprimet dhe ngjarjet, numri i stadeve.

2. Përpilohet një tabelë për të paraqitur veprimet dhe ngjarjet, hap pas hapi në

stade të caktuara.

1

22

3. Bëjmë një paraqitje sesi mund të duket pema së bashku me degët e saj. Lëmë

hapësirë për shpjegime.

4. Etiketojmë ngjarjet dhe veprimet së bashku me probabilitetet e tyre.

5. Kërkojmë çdo degë nga e majta në të djathtë duke llogaritur shumën e vlerave

të pritura në secilën.

6. Nga e djathta në të majtë përcaktojmë vlerën optimale për secilin kulm në të.

7. Kur të arrijmë tek kulmi 1 me vlerën optimale të përcaktuar gjurmojmë

sekuencën optimale nëpër degë.

1.6 Pemët binare.

Lloji i parë i atributeve të përdoruar në analizën e të dhënave janë atributet binarë, të

cilat mund të marrin vetëm dy vlera. Zbatimet më të ndeshura janë kodimet e

ndryshme që mund të bëhen në modele matematike. [3]

Çdo lloj atributi cilësor ose numerik ekuivalentohet me numrat 0 dhe1. Në qoftë se

atributet janë kategorike, të njohur si atribute diskret, atëherë vlera e atributit do të

jetë një nga numrat binarë. Gjendet një nënklasë e atributeve kategorikë që është

klasa e atributeve ordinal ( të renditur). Vlerat e këtyre atributeve merren nga një listë

e limituar vlerash të renditura, ku mund të krahasohen dy vlera dhe mund të themi

çfarë është më shumë dhe çfarë është më pak. Zakonisht kulmet pasardhëse të një

kulmi janë quajtur fëmijë, ndërsa kulmi paraardhës i tij është quajtur prind. Le të

shohim disa lloje pemësh binare.

Një pemë binare quhet grafi ( , )T V E që ka vetitë e mëposhtme :

1. 1E V .

2. Për çdo çift kulmesh 1 2,v v V , gjendet një shteg nga 1v tek 2v .

3. Fëmijë v V janë ata u V të cilët janë incident me v dhe thellësia e tyre

është 1 më larg sesa v .

4. Çdo v V ka zero ose dy fëmijë.

Figura 1.13 Paraqitja e një peme binare

Pema binare e përgjithshme është një pemë që ka një rrënjë nga ku çdo kulm ka të

shumtën dy fëmijë.

23

Pema binare e plotë, zakonisht e quajtur pemë-2 (pemë dyshe), është pema në të cilën

çdo kulm , përveç gjetheve, ka dy fëmijë.

Një pemë perfekte binare është një pemë e plotë në të cilën të gjitha gjethet janë në të

njëjtën thellësi ose në të njëjtin nivel.

Një pemë binare e pafundme është një pemë me disa nivele, kur për çdo nivel d të

zgjedhur numri i kulmeve ekzistuese është 2d, në fakt paraqet më së miri strukturën e

bashkësive të Kantorit. Intervali i pemës është imazhi i vazhdueshëm i bashkësive të

Kantorit, shpesh quhet edhe hapësira e Kantorit.

Një pemë binare e balancuar quhet kur thellësia e të gjitha gjetheve të ndryshme

ndryshon me të paktën një lidhje. Këto janë pemë të parashikueshme për thellësinë e

tyre pasi është sa , ku n tregon numrin e kulmeve të pemës së balancuar.

Pema e plotë binare në rrënjë identifikohet me një magmë të lirë.

Një pemë gjeneratë është pema ku për çdo kulm prind, gjendet vetëm një kulm tjetër

fëmijë.

Kodet binarë

Për materialet në përgjithësi ekzistojnë dy lloje gjendjesh ose më tepër. Kur kalohet

nga njëra gjendje në tjetrën mund të modelojmë me variablat 0 dhe 1.

Të gjitha shkronjat kanë dy paraqitje të mëdha dhe të vogla, po ashtu si shumë

simbole në matematikë që kanë vlerë të madhe dhe të vogël. Shumica e tyre janë të

koduara në informatikë në kodin ASCII.

Si të ndërtojmë prefikset me anë të kodeve?

Pemët binare përdoren për të ndërtuar prefikset nga një bashkësi e caktuar me

simbole. Ndërtojmë një pemë binare arbitrare gjethet e së cilës lidhen në mënyrë

bijektive me këto simbole. Pra në fund çdo gjethe ka një simbol të ndryshëm. Gjithë

degët që dalin nga ana e majtë i shënojmë me zero, kurse ato që dalin nga ana e

djathtë me njësh. Kështu që çdo simbol i korrespondon fjalës kod të formuar nga

degët të kaluara nga rrënja në gjethe. Supozojmë se kemi në dispozicion këto shtatë

gërma . Për të ndërtuar pemën binare që përfaqëson kodet prefiks

kemi:

Tabela 1.2 Tabela Gërmë-Kod

Gërma a B c D e f g

Kodi prefiks 000 0010 0011 0101 011 100 101

24

Figura 1.14 Pema binare prefiks-kod.

Pema Kuq e Zi

Pema Kuq e Zi është një lloj peme binare e vetë balancuar, ku secili kulm ka një

ngjyrë të kuqe ose të zezë. Balancimi i referohet pikërisht këtij fenomeni, ngjyrimi

me dy ngjyra i kulmeve, por po ashtu mund të shihet edhe disbalanca nëse mungojnë

ngjyrime. Kërkimi i balancës është i rendit O(log n) herë, ku n është numri total i

kulmeve në pemë. Çdo ndërhyrje për të fshirë apo shtuar po ashtu performohet në

O(log n) kohë.

Në 1972 Rudolf Bayer shpiku një strukturë të dhënash që ishte një rast i veçantë i

pemëve binare. Këto pemë përmbanin shtigje nga rrënja në gjethe me numër të njëjtë

kulmesh që krijonin pemë binare të balancuara. Bayer i quajti ato “ pemë simetrike

binare” në shkrimin e tij, më vonë ai i bëri ato popullore me emrin 2-3-4-pemësh.

Në 1978 artikulli “Një kornizë dy ngjyrëshe për pemët e balancuara” nga Leonidas

J.Guibas dhe Robert Sedgewick derivuan pemët kuq e zi nga pemët simetrike binare.

Ngjyra e kuqe ishte zgjedhur pasi ishte ngjyra që dukej më mirë nga printeri i asaj

kohe dhe njëkohësisht vetëm dy ngjyra stilolapsash ishin në atë kohë.

Në 1993 Andersson futi idenë e pemëve binare të djathta, për të thjeshtuar

operacionet e futjes dhe fshirjes nëpër pemë.

Në 1999 Okasaki tregoi si të futeshin funksione të pastra, duke ruajtur balancën e

pemës.

Në 2008 Sedgewick propozoi pemën e majtë kuq e zi, duke lëvruar idenë e Andersen

që thjeshtëzonte algoritmat.

Një shembull i këtyre pemëve është edhe lidhja fisnore fëmijë-prind-xhaxha

Rasti kur prindi dhe xhaxhai kanë një ngjyrë

25

Figura 1.15a Pema Kuq e Zi, prindi- xhaxha

Rasti kur prindi dhe xhaxhai (daja) kanë ngjyra të ndryshme.

Figura 1.15b Pema Kuq e Zi prindi- xhaxha

Figura 1.15 c Pema Kuq e Zi, prind- xhaxha

Nëse prindi është në një kulm me të kuqe dhe xhaxhai është i zi fjalia “ Nëse një kulm

është i kuq atëherë, të dy fëmijet e tij janë të zinj “ nuk ndeshet. Operacione të

26

ndryshme mund të kryhen në varësi, nëse kulmi është fëmija i majtë apo i djathtë i

ndonjë prindi, mund të transformojnë strukturën e pemës .

Kjo gjë shihet në figurën 1.15c, si alternohen këto vlera

Renditja e numrave

Një aplikim i rëndësishëm në renditjen e numrave është edhe pema kërkim binare

(BST). Supozojmë se k përfaqëson vlerën e një kulmi, atëherë një pemë kërkimi

binare ka vetinë e mëposhtme:

Gjithë fëmijët majtas kulmit kanë vlera më të vogla se k dhe ata djathtas k, kanë vlera

më të mëdha se k.

Duhet theksuar se pema duhet të jetë binare e balancuar për të kryer këtë renditje.

Supozoj se duam të renditim numrat 16,38,20,9,13,45,40, që mund të përdorim

algoritmin e kërkimit binar . Ai fillon duke gjetur elementin e mesëm në këtë listë dhe

më pas krahason këtë element me kufirin e sipërm Ub (Upper bounded) dhe të

poshtëm Lb ( Lower bounded)

Algortimi BST Binary Search Tree

Int function Binary search ( Grupi A, int Lb, int Ub, int k)

Fillo

Bëj gjithmonë

M=(Lb+Ub)/2;

Nqs (k A(M)) atëherë

Ub=M-1;

Përndryshe nqs (k A(M)) atëherë

Lb=M+1

Përndryshe

Rikthehu M;

Nqs (Lb atëherë

Rikthehu -1

Fund

27

Në vargun që kishim 16,38,20,9,13,45, 40 shohim se vlera e mesit është numri 20, i

cili mund të shërbejë si një rrënjë e pemës binare. Majtas saj vendosen vlerat më të

vogla, ndërsa djathtas vlerat më të mëdha.

Figura 1.16 Renditja e elementëve me anë të BST.

Kështu lexojmë nga e majta në të djathtë gjithë pemën duke pasur këtë renditje:

9,13,16,20,38,40,45

Një pyetje shqetësuese është “ Sa pemë binare të ndryshme mund të formojmë ne me

numër të njëjtë kulmesh?”. Pra është rasti i një kombinatorike të panumërueshme, e

cila mund të derivojë formula rekursive.

Shënoj numrin e pemëve binare me n kulme, ku si rrënjë e pemës. Për

, një pemë binare me n kulme ka një nënpemë të majtë me j kulme dhe një

nënpemë të djathtë me n-1-j kulme, për . Po të shënoj me nënpemën

e majtë të mundëshme dhe nënpemën e djathtë të mundëshme rezultati

shpreh kombinatorikën e majtë dhe të djathtë të nënpemëve të pemës T.

Ky relacion rekurence është i njohur si Rekursioni i Katalanit, ku quhet numri i n-

të i Katalanit. Në rast kur n=2 dhe n=3 atëherë . Për një pemë me tre

kulme kemi pesë mënyra të ndryshme pemësh binare:

Figura 1.17 Llojet e pemëve binare me tre kulme

Nga ekuacioni i mësipërm numri i pemëve të ndryshme binare të ndërtuara për n

kulme është:

28

1.7 Minimizimi i numrit të kulmeve të pemës së vendimit.

Problemi i minimizimit të pemës së vendimit kërkon së pari të tregojmë një hipotezë

për bashkësinë e përzgjedhur nga baza e të dhënave, që do të quhet edhe bashkësia

trajnuese dhe më pas të vlerësojmë saktësinë e saj me anë të një bashkësie test të

dhënash nga ato. Megjithatë mund të përftojmë matje më të sofistikuara nëse e

konsiderojmë të kufizuar problemin e gjetjes së pemës më të vogël të vendimit me

një bashkësi trajnuese të dhënash.

Le të jetë një bashkësi të dhënash, Ƒ një bashkësi karakteristikash me

vlera boolean dhe një ndarje e E-së. Shënojmë vlerat 0 ose 1 të

karakteristikave ku . Le të jetë një pemë binare me rrënjë

X është bashkësia e kulmeve, U bashkësia e brinjëve, nëse L është bashkësia e

gjetheve të pemës T atëherë L X . [17]

Një pemë vendimi e bazuar në pemën T, është një pemë e etiketuar ku çdo kulm i

brendshëm është etiketuar me një element nga Ƒ, që shënohet Çdo

brinjë etikohet me një vlerë booleane ku

Përmasa e pemës së vendimit është numri i kulmeve të T. Për një të dhënë

shënojmë rrugën të T nga rrënja r tek gjethja l. Për çdo vlerë mund t’i

shoqërojmë një gjetheje të vetme të tillë që për çdo brinjë në kemi . Një pemë vendimi klasifikon bashkësinë e të dhënave E në

qoftë se për çdo çift kemi që .

Pra për një bashkësi të dhënë E, duam të ndërtojmë një pemë vendimi që i

klasifikon të dhënat me një numër minimal kulmesh. Një kulm vendimi nga i cili

nuk dalin më alternativa quhet një gjethe vendimi.

Tiparet kategorike mund të shifrohen numerikisht dhe mund të përfaqësohen nga

bashkësia binare e vlerave. Karakteristikave Booleane i korrespondojmë ndarje të

barabarta në mënyrë të tillë:

Standarte është ndarja numerike e të dhënave me anë të mosbarazimit

Duke i bashkuar të dyja këto lloje të ndarjeve mund të shënojmë karakteristikat e dyta

kështu:

29

Për shembull le të kemi , tre karakteristika

tiparesh dhe të dhënat. Numërimi binar do të jetë si më poshtë : 0100

0001 1000 0111 0001 1111, në bashkësinë e vlerave booleane 1 3 '1 '3

1 4 1 4,..., , ,...,f f f f .

1.8 Etiketimi i çdo kulmi me të shumtën një tipar.

Problemi SAT është një problem caktimi vlerash në mënyrë të tillë që të plotësohet

çdo kufizim i problemit. Ky model përdoret për të gjetur një pemë vendimi optimale

që klasifikon të dhënat. Pra çdo kulmi duhet t’i caktojmë një tipar.

Për një pemë binare të dhënë dhe një bashkësi E, prezantojmë një

formulë SAT që plotësohet nëse gjendet një pemë vendimi e bazuar në T që

klasifikon të gjithë E-në. [19]

Le të jetë Ƒ një bashkësi tiparesh Ƒ dhe dy vlera që

kanë një vlerë të ngjashme në bashkësinë e tipareve ku

dhe një vlerë të ndryshme në bashkësinë

Ƒ . Modeli SAT duhet të sigurojë që dhe nuk janë shoqëruar

me të njëjtën gjethe. Përgjithësisht dhe nuk janë të shoqëruara me të njëjtën

gjethe nëse ekziston një brinjë e tillë që:

Tek sigurohemi se nëse kanë x si një “stërgjysh” të

përbashkët ato shfaqen në një nga dy nënpemët me rrënjë x. Në rastin tjetër

sigurohet që asnjëra nga ose nuk është

e njëjtë me l , pasi të dyja do të qëndrojnë në degën e kundërt të fëmijës së x.

Kodimi kulm-tipar bëhet me anë të caktimit të një saktësie ku tregon se

kulmi x është etiketuar me tipatin f. Për çdo çift , për çdo

ndërtojmë një klauzolë që harron se janë klasifikuar në l. Nga më sipër

supozojmë se gjendet një rrugë e tillë që është fëmijë i majtë i

dhe l është fëmijë i djathtë i . Klauzola jonë do të jetë

ku tregon se është etiketuar me një tipar

që ndodhet midis dhe sepse . Klauzola tregon se tipari që

etiketon do të klasifikojë së bashku dhe në degën që nuk të çon tek gjethja l

sepse përdor fëmijën e majtë të ku .

Formalisht klauzolat janë këto :

30

Klauzola e mëposhtme tregon se secili kulm etiketohet me të shumtën nje tipar:

Kemi shtuar klauzola të tepërta duke specifikuar që dy kulmet të së njëjtës rrugë nuk

duhet të marrin të njëjtin tipar, pasi përshpejton proçesin e rezolucionit :

1.9 Vështrim i përgjithshëm mbi kompleksitetin.

Le të marrim në shqyrtim problemet e optimizimit në lidhje me një graf me n kulme dhe m brinjë. Një përqasje e paraqitjes së një grafi është caktimi i

një matrice ku:

Kjo matricë ka n2 elemente. Fakti se tregon se gjendet një brinjë nga në

dhe se tregon që nuk ka një brinjë të tillë. Vërehet se matrica e grafit të

paorientuar është simetrike. Një graf i paorientuar mund të ketë rreth

brinjë. Në rastin e grafeve të rrallë është më mirë të përfaqësohet grafi i dhënë me anë

të një liste afërsie. Për çdo kulm ndërtojmë bashkësinë të

kulmemeve që janë afër me të. Meqë çdo brinjë kontribuon me 2 në gjatësinë e listës

atëherë duhet të mendojmë për 2m elementë. Faktori tjetër që ndikon në gjatësinë

totale të paraqitjes është mënyra e kodimit të kulmeve. Alfabeti ynë ka numër të

fundëm shkronjash, por po supozojmë se ka elementët . Na duhet kështu

njësi për të koduar një kulm të vetëm. Pra për të gjithë grafin duhen

simbole. Praktikisht themi se grafi G mund të kodohet në hapësirën që duket si kontradiktor me atë më sipër. Ka një arsye të veçantë pasi kompjuterat i

trajtojnë njësoj me radhë të gjithë numrat e plotë. Hapësira regjistron nga 5 njësi deri

ne 312

njësi. Supozojmë se po studiojmë grafet me numër kulmesh ndërmjet këtyre

njësive. Shumica e kompjuterëve e ka hapësirën 0 deri në 231

ku kemi numrat e plotë

me 32 bite. Kështu është një përafrim i arsyeshëm i madhësisë së grafit duke u

pranuar në praktikë edhe në lidhje me m brinjët. Në shumicën e rasteve merren në

konsideratë të dy parametrat m dhe n. [19]

Një çështje mjaft e rëndësishme që del nga problemet kombinatoriale të optimizimit

është klasifikimi i problemeve të vështira ( Papademitriou dhe Steiglitz, 1998). Për të

31

bërë dallimin ndërmjet problemeve të thjeshta dhe të vështira, mendohet të

konsiderojmë klasën e problemeve që zgjidhen nga makinat deterministe të Turingut

në kohë polinomiale dhe problemet që zgjidhen nga makinat jo deterministe të

Turingut në kohë polinomiale. Një makinë e Turingut përbëhet nga një “proçesor” që

mund të jetë në një numër të fundëm gjendjesh dhe nga një shirit me gjatësi të

kufizuar. Mbi të gjitha gjendet një “kokë lexo-shkruaj” që mund të lexojë simbolet e

shiritit një në një kohë. Në varësi të gjendjes së proçesorit dhe leximit të simboleve,

proçesori kalon në një gjendje tjetër , simboli në shirit ndryshon dhe shiriti lëviz një

pozicion në të majtë ose në të djathtë. Matematikisht një makinë Turingu është një

funksion i M-së që është bashkësia e gjendjeve të proçesorit dhe ∑ bashkësia e të

gjithë simboleve që mund të shkruhen në shirit :

Funksioni T paraqet një “iteracion” që tregon se nëse

proçesori është në gjendjen m dhe simboli i lexuar në shirit është , atëherë gjendja e

ardhshme do të jetë , simboli do të ndryshohet me dhe shirirti do të lëviz një

pozicion në të djathtë. Po ashtu ka të njëjtin kuptim vetëm se

shiriti lëviz majtas. [39]

Nuk është qëllimi të karakterizojmë klasat P dhe NP me anë të makinave të Turingut

por pëlqejmë të përshkruajmë karakteristikat dhe nocionet e lidhura me këto klasa në

një nivel edhe më intuitiv. Kjo çon në një përkufizim të ri të problemeve që i përkasin

P. Do të themi se problemi është në P nëse ai mund të zgjidhet me anë të një

algoritmi polinomial në kohë.

Shembuj problemash që mund t’i përkasin kësaj klase janë problemi i rrugës më të

shkurtër dhe problemi i gjetjes së pemës së pjesshme minimale. Klasa që shoqëron

problemet e vështira quhet klasa NP (jo determinist në kohë polinomiale). Në mënyrë

tipike klasa NP është e kufizuar më shumë tek problemet e vendimit, sidomos tek ato

që përbëhen nga atribute binarë të formës “Po” ose “JO”. Ky kufizim ka një prapavijë

teknike që kap themelin e problemeve pa i thjeshtësuar shumë ato. Një problem

vendimi është i tipit NP nëse çdo zgjidhje e dhënë e problemit mund të verifikohet në

kohë polinomiale. Pra nuk është e rëndësishme që zgjidhja të llogaritet në kohë

polinomiale por që ajo të verifikohet në kohë polinomiale. Patjetër që

qëndron ( abuzojmë pak simbolikisht duke kufizuar P-të në problemet e vendimit)

dhe gjerësisht dihet se . Le të shënojmë me P klasën e problemave të

vendimit që janë të zgjidhshme në një kohë polinomiale. Themi se një problem

kërkimi i përcaktuar nga një relacion R është një problem NP kërkimi nëse relacioni

llogaritet në mënyrë efikase dhe zgjidhjet nëse ekzistojnë janë të shkurtëra.

Formalisht R është NP nëse gjendet një algoritëm me kohë polinomiale që për të

dhënë vendos kur dhe nëse gjendet një polinom p i tillë që nëse

32

Me anë të algoritmeve të grafeve, mund të kufizojmë kohën e

veprimeve polinomialisht me m dhe n, duke përftuar një algoritëm polinomial në

kohë. Supozoj se kemi numrin e plotë më të madh nga të dhënat. Një algoritëm

A do të quhet pseudo-polinomial nëse është polinomial në masën e të dhënave dhe

. Vërehet se mund të kodohet nga bite. Kështu një funksion që

është polinomial në dhe , nuk është e thënë të jetë polinomial në përmasat e të

dhënave. Në rastet kur është e kufizuar nga një polinomial në , A është

algoritëm polinomial në kohë.

33

Kapitulli 2

Aspekte algoritmike në rrjetat vendim-marrëse

2.1 Teoria e rrjetave e aplikuar në pemët e vendimit

Teoria e vendim-marrjes është zhvilluar që nga mesi i shekullit të 20-të, përmes

kontributeve nga akademik të disiplinave të ndryshme. Këta akademik janë nga

radhët e ekonimistëve, statistikanëve, psikologëve, politikanë, punonjësve social,

filozofëve etj. Një politikan është i prirur të studiojë rregullat e votimit dhe aspekte të

tjera të vendim-marrjeve kolektive. Një psikolog është i prirur të studiojë sjelljet e

individëve gjatë vendimeve, ndërsa filozofi do të dijë kërkesat kur vendimet janë

racionale. Pra është një gamë e gjerë me subjekt të përbashkët dhe metoda të

ndryshme nga kërkues me profile të ndryshme, që aplikojnë problema të ngjashme.

Vendim-marrja është përzgjedhja e një vije qëndrimi për të arritur në një rezultat sa

më të mirë në kushtet e një situate sado pak të ndërlikuar. Në këto kushte vendim-

marrësi, qoftë ky një person apo një organ drejtues shqyrton të gjitha alternativat nga

këndvështrime apo kritere të ndryshme të cilat përcaktojnë vlerën e alternativave. Në

këto rrethana shtrohet problemi i marrjes së një vendimi optimal, ku përmendim

metodat e vendim-marrjes shumëkriterëshe (MCDM multi criteria decision making)

Këto metoda (MCDM) i referohen marrjes së vendimeve në prezencë të shumë

kritereve, zakonisht edhe konfliktuese ndërmjet tyre. Problemat MCDM janë të

shumta në jetën e përditshme, siç mund të jetë blerja e një shtëpie ose një makine që

karakterizohen me anë të termave çmim, madhësi, siguri, komfort, etj. Kjo disiplinë

është ngushtësisht e lidhur me përparimin e teknologjisë kompjuterike, pra ajo ka një

disiplinë të shkurtër rreth 30 vjeçare. Nga njëra anë ky zhvillim i menjëhershëm i

teknologjisë në këto pak vite ka bërë të mundur zgjidhjen analitike të problemave

MCDM komplekse. Nga ana tjetër përhapja e teknologjisë së informacionit dhe

kompjuterave kanë gjeneruar një sasi të gjerë informacioni, ku MCDM bëhet gjithnjë

e më shumë e rëndësishme si suport për vendim-marrësin.

Zakonisht gjenden dy lloje problemash MCDM: lloji i parë ka një numër të fundëm

alternativash për zgjidhje, ndërsa lloji i dytë një numër të pafundëm zgjidhjesh.

Normalisht në problema që shoqërohen me përzgjedhje dhe vlerësime, numri i

alternativave të zgjidhjeve është i limituar. Në problema që kanë të bëjnë me

dizenjim, një atribut mund të marr çdo lloj vlere në një varg. Një atribut është një

veti, cilësi ose tipar i alternativave. Për të vlerësuar një alternativë, ndaj secilit atribut

bashkangjitet një kriter. Korrespodenca midis atributeve dhe kritereve është një për

një. Ka raste kur zgjidhjet alternative mund të jenë të pafundme, atëherë problemi

paraqitet si problem optimizimi me shumë objektiva. Fokusimi ynë kryesor do të jetë

në problema me një numër të fundëm alternativash.

Problemat vendim-marrëse janë zgjidhur gjerësisht me anë të modeleve të

programimit linear, në të cilat numri i zgjidhjeve të mundshme është zakonisht i

34

madh. Nga këto modele është shumë e vështirë të evidentohen zgjidhjet e lejueshme,

pra ato alternativa që i duhen vendim-marrjes. Në metodat e MCDM edhe pse numri i

alternativave është i vogël, ato janë të disponueshme që në momentin fillestar të

shtrimit të problemit. Në praktikë kriteret e vlerësimit të alternativave mund të jenë

me natyra cilësore ose sasiore. Kur kriteret janë cilësore ato nuk mund të shprehen

numerikisht, pasi kriteret nuk kanë njësi matëse të përbashkëta. Ndaj në këto kushte

problemet e vendim-marrjes nuk mund të trajtohen me modelet e njohura lineare. [37]

2.2 Avantazhet dhe disavantazhet në përdorimin e pemës së vendimit

Pemët janë një teori qëndrore për të kuptuar strukturimin e një grafi, të cilat kanë një

rang të gjerë aplikimi. Pema e vendimit përbëhet nga një kulm kryesor që quhet

rrënjë, e cila nuk ka brinjë hyrëse, ndërsa gjithë kulmet e tjera kanë ekzaktësisht një

brinjë hyrëse. Kulmi me brinjë dalëse quhet kulm i brendshëm, kurse kulmet nga të

cilat nuk dalin brinjë quhen gjethe. Secila gjethe i përket një klase që përfaqëson

vlerën më të përshtatshme të synuar. Pemët e vendimit ose modelet e ndarjeve

rekursive janë një mjet vendim-marrje dhe paraqesin një lloj diagrame që përbëhet

nga kulmet ( gjethe= kulm me fuqinë 1) dhe nga një bashkësi vendimesh që duhen

marr nga kulmet, ne i referohemi me degë( brinjë). Struktura gjethe dhe degë formon

një paraqitje hierarkike që ngjason me pemën.

Aplikimet më të shpeshta të këtyre pemëve janë:

Prodhim – vlerësimi i materialeve kimike për prodhim.

Proçese optimizimi në makinat elektrokimike.

Inxhinieria Biomjekësore- Identifikimi i karakteristikave për tu përdorur në

pajisje implantuese.

Astronomi- Përdorim i pemëve të vendimit në filtrimin e zhurmave të

hapësirës

Biololgjia molekulare-Analizimi i vargjeve të aminoacideve në genomin

human.

Avantazhet e pemëve të vendimit

Janë të thjeshta për tu kuptuar dhe interpretuar.

Kanë vlera edhe për të dhëna të pakta.

Algoritmet janë të fortë edhe në të dhëna të zhurmuara.

Të ndihmon të kuptosh vlerat më të mira, më të këqija dhe ato të pritshme.

Disavantazhet e pemëve të vendimit.

Për të dhëna që përfshijnë variabla kategorikë, me numër të ndryshëm

nivelesh hierarkik, përftimi i informacionit (Information gain) anohet në favor

të atyre atributeve që kanë më shumë nivele.

Llogaritjet mund të bëhen komplekse, veçanërisht kur pema ndërtohet mbi

pasigurinë e të dhënave.

35

2.3 Algoritmet e rrjetave të vendimit

Pemët e vendimit kanë karakteristika numerike dhe cilësore njëkohësisht. Problemat

MCDM mund të përshkruhen duke përdorur një matricë vendimi. Supozoj se kemi m

alternativa, që vlerësohen në bazë të n atributeve, atëherë matrica vendim është me

mxn përmasa. Metodat kryesore në lidhje me vendim-marrjen gjenerohen kryesisht

me anë të këtyre matricave. [29]

Një model është ndërtimi i pemës vendim-marrëse, si një proçes renditje dhe

klasifikimi njëkohësisht, duke pasur në krye vendim-marrësin. Algoritmi ID3 është i

pari algoritëm vendim-marrës që është ndërtuar nga J.Ross Quinlan 1986. ID3

ndërton një pemë vendim-marrëse nga një bashkësi fikse të dhënash, zakonisht

diskret. Gjethja e pemës përmban emrin e klasës së atributit, nqs kulmi nuk është

gjethe atëherë është një kulm vendimi, i cili shërben si një atribut test për degë të reja

të pemës. Ross Quinlan ka punuar me këto lloj pemësh vendimi, të cilat duken të

thjeshta dhe teknikisht të lehta për tu përdorur. Teoria e tij përdor vetitë e kulmeve të

pemës së vendimit , në mënyrë rekursive lart-poshtë, krahasime dhe gjykime të

bazuara në vlerat e ndryshme të atributeve. Si input janë bashkësia e të dhënave

ndërsa rezultati në dalje është pema që i përngjason një diagrame të orientuar, ku

secila gjethe përfaqëson një klasë vendimi. Gjethja përfaqëson vendimin që i përket

një klase të dhënash, pasi bëhet verifikimi i çdo testi nga rrënja në gjethe. Algoritma

të përmirësuar të ID3 janë paraqitur po nga Quinlan, disa vite më vonë. Përmirësimi i

parë quhet algoritmi C4.5, që ndërton pemën e vendimit si ID3, por në secilin kulm të

pemës zgjedh atribute nga të dhënat që ndajnë bashkësinë në nënbashkësi, nga një

klasë në tjetrën. Kriteri i ndarjes është normalizimi i përftimit të informacionit, ku

atributi me vlera më të larta të normalizuara të përftimit të informacionit, zgjidhet për

të bërë vendimin. Më pas në mënyrë rekursive C4.5 kalon në nivelin tjetër.

Përmirësimi tjetër është algoritmi Cart, që lidhet me klasifikimin dhe pemët

regresive. Zhvillimin kryesor e ka marr nga Breiman dhe Olshen në vitet 80-të, më

pas përmirësimi i tij u bë nga Quinlan në vitet 90-të. Ai lidhi modelimin bazë të

pemëve me fushën e gjerë të statistikës.

Një model tjetër për ndërtimin e pemëve vendim-marrëse jepet me anë të Proçesit të

Analizës Hierarkike, në të cilin atributet cilësore kthehen në atribute numerikë, ku

ndërtohen matricat përkatëse krahasuese me në qendër vendim-marrësin. Ky është një

model i paraqitur nga Thomas Saaty 1970, shumë i lëvruar edhe në kohët e sotme.

AHP paraqet një proçes të gjatë analize e organizimi për një vendimmarrrje sa më

optimale. Aplikimi i AHP është në mjaft fusha të gjera si në qeverisje, shëndetësi,

biznes, ndërtime, industri dhe edukim. Vendimmarrësi është në krye të AHP dhe ai

dekompozon gjithë problemin në hierarki e nivele, të cilat përbëjnë nënprobleme, ku

secila prej tyre analizohet në mënyrë të pavarur. Pasi ndërtohet kjo skemë,

vendimmarrësi nis të bëjë krahasime midis tyre, duke i marrë dy e nga dy. Të gjitha

vlerësimet cilësore që kryen ai, kthehen në vlerësime sasiore, duke i vendosur peshat

përkatëse secilit element në këtë hierarki. Në hapin final të gjitha vlerësimet numerike

të llogaritura renditen sipas rendit zbritës të tyre. Kështu klasifikohen alternativat nga

më optimalja deri tek ajo më e papërshtatshmja.

36

2.3.1 ID3 algoritmi bazë i vendimit

Algoritmi ID3 quhet në fakt Iterative Dichotometer 3, që do të thotë se klasifikon në

mënyrë iterative, por në fund të klasifikimit përgjigjia është po ose jo në lidhje me

atributet. I pari që e shpiku ID3 ishte Ross Quinlan në 1986 që ishte një kërkues

shkencor në shkencat kompjuterike dhe në teorinë e vendim-marrjes. ID3 në fakt

ndërton pemën më optimale të vendimit, në bazë të atributeve të tij. Baza e të

dhënave implementohet në variabla diskret dhe të vazhdueshëm. Klasifikimi bëhet në

bazë të atributeve, formohet pema e cila përmban gjethe vendimi. Nisja e algoritmit

bëhet nga llogaritja e entropisë së sistemit, që quhet Entropia e Shannonit, më pas

pasohet nga një veti statistike që quhet Përftim Informacioni (Information Gain).

Entropia është futur si kuptim në 1948 nga Klaud Shannon. Ajo mat rastësinë dhe

tregon se po të kemi më pak vlera është më e vogël pasiguria, po të kemi më shumë

vlera është më e madhe pasiguria. Në termodinamikë entropia mat rregullsinë ose

jorregullsinë e një sistemi, në teorinë e informacionit mat sa e sigurt apo e pasigurt

është vlera e një variabli rasti. Hapat e ID3 janë si më poshtë :

Merren atributet dhe llogariten entropitë për secilin.

Zgjidhet atributi që ka vlerë minimale të entropisë ose ai që ka përftim

informacioni maksimal.

Vendoset një kulm që e përmban atë atribut.

Nëse kemi një bashkësi S me n atribute, që kanë vlera të ndryshme, atëhere entropia

përkufizohet si më poshtë:

ku është proporcioni që S t’i përkasë klasës i.

Nëse S është një bashkësi nga një bazë të dhënash , që kërkohen të ndahen në m-klasa në bazë të një atributi në dalje ka një shpërndarje probabilitare të

klasave

ku tregon numrin e elementëve të klasës .

Le të mendojmë pak se çfarë ndodh nëse ndajmë bashkësinë bazë S në klasa

. Informacioni që duhet për të identifikuar klasën e një elementi në S në

lidhje me një atribut X është:

Në kontekstin e ndërtimit të një peme vendimi, duam të dimë se sa informacion duhet

shtuar për atributin në dalje kur dihet vlera X e atributit në hyrje? Pra ky është

ndryshimi midis informacionit që duhet për të klasifikuar një element në S përpara se

37

të njohim vlerën e atributit X , E(S) dhe informacionit që duhet pasi është ndarë

bashkësia S në bazë të njohjes së vlerës X. Kjo madhësi quhet përftim i informacionit

(IG) që mat ndryshimet efektive të entropisë, pasi bëhet një vendim bazuar në vlerat e

një atributi. Në kontekstin e ndërtimit të një peme vendimi, interesohemi se sa

informacion duhet rreth atributit në dalje, që mund të fitohet duke njohur vlerën e një

atributi. Formula është si më poshtë :

ku është bashkësia e të gjithë vlerave të mundëshme për atributin A.

Deri tani shpjeguam në vija të përgjithshme algoritmin, por le të japim një shpjegim

edhe me në detaje në lidhje me atributet dhe bashkësinë S. Për secilin atribut

vendosim një bashkësi pragjesh që janë të ndarë në mënyrë të

barabartë në intervalin . Në lidhje me këto pragje do të

korrespondojmë dy nënbashkësi të S-së të tilla që:

dhe

ku

Pra kështu pragu ndan bashkësinë S në dy nënbashkësi të ndara në lidhje me

vlerat e atributit . Gjithë pikat në bashkësinë trajnuese supozohet se janë të

klasifikuar pothuajse rregullsisht në klasat c nga bashkësia e klasave të pranueshme

C. Ka disa karakteristika në bashkësinë trajnuese:

1) janë numri total në bashkësitë përkatëse.

2) dhe raportet e numrit të elementëve të

bashkësive të klasifikuar nga klasa c.

Për bashkësitë do të vendosim sasi që specifikojnë

ndryshueshmërinë e klasave përveç këtyre bashkësive. Pra në këto kushte kjo

madhësi është entropia e Shannonit.

Është e qartë se nëse atëherë bashkësia përmban vetëm një

objekt të asaj klase. Në fund do të japim kuptimin e entropisë së kushtëzuar

:

38

si dhe një përftim informacioni relativ

Të përmbledhur hapat e algoritmit janë këto:

1) Jepet bashkësia S.

2) Krijohen pragjet

3) Për secilin prag llogaritet

4) Përkufizohet

5) Krijohet një kulm me atributin si një kulm vendimi dhe

, janë kushtet korresponduese të degës së vetë. Ndahet

kështu bashkësia fillestare S ne ,l mS dhe ,l mS

.

6) Hiqet si prag dhe përsëritet proçedura në mënyrë rekursive në

nënbashkësitë ,l mS dhe ,l mS

derisa të kemi kushtin e ndalimit.

Vlerat e atributeve mund të jenë cilësore ose sasiore. Le të marrim një shembull që

vetë Quinlan e ka botuar për të konkretizuar algortimin. [30]

Shembull 1

Duam të luajmë futboll në fundjavë. Për këtë do të bëjmë një parashikim në lidhje me

të dhënat e dy javëve të muajit të shkuar, ku përgjigjia do të jetë “po” ose “jo”. Tabela

e mëposhtme paraqet të dhënat:

Tabela 2.1 Bashkësia S e të dhënave.

Dita Moti Temperaturat Lagështia Era Të luajmë?

D1 Diell Nxehtë E lartë Pak Jo

D2 Diell Nxehtë E lartë Shumë Jo

D3 Me re Nxehtë E lartë Pak Po

D4 Shi Mesatar E lartë Pak Po

D5 Shi Ftohtë Normale Pak Po

D6 Shi Ftohtë Normale Shumë Jo

D7 Me re Ftohtë Normale Shumë Po

D8 Diell Mesatar E lartë Pak Jo

D9 Diell Ftohtë Normale Pak Po

D10 Shi Mesatar Normale Pak Po

D11 Diell Mesatar Normale Shumë Po

D12 Me re Mesatar E lartë Shumë Po

D13 Me re Nxehtë Normale Pak Po

D14 Shi Mesatar E lartë Shumë Jo

39

Së pari do të gjejmë atributin që do të jetë rrënjë e pemës sonë të vendimit. Llogaritim

entropinë e sistemit në lidhje me kolonën “Të luajmë?” .

Llogaritim entropitë e aributeve në lidhje me secilën vlerë cilësore që ata kanë. Në

lidhje me atributin “Moti”, ai merr tre vlera cilësore që janë diell, me re, shi. Kemi

gjithsej pesë vlera të cilësuara diell, nga të cilat 3 kanë përgjigjen “jo” tek kolona e

fundit dhe dy kanë përgjigjen “po”. Formulat përkatëse paraqesin entropinë në lidhje

me atributin “Moti”.

Atributi Moti

Le të llogaritim tani përftimin e informacionit të S në lidhje me “motin”. Kemi 5 vlera

me “Diell”, 4 vlera “Me re”, 5 me vlera “Shi”, nga 14 përgjigjet.

.

Atributi Temperatura

40

Atributi Lagështi

Atributi Era

Si rrënjë e pemës do të shërbejë informacioni me vlerë më të lartë që është atributi

“Moti”. Meqënëse atributi Moti ka tre variabla cilësorë atëherë do të dalin tre degë

nga kjo rrënjë, që do të formojnë nivelin e parë të hierarkisë.

Për këto kulme do të llogaritim Përftimin e Informacionit duke ndërtuar tre tabela të

reja që i përkasin atributeve në këtë mënyrë: për cilësinë “Diell” si degë e parë e

pemës, bëjmë një ekstrakt nga tabela në një tabelë të re si më poshtë:

Dita Temperatura Lagështi Era Të luajmë?

D1 Nxehtë E lartë Pak Jo

D2 Nxehtë E lartë Shumë Jo

D8 Mesatar E lartë Pak Jo

D9 Ftohtë Normale Pak Po

D11 Mesatar Normale Shumë Po

Tabela 2.2 Të dhënat pas rrënjës në lidhje me atributin “Diell”

Pasi të llogaritim sërish entropinë për këtë sistem të ri dhe Përftimin e Informacionit

për secilin atribut si më sipër, gjejmë se vlerën më të lartë e ka atributi Lagështi, që

shërben tani si një kulm i ri vendimi.

Për cilësinë “Me re ” si degë e dytë e pemës, zgjedhim nga tabela fillestare këto

elementë:

41


D3 Nxehtë E lartë Pak Po

D7 Ftohtë Normale Shumë Po

D12 Mesatar E lartë Shumë Po

D13 Nxehtë Normale Pak Po

Tabela 2.3 Të dhënat pas rrënjës në lidhje me atributin “Me re”

Të gjithë atributet janë njësoj, atëherë përgjigjia është “Po”, në këtë rast kjo është një

gjethe vendimi. Për cilësinë “Shi” si degë e tretë e pemës, zgjedhim nga tabela

fillestare këto elementë:


D4 Mesatar E lartë Pak Po

D5 Ftohtë Normale Pak Po

D6 Ftohtë Normale Shumë Jo

D10 Mesatar Normale Pak Po

D14 Mesatar E lartë Shumë Jo

Tabela 2.4 Të dhënat pas rrënjës në lidhje me atributin “Shi”

Pra atributi fitues në këtë degë të tretë është “Era”. Duke vazhduar kështu ne

përftojmë këtë pemë,ku në fakt atributi “Temperaturë” ka vlera minimale dhe nuk

merret në konsideratë.

Figura 2.1 Paraqitja e pemës vendim-marrëse për të luajtur futboll

42

2.3.2 Algoritmi ID3 Pseudokodë

Algoritmi ID3 është implementuar për tu përdorur në ndryshore diskret dhe të

vazhduara. Në kontekstin e ndërtimit të një peme vendimi, ne jemi të interesuar që të

dimë se sa shumë informacion duhet të trajtohet për atributin autput pasi njohim

vlerën e atributit A.

Formula e përfitimit të informacionit është :

Çdo atribut klasifikohet hap pas hapi në çdo nënndarje të re. Kjo proçedurë i ngjan

shumë thirrjes së famshme “ Përça dhe sundo”. Në bazë të këtij informacioni do të

zgjedhim atributin që ka vlerën më të lartë, duke e quajtur atë rrënjë të pemës sonë.

Pasi të kemi gjetur rrënjën, ky atribut lëviz nga bashkësia dhe për nivelin tjetër të

dhënat do të ndahen sipas vlerave të këtij atributi.

ID3 Algoritëm ,[Quinlan 1986]

S është një bashkësi tiparesh, gjithashtu quhet edhe hapësirë e tipareve.

C është bashkësia e klasave.

është funksioni klasifikim ideal për S.

SxC është bashkësia e shembujve;

ID3 (D, Atributi, Etiketimi)

Krijo një kulm t në pemë

Në qoftë se gjithë shembujt e D janë pozitivë,

atëherë shëno të vetmin kulm me “+”.

Në qoftë se gjithë shembujt e D janë negative,

atëherë shëno të vetmin kulm me “-”.

Etiketo “t” me vlerën më të madhe nga vlerat në D

Nqs atributi është bosh, atëherë rikthehu në kulmin t.

Le të jetë A atributi më i mirë i klasifikuar nga bashkësia e shembujve

Shënoj t atributin vendim të A

Për çdo vlerë të mundëshme “a” në Abëj:

Shto një degë të re peme poshtë t, korresponduese të A=“a”

Përndryshe,

Shkruaj Pema ID3 (D_a, Atribute/ A , Etiketë)

Rikthehu në t

43

2.3.3 Algoritmi C4.5 si përmirësim i ID3

Algoritmi C4.5 është një evolucion i ID3, i paraqitur po nga Quinlan në 1993. Ai

gjeneron një pemë vendimi për të dhënat, duke i ndarë ato në mënyrë rekursive. Rritja

e pemës së vendimit përdor strategjinë kërkim në thellësi. Algoritmi konsideron të

gjitha testet e mundëshme që mund të ndajnë të dhënat dhe përzgjedh një test që jep

përftimin e informacionit më të mirë, pra me vlerë maksimale. Ky test heq

paragjykimet e ID3 në favor të zgjerimit të pemës së vendimit. Për secilin atribut

diskret një test përdoret për të prodhuar shumë rezultate, siç janë vlerat e veçanta të

atributit. Për atributet e vazhdueshëm, të dhënat renditen dhe llogaritja e entropisë

bazohet në prerjet binare në secilën vlerë të ndarë nga të dhënat e renditura.

Ky proçes përsëritet për të gjithë atributet e vazhdueshëm. C4.5 lejon krasitjen e

pemëve vendim-marrëse të rezultuara në nivelet e mëparshme. Ai aplikohet shumë

mirë në atributet numerik, vlera të humbura ose të dhëna të zhurmuara. [36]

Një kufizim i ID3 është se ai është shumë i ndjeshëm ndaj tipareve me vlera të mëdha

numerike. Kjo gjë paraqitet sidomos në numrat e sigurimeve shoqërore të cilët janë të

vetëm për çdo individ, që duke u testuar në çdo vlerë ka gjithmonë vlera të vogla të

entropisë. Për të kaluar këtë vështirësi C4.5 përdor përftimin e informacionit si një

raport përftimi, të quajtur Gain Ratio (GR).

IG është përftimi i informacionit, SI është informacioni për ndarjen (Split Info)

ku

është raporti i elementëve të pranishëm në pozicionin p, që marrin vlerat e

testit të j-të. Po ashtu si ID3 të dhënat renditen për çdo kulm të pemës për të gjetur

atributin më të mirë të ndarë. Algoritmi përdor GR- përftimin e raportit për të

vlerësuar ndarjen e atributeve. Pemët e vendimit ndërtohen në C4.5 mbi bazë të të

dhënave të pemës nga ID3. Nga çdo gjethe e pemës C4.5 zgjedh atë atribut nga të

dhënat që ndan në mënyrë sa më efektive bashkësinë e shembujve në nënbashkësi.

Kriter mbetet normalizimi i IG përftimi i informacionit, pra atributi me vlerë më të

madhe të GR do të zgjidhet si fitues.

Ka rëndësi të përmendim se edhe faza tjetër që e quajmë “krasitje” është një teknikë

kërkimi nga poshtë lart, që redukton madhësinë e pemës së vendimit duke lëvizur

degë të pemës që janë pak të fuqishme për të klasifikuar më tej.

Duke iu referuar shembullit 1 të dhënë më lart le të tregojmë se si llogaritet atributi

më i rëndësishëm me anë të GR(p,t). Pasi është llogaritur IG na duhet të llogaritim SI

për çdo variabël për të gjetur GR.

Le të marrim atributin Era. Llogaritim SI e këtij atributi, e cila merr dy vlera:

“ Shumë dhe Pak”. Kemi tetë vlera për “Shumë” dhe gjashtë vlera për “Pak”. Pra:

44

Po të llogaritim SI për variablat e tjerë në këtë mënyrë, ne ndërtojmë tabelën e

mëposhtme, ku IG është marr nga ID3 :

Atributi Ndarja në klasa IG SI GR

Lagështi 7,7 0.152 1 0.152

Era 8,6 0.048 0.985 0.049

Moti 5,4,5 0.25 1.577 0.156

Temperatura 4,6,4 0.03 1.362 0.021

Tabela 2.5 Vlerat e atributeve të C4.5

Pra vlera më e madhe është përsëri Moti, më pas vazhdohet sërish në këtë mënyrë dhe

ndërtohet po ashtu pema e vendimit.

2.3.4 Avantazhet dhe disavantazhet e ID3 dhe C4.5

Avantazhe:

C4.5 punon me të dy atributet të vazhdueshëm dhe diskret njëkohësisht. Kur

atributet janë të vazhdueshëm, për t’i mbajtur ato algoritmi krijon një prag,

pastaj ndan listën me ato atribute që vlerat i kanë më lart se pragu dhe me ato

atribute që vlerat i kanë më pak ose baraz me pragun.

C4.5 lejon që vlerat e atributeve të shënohen si “të himbura”. Vlerat e

atributeve që humbasin janë thjesht të papërdorura në entropinë dhe përftimin

e informacionit.

C4.5 kthehet pas në pemë edhe pasi ajo është krijuar duke u përpjekur për të

lëvizur ndonjë degë që nuk ndihmon dhe i zëvendëson ato me ndonjë kulm

gjethe.

Disavantazhe:

C4.5 ndërton edhe degë boshe që është hapi më i rëndësishëm për të gjeneruar

rregullat. Kemi gjetur shumë kulme me vlera zero ose afër zeros.

Këto vlera nuk ndihmojnë për të gjeneruar rregulla as për të ndërtuar ndonjë

klasë në lidhje me klasifikimin. Përkundrazi ajo e bën pemën më të madhe dhe

më komplekse.

Mbi vendosja ndodh kur modeli algoritëm zgjedh të dhëna me karakteristika

të rralla. Zakonisht C4.5 si algoritëm ndërton pemë dhe rrit degët e saj në

thellësi për të klasifikuar të dhënat. Shumicën e kohës algoritmi mbivendos të

dhënat e zhurmuara.

45

Algoritmi

Karakteristika

ID3 C4.5

Kriteret për ndarje IG Përftim informacioni GR Përftim raporti

Lloje të atributeve Vlera kategorike Vlera kategorike dhe numerike

Vlera të humbura Nuk i mban vlerat e humbura

I mban vlerat e humbura

Strategjia e krasitjes Nuk ka krasitje. Përdoret gabimi i krasitjes bazë.

Tabela 2.6 Karakteristikat e ID3 dhe C4.5

2.3.5 Krahasimi midis ID3 dhe C4.5 i aplikuar në rrjetat wireles dhe Sistemet

Inteligjente të Transportit. (ITS)

Pemët e vendimit sigurojnë një strukturë formale vendimesh dhe shanse ngjarjesh nga

e majta në të djathtë. Zhvillimet e internetit së fundmi kanë në përmbajtje sasi

marramendëse të dhënash dhe informacioni. Kjo situatë gjeneron një nevojë urgjente

për teknika të reja dhe mjete automatike, që mund të na ndihmojnë të transformojmë

këto të dhëna në informacion të dobishëm për ne. [36]

Sistemet Inteligjente të Transportit (ITS) i referohen sistemeve të avancuara të

transportit, që janë dizenjuar për të mbledhur, proçesuar dhe siguruar informacionin e

trafikut në kohë reale, në sajë të transportit të sofistikuar elektronik dhe teknologjisë

së informacionit. Për të menaxhuar trafikun në mënyrë sa më të thjeshtë do të

përdorim algoritmin e pemëve të vendimit. Me zhvillimin e ekonomisë sociale, rritja

e trafikut është akoma më e madhe sesa kapaciteti i rrjetit rrugor. Problemet e trafikut

kanë ardhur duke u bërë një shqetësim social qëndror.

Sistemi ITS i aplikuar në trafikun e qytetit reflektohet kryesisht në përmbledhjen

mikroskopike të informacionit të trafikut, kontrolle të trafikut dhe guidë, për të

përmirësuar efektshmërinë e sitemit të trafikut. Rrjeti wireless ka karakteristika të

shkëlqyera, që mund të sigurojë një mjet efektiv për të mbledhur informacion për ITS

dhe mund të monitoroj prerjet në të gjitha drejtimet për makinat në trafik.

Teknologjia e rrjetave wireless është teknologjia me distancë të vogël, kompleksitet të

vogël, pak kosto. Teknologjia e rrjetit wireless përmban tre lloje të rrjetave të

vetëorganizuara që janë : rrjeti Yll, rrjeti pemë Klaster dhe rrjeti Mesh. Fan dhe Van

kanë studiuar kritere të rëndësishme për dizenjimin e rrjetave wireless. Një ndër to

është gjetja e kulmit terminal ( rrënja) , kulmet hyrës dhe dalës. Do të aplikojmë

rrjetat wireless në përmirësimin e statusit të transportit publik, që janë një pjesë e

sistemeve inteligjente të transportit. Pikërisht për të ndërtuar këto rrjeta kemi përdorur

algoritmet ID3 dhe C4.5. Pas ndertimit ne do të shohim se algoritmi C4.5 është më i

shpejtë dhe më efektiv sesa ID3. Fan dhe Wan në 1995, gjetën kriterin më të

46

rëndësishëm për të ndërtuar rrjetin wireless. Ata konkluduan se duheshin ndarë

kulmet kryesore në rrjetë që ishin: kulmi Terminal, kulmi Sink dhe kulmi Gateway.

Kulmi terminal përfaqëson një gjethe vendimi, pra një kulm fundor. Kulmi Sink në

një pemë vendimi ka rolin e rrënjës së pemës. Në rrjetat wireless ai mund të jetë nyje

lidhëse ndërmjet rrjeteve. Kulmi Gateway lidh rrjetat me protokolle të ndryshme. Në

figurën 12 jepen llojet e kulmeve në një rrjetë të tipit Mesh.

Figura 2.2 Llojet e kulmeve në rrjetat wireles

Sistemet e rrjetave wireless në fakt kanë një dobësi pasi ato varen nga bateria, që

është në fakt edhe kriteri më i rëndësishëm për të dizenjuar rrjetën. Rrjeti wireless

WSN ka kapacitet të madh për numrat e kulmeve sensore të rrjetës, ndërsa një sistem

inteligjent transporti ITS pritet që të mbulojë qindra rrugë dhe zona të miliona

makinave. Pra këtu kuptohet se sa e gjerë duhet WSN për të mbuluar një sipërfaqe të

tillë, pasi me këtë trafik vetëm një fraksion rrugor mund të mbulohet nga WSN.

Në arkitekturën që do të ndërtojmë do të marrim si kulme stacionet bazë siç janë

kryqëzimet, urat, rrugët një kalimshe, etj. Mirëpërcaktimi i pozicionit të një kulmi

lokaliteti është një nga funksionet bazë të WSN. Në ndihmë të këtij strukturimi vjen

GIS, një sistem informacioni gjeografik që regjistron të dhënat e trafikut, i cili

aplikohet në ndërtimin e trafikut, manaxhimin dhe shërbime të informacionit, një

sistem i pazëvendësueshëm për ITS.

Figura 2.3 Rrjeta WSN

47

Formulat më fillestare të përdorura në GIS kanë qenë distanca e Euklidit, prerja e dy

drejtëzave, dimensionet e prerjeve të një drejtëze, etj.Tani si funksion bazë në lidhje

me atributet e të dhënave dhe ndarjeve të tyre, i ngjashëm me pasqyrime të analizës

hapësinore, ku C tregon kapacitetin maksimal të rrjetës, në funksion të dy

shpërndarjeve probabilitare të ITS dhe të

GIS. Ky funksion është huazuar nga teoria e informacionit, në bazë të llojeve të

ndryshme të entropive. [44]

Në rrjetën WSN kulmi sink mund të transportojë më thjesht nga anët e kolonave të

rrugëve ose bareve, kulmi gateway është integruar në ndërprerje të sinjaleve të

trafikut, ndërsa kulmi terminal mund të vendoset në rrugë ose anash saj. Në

transportin publik në pikat e ndalesave të autobuzëve vijnë disa njëkohësisht, ata që

ndalojnë janë të përshtatshëm për rrjetat Yll. Por nqs autobuzi ndalon jashtë stacionit,

ai del nga sensorët dhe kanali bllokohet, ndaj më e përshtatshme është rrjeta Mesh.

Po të marrim në konsideratë figurën e mëposhtme, ku makinat që janë në një rrugë të

përbashkët mund të marrin informacion ndërmjet tyre nëse në afërsi janë rrjetat WSN

të cilat në fakt aplikohen edhe me Bluetooth. Makina A gjen se në linjën e saj është

makina B dhe D. Valët bluetooth supozohet të monitorojnë rreth 200 makina në

afërsinë 100 m. Rrjeta GIS bën të mundur që së pari makinat të kërkojnë stacionin

bazë, nqs e gjejnë të komunikojnë me të , ndërkohë kjo gjë ndikon tek makinat e tjera.

Figura 2.4 Komunikimi WSN-GIS-ITS

Në qoftë se supozojmë se makina E është më afër me stacionin bazë, ajo i dërgon një

lidhje bluetooth stacionit, për të ditur gjendjen e rrugës, pengesat etj. Stacioni lidhet

me të dhe dërgon informacionin e tij, ndërkohë makina A që është pas saj mund të

mar këtë informacion si sinjal nga stacioni. [7]

Për të ndërtuar sistemin inteligjent të transportit kemi përdorur algoritmat ID3 dhe

C4.5, sigurisht të aplikuar në paketën Weka( do të jepet informacion tek kapitulli 3).

Duke marr një bashkësi të dhënash për 20 stacione autobuzi, në të cilat janë vendosur

48

rrjetat wireless( disa pranë lokaleve ose bareve të qytetit), i kemi formatuar të dhënat

për të ndërtuar pemët dhe kemi parë se C4.5 ndërton shumë herë më shpejt se ID3.

Duke parë numrin e makinave përgjatë një muaji, janë marr pemët përkatëse të

ndërtuara për çdo rast. Kryesisht 0-1000 makina ndërtonin rrjeta vendimi me

maksimumi 6 kulme, më shumë se 1000 makina ndërtonin rrjeta vendimi me nga një

kulm më shumë për çdo rast. ID3 për 6223 makina ndërton pemë me 9 kulme, ndërsa

optimizimi i tij C4.5 për këtë rast e minimizon numrin në 2000 makina.

Figura 2.5 Grafiku krahasues ID3 dhe C4.5

2.3.6 Algoritmi Cart dhe indeksi GINI

Algoritmi Cart u zhvillua nga Breiman në 1984. Cart janë inicialet për pemët

klasifikuese dhe regresive. (classification and regression trës). Këto dy lloje pemësh

kanë një ndryshim- pemët klasifikuese përdorin variabla diskret, ndërsa ato regresive

marrrin variabla të vazhdueshëm, duke u fokusuar vetëm tek pemët klasifikuese. Nëse

një variabël zgjidhet pas fazës ndarëse, të gjithë variablat e tjerë testohen mbi një

kriter dhe zgjidhet më i miri prej tyre. Në qoftë se kemi variabla binarë secila vlerë

përkufizon një grup për një ndarje, nëse variabli është diskret merren gjithë

kombinimet e mundshme të grupeve. Numri i testeve për n variabla diskret është (2n-

2)/2. Në qoftë se variabli është i vazhdueshëm, atëherë për n variabla bëhen n-1 teste.

Cart përdor një kriter selektimi ndarës si “një mesatare e ponderuar jo e pastër”, e

cila në bazë ka indeksin e GINI-it. Pikë së pari indeksi GINI llogaritet dhe më pas

kombinohet në kriter. Do ta shohim këtë indeks për dy grupe nga një ndarje e

mundshme e tre variablave të motit . [21]

ku është një raport i një atributi të caktuar ( p.sh ( PO,JO)). Indeksi Gini është një

masë e dispersionit statistikor, e zhvilluar nga statisticieni italian Korrado Gini në

49

1912, i botuar në artikullin “Ngjashmëria dhe ndryshueshmëria”. Indeksi i Ginit

përkufizohet në bazë të vijës së Lorencit, e cila tregon proporcionin e të ardhurave

totale të popullsisë (boshti oy) ,që fitohet nga akumulimi i popullsisë në boshtin e x-

ve. Drejtëza y=x përfaqëson barazimin perfekt të të ardhurave. Pra ky indeks mund të

mendohet si raport i sipërfaqes që shtrihet midis drejtëzës së barazimit dhe vijës së

Lorencit( shënuar me A në diagram) mbi sipërfaqen totale që është nën vijën e

barazisë ( shënuar me A+B).

Figura 2.6 Indeksi Gini

Nëse gjithë njerëzit kanë të ardhura jo negative, indeksi i Ginit shtrihet midis 0 dhe 1,

shpesh shprehet si përqindje. Praktikisht të dy vlerat nuk arrihen shpesh, indeksi

mund të kalojë vlerën 1 nëse gjenden vlera negative të mundshme. Vërehet se vlera

më e mirë për të ndarë është atributi me vlera minimale të GINI. Duke iu referuar

shembullit 1, ne duhet të vendosim si t’i ndajmë tre atributet kryesore të motit në

nëngrupe? Në shembullin 1 ne mund të bëjmë këtë tabelë për të llogaritur indeksin:

Grupi 1 Grupi 2 Grupi 3

Të luajmë? Diell+

Shi

Me

re

Diell+Me

re

Shi Diell Shi+Me re

Po 5 4 6 3 2 7

Jo 5 0 3 2 3 2

Gini grup 0.5 0 0.44 0.48 0.48 0.35

Gini variabël 0.36 0.46 0.39

Tabela 2.7 Vlerat e indeksit GINI

25

10

25

10

50

26

9

23

9

27

9

22

9

Indeksi i GINI-t për variabël llogaritet si një mesatare e ponderuar e indekseve GINI

për secilin grup.

0.5 10 0 4

0.3614

0.44 9 0.48 5

0.4614

0.48 5 0.35 9

0.3914

Nga këto indekse GINI shohim se vlerën minimale e ka grupi i parë, pra ai është

nënndarja më e mirë. Në mënyrë të njëjtë ne bëjmë testin për grupin e variablave

Temperaturë. Rezultatet tregojnë se ndarja më e mirë është Nxehtë + Ftohtë si një

grup dhe Mesatar në grupin tjetër . Le të paraqesim në një tabelë gjithë rezultatet e

testeve të kryera për indeksin GINI.

Moti Temperatura Lagështia Era

Të luajmë? Diell+S

hi

Me re Nxehtë +

Ftohtë

Mesatar Lart

ë

Norma

l

Pak Shum

ë

Po 5 4 5 4 3 6 6 3

Jo 5 0 3 2 4 1 2 3

Gini grup 0.5 0 0.47 0.44 0.49 0.25 0.38 0.5

Gini

variabël

0.36 0.46 0.37 0.43

Tabela 2.8 Atributet të indeksuara me GINI

Pra vlerën minimale të indeksit të GINI-t , e ka atributi Moti ku grupi Diell+Shi me

10 vlera do të rindahet duke përdorur të njëjtin algoritëm, ndërsa grupi i dytë Mot-

Me re do të ndahet po ashtu me këtë algoritëm derisa të arrihet kriteri “ nuk ka asnjë

variabël tjetër për tu ndarë”. Cart nuk përdor një para ndarje, por një pas ndarje, pra

pas llogaritjeve të bëra. Kështu pema e përftuar do të jetë e ngjashme me pemën e

ID3.

51

KAPITULLI 3

Paketa weka pёr klasifikime nё rrjeta

3.1 Paketa Weka për klasifikim.

Figura 3.1 Pamje e paketës Weka

Weka është një paketë e re për klasifikime, e cila u zhvillua për herë të parë në

Universitetin Waikato në Zelandën e Re (1999), sot përmban versione të avancuara të

2014. WEKA përfaqëson Waikato Environment for Knowledge Analysis, ku

paraqitet me anë të një logo zogu të llojit Meka, i cili gjendet vetëm në Zelandën e

Re. Weka është shkruar në një gjuhë programimi objekti të orientuar në Java, e

përshtatshme për të gjithë llojet e kompjuterave. Pikërisht algoritmi ynë ID3

implementohet vetëm në Weka , jo në R-programming apo Matlab. Gjenden komanda

të ndryshme shërbimesh që mund të përdoren në Weka, në nivele të ndryshme.

Përmban një variete mjetesh për të transformuar të dhënat dhe klasifikuar ato në

nivele, të gjitha të vlefshme pasi nuk të duhet të shkruash ndonjë gjuhë të caktuar

programimi. Ndërtimi i një peme vendim-marrëse është një komandë e thjeshtë që

mund të bëjmë me paketën, pasi ajo ka në përbërje algoritma më të vështirë. [45]

Për të aplikuar Wekën, së pari ndërtojmë në një tabelë Exceli të dhënat tona.

E ruajme me Save as – CSV Comma Delimited

Shtyp Open Weka

Shtyp Explorer

Shtyp Choose File

Shtyp Visualize Atributte Classification

Shtyp Choose – Trees-J 48Pruned

Shtyp Use Training Set-Start-Visualize Tree

Del pema ID3.

52

3.2 ID3 i implementuar në paketën Weka Tushar

Le të marrim shembullim 1 të mësipërm të aplikuar në Weka për të ndërtuar pemën

vendim-marrëse me anë të ID3. Kur hedhim të dhënat ato klasifikohen kështu:

Figura 3.2 Të dhënat e shembullit 1 në Weka

Në qoftë se në të djathtë klikojmë tek Visualize all shohim këtë klasifikim:

Figura 3.3 Visualizimi i atributeve ndërmjet tyre

Klikojmë tek Classify- Trees-J 48 prunned –Use training set-Start

53

Figura 3.4 Përzgjedhja e algoritmit ID3 si J 48 Prunned.

Classifier output

= = = Run information = = =

Scheme: weka.classifiers.trees. J48 –C 0.25 _M 2

Relation: shembull 1

Instances : 14

Attributes: 6

Dita

Moti

Temperaturat

Lagështia

Era

Të luajmë?

Test mode: evaluate on training data

= = = Classifier model ( full training set) = = =

J 48 Pruned tree

54

= = = = = = = = = = = = =

Moti = Diell

| Lagështia = E lartë : Jo (3.0)

| Lagështia = Normale : Jo (0.0)

| Lagështia Normale : Po (2.0)

Moti = Me re : Po (4.0)

Moti = Shi : Po ( 4.0/1.0)

Moti = Shi : Jo (1.0)

Number of Leaves : 5

Size of the trë : 8

Time taken to build model : 0.05 seconds

= = = Evaluation on training set = = =

Time taken to test model on training data : o seconds

= = = Summary = = =

Correctly Classified Instances 13

Incorrectly Classified Instances 1

Kappa statistic 0.8372

Mean absolute error 0.1071

Root mean squared error 0.2315

Relative absolute error 23.0769

Coverage of cases (0.95 level) 100

Mean rel. Region size (0.95 level) 64.2857

Total Number of Instances 14

= = = Detailed Accuracy By Class = = =

TP Rate FP Rate Precision Recall F-measure MCC ROC Area PRC Area Class

0.800 0.000 1.000 0.800 0.889 0.849 0.967 0.925 Jo

1.000 0.200 0.900 1.000 0.947 0.849 0.967 0.967 Po

Weigted avg. 0.929 0.129 0.936 0.929 0.926 0.849 0.967 0.952

55

= = = Confusion Matrix = = =

a b <= = classified as

4 1 | a= Jo

0 10| b= Po

Figura 3.5 Paraqitja e pemës përfundimtare

Siç shihet nga figura 23 pema e ndërtuar është e njëjtë me atë tek shembulli 1, por

tani e llogaritur për 0.1 sekonda, kohë mjaft e mirë në krahasim me llogaritjet që

duhen bërë. [42]

3.2.1 Vlerësimi i faktorëve për të qenë obezë. (Zbatim)

Të qenurit obezë i referohet akumulimit të tepërt të yndyrës në trup. [31] Sipas të

dhënave që kemi mar nga qendra Tirana Intermedical Centre, numri i pacientëve

obezë është duke ardhur në rritje në këto 3 vitet e fundit. Janë të shumtë faktorët për

tu analizuar në lidhje me obezitetin, si një sëmundje komplekse që prek fëmijët, të

rinjtë dhe të vjetrit, me shumë arsye të ndryshme. [26] Faktorët kryesor që ndikojnë

më tepër janë: presioni i gjakut, ushqyrja me fruta e perime, pirja e alkolit, aktiviteti

fizik, pirja e duhanit,gjenetike etj. Do të aplikojmë algoritmin ID3 të vendimit për 20

prej 1000 pacientëve të vizituar në këtë qendër. Më poshtë kemi tabelën me

përzgjedhjet e rastësishme të tyre.

Personat Aktiviteti fizike Duhan-pirja Ushqimi me fruta Obeze ?

Per1 Jo Po Jo Po

Per6 Po Po Jo Jo

Per11 Jo Po Jo Po

Per17 Po Po Jo Po

Per20 Jo Jo Po Po

56

Tabela 3.1 Faktorët e obezitetit

Llogaritim entropinë dhe përftimin e Informacinoit IG për këto persona të zgjedhur

rastësisht nga bashkësia.

Për atributin e parë Aktiviteti fizik , kryejmë llogaritjet e entropisë dhe IG.

Për atributin e dytë Duhan-pirja kemi :

Per23 Jo Po Po Jo

Per27 Jo Po Jo Po

Per36 Po Po Jo Po

Per40 Po Po Jo Po

Per48 Jo Po Po Po

Per51 Jo Jo Po Po

Per59 Po Jo Jo Jo

Per62 Po Po Jo Po

Per65 Jo Po Po Jo

Per74 Jo Po Po Jo

Per85 Po Po Jo Po

Per88 Po Jo Jo Jo

Per90 Po Po Po Po

Per97 Jo Jo Po Po

Per100 Jo Jo Jo Po

57

Për atributin e tretë Ushqimi me fruta kemi :

Duhan-pirja është atributi që ka IG më të madhe, kështu që do të jetë edhe rrënja e

pemës sonë. Më poshtë paraqiten klasifikimet e atributeve

Figura 3.6 Klasifikimi i faktorëve të obezitetit

Figura 3.7 Aplikimi i J 48

58

Figura 3.8 Paraqitja e pemës faktorë obeziteti.

Praktikisht pema e vendimit për këto të dhëna ndërtohet lehtësisht. Rrënja e pemës

është duhan-pirja, që ndër këto atribute del edhe më i rëndësishmi. Në qoftëe se kemi

një person të ri, të cilin duam ta klasifikojmë në tabelë, mjafton të ndjekim shtegun

nga rrënja tek gjethet, duke ditur vlerat përkatëse të atributeve.

3.2.2 Klasifikimi i statusit ekonomik të familjeve shqiptare. Zbatim

Le të klasifikojmë gjendjen ekonomike të familjeve shqiptare duke përdorur

algoritmin e pemës vendim-marrëse që është ID3 algoritëm dhe më pas të aplikojmë

të dhënat edhe në paketën Weka. [33] Është gjetur se si rrënjë e pemës vendim-

marrëse shërben numri i personave për familje, i cili është po ashtu edhe më i

rëndësishmi atribut ndër të tjerët. Kemi aplikuar Wekën për të ndërtuar pemën binare

për këto raste dhe kemi parë se pema binare është më e vogël se pema vendim-

marrëse.Të dhënat janë marrë nga Anketa e Matjes së Nivelit të Jetesës për vitin

2012. Në studim janë marrë në konsideratë 6 671 familje që përbëjnë dhe njësinë e

vrojtimit të cilat janë përfaqësuese për të 4 rajonet: qëndror, bregdetar, malor. Lidhur

me përcaktimin e konceptit se “kush është i varfër” në Shqipëri: Një individ quhet i

varfër nëse niveli i tij i shpenzimeve për frymë bie nën nivelin minimal që nevojitet

për të plotësuar nevojat bazë për ushqime dhe artikuj joushqimor të këtij individi.

59

Tabela 3.2 Statusi ekonomik i familjeve shqiptare

Madhësia e

familjes Zona Kryefamiljari

Statusi

ekonomik

7 Rural mashkull I varfër

6 Rural femër I varfër


12 Urban mashkull I varfër





3 Urban femër Jo i varfër





4 Urban mashkull Jo i varfër






2 Rural mashkull Jo i varfër











60

Ky nivel minimal konsumi quhet “vija e varfërisë” dhe është një kufi që përfaqëson

pikën e ndarjes midis të varfërve dhe atyre që nuk janë të varfër. Kufiri absolut i

varfërisë përkufizohet në lidhje me një prag të paracaktuar ose me përballimin e

standardeve minimale të lidhura me një shportë konsumi (artikuj ushqimorë jo

ushqimorë). Përllogaritja e kufirit absolut të varfërisë e mbështetetur mbi këtë shportë

konsumi të një grup zgjedhjeje popullsie të marrë nga vëzhgimi dhe është konvertuar

në masë monetare. Kjo ka çuar në zgjedhjen e një kufiri varfërie absolut prej 4 891

Lekë për frymë në muaj. Kufiri i varfërisë ekuivalent me çmimet e vitit 2012 është 5

442 Lekë për frymë në muaj (INSAT 2012). Nga zgjedhje të rastësishme në

bashkësinë e 6671 familjeve kemi marrë 30 prej tyre për ndërtimin e një pjese të

pemës së vendimit. Duke aplikuar algoritmin ID3 si dhe duke i kthyer të dhënat e

tabelës në elemente binare, është ndërtuar gjithashtu pema e vendimit binarë. Kemi

zgjedhur të ndërtojmë këtë pemë binare për të gjitha këto vendime, pasi edhe rruga

për të gjetur rrugën optimale në pemë është edhe më e thjeshtë sepse nga secili kulm

dalin vetëm dy alternativa ose asnjë. Në rast se nuk del asnjë alternativë atëherë ky

është një kulm vendimi final. Pema binare si ekuivalente e pemës vendim-marrëse ka

numër më të vogël gjethesh (kulmesh vendimi). Në bazë të këtij informacioni do të

zgjedhim atributin që ka vlerën më të lartë, duke e quajtur atë rrënjë të pemës sonë.

Pasi të kemi gjetur rrënjën, ky atribut lëviz nga bashkësia dhe për nivelin tjetër të

dhënat do të ndahen sipas vlerave të këtij atributi.

Më poshtë jepet entropia e statusit ekonomik si entropi e një sistemi të tërë:

Tani llogaritim entropinë për atributin→ Madhësi e familjes

Tani llogaritim entropinë për atributin→Zona

Tani llogaritim entropinë për atributin→ Kryefamiljari

61

Siç shihet atributi me vlerë më të madhe është Madhësia e Familjes, e cila do të jetë

edhe rrënja e pemës sonë, atributi tjetër vjen Kryefamiljari e më pas atributi Zona.

Kemi përcaktuar kështu vetëm rrënjën. Në vazhdim për çdo nënndarje në pemë

aplikohet algoritmi nga e para, e kështu me radhë.

Figura 3.9 Klasifikimi i familjeve në Weka

Figura 3.10 Paraqitja e pemës status ekonomik me anë të Weka

62

Pema jonë vendim-marrëse ka klasifikuar më se miri gjithë të dhënat tona. Rrënja e

saj përbëhet nga atributi me entropinë më të madhe që është “madhësia e familjes”,

më pas në nivel të dytë, pasi rillogaritet entropia e nivelit pasardhës, ajo mbetet sërish

me vlerë më të madhe se atributet e tjera. Algoritmi ka klasifikuar duke nxjerr dy

degë me opsione më e madhe se 4.5 dhe më e vogël se 4.5 në lidhje me rrënjën. Më

pas sipas atributit fitues të radhës vendosen edhe variablat cilësorë të secilit. Shohim

se ana e majtë e pemës binare ka klasifikuar “jo të varfërit”, përveç një gjethe që

përmban të varfër , ndërsa ana e djathtë ka klasifikuar “të varfërit”, gjithçka në një

hierarki të tabelës fillestare. Për të ndërtuar pemën ekuivalente binare bëjmë këto

përcaktime:

Tabela 3.3 Vlerat e variablave binare tek statusi ekonomik

Figura 3.11 Paraqitja e klasifikimit binarë për statusin ekonomik

Edhe në pemën binare atributi “madhësi e familjes” është sërish rrënja e pemës. Këtu

atributet kanë vlera 0;1, kështu që algoritmi do klasifikojë me atribute me variabla

numerike jo më cilësore si më lart. Madhësia e pemës është më e vogël, por sërish në

anën e majtë janë klasifikuar “jo të varfër” , p.sh madhësia e familjes

zona ,13 të tillë.

Madhësia e familjes

Zona

Kryefamijlari Mashkull Femër

Statusi ekonomik I varfër Jo i varfër

63

Siç shihet nga paraqitja e pemëve, kemi një informacion më të plotë klasifikimi kur

kemi pemën vendim-marrëse të aplikuar me atribute cilësore dhe sasiore, ndërsa tek

pema binare kemi më pak informacion klasifikimi. Pema binare është e përshtatshme

kur kemi një sasi shumë të madhe të dhënash dhe kur kemi atribute cilësore që marrin

vetëm dy vlera. Nëse tek të dhënat, atributet janë cilësore me 3 ose më shumë tipare

atëherë pema binare nuk është e përshtatshme.

3.3 Një mënyrë e re e përmirësuar e ID3 në pemët binare.

Le të tregojmë një mënyrë për të gjetur pemën optimale të vendimit, duke përdorur

shpërndarjen, që formohet nga transformimi i variablave tanë në variabla binarë.

Dihet që pema e vendimit përfaqëson një shpërndarje dhe çdo rrugë midis atributeve

është një probabilitet i kushtëzuar.[35] Duke zgjedhur pemët binare thjeshtojmë

mënyrën e gjetjes së pemës optimale pasi këtu numri i gjetheve dhe numri i kulmeve

janë të njëjta. Në bazë të një përmirësimi të ID3, mund të tregojmë hapat për të gjetur

pemën optimale binare si më lart.

Shumë punime janë të lidhura me pemët e vendimit, duke përfshirë rritjen e tyre,

seleksionimin, ndarjen dhe kompleksitetin. E rëndësishme është të theksojmë se

përveç algoritmeve të njohur të trajtuar për ID3, C4.5 etj, do mundohemi që t’i

shoqërojmë kulmeve dhe brinjëve karakteristika numerike, duke përdorur teorinë e

probabiliteteve. Kulmi i parë përfaqëson kulmin rrënjë, që është dhe pika fillestare e

një strukture logjike. Nga rrënja përftojmë brinjët që japin alternativat e nivelit të

parë. Po kështu vazhdohet për nivelin e dytë, me alternativat përkatëse. Pra struktura

përftohet duke marr nga çdo kulm, numër të njëjtë brinjësh që kanë alternativat e

nivelit tjetër. Nëse duhet të ndërtojmë një pemë binare për gjithë vendimet e

strukturës, mënyra e gjetjes së pemës optimale është e thjeshtë, sepse nga secili kulm

dalin vetëm dy brinjë si alternativa ose asnjë. Shënojmë me 0 1, ,..., nA A A një bashkësi

variablash binarë dhe me 0 1( , ,..., )nP A A A një funksion probabilitar i shoqëruar me

secilin kombinim të vlerave 1

0 1( , ,..., ) 0,1n

na a a

, në mënyrë të tilë që shuma e

këtyre vlerave shoqëruese të jetë 1. 0 1

1 1 1

0 0 1 1

0 0 0

..... ( , ,..., ) 1n

n n

a a a

P A a A a A a

Nga këto do të marrim ato shpërndarje që kanë:

Le të jenë

0 1, ,...., nA A A një bashkësi variablash binarë. Shënoj 0A një variabël të

etiketuar, atëherë probabiliteti i kushtëzuar është funksioni:

64

0 10 1

1 2

( , ,...., )( | ,...., )

( , ,...., )

nn

n

P A A AP A A A

P A A A . Vërejmë se ky funksion i n+1 variablave, i

cakton secilit kombinimin e vlerave 0 1( , ,... )na a a një vlerë jonegative nga segmenti

[0,1].

Tabela 3.4 Vlerat e probabilitetit të kushtëzuar

Po ashtu kemi që:

0 1 1 0 1 1( 1| ,...., ) ( 0 | ,...., ) 1n n n nP A A a A a P A A a A a

Shpërndarjet në të cilat variablat kanë probabilitet jo zero, quhen shpërndarje të plota.

Në bazë të kombinimit të vlerave 1 2( , ,..., )na a a përcaktojmë një kusht të gjethes që

kjo i përket, duke e shënuar këtë kusht me vC . Pra

0 1 1 2 2( 1| , ,..., )n nP A A a A a A a do të shkruhet 0( 1| )vP A C

Në të njëjtën mënyrë për një bashkësi të dhënë 1 2, ,...,

ki i iA A A , ku

1 2( , ,..., ) (1,2,..., )ki i i n kemi :

1 2

1 2

1 2

0

0

( , , ,..., )( | , ,..., )

( , ,..., )

k

k

k

i i i

i i i

i i i

P A A A AP A A A A

P A A A

Për një shpërndarje probabilitare 0 1 2( , , ,..., )nP A A A A dhe një bashkësi arbitrare

(1,...., )L n , mund të llogaritim gjithmonë probabilitetin e kushtëzuar

0( | , )iP A A i L , i cili është i vetëm pasi përcakton një shpërndarje të plotë. Për një

bashkësi tjetër'L gjenden një numër i pafundëm shpërndarjesh

0 1 2( , , ,..., )nP A A A A ,

nga ku mund të nxjerrim '

0( | , )iP A A i L . I vetmi ndryshim në këtë shpërndarje

probabilitare të bashkuar është në '( , )iP A i L . Kemi pak ndryshime në 1 2( , )P A A dhe

'

1 2( , )P A A .

0A 1A 2A Probabiliteti i kushtëzuar i bashkuar.

0 0 0 0.08

0 0 1 0.16

0 1 0 0.20

0 1 1 0.03

1 0 0 0.09

1 0 1 0.18

1 1 0 0.20

1 1 1 0.06

65

A1 A2 0 1 2( 1| , )P A A A

0 0 9/17

0 1 9/17

1 0 ½

1 1 2/3

A1 0 1( 1| )P A A

0 9/17

1 26/49

A2 0 2( 1| )P A A

0 29/57 1 24/43

0( 1)P A

53/100

Tabela 3.5 Probabilitetet e shpërndarjes P

Së pari probabiliteti kalon nga :

1 2( 1, 0) 0.20 0.20 0.40P A A në 1 2( 1, 0) 0.11 0.11 0.22P A A . Së dyti

1 2( 1, 1) 0.03 0.06 0.09P A A kalon në 1 2( 1, 1)P A A = 0.09 0.18 0.27 .

A0 A1 A2 'P 0 0 0 0.08

0 0 1 0.16

0 1 0 0.11

0 1 1 0.09

1 0 0 0.09

1 0 1 0.18

1 1 0 0.11

1 1 1 0.18

Tabela 3.6 Probabilitetet e shpërndarjes 'P

Le të marrim në konsideratë situatën e mëposhtme: të parashikojmë suksesin për

nxënësit në një provim. Për djemtë, suksesi varet tek njohuritë, kurse për vajzat

suksesi varet nga zelli i të mësuarit. Dihet se njohuritë dhe zelli i të mësuarit janë

fortësisht të korreluara.

Ndërtojmë një pemë për këtë rast si në figurën e mëposhtme:

66

Figura 3.12 Pemët me shpërndarje

Pemët e vendimit janë me të njëjtin klasifikim, por me numër të ndryshëm gjethesh.

Variabli i etiketuar është Kalon/ Nuk kalon ku (Kalon=1, Nuk kalon=0). Z tregon

zell, Nj tregon njohuritë, V/D tregon vajzë/djalë.

Le të jetë P një shpërndarje 0 1 2( , , ,..., )nP A A A A dhe *T një pemë optimale që

përfaqëson shpërndarjen P, atëherë gjendet një varg n me pemë 1 2 1, ,..., , ...,i i nT T T T T

të

tilla që:

1. 1T është një pemë me një kulm të vetëm.

2. iT është pemë që përfaqëson P.

3. 1,2,..., 1k i pema 1kT ndërtohet nga kT me një shkallë të ID3 algorithm.

4. , 1,..., 1k i i n pema 1kT ndërtohet nga kT nga një iteracion këmbimi

prind-fëmijë.

5. nT = T

Nëse v është një kulm prind, me fëmijë 1 2,v v tregohet se:

1 20 0 0( 1| ) ( | ) ( | )v v vP A C P A C P A C

Jemi munduar të gjejmë pemën optimale minimale, duke ndërhyrë në fazën pas

ndarjeve në nivele, duke testuar kur mund të gjejmë një pemë minimale në kushte

supozimi të arsyeshme. Hapi tjetër është përmirësimi i algoritmit ID3 në fazat e

ndarjeve në nivele.

Algoritmi i përmirësuar ID3.

Faza ndarëse

- Ndaj kulmet derisa grupet janë shumë të vogla

Faza e ndalimit

Përsërit

67

- Gjej := Gjej dy gjethe 1 2,v v

- me probabilitet të njëjtë tek gjethja e etiketuar

- të cilat mund të jenë fqinje

- Nqs u gjet atëherë

- etiketo 1 2,v v

Derisa nuk u gjet

Kemi përzgjedhur pak të dhëna nga punëtorët e një biznesi në lidhje me mënyrën e

transportit për në punë. Ata janë përgjigjur me Po ose Jo për alternativat tona, që i

kemi peshuar me variabla 0 dhe 1, për të ndërtuar pemën binare. Alternativat janë 1.

Eshtë kamion? 2. Pesha e madhe e automjetit 3. Pesha e madhe e motorrit 4. Ia vlen?

Tabela 3.7 Të dhënat e punëtorëve

I vetmi ndryshim me ID3 është se kemi zëvendësuar iteracionin “të cilat janë fqinje”

me atë që “të cilat mund të jenë fqinje”. E kemi të thjeshtë të testojmë nëse dy gjethe

mund të jenë fqinje, pasi shohim kushtin e caktuar për to, pasi të dyja do të jenë në të

njëjtën thellësi në pemë. Kemi aplikuar këtë algoritëm në të dhëna reale, duke

përdorur Wekën për ID3 dhe ID3 e modifikuar.

0A

Është

kamion?

1A

Pesha e madhe e

mjetit

2A

Pesha e madhe e

motorrit

3A

Ia vlen?

0 0 0 0

0 0 0 1

0 0 1 0

0 0 1 1

0 1 0 0

0 1 0 1

0 1 1 0

0 1 1 1

1 0 0 1

1 0 0 0

1 0 1 1

1 1 0 0

1 1 0 1

1 1 1 0

1 1 1 1

68

Figura 3.13 Pema binare e ndërtuar nga ID3

Figura 3.14 Pema binare e ndërtuar nga ID3 i modifikuar

Pra siç shihet versioni i modifikuar i ID3 ka vetëm 4 gjethe, krahasuar me versionin e

ID3 të zakonshëm që ka 7 gjethe. Kjo çel rrugën e re për të ndërtuar pemë vendimi

ekuivalente dhe për të gjetur një pemë vendimi optimale, që është shumë e thjeshtë

nëse përdorim probabilitetet e kushtëzuara në pemët binare.

69

KAPITULLI 4

TEORIA E RENDITJES NGA NIVELET E RRJETËS

4.1 Procesi i Analizës Hierarkike (AHP) .

Proçesi i Analizës Hierarkike (AHP) bën pjesë në teorinë gjenerale të matjeve.

Përdoret për të derivuar shanset e krahasimeve dy e nga dy, në rastin diskret dhe të

vazhdueshëm. Këto krahasime mund të merren nga një matje aktuale ose nga një

shkallëzim themelor i cili reflekton forcën relative të preferencave. Në formën e saj të

zakonshme AHP është një kornizë jolineare për të nxjerr mendime induktive dhe

deduktive, pa përdorimin e silogjizmit dhe nga marrja e faktorëve të ndryshëm në

konsideratë në mënyrë simultane, duke lejuar pavarësinë dhe duke bërë vlerësime

numerike për të arritur në një sintezë ose konkluzion. Për një kohë të gjatë njerëzit

janë shqetësuar për të matur ngjarjet fizike dhe psikologjike, ku me fizike kuptojmë

atë çfarë është shumë e njohur. Në kontrast është ngjarja psikologjike, që është fusha

e ideve subjektive dhe besimi i individëve për veten krahasuar me eksperiencën

botërore. [38]

Lind pyetja: A gjendet një teori koherente që mund të bëjë ujdi me të dy këto botë të

realiteteve të ndryshme , pa bërë kompromis me asgjë? AHP është metoda që mund

të stabilizojë masat në të dy këto botë. Duke përdorur AHP për të modeluar një

problem, duhet një hierarki ose një strukturë rrjetore që përfaqëson atë problem dhe

krahasimet dy e nga dy për të stabilizuar relatat në këtë strukturë. Në rastin diskret

këto krahasime çojnë në një matricë dominante dhe në rastin e vazhdueshëm në

operatorët e Fredholmit, nga të cilët shanset rrjedhin në formën e vektorëve të vetë

themelor. Këto matrica janë pozitive dhe reciproke, p.sh

Nga nevoja për gjykime të ndryshme, është bërë një punë e konsiderueshme për të

karakterizuar proçesin e sintetizimeve të gjykimeve të ndryshme. Zakonisht një

model hierarkik i rrjeteve sociale , mund të jetë ndonjë që del nga një fokus, nga një

kriter, nga nënkritere që janë ndarje të kritereve dhe së fundi nga alternativat nga të

cilat zgjedhja duhet të bëhet.

Parlamenti i Finlandës ishte në vështirësi në lidhje me problemin e ndërtimit të një

termocentrali. Anëtarët e parlamentit ishin të fokusuar në lidhje me mënyrën se si do

të ndikonte ndërtimi i tyre në ekonominë Finlandeze. Kishte disa faktorë kryesor nga

ana shëndetësore, e sigurisë dhe e zhvillimit për qytetarët finlandezë dhe faktorët

politikë e relatat e finlandezëve me U.S.S.R. Qëllimi ishte të ndërtohej një

termocentral që do i shërbente më së miri mbarë kombit.

70

Secili nga kriteret kryesore u nda në nënkritere, i ndjekur nga alternativat, llojet e

ndryshme të termocentralit. Një hierarki e thjeshtë e problemit tregohet në figurën e

mëposhtme:

Figura 4.1 Hierarkia e problemit të Finlandës

Është bërë një punë marramendëse për të strukturuar problemin praktik.Gjithë

problemet u pamë se binin në njërën ose tjetrën kategori. Elementet e hierarkisë janë

grupuar në klasa nga homogjeniteti ( sipas aksiomave te AHP) ku niveli konsiston në

një ose disa klasa homogjeniteti. Elementët e çdo niveli mund të shikohen si

dekompozime të elementëve më sipër, pasi për të qenë një hierarki e kompletuar

elementët e një niveli, i kanë elementët e nivelit tjetër si pasardhës. Në këto kushte

nivelet janë klasat e vetme homogjene, në të kundërt hierarkia nuk është e plotë.

Objekti i vendim-marrjes në përgjithësi është përzgjedhja e një alternative sa më

optimale, për tu vënë në jetë, por në situata të tjera kur është fjala për të planifikuar

investimet vjetore të një kompanie apo të një instance administrative buxhetore

shtetërore, si objektiv mund të jetë renditja për nga rëndësia e të gjitha alternativave.

Lind pyetja : Ku është përdorur kjo teori në jetën reale? Le të japim disa shembuj

kryesor të përdorimit në praktikë të AHP.

71

Në administratën publike ka pasur shumë aplikime.

Shteti i Karolinës së Veriut e përdori atë për të zhvilluar vlerësimin e kritereve dhe

shitjeve , lidhur me përzgjedhjen e vlerës më të mirë të shitësve, e pranueshme për

vendim-marrësit.Komisioni Rregullator Bërthamor (KRB) i SHBA me kaq shumë

kërkesa konkuruese të projekteve të tyre teknologjike, përdorën teorinë për të ndarë

100 milion dollarë të portofolit. Saaty pati vështirësi me prioritetet e kërkesave të

shumta konkuruese për të ndarë punën në IT, krahasuar me gjetjen e konsensusit

ndërmjet 35 vetëve. AHP jo vetëm që ndihmoi për të ndarë burimet kryesore të KRB,

por reduktoi edhe kohën e vendimeve nga 15-20 herë. Këshilli Federal i Ekzaminimit

të Institucioneve Financiare (FFIEC) është një trup qeverisëse në SHBA . Ata

përdorën AHP për të gjetur prioritetin e përmirësimit strategjik për aktivitetin që i

nevojitet trupit të njeriut. Ata bënë prioritare objektivat e tyre përmes kërkesave

konkurruese me një numër të limituar burimesh të mjedisit dhe ishin të aftë ta

kompletonin këtë në sesionin e një dite. Klubi i Vajzave dhe Djemve në SHBA si

pjese e planit të tyre strategjik , përdorën AHP për të përkufizuar “riskun e rinisë”

duke i vendosur prioritete relative faktorëve.Grupi arriti konsensus dhe standarte për

planin e tyre strategjik. Departamenti i Mbrojtjes në SHBA përdorën metodën shpesh

dhe frekuentivisht për të ndarë burimet e tyre në aktivitetet e ndryshme .

Administrimi i shërbimeve gjenerale në SHBA përdori AHP për të suportuar

Këshillin e Teknologjisë së Informacionit dhe Këshillin e Kontrollorëve për të bërë

prioritare iniciativat e tyre kryesore në IT. Ata e përdorën procesin për të përsosur

kuadrin e tyre analitik, t’i jepnin prioritet kritereve te tyre. Rezultati ishte prioritizimi

i gjerë i GSA , i iniciativave kryesore IT , që përfshinte një analizë të përftimit të

kostos dhe një analizë të përftimit të riskut.Në 2001 u përdor për të përcaktuar

rivendosjen më të mirë të sajtit, në lidhje me tërmetin që shkatërroi qytetin turk

Adapazari. Kompanitë Britanike të fluturimit e përdorën këtë teori në 1998 për të

zgjedhur sistemet e argëtimit për të gjithë flotën. Një kompani e përdori atë në 1987,

për të zgjedhur tipin më të mirë të platformës, për të shpuar për naftë në Atlantikun e

Veriut. Platforma kushton rreth 3 bilion dollar për tu ndërtuar, por kostoja e rrënimit

ishte edhe një faktor më i rëndësishëm për vendim-marrjen.Një libër u shkrua në 1990

nga Nagel dhe Mills: Metoda shumëkriterëshe për zgjidhje alternative të

mosmarrëveshjeve duke aplikuar konceptet e vendim-marrjes sasiore në

administrimin publik. Nga ekzaminimi i librit del se autorët sugjerojnë shkallëzim

numerik.

Konflikti i SHBA me Kinën

Ky proçes u aplikua në konfliktin midis Kinës dhe SHBA-ve në betejën e të drejtave

të pronësisë intelektuale të kopjimit të muzikës, videove dhe softuereve të vitit 1995

mbi individët kineze. Një analizë AHP përfshin tre hierarki të vendim-marrjes me 97

benefite në kosto dhe risk , tregoi se ishte më mirë për SHBA të mos e sanksiononte

72

Kinën. Personalisht Saatin e ftoi presidenti Klinton duke e pyetur : “ A je krenar që

nuk e sanksionuam Kinën?”. Një studim tjetër pasoi këtë pyetje duke u përgjigjur se

Kina duhej shtuar në Organizatën Botërore të Tregtisë.

Të tjera

Në 1999 Kompania e motorrëve Ford përdorën AHP për të vendosur

prioritetet për kriteret që përmirësojnë kënaqësinë e konsumatorit.

Në 1986 Instituti i Studimit të Strategjive në Pretoria përdori AHP për të

analizuar konfliktin në Afrikën e Jugut dhe rekomandoi aksione për lirimin e

Nelson Mandelës, në heqjen e aparteidit dhe dhënien e shtetësisë së plotë dhe

të drejtave të barabarta për shumicën e zezë. Gjithë këto aksione të

rekomanduara u implementuan shpejt.

AHP është përdorur në pranimin e studentëve , promocione të personelit

ushtarak etj.

Në sporte është përdorur në 1995 për të parashikuar cila skuadër futbolli do të

shkonte drejt fitores.

AHP është aplikuar në IBM për të dizenjuar në mënyrë të suksesshme

kompjutera të rangut të mesëm AS 400. Për këtë IBM fitoi çmimin prestigjoz

Malcolm Baldrige Ekselent.

Me interes themelor ishte analiza për të ndërtuar ose jo Mbrojtjen Kombëtare

të Raketave bërë dy vjet para kohës që vendimi ishte bërë në dhjetor 2002.

Vendimi ishte i njëjtë me studimin e rekomanduar në një konferencë për

ushtrinë e hershme në vitin 2002: duke ndërtuar atë përkundër skepticizmit të

disa shkencëtarëve.

4.2 Shkalla Saaty

Kryerja e një proçesi vendim-marrës kërkon një vështrim shumë të kujdesshëm

krahasues mbi të gjitha alternativat dhe kriteret në shqyrtim. [10] Por realizimi i

krahasimeve vështirësohet për dy arsye : së pari për shumë kritere që ndeshen në

praktikë vlerësimet jepen në trajtë opinionesh kualitative të shprehuara me gjuhën e

zakonshme prej ekspertëve, së dyti edhe kur disa kritere shprehen në mënyrë sasiore ,

ato jepen të matura në njësi të ndryshme përshtatur me natyrën e kriterit, për këtë

arsye shpesh herë nuk mund të përcaktohet ndonjë njësi matje e vlefshme për të

gjithë. Megjithatë, sipas çdo kriteri një opinion dhe vlerësim në terma cilësorë për

krahasimin e alternativave nga specialistët e fushave përkatëse, mund të bëhet. [13]

Në këto kushte çdo përqasje matematike për trajtimin e problemeve të vendim-

marrjes do të mundësohej nëse do të mund të përdornin “ekuivalentë” sasiorë të

shprehjeve gjuhësore krahasuese ndërmjet elementëve të ndryshëm të skemës

hierarkike. Pra për të avancuar ide përqasjesh të tilla, problemi që do të duhej

73

zgjidhur është sajimi i ndonjë mënyre për të shkallëzuar numerikisht karakterizimet e

shprehura me të folurit e zakonshëm të rëndësive relative të elemenetëve të krahasuar.

Ky është problemi më i rëndësishëm i analizës shumëkriterëshe të vendim-marrjes që

hap rrugën për çështjet e tjera teknike. Saaty më 1977 ofroi një zgjidhje të problemit

të shkallëzimit numerik dhe pas kësaj ndërtoi një model të plotë për trajtimin

hierarkik të renditjes së një bashkësie alternativash në shqyrtim lidhur me një skemë

vendim-marrje të dhënë.

Si bazë për ndërtimin e shkallës numerike të krahasimeve të shprehjeve gjuhësore të

opinioneve, Saaty shfrytëzoi konkluzionet e arritura prej disa eksperimenteve

shkencore në fushën e psikologjisë. Sipas ligjit të formuluar nga Weber(1846) një

ndryshim në objekte fizike të matshëm bëhet i ndjeshëm nëse vlerësimi i përmasave

që i është bërë paraprakisht rritet me një përqindje konstante të vetëvlerësimit. Nga

ana tjetër eksperimentet psikologjike kanë treguar se vetëm një njeri i vetëm nuk

mund të krahasojë dhe të operojë njëherësh me më shumë se 7 2 objekte (Miller

1956) . Për këto arsye Saaty përcaktoi numrin 9 si kufirin e sipërm të shkallës së vet

dhe numrin 1 si ndryshesë konstante ndërmjet hapave të njëpasnjëshëm në atë

shkallë.

Në këtë mënyrë pjesa e parë e numrave të shkallës Saaty është 1,2,3,4,5,6,7,8,9.

Pasqyrimi në bashkësinë e numrave bazë të shkallës Saaty i shprehjeve gjuhësore që

përdoren për krahasimin çift e çift të elementëve të çdo niveli të hierarkisë tregohen

në tabelën e mëposhtme:

Përcaktimi gjuhësor Rëndësia

relative

Elementët e krahasuar kanë rëndësi të

njëjtë

1

Rëndësi e dobët e një elementi ndaj tjetrit

3

Rëndësi thelbësore ose e fortë 5

Rëndësi e demonstruar 7

Rëndësi absolute 9

Vlera të ndërmjetme 2,4,6,8

Reciprokët e vlerave 2,3,4,5,6,7,8,9

ku vlen formula

1/2,1/3,1/4,1/5,

1/6,1/7,1/8,1/9

Tabela 4.1 Shkalla Saaty

Objekti i proçesit të analizës hierarkike është përcaktimi prej vendim-marrësit i një

renditjeje sa më të saktë të rëndësive thelbësore të alternativave . Një renditje e tillë

kërkon nje analizë të mënyrës sesi akumulohen masat e pjesshme të rëndësisë së

alternativave siaps kritereve të ndryshme në një tregues përmbledhës final. Është e

kuptueshme se në këndvështrimin e çdo kriteri alternativat kanë pesha të ndryshme

përkatëse me natyrën e kriterit. Këto të fundit quhen pesha lokale, të cilat caktohen

74

për elementet e nënbashkësive të hierarkisë të cilët varen nga një element i vetëm i

nivelit direkt më të lartë sipas vetë përmbajtjes së kriterit.

4.3 Aksiomatika e AHP

Principi i dekompozimit aplikohet nga strukturimi i një problemi të thjeshtë me

elemente në nivele që janë të pavarur nga ata të nivelit të pasuar, duke lëvizur nga

fokusi tek niveli në majë. Kriteret në fokus janë të niveleve të dyta, të treta e kështu

me radhë. Saaty bën një dallim midis dy llojeve të pavarësisë, të cilat ai i quan

strukturore dhe funksionale. Principi i gjykimeve krahasuese aplikohet për të ndërtuar

krahasimet dyshe të rëndësisë relative të elementëve në disa nivele, respektivisht edhe

me kriteret ose vetitë e niveleve të mësipërme. Më pas kemi edhe principin e

sintetizimit të prioriteteve. Tek AHP prioritetet sintetizohen nga niveli i dytë e më

poshtë duke shumëzuar prioritetet lokale me prioritetet e kritereve të tyre

korresponduese të niveleve të poshtme. Kjo i jep një prioritet global atyre elementëve,

që në kthim përdoren për të peshuar prioritet lokale të elementëve të nivelit më

poshtë, krahasuar ndërmjet tyre me atë si kriter, kështu me radhë deri tek niveli më i

fundit. Janë katër aksioma kryesore që dominojnë teorinë e AHP në lidhje me

nocionin e krahasimeve dyshe. [40]

Le të jetë U një bashkësi e fundme n-elementësh që quhen alternativa. Le të jetë C

një bashkësi vetish ose atributesh në lidhje me të cilën elementët e U krahasohen.

Elementëve të C do i referohemi si kritere. Një kriter mund ta quajmë edhe

primitivë. Tek elementët e U do të bëjmë krahasime binare, në akordancë me kriteret

e C . Shënojmë me C një relacion binar në U që përfaqëson “ më të preferuarin e”

në lidhje me kriteret c C . Le të jetë C një relacion binar “indiferent me” një kriter

c C . Keshtu për çdo dy elementë të dhënë ,i jA A A ku i C jA A ose

j C iA A

ose i C jA A , c C . Përdorim i C jA A për të treguar më shumë të preferuarin

ose indiferentin. Një familje binare relacionesh C në lidhje me kriterin c C është

një primitivë. Le të jetë një bashkësi pasqyrimesh të :UxU R dhe

:f C , ( )CP f c për c C ,CP cakton një numër real pozitiv për çdo çift

( , )i jA A UxU .

Në qoftë së kemi ( , )C i j ijP A A a R , ,i jA A U , për çdo c C , treshja

( , , )CUxU R P është një shkallë themelore ose primitive. Një shkallë themelore është

një pasqyrim i objekteve në një sistem numerik.

75

Përkufizim : Për ,i jA A U dhe c C

i C jA A ë ( , ) 1C i jP A A

i C jA A ë ( , ) 1C i jP A A

Nëse i C jA A , themi se iA dominon

jA në lidhje me c C . CP përfaqëson

intensitetin ose fortësinë e preferencave për një alternativë mbi të tjerat.

Aksioma 1 ( Aksioma e reciprocitetit)

Për ,i jA A U dhe c C kemi që :

1

( , )( , )

C i j

C j i

P A AP A A

Kjo aksiomë thotë se matricat e krahasimeve që kemi ndërtuar , janë formuar nga

çiftet e krahasimeve reciproke. P.sh nëse një gur gjykohet se është pesë herë më i

rëndë sesa një tjetër, atëherë tjetri është një e pesta herë më i rëndë sesa i pari. Është

pikërisht kjo relatë e thjeshtë por e fuqishme në bazë të AHP.

Le të jetë ( ) ( ( , ))ij C i jA a P A A bashkësia e krahasimeve dyshe të alternativave në

lidhje respektive me kriteret c C . Nga përkufizimi i CP dhe Aksioma 1, A është

matricë pozitive reciproke. Objektivi është të përftojmë një shkallë dominance

relative të alternativave nga krahasimet dyshe të dhëna në matricën A.

Do të tregojmë si do të përcaktohet dominanca relative të bashkësisë së alternativave

nga matrica A e krahasimeve dy e nga dy. Le të jetë ( )M nR bashkësia e matricave

reciproke pozitive ( ) ( ( , ))ij C i jA a P A A , c C dhe [0,1]n prodhimi kartezian n-

fish i segmentit [0,1] , ( ): [0,1]n

M nW R për ( )M nA R . ( )W A është një vektor n-

dimensional komponentët e të cilit janë në intervalin [0,1] . Treshja ( )( ,[0,1] , )n

M nR W

përfaqëso një pasqyrim midis dy sistemeve numerikë relativ.

Një aspekt i rëndësishëm i AHP është ideja e konsistencës. Nëse një atribut ka një

shkallë për një veti që zotëron nga disa objekte dhe e mat këtë veti në to, atëherë

peshat e tyre relative në lidhje me atë veti janë fikse. Në këtë rast nuk ka më

mospërputhje gjykimesh ( megjithëse në qoftë se njëri ka një shkallë fizike dhe e

aplikon atë në objektet dy e nga dy atëherë derivon qëndrimin relativ të objekteve në

shkallën nga matrica e krahasimeve dy e nga dy). Por duke krahasuar respektivisht

një veti për të cilën nuk ka shkallë të qëndrueshme ose masë, do të mundohemi të

derivojmë një shkallë përmes krahasimit të objekteve dy e nga dy. Përderisa objektet

76

mund të përfshihen në më shumë se një krahasim por nuk kemi një shkallë standarte,

ndaj caktojmë vlera relative si një mjet gjykimi. Konsistenca e AHP është përkufizuar

në mënyrën e mëposhtme.

Përkufizim : Pasqyrimi CP do të jetë konsistent nëse:

( , ) ( , ) ( , )C i j C j k C i kP A A P A A P A A . .i j k

Në mënyrë të ngjashme matrica A do të ishte konsistente nëse ij jk ika a a , . .i j k .

Do të shohim aksiomat hierarkike 2-4 dhe përkufizimet përkatëse.

Në një bashkësi pjesërisht të renditur, përkufizojmë x y në kuptimin që x y dhe

x y , thuhet se y mbulon x ose dominon x. Nëse x y atëherë x t y është e

mundur për një numër t. Le të shënojmë dhe

, për elementet x të bashkësisë së renditur.

Le të jetë H një bashkësi pjesërisht e renditur, atëherë H është një hierarki nëse

plotëson kushtet e mëposhtme:

(a) Gjendet një ndarje e H në dy bashkësi kL , 1,...,k h për disa h ku 1L b , b

është një element i vetëm.

(b) kx L

(c) kx L

Nocioni i shkallëve themelore dhe të derivuara mund të zgjerohet ne kx L dhe

1kx L

duke zëvendësuar C me A respektivisht. Shkalla e rezultuar nga krahasimi i

elementëve në x në lidhje me x, quhet një shkallë lokale e derivuar ose një prioritet

lokal i elementëve në x .

Përkufizim : Për një numër pozitiv real të dhënë 1p , një bashkësi jo boshe

1kx L

është p-homogjene në lidhje me kx L nëse për çdo çift elementësh kemi

se 1 2

1( , )cP y y p

p . Zakonisht aksioma reciproke implikon që ( , ) 1c i iP y y .

Aksioma 2. (Aksioma e homogjenitetit)

Për një hierarki H të dhënë, x H dhe kx L , 1kx L

, është p-homogjene për

. Homogjeniteti është themelor për të gjithë krahasimet, pasi mendja

nuk mund të krahasojë elementët gjerësisht të pangjashëm. Kur pabarazia është e

77

madhe, elementët duhet të vendosen në klastera të ndarë me madhësi të

krahasueshme.

Për kL , 1kL H , do të shënojmë shkallën lokale të derivuar me

1( / ) 1k y x ,

2,3,... 1k h . Duke marr në konsideratë matricën 1 1( / )k k kL L

, kolonat e së cilës

janë shkallë lokale të përftuara nga elementët në kL respektivisht me elementët e 1kL

Përkufizim: Një bashkësi A thuhet se është e varur së jashtmi në një bashkësi C, nëse

një shkallë themelore mund të përcaktohet në A respektivisht me çdo c C .

Proçesi i lidhjeve të elementëve (p.sh alternativa) me një nivel të hierarkisë sipas

elementëve të nivelit tjetër më sipër ( p.sh kriteret), shpreh varësinë ( që është varësia

së jashtmi) e elementëve më poshtë deri tek më lartë, ku krahasimet të mund të jenë të

ndryshme ndërmjet tyre. Hapat përsëriten deri në të gjitha nivelet. Elementet e një

niveli mund të varen edhe ndërmjet tyre, në lidhje me një veti që ndodhet në një nivel

tjetër.

Aksioma 3.( Aksioma e varësisë)

Le të jetë H një hierarki me nivele 1 2, ,..., hL L L , për çdo kL , 1,2,3,... 1k h .

a) 1kL është e varur së jashtmi në kL .

b) 1kL nuk është e varur së brendshmi respektivisht me gjithe kx L .

c) kL nuk është e varur së jashtmi ne 1kL .

Aksioma 4. (Aksioma e pritjeve)

hC H L , hA L

Kjo aksiomë është thjeshtësisht deklarata që i fut në mendime njerëzit të cilët kanë

arsye në besimet e tyre, duhet të sigurohemi se idetë e tyre janë përfaqësuar në

mënyrë adekuate në model. Gjithë alternativat, kriteret dhe pritjet duhet të jenë të

përfaqësuara në hierarkinë. Kjo aksiomë nuk supozon racionalitetin. Bazuar në

konceptin e aksiomes 3, mund të zhvillojmë një funksion peshë. Për secilin x H ,

gjendet një funksion i peshuar i përshtashëm ( natyra e të cilit varet nga fenomeni i

strukturimit hierarkik) :

të tillë që .

Vërejmë se është niveli i fundit për të cilin është jo-bosh. Bashkësitë iL

janë nivelet e hierarkisë dhe funksioni është funksioni prioritar i elementëve në

një nivel në lidhje me objektivin x. Vërejmë se edhe nëse ( për disa nivele

78

mund të përcaktohet për të gjithë , duke i vendosur të barabarta me zero

për të gjithë elementët në jo në x. Funksioni i peshës është një nga kontributet më

domethënëse në aplikimin e teorisë hierarkike.

Përkufizim: Një hierarki është e aplikuar nëse kx L , 1kx L

.

Lind një pyetje qëndrore :

Problemi bazë. Për një element të dhënë kx L dhe një nënbashkësi S L ( )

si do të përkufizojmë një funksion , : [0,1]x Sw S , i cili pasqyron vetite e

funksioneve prioritare në nivelet , .

Specifikisht , çfarë është funksioni , : [0,1]

kb L kw L ?

Pra më ndryshe le të themi se: Për një sistem social të dhënë me një objektiv major b

dhe bashkësia kL e aktiviteteve bazë, të tilla që sistemi mund të modelohet si një

hierarki me elemente nga b deri tek niveli më i ulët kL . Cilat janë prioritetet e

elementëve të ndonjë niveli dhe në veçanti ato të kL në lidhje me b?

Le të tregojmë një metodë për të zgjidhur problemin bazë. Supozojmë se

1,...., km kY y y L dhe 11 1,....,

km kX x x L . Mund të supozojmë se 1kX L

dhe se gjendet një element kz L i tillë që . Marrim në konsideratë

funksionin probabilitar:

dhe

dhe ndërtojmë funksionin prioritar të elementëve në X në lidhje me z, duke e shënuar

me : 0,1w X me anë të formulës :

Duket se kjo nuk është më shumë sesa një proçes i peshimit të influencës së

elementëve në prioritet të , duke shumëzuar atë me rëndësinë e në lidhje me

z. Mund të thjeshtojmë zgjidhjen duke kombinuar brenda në një matricë B

duke vendosur . Zëvendësojmë bashkësitë dhe

atëherë formula e mësipërme shkruhet :

.

79

Pra kemi vektorin prioritar w dhe në të vërtetë një matricë prioritare B të nivelit

(k+1)-të, që formulën finale :

Teoremë : Le të jetë H një hierarki e kompletuar, me elemente me gjerësi b dhe nivele

h. Shënojmë kB matricën prioritare të nivelit të k-të, . Nëse është

vektori prioritar i nivelit të p-të respektivisht me disa elemente z të nivelit (p-1)-të,

atëherë vektori prioritar w i nivelit të q-të, ( )p q respektivisht me z jepet nga

Vektori prioritar i nivelit më të ulët respektivisht me elementin b jepet nga:

ku 1L ka vetëm një element të vetëm Vërejmë se proçesi i krahasimeve dy e

nga dy merr në konsideratë jo-linearitetin. Këto jo-linearitete kapen nga kompozimi i

proçesit të peshimeve. Zakonisht alternativat varen nga kriteret dhe kriteret në

alternativa ku gjendet një cikël që i bashkon të dyja këto, i cili më saktësisht studiohet

me përgjasime të rrjetave.

Një rrjetë është një bashkësi kulmesh (secili nga ata ka një bashkësi elementësh) dhe

një bashkësi harqesh, që tregojnë rregullin e bashkëveprimit përgjatë komponenteve.

Prioritetet e elementëve në çdo kulm janë komponente të vektorit të vetë të matricës

së krahasimeve dy e nga dy, të impaktit relativ të këtyre elemenetëve. Bashkëveprimi

jepet me anë të një harku të rrjetës. Të gjithë këta vektor të vetë përkufizojnë një

matricë globale të prioriteteve me impakt. Formalisht kemi këtë përkufizim:

Përkufizim: Një bashkësi pjesërisht e renditur S është një sistem rrjetor nëse

a) Gjendet një ndarje e S në bashkësitë

b) Gjendet një renditje në , e tillë që implikon që ose

ose është në për ndonjë ose të dy , .

c) Për çdo , gjendet një funksion i peshuar i përshtatshëm

i tillë që dhe për

gjendet një funksion pesh ku

80

4.4 Matrica e krahasimeve

Alternativat në përgjithësi nuk janë të matshme, por edhe kur ato janë të matshme

mund të mos kenë ekuivalentë në një njësi të përbashkët matjeje. E njëjta vërejtje

vlen edhe për kriteret dhe nënkriteret. Pra ështe praktikisht e pamundur që të

përcaktohen peshat e këtyre elementëve të skemës së hierarkisë, pasi ajo që vendim-

marrësi ka mundësi të bëjë është të krahasojë çift e çift elementët e alternativave ose

të bashkësive të nënkritereve e kritereve sipas ndonjë shkallëzimi numerik. Nëse

bashkësia në shqyrtim ka n elemente, atëherë do të bëhen n2 krahasime çift e çift të

elementëve të saj. Rezultatet e krahasimeve të shprehura numerikisht mund të

sistemohen në trajtën e një matrice katrore A, ku nga shkalla Saaty matrica ka veçori:

A quhet maricë e krahasimeve, ku elementët e diagonales kryesore janë njësha.

Le të marrim parasysh një kriter të caktuar dhe bashkësinë prej n alternativash në një

problem vendim-marrje me të dhëna të përcaktuara. Nga këndvështrimi i atij kriteri

çdo alternativë e ka një peshë lokale por tani ato pesha janë të panjohura. Le t’i

shënojmë peshat përkatësisht me , ku në funksion të këtyre peshave

sidoqë të jenë të panjohura, rëndësia relative e një alternative “i” ndaj një tjetre “j”

jepet nga raporti

. Kështu matrica e krahasimit merr trajtën:

1 1

2

2 2

1

1 2

1 ....

1 ....

.... ..... ..... .....

.... 1

n

n

n n

A

Shohim se në matricën A të gjithë rreshtat e saj janë të përpjesshëm me rreshtin e

parë. Vërtet po të shumëzojmë elementët e rreshtit të parë me 1

i

përftohen me radhë

të gjithë rreshtat e tjerë. Zgjedhim në rreshtin “k” elementin akk dhe një element tjetër

çfarëdo akj , në një rresht tjetër “i” marrim korresponduesit e tyre sipas shtyllave, pra

jemi duke shqyrtuar katërshen e elementëve , , ,kk kj ik ija a a a . Nga vetia e

pjesëtueshmërisë së rreshtave të matricës A mund të shkuhet barazimi:

81

kjkk

ik ij

aa

a a dhe meqë kka =1 atëherë kemi

ij ik kja a a

Pra në mënyrë të përmbledhur matrica A ka këto veti:

iia =1 , i=1,2,3,…n

i,j=1,….,.n

ij ik kja a a i,j,k=1,…..n

Çdo matricë që gëzon këto veti do të quhet konsistente.

Vektorët e vetë

Nëse ija përfaqëson rëndësinë e alternativës i ndaj alternativës j,

jka përfaqëson

rëndësinë e alternativës j ndaj alternativës k, atëherë ika tregon rëndësinë e

alternativës i ndaj asaj k, duhet barazuar ij jka a për vlerësimet që të jenë konsistente.

Nëse nuk kemi një shkallë të caktuar, nuk mund të japim vlera fikse të

por vetëm

një vlerësim. Problemi ynë kalon në

ku

është vlera e vetë

principale e vlerat pas krahasimit të me

. Për të

thjeshtësuar shënimet do të përdorim

. Zgjidhja më tej përftohet nga

rritja e matricës, më pas shumimi sipas rreshtave dhe normalizimi i vektorit prioritar

të peshave 1( ,...., )nw w w . Proçesi ndalon kur diferenca midis komponenteve të

vektorit prioritar është më e vogël se disa vlera të paracaktuara. Një rrugë e thjeshtë

për të përafruar prioritet është normalizimi i mesatares gjeometrike të rreshtave. Një

tjetër rrugë për të përftuar një përafrim është normalizimi i mesatares së elementëve

të secilës kolonë të matricës krahasuese .

Nga matrica A dihet se të llogaritet vlera e vetë kryesore max si rrënjë e polinomit

karakteristik të kësaj matrice , është e vështirë. Për të hapur një rrugë më të lehtë

Saaty ndjek një drejtim të kundërt, ai realizon një vlerësim të vektorit dhe mbi këtë

bazë kryen më thjesht përllogaritjen e max . Sipas tij vektori me komponent të

mesmet gjeometrike të elementëve të çdo rreshti është:

1 2. .......ni i i ina a a

82

dhe përcaktohet si një vektor i vetë i nënhapësirës vektoriale të përcaktuar nga max .

Për arsye të linearitetit të nënhapësirës së përcaktuar nga autovlerat, edhe i normuari i

vektorit , që po e shënojmë me , mbetet një vektor i vetë korrespondues i max .

Komponentet e janë:

Pikërisht këto komponente janë vlerësime të peshave lokale të elementëve në

shqyrtim kur matrica e krahasimeve rezulton me konsistencë të pranueshme. Në

ekuacionin maxA

le të vendosim si koordinata të vektorit vlerat e llogaritura

nga barazimi i mësipërm, atëherë do të kemi:

1 1 2 2 max.....i i in n ia a a

Le të shënojmë me js shumën e elementëve të shtyllës j të matricës A:

Duke ndryshuar indeksin i nga barazimet e mësipërme, koeficintët pranë peshave

1,...., n në anën e majtë do të jenë përkatësisht 1,...., ns s . Nga fakti se shuma e të

gjitha i është 1, rrjedh se shuma e anëve të djathta do të jetë vlera e vetëmax

kryesore. Pra kemi :

max

1

n

j j

j

s

4.5 Qëndrueshmëria Saaty

Vetitë e mësipërme të matricave të krahasimit u bazuan në supozimin se elementët e

atyre matricave janë përcaktuar nga raporti i peshave objektive të alternativave apo

kritereve. Por në praktikë janë ato pesha që vendim-marrësi kërkon të njohë.

Ekspertët nuk mund të përcaktojnë menjëherë peshat i të matricave. Ajo që ata

mund të bëjnë drejtpërdrejt është të vlerësojnë rëndësinë relative ija për çdo çift

alternativash ,i jA A . Pra problemi në praktikë ka kahen e kundërt : në kushtet kur janë

të disponueshme vlerësimet ija të raporteve i

j

të peshave, kërkohet një vlerësim i

83

pranueshëm i komponentëve i të vektorit të peshave . Problemi tjetër është se sa

mirë është vlerësuar vektori i vetë w? Na duhet që matrica A në vetvete të jetë

konsistente ose e qëndrueshme. Nëse matrica nuk është e qëndrueshme na duhet një

mase gabimi për jo qëndrueshmërinë. Del se A është e qëndrueshme nëse max n

dhe se gjithnjë kemi që max n . Kjo sugjeron të përdorim indeksin

max n si një

zhvendosje nga qëndrueshmëria. Por

max

2

n

i

i

n

, max i

ku i , 1,...,i n janë vlerat e veta të A. Për të ecur teknikisht përpara në trajtimin e

këtij problemi Saaty konsideroi si pikë mbështetje Indeksin e konsistencës ose

qëndrueshmërisë IC që përcaktohet nga herësi:

max

1

nIC

n

Ky raport tregon një mesatare të shmangies së vlerave të veta të matricës nga zeroja.

Saaty mori 500 matrica me elementë nga shkalla e tij 1/9,….,9, ku llogariti IC për

secilën matricë dhe u vlerësua mesatarja e tyre. Kjo mesatare quhet RC, indeksi

rastësor i qëndrueshmërisë. Tabela e mëposhtme tregon vlerat e RC për matrica deri

në rendin e dhjetë

Tabela 4.2 Indeksi rastësor i qëndrueshmërisë

Si shprehje sasiore e masës së tolerancës është marrë i ashtuqujturi koefiçient i

qëndrueshmërisë që është :

ICRI

RC

Lind pyetja: Pse të tolerojmë 10% jo konsistencë? Prioriteti i konsistencës për të

përftuar një shpjegim koherent të bashkësisë së fakteve , duhet të ndryshojë në bazë

të jo konsistencës, e cila është një masë gabimi e konsistencës. Pra, në një shkallë nga

0-1, jo konsistenca nuk e tejkalon 0.10 shumë. Ky kufizim nuk duhet të bëhet më i

vogël se 1% ose 0.1%. Arsyeja ështe se jo konsistenca në vetvete është e

rëndësishme, ku pa atë njohuritë e reja të cilat ndryshojnë rendin e preferencave nuk

mund të pranohen. Kështu objektivi i zhvillimit të një konsistence të spektrit të gjerë

varet nga pranimi i jo konsistencës. Kjo kërkon që numri i elementëve të krahasuar të

N 1 2 3 4 5 6 7 8 9 10

RC(n) 0 0 0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49

84

jetë i vogël, pasi po qe numër i madh atëherë prioritet relative të elementëve do të

jenë të vogla saqë gabimi mund të devijojë prioritetet. Nëse numri i elementëve është

i vogël dhe prioritetet janë të krahasueshme , një gabim i vogël nuk ndikon në lidhje

me përgjigjet përfundimtare. Për të ndodhur kështu duhet që elementët të jenë më të

vegjël se 10, që vlerat e tyre në tërësi të jenë më të mëdha se 10% secili , ku ngelen

me 1% gabim. Konsistenca e gjithë hierarkisë (IC) jepet nga

1

, 1

1 1

i jn

h

h ij i j

j i

C w

ku 1ijw , për 1j dhe është numri i elementëve të nivelit j+1 , në lidhje me

kriterin i, tregon indeksin e konsistencës të nivelit i në lidhje me kriterin j+1.

4.6 Një veti e matricave të qëndrueshme.

Shënojmë nR vektorin me komponente peshat shoqëruese të alternativave të

menduara si më lart. Le të shumëzojmë matricën A nga e djathta me vektorin shtyllë

:

1 1

2

2

1

1 2

1 ....

1 ....

.... ..... ..... .....

.... 1

n

i

n

n n

A

1

2

...

n

=

1

2

...

n

n

n

n

=

1

2

...

n

n

Barazimi i gjetur tregon se n është një zgjidhje e ekuacionit: A .

Nga fakti që rreshtat e matricës A janë të përpjesshme mund të shohim lehtë se

minorët kryesor të saj kanë këto vlera: 11 221, 0,...., 0nnM M M . Pra matrica A

është gjysëm e përcaktuar pozitivisht.

4.7 Përcaktimi i peshave globale

Qëllimi final i vendim-marrësit është që të arrijë në një vlerësim të peshave globale të

alternativave që në fakt janë tregues sintetizues të të gjitha niveleve e gjykimeve që

përmban skema hierarkike e çdo problemi konkret. Për të paraqitur edhe këtë hap të

AHP, vendim-marrësi i bazon gjykimet në kriteret që ka zgjedhur, por vetë ato kritere

nuk kanë të njëjtën rëndësi. Këto vlerësime janë po ashtu në shkallë lokale edhe për

këtë arsye kryen me po atë proçedurë që u përdor për peshat lokale të alternativave

85

lidhur me kritere të ndryshme. Pesha globale e një alternative përmbledh peshat e saj

sipas kritereve në përpjesëtim me peshën që ka vetë kriteri në vendim-marrje. [20]

Numerikisht pesha globale e një alternative të caktuar merret si shumatore e

prodhimeve të peshave, që ajo ka sipas çdo kriteri të veçantë të shumëzuar me peshën

e vetë të kriterit. Shënojmë 1 2 3 4, , , vektorët shtyllë të peshave të alternativave

sipas kritereve në shqyrtim. Me këta vektorë ndëertojmë një matricë B që ka aq

rreshta sa është numri i alternativave dhe shtylla sa numri i kritereve. Shënojmë ij

komponenten e i-te të vektorit j , j=1,2,34 dhe ( )j K komponenten e j-të të

vektorit të normuar të peshave të kritereve ( )K . Shënojmë me * vektorin e

peshave globale, që është:

4*

1

( )i ij j

j

K

Mbi këtë bazë mund të përdorim shumëzimin e matricës B me shtyllën ( )K

rezultati i të cilit është *

* ( )B K

11 12 13 14

21 22 23 24

31 32 33 34

41 42 43 44

11

2

2

3

34

( )

( )

( )

( )

K

K

K

K

Në qoftë se skema hierarkike përmban 4 nivele , bashkë me nivelin zero të

alternativave, atëherë peshat globale gjenden hap pas hapi . për secilin kriter të nivelit

të dytë përcaktojmë vektorin e peshave globale si më sipër. Më pas këto pesha

globale të përkohshme shihen si pesha lokale të alternativave lidhur me kriteret.

Prodhimi i matricës B me vektorin shtyllë të peshave përcakton prodhimin

përfundimtar të peshave globale që vendim-marrësi u atribuon alternativave.

4.8 Strukturimi i informacionit. Matjet absolute dhe relative.

Në përgjithësi ne njohim dy lloje krahasimesh absolute dhe relative. Në krahasimet

absolute alternativat krahasohen me një standart të dikujt që ka në memorie nga

eksperienca e tij, në krahasimet relative alternativat krahasohen në çift lidhur me një

atribut të përbashkët.[18] Metoda AHP është përdorur me të dy llojet e krahasimeve

për të derivuar shkallët racionale të matjeve. Këto shkallë i quajmë shkallë matje

absolute dhe relative. Matja relative në AHP është e mirë zhvilluar , zgjedhja eksperte

përfshin këtë metodë matjeje duke i quajtur “raporte”. Matjet absolute aplikohet për

86

të renditur alternativat në lidhje me kriteret ose ndryshe në terma të raporteve të

kritereve.

Duke përdorur matjet absolute , nuk ka rëndësi sa shumë alternativa të reja futen, ose

të vjetra fshihen, renditja e alternativave nuk ndryshon. Ideja është përdorur për të

renditur qytetet në SH.B.A , në lidhje me nëntë kritere të gjykuara nga 6 njerëz. Një

shembull tjetër i përdorimit të matjeve absolute është ai i shkollave që pranojnë

studentë. [28]

Shumë shkolla vendosin kriteret e tyre për të pranuar studentë në mënyrë të pavarur,

prioritetet e tyre përdoren më pas për të caktuar kur një student arrin një bashkësi

standartesh për një kualifikim. Në këtë rast matjet absolute përdoren për të caktuar

cili student kualifikohet për pranim. Por kjo masë absolute kërkon edhe standarte,

zakonisht vendoset nga shoqëria për thjeshtësi të saj dhe në problemet e reja të

vendimit , ose në të vjetrat ku nuk ka standarte të fiksuara, ne duhet të vazhdojmë të

përdorim matjet relative duke krahasuar alternativat për të gjetur më të mirën. Pyetja

tani është : “Ҫfarë ndodh me renditjen kur përdorim masat relative dhe kur

alternativat shtohen ose fshihen?”

Kur matjet relative përdoren për shembull për të blerë një makinë, edhe kur prioritetet

e kritereve janë vendosur pavarësisht alternativave, makina që kualifikohet në fund

varet nga numri i makinave të ekzaminuara. Duke shtuar një makinë të re në

koleksion, nga ekzaminimi mund të ndryshohet renditja e makinave origjinale. Ky

fenomen mund të llogaritet duke konsideruar operacionin e normalizimit si një kriter

strukturimi , që ka të bëjë me informacion në proçesin e matjeve. Me matjet relative

prioriteti në të cilin ndryshon ky kriter , kur alternativat e reja shtoheshin ose kur ato

të vjetra fshiheshin, atëherë një tjetër renditje mund të përshkojë alternativat e vjetra.

Analogjia mund të bëhet me modelet matematikë të programimit linear , kur shtohet

një variabël i ri. Nuk është nevoja për një relacion midis zgjidhjeve të reja të

problemit me ato të vjetra.[14]

Megjithatë renditja finale mund të ndryshojë edhe kur gjykimet janë konsistente , kur

një alternativë dominon mbi një kriter , por dominohet nga ai nën një tjetër. Le të

marrim një shembull për të ilustruar situatën në strukturimin e kritereve.

Shembull. Për një vendim-marrje në lidhje me investimet le të përdorim vetëm dy

kritere KTHIM dhe RISK I VOGËL, për të përcaktuar se kur është më mirë të

investohet. Le të supozojmë se ata janë njëlloj të rëndësishëm, pra me prioritete 0.5

dhe 0.5. Së pari marrim dy alternativa, lidhja e taksave pa pagesë (A) dhe letra me

vlerë (B), i krahasojmë ato së bashku sipas preferencave së pari të preferencës

KTHIM dhe më pas atë RISK I VOGËL, duke marr edhe peshat e këtyre

kompozimeve.

87

Renditja finale është:

: 0.5 0.75 0.5 0.33 0.54A : 0.5 0.25 0.5 0.67 0.46B

A është më e preferuar se B. Duke vëzhguar proiritetet e alternativave nën secilin

kriter, mund të rishkruajmë operacionet e mësipërme aritmetike për të treguar se

normalizimi aplikohet për të rishkallëzuar prioritetet e kritereve dhe përdor ato për të

peshuar prioritetet e alternativave para se ato të normalizoheshin. Kështu po të

shkruajmë 0.75=3/4, 0.25=1/4, 0.33 = 1/3, 0.67=2/3, vërejmë se 4 është faktori i

normalizimit për KTHIM-in dhe 3 është faktori i normalizimit për RISK I VOGEL ,

nga më sipër mund të shkruajmë:

Me fjalë të tjera, normalizimi mund të konsiderohet si një operacion që transformon

peshat e kritereve nga shkalla origjinale (0.5,0.5) në shkallën e re (0.5/4, 0.5/3) që

kur normalizohen bëhen

të cilat janë prioritetet e rishkallëzuara të kritereve. Pra, masa relative mund të

konsiderohet si një operacion që fut gjithmonë një kriter të ri që operon me kriterin

ekzistues duke modifikuar prioritetet e tyre. Këtë gjë e quajtëm kriteri

strukturor.Është e njohur në teorinë e vendim-marrjes që ndryshimi i renditjes mund

të ndodh kur një kriter i ri futet dhe ku kemi hasur një lloj të ri kriteri themelor që

është gjithmonë prezent kur performojmë masat relative. Le të shohim sesi ndodh

ndryshimi i renditjes duke futur alternativat e reja LLOGARI KURSIMI (C), me

rezultatet e krahasimeve dyshe të treguara më poshtë:

KTHIM A B C Prioriteti

A

B

C

1 3 1/2 0.30

1/3 1 1/6 0.10

2 6 1 0.60

KTHIM A B Prioriteti

A

B

1 3 0.75

1/3 1 0.25

RISK I VOGËL A B Prioriteti

A

B

1 1/2 0.33

2 1 0.67

88

RISK I VOGEL A B C Prioriteti

A

B

C

1 1/2 4 0.31

2 1 8 0.08

1/4 1/8 1 0.62

Si më sipër do të kemi :

Prezenca e alternativës C ka shkaktuar ndryshim renditje midis A dhe B, ku B del më

e preferuar se C, e cila është më e preferuar se A. Në këtë rast do të injorojmë

renditjen e parë dhe do të marrim të dytën. Vërejmë se ky proçes i ndryshimit të

renditjes nuk është kontradiktor me ndonjë fakt ekzistues, ku nuk kemi precedent

historik në teorinë shumë kriterëshe të mirë-zhvilluar, për ta kontrolluar atë sërish.

Në teorinë e masave relative, AHP kërkon që elementët të jenë homogjenë për tu

krahasuar me njëri-tjetrin. Në një punim të papublikuar të Th.Saaty , sigurohet një

principël në lidhje me renditjen dhe ndryshimin.“Ka pasiguri të madhe rreth renditjes

optimale me rritjen e përqindjes së ndryshimit të informacionit”

Le të japim një shembull konkret të zbatimit të teorisë AHP që vetë autori Saaty e ka

përdorur për djalin e tij adoleshent, i cili mbaroi kolegjin me rezultate shumë të larta,

në përzgjedhjen e një universiteti për studimet e larta. Përdorim metodën AHP për të

bërë një përzgjedhje.Ai ishte përzgjedhur nga universitetet Svarthmore, Northvestern,

Miçigan Vanderbilt dhe Mellon. Meqë kostoja e studimeve të secilit ishte pothuajse e

njëjtë, ajo nuk u përfshi si një kriter në hierarki.

Qëllimi

Kritere Vendndodhja Reputacioni Akademikët Ambjenti

Alternativa Svarthmore Northvestern Miçigan Vanderbilt Mellon

Figura 4.2 Hierarkia e universiteteve

Universiteti më i mirë

89

Në Northvestern ai zgjodhi një dhomë fjetjeje përballë liqenit Miçigan, duke

kombinuar një palë pushime 4-vjeçare bashkë me studimet e tij.

U morën në kosideratë 4 kritere themelore : Vendndodhja –perceptohet që shkolla të

jetë sa më larg shtëpisë, Reputacioni – tregon renditjen që ka universiteti ,

Akademikët –tregojnë përqëndrimin e personalizuar klasat e vogla kundrejt atyre të

mëdha, Ambjenti- sa mirë ndihet një student në atë universitet. Hierarkia e mësipërme

e tregon këtë situatë. Djali kishte një temperament artistik, shkrim kaligrafik në

pozicion të përkulur dhe me këtë natyrë ai zgjodhi universitetin Northvestern pasi

reputacioni dhe akademikët e tij janë pak më pak të preferuar sesa ai Svarthmore.

Për një çift elementësh ( , )i j të një niveli të hierarkisë i krahasojmë respektivisht me

elementët e një niveli poshtë tyre, në lidhje me një kriter, i përdorur për të gjykuar

cila ka më shumë rëndësi. Një pyetje tipike për të vendosur një element në matricën e

krahasimeve është: kur të marrim në konsideratë dy elemente në pozicionin i dhe j,

cili e plotëson më shumë kriterin, ose cili konsiderohet më i rëndësishëm për atë

kriter? [16]

Kjo pyetje në lidhje me krahasimet influencon në gjykimet e bëra. Duhet të jetë e

qartë që në fillim se cili është qëllimi i hierarkisë dhe si kombinohen elementët e

nivelit të dytë me të tretë. Matrica e krahasimeve e kritereve në lidhje me qëllimin

është :

Vendndodhja Reputacioni Akademikët Ambjenti

Vendndodhja 1 1/5 1/5 1/7

Reputacioni 5 1 1 1/2

Akademikët 5 1 1 1/3

Ambjenti 7 2 3 1

Pyetja është : Sa më shumë preferohet Vendndodhja në krahasim me Ambjentin?

Ambjenti preferohet në fakt 7 herë më shumë sesa Vendndodhja. Vlera reciproke 1/7

shënohet në pozicionin (1,4). Kështu vlera 7 vendoset në pozicionin (4,1)

automatikisht. Nga përkufizimi i konsistencës kemi që elementët e saj duhet të

plotësojnë këtë veti: ij jk ika a a . Por kjo matricë nuk është konsitente, pasi për

shembull (Ambjenti, Reputacioni)=2 kurse (Reputacioni, Akademikët)=1, atëherë

(Ambjenti, Reputacioni)x(Reputacioni, Akademikët)=2 ndërsa vlera (Ambjenti,

Akademikët)=3.

Pra kjo vlerë është më e madhe se 2 për të qenë konsistente. Por kemi futur vlerën 1/3

në pozicionin (4,2) e cila është . Rëndësia e këtij vëzhgimi është se kur

një vlerë tejkalon vlerën korresponduese konsistente, reciprokja e saj është më e

vogël se reciprokja e vlerës konsistente, pra ka një tendencë kompensimi. [24] Në

qoftë se një matricë e rendit n është konsistente, vlera e vetë kryesore ka vlerën n. Kur

90

është jo konsistente vlera e vetë kryesore tejkalon n dhe ky kalim shërben si një masë

e jo konsistencës, me anë të një raporti që është indeksi i konsistencës. Hapi tjetër

është llogaritja e peshave, duke gjetur vektorin e vetë të matricës dhe duke e

normalizuar atë. Kjo quhet shkalla lokale para peshimit sipas prioriteteve të kritereve

të mëparshme. Pas peshimit quhet vlera globale e shkallëzuar.

Përftojmë vektorin me këto pesha relative:

(Vendndodhja, Reputacioni, Akademikët, Ambjenti) = (0.053, 0.238, 0.213, 0.491)

me një shkallë të jo konsistencës 0.02 . Hapi tjetër është vendosja e matricave të

krahasimit për universitetet e nivelit 3 krahasuar me kriteret e nivelit 2.

Janë katër matrica të tilla ku secili nga universitetet krahasohet me kriteret. Të pestë

universitetet në lidhje me vendndodhjen kanë këtë tabelë krahasimi:

Venndodhja Svarth North Miçig Vander Mell

Svarth 1 ¼ 1/3 1/3 7 0.115

North 4 1 2 3 7 0.402

Miç 3 ½ 1 3 6 0.283

Vander 3 1/3 1/3 1 4 0.163

Mell 1/7 1/7 1/6 ¼ 1 0.037

Tabela 4.3 Universitetet në varësi të kriterit vendndodhje

Si më sipër kemi këto vlera për këtë matricë:

(1) ( Svarth, North, Miç, Vander, Mell)=(0.115, 0.402, 0.283, 0.163, 0.037)

Për kriteret e tjera (2) Reputacioni , (3) Akademikët dhe (4) Ambjentet kanë këto

vlera :




91

Shënoj B matricën e përbërë nga peshat lokale të kritereve dhe vektorin e peshave

globale të firmave . Shënoj ,

Kjo i jep një prioritet final me vlerë o.387 për universitetin Northvestern, si një

shkollë më e preferuar se Svarthermore me prioritet 0.270.

4.9 Klasifikimi i firmave pjesëmarrëse në një tender. (Zbatim)

Le të shohim rastin e klasifikimit të katër firmave në një tender. Pasi kemi mbledhur

të dhëna për ato, F1: Zbogo, F2: Teuta konstruksion, F3: Kontakt shpk, F4: The best

Construction, kemi vlerësuar në bazë të 5 kritereve kryesore , K1, K2, K3, K4, K5 ,

firmën që është më e përshtatshme për projektin tonë. [34]

Firma

Kritere

F1

Zbogo F2 Teuta

konstruksion

F3 Kontakt shpk

F4 The best

Construction

K 1

Eksperienca

5 vjet përvojë 10 vjet

përvojë

8 vjet përvojë 3 vjet përvojë

K 2 Kualiteti

i punimeve

Organizim i

mirë

Organizim

mesatar

Organizim i mirë Organizim

mesatar

K 3 Fuqia

punetore

50 punëtorë, 10 specialistë



40 punëtorë,10

specialistë

K 4 Pajisjet e

punës

4 betoniera,1 ekskavator



3 betoniera ,2 ekskavator

K 5 Ngarkesa aktuale e

punës

1 projekt i madh në

përfundim,2

në proces

2 projekte në përfundim

1 projekt i mesëm i filluar, 2 në

përfundim

2 projekte të vogla,3

projekte në

mbarim

Tabela 4.4 Kriteret e firmave

Kriteret janë : K1 eksperienca, K2 kualiteti i punimeve, K3 fuqia punëtore, K4 pajisjet

e punës, K5 ngarkesa aktuale e punës. Duke u bazuar në shkallëzimin AHP gjejmë

një renditje për këto firma.Të dhënat e grumbulluara për firmat e ndërtimit të

mësipërme , i kemi grumbulluar në tabelën e mësipërme.

Skema hierarkike është:

92

Figura 4.3 Struktura hierarkike e firmave

Matrica e krahasimit për kriteret e mësipërme, duke u nisur nga rëndësia që japin

ekspertët , mbi bazën e shanseve bazë që kanë vlerësuar ata në bazë të tabelës 24

kemi :

Tabela 4.5 Krahasimet e kritereve

dhe vektori i peshave = . Pra kemi

1 3 4 2 4

11 2 4 5

3

1 11 3 2

4 2

1 1 11 2

2 4 3

1 1 1 11

4 5 2 2

A

K1 K2 K3 K4 K5

K1 1 3 4 2 6

K2 1/3 1 2 6 5

K3 ¼ ½ 1 3 2

K4 ½ 1/6 1/3 1 2

K5 1/6 1/5 1/2 ½ 1

93

Llogaritim

ku

Llogaritim shumën e elementëve të shtyllës “j” të matricës dhe kemi :

2.33

Llogaritim tani

Nga tabela standarte për vlerën , ndërsa vlera jonë

5.384

Pra kemi , që tregon se matrica e krahasimit është

konsistente dhe vektori i peshave është vektor i vetë i kësaj matrice.

që në bazë të tabelës 2 , jemi në vlera kufitare të pranueshme.Më pas ndërtohen me

radhë matricat të krahasimit të firmave

sipas secilit prej 5 kritereve. Në çdo rast do të llogaritim vlerën

duke parë për konsistencën apo jo të matricave e më pas do gjejmë ku B

është matrica që ka për shtylla vektorët e peshave lokale. Pikërisht këtu është edhe

renditja jonë e firmave. Në bazë të ekspertëve matrica e krahasimit për kriterin

është si më poshtë:

1

1 11 2

3 2

3 1 3 2

( ) 12 1 2

3

1 1 11

2 2 2

A K

41 1

1 23 2

4 3.1.3.2

41

2. .1.23

41 1 1

. . 12 2 2

94

Llogaritim shumën e elementëve të shtyllës “j” të matricës dhe kemi :

Llogaritim tani


4.138

, që tregon se matrica e krahasimit është

konsistente dhe vektori i peshave është vektor i vetë i kësaj matrice. Për kriterin e

dytë kemi :

2

1 4 3 2

1 1 11

4 4 2( ) 1 1

4 13 3

12 3 1

2

A K

,

, ,


4.17



95

Shohim për kriterin e tretë.

3

11 7 2

3

1 1 11

( ) 7 5 4

3 5 1 4

1 14 1

2 4

A K

,

, ,


4.219



Llogaritim për kriterin e katërt.

4

1 11 2

6 8

16 1 5

( ) 4

8 4 1 9

1 1 11

2 5 9

A K

, ,


4.133

, që tregon se matrica e

krahasimit është konsistente dhe vektori i peshave është vektor i vetë i kësaj

matrice.

96

5

1 11 2

2 4

12 1 5

( ) 3

4 3 1 4

1 1 11

2 5 4

A K

, ,

Shënoj B matricën e përbërë nga peshat lokale të kritereve dhe vektorin e peshave

globale të firmave . Shënoj ,

0.450.168 0.46 0.27 0.068 0.138

0.190.45 0.088 0.054 0.25 0.26

0.1960.23 0.171 0.517 0.62 0.518

0.0940.132 0.275 0.156 0.049 0.07

0.063

B

=

0.214

0.265

0.32

0.15

Ky vektor tregon se preferencat janë në këtë rend : Kontakt shpk, Teuta

konstruksion, Zbogo, The best construction.

Në përdorimin e AHP për të modeluar një problem, na duhet hierarkia e një strukture

rrjetore që përfaqëson problemin vendimmarrës dhe shkalla Saaty për të bërë

krahasimet në këtë strukturë. [25], [27]

4.10 Vlerësimi i faktorëve të riskut për të qenë i sëmurë me anë të AHP.

(Zbatim)

Në ditët e sotme diskutimet më të shumta janë fokusuar në zhvillimet shkencore të

sëmundjeve kanceroze. [32] Pavarësisht kërkimeve të gjata për faktorët që shkaktojnë

këto sëmundje, ata janë gjithmonë të ndryshëm dhe jo të fiksuar. Shkenca ka

konkluduar se numri i faktorëve që shkaktojnë kancer varet nga llojet e kancerit. Për

shembull sëmundjet e hundëve janë shkaktuar nga duhani, puna në ventilim të paktë,

drogat e ndryshme etj. Faktorët më të shumtë janë ekspozimet kimike, historitë

familjare, alkoli, duhani etj. Ky studim është fokusuar në të dhënat e Spitalit të

Tiranës, për të vlerësuar riskun e të paturit kancer bazuar në disa faktorë siç janë

duhanpirja, alkoli, obeziteti, historia familjare. Bashkësia e të dhënave është marr nga

vitet 2010-2015, ku llojet më të ndeshur të kancerit janë : kancer i mushkrisë, kancer i

97

fytit, kancer i gjoksit dhe kancer i prostatës. Do të ndërtojmë strukturën hierarkike ku

vendim-marrësi konsiderohet risku i kancerit, si nivel i parë i strukturës.

Figura 4.4 Struktura hierarkike e sëmundjeve kanceroze

Të dhënat janë marr për n=150 pacientë, ku kemi katër faktorë për person. Kemi

kryer edhe një pyetësor për doktorët e spitalit për të kuptuar ndërtimin e matricës

krahasuese, të bazuar në shanset e këtyre faktorëve kryesor. [1]

Tabela 4.6 Krahasimet dy e nga dy të faktorëve

1 2 4 5

1/ 2 1 2 6( )

1/ 4 1/ 2 1 4

1/ 5 1/ 6 1/ 4 1

A faktoret

Llogaritim vlerën max për këtë matricë:

.

41 1 2 4 5 2.5 4

2

11 2 6 1.56

2

43

1 11 4 0.84

4 2 4

4

1 11 4 0.3

5 6

1,4

5.2i

i

Vektori i normalizuar është:

Faktorët e riskut Duhani Alkoli Obeziteti Histori familjare

Duhani 1 2 4 5

Alkoli ½ 1 2 6

Obeziteti ¼ 172 1 4

Histori familjare 1/5 1/6 ¼ 1

Shuma 1.95 3.66 7.25 16

98

2.5 1.56 0.84 0.3

, , , 0.48,0.3,0.16,0.065.2 5.2 5.2 5.2

max

1,4

0.48 1.95 0.3 3.6 0.16 7.25 0.06 16 4.1i i

i

s

.

Matrica është konsistente pasi max max4.1 4.270 . Ndërtojmë matricën e

krahasimit të llojeve të sëmundjes sipas faktorit duhan.

Tabela 4.7 Krahasimet e sëmundjeve me faktorin duhan.

Faktori Alkol Mushkëri Prostate Gjoksi Fyti

Mushkëri 1 3 7 9

Prostate 1/3 1 5 7

Gjoksi 1/7 1/5 1 3

Fyti 1/9 1/7 1/3 1

Shuma 1.58 4.34 13.33 20

Tabela 4.8 Krahasimet e sëmundjeve me faktorin alkol.

Faktori Obeziteti Mushkëri Prostate Gjoksi Fyti

Mushkëri 1 3 ¼ 2

Prostate 1/3 1 1/7 2

Gjoksi 4 7 1 6

Fyti ½ ½ 1/6 1

Shuma 5.83 11.5 1.4 11

Tabela 4.9 Krahasimet e sëmundjeve me faktorin obeziteti.

Faktori Histori familjare Mushkëri Prostate Gjoksi Fyti

Mushkëri 1 4 6 7

Prostate ¼ 1 3 4

Gjoksi 1/6 1/3 1 2

Fyti 1/7 ¼ ½ 1

Shuma 1.55 5.58 10.5 14

Tabela 4.10 Krahasimet e sëmundjeve me faktorin histori familjare.

Për secilën nga të dhënat në tabela kemi llogaritur vektorët e normalizuar dhe vlerat

përkatëse të max për secilën, duke i pasqyruar në tabelën e mëposhtme:

Faktori Duhan Mushkëri Prostate Gjoksi Fyti

Mushkëri 1 3 1/5 1/9

Prostate 1/3 1 3 1/3

Gjoksi 5 1/3 1 3

Fyti 9 3 1/3 1

Shuma 15.33 7.33 4.53 4.44

99

Tabelat max ( )vektor

Tab 26 3.96 =(0.11,0.16, 0.33, 0.38)

Tab 27 4.26 ( )prostate =(0.58,0.29,0.085, 0.04)

Tab 28 3.8 ( )gjoksi =(0.19, 0.096, 0.63, 0.078)

Tab 29 3.9 ( )fyti =(0.61, 0.22, 0.09, 0.06)

Tab 25 4.1 ( )faktoret =(0.48, 0.3, 0.16, 0.06 )

Tabela 4.11 Peshat lokale për çdo tabelë

0.11 0.58 0.19 0.61

0.16 0.29 0.096 0.22

0.33 0.085 0.63 0.09

0.38 0.04 0.078 0.06

mush pros gji fyt

0.48

0.3

0.16

0.06

faktor

=

0.286

0.185

0.280

0.207

rezultate

1

4

2

3

Renditja

Kjo renditje i jep një prioritet final kancerit të mushkërisë me vlerën 0.285, pastaj

kancerit të gjoksit me vlerën 0.280, kancerit të fytit me vlerën 0.207 dhe në fund

kancerit të prostatës me vlerë 0.185.

Kemi klasifikuar kështu llojet e kancerit, sipas faktorëve të përfshirë në nivelin 2,

duke përdorur metodën e krahasimeve dyshe të AHP. Nga të dhënat e marra në

spitalin QSUT Tiranë, tregohet se kanceri i mushkërisë është më shumë i përhapur tek

individët me riskun më të lartë ndërsa kanceri i prostatës është më pak i përhapuri tek

individët me riskun më të vogël. [26], [23]

100

PËRFUNDIME

Në këtë tezë doktorature u paraqitën probleme të optimizimit në rrjeta si dhe zbatime

të tyre, të aplikuara në softuerin WEKA. Një proçes i rëndësishëm i optimizimit ishte

klasifikimi, duke e paraqitur atë në detaje deri në grupime klasash. Ndër to kemi

kërkuar atribute ose vlera cilësore që “peshojnë” më shumë se vlerat e tjera, për të

klasifikuar këtë sasi të dhënash në formën e një peme vendimi. Klasifikimi i rrjetave

të vendimit u aplikua për një sasi të kufizuar të dhënash, duke ndihmuar kështu

vendim-marrësin për të përzgjedhur një alternativë të caktuar sa më optimale. Janë

marr kriteret cilësore dhe janë shprehur numerikisht, me anë të algoritmeve përkatëse,

pasi kriteret nuk kanë njësi matëse të përbashkëta.

Vështruam se problemet tona të vendimit gjetën zgjidhje të ndërthurura sasiore edhe

cilësore me anë të algoritmave përkatës siç ishin : ID3, CART, C4.5 etj. U paraqit një

krahasim midis ID3 dhe C4.5 në lidhje me ndërtimin e dy pemëve të vendimit për

secilin algoritëm dhe u pa se C4.5 e ndërtonte më shpejt dhe me më pak të dhëna të

njëjtën pemë vendimi me ID3. Në fakt në ndihmë kishim një program që e ka të

implementuar paketën e këtyre algoritmave i cili ishte WEKA Tushar 3.7.12 .

Programi paraqiti klasifikime me përqindje gabimi ose jo, ndërtoi vijën regresive të

lidhjeve ndërmjet cilësive për nga rëndësia. Gjethet e vendimit ishin pikat kyçe nga të

cilat zgjodhëm alternativën më të mirë, ku gjetja e tyre ishte sa e thjeshtë aq edhe e

vështirë. Në studimin e kryer në lidhje me klasifikimin e statusit ekonomik të

familjeve shqiptare u gjet si rrënjë e pemës atributi “madhësia e familjes” me

rëndësinë më të madhe, në nivelin e parë dhe të dytë e më pas atributet e tjera. Pragu i

parë ishte numri i familjareve më i madh ose më i vogël se 4.5; pra bëhej fjalë për

familje me më shumë ose më pak se 4 persona efektivisht. Rezultoi se familjet me më

pak se 4 persona ishin “jo të varfër” sipas kriterit. U ndërtua një pemë ekuivalente me

të binare që optimizonte klasat e vendimit të kësaj peme dhe u vu re se ajo kishte

numër më të vogël gjethesh vendimi. Një zbatim të gjerë gjeti kjo teori në

klasifikimin e faktorëve të sëmundjeve tek njerëzit. Tek studimi i faktorëve për të

qenë obezë u gjet gjithashtu se faktori kryesor ndër ata të studiuar ishte “duhanpirja”

e më pas vinin “aktiviteti fizik” dhe “ushqimi me fruta” në nivelin e dytë. Duke

përmirësuar një hap tek ID3, në fazën e kërkimit të elementëve gjatë fazës ndarëse,

optimizuam një pemë binare në lidhje me gjethet e vendimit ku pema e re doli me një

numër minimal gjethesh vendimi.

Një teori paralele e zhvilluar në fund të shekullit të kaluar ishte edhe Proçesi i

Analizës Hierarkike, nga Thomas Saaty. U paraqitën sërish probleme rrjetore me

vlera cilësore, por në këtë rast u gjet një aksiomatikë që pasqyron krieteret cilësore në

ato sasiore. Duke pasur vendim-marrësin në krye, ndërtuam një hierarki dhe

klasifikuam atributet për nga rëndësia e tyre. Principi i dekompozimit u aplikua nga

101

strukturimi i një problemi të thjeshtë, me elemente në nivele që janë të pavarur nga

ata të nivelit të pasuar, duke lëvizur nga fokusi tek niveli në majë. Përdorimi i kësaj

teorie gjeti vend në shumë problema praktike dhe të limituara në alternativa. U arrit

të renditim për nga rëndësia katër firma pjesëmarrëse në një tender, të cilat kishin

atribute te ndryshme cilësore dhe sasiore, ku u aplikua shkalla Saaty si bazë e

krahasimeve. Proçesi i ndërtimit të hierarkisë i ngjante një rrjete vendimi nga ku

duhej gjetur një pemë vendimi. Po ashtu u arrit të renditeshin edhe faktorët që

ndikonin në një semundje të caktuar, për nga rëndësia e tyre. Pamë se nga të dhënat

kanceri i mushkrive ishte ai më i rëndësishmi me shpërhapje më të madhe ndërsa

kanceri i prostatës ishte më pak i shpërhapuri.

102

LITERATURA

[1] Abdullah L., Taib I., Salleh R. (2009) : Public perceptions of cancer risk using

Analytic Hierarchy Process , Journal of applied sciences, volume 12, nr 9, 2319-2324.

[2] Ahuya R.K., Magnanti T.L. (1993) : Network flows theory, algorithms and

applications.

[3] Al-Alawi MA.(1991) : A computerized model for public projects in Bahrain.

Master thesis, King Fahd University of Petroleum and Minerals, KFUPM, Dhahran,

30-45.

[4] Al-Subhi Al-Harbi K. (2001) : Application of the AHP in project management,

International Journal of Project Management, 19, 19-27.

[5] Alexander, E. R (1970) : "The limits of uncertainty: A note", Theory and Decision

6:363-370.

[6] Arora S. and Barak B. (2009): Computational Modern Approach, Cambridge

University Press, 13, 60-113.

[7] Ankur Sh., Vijai Ch. (2012): Comparison betwën ID3 and C4.5 in contrast to

IDS Surbhi Hardikar, VSRD-IJCSIT, Vol 2, 659-667.

[8] Bellacicco A, Labella A (1979): Le strutture matematiche dei dati, Feltrineli

Edittore Italiano , 124-200.

[9] Belton V. (1990) : Multiple Criteria Decision Analysis- practically the only way

to choose. Operational research tutorial papers , 53-102.

[10] Belton V., Gear T. (1985) : The legitimacy of rank reversal- a comment. Omega

13. 143-144.

[11] Chapman C.B, Cooper D.F. (1983) : Risk Analysis, Testing Some Prejudices.

European Journal of Operational Research 14, 238-247.

[12] Cook S.A. (1972) : A hierarchy for nondeterministic time complexity. ACM

symposium on the theory of computing , 187-192.

[13] Dyer JS. (1990) : Remarks on the analytical hierarchy process, 249-258

[14] Dyer J.S., Wendel R.E (1985) : A critique of the analytical hierarchy process,

working paper, Department of Management , The University of Texas , 84-85.

[15] Dilworth J.B. (2000): Providing value in Goods and Services, Operations

Management, 14, 201-210.

103

[16] Elsworth A. (2014) : Expert Choise Software Manual , Usa.

[17] Freeling, A. (1984) : "A philosophical basis for decision aiding", Theory and

Decision 16:179-206.

[18] Harker PT., Vargas LG. (1987) : The theory of ratio scale estimation: Saaty’s

analytic hierarchy process. Mangement Science, 33, 1383-1403.

[19] Hastad J. (2009): Complexity theory, Royal Institute of Technology, 100-120

[20] Irvin R.A., Stansbury J. (2004) : Citizen participation in decision making: is it

worth the effort? Public administration review, 64, 55-65.

[21] Johnson, E. J., Payne, J. W. (1985). Effort and accuracy in choice. Management

Science, 31(4), 395-414.

[22] Kedhi V. (2000): Grafet dhe rrjedhat në rrjeta, 255-341

[23] Kosova,R.,Xhafaj, E.,Qendraj,D.,“A probability approach to Hubbert method of

oil production and reserves estimation. Applications in some albanians oilfields.

International Conference on Statistic Probability and Numerical Analysis, SPNA

2015.

[24] McCaffrey J. (2005). "Test Run: The Analytic Hierarchy Process". MSDN

Magazine.

[25] Moore M.J. (1985) : Selecting a contractor for Fast truck projects: Part I,

principles of contractor evaluation, 39, 74-76

[26] Metkalfe K.A, Narod S.A (2002): Breast cancer risk perception among woman

who have undergone prophylactic bilateral mastectomy, 94, 1564-1569.

[27] Perez J. (1995) : Some comments on Saaty’s AHP, Management Science, 41,

1091-1095

[28] Peterson, C. R (1965) : "Internal consistency of subjective probabilities", Journal

of Experimental Psychology 70:526-533.

[29] Quinlan J.R.(1986) : Induction of decision trës, Machine Learning, 4, 81-106.

[30] Quinlan J.R. (2009) : C4.5 programms for machine learning. Online google.

[31] Qendraj D., Xhafaj E. (2015) : Evaluating risk factors of being obeseby using

ID3 algorithm in Weka sofware, European Scientific Journal, Vol 11, No 24, 261-

267.

http://msdn2.microsoft.com/en-us/magazine/cc163785.aspx

104

[32] Qendraj D, Muca M. (2015) : The analytic hierarchic process: A model to

evaluate the risk of getting cancer, Proceedings UBT Annual International

Conference on Business, Technology and Innovation, 4, 36-41.

[33] Qendraj, D., Xhafaj, E.,Mukli,L. “Klasifikimi i statusit ekonomik me anё tё

pemёve vendim-marrёse, njё rast studimi i familjeve shqiptare”, Buletini i Shkencave

tё Natyrёs, nr 20, 2015 ISSN 2305 882X, FSHN, UT.

[34] Qendraj (Halidini), D., Mitre, TH., Xhafaj, E. “Optimizimi nё rrjetat vendim-

marrёse me anё tё Proçesit tё Analizёs Hierarkike tё shkallёs Saaty” , Optime-

Buletini Shkencor i Albanian University, Nr 6, 2015, ISSN 2220-461X

[35] Qendraj (Halidini )D.,Halidini, E. “A new way for finding the optimal decision

tree by using a modified iteration of ID3 algorithm”, ICRAE (International

Conference on: “Research and Education Challenges Towards the Future) 23-24

november 2015 (me proceeding, proçes botimi).

[36] Qendraj (Halidini )D., Mitre, Th.,Halidini,E. “An application of decision tree in

technology”, ISTI ( Information Systems and Technology Innovations Inducting

Modern Business Solutions), 5-6 june, 2015 ( Proceeding online)

[37] Salleh R., Taib I., Abdullah L. (2012): Comparison of C5.0 and cart,

International Journal of enginnniering research and Technology IJERT, Vol 1, Issue

4, ISSN 2278-0181

[38] Saaty TH. (1980): The analytic hierarchy process, New York: McGraw Hill

[39] Saaty TH. (1985): Decision making for liders, belmont california: Life Time

Leaning Publications.

[40] Saaty Th.;Peniwati K.(2008): Group Decision Making: Drawing out and

Reconciling Differences. Pittsburgh, Pennsylvania: RWS Publications. ISSN 978-1-

888603-08-8.

[41] Stewart J. Cohen, Dessai S. Lammel A., Lempert R.J (2010): Foundation of

decision making, Cambridge University Press, 195-229.

[42] Stewart N., Oaksford M. (2008): A decision-by-sampling account of decision

under risk. In: The Probabilistic Mind: Prospects for Bayesian Cognitive Science,

Oxford University Press, 261-276.

[43] Stana, A. (2016): E-Commerce, nr 11, 173-248.

[44] Shannon, C. E. (1948): A mathematical theory of communication, Bell System

Technical Journal 27: 379–423 and 623–656.

https://en.wikipedia.org/wiki/Thomas_L._Saaty

https://en.wikipedia.org/wiki/International_Standard_Book_Number

https://en.wikipedia.org/wiki/Special:BookSources/978-1-888603-08-8

https://en.wikipedia.org/wiki/Special:BookSources/978-1-888603-08-8

105

[45] Witten, I., Frank, E.(2000) : Practical Machine Learning Tools and Techniques

with Java Implementations, Weka machine learning algorithm,13, 262-310.

http://www.cs.waikato.ac.nz/ml/weka/

http://en.wikipedia.org/wiki/Weka_(machine_learning)

http://www.cs.waikato.ac.nz/ml/weka/

http://en.wikipedia.org/wiki/Weka_(machine_learning)

TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE ZBATIME TË …

Documents

Transcript of TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE ZBATIME TË …