TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE ZBATIME TË …
Transcript of TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE ZBATIME TË …
i
REPUBLIKA E SHQIPËRISË
UNIVERSITETI I TIRANËS
FAKULTETI I SHKENCAVE TË NATYRËS
DEPARTAMENTI I MATEMATIKËS SË APLIKUAR
PROGRAMI I STUDIMIT:
Metoda Probabilitare, Statistike dhe Metodat e Analizës Numerike
TEZË DOKTORATURE
Për gradën
“DOKTOR I SHKENCAVE"
TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE
ZBATIME TË TYRE
Kandidate: Udhëheqës shkencor:
Msc. Daniela Halidini (Qendraj) Prof. Dr. Thoma Mitre
TIRANË, 2016
ii
REPUBLIKA E SHQIPËRISË
UNIVERSITETI I TIRANËS
FAKULTETI I SHKENCAVE TË NATYRËS
DEPARTAMENTI I MATEMATIKËS SË APLIKUAR
TEZË DOKTORATURE
TEMA: PROBLEME OPTIMIZIMI NË RRJETA DHE ZBATIME TË TYRE
Kandidate: Udhëheqës shkencor:
Msc. Daniela Halidini (Qendraj) Prof. Dr. Thoma Mitre
Mbrohet më datë ____.____.2016 para komisionit të përbërë nga:
1. ____________________________________, Kryetar
2. ____________________________________, Anëtar (Oponent)
3. ____________________________________, Anëtar (Oponent)
4. ____________________________________, Anëtar
5. ____________________________________, Anëtar
TIRANË, 2016
iii
FALENDERIME
Në fund të këtij rrugëtimi të gjatë ndiej dëshirën e madhe për të falenderuar së pari gjithë
profesorët që na kanë formuar me dijet e tyre shkencore. Një falenderim i veçantë shkon për
profesorin tim udhëheqës Prof. Thoma Mitre për gjithë sugjerimet, këshillat dhe kritikat në
realizimin me sukses të këtij punimi. Gjithashtu falenderoj shumë Prof. Fatmir Hoxhën për
ndihmesën dhe mbështetjen e pakursyer në kohë.
Mirënjohja themelore është për prindërit e mi, sidomos për babain tim që edhe pse nuk jeton më,
ky sukses është vetëm i tij dhe i nënës sime.
Dëshiroj të falenderoj shumë bashkëshortin tim për përkushtimin e thellë, durimin dhe
inkurajimin e vazhdueshëm gjatë gjithë kohës së punimit për këtë temë.
I detyrohem mirënjohje dhe respekt gjithë familjes sime për mbështetjen e pakursyer që më kanë
dhënë dhe së fundmi më të voglit të familjes, djalit tim Luis.
Ju falenderoj të gjithëve pafundësisht!
iv
PËRMBAJTJA
PËRMBLEDHJE …………………………………………………………………………………………………....vi
ABSTRAKT………………………………………………………………………………………………………….vi
LISTA E TABELAVE…………………………………………………………………..………………………......vii
LISTA E FIGURAVE………………………………………………………………………………………...…....viii
HYRJE ……………………………………………………………………………………………………x
KAPITULLI 1 Një vështrim mbi problemet e optimizimit
1.1 Optimizimi matematik. Trajta e përgjithshme e një problemi optimizimi…………..…….....1
1.2 Optimizimi në rrjeta ………………………………………………………………………,.....4
1.3 Problemet e klasifikimit…………………………………………………………………...…11
1.4 Pemët e klasifikimit. Algoritmet e kërkimit të pemës minimale.............................................12
1.5 Pemët e vendimit dhe analiza e tyre........................................................................................16
1.6 Pemët binare..............................................................………….........………........…….........22
1.7 Minimizimi i numrit të kulmeve të pemës së vendimit……………………………………..28
1.8 Etiketimi i çdo kulmi me të shumtën një tipar.........................................................................29
1.9 Vështrim i përgjithshëm mbi kompleksitetin………………………….……………………..30
KAPITULLI 2 Aspekte algoritmike nё rrjetat vendim-marrёse
2.1 Teoria e rrjetave e aplikuar në pemët e vendimit……………………………………………33
2.2 Avantazhet dhe disavantazhet e pemës së vendimit……………………………………..….34
2.3 Algoritmet e rrjetave të vendimit…………………………………………………….............35
2.3.1 ID3 algoritmi bazë i vendimit………………………………………………………........36
2.3.2. Algoritmi ID3 Pseudokode.............................................................................................42
2.3.3 Algoritmi C4.5 si përmirësim i ID3……………………………………………………..43
2.3.4 Avantazhet dhe disanvantazhet e ID3 dhe C4.5………………………………………...44
2.3.5 Krahasimi midis ID3 dhe C4.5 i aplikuar në rrjetat wireles dhe sistemet inteligjente të
transportit…………………………………………………………………………………….…..45
2.3.6. Algoritmi Cart dhe indeksi Gini…………………..…………………………….….... 48
v
KAPITULLI 3 Paketa weka pёr klasifikime nё rrjeta
3.1 Paketa Weka për klasifikim…………………..……………………………………………..51
3.2 ID3 i implementuar në paketën Weka Tushar ………………………………………………52
3.2.1Vlerësimi i faktorëve për të qenë obezë. (Zbatim).......................………………...……..55
3.2.2 Klasifikimi i statusit ekonomik të familjeve shqiptare. (Zbatim)……………..……...…58
3.3 Një mënyrë e re e përmirësuar e ID3 në pemët binare me anë të Weka……………………63
KAPITULLI 4 Teoria e renditjes nga nivelet e rrjetёs
4.1 Proçesi i Analizës Hierarkike (AHP) ……………………………………………..………...69
4.2 Shkalla Saaty………………………………………………………………………………...72
4.3 Aksiomatika e AHP………………………………………………………………………….74
4.4 Matrica e krahasimeve.Vektorët e vetë………………………………………………...…….80
4.5 Qëndrueshmëria Saaty…………………………………………….……….…….………..…82
4.6 Një veti e matricave të qëndrueshme…………………………………………………….…..84
4.7 Përcaktimi i peshave globale………………………………………………………….……..84
4.8 Strukturimi i informacionit. Matjet absolute dhe relative…………………………..………85
4.9 Klasifikimi i firmave pjesëmarrëse në një tender.( Zbatim)…………………………….…...91
4.10 Vlerësimi i faktorëve të riskut për të qenë i sëmurë me anë të AHP. (Zbatim)………........96
PËRFUNDIME ………………………………………………………………………………...100
LITERATURA .. ………………………………………………………………………………102
vi
PËRMBLEDHJE
Në këtë tezë doktorature trajtohen probleme të optimizimit në rrjeta, duke u fokusuar në rrjetat vendim-
marrëse, të cilat kanë një zbatim të gjerë në të gjitha fushat e shkencës. Duke marr shkas nga zhvillimet e
kohës në teknologji dhe internet, ku sasia e të dhënave është marramendëse do të mundohemi të
klasifikojmë disi apo të propozojmë mënyra renditjeje, për të gjetur një zgjidhje optimale ose sa më afër
optimales. Trajtohen problemet e optimizimit më të ndeshura në kohë, që modelohen si probleme me
konstrukt klasifikimi në pemë. Jepet në përgjithësi struktura e një pemë vendimi dhe problema që çojnë
në këto struktura, algoritme që gjenerojnë pemë vendim-marrëse si dhe përmirësime të tyre. Janë parë
raste nga ekonomia, mjekësia, transporti, mjedisi, etj dhe është konkluduar se këto algoritma janë të
shpejtë dhe të efektshëm për një zgjidhje sa më afër optimales. Në ndihmë të klasifikimit kemi paketën
WEKA Tushar, e cila mund të përdoret në mënyrë shumë praktike. Në ndryshim nga R- Programming
dhe Matlab, kjo paketë ka algoritmin e klasifikimit ID3 si dhe algoritma të tjerë klasifikimi, të
përshtashëm për vendim-marrje, me versione të përmirësuara të vitit 2014. Është shumë e vlefshme për
klasifikim të çdo baze të dhënash, të ruajtur thjesht në një tabelë ekseli, për ta paraqitur atë si një pemë
vendimi. Një teori e re për rrjetat e vendimit është Procesi i Analizës Hierarkike (Thomas Saaty), i cili
është mjaft praktik për të renditur rezultate nga më i miri tek më i keqi ose nga më i preferuari tek ai më
pak i preferuari. Në këtë teori ka mjaft rol mënyra e formimit të matricave të krahasimit dy e nga dy
ndërmjet kritereve, si dhe llogaritja e peshave të secilit kriter.
Fjalë kyçe: Pemë vendim-marrëse, ID3 algoritëm, Weka, AHP
ABSTRACT
In this doctoral thesis we have been treated the optimization problems in networks, focusing on the
decision-making networks, which have a wide application in all scientific fields. Taking into
consideration the developments in technology and internet, where the amount of data is enormous, we
will try to classify somehow or propose ways to sort, to find an optimal solution or as near as possible
from optimal. Have been treated optimization problems encountered in the most time, which are modeled
as problems that are built in tree classification, the algorithms that generate decision trees and their
improvements. We have seen cases of economy, medicine, transport, environment, etc. and have
concluded that these algorithms are fast and effective for a solution as near as possible to optimal. In
support of the classification we have WEKA package Tushar as a new soft that can be used by everyone
in a very practical way. Compared to R-Programming and Matlab, this package has the ID3 classification
algorithm, as well as other classification algorithms suitable for decision-making, has now improved
versions of 2014.It is very valuable for classification of each database saved simply in an excel table, to
present it as a decision tree. A new theory for decision networks, represented by Analytic Hierarchic
Process (Thomas Saaty), which is quite practical to align results from best to worst, or most preferred to
the least preferred. In this theory has a big role the way of forming the comparison matrices between the
criterions selected two by two and calculation of weights each criterion.
Keywords: Decision tree, ID3 algorithm, Weka, AHP
vii
LISTA E TABELAVE
Tabela 1.1. Tabela e veprimeve dhe ngjarjeve............................................................................................19
Tabela 1.2 Tabela Gërmë-Kod...................................................................................................................23
Tabela 2.1. Bashkësia S e të dhënave.........................................................................................................38
Tabela 2.2 Të dhënat pas rrënjës në lidhje me atributin “Diell”.................................................................40
Tabela 2.3 Të dhënat pas rrënjës në lidhje me atributin “Me re”...............................................................41
Tabela 2.4 Të dhënat pas rrënjës në lidhje me atributin “Shi”...................................................................41
Tabela 2.5 Vlerat e atributeve te C4.5........................................................................................................44
Tabela 2.6 Karakteristikat e ID3 dhe C4.5.................................................................................................45
Tabela 2.7 Vlerat e indeksit GINI..............................................................................................................49
Tabela 2.8 Atributet të indeksuara me GINI.............................................................................................50
Tabela 3.1 Faktorët e obezitetit.................................................................................................................56
Tabela 3.2 Statusi ekonomik i familjeve shqiptare....................................................................................59
Tabela 3.3 Vlerat e variablave binare tek statusi ekonomik......................................................................62
Tabela 3.4 Vlerat e probabilitetit të kushtëzuar........................................................................................64
Tabela 3.5 Probabilitetet e shpërndarjes P……………………………………………………….............65
Tabela 3.6 Probabilitetet e shpërndarjes 'P ……………………………………………………………..65
Tabela 3.7 Të dhënat e punëtorëve............................................................................................................67
Tabela 4.1 Shkalla Saaty………………………………………………………………………................73
Tabela 4.2 Indeksi rastësor i qëndrueshmërisë………………………..……………………………….…83
Tabela 4.3 Universitetet në varësi të kriterit vendndodhje……………………………………................90
Tabela 4.4 Kriteret e firmave......................................................................................................................91
Tabela 4.5 Krahasimet e kritereve............................................................................................... ..............92
Tabela 4.6 Krahasimet dy e nga dy të faktorëve.......................................................................................97
Tabela 4.7 Krahasimet e sëmundjeve me faktorin duhan...........................................................................98
viii
Tabela 4.8 Krahasimet e sëmundjeve me faktorin alkol.............................................................................98
Tabela 4.9 Krahasimet e sëmundjeve me faktorin obeziteti.....................................................................98
Tabela 4.10 Krahasimet e sëmundjeve me faktorin histori familjare........................................................98
Tabela 4.11 Peshat lokale për çdo tabelë..................................................................................................99
LISTA E FIGURAVE
Figura 1.1 Klasifikimi i disiplinave të optimizimit………………………………………………...……...3
Figura 1.2 Fluksi në rrjeta...........................................................................................................................5
Figura 1.3 Caktimet një person-një objekt...................................................................................................7
Figura 1.4 Këmbimet midis tre personave……………………………………………………………......8
Figura 1.5 Pemët klasifikuese.....................................................................................................................12
Figura 1.6 Algoritmi Kruskal......................................................................................................................14
Figura 1.7 Algoritmi Prim...........................................................................................................................15
Figura 1.8 Algoritmi Boruvka.....................................................................................................................16
Figura 1.9 Shembull Vendim-marrje..........................................................................................................17
Figura 1.10 Pema veprime-ngjarje……………………………………………………………………….20
Figura 1.11 Vlerat e pritshme të veprimeve në hapin e dytë......................................................................20
Figura 1.12 Vlerat e pritshme të veprimeve tek hapi i parë........................................................................21
Figura 1.13 Paraqitja e një peme binare......................................................................................................22
Figura 1.14 Pema binare prefiks-kod.........................................................................................................24
Figura 1.15a Pema Kuq e Zi, prindi- xhaxha..............................................................................................25
Figura 1.15b Pema Kuq e Zi prindi- xhaxha..............................................................................................25
Figura 1.15c Pema Kuq e Zi, prind- xhaxha...............................................................................................25
Figura 1.16 Renditja e elementëve me anë të BST.....................................................................................27
Figura 1.17 Llojet e pemëve binare me tre kulme......................................................................................27
Figura 2.1 Paraqitja e pemës vendim-marrëse për të luajtur futboll...........................................................41
Figura 2.2 Llojet e kulmeve në rrjetat wireles............................................................................................46
Figura 2.3 Rrjeta WSN............................................................................................................. ..................46
Figura 2.4 Komunikimi WSN-GIS-ITS.....................................................................................................47
ix
Figura 2.5 Grafiku krahasues ID3 dhe C4.5..............................................................................................48
Figura 2.6 Indeksi Gini.............................................................................................................. .................49
Figura 3.1 Pamje e paketës Weka...............................................................................................................51
Figura 3.2 Të dhënat e shembullit 1 në Weka............................................................................................52
Figura 3.3 Visualizimi i atributeve ndërmjet tyre.......................................................................................52
Figura 3.4 Përzgjedhja e algoritmit ID3 si J 48 Prunned............................................................................53
Figura 3.5 Paraqitja e pemës përfundimtare...............................................................................................55
Figura 3.6 Klasifikimi i faktorëve të obeziteti............................................................................................57
Figura 3.7 Aplikimi i J 48...........................................................................................................................57
Figura 3.8 Paraqitja e pemës faktorë obeziteti............................................................................................58
Figura 3.9 Klasifikimi i familjeve në Weka................................................................................................61
Figura 3.10 Paraqitja e pemës status ekonomik me anë të Weka...............................................................61
Figura 3.11 Paraqitja e klasifikimit binare për statusin ekonomik.............................................................62
Figura 3.12 Pemët me shpërndarje............................................................................................. .................66
Figura 3.13 Pema binare e ndërtuar nga ID3.............................................................................................68
Figura 3.14 Pema binare e ndërtuar nga ID3 i modifikuar.........................................................................68
Figura 4.1 Hierarkia e problemit të Finlandës………………..…………………………………………..70
Figura 4.2 Hierarkia e universiteteve……………………………………………………………………..88
Figura 4.3 Struktura hierarkike e firmave.................................................................................... ...............92
Figura 4.4 Struktura hierarkike e sëmundjeve ………….………………………………………….….....97
x
Hyrje
Që në lashtësi njerëzit janë përpjekur të gjejnë zgjidhje sa më të mira për problemet e tyre jetike,
një pjesë e të cilave shumë vonë janë paraqitur si probleme optimizimi në rrjeta. Pikërisht këto
probleme optimizimi formulohen në struktura rrjetore dhe kanë aplikime të gjera në fusha të
ndryshme. Një fakt i pamohueshëm është se ne të gjithë jemi optimizues pasi ne marrim vendime
për të maksimizuar cilësinë e jetesës, produktivitetin në kohë, si dhe mirëqënien tonë në një
mënyrë ose një tjetër. Kjo është një luftë e vazhdueshme për të krijuar një mundësi më të mirë në
mes të shumë alternativave. Optimizimi ka qenë, është dhe do të jetë kërkesa themelore e jetës
njerëzore dhe ky fakt bën që të zhvillohen masivisht teknikat në këtë fushë. Në këtë drejtim kanë
punuar shumë filozof, matematikanë, shkencëtarë. Ekzistenca e metodave të optimizimit
gjurmohet prej kohës së Njutonit, Lagranzhit dhe Koshi. Zhvillimi i metodave llogaritëse
diferenciale për optimizimin ishte i mundur nga kontributi i Njutonit dhe Lajbnicit. Themelet e
llogaritjeve variacionale kishin të bënin me minimizimin e funksionit dhe janë bërë nga Euleri,
Lagranzhi dhe Vajershtrasi. Metodat e optimizimit të problemeve me kufizime u bënë të njohura
nga Lagranzhi. Koshi bëri aplikimin e parë të një metodë optimizimi për zgjidhjen e problemeve
pa kufizime. Nga mesi i shekullit të njëzetë zhvillimi dixhital i kompjuterave bëri të mundur
implementimin e optimizimit kompleks dhe të simulimeve me metoda të reja. Ky avancim dha
rezultat në krijimin e fushave të ndryshme të teorisë së optimizimit. Disa nga ndalesat kryesore
janë këto :
Matematikanët grekë të antikitetit kanë zgjidhur disa probleme optimizimi që kanë lidhje me
studimet e tyre gjeometrike, p.sh: Euklidi gjeti distancën minimale ndërmjet një pike dhe një
drejtëze, Zenodorus zgjidhi problemin Dido, të gjetjes së figurës me sipërfaqe maksimale për një
perimetër të dhënë. Heroni provoi se drita kur pasqyrohet në pasqyrë lëviz ndërmjet dy pikave,
në rrugën me gjatësi më të shkurtër. Më vonë në shek. 17-të J.Kepler gjeti përmasat optimale të
fuçive të verës dhe formuloi një version të ri të problemit të sekretarit ose të problemit të
martesave. P. De Fermat tregon se në pikat ekstremale derivati i funksionit anullohet dhe G.
Monge tentoi të jap zgjidhje për problemin e transportit. Gjatë shek 19-të Furie formuloi
problemin PL për të zgjidhur problemet në mekanikë dhe teorinë probabilitare kurse Koshi
prezantoi metodën e gradientit. Gjatë kësaj periudhe u botuan shumë libra me përmbledhje nga
problemet e optimizimit ku veçohet libri i H.Hankok mbi optimizimin me titull “ Teoria e
minimumit dhe maksimumit”. Më vonë K.Menger paraqet formulën themelore të problemit të
tregtarit shëtitës kurse Ford dhe Fulkerson paraqesin fillimet e problemeve të optimizimit në
rrjeta. R.Bellman prezanton principet optimal dhe N.Karmarkar tregon algoritme në kohë
polinomiale për problemet e programimit linear (PL). Shumë sisteme janë formuar nga
ndërprerja e nënsistemeve që mund të kenë qëllime optimizimi të ndryshme ose të kundërta në
lidhje me sistemin global nga i cili ato janë pjesë. Pikërisht struktura e këtyre lidhjeve influencon
në performancën globale të rrjetës. Vetitë kryesore të rrjetave dinamike të strukturuara në
mënyra të ndryshme, janë lidhur në mënyrë eksplicite me optimizim të disa funksioneve
specifike në rrjetat komplekse dhe në topologjinë e tyre. Rrjeta e parë njerëzore që të vjen në
mendje është rrjeta gjenealogjike me lidhjet midis anëtarëve të familjes. Në një qytet të madh në
jugperëndim të Gjermanisë në fillim të shekullit të 19-të, shkencetari Lipp zbuloi kur dhe si
shtimi i një sistemi elektoral prek sistemin e rrjetave farefisnore. Çuditërisht në një zonë të
njohur për reformat e saj demokratike, Lipp tregoi se një gjysmë shekulli zgjedhjesh nuk e
reduktoi fuqinë farefisnore në komunitet, në fakt fuqia farefisnore vetëm sa forcohej. Lipp e
përdori rrjetën edhe për të zbuluar aktorët e shquar të fraksioneve të vogla politike dhe si ata
xi
lidhnin individë rrotull tyre. Në këtë rast rrjetat ishin subjekti i studimit në përdorim më shumë
se sa një evidencë, një përpjekje për të parë efektet e ndryshimeve politike në strukturat e
pushtetit. Një paralele në këto kohë është edhe teoria e analizës hierarkike, e paraqitur nga
Thomas Saaty që nga vitet 1970 e deri më tani. Kjo metodë paraqet një proçes të gjatë analize e
organizimi për një vendim-marrrje sa më optimale. Aplikimi i AHP (Proçesi i Analizës
Hierarkike) është në mjaft fusha të gjera si në qeverisje, shëndetësi, biznes, ndërtime, industri
dhe edukim. Vendim-marrësi është në krye të AHP dhe ai dekompozon gjithë problemin në
hierarki e nivele, të cilat përbëjnë nënprobleme, ku secila prej tyre analizohet në mënyrë të
pavarur. Pasi ndërtohet kjo skemë, vendim-marrësi nis të bëjë krahasime midis tyre, duke i marrë
dy e nga dy. Të gjitha vlerësimet cilësore që kryen ai, kthehen në vlerësime sasiore, duke i
vendosur peshat përkatëse secilit element në këtë hierarki. Në hapin final të gjitha vlerësimet
numerike të llogaritura renditen sipas rendit zbritës të tyre. Kështu klasifikohen alternativat nga
më optimalja deri tek ajo më e papërshtatshmja. J.Ross Quinlan prezantoi në 1979 algoritmin
ID3. Metodat në lidhje me pemët vendim-marrëse janë përdorur kryesisht për klasifikim sepse
kanë një strukturë hierarkike të thjeshtë për përdoruesin që të kuptojë vendim-marrrjen. Quinlan
ka qenë një lojtar aktiv në gjysmën e dytë të vitit 1980, me një numër të madh publikimesh në të
cilat ai propozon një metodë deduktive për të provuar sjelljen e një sistemi. Por ai bëri një kthesë
domethënëse në vitet 90-të, kur ai prezantoi metodën C4.5, e cila është referenca tjetër
thelbësore, ku donte të përfshinte pemët e vendimit (1993). [29]
Sot po përjetojmë një rigjallërim, të zhvilluar dhe nga popullariteti i internetit, e vetmja rrjetë që
lidh sistemin e një bote të tërë. Konfigurimet e ndryshme të kulmeve dhe brinjëve si një strukturë
kombinatoriale paraqesin grafin, së bashku me një relacion incidence ndërmjet tyre. Grafet mund
të përdoren për të modeluar shumë lloje relacionesh dhe proçesesh në fizikë, biologji, shkenca
sociale, sisteme informacioni etj. Shumë probleme praktike mund të paraqiten me anë të grafit.
Në shkencat kompjuterike, grafet përdoren për të paraqitur rrjetat e komunikimit, organizimin e
të dhënave, devijimet kompjuterike, fluksin kompjuterik etj. Për shembull, struktura e linkut të
një faqe web mund të paraqitet me anë të një grafi të orientuar, në të cilin kulmet përfaqësojnë
faqet web ndërsa brinjët e orientuara përfaqësojnë linket nga njëra faqe në tjetrën. Me zhvillimin
algoritmik për trajtimin e grafeve, interesi ka qenë shumë i lartë në shkencat kompjuterike.
Në fokusin tonë do të trajtohen problemat e optimizimit në rrjeta me algoritmet përkatës të tyre,
të lidhura me vlerësime të alternativave të zgjedhjes dhe renditje faktorësh nga më i rëndësishmi
tek më pak i rëndësishmi, të modeluara në rrjetat vendim-marrëse, si një model mjaft praktik dhe
i rëndësishëm për jetën e përditshme. Problemi kryesor është si të ndërtojmë një pemë vendimi
sa më optimale, për një problem të dhënë. Ndërtimi i pemëve vendim-marrëse nga të dhënat
është një disiplinë e largët në kohë. Statisticienët i kanë dhënë atribute punimeve të partneritetit
Sonquist e Morgan (1963), të cilët përdornin pemët regresive në proçeset e parashikimeve. Më
pas këto punime janë ndjekur nga një familje e tërë metodash, referuar kryesisht në problemat e
klasifikimit (Thaid-Morgan and Messenger 1973, Chaid-Kass 1980). Problemat vendim-marrëse
janë zgjidhur gjerësisht me anë të modeleve të programimit linear, në të cilat numri i zgjidhjeve
të mundshme është zakonisht i madh. Nga këto modele është shumë e vështirë të evidentohen
zgjidhjet e lejueshme, pra ato alternativa që i duhen vendim-marrjes. Në metodat e MCDM edhe
pse numri i alternativave është i vogël, ato janë të disponueshme që në momentin fillestar të
shtrimit të problemit. Në praktikë kriteret e vlerësimit të alternativave mund të jenë me natyra
cilësore ose sasiore. Kur kriteret janë cilësore ato nuk mund të shprehen numerikisht, pasi
kriteret nuk kanë njësi matëse të përbashkëta. Ndaj në këto kushte problemet e vendim-marrjes
nuk mund të trajtohen me modelet e njohura lineare. [8]
1
Kapitulli 1
Një vështrim mbi problemet e optimizimit
1.1 Optimizimi matematik. Trajta e përgjithshme e një problemi optimizimi.
Problemet e optimizimit janë të zakonshme në shumë disiplina dhe fusha të
ndryshme. Në këto problema duhen gjetur zgjidhje të cilat janë optimale ose afër-
optimales në lidhje me një qëllim të caktuar. Zakonisht nuk mund të zgjidhim
probleme që në hapin e parë, por duhen ndjekur disa proçese që na drejtojnë drejt
zgjidhjes së problemit. Zakonisht proçesi i zgjidhjes është i ndarë në dy shkallë të
ndryshme që ekzekutohen njëra pas tjetrës. Njohja me këto shkallë të ndihmon në
ndërtimin dhe zgjidhjen e problemës, vlerësimin dhe implementimin e zgjidhjeve. Ka
problema të optimizimit që mendohet se nuk modelohen në rrjeta, por që janë
lehtësisht të modelueshme dhe prodhojnë rrugë të të menduarit për një model optimal.
Optimizimi i vazhduar kundrejt optimizimit diskret: Disa modele kanë kuptim vetëm
nëse variablat marrin vlerë nga një bashkësi e fundme, zakonisht një nënbashkësi e
numrave të plotë, ndërsa modele të tjera përmbajnë variabla që marrin çdo vlerë reale.
Modelet me variabla diskret janë problema të optimizimit diskret dhe modelet me
variabla të vazhduar janë problema të optimizimit të vazhdueshëm. Këto modele të
vazhdueshme kanë tendencë të jenë më të thjeshta për tu zgjidhur sesa modelet e
optimizimit diskret. Implementimi i algoritmeve me teknologjinë e avancuar
kompjuterike ka rritur kompleksitetin e problemeve diskrete të optimizimit që mund
të zgjidhen në mënyrë efikase. Algoritmet e optimizimit të vazhduar janë shumë të
rëndësishëm në optimizimin diskret pasi mjaft algoritme të optimizimit diskret
gjenerojnë një varg nënproblemesh të vazhdueshme.
Optimizimi pa kufizime kundrejt optimizimit me kufizime: Një dallim i rëndësishëm
është ndërmjet problemeve në të cilat nuk ka kufizime në variabla dhe problemeve në
të cilat ka kufizime në variabla. Problemet e optimizimit pa kufizime lindin nga
shumë aplikime praktike: ato po ashtu lindin në riformulimin e problemeve të
optimizimit të kufizuar ku kufizimet rivendosen nga një term i funksionit të qëllimit.
Problemet e optimizimit me kufizime janë nga aplikime në të cilat gjenden kufizime
eksplicite në variabla. Këto kufizime në variabla ndryshojnë shumë nga kufijtë e
thjeshtë tek sistemet e barazisë ose të mosbarazimeve që modelojnë marrëdhënien
komplekse midis variablave.
Asnjë, një ose shumë objektiva: Problemet më të shumta të optimizimit kanë vetëm
një funksion objektiv. Gjenden mjaft raste interesante kur problemat e optimizimit
nuk kanë funksion objektiv ose funksion me shumë objektiva. Problemet e fizibilitetit
janë probleme në të cilat qëllimi është të gjejmë vlerat e variablave që kënaqin
kufizimet e një modeli që nuk kanë funksion qëllimi të veçantë për të optimizuar.
Problemet e optimizimit kombinator hasin një pengesë ku variablat në përgjithësi
marrin vlera nga kufizimet shtesë dhe bashkësitë diskrete në bazë të burimeve
themelore që janë: puna, furnizimet dhe kapitalet që kufizojnë alternativat e
2
mundshme që konsiderohen të realizueshme. Zakonisht janë shumë alternativa për t'u
marr parasysh dhe një qëllim përcakton se cila nga këto alternativa është më e mira.
Një shkallë e rëndësishme në proçesin e optimizimit është klasifikimi i modelit,
përderisa algoritmet për të zgjidhur këto probleme janë përshtatur për lloje të veçanta
të problemit.
Trajta e përgjithshme e një problemi optimizimi: Për të vendosur bazat për zgjidhjen
e një problemi të optimizimit është shumë e nevojshme që ai të formulohet në një
mënyrë të tillë të reflektimit të situatës që do modelohet, por të jetë edhe i
pranueshëm për teknikat llogaritëse. [41]
Problemi bazë: Minimizimi i funksionit të qëllimit mbi një bashkësi të
specifikuar e quajtur bashkësia e mundësive.
Koncepti i zgjidhjes: Zgjidhja e mundshme : Jepet nga çdo pikë , pavarësisht
vlerave që i jep . Për të gjetur një pikë të tillë është e vështirë numerikisht, kur
kufizimet janë të komplikuara ose numerike. Kështu me të vërtetë ekzistenca e një
zgjidhjeje të mundshme mund të mbetet shpesh herë një pyetje e hapur. Këto janë
niveli i parë i rëndësishëm i zgjidhjeve. Zgjidhja optimale : Një pikë përfaqëson
vlerën minimale të në nëse për gjithë zgjidhjet e mundshme x. Në
mënyrë specifike kjo quhet një zgjidhje optimale globale. Zgjidhja optimale lokale :
Jepet nga një pikë e tillë që për ndonjë fqinjësi U të plotësohet mosbarazimi
për . Optimaliteti në këtë rast pohohet jo relativisht tek C si
një e tërë, por relativisht në fqinjësi rreth . Praktikisht është e vështirë të ndajmë kur
një metodë numerike prodhon një zgjidhje optimale globale ose vetëm një optimale
lokale. Vlera optimale: Jepet nga kufiri i përpiktë i poshtëm i vlerave të . Mund
të gjendet ose jo një pikë ku aktualisht arrin këtë vlerë. Megjithatë edhe pse
vlera optimale është e përcaktuar saktë ajo mund të mos jetë e fundme.
Po japim një perspektivë të fokusuar kryesisht tek optimizimi me një funksion
objektiv të vetëm.
3
Figura 1.1 Klasifikimi i disiplinave të optimizimit
4
1.2 Optimizimi në rrjeta
Problemet e optimizimit në rrjeta janë probleme të interesit të veçantë. Në sajë të
modelimit të tyre në konstrukt rrjetash mund të aplikojmë algoritme të llojeve të
ndryshme për të gjetur një optimum të caktuar, pjesa më e madhe e tyre në lidhje me
distancat. Gjetja e një zgjidhje efikase si proçedurë për këtë problem, ka rezultuar
gjerësisht si një aplikimin i rëndësishëm i programimit linear në probleme të
ndryshme. Optimizimi në rrjeta është mjaft i lëvruar dhe shpesh ka avantazhe
kundrejt programimit linear. Në fakt modelet e rrjetave janë përdorur në mënyrë të
dendur në praktikë, në një spektër të madh aplikimesh. Në të vërtetë probleme të tilla
si rruga më e shkurtër, caktimet, transporti, pemët, maksimizimet e flukseve etj,
ndërtojnë klasën më të madhe të problemave të optimizimit në rrjeta. Një progres i
madh është bërë në metodologjinë e problemave në rrjeta, që në fakt i detyrohet
avancimeve në teknologji dhe algoritmikë këto 20 vitet e fundit . [2]
Flukset në rrjeta. Le të kemi një graf të orientuar me kulme dhe një
bashkësi me elemente çifte kulmesh të ndarë, që i referohemi me harqe. Numri i
kulmeve dhe harqeve varion nga Bashkësisë së flukseve të
rrjetës do t’i referohemi edhe si vektori i fluksit. Vektori që i shoqërohet një vektor
fluksi është vektori N-përmasor me këto koordinata:
Pra tregon diferencën midis fluksit total që hyn në kulmin i dhe fluksit total që del
nga kulmi i dhe i referohemi me nocionin divergjencë e kulmit i. Kulmi i quhet një
burim për vektorin e fluksit x nëse .
Nëse atëherë x quhet një cirkulacion. Çdo vektor divergjencë duhet të
plotësojë këtë barazim:
Vektori i flukseve është i kufizuar midis kufirit të sipërm dhe të poshtëm të kësaj
formë:
Problemi i fluksit me kosto minimale: Ky problem konsiston në gjetjen e flukseve
të harqeve që minimizojnë një funksion kostoje linear, subjekt i kufizimeve që
prodhojnë një vektor divergjencë së bashku me kufijtë e tyre:
(min)
(kufizime)
5
(kufizime)
ku janë skalarë çfarëdo dhe quhet koefiçient i kostos,
kufijtë e fluksit të harqeve , quhet furnizim i kulmit i.
Problemi i fluksit maksimal: Problemi shihet si një rast i veçantë i problemit të
fluksit me kosto minimale duke i caktuar kosto 0 të gjithë harqeve dhe duke futur një
hark artificial me kosto (-1). Problemi ka këtë pamje:
Figura 1.2 Fluksi në rrjeta
Maksimizimi
Kufizime
Problemi mund të shkruhet edhe në formën e minimizimit të për të njëjtat
kufizime. Po ashtu mund të vendosim kufijtë e sipërm dhe të poshtëm për .
Problemi i rrugës më të shkurtër. Problemi i gjetjes së rrugës më të shkurtër është
ndër problemet më të hershme të optimizimit. Qëllimi është të gjejmë një rrugë sa më
të shkurtër nga kulmi hyrës në atë dalës, ku gjatësia e harqeve të jetë jo negative.
Aplikimet më të shpeshta janë në makineri, në rrjeta interneti, në rrjeta urbane etj. Le
të kemi një graf , dhe një funksion që quhet funksion i gjatësive
të harqeve. Le të jetë një rrugë nga kulmi i në kulmin
j, gjatësi e rrugës P quhet shuma:
6
Le të supozojmë se një harku të grafit i bashkangjisim një kosto skalare ,
duke pasur parasysh se kostoja e një rruge të ndjekur do të jetë shuma e kostove të
harqeve të saj. Për një çift kulmesh të dhënë, problemi i rrugës më të shkurtër është që
të gjejmë një rrugë që lidh këto kulme me një kosto minimale. Analogjia këtu bëhet
midis harqeve dhe kostove të tyre, siç mund të ishte edhe për rrugët e një rrjete
transporti dhe gjatësia e tyre. Konteksti i këtij problemi transporti kalon në gjetjen e
rrugës më të shkurtër midis dy pikave gjeografike. Në rrjetat e komunikimit me
mund të shënojmë mesataren e vonesave të paketës për të kaluar linkun e
komunikimit . Në çdo rast rruga më e shkurtër është minimumi i mesatares së
vonesave, që shërben për të çuar informacionin nga origjina në destinacion. Një
shembull tjetër është shënimi me i probabilitetit që një hark i dhënë i një
rrjete komunikimi të jetë i përdorshëm në mënyrë të pavarur, atëherë produkti i
probabiliteteve të harqeve të rrugës siguron një matje të rrugës. Kështu është treguar
se për të gjetur rrugën më të shkurtër ndërmjet dy kulmeve, gjatësia e tyre është
ekuivalente me [9]
Mund të formulohet problemi i rrugës më të shkurtër nga kulmi s në t si një fluks
minimal :
Minimumi
Subjekt i
ku
Algoritmat kryesorë për të gjetur rrugën më të shkurtër janë : Algoritmi Dijkstra,
Algoritmi Bellman-Ford, Algoritmi Floyd-Warshall dhe modifikime të tyre.
Algoritmet për zgjidhjen e problemeve të ndryshme në rrjeta, të vështruar nga
pikëpamja e kriterit të efikasitetit, rezultojnë të kenë vlera relative. Ky relativitet
lidhet kryesisht me konfiguracionin e vetë rrjetës e konkretisht me aspektin strukturor
të saj si dhe veçori konkrete të vetë numrave që i shoqërohen kulmeve dhe harqeve të
rrjetës. Rezulton i rëndësishëm fakti nëse gjatësitë e harqeve janë ose jo të plota si
dhe çfarë shenje kanë. Po ashtu ka rëndësi edhe ana strukturore e rrjetës nëse rrjeta
është e ngjeshur apo e rrallë, nëse ka cirkuite negativë etj.
Problemi i caktimeve për një person. Supozojmë se kemi n persona dhe n objekte,
që duhet t’i bëjmë një përkatësi një për një. Gjendet një vlerë për të konçiduar
personin i me objektin j, ku do të caktojmë personat tek objektet për të maksimizuar
totalin e benefitit. Në fakt ka edhe një kufizim tjetër, që personit “i” të mund t’i
caktohet objekti “j”, vetëm nëqoftëse i përket një bashkësie të dhënë çiftesh nga
.
7
Matematikisht duhet të gjejmë një bashkësi çiftesh person-objekt nga saqë objektet janë të gjithë të ndarë dhe funksioni total është
maksimizimi i .
Problemi i caktimeve është një kontekst shumë praktik. Rastet më të shpeshta janë
caktimet e të punësuarve dhe profesioneve, makinerive dhe taksave etj. Po ashtu
problemi i caktimeve del si një nënproblem në metodat komplekse të optimizimit
kombinator.
Figura 1.3 Caktimet një person-një objekt
Mund t’i shoqërojmë problemit të caktimeve një bashkësi variablash
ku
Vlera e këtij caktimi është . Kufizimi i një objekti për person mund të
deklarohet si për të gjitha i-të dhe për të gjitha j-të. Më pas
mund të formulojmë problemin e caktimeve si një problem programimi linear, me
funksion maksimizimi dhe me kushte si më poshtë:
Kufizimi ku tregon se divergjenca e personit/kulmi i, duhet të jetë
1, ndërsa kufizimi tregon se divergjenca e objektit/kulmi j, duhet
të jetë (-1). Me ndryshimin e shenjës problemi kalon nga maksimum në minimum. Në
fakt kufizimi do të ishte më i fortë nëse do të ishte ose 0 ose 1. Programimi i
mësipërm linear ka vetinë se nëse ka një zgjidhje reale, atëherë zgjidhja optimale
është kur të gjitha janë ose 0 ose 1. Kjo zgjidhje optimale përfshin gjithë
optimalitetet e caktimeve.
8
Problemi i caktimeve për shumë persona. Në qoftë se marrim në konsideratë
problemin e caktimeve me përmasa , duke supozuar se kemi një caktim të
realizueshëm, bashkësia e n çifteve i caktojnë çdo personi ekzaktësisht një
objekt dhe çdo objekti ekzaktësisht një person. Për të treguar caktimin në shumë
persona, mendojmë një ndërrim midis dy personave, që do të thotë zëvendësim të
çifteve dhe nga caktimi me çiftet dhe . Caktimi i
rezultuar do të jetë prapë i realizueshëm në qoftë se dhe vetëm në qoftë se :
Vërejmë se ky problem këmbimi ndërmjet dy personave, mund të identifikohet me
një cikël me katër harqe , dhe Ky cikël është diferenca
midis caktimeve para dhe caktimeve pas këmbimit, ndërsa mosbarazimi është një
cikël i vërtetë. Për fat të keq është e pamundur të përmirësosh caktimin për këmbimin
e këtyre dy personave, edhe nëse caktimi nuk është optimal. Një përmirësim mund të
bëhet në këmbime me k-persona, për , ku bashkësia e çifteve nga caktimi korrent zëvendësohet nga çiftet .
Një këmbim me k-persona i korrespondon një cikli të thjeshtë me k-harqe hyrës (në
korrespondencë me caktimet e reja të çifteve) dhe k-harqe dalës (në korrespondencë
me çiftet korrente të caktimeve pasi janë zëvendësuar). Problemi i këmbimit në k-
persona përmirëson caktimin nëqoftëse dhe vetëm nëqoftëse ,
është ekuivalent me ciklin korrespondues me vlera pozitive. Figura 3 tregon një
realizim caktimi jo optimal, që nuk mund të përafrohet me këmbimet ndërmjet dy
personave. Vlerat për çdo çift janë shënuar në harqe. Vlera e caktimeve janë të pandryshuara majtas, sipas këmbimeve midis dy
personave. Përmes këmbimeve ndërmjet tre personave kemi një caktim optimal që ka vlerën 6.
Figura 1.4 Këmbimet midis tre personave
9
Në figurën 1.4, ilustrohet shembulli i mësipërm, ku harqet dalës nga cikli janë që i korrespondojnë çifteve të caktimeve korrente. Këto këmbime
në tre persona janë vlerat e përmirësuara, sepse shuma e vlerave të harqeve pas
zëvendësimit është (2+2+2)=6, më e madhe sesa vlera e harqeve të caktimeve para
këmbimit (1+1+1)=3.
Problemi i matricave të balancuara. Këtu problemi kalon në gjetjen e një matrice
me përmasa , ku jepen shumat e kolonave dhe të rreshtave, që përafrojnë një
matricë M me përmasa në mënyra sa më optimale. Kështu, mund të formulojmë
një problem në termat e grafit me m hyrje dhe n dalje. Bashkësia e harqeve
përfaqëson çiftet për të cilët hyrja korresponduese nga matrica , duhet të
jetë jozero. [6]
Për shumat e dhëna të rreshtave dhe të kolonave, shprehim këto relacione:
Po ashtu mund të vendosim edhe kufizime për hyrjet nga X. Funksioni i kostos që
duhet optimizuar ka formën:
Ky funksion shpreh objektivin e përafrimit të hyrjeve të X në mënyrë korresponduese
me hyrjet e matricës M. Një shembull mjaft i përdorur është funksioni kuadratik, ku
janë skalarët e dhënë pozitivë.
Një shembull tjetër për funksionin kosto është logaritmi:
nga ku del se për çdo . Vërehet se ky funksion nuk është i
përcaktuar për , pra në lidhje me problemin tonë, duhet të vëmë një kufi
intervalor për , ku është një skalar çfarëdo
pozitiv.
Problemi i transportit. Problemi i transportit është i njëjtë me problemin e
caktimeve, përveç se vlerat nuk janë vetëm 1 ose (-1) dhe numri i hyrjeve dhe daljeve
nuk është i thënë të jetë i barabartë. Problemi ka formën:
10
ku dhe janë skalar pozitivë, që për fizibilitet duhet të plotësojë barazimin
Si një shembull praktik të problemit të transportit, mund të supozojmë se kemi një
terminal me m komunikime, secila e lidhur me një nga n përqëndruesit e trafikut.
Vendosim variablat të cilët marrin vlerën 1 nëse terminali i është i lidhur me
përqëndruesin j. Duke supozuar se përqëndruesi j mund të lidhet me jo më shumë se
terminale, marrim kufizimin :
Po ashtu secili terminal duhet të lidhet ekzaktësisht me një përqëndrues, kemi
kufizimin
Në qoftë se supozojmë se ka një kosto për të lidhur terminalin i me përqëndruesin
j , problemi kalon në gjetjen e kostos minimale, që është të minimizojmë shumën
në lidhje me kufizimet paraardhëse. Ky problem nuk është akoma një problem
transporti për dy arsye të forta:
a) Harqet duhet të jenë patjetër 0 ose 1.
b) Kufizimet , nuk janë kufizime barazimi.
Del se mund të injorojmë kufizimet për me vlera 0,1. Siç u pa në problemin e
rrugës më të shkurtër dhe problemi i caktimeve, edhe nëse e zbutim këtë kufizim dhe
ta zëvendësojmë atë me , gjendet një zgjidhje optimale e tillë që është
0 ose 1. Për të konvertuar mosbarazimin në barazim tek kufizimet mund të futim një
total prej terminale fiktivë që mund të lidhen me kosto 0 me të gjithë
përqëndruesit e trafikut. Po ashtu futet edhe një kulm 0 fiktiv së bashku me kufizimet
dhe ndryshojmë kufizimet mosbarazim tek
.
11
Problemi i transformuar ka strukturën e problemit të transportit dhe është ekuivalent
me problemin origjinal.
Problemi i tregtarit shëtitës: Problemi i referohet një tregtari që donte të gjente
minimumin e kostos për një udhëtim në të cilin ai mund të vizitojë secilin nga N
qytetet e dhëna vetëm një herë dhe të kthehet në fund aty ku filloi udhëtimin. Për ta
paraqitur si një problem në rrjeta, i shoqërojmë çdo qyteti një kulm dhe
futim një hark me kosto . Një udhëtim i tillë është i ngjashëm me një cikël
Hamiltonian, që është përkufizuar si një cikël i thjeshtë që përmban të gjitha kulmet e
grafit. Pra udhëtimi është një nëngraf i lidhur me N harqe që ka ekzaktësisht një hark
hyrës dhe një dalës për secilin kulm. Problemi është të gjejmë udhëtimin me shumë
minimale të kostove të harqeve. Shënojmë me fluksin e harqeve duke kërkuar
që fluksi të jetë 1 ose 0, pasi tregon që harku është ose jo pjesë e udhëtimit. Kostoja e
një udhëtimi U është:
Kufizimet ku secili kulm ka vetëm një hark hyrës dhe vetëm një hark dalës në
udhëtim jepet si më poshtë:
Nëse kufizimet nuk vendosen kështu atëherë ky do të ishte një problem caktimi i
zakonshëm.
1.3 Problemet e klasifikimit.
Problemet e klasifikimit janë parë gjithmonë si probleme optimizimi, ku qëlllimi
është të gjejmë modelin më të mirë për të parashikuar të dhënat. Këto probleme janë
ndër problemet më të studiuara për të dhëna të shumta. Në themel problemet e
klasifikimit përfshijnë realizimin e një marrëdhënieje parashikuese midis vlerave që
kemi dhe vlerave të dëshiruara. Për një bashkësi të dhënë shembujsh, qëllimi i një
algoritmi klasifikimi për të krijuar një model është të paraqes marrëdhënien midis
vlerës së atributit parashikues dhe klasës së vlerave. Po ashtu algoritmi duhet të
klasifikojë edhe shembujt e rinj në klasa në bazë të vlerave të parashikuara nga
atributi. Qëllimi kryesor i një algoritmi të klasifikimit është ndërtimi i një modeli që
maksimizon saktësinë parashikuese, numrin e parashikimeve të sakta. Po ashtu në
shumë aplikime të rëndësishme kuptueshmëria e modelit luan një rol të rëndësishëm.
Për shembull në diagnozat mjekësore modeli i klasifikimit duhet vlerësuar dhe
interpretuar nga mjekët, në kreditime të ndryshme modeli duhet intrepretuar nga
12
eksperti etj. Pra në fusha të tilla është vendimtare prodhimi i modeleve klasifikuese
kuptim-plota. Një problem klasifikimi ka këtë pamje të përgjithshme: Le të jetë
një bashkësi atributesh ku C përmban klasat e atributeve me vlera
diskrete. Shënojmë vlerat e C-së me dhe S një hapësirë
atributesh e lidhur me R. Problemi i klasifikimit është të gjejmë një pasqyrim
të tillë që për të gjithë të dhënat
. Në praktikë rrallë gjendet funksioni f që përcakton
korrektësisht për të gjitha të dhënat korrente dhe të ardhshme. Veçanërisht në fushat e
edukimit bashkësia e të dhënave përmban të dhëna jo konsistente dhe për të
cilat por . [15]
Mund të mendojmë një zgjidhje tjetër për të gjithë të dhënat , duke u caktuar
një shpërndarje probabilitare për gjithë klasat dhe pastaj të zgjedhim
klasën më të mirë të mundshme. Këto lloje klasifikuesish quhen klasifikues
probabilitar. Le të jenë R,C dhe S bashkësi atributesh si më lart dhe M një
klasifikues.
Nëse M përcakton një pasqyrim i tillë që
për , themi se M përfaqëson klasifikim diskriminant.
Nëse M përcakton një pasqyrim i tillë që
për , themi se M
përfaqëson klasifikim probabilitar.
1.5 Pemët e klasifikimit
Një model klasifikimi i përdorur gjerësisht janë edhe pemët klasifikuese, të cilat
përfaqësojnë një formë klasifikuese lehtësisht të paraqitshme grafikisht, me anë të
rregullave të klasifikimit. [40]
Figura 1.5 Pemët klasifikuese
Breiman et.al në 1984 dha një numër të shumtë shembujsh të përdorimit të pemëve të
klasifikimit. Ndër to më i përdoruri ishte rasti kur një pacient pësonte goditje në
zemër, që varej nga impulsi, presioni i gjakut etj. Një varietet informacioni tjetër
merret për moshën e pacientit dhe historinë medicinale. Do të ishte me dobi trajtimi i
pacientëve me goditje në zemër, në bazë të matjeve të marra në spital, për të
13
identifikuar riskun e lartë të sëmundjes tek pacientët që nuk jetojnë pas 30 ditësh nga
goditja e zemrës.
Një pemë klasifikimi që Breiman zhvilloi për këtë problem ishte një pemë vendimi
me tre pyetje. Ajo ishte një pemë klasifikimi binare që përshkruhet si më poshtë:
“ Nëse tensioni minimal sistolik është më i madh se 91 në periudhën fillestare prej 24
orësh, pastaj nëse mosha e pacientit është mbi 62.5 vjeç, pastaj nëse pacienti ka sinus
takikardi, atëherë dhe vetëm atëherë pacienti parashikohet që të mos mbijetojë për 30
ditët e ardhshme”. Tani është e lehtë të sjellim në mend imazhin e një “peme” me të
dhëna të tilla. Një hierarki e tërë pyetjesh janë bërë që vendimi final i marr të varet
nga përgjigjet e të gjitha pyetjeve paraardhëse.
Në mënyrë të ngjashme lidhja midis gjethes dhe pemës në të cilën ajo rritet mund të
përshkruhet me anë të hierarkisë së ndarjes së degëve, duke nisur nga trungu deri tek
dega në të cilën qëndron gjethja. Natyra hierarkike e pemëve të klasifikimit është një
nga tiparet e tyre më themelore, që del më në pah tek pemët e vendimit ku sistemi
fillon nga rrënja e vendimit deri tek gjethet e saj.
Algoritmet e kërkimit të pemës minimale.
Problemi i pemës minimale është një problem klasik, në lidhje me një graf të peshuar
me n kulme dhe m brinjë, ku brinjët kanë pesha , të gjejmë
pemën minimale në graf, me peshë totale të brinjëve minimale. [22]
Dy janë rregullat kryesore për ndërtimin e algoritmeve në pemët minimale: Rregulli i
prerjes (i njohur si rregulli blu i Tarjanit) dhe Rregulli i ciklit (i njohur si rregulli i
kuq). Rregulli i prerjes qëndron pasi për çdo prerje të grafit (ku prerje quhet një
ndarje e kulmeve në dy grupe), brinja me peshë minimale që kalon prerjen duhet të
jetë në pemën minimale. Ky rregull na ndihmon të gjejmë se çfarë të shtojmë në
pemën minimale. Ndërsa rregulli i ciklit qëndron në rastin kur kemi një cikël, brinja
me peshë më të madhe në të duhet hequr, pra kjo brinjë të mos jetë në pemën
minimale. [12]
Shënojmë me C një prerje në grafin G, që ndodh ndërmjet kulmeve s dhe t . Kjo
bashkësi përmban brinjët e tilla, që çdo rrugë ndërmjet s dhe t kalon në të paktën një
brinjë nga C. Kapaciteti i prerjeve C është shuma e të gjitha peshave të këtyre
brinjëve. Le të jetë s-t një prerje nga C= (S,T) një ndarje e V-së e tillë që dhe
. Bashkësia e prerjeve C është: dhe kapaciteti i
prerjeve do të jetë:
ku
Pra duhen përcaktuar bashkësitë S dhe T në mënyrë të tillë që kapaciteti të jetë
minimal. Si problem klasik, është parë shumë herë, por po japim një histori të
shkurtër të optimizimit në lidhje me peshat e brinjëve:
Algoritmi i Boruvkës ishte një nga algoritmat e parë të pemëve minimale që
nga 1926. Jarnik dha algoritmin e tij në 1930, më pas Kruskal e përmirësoi në
14
1956, Prim dha një version të tij në 1957, i pasuar nga Dijkstra në 1959. Të
gjithë këto mund të implementohen rregullisht në kohën Algoritmi i Yaos në 1975 arriti një kohë . Në 1984, Fredman dhe Tarjan dhanë një algoritëm me kohë . Kjo
u përmirësua nga Gabow, Galil, Spencer dhe Tarjan në 1986 për të marr
kohën . Karger,Klein dhe Tarjan arritën tek koha , por ky ishte një algoritëm i
rastësishëm, kështu që kërkimet vazhduan.
Në 1997 Chazelle dha një algoritëm deterministik në kohë , ku
është funksioni i anasjelltë Ackermann
Në 1998 Pettie dhe Ramachandran dhanë një algoritëm optimal, por dinin
kohën e tij.
Për të aplikuar algoritmin e Kruskalit së pari na duhet të renditim peshat e brinjëve
, kjo do një kohë me . Më pas veprojmë me
brinjët, duke shtuar një brinjë në qoftë se dhe vetëm në qoftë se ajo lidh dy kulme që
nuk janë të dyja njëkohësisht në të njëjtën komponente.
Figura 1.6 Algoritmi Kruskal
Në figurën 1.6 jepet një shembull se si mund të shtojmë brinjët 1,2,10,3,4,5. Shohim
se 10-ta mund të shtohet ndërsa 5-a jo. Gjendet një implementim që na lejon të bëjmë
m operacione në kohë të amortizuar, ku është funksioni i anasjelltë
Ackermann, funksion me rritje të vogël. Termi dominohet nga që merret nga renditja për të gjithë kohën e veprimeve.
Supozojmë se P është një graf i lidhur dhe me peshat, Y një nëngraf i tij që
prodhohet nga algoritmi Kruskal. Nëngrafi Y nuk mund të ketë një cikël, gjersa brinja
e fundit e shtuar në atë cikël do të kishte qenë brenda në një nënpemë dhe jo ndërmjet
dy pemëve të ndryshme. Y nuk mund të jetë i palidhur, përderisa brinja e parë e
panumëruar, që bashkon dy komponentet e Y ka qenë shtuar nga algoritmi.
Pra Y është një pemë e pjesshme e P.
Le të jetë Y1 një pemë minimale e pjesshme për P që ka numrin më të madh të
brinjëve të përbashkëta me Y. Nëse Y1=Y, atëherë Y është pema minimale e
pjesshme, në të kundërt le të jetë e brinja e parë e konsideruar nga algoritmi që
ndodhet në Y dhe jo në Y1. Le të jenë C1 dhe C2 komponente nga F ( një bashkësi
pemësh) ku e shtrihet midis hapave, ku e merret në konsideratë. Meqë Y1 është një
pemë, Y1+e përmban një cikël, ku gjenden brinjë të ndryshme f të atij cikli që
shtrihen midis C1 dhe C2. Por Y2= Y1+e-f është po ashtu një pemë e pjesshme. Derisa
e të merret para f në këtë algoritëm, pesha e e-së është pothuajse e barabartë me
peshën e f-së dhe Y1 është një pemë e pjesshme atëherë peshat e këtyre brinjëve duhet
15
të jenë të barabarta. Kështu Y2 është një pemë minimale e pjesshme që ka më shumë
brinjë të përbashkëta me Y sesa me Y1, që kundërshton supozimin tonë në lidhje me
Y1. Kjo tregon se Y do të jetë pema minimale e pjesshme.
Për algoritmin e Prim-it, marrim së pari një kulm rrënjë arbitrar r për të filluar
pemën minimale. Në çdo iteracion marrim brinjën me më pak peshë të lidhur në
pemën tonë korrente T me disa kulme që nuk janë në T, për ta shtuar këtë brinjë në T,
në vazhdim rritet numri në T një nga një. Shohim figurën 1.7 për këtë rast.
Figura 1.7 Algoritmi Prim
Do të përdorim një radhë prioritare në strukturën e të dhënave e cila gjurmon brinjët
me pesha të mëdha në T, deri tek brinjët që nuk janë në T. Secili kulm vendoset në
bashkësinë , pastaj në radhën prioritare. Vazhdon kështu algoritmi.
Le të jetë P një graf i lidhur dhe me pesha të përcaktuara. Në çdo iteracion të
algoritmit Prim, duhet gjetur një brinjë që lidh një kulm të nëngrafit me një kulm
jashtë tij. Kur P është i lidhur, gjendet gjithmonë një rrugë nëpër çdo kulm. Ajo çfarë
gjen algoritmi i Primit është një pemë Y, sepse brinjët dhe kulmet e shtuara tek Y ,
janë të lidhur me kulme dhe brinjë të tjera të Y, ku nuk gjendet një iteracion që
formon një cikël pasi çdo brinjë e shtuar lidh dy kulme në dy bashkësi të ndara. Po
ashtu Y përfshin të gjithë kulmet nga P pasi Y është një pemë me n-kulme, njësoj sa
P. Le të kemi Y1 një pemë minimale të pjesshme për P. Nëse Y=Y1 atëherë vërtetimi
është i kompletuar. Nëse jo gjendet një brinjë në Y që nuk është në Y1. Le të jetë e
brinja e parë që u shtua kur Y u ndërtua. Kemi V bashkësinë e kulmeve të Y-e. Pra
një kulm i e-së është në Y, kulmi tjetër jo. Përderisa Y1 është një pemë minimale e
pjesshme e P, gjendet një rrugë që bashkon dy kulme nga e-ja. Nëse ecim gjatë rrugës
gjejmë një brinjë f që bashkon një kulm në V me një kulm jo në V. Tek iteracioni kur
e-ja u shtua në Y , f mund të ishte shtuar po ashtu , ndoshta në vend të e-së, nëse
pesha e saj do të ishte më pak se e e-së. Gjersa f nuk është shtuar atëherë del se
Quajmë Y2 pemën që përftohet nga heqja e f-së dhe shtimi i e-së nga
Y1. Del se Y2 është një pemë që ka më shumë të përbashkëta me Y sesa Y1. Nëse
Y2=Y atëherë vërtetimi është i kompletuar. Nëse jo mund të gjejmë një pemë Y3, me
një brinjë më shumë të përbashkët me Y sesa me Y2. Duke vazhduar kështu del një
pemë me më shumë të përbashkëta me Y. Përderisa brinjët e Y janë një numër i
16
fundëm atëherë eventualisht gjendet një pemë Yh që është identike me Y. Kjo tregon
se Y është pema minimale e pjesshme.
Algoritmi Boruvka ndryshe nga Kruskal dhe Prim, shton shumë brinjë në paralel
dhe mund të implementohet pa ndonjë strukturë triviale. Thjesht hiqet brinja me
peshë më të madhe, ku nëse peshat e brinjëve janë të dallueshme qartë, kjo garanton
një pyll të tërë. Për secilën pemë në këtë pyll ,shohim në mënyrë rekursive grafin, në
gjurmët e secilës brinjë që kemi zgjedhur në çdo hap. Kjo gjë kërkon kohë dhe
gjatë kësaj kohe garantohet një tkurrje e të paktën gjysmës së kulmeve, që për këtë
koha totale është . Në figurën 1.8, brinjët me të kuqe do të zgjidhen në të
njëjtin hap, duke lënë grafin që duket në të djathtë dhe ku ngjyrat caktojnë
komponentët.
Figura 1.8 Algoritmi Boruvka
1.5 Pemët e vendimit dhe analiza e tyre.
Pemët e vendimit janë një mjet popullor dhe i fuqishëm për klasifikim dhe
parashikim. Kjo tërheqje e madhe për pemët e vendimit është e lidhur me faktin që
ndryshe nga rrjetat neurale, pemët e vendimit përfaqësojnë rregulla. Këto rregulla
mund të shprehen thjesht, që njerëzit t’i kuptojnë ato ose t’i përdorin në bazë të
dhënash, apo gjuhën e programimit SQL, që lidh të dhënat në një sistem bazë
menaxhimi.
Në mjaft aplikime saktësia e klasifikimit ose parashikimit është problemi kryesor. Në
këto situata nuk na duhet si dhe pse punon modeli, në situata të tjera mundësia për të
shpjeguar arsyen e një vendimi është vendimtare. [5]
Ka mjaft zbatime në fusha të ndryshme, sidomos në marketing për të pasur sukses në
produktet e reja. Le të shohim një shembull të thjeshtë ku kërkohet një vendim për të
hapur një dyqan të ri.
Shembull 1. Një person dëshiron të vendosë për të hapur një dyqan karamelesh apo
një tendë me pije të shtrydhura. Nëse hap dyqanin ai ka mundësi të fitojë 100$, nëse
hap tendën ai mund të fitojë 90$. Deri këtu mendon për versionin e parë. Më pas nga
zgjedhja e parë ka mundësi 50% të jetë me sukses dhe 50% për të falimentuar. Nëse
ka sukses fiton 100$, nëse humb ka (-30%). Për zgjedhjen e dytë ka 50% mundësi të
jetë me sukses dhe 50% për të humbur, por nga suksesi fiton 90$, ndërsa nga humbja
-10$. Cilën të zgjedh ai?
17
Figura 1.9 Shembull Vendim-marrje
Një vlerë mesatare për rastin e dyqanit të karameleve do të ishte :
Një vlerë mesatare për rastin e tendës është:
Në këtë rast vendim-marrësi zgjedh alternativën që mendon se është më e mirë. Këto
vlera janë jo gjithmonë njësoj, pasi varen në mënyrë probabilitare.
Një pemë vendimi është një klasifikuese në formën e një strukture pemë, ku çdo kulm
është:
Një kulm gjethe- tregon vlerën e atributit të etiketuar në një klasë.
Një kulm vendimi – specifikon disa teste të kryera në një kulm të vetëm
atributi, me një degë dhe një nën-pemë për çdo rezultat të mundshëm të testit.
Pema e vendimit përdoret për të klasifikuar një shembull duke filluar nga rrënja e
pemës dhe duke lëvizur nëpër të deri tek një kulm-gjethe, që siguron klasifikimin e
momentit. Disa karakteristika për pemët e vendimit janë:
Përshkrimi i vlerave të atributeve: Një objekt ose një rast mund të shprehet në
terma të një koleksioni të fiksuar vetish ose atributesh. Kjo do të thotë se kemi
nevojë për të bërë diskret atributet e vazhdueshëm, ose të parashikohet në
algoritme.
Atribute të klasave të etiketuara: Kategoritë në të cilat shembujt duhet të
caktohen duhet të jenë ndërtuar më përpara.
Klasa diskret: Një rast i përket ose jo një klase të veçantë, duhet të jenë më
shumë raste se klasa.
Të dhëna të mjaftueshme: Zakonisht 100 ose 1000 raste të testuara.
18
Kriter vlerësimi në algoritmet e pemëve të vendimit është përzgjedhja e atributit për
t’u testuar në secilin kulm vendimi të pemës. Qëllimi është të përzgjedhësh atributin
që është më i përdorshëm për të klasifikuar shembujt. Një masë sasiore për një atribut
është një veti statistike e quajtur IG Përftim Informacioni, që mat sa “mirë” një
atribut i dhënë ndan shembujt në klasat e tyre të etiketuara. Kjo masë përdoret për të
përzgjedhur atributet në çdo hap pasardhës, derisa pema të rritet. Algoritmi kryesor që
përdor këtë veti është ID3, si algoritëm i ndërtimit të pemëve të vendimit. Ka edhe
përmirësime të tij, që mund t’i shohim më së miri në kapitullin e dytë.
Një problem i rëndësishëm është marrja e një vendimi të vetëm në një pikë të caktuar.
Supozojmë se njohim problemin e marrjes së një vargu vendimesh përgjatë një
periudhe të caktuar. Secili nga këto vendime mund të varet në vendimet para tyre që
mund të çojnë në një bashkësi alternativash probabilitare. Duam të specifikojmë një
vendim-marrje optimale që do të mbulojë të gjitha kontigjentet. Një paraqitje grafike
e orientuar drejt zgjidhjeve të problemave të vendimit me shumë shkallë quhet analiza
e pemës së vendimit. Këtë mund ta ilustrojmë më mirë me anë të një shembulli.
Shembull 2. Kompania e prodhimit Fadko është përfshirë në prodhimin e një
produkti të ri rajonal. Ky produkt ka një natyrë të tillë që tenton të jetë sa i
suksesshëm aq i pa suksesshëm. Nëse produkti është i suksesshëm priten fitime bruto
100.000$, nëse është i pa suksesshëm vetëm 20.000$. Fadko duhet të marr një
vendim të menjëhershëm të zgjedh një nga tre mundësitë :
1. Të testojë tregun e produktit me kosto 10.000$.
2. Menjëherë të tregtojë produktin rajonal me një kosto 50.000$.
3. Të bjerë produkti.
Nëse produkti testohet në treg rezultatet do të klasifikohen si të favorshme ose jo të
favorshme dhe atëherë duhet marr vendimi kur të tregtojnë produktin rajonal ose kur
të mos e bëjnë më këtë. Nëse rezultatet e testit të tregtimit janë të favorshme
vlerësimet e manaxhimit tregojnë se probabiliteti i suksesit në tregun rajonal është
0.80, nëse është jo i favorshëm probabiliteti i suksesit është vetëm 0.30. Nga
eksperiencat e kaluara Fadko ka pasur shanse 50-50 për favorizim të rezultateve të
testimit të tregut. Pa pasur rezultatet e testimit të tregut probabiliteti i një marketingu
të suksesshëm të produktit rajonal besohet se është më pak se 0.5 , ndërsa manaxhimi
ka vendosur një probabilitet 0.45. Çfarë kursi veprimi duhet të ketë për qëllim Fadko?
Përderisa ky lloj problemi përfshin një varg vendimesh atëherë do të strukturojmë
zgjidhjet e problemit tonë. Na duhet një paraqitje grafike , e quajtur pemë e vendimit
për të gjetur lidhjen ndërmjet ngjarjeve, probabiliteteve, përftimeve dhe humbjeve.
Objektivi ynë në këtë problem është përcaktimi i vargjeve të vendimeve që do të
maksimizojnë përfitimin e pritur. Në përcaktimin e ngjarjeve dhe veprimeve do të
diferencojmë në varësi të pikave të ndryshme në kohë.
19
Pra kemi gjashtë ngjarje të ndryshme që do t’i shënojmë me :
rezultat i favorshëm i testimit në treg,
rezultat jo i favorshëm i testimit në treg,
sukses i menjëhershëm i tregtimit rajonal,
jo sukses i menjëhershëm i tregtimit rajonal,
sukses i tregtimit rajonal pas testit,
pa sukses tregtimi rajonal pas testit.
Pesë veprimet e marra në konsideratë janë:
testimi i tregut,
tregtim rajonal i menjëhershëm,
produkti të mos hidhet menjëherë,
të tregtohet në rajon pas testit të tregut,
të mos tregtohet pas testit të tregut.
Veprimet përfaqësojnë fazën e parë të vendimit, pikën më të hershme në
kohë, ndërsa veprimet që vijnë pasi të testohet tregu përfaqësojnë hapin e
dytë të vendimit në këtë problem. Për të krijuar disa ide se si do të jetë pema e
vendimit do të ndërtojmë një tabelë si më poshtë: për secilin hap vendimi do të kemi
dy kolona të quajtura e para “Veprime” dhe e dyta “Ngjarje”. Në kolonën e parë
shënojmë “Veprime” dhe lëmë pak hapësirë pastaj shënojmë “Ngjarjet”. Tek e dyta
ngjarjet e mundëshme i shoqërojmë me veprimet e kolonës së parë. I lidhim me anë të
drejtëzave këto ngjarje dhe veprime. Në kolonën e tretë vijnë veprimet dhe në
kolonën e katërt ngjarjet .
Veprime Ngjarje Veprime Ngjarje
A1 E1 A4 E5
A5 E6
E2 A4 E5
A2 E3 A5 E6
E4
A3
Tabela 1.1. Tabela e veprimeve dhe ngjarjeve
Tani mund të ndërtojmë pemën e vendimit : secila bashkësi veprimesh për një hap të
dhënë janë shënuar me numra brenda në katrorë, ndërsa ngjarjet me rrathë.
20
E5 40
A4
E6 -40
-10
A5
E1 40
E5
-40
A4 E6
E2
A1
-10
A5
A2 50
E3
A3 -30
E4
0
Figura 1.10 Pema veprime-ngjarje
Pasi është vizatuar pema bazë, shtohen vlerat e kërkuara numerike. Përftimet
vendosen në degët e ngjarjeve, kostot në degët e veprimeve. Përftimet neto në
kolonën në të djathtë janë marr nga shumimi i vlerave monetare nëpër degë. Pra kosto
e tregtimit është 10.000$, kosto e tregtimit rajoanl është 50.000$, suksesi i produktit
ka një fitim 100.000$ me një rezultat përftimi neto 40.000$. Po ashtu llogariten vlerat
e tjera.
Vlera neto e pritshme për degën 1-2-A4 është (0.8).(0.40)+(0.2).(-40)=24$, si një
vlerë e pritshme optimale në atë pikë. Ndërsa 1-3-A4 ka një përftim neto të pritshëm
(0.3)(0.40)+(0.7)(-40)=-16 (-16.000$)
A4 24
E1 A5 -10
A4 -16
A1 E2 A5 -10
A2 E3 50 2
A3 E4
-30
0
Figura 1.11 Vlerat e pritshme të veprimeve në hapin e dytë
1
2
3
1
2
3
21
Si alternativë më e mirë mbetet të hidhet produkti tek alternativa A5 me -10.000$. Po
ta rishohim proçesin me vlerat e pritshme për veprimet A1, A2, A3 duke nisur nga
rrënja kemi:
7 (0.5)(24)+(0.5)(-10)=7
A1 A2 6 (0.45)(50)+(0.55)(-30)=6
A3 0
Figura 1.12 Vlerat e pritshme të veprimeve tek hapi i parë
Në këte pikë problemi quhet i zgjidhur. Fadko duhet ta testojë tregun me një vlerë të
pritshme prej 7000$. Tani duhet të specifikojmë të gjithë vendimet optimale duke
gjetur alternativat e preferuara pas testimit të tregut. Pra më së miri duhet të zgjedhim
veprimin A1, pastaj nëse ndodh E1 do të zgjedhim veprimin A4 , nëse ndodh E2
atëherë do të zgjedhim A5.
Kthehemi pas dhe mendojmë: Çfarë do të ishte me vlerë për të pasur informacion
perfekt për këtë problem? Informacionin e duhur për suksesin ( ngjarja E3) ose të
falimentit (ngjarja E4) do të ishin me vlerë të madhe. Nëse Fadko do ta dinte atë do të
zgjidhte menjëherë A2 dhe E3, po ashtu edhe për falimentin. Duke mos pasur kontroll
mbi probabilitetet e suksesit dhe të mos suksesit të tregut, vlera e pritshme e fitimit
për vendimmarrjen shënohet . Nga rezultatet e llogaritura vlera e pritshme për
fitimin mund të përkufizohet si:
ku EPPI është vlera e pritshme e fitimit me informacion perfekt, EMW vlera e
pritshme monetare.
Ngjarje P(Ei) Veprimi optimal Përftimi Përftimi i peshuar
E3 0.45 A2 50 22.5
E4 0.55 A3 0 0
Fadko duhet të ofroj për të paguar më shumë se 15.500$ nëse kompania merr
informacion perfekt atëherë tregtimi do të jetë i suksesshëm.
Në këtë shembull vendimet duhen vlerësuar në dy pika, pra kemi dy stade vendimi.
Në pikën 1 të pemës është stadi i parë, ndërsa në pikat 2 dhe 3 të pemës stadi i dytë.
Siç shihet një paraqitje grafike kalon më shumë se 3 stade dhe më pas për të
klasifikuar kërkon llogaritje kompjuterike. Së fundmi japim një proçedurë gjenerale
për të zgjidhur problemet manualisht duke përfshirë vendimet sekuenciale.
1. Përcaktohen veprimet dhe ngjarjet, numri i stadeve.
2. Përpilohet një tabelë për të paraqitur veprimet dhe ngjarjet, hap pas hapi në
stade të caktuara.
1
22
3. Bëjmë një paraqitje sesi mund të duket pema së bashku me degët e saj. Lëmë
hapësirë për shpjegime.
4. Etiketojmë ngjarjet dhe veprimet së bashku me probabilitetet e tyre.
5. Kërkojmë çdo degë nga e majta në të djathtë duke llogaritur shumën e vlerave
të pritura në secilën.
6. Nga e djathta në të majtë përcaktojmë vlerën optimale për secilin kulm në të.
7. Kur të arrijmë tek kulmi 1 me vlerën optimale të përcaktuar gjurmojmë
sekuencën optimale nëpër degë.
1.6 Pemët binare.
Lloji i parë i atributeve të përdoruar në analizën e të dhënave janë atributet binarë, të
cilat mund të marrin vetëm dy vlera. Zbatimet më të ndeshura janë kodimet e
ndryshme që mund të bëhen në modele matematike. [3]
Çdo lloj atributi cilësor ose numerik ekuivalentohet me numrat 0 dhe1. Në qoftë se
atributet janë kategorike, të njohur si atribute diskret, atëherë vlera e atributit do të
jetë një nga numrat binarë. Gjendet një nënklasë e atributeve kategorikë që është
klasa e atributeve ordinal ( të renditur). Vlerat e këtyre atributeve merren nga një listë
e limituar vlerash të renditura, ku mund të krahasohen dy vlera dhe mund të themi
çfarë është më shumë dhe çfarë është më pak. Zakonisht kulmet pasardhëse të një
kulmi janë quajtur fëmijë, ndërsa kulmi paraardhës i tij është quajtur prind. Le të
shohim disa lloje pemësh binare.
Një pemë binare quhet grafi ( , )T V E që ka vetitë e mëposhtme :
1. 1E V .
2. Për çdo çift kulmesh 1 2,v v V , gjendet një shteg nga 1v tek 2v .
3. Fëmijë v V janë ata u V të cilët janë incident me v dhe thellësia e tyre
është 1 më larg sesa v .
4. Çdo v V ka zero ose dy fëmijë.
Figura 1.13 Paraqitja e një peme binare
Pema binare e përgjithshme është një pemë që ka një rrënjë nga ku çdo kulm ka të
shumtën dy fëmijë.
23
Pema binare e plotë, zakonisht e quajtur pemë-2 (pemë dyshe), është pema në të cilën
çdo kulm , përveç gjetheve, ka dy fëmijë.
Një pemë perfekte binare është një pemë e plotë në të cilën të gjitha gjethet janë në të
njëjtën thellësi ose në të njëjtin nivel.
Një pemë binare e pafundme është një pemë me disa nivele, kur për çdo nivel d të
zgjedhur numri i kulmeve ekzistuese është 2d, në fakt paraqet më së miri strukturën e
bashkësive të Kantorit. Intervali i pemës është imazhi i vazhdueshëm i bashkësive të
Kantorit, shpesh quhet edhe hapësira e Kantorit.
Një pemë binare e balancuar quhet kur thellësia e të gjitha gjetheve të ndryshme
ndryshon me të paktën një lidhje. Këto janë pemë të parashikueshme për thellësinë e
tyre pasi është sa , ku n tregon numrin e kulmeve të pemës së balancuar.
Pema e plotë binare në rrënjë identifikohet me një magmë të lirë.
Një pemë gjeneratë është pema ku për çdo kulm prind, gjendet vetëm një kulm tjetër
fëmijë.
Kodet binarë
Për materialet në përgjithësi ekzistojnë dy lloje gjendjesh ose më tepër. Kur kalohet
nga njëra gjendje në tjetrën mund të modelojmë me variablat 0 dhe 1.
Të gjitha shkronjat kanë dy paraqitje të mëdha dhe të vogla, po ashtu si shumë
simbole në matematikë që kanë vlerë të madhe dhe të vogël. Shumica e tyre janë të
koduara në informatikë në kodin ASCII.
Si të ndërtojmë prefikset me anë të kodeve?
Pemët binare përdoren për të ndërtuar prefikset nga një bashkësi e caktuar me
simbole. Ndërtojmë një pemë binare arbitrare gjethet e së cilës lidhen në mënyrë
bijektive me këto simbole. Pra në fund çdo gjethe ka një simbol të ndryshëm. Gjithë
degët që dalin nga ana e majtë i shënojmë me zero, kurse ato që dalin nga ana e
djathtë me njësh. Kështu që çdo simbol i korrespondon fjalës kod të formuar nga
degët të kaluara nga rrënja në gjethe. Supozojmë se kemi në dispozicion këto shtatë
gërma . Për të ndërtuar pemën binare që përfaqëson kodet prefiks
kemi:
Tabela 1.2 Tabela Gërmë-Kod
Gërma a B c D e f g
Kodi prefiks 000 0010 0011 0101 011 100 101
24
Figura 1.14 Pema binare prefiks-kod.
Pema Kuq e Zi
Pema Kuq e Zi është një lloj peme binare e vetë balancuar, ku secili kulm ka një
ngjyrë të kuqe ose të zezë. Balancimi i referohet pikërisht këtij fenomeni, ngjyrimi
me dy ngjyra i kulmeve, por po ashtu mund të shihet edhe disbalanca nëse mungojnë
ngjyrime. Kërkimi i balancës është i rendit O(log n) herë, ku n është numri total i
kulmeve në pemë. Çdo ndërhyrje për të fshirë apo shtuar po ashtu performohet në
O(log n) kohë.
Në 1972 Rudolf Bayer shpiku një strukturë të dhënash që ishte një rast i veçantë i
pemëve binare. Këto pemë përmbanin shtigje nga rrënja në gjethe me numër të njëjtë
kulmesh që krijonin pemë binare të balancuara. Bayer i quajti ato “ pemë simetrike
binare” në shkrimin e tij, më vonë ai i bëri ato popullore me emrin 2-3-4-pemësh.
Në 1978 artikulli “Një kornizë dy ngjyrëshe për pemët e balancuara” nga Leonidas
J.Guibas dhe Robert Sedgewick derivuan pemët kuq e zi nga pemët simetrike binare.
Ngjyra e kuqe ishte zgjedhur pasi ishte ngjyra që dukej më mirë nga printeri i asaj
kohe dhe njëkohësisht vetëm dy ngjyra stilolapsash ishin në atë kohë.
Në 1993 Andersson futi idenë e pemëve binare të djathta, për të thjeshtuar
operacionet e futjes dhe fshirjes nëpër pemë.
Në 1999 Okasaki tregoi si të futeshin funksione të pastra, duke ruajtur balancën e
pemës.
Në 2008 Sedgewick propozoi pemën e majtë kuq e zi, duke lëvruar idenë e Andersen
që thjeshtëzonte algoritmat.
Një shembull i këtyre pemëve është edhe lidhja fisnore fëmijë-prind-xhaxha
Rasti kur prindi dhe xhaxhai kanë një ngjyrë
25
Figura 1.15a Pema Kuq e Zi, prindi- xhaxha
Rasti kur prindi dhe xhaxhai (daja) kanë ngjyra të ndryshme.
Figura 1.15b Pema Kuq e Zi prindi- xhaxha
Figura 1.15 c Pema Kuq e Zi, prind- xhaxha
Nëse prindi është në një kulm me të kuqe dhe xhaxhai është i zi fjalia “ Nëse një kulm
është i kuq atëherë, të dy fëmijet e tij janë të zinj “ nuk ndeshet. Operacione të
26
ndryshme mund të kryhen në varësi, nëse kulmi është fëmija i majtë apo i djathtë i
ndonjë prindi, mund të transformojnë strukturën e pemës .
Kjo gjë shihet në figurën 1.15c, si alternohen këto vlera
Renditja e numrave
Një aplikim i rëndësishëm në renditjen e numrave është edhe pema kërkim binare
(BST). Supozojmë se k përfaqëson vlerën e një kulmi, atëherë një pemë kërkimi
binare ka vetinë e mëposhtme:
Gjithë fëmijët majtas kulmit kanë vlera më të vogla se k dhe ata djathtas k, kanë vlera
më të mëdha se k.
Duhet theksuar se pema duhet të jetë binare e balancuar për të kryer këtë renditje.
Supozoj se duam të renditim numrat 16,38,20,9,13,45,40, që mund të përdorim
algoritmin e kërkimit binar . Ai fillon duke gjetur elementin e mesëm në këtë listë dhe
më pas krahason këtë element me kufirin e sipërm Ub (Upper bounded) dhe të
poshtëm Lb ( Lower bounded)
Algortimi BST Binary Search Tree
Int function Binary search ( Grupi A, int Lb, int Ub, int k)
Fillo
Bëj gjithmonë
M=(Lb+Ub)/2;
Nqs (k A(M)) atëherë
Ub=M-1;
Përndryshe nqs (k A(M)) atëherë
Lb=M+1
Përndryshe
Rikthehu M;
Nqs (Lb atëherë
Rikthehu -1
Fund
27
Në vargun që kishim 16,38,20,9,13,45, 40 shohim se vlera e mesit është numri 20, i
cili mund të shërbejë si një rrënjë e pemës binare. Majtas saj vendosen vlerat më të
vogla, ndërsa djathtas vlerat më të mëdha.
Figura 1.16 Renditja e elementëve me anë të BST.
Kështu lexojmë nga e majta në të djathtë gjithë pemën duke pasur këtë renditje:
9,13,16,20,38,40,45
Një pyetje shqetësuese është “ Sa pemë binare të ndryshme mund të formojmë ne me
numër të njëjtë kulmesh?”. Pra është rasti i një kombinatorike të panumërueshme, e
cila mund të derivojë formula rekursive.
Shënoj numrin e pemëve binare me n kulme, ku si rrënjë e pemës. Për
, një pemë binare me n kulme ka një nënpemë të majtë me j kulme dhe një
nënpemë të djathtë me n-1-j kulme, për . Po të shënoj me nënpemën
e majtë të mundëshme dhe nënpemën e djathtë të mundëshme rezultati
shpreh kombinatorikën e majtë dhe të djathtë të nënpemëve të pemës T.
Ky relacion rekurence është i njohur si Rekursioni i Katalanit, ku quhet numri i n-
të i Katalanit. Në rast kur n=2 dhe n=3 atëherë . Për një pemë me tre
kulme kemi pesë mënyra të ndryshme pemësh binare:
Figura 1.17 Llojet e pemëve binare me tre kulme
Nga ekuacioni i mësipërm numri i pemëve të ndryshme binare të ndërtuara për n
kulme është:
28
1.7 Minimizimi i numrit të kulmeve të pemës së vendimit.
Problemi i minimizimit të pemës së vendimit kërkon së pari të tregojmë një hipotezë
për bashkësinë e përzgjedhur nga baza e të dhënave, që do të quhet edhe bashkësia
trajnuese dhe më pas të vlerësojmë saktësinë e saj me anë të një bashkësie test të
dhënash nga ato. Megjithatë mund të përftojmë matje më të sofistikuara nëse e
konsiderojmë të kufizuar problemin e gjetjes së pemës më të vogël të vendimit me
një bashkësi trajnuese të dhënash.
Le të jetë një bashkësi të dhënash, Ƒ një bashkësi karakteristikash me
vlera boolean dhe një ndarje e E-së. Shënojmë vlerat 0 ose 1 të
karakteristikave ku . Le të jetë një pemë binare me rrënjë
X është bashkësia e kulmeve, U bashkësia e brinjëve, nëse L është bashkësia e
gjetheve të pemës T atëherë L X . [17]
Një pemë vendimi e bazuar në pemën T, është një pemë e etiketuar ku çdo kulm i
brendshëm është etiketuar me një element nga Ƒ, që shënohet Çdo
brinjë etikohet me një vlerë booleane ku
Përmasa e pemës së vendimit është numri i kulmeve të T. Për një të dhënë
shënojmë rrugën të T nga rrënja r tek gjethja l. Për çdo vlerë mund t’i
shoqërojmë një gjetheje të vetme të tillë që për çdo brinjë në kemi . Një pemë vendimi klasifikon bashkësinë e të dhënave E në
qoftë se për çdo çift kemi që .
Pra për një bashkësi të dhënë E, duam të ndërtojmë një pemë vendimi që i
klasifikon të dhënat me një numër minimal kulmesh. Një kulm vendimi nga i cili
nuk dalin më alternativa quhet një gjethe vendimi.
Tiparet kategorike mund të shifrohen numerikisht dhe mund të përfaqësohen nga
bashkësia binare e vlerave. Karakteristikave Booleane i korrespondojmë ndarje të
barabarta në mënyrë të tillë:
Standarte është ndarja numerike e të dhënave me anë të mosbarazimit
Duke i bashkuar të dyja këto lloje të ndarjeve mund të shënojmë karakteristikat e dyta
kështu:
29
Për shembull le të kemi , tre karakteristika
tiparesh dhe të dhënat. Numërimi binar do të jetë si më poshtë : 0100
0001 1000 0111 0001 1111, në bashkësinë e vlerave booleane 1 3 '1 '3
1 4 1 4,..., , ,...,f f f f .
1.8 Etiketimi i çdo kulmi me të shumtën një tipar.
Problemi SAT është një problem caktimi vlerash në mënyrë të tillë që të plotësohet
çdo kufizim i problemit. Ky model përdoret për të gjetur një pemë vendimi optimale
që klasifikon të dhënat. Pra çdo kulmi duhet t’i caktojmë një tipar.
Për një pemë binare të dhënë dhe një bashkësi E, prezantojmë një
formulë SAT që plotësohet nëse gjendet një pemë vendimi e bazuar në T që
klasifikon të gjithë E-në. [19]
Le të jetë Ƒ një bashkësi tiparesh Ƒ dhe dy vlera që
kanë një vlerë të ngjashme në bashkësinë e tipareve ku
dhe një vlerë të ndryshme në bashkësinë
Ƒ . Modeli SAT duhet të sigurojë që dhe nuk janë shoqëruar
me të njëjtën gjethe. Përgjithësisht dhe nuk janë të shoqëruara me të njëjtën
gjethe nëse ekziston një brinjë e tillë që:
Tek sigurohemi se nëse kanë x si një “stërgjysh” të
përbashkët ato shfaqen në një nga dy nënpemët me rrënjë x. Në rastin tjetër
sigurohet që asnjëra nga ose nuk është
e njëjtë me l , pasi të dyja do të qëndrojnë në degën e kundërt të fëmijës së x.
Kodimi kulm-tipar bëhet me anë të caktimit të një saktësie ku tregon se
kulmi x është etiketuar me tipatin f. Për çdo çift , për çdo
ndërtojmë një klauzolë që harron se janë klasifikuar në l. Nga më sipër
supozojmë se gjendet një rrugë e tillë që është fëmijë i majtë i
dhe l është fëmijë i djathtë i . Klauzola jonë do të jetë
ku tregon se është etiketuar me një tipar
që ndodhet midis dhe sepse . Klauzola tregon se tipari që
etiketon do të klasifikojë së bashku dhe në degën që nuk të çon tek gjethja l
sepse përdor fëmijën e majtë të ku .
Formalisht klauzolat janë këto :
30
Klauzola e mëposhtme tregon se secili kulm etiketohet me të shumtën nje tipar:
Kemi shtuar klauzola të tepërta duke specifikuar që dy kulmet të së njëjtës rrugë nuk
duhet të marrin të njëjtin tipar, pasi përshpejton proçesin e rezolucionit :
1.9 Vështrim i përgjithshëm mbi kompleksitetin.
Le të marrim në shqyrtim problemet e optimizimit në lidhje me një graf me n kulme dhe m brinjë. Një përqasje e paraqitjes së një grafi është caktimi i
një matrice ku:
Kjo matricë ka n2 elemente. Fakti se tregon se gjendet një brinjë nga në
dhe se tregon që nuk ka një brinjë të tillë. Vërehet se matrica e grafit të
paorientuar është simetrike. Një graf i paorientuar mund të ketë rreth
brinjë. Në rastin e grafeve të rrallë është më mirë të përfaqësohet grafi i dhënë me anë
të një liste afërsie. Për çdo kulm ndërtojmë bashkësinë të
kulmemeve që janë afër me të. Meqë çdo brinjë kontribuon me 2 në gjatësinë e listës
atëherë duhet të mendojmë për 2m elementë. Faktori tjetër që ndikon në gjatësinë
totale të paraqitjes është mënyra e kodimit të kulmeve. Alfabeti ynë ka numër të
fundëm shkronjash, por po supozojmë se ka elementët . Na duhet kështu
njësi për të koduar një kulm të vetëm. Pra për të gjithë grafin duhen
simbole. Praktikisht themi se grafi G mund të kodohet në hapësirën që duket si kontradiktor me atë më sipër. Ka një arsye të veçantë pasi kompjuterat i
trajtojnë njësoj me radhë të gjithë numrat e plotë. Hapësira regjistron nga 5 njësi deri
ne 312
njësi. Supozojmë se po studiojmë grafet me numër kulmesh ndërmjet këtyre
njësive. Shumica e kompjuterëve e ka hapësirën 0 deri në 231
ku kemi numrat e plotë
me 32 bite. Kështu është një përafrim i arsyeshëm i madhësisë së grafit duke u
pranuar në praktikë edhe në lidhje me m brinjët. Në shumicën e rasteve merren në
konsideratë të dy parametrat m dhe n. [19]
Një çështje mjaft e rëndësishme që del nga problemet kombinatoriale të optimizimit
është klasifikimi i problemeve të vështira ( Papademitriou dhe Steiglitz, 1998). Për të
31
bërë dallimin ndërmjet problemeve të thjeshta dhe të vështira, mendohet të
konsiderojmë klasën e problemeve që zgjidhen nga makinat deterministe të Turingut
në kohë polinomiale dhe problemet që zgjidhen nga makinat jo deterministe të
Turingut në kohë polinomiale. Një makinë e Turingut përbëhet nga një “proçesor” që
mund të jetë në një numër të fundëm gjendjesh dhe nga një shirit me gjatësi të
kufizuar. Mbi të gjitha gjendet një “kokë lexo-shkruaj” që mund të lexojë simbolet e
shiritit një në një kohë. Në varësi të gjendjes së proçesorit dhe leximit të simboleve,
proçesori kalon në një gjendje tjetër , simboli në shirit ndryshon dhe shiriti lëviz një
pozicion në të majtë ose në të djathtë. Matematikisht një makinë Turingu është një
funksion i M-së që është bashkësia e gjendjeve të proçesorit dhe ∑ bashkësia e të
gjithë simboleve që mund të shkruhen në shirit :
Funksioni T paraqet një “iteracion” që tregon se nëse
proçesori është në gjendjen m dhe simboli i lexuar në shirit është , atëherë gjendja e
ardhshme do të jetë , simboli do të ndryshohet me dhe shirirti do të lëviz një
pozicion në të djathtë. Po ashtu ka të njëjtin kuptim vetëm se
shiriti lëviz majtas. [39]
Nuk është qëllimi të karakterizojmë klasat P dhe NP me anë të makinave të Turingut
por pëlqejmë të përshkruajmë karakteristikat dhe nocionet e lidhura me këto klasa në
një nivel edhe më intuitiv. Kjo çon në një përkufizim të ri të problemeve që i përkasin
P. Do të themi se problemi është në P nëse ai mund të zgjidhet me anë të një
algoritmi polinomial në kohë.
Shembuj problemash që mund t’i përkasin kësaj klase janë problemi i rrugës më të
shkurtër dhe problemi i gjetjes së pemës së pjesshme minimale. Klasa që shoqëron
problemet e vështira quhet klasa NP (jo determinist në kohë polinomiale). Në mënyrë
tipike klasa NP është e kufizuar më shumë tek problemet e vendimit, sidomos tek ato
që përbëhen nga atribute binarë të formës “Po” ose “JO”. Ky kufizim ka një prapavijë
teknike që kap themelin e problemeve pa i thjeshtësuar shumë ato. Një problem
vendimi është i tipit NP nëse çdo zgjidhje e dhënë e problemit mund të verifikohet në
kohë polinomiale. Pra nuk është e rëndësishme që zgjidhja të llogaritet në kohë
polinomiale por që ajo të verifikohet në kohë polinomiale. Patjetër që
qëndron ( abuzojmë pak simbolikisht duke kufizuar P-të në problemet e vendimit)
dhe gjerësisht dihet se . Le të shënojmë me P klasën e problemave të
vendimit që janë të zgjidhshme në një kohë polinomiale. Themi se një problem
kërkimi i përcaktuar nga një relacion R është një problem NP kërkimi nëse relacioni
llogaritet në mënyrë efikase dhe zgjidhjet nëse ekzistojnë janë të shkurtëra.
Formalisht R është NP nëse gjendet një algoritëm me kohë polinomiale që për të
dhënë vendos kur dhe nëse gjendet një polinom p i tillë që nëse
32
Me anë të algoritmeve të grafeve, mund të kufizojmë kohën e
veprimeve polinomialisht me m dhe n, duke përftuar një algoritëm polinomial në
kohë. Supozoj se kemi numrin e plotë më të madh nga të dhënat. Një algoritëm
A do të quhet pseudo-polinomial nëse është polinomial në masën e të dhënave dhe
. Vërehet se mund të kodohet nga bite. Kështu një funksion që
është polinomial në dhe , nuk është e thënë të jetë polinomial në përmasat e të
dhënave. Në rastet kur është e kufizuar nga një polinomial në , A është
algoritëm polinomial në kohë.
33
Kapitulli 2
Aspekte algoritmike në rrjetat vendim-marrëse
2.1 Teoria e rrjetave e aplikuar në pemët e vendimit
Teoria e vendim-marrjes është zhvilluar që nga mesi i shekullit të 20-të, përmes
kontributeve nga akademik të disiplinave të ndryshme. Këta akademik janë nga
radhët e ekonimistëve, statistikanëve, psikologëve, politikanë, punonjësve social,
filozofëve etj. Një politikan është i prirur të studiojë rregullat e votimit dhe aspekte të
tjera të vendim-marrjeve kolektive. Një psikolog është i prirur të studiojë sjelljet e
individëve gjatë vendimeve, ndërsa filozofi do të dijë kërkesat kur vendimet janë
racionale. Pra është një gamë e gjerë me subjekt të përbashkët dhe metoda të
ndryshme nga kërkues me profile të ndryshme, që aplikojnë problema të ngjashme.
Vendim-marrja është përzgjedhja e një vije qëndrimi për të arritur në një rezultat sa
më të mirë në kushtet e një situate sado pak të ndërlikuar. Në këto kushte vendim-
marrësi, qoftë ky një person apo një organ drejtues shqyrton të gjitha alternativat nga
këndvështrime apo kritere të ndryshme të cilat përcaktojnë vlerën e alternativave. Në
këto rrethana shtrohet problemi i marrjes së një vendimi optimal, ku përmendim
metodat e vendim-marrjes shumëkriterëshe (MCDM multi criteria decision making)
Këto metoda (MCDM) i referohen marrjes së vendimeve në prezencë të shumë
kritereve, zakonisht edhe konfliktuese ndërmjet tyre. Problemat MCDM janë të
shumta në jetën e përditshme, siç mund të jetë blerja e një shtëpie ose një makine që
karakterizohen me anë të termave çmim, madhësi, siguri, komfort, etj. Kjo disiplinë
është ngushtësisht e lidhur me përparimin e teknologjisë kompjuterike, pra ajo ka një
disiplinë të shkurtër rreth 30 vjeçare. Nga njëra anë ky zhvillim i menjëhershëm i
teknologjisë në këto pak vite ka bërë të mundur zgjidhjen analitike të problemave
MCDM komplekse. Nga ana tjetër përhapja e teknologjisë së informacionit dhe
kompjuterave kanë gjeneruar një sasi të gjerë informacioni, ku MCDM bëhet gjithnjë
e më shumë e rëndësishme si suport për vendim-marrësin.
Zakonisht gjenden dy lloje problemash MCDM: lloji i parë ka një numër të fundëm
alternativash për zgjidhje, ndërsa lloji i dytë një numër të pafundëm zgjidhjesh.
Normalisht në problema që shoqërohen me përzgjedhje dhe vlerësime, numri i
alternativave të zgjidhjeve është i limituar. Në problema që kanë të bëjnë me
dizenjim, një atribut mund të marr çdo lloj vlere në një varg. Një atribut është një
veti, cilësi ose tipar i alternativave. Për të vlerësuar një alternativë, ndaj secilit atribut
bashkangjitet një kriter. Korrespodenca midis atributeve dhe kritereve është një për
një. Ka raste kur zgjidhjet alternative mund të jenë të pafundme, atëherë problemi
paraqitet si problem optimizimi me shumë objektiva. Fokusimi ynë kryesor do të jetë
në problema me një numër të fundëm alternativash.
Problemat vendim-marrëse janë zgjidhur gjerësisht me anë të modeleve të
programimit linear, në të cilat numri i zgjidhjeve të mundshme është zakonisht i
34
madh. Nga këto modele është shumë e vështirë të evidentohen zgjidhjet e lejueshme,
pra ato alternativa që i duhen vendim-marrjes. Në metodat e MCDM edhe pse numri i
alternativave është i vogël, ato janë të disponueshme që në momentin fillestar të
shtrimit të problemit. Në praktikë kriteret e vlerësimit të alternativave mund të jenë
me natyra cilësore ose sasiore. Kur kriteret janë cilësore ato nuk mund të shprehen
numerikisht, pasi kriteret nuk kanë njësi matëse të përbashkëta. Ndaj në këto kushte
problemet e vendim-marrjes nuk mund të trajtohen me modelet e njohura lineare. [37]
2.2 Avantazhet dhe disavantazhet në përdorimin e pemës së vendimit
Pemët janë një teori qëndrore për të kuptuar strukturimin e një grafi, të cilat kanë një
rang të gjerë aplikimi. Pema e vendimit përbëhet nga një kulm kryesor që quhet
rrënjë, e cila nuk ka brinjë hyrëse, ndërsa gjithë kulmet e tjera kanë ekzaktësisht një
brinjë hyrëse. Kulmi me brinjë dalëse quhet kulm i brendshëm, kurse kulmet nga të
cilat nuk dalin brinjë quhen gjethe. Secila gjethe i përket një klase që përfaqëson
vlerën më të përshtatshme të synuar. Pemët e vendimit ose modelet e ndarjeve
rekursive janë një mjet vendim-marrje dhe paraqesin një lloj diagrame që përbëhet
nga kulmet ( gjethe= kulm me fuqinë 1) dhe nga një bashkësi vendimesh që duhen
marr nga kulmet, ne i referohemi me degë( brinjë). Struktura gjethe dhe degë formon
një paraqitje hierarkike që ngjason me pemën.
Aplikimet më të shpeshta të këtyre pemëve janë:
Prodhim – vlerësimi i materialeve kimike për prodhim.
Proçese optimizimi në makinat elektrokimike.
Inxhinieria Biomjekësore- Identifikimi i karakteristikave për tu përdorur në
pajisje implantuese.
Astronomi- Përdorim i pemëve të vendimit në filtrimin e zhurmave të
hapësirës
Biololgjia molekulare-Analizimi i vargjeve të aminoacideve në genomin
human.
Avantazhet e pemëve të vendimit
Janë të thjeshta për tu kuptuar dhe interpretuar.
Kanë vlera edhe për të dhëna të pakta.
Algoritmet janë të fortë edhe në të dhëna të zhurmuara.
Të ndihmon të kuptosh vlerat më të mira, më të këqija dhe ato të pritshme.
Disavantazhet e pemëve të vendimit.
Për të dhëna që përfshijnë variabla kategorikë, me numër të ndryshëm
nivelesh hierarkik, përftimi i informacionit (Information gain) anohet në favor
të atyre atributeve që kanë më shumë nivele.
Llogaritjet mund të bëhen komplekse, veçanërisht kur pema ndërtohet mbi
pasigurinë e të dhënave.
35
2.3 Algoritmet e rrjetave të vendimit
Pemët e vendimit kanë karakteristika numerike dhe cilësore njëkohësisht. Problemat
MCDM mund të përshkruhen duke përdorur një matricë vendimi. Supozoj se kemi m
alternativa, që vlerësohen në bazë të n atributeve, atëherë matrica vendim është me
mxn përmasa. Metodat kryesore në lidhje me vendim-marrjen gjenerohen kryesisht
me anë të këtyre matricave. [29]
Një model është ndërtimi i pemës vendim-marrëse, si një proçes renditje dhe
klasifikimi njëkohësisht, duke pasur në krye vendim-marrësin. Algoritmi ID3 është i
pari algoritëm vendim-marrës që është ndërtuar nga J.Ross Quinlan 1986. ID3
ndërton një pemë vendim-marrëse nga një bashkësi fikse të dhënash, zakonisht
diskret. Gjethja e pemës përmban emrin e klasës së atributit, nqs kulmi nuk është
gjethe atëherë është një kulm vendimi, i cili shërben si një atribut test për degë të reja
të pemës. Ross Quinlan ka punuar me këto lloj pemësh vendimi, të cilat duken të
thjeshta dhe teknikisht të lehta për tu përdorur. Teoria e tij përdor vetitë e kulmeve të
pemës së vendimit , në mënyrë rekursive lart-poshtë, krahasime dhe gjykime të
bazuara në vlerat e ndryshme të atributeve. Si input janë bashkësia e të dhënave
ndërsa rezultati në dalje është pema që i përngjason një diagrame të orientuar, ku
secila gjethe përfaqëson një klasë vendimi. Gjethja përfaqëson vendimin që i përket
një klase të dhënash, pasi bëhet verifikimi i çdo testi nga rrënja në gjethe. Algoritma
të përmirësuar të ID3 janë paraqitur po nga Quinlan, disa vite më vonë. Përmirësimi i
parë quhet algoritmi C4.5, që ndërton pemën e vendimit si ID3, por në secilin kulm të
pemës zgjedh atribute nga të dhënat që ndajnë bashkësinë në nënbashkësi, nga një
klasë në tjetrën. Kriteri i ndarjes është normalizimi i përftimit të informacionit, ku
atributi me vlera më të larta të normalizuara të përftimit të informacionit, zgjidhet për
të bërë vendimin. Më pas në mënyrë rekursive C4.5 kalon në nivelin tjetër.
Përmirësimi tjetër është algoritmi Cart, që lidhet me klasifikimin dhe pemët
regresive. Zhvillimin kryesor e ka marr nga Breiman dhe Olshen në vitet 80-të, më
pas përmirësimi i tij u bë nga Quinlan në vitet 90-të. Ai lidhi modelimin bazë të
pemëve me fushën e gjerë të statistikës.
Një model tjetër për ndërtimin e pemëve vendim-marrëse jepet me anë të Proçesit të
Analizës Hierarkike, në të cilin atributet cilësore kthehen në atribute numerikë, ku
ndërtohen matricat përkatëse krahasuese me në qendër vendim-marrësin. Ky është një
model i paraqitur nga Thomas Saaty 1970, shumë i lëvruar edhe në kohët e sotme.
AHP paraqet një proçes të gjatë analize e organizimi për një vendimmarrrje sa më
optimale. Aplikimi i AHP është në mjaft fusha të gjera si në qeverisje, shëndetësi,
biznes, ndërtime, industri dhe edukim. Vendimmarrësi është në krye të AHP dhe ai
dekompozon gjithë problemin në hierarki e nivele, të cilat përbëjnë nënprobleme, ku
secila prej tyre analizohet në mënyrë të pavarur. Pasi ndërtohet kjo skemë,
vendimmarrësi nis të bëjë krahasime midis tyre, duke i marrë dy e nga dy. Të gjitha
vlerësimet cilësore që kryen ai, kthehen në vlerësime sasiore, duke i vendosur peshat
përkatëse secilit element në këtë hierarki. Në hapin final të gjitha vlerësimet numerike
të llogaritura renditen sipas rendit zbritës të tyre. Kështu klasifikohen alternativat nga
më optimalja deri tek ajo më e papërshtatshmja.
36
2.3.1 ID3 algoritmi bazë i vendimit
Algoritmi ID3 quhet në fakt Iterative Dichotometer 3, që do të thotë se klasifikon në
mënyrë iterative, por në fund të klasifikimit përgjigjia është po ose jo në lidhje me
atributet. I pari që e shpiku ID3 ishte Ross Quinlan në 1986 që ishte një kërkues
shkencor në shkencat kompjuterike dhe në teorinë e vendim-marrjes. ID3 në fakt
ndërton pemën më optimale të vendimit, në bazë të atributeve të tij. Baza e të
dhënave implementohet në variabla diskret dhe të vazhdueshëm. Klasifikimi bëhet në
bazë të atributeve, formohet pema e cila përmban gjethe vendimi. Nisja e algoritmit
bëhet nga llogaritja e entropisë së sistemit, që quhet Entropia e Shannonit, më pas
pasohet nga një veti statistike që quhet Përftim Informacioni (Information Gain).
Entropia është futur si kuptim në 1948 nga Klaud Shannon. Ajo mat rastësinë dhe
tregon se po të kemi më pak vlera është më e vogël pasiguria, po të kemi më shumë
vlera është më e madhe pasiguria. Në termodinamikë entropia mat rregullsinë ose
jorregullsinë e një sistemi, në teorinë e informacionit mat sa e sigurt apo e pasigurt
është vlera e një variabli rasti. Hapat e ID3 janë si më poshtë :
Merren atributet dhe llogariten entropitë për secilin.
Zgjidhet atributi që ka vlerë minimale të entropisë ose ai që ka përftim
informacioni maksimal.
Vendoset një kulm që e përmban atë atribut.
Nëse kemi një bashkësi S me n atribute, që kanë vlera të ndryshme, atëhere entropia
përkufizohet si më poshtë:
ku është proporcioni që S t’i përkasë klasës i.
Nëse S është një bashkësi nga një bazë të dhënash , që kërkohen të ndahen në m-klasa në bazë të një atributi në dalje ka një shpërndarje probabilitare të
klasave
ku tregon numrin e elementëve të klasës .
Le të mendojmë pak se çfarë ndodh nëse ndajmë bashkësinë bazë S në klasa
. Informacioni që duhet për të identifikuar klasën e një elementi në S në
lidhje me një atribut X është:
Në kontekstin e ndërtimit të një peme vendimi, duam të dimë se sa informacion duhet
shtuar për atributin në dalje kur dihet vlera X e atributit në hyrje? Pra ky është
ndryshimi midis informacionit që duhet për të klasifikuar një element në S përpara se
37
të njohim vlerën e atributit X , E(S) dhe informacionit që duhet pasi është ndarë
bashkësia S në bazë të njohjes së vlerës X. Kjo madhësi quhet përftim i informacionit
(IG) që mat ndryshimet efektive të entropisë, pasi bëhet një vendim bazuar në vlerat e
një atributi. Në kontekstin e ndërtimit të një peme vendimi, interesohemi se sa
informacion duhet rreth atributit në dalje, që mund të fitohet duke njohur vlerën e një
atributi. Formula është si më poshtë :
ku është bashkësia e të gjithë vlerave të mundëshme për atributin A.
Deri tani shpjeguam në vija të përgjithshme algoritmin, por le të japim një shpjegim
edhe me në detaje në lidhje me atributet dhe bashkësinë S. Për secilin atribut
vendosim një bashkësi pragjesh që janë të ndarë në mënyrë të
barabartë në intervalin . Në lidhje me këto pragje do të
korrespondojmë dy nënbashkësi të S-së të tilla që:
dhe
ku
Pra kështu pragu ndan bashkësinë S në dy nënbashkësi të ndara në lidhje me
vlerat e atributit . Gjithë pikat në bashkësinë trajnuese supozohet se janë të
klasifikuar pothuajse rregullsisht në klasat c nga bashkësia e klasave të pranueshme
C. Ka disa karakteristika në bashkësinë trajnuese:
1) janë numri total në bashkësitë përkatëse.
2) dhe raportet e numrit të elementëve të
bashkësive të klasifikuar nga klasa c.
Për bashkësitë do të vendosim sasi që specifikojnë
ndryshueshmërinë e klasave përveç këtyre bashkësive. Pra në këto kushte kjo
madhësi është entropia e Shannonit.
Është e qartë se nëse atëherë bashkësia përmban vetëm një
objekt të asaj klase. Në fund do të japim kuptimin e entropisë së kushtëzuar
:
38
si dhe një përftim informacioni relativ
Të përmbledhur hapat e algoritmit janë këto:
1) Jepet bashkësia S.
2) Krijohen pragjet
3) Për secilin prag llogaritet
4) Përkufizohet
5) Krijohet një kulm me atributin si një kulm vendimi dhe
, janë kushtet korresponduese të degës së vetë. Ndahet
kështu bashkësia fillestare S ne ,l mS dhe ,l mS
.
6) Hiqet si prag dhe përsëritet proçedura në mënyrë rekursive në
nënbashkësitë ,l mS dhe ,l mS
derisa të kemi kushtin e ndalimit.
Vlerat e atributeve mund të jenë cilësore ose sasiore. Le të marrim një shembull që
vetë Quinlan e ka botuar për të konkretizuar algortimin. [30]
Shembull 1
Duam të luajmë futboll në fundjavë. Për këtë do të bëjmë një parashikim në lidhje me
të dhënat e dy javëve të muajit të shkuar, ku përgjigjia do të jetë “po” ose “jo”. Tabela
e mëposhtme paraqet të dhënat:
Tabela 2.1 Bashkësia S e të dhënave.
Dita Moti Temperaturat Lagështia Era Të luajmë?
D1 Diell Nxehtë E lartë Pak Jo
D2 Diell Nxehtë E lartë Shumë Jo
D3 Me re Nxehtë E lartë Pak Po
D4 Shi Mesatar E lartë Pak Po
D5 Shi Ftohtë Normale Pak Po
D6 Shi Ftohtë Normale Shumë Jo
D7 Me re Ftohtë Normale Shumë Po
D8 Diell Mesatar E lartë Pak Jo
D9 Diell Ftohtë Normale Pak Po
D10 Shi Mesatar Normale Pak Po
D11 Diell Mesatar Normale Shumë Po
D12 Me re Mesatar E lartë Shumë Po
D13 Me re Nxehtë Normale Pak Po
D14 Shi Mesatar E lartë Shumë Jo
39
Së pari do të gjejmë atributin që do të jetë rrënjë e pemës sonë të vendimit. Llogaritim
entropinë e sistemit në lidhje me kolonën “Të luajmë?” .
Llogaritim entropitë e aributeve në lidhje me secilën vlerë cilësore që ata kanë. Në
lidhje me atributin “Moti”, ai merr tre vlera cilësore që janë diell, me re, shi. Kemi
gjithsej pesë vlera të cilësuara diell, nga të cilat 3 kanë përgjigjen “jo” tek kolona e
fundit dhe dy kanë përgjigjen “po”. Formulat përkatëse paraqesin entropinë në lidhje
me atributin “Moti”.
Atributi Moti
Le të llogaritim tani përftimin e informacionit të S në lidhje me “motin”. Kemi 5 vlera
me “Diell”, 4 vlera “Me re”, 5 me vlera “Shi”, nga 14 përgjigjet.
.
Atributi Temperatura
40
Atributi Lagështi
Atributi Era
Si rrënjë e pemës do të shërbejë informacioni me vlerë më të lartë që është atributi
“Moti”. Meqënëse atributi Moti ka tre variabla cilësorë atëherë do të dalin tre degë
nga kjo rrënjë, që do të formojnë nivelin e parë të hierarkisë.
Për këto kulme do të llogaritim Përftimin e Informacionit duke ndërtuar tre tabela të
reja që i përkasin atributeve në këtë mënyrë: për cilësinë “Diell” si degë e parë e
pemës, bëjmë një ekstrakt nga tabela në një tabelë të re si më poshtë:
Dita Temperatura Lagështi Era Të luajmë?
D1 Nxehtë E lartë Pak Jo
D2 Nxehtë E lartë Shumë Jo
D8 Mesatar E lartë Pak Jo
D9 Ftohtë Normale Pak Po
D11 Mesatar Normale Shumë Po
Tabela 2.2 Të dhënat pas rrënjës në lidhje me atributin “Diell”
Pasi të llogaritim sërish entropinë për këtë sistem të ri dhe Përftimin e Informacionit
për secilin atribut si më sipër, gjejmë se vlerën më të lartë e ka atributi Lagështi, që
shërben tani si një kulm i ri vendimi.
Për cilësinë “Me re ” si degë e dytë e pemës, zgjedhim nga tabela fillestare këto
elementë:
41
Dita Temperatura Lagështi Era Të luajmë?
D3 Nxehtë E lartë Pak Po
D7 Ftohtë Normale Shumë Po
D12 Mesatar E lartë Shumë Po
D13 Nxehtë Normale Pak Po
Tabela 2.3 Të dhënat pas rrënjës në lidhje me atributin “Me re”
Të gjithë atributet janë njësoj, atëherë përgjigjia është “Po”, në këtë rast kjo është një
gjethe vendimi. Për cilësinë “Shi” si degë e tretë e pemës, zgjedhim nga tabela
fillestare këto elementë:
Dita Temperatura Lagështi Era Të luajmë?
D4 Mesatar E lartë Pak Po
D5 Ftohtë Normale Pak Po
D6 Ftohtë Normale Shumë Jo
D10 Mesatar Normale Pak Po
D14 Mesatar E lartë Shumë Jo
Tabela 2.4 Të dhënat pas rrënjës në lidhje me atributin “Shi”
Pra atributi fitues në këtë degë të tretë është “Era”. Duke vazhduar kështu ne
përftojmë këtë pemë,ku në fakt atributi “Temperaturë” ka vlera minimale dhe nuk
merret në konsideratë.
Figura 2.1 Paraqitja e pemës vendim-marrëse për të luajtur futboll
42
2.3.2 Algoritmi ID3 Pseudokodë
Algoritmi ID3 është implementuar për tu përdorur në ndryshore diskret dhe të
vazhduara. Në kontekstin e ndërtimit të një peme vendimi, ne jemi të interesuar që të
dimë se sa shumë informacion duhet të trajtohet për atributin autput pasi njohim
vlerën e atributit A.
Formula e përfitimit të informacionit është :
Çdo atribut klasifikohet hap pas hapi në çdo nënndarje të re. Kjo proçedurë i ngjan
shumë thirrjes së famshme “ Përça dhe sundo”. Në bazë të këtij informacioni do të
zgjedhim atributin që ka vlerën më të lartë, duke e quajtur atë rrënjë të pemës sonë.
Pasi të kemi gjetur rrënjën, ky atribut lëviz nga bashkësia dhe për nivelin tjetër të
dhënat do të ndahen sipas vlerave të këtij atributi.
ID3 Algoritëm ,[Quinlan 1986]
S është një bashkësi tiparesh, gjithashtu quhet edhe hapësirë e tipareve.
C është bashkësia e klasave.
është funksioni klasifikim ideal për S.
SxC është bashkësia e shembujve;
ID3 (D, Atributi, Etiketimi)
Krijo një kulm t në pemë
Në qoftë se gjithë shembujt e D janë pozitivë,
atëherë shëno të vetmin kulm me “+”.
Në qoftë se gjithë shembujt e D janë negative,
atëherë shëno të vetmin kulm me “-”.
Etiketo “t” me vlerën më të madhe nga vlerat në D
Nqs atributi është bosh, atëherë rikthehu në kulmin t.
Le të jetë A atributi më i mirë i klasifikuar nga bashkësia e shembujve
Shënoj t atributin vendim të A
Për çdo vlerë të mundëshme “a” në Abëj:
Shto një degë të re peme poshtë t, korresponduese të A=“a”
Përndryshe,
Shkruaj Pema ID3 (D_a, Atribute/ A , Etiketë)
Rikthehu në t
43
2.3.3 Algoritmi C4.5 si përmirësim i ID3
Algoritmi C4.5 është një evolucion i ID3, i paraqitur po nga Quinlan në 1993. Ai
gjeneron një pemë vendimi për të dhënat, duke i ndarë ato në mënyrë rekursive. Rritja
e pemës së vendimit përdor strategjinë kërkim në thellësi. Algoritmi konsideron të
gjitha testet e mundëshme që mund të ndajnë të dhënat dhe përzgjedh një test që jep
përftimin e informacionit më të mirë, pra me vlerë maksimale. Ky test heq
paragjykimet e ID3 në favor të zgjerimit të pemës së vendimit. Për secilin atribut
diskret një test përdoret për të prodhuar shumë rezultate, siç janë vlerat e veçanta të
atributit. Për atributet e vazhdueshëm, të dhënat renditen dhe llogaritja e entropisë
bazohet në prerjet binare në secilën vlerë të ndarë nga të dhënat e renditura.
Ky proçes përsëritet për të gjithë atributet e vazhdueshëm. C4.5 lejon krasitjen e
pemëve vendim-marrëse të rezultuara në nivelet e mëparshme. Ai aplikohet shumë
mirë në atributet numerik, vlera të humbura ose të dhëna të zhurmuara. [36]
Një kufizim i ID3 është se ai është shumë i ndjeshëm ndaj tipareve me vlera të mëdha
numerike. Kjo gjë paraqitet sidomos në numrat e sigurimeve shoqërore të cilët janë të
vetëm për çdo individ, që duke u testuar në çdo vlerë ka gjithmonë vlera të vogla të
entropisë. Për të kaluar këtë vështirësi C4.5 përdor përftimin e informacionit si një
raport përftimi, të quajtur Gain Ratio (GR).
IG është përftimi i informacionit, SI është informacioni për ndarjen (Split Info)
ku
është raporti i elementëve të pranishëm në pozicionin p, që marrin vlerat e
testit të j-të. Po ashtu si ID3 të dhënat renditen për çdo kulm të pemës për të gjetur
atributin më të mirë të ndarë. Algoritmi përdor GR- përftimin e raportit për të
vlerësuar ndarjen e atributeve. Pemët e vendimit ndërtohen në C4.5 mbi bazë të të
dhënave të pemës nga ID3. Nga çdo gjethe e pemës C4.5 zgjedh atë atribut nga të
dhënat që ndan në mënyrë sa më efektive bashkësinë e shembujve në nënbashkësi.
Kriter mbetet normalizimi i IG përftimi i informacionit, pra atributi me vlerë më të
madhe të GR do të zgjidhet si fitues.
Ka rëndësi të përmendim se edhe faza tjetër që e quajmë “krasitje” është një teknikë
kërkimi nga poshtë lart, që redukton madhësinë e pemës së vendimit duke lëvizur
degë të pemës që janë pak të fuqishme për të klasifikuar më tej.
Duke iu referuar shembullit 1 të dhënë më lart le të tregojmë se si llogaritet atributi
më i rëndësishëm me anë të GR(p,t). Pasi është llogaritur IG na duhet të llogaritim SI
për çdo variabël për të gjetur GR.
Le të marrim atributin Era. Llogaritim SI e këtij atributi, e cila merr dy vlera:
“ Shumë dhe Pak”. Kemi tetë vlera për “Shumë” dhe gjashtë vlera për “Pak”. Pra:
44
Po të llogaritim SI për variablat e tjerë në këtë mënyrë, ne ndërtojmë tabelën e
mëposhtme, ku IG është marr nga ID3 :
Atributi Ndarja në klasa IG SI GR
Lagështi 7,7 0.152 1 0.152
Era 8,6 0.048 0.985 0.049
Moti 5,4,5 0.25 1.577 0.156
Temperatura 4,6,4 0.03 1.362 0.021
Tabela 2.5 Vlerat e atributeve të C4.5
Pra vlera më e madhe është përsëri Moti, më pas vazhdohet sërish në këtë mënyrë dhe
ndërtohet po ashtu pema e vendimit.
2.3.4 Avantazhet dhe disavantazhet e ID3 dhe C4.5
Avantazhe:
C4.5 punon me të dy atributet të vazhdueshëm dhe diskret njëkohësisht. Kur
atributet janë të vazhdueshëm, për t’i mbajtur ato algoritmi krijon një prag,
pastaj ndan listën me ato atribute që vlerat i kanë më lart se pragu dhe me ato
atribute që vlerat i kanë më pak ose baraz me pragun.
C4.5 lejon që vlerat e atributeve të shënohen si “të himbura”. Vlerat e
atributeve që humbasin janë thjesht të papërdorura në entropinë dhe përftimin
e informacionit.
C4.5 kthehet pas në pemë edhe pasi ajo është krijuar duke u përpjekur për të
lëvizur ndonjë degë që nuk ndihmon dhe i zëvendëson ato me ndonjë kulm
gjethe.
Disavantazhe:
C4.5 ndërton edhe degë boshe që është hapi më i rëndësishëm për të gjeneruar
rregullat. Kemi gjetur shumë kulme me vlera zero ose afër zeros.
Këto vlera nuk ndihmojnë për të gjeneruar rregulla as për të ndërtuar ndonjë
klasë në lidhje me klasifikimin. Përkundrazi ajo e bën pemën më të madhe dhe
më komplekse.
Mbi vendosja ndodh kur modeli algoritëm zgjedh të dhëna me karakteristika
të rralla. Zakonisht C4.5 si algoritëm ndërton pemë dhe rrit degët e saj në
thellësi për të klasifikuar të dhënat. Shumicën e kohës algoritmi mbivendos të
dhënat e zhurmuara.
45
Algoritmi
Karakteristika
ID3 C4.5
Kriteret për ndarje IG Përftim informacioni GR Përftim raporti
Lloje të atributeve Vlera kategorike Vlera kategorike dhe numerike
Vlera të humbura Nuk i mban vlerat e humbura
I mban vlerat e humbura
Strategjia e krasitjes Nuk ka krasitje. Përdoret gabimi i krasitjes bazë.
Tabela 2.6 Karakteristikat e ID3 dhe C4.5
2.3.5 Krahasimi midis ID3 dhe C4.5 i aplikuar në rrjetat wireles dhe Sistemet
Inteligjente të Transportit. (ITS)
Pemët e vendimit sigurojnë një strukturë formale vendimesh dhe shanse ngjarjesh nga
e majta në të djathtë. Zhvillimet e internetit së fundmi kanë në përmbajtje sasi
marramendëse të dhënash dhe informacioni. Kjo situatë gjeneron një nevojë urgjente
për teknika të reja dhe mjete automatike, që mund të na ndihmojnë të transformojmë
këto të dhëna në informacion të dobishëm për ne. [36]
Sistemet Inteligjente të Transportit (ITS) i referohen sistemeve të avancuara të
transportit, që janë dizenjuar për të mbledhur, proçesuar dhe siguruar informacionin e
trafikut në kohë reale, në sajë të transportit të sofistikuar elektronik dhe teknologjisë
së informacionit. Për të menaxhuar trafikun në mënyrë sa më të thjeshtë do të
përdorim algoritmin e pemëve të vendimit. Me zhvillimin e ekonomisë sociale, rritja
e trafikut është akoma më e madhe sesa kapaciteti i rrjetit rrugor. Problemet e trafikut
kanë ardhur duke u bërë një shqetësim social qëndror.
Sistemi ITS i aplikuar në trafikun e qytetit reflektohet kryesisht në përmbledhjen
mikroskopike të informacionit të trafikut, kontrolle të trafikut dhe guidë, për të
përmirësuar efektshmërinë e sitemit të trafikut. Rrjeti wireless ka karakteristika të
shkëlqyera, që mund të sigurojë një mjet efektiv për të mbledhur informacion për ITS
dhe mund të monitoroj prerjet në të gjitha drejtimet për makinat në trafik.
Teknologjia e rrjetave wireless është teknologjia me distancë të vogël, kompleksitet të
vogël, pak kosto. Teknologjia e rrjetit wireless përmban tre lloje të rrjetave të
vetëorganizuara që janë : rrjeti Yll, rrjeti pemë Klaster dhe rrjeti Mesh. Fan dhe Van
kanë studiuar kritere të rëndësishme për dizenjimin e rrjetave wireless. Një ndër to
është gjetja e kulmit terminal ( rrënja) , kulmet hyrës dhe dalës. Do të aplikojmë
rrjetat wireless në përmirësimin e statusit të transportit publik, që janë një pjesë e
sistemeve inteligjente të transportit. Pikërisht për të ndërtuar këto rrjeta kemi përdorur
algoritmet ID3 dhe C4.5. Pas ndertimit ne do të shohim se algoritmi C4.5 është më i
shpejtë dhe më efektiv sesa ID3. Fan dhe Wan në 1995, gjetën kriterin më të
46
rëndësishëm për të ndërtuar rrjetin wireless. Ata konkluduan se duheshin ndarë
kulmet kryesore në rrjetë që ishin: kulmi Terminal, kulmi Sink dhe kulmi Gateway.
Kulmi terminal përfaqëson një gjethe vendimi, pra një kulm fundor. Kulmi Sink në
një pemë vendimi ka rolin e rrënjës së pemës. Në rrjetat wireless ai mund të jetë nyje
lidhëse ndërmjet rrjeteve. Kulmi Gateway lidh rrjetat me protokolle të ndryshme. Në
figurën 12 jepen llojet e kulmeve në një rrjetë të tipit Mesh.
Figura 2.2 Llojet e kulmeve në rrjetat wireles
Sistemet e rrjetave wireless në fakt kanë një dobësi pasi ato varen nga bateria, që
është në fakt edhe kriteri më i rëndësishëm për të dizenjuar rrjetën. Rrjeti wireless
WSN ka kapacitet të madh për numrat e kulmeve sensore të rrjetës, ndërsa një sistem
inteligjent transporti ITS pritet që të mbulojë qindra rrugë dhe zona të miliona
makinave. Pra këtu kuptohet se sa e gjerë duhet WSN për të mbuluar një sipërfaqe të
tillë, pasi me këtë trafik vetëm një fraksion rrugor mund të mbulohet nga WSN.
Në arkitekturën që do të ndërtojmë do të marrim si kulme stacionet bazë siç janë
kryqëzimet, urat, rrugët një kalimshe, etj. Mirëpërcaktimi i pozicionit të një kulmi
lokaliteti është një nga funksionet bazë të WSN. Në ndihmë të këtij strukturimi vjen
GIS, një sistem informacioni gjeografik që regjistron të dhënat e trafikut, i cili
aplikohet në ndërtimin e trafikut, manaxhimin dhe shërbime të informacionit, një
sistem i pazëvendësueshëm për ITS.
Figura 2.3 Rrjeta WSN
47
Formulat më fillestare të përdorura në GIS kanë qenë distanca e Euklidit, prerja e dy
drejtëzave, dimensionet e prerjeve të një drejtëze, etj.Tani si funksion bazë në lidhje
me atributet e të dhënave dhe ndarjeve të tyre, i ngjashëm me pasqyrime të analizës
hapësinore, ku C tregon kapacitetin maksimal të rrjetës, në funksion të dy
shpërndarjeve probabilitare të ITS dhe të
GIS. Ky funksion është huazuar nga teoria e informacionit, në bazë të llojeve të
ndryshme të entropive. [44]
Në rrjetën WSN kulmi sink mund të transportojë më thjesht nga anët e kolonave të
rrugëve ose bareve, kulmi gateway është integruar në ndërprerje të sinjaleve të
trafikut, ndërsa kulmi terminal mund të vendoset në rrugë ose anash saj. Në
transportin publik në pikat e ndalesave të autobuzëve vijnë disa njëkohësisht, ata që
ndalojnë janë të përshtatshëm për rrjetat Yll. Por nqs autobuzi ndalon jashtë stacionit,
ai del nga sensorët dhe kanali bllokohet, ndaj më e përshtatshme është rrjeta Mesh.
Po të marrim në konsideratë figurën e mëposhtme, ku makinat që janë në një rrugë të
përbashkët mund të marrin informacion ndërmjet tyre nëse në afërsi janë rrjetat WSN
të cilat në fakt aplikohen edhe me Bluetooth. Makina A gjen se në linjën e saj është
makina B dhe D. Valët bluetooth supozohet të monitorojnë rreth 200 makina në
afërsinë 100 m. Rrjeta GIS bën të mundur që së pari makinat të kërkojnë stacionin
bazë, nqs e gjejnë të komunikojnë me të , ndërkohë kjo gjë ndikon tek makinat e tjera.
Figura 2.4 Komunikimi WSN-GIS-ITS
Në qoftë se supozojmë se makina E është më afër me stacionin bazë, ajo i dërgon një
lidhje bluetooth stacionit, për të ditur gjendjen e rrugës, pengesat etj. Stacioni lidhet
me të dhe dërgon informacionin e tij, ndërkohë makina A që është pas saj mund të
mar këtë informacion si sinjal nga stacioni. [7]
Për të ndërtuar sistemin inteligjent të transportit kemi përdorur algoritmat ID3 dhe
C4.5, sigurisht të aplikuar në paketën Weka( do të jepet informacion tek kapitulli 3).
Duke marr një bashkësi të dhënash për 20 stacione autobuzi, në të cilat janë vendosur
48
rrjetat wireless( disa pranë lokaleve ose bareve të qytetit), i kemi formatuar të dhënat
për të ndërtuar pemët dhe kemi parë se C4.5 ndërton shumë herë më shpejt se ID3.
Duke parë numrin e makinave përgjatë një muaji, janë marr pemët përkatëse të
ndërtuara për çdo rast. Kryesisht 0-1000 makina ndërtonin rrjeta vendimi me
maksimumi 6 kulme, më shumë se 1000 makina ndërtonin rrjeta vendimi me nga një
kulm më shumë për çdo rast. ID3 për 6223 makina ndërton pemë me 9 kulme, ndërsa
optimizimi i tij C4.5 për këtë rast e minimizon numrin në 2000 makina.
Figura 2.5 Grafiku krahasues ID3 dhe C4.5
2.3.6 Algoritmi Cart dhe indeksi GINI
Algoritmi Cart u zhvillua nga Breiman në 1984. Cart janë inicialet për pemët
klasifikuese dhe regresive. (classification and regression trës). Këto dy lloje pemësh
kanë një ndryshim- pemët klasifikuese përdorin variabla diskret, ndërsa ato regresive
marrrin variabla të vazhdueshëm, duke u fokusuar vetëm tek pemët klasifikuese. Nëse
një variabël zgjidhet pas fazës ndarëse, të gjithë variablat e tjerë testohen mbi një
kriter dhe zgjidhet më i miri prej tyre. Në qoftë se kemi variabla binarë secila vlerë
përkufizon një grup për një ndarje, nëse variabli është diskret merren gjithë
kombinimet e mundshme të grupeve. Numri i testeve për n variabla diskret është (2n-
2)/2. Në qoftë se variabli është i vazhdueshëm, atëherë për n variabla bëhen n-1 teste.
Cart përdor një kriter selektimi ndarës si “një mesatare e ponderuar jo e pastër”, e
cila në bazë ka indeksin e GINI-it. Pikë së pari indeksi GINI llogaritet dhe më pas
kombinohet në kriter. Do ta shohim këtë indeks për dy grupe nga një ndarje e
mundshme e tre variablave të motit . [21]
ku është një raport i një atributi të caktuar ( p.sh ( PO,JO)). Indeksi Gini është një
masë e dispersionit statistikor, e zhvilluar nga statisticieni italian Korrado Gini në
49
1912, i botuar në artikullin “Ngjashmëria dhe ndryshueshmëria”. Indeksi i Ginit
përkufizohet në bazë të vijës së Lorencit, e cila tregon proporcionin e të ardhurave
totale të popullsisë (boshti oy) ,që fitohet nga akumulimi i popullsisë në boshtin e x-
ve. Drejtëza y=x përfaqëson barazimin perfekt të të ardhurave. Pra ky indeks mund të
mendohet si raport i sipërfaqes që shtrihet midis drejtëzës së barazimit dhe vijës së
Lorencit( shënuar me A në diagram) mbi sipërfaqen totale që është nën vijën e
barazisë ( shënuar me A+B).
Figura 2.6 Indeksi Gini
Nëse gjithë njerëzit kanë të ardhura jo negative, indeksi i Ginit shtrihet midis 0 dhe 1,
shpesh shprehet si përqindje. Praktikisht të dy vlerat nuk arrihen shpesh, indeksi
mund të kalojë vlerën 1 nëse gjenden vlera negative të mundshme. Vërehet se vlera
më e mirë për të ndarë është atributi me vlera minimale të GINI. Duke iu referuar
shembullit 1, ne duhet të vendosim si t’i ndajmë tre atributet kryesore të motit në
nëngrupe? Në shembullin 1 ne mund të bëjmë këtë tabelë për të llogaritur indeksin:
Grupi 1 Grupi 2 Grupi 3
Të luajmë? Diell+
Shi
Me
re
Diell+Me
re
Shi Diell Shi+Me re
Po 5 4 6 3 2 7
Jo 5 0 3 2 3 2
Gini grup 0.5 0 0.44 0.48 0.48 0.35
Gini variabël 0.36 0.46 0.39
Tabela 2.7 Vlerat e indeksit GINI
25
10
25
10
50
26
9
23
9
27
9
22
9
Indeksi i GINI-t për variabël llogaritet si një mesatare e ponderuar e indekseve GINI
për secilin grup.
0.5 10 0 4
0.3614
0.44 9 0.48 5
0.4614
0.48 5 0.35 9
0.3914
Nga këto indekse GINI shohim se vlerën minimale e ka grupi i parë, pra ai është
nënndarja më e mirë. Në mënyrë të njëjtë ne bëjmë testin për grupin e variablave
Temperaturë. Rezultatet tregojnë se ndarja më e mirë është Nxehtë + Ftohtë si një
grup dhe Mesatar në grupin tjetër . Le të paraqesim në një tabelë gjithë rezultatet e
testeve të kryera për indeksin GINI.
Moti Temperatura Lagështia Era
Të luajmë? Diell+S
hi
Me re Nxehtë +
Ftohtë
Mesatar Lart
ë
Norma
l
Pak Shum
ë
Po 5 4 5 4 3 6 6 3
Jo 5 0 3 2 4 1 2 3
Gini grup 0.5 0 0.47 0.44 0.49 0.25 0.38 0.5
Gini
variabël
0.36 0.46 0.37 0.43
Tabela 2.8 Atributet të indeksuara me GINI
Pra vlerën minimale të indeksit të GINI-t , e ka atributi Moti ku grupi Diell+Shi me
10 vlera do të rindahet duke përdorur të njëjtin algoritëm, ndërsa grupi i dytë Mot-
Me re do të ndahet po ashtu me këtë algoritëm derisa të arrihet kriteri “ nuk ka asnjë
variabël tjetër për tu ndarë”. Cart nuk përdor një para ndarje, por një pas ndarje, pra
pas llogaritjeve të bëra. Kështu pema e përftuar do të jetë e ngjashme me pemën e
ID3.
51
KAPITULLI 3
Paketa weka pёr klasifikime nё rrjeta
3.1 Paketa Weka për klasifikim.
Figura 3.1 Pamje e paketës Weka
Weka është një paketë e re për klasifikime, e cila u zhvillua për herë të parë në
Universitetin Waikato në Zelandën e Re (1999), sot përmban versione të avancuara të
2014. WEKA përfaqëson Waikato Environment for Knowledge Analysis, ku
paraqitet me anë të një logo zogu të llojit Meka, i cili gjendet vetëm në Zelandën e
Re. Weka është shkruar në një gjuhë programimi objekti të orientuar në Java, e
përshtatshme për të gjithë llojet e kompjuterave. Pikërisht algoritmi ynë ID3
implementohet vetëm në Weka , jo në R-programming apo Matlab. Gjenden komanda
të ndryshme shërbimesh që mund të përdoren në Weka, në nivele të ndryshme.
Përmban një variete mjetesh për të transformuar të dhënat dhe klasifikuar ato në
nivele, të gjitha të vlefshme pasi nuk të duhet të shkruash ndonjë gjuhë të caktuar
programimi. Ndërtimi i një peme vendim-marrëse është një komandë e thjeshtë që
mund të bëjmë me paketën, pasi ajo ka në përbërje algoritma më të vështirë. [45]
Për të aplikuar Wekën, së pari ndërtojmë në një tabelë Exceli të dhënat tona.
E ruajme me Save as – CSV Comma Delimited
Shtyp Open Weka
Shtyp Explorer
Shtyp Choose File
Shtyp Visualize Atributte Classification
Shtyp Choose – Trees-J 48Pruned
Shtyp Use Training Set-Start-Visualize Tree
Del pema ID3.
52
3.2 ID3 i implementuar në paketën Weka Tushar
Le të marrim shembullim 1 të mësipërm të aplikuar në Weka për të ndërtuar pemën
vendim-marrëse me anë të ID3. Kur hedhim të dhënat ato klasifikohen kështu:
Figura 3.2 Të dhënat e shembullit 1 në Weka
Në qoftë se në të djathtë klikojmë tek Visualize all shohim këtë klasifikim:
Figura 3.3 Visualizimi i atributeve ndërmjet tyre
Klikojmë tek Classify- Trees-J 48 prunned –Use training set-Start
53
Figura 3.4 Përzgjedhja e algoritmit ID3 si J 48 Prunned.
Classifier output
= = = Run information = = =
Scheme: weka.classifiers.trees. J48 –C 0.25 _M 2
Relation: shembull 1
Instances : 14
Attributes: 6
Dita
Moti
Temperaturat
Lagështia
Era
Të luajmë?
Test mode: evaluate on training data
= = = Classifier model ( full training set) = = =
J 48 Pruned tree
54
= = = = = = = = = = = = =
Moti = Diell
| Lagështia = E lartë : Jo (3.0)
| Lagështia = Normale : Jo (0.0)
| Lagështia Normale : Po (2.0)
Moti = Me re : Po (4.0)
Moti = Shi : Po ( 4.0/1.0)
Moti = Shi : Jo (1.0)
Number of Leaves : 5
Size of the trë : 8
Time taken to build model : 0.05 seconds
= = = Evaluation on training set = = =
Time taken to test model on training data : o seconds
= = = Summary = = =
Correctly Classified Instances 13
Incorrectly Classified Instances 1
Kappa statistic 0.8372
Mean absolute error 0.1071
Root mean squared error 0.2315
Relative absolute error 23.0769
Coverage of cases (0.95 level) 100
Mean rel. Region size (0.95 level) 64.2857
Total Number of Instances 14
= = = Detailed Accuracy By Class = = =
TP Rate FP Rate Precision Recall F-measure MCC ROC Area PRC Area Class
0.800 0.000 1.000 0.800 0.889 0.849 0.967 0.925 Jo
1.000 0.200 0.900 1.000 0.947 0.849 0.967 0.967 Po
Weigted avg. 0.929 0.129 0.936 0.929 0.926 0.849 0.967 0.952
55
= = = Confusion Matrix = = =
a b <= = classified as
4 1 | a= Jo
0 10| b= Po
Figura 3.5 Paraqitja e pemës përfundimtare
Siç shihet nga figura 23 pema e ndërtuar është e njëjtë me atë tek shembulli 1, por
tani e llogaritur për 0.1 sekonda, kohë mjaft e mirë në krahasim me llogaritjet që
duhen bërë. [42]
3.2.1 Vlerësimi i faktorëve për të qenë obezë. (Zbatim)
Të qenurit obezë i referohet akumulimit të tepërt të yndyrës në trup. [31] Sipas të
dhënave që kemi mar nga qendra Tirana Intermedical Centre, numri i pacientëve
obezë është duke ardhur në rritje në këto 3 vitet e fundit. Janë të shumtë faktorët për
tu analizuar në lidhje me obezitetin, si një sëmundje komplekse që prek fëmijët, të
rinjtë dhe të vjetrit, me shumë arsye të ndryshme. [26] Faktorët kryesor që ndikojnë
më tepër janë: presioni i gjakut, ushqyrja me fruta e perime, pirja e alkolit, aktiviteti
fizik, pirja e duhanit,gjenetike etj. Do të aplikojmë algoritmin ID3 të vendimit për 20
prej 1000 pacientëve të vizituar në këtë qendër. Më poshtë kemi tabelën me
përzgjedhjet e rastësishme të tyre.
Personat Aktiviteti fizike Duhan-pirja Ushqimi me fruta Obeze ?
Per1 Jo Po Jo Po
Per6 Po Po Jo Jo
Per11 Jo Po Jo Po
Per17 Po Po Jo Po
Per20 Jo Jo Po Po
56
Tabela 3.1 Faktorët e obezitetit
Llogaritim entropinë dhe përftimin e Informacinoit IG për këto persona të zgjedhur
rastësisht nga bashkësia.
Për atributin e parë Aktiviteti fizik , kryejmë llogaritjet e entropisë dhe IG.
Për atributin e dytë Duhan-pirja kemi :
Per23 Jo Po Po Jo
Per27 Jo Po Jo Po
Per36 Po Po Jo Po
Per40 Po Po Jo Po
Per48 Jo Po Po Po
Per51 Jo Jo Po Po
Per59 Po Jo Jo Jo
Per62 Po Po Jo Po
Per65 Jo Po Po Jo
Per74 Jo Po Po Jo
Per85 Po Po Jo Po
Per88 Po Jo Jo Jo
Per90 Po Po Po Po
Per97 Jo Jo Po Po
Per100 Jo Jo Jo Po
57
Për atributin e tretë Ushqimi me fruta kemi :
Duhan-pirja është atributi që ka IG më të madhe, kështu që do të jetë edhe rrënja e
pemës sonë. Më poshtë paraqiten klasifikimet e atributeve
Figura 3.6 Klasifikimi i faktorëve të obezitetit
Figura 3.7 Aplikimi i J 48
58
Figura 3.8 Paraqitja e pemës faktorë obeziteti.
Praktikisht pema e vendimit për këto të dhëna ndërtohet lehtësisht. Rrënja e pemës
është duhan-pirja, që ndër këto atribute del edhe më i rëndësishmi. Në qoftëe se kemi
një person të ri, të cilin duam ta klasifikojmë në tabelë, mjafton të ndjekim shtegun
nga rrënja tek gjethet, duke ditur vlerat përkatëse të atributeve.
3.2.2 Klasifikimi i statusit ekonomik të familjeve shqiptare. Zbatim
Le të klasifikojmë gjendjen ekonomike të familjeve shqiptare duke përdorur
algoritmin e pemës vendim-marrëse që është ID3 algoritëm dhe më pas të aplikojmë
të dhënat edhe në paketën Weka. [33] Është gjetur se si rrënjë e pemës vendim-
marrëse shërben numri i personave për familje, i cili është po ashtu edhe më i
rëndësishmi atribut ndër të tjerët. Kemi aplikuar Wekën për të ndërtuar pemën binare
për këto raste dhe kemi parë se pema binare është më e vogël se pema vendim-
marrëse.Të dhënat janë marrë nga Anketa e Matjes së Nivelit të Jetesës për vitin
2012. Në studim janë marrë në konsideratë 6 671 familje që përbëjnë dhe njësinë e
vrojtimit të cilat janë përfaqësuese për të 4 rajonet: qëndror, bregdetar, malor. Lidhur
me përcaktimin e konceptit se “kush është i varfër” në Shqipëri: Një individ quhet i
varfër nëse niveli i tij i shpenzimeve për frymë bie nën nivelin minimal që nevojitet
për të plotësuar nevojat bazë për ushqime dhe artikuj joushqimor të këtij individi.
59
Tabela 3.2 Statusi ekonomik i familjeve shqiptare
Madhësia e
familjes Zona Kryefamiljari
Statusi
ekonomik
7 Rural mashkull I varfër
6 Rural femër I varfër
8 Rural mashkull I varfër
12 Urban mashkull I varfër
6 Rural mashkull I varfër
6 Rural mashkull I varfër
8 Rural mashkull I varfër
11 Urban mashkull I varfër
3 Urban femër Jo i varfër
4 Rural mashkull I varfër
6 Rural mashkull I varfër
7 Rural mashkull I varfër
5 Rural mashkull I varfër
4 Urban mashkull Jo i varfër
10 Urban mashkull I varfër
5 Rural mashkull I varfër
5 Urban mashkull I varfër
6 Rural mashkull I varfër
5 Rural mashkull I varfër
2 Rural mashkull Jo i varfër
5 Rural mashkull I varfër
2 Rural mashkull Jo i varfër
3 Urban mashkull Jo i varfër
3 Rural mashkull Jo i varfër
3 Urban mashkull Jo i varfër
2 Urban mashkull Jo i varfër
4 Urban mashkull Jo i varfër
2 Urban mashkull Jo i varfër
3 Rural mashkull Jo i varfër
2 Urban mashkull Jo i varfër
60
Ky nivel minimal konsumi quhet “vija e varfërisë” dhe është një kufi që përfaqëson
pikën e ndarjes midis të varfërve dhe atyre që nuk janë të varfër. Kufiri absolut i
varfërisë përkufizohet në lidhje me një prag të paracaktuar ose me përballimin e
standardeve minimale të lidhura me një shportë konsumi (artikuj ushqimorë jo
ushqimorë). Përllogaritja e kufirit absolut të varfërisë e mbështetetur mbi këtë shportë
konsumi të një grup zgjedhjeje popullsie të marrë nga vëzhgimi dhe është konvertuar
në masë monetare. Kjo ka çuar në zgjedhjen e një kufiri varfërie absolut prej 4 891
Lekë për frymë në muaj. Kufiri i varfërisë ekuivalent me çmimet e vitit 2012 është 5
442 Lekë për frymë në muaj (INSAT 2012). Nga zgjedhje të rastësishme në
bashkësinë e 6671 familjeve kemi marrë 30 prej tyre për ndërtimin e një pjese të
pemës së vendimit. Duke aplikuar algoritmin ID3 si dhe duke i kthyer të dhënat e
tabelës në elemente binare, është ndërtuar gjithashtu pema e vendimit binarë. Kemi
zgjedhur të ndërtojmë këtë pemë binare për të gjitha këto vendime, pasi edhe rruga
për të gjetur rrugën optimale në pemë është edhe më e thjeshtë sepse nga secili kulm
dalin vetëm dy alternativa ose asnjë. Në rast se nuk del asnjë alternativë atëherë ky
është një kulm vendimi final. Pema binare si ekuivalente e pemës vendim-marrëse ka
numër më të vogël gjethesh (kulmesh vendimi). Në bazë të këtij informacioni do të
zgjedhim atributin që ka vlerën më të lartë, duke e quajtur atë rrënjë të pemës sonë.
Pasi të kemi gjetur rrënjën, ky atribut lëviz nga bashkësia dhe për nivelin tjetër të
dhënat do të ndahen sipas vlerave të këtij atributi.
Më poshtë jepet entropia e statusit ekonomik si entropi e një sistemi të tërë:
Tani llogaritim entropinë për atributin→ Madhësi e familjes
Tani llogaritim entropinë për atributin→Zona
Tani llogaritim entropinë për atributin→ Kryefamiljari
61
Siç shihet atributi me vlerë më të madhe është Madhësia e Familjes, e cila do të jetë
edhe rrënja e pemës sonë, atributi tjetër vjen Kryefamiljari e më pas atributi Zona.
Kemi përcaktuar kështu vetëm rrënjën. Në vazhdim për çdo nënndarje në pemë
aplikohet algoritmi nga e para, e kështu me radhë.
Figura 3.9 Klasifikimi i familjeve në Weka
Figura 3.10 Paraqitja e pemës status ekonomik me anë të Weka
62
Pema jonë vendim-marrëse ka klasifikuar më se miri gjithë të dhënat tona. Rrënja e
saj përbëhet nga atributi me entropinë më të madhe që është “madhësia e familjes”,
më pas në nivel të dytë, pasi rillogaritet entropia e nivelit pasardhës, ajo mbetet sërish
me vlerë më të madhe se atributet e tjera. Algoritmi ka klasifikuar duke nxjerr dy
degë me opsione më e madhe se 4.5 dhe më e vogël se 4.5 në lidhje me rrënjën. Më
pas sipas atributit fitues të radhës vendosen edhe variablat cilësorë të secilit. Shohim
se ana e majtë e pemës binare ka klasifikuar “jo të varfërit”, përveç një gjethe që
përmban të varfër , ndërsa ana e djathtë ka klasifikuar “të varfërit”, gjithçka në një
hierarki të tabelës fillestare. Për të ndërtuar pemën ekuivalente binare bëjmë këto
përcaktime:
Tabela 3.3 Vlerat e variablave binare tek statusi ekonomik
Figura 3.11 Paraqitja e klasifikimit binarë për statusin ekonomik
Edhe në pemën binare atributi “madhësi e familjes” është sërish rrënja e pemës. Këtu
atributet kanë vlera 0;1, kështu që algoritmi do klasifikojë me atribute me variabla
numerike jo më cilësore si më lart. Madhësia e pemës është më e vogël, por sërish në
anën e majtë janë klasifikuar “jo të varfër” , p.sh madhësia e familjes
zona ,13 të tillë.
Madhësia e familjes
Zona
Kryefamijlari Mashkull Femër
Statusi ekonomik I varfër Jo i varfër
63
Siç shihet nga paraqitja e pemëve, kemi një informacion më të plotë klasifikimi kur
kemi pemën vendim-marrëse të aplikuar me atribute cilësore dhe sasiore, ndërsa tek
pema binare kemi më pak informacion klasifikimi. Pema binare është e përshtatshme
kur kemi një sasi shumë të madhe të dhënash dhe kur kemi atribute cilësore që marrin
vetëm dy vlera. Nëse tek të dhënat, atributet janë cilësore me 3 ose më shumë tipare
atëherë pema binare nuk është e përshtatshme.
3.3 Një mënyrë e re e përmirësuar e ID3 në pemët binare.
Le të tregojmë një mënyrë për të gjetur pemën optimale të vendimit, duke përdorur
shpërndarjen, që formohet nga transformimi i variablave tanë në variabla binarë.
Dihet që pema e vendimit përfaqëson një shpërndarje dhe çdo rrugë midis atributeve
është një probabilitet i kushtëzuar.[35] Duke zgjedhur pemët binare thjeshtojmë
mënyrën e gjetjes së pemës optimale pasi këtu numri i gjetheve dhe numri i kulmeve
janë të njëjta. Në bazë të një përmirësimi të ID3, mund të tregojmë hapat për të gjetur
pemën optimale binare si më lart.
Shumë punime janë të lidhura me pemët e vendimit, duke përfshirë rritjen e tyre,
seleksionimin, ndarjen dhe kompleksitetin. E rëndësishme është të theksojmë se
përveç algoritmeve të njohur të trajtuar për ID3, C4.5 etj, do mundohemi që t’i
shoqërojmë kulmeve dhe brinjëve karakteristika numerike, duke përdorur teorinë e
probabiliteteve. Kulmi i parë përfaqëson kulmin rrënjë, që është dhe pika fillestare e
një strukture logjike. Nga rrënja përftojmë brinjët që japin alternativat e nivelit të
parë. Po kështu vazhdohet për nivelin e dytë, me alternativat përkatëse. Pra struktura
përftohet duke marr nga çdo kulm, numër të njëjtë brinjësh që kanë alternativat e
nivelit tjetër. Nëse duhet të ndërtojmë një pemë binare për gjithë vendimet e
strukturës, mënyra e gjetjes së pemës optimale është e thjeshtë, sepse nga secili kulm
dalin vetëm dy brinjë si alternativa ose asnjë. Shënojmë me 0 1, ,..., nA A A një bashkësi
variablash binarë dhe me 0 1( , ,..., )nP A A A një funksion probabilitar i shoqëruar me
secilin kombinim të vlerave 1
0 1( , ,..., ) 0,1n
na a a
, në mënyrë të tilë që shuma e
këtyre vlerave shoqëruese të jetë 1. 0 1
1 1 1
0 0 1 1
0 0 0
..... ( , ,..., ) 1n
n n
a a a
P A a A a A a
Nga këto do të marrim ato shpërndarje që kanë:
Le të jenë
0 1, ,...., nA A A një bashkësi variablash binarë. Shënoj 0A një variabël të
etiketuar, atëherë probabiliteti i kushtëzuar është funksioni:
64
0 10 1
1 2
( , ,...., )( | ,...., )
( , ,...., )
nn
n
P A A AP A A A
P A A A . Vërejmë se ky funksion i n+1 variablave, i
cakton secilit kombinimin e vlerave 0 1( , ,... )na a a një vlerë jonegative nga segmenti
[0,1].
Tabela 3.4 Vlerat e probabilitetit të kushtëzuar
Po ashtu kemi që:
0 1 1 0 1 1( 1| ,...., ) ( 0 | ,...., ) 1n n n nP A A a A a P A A a A a
Shpërndarjet në të cilat variablat kanë probabilitet jo zero, quhen shpërndarje të plota.
Në bazë të kombinimit të vlerave 1 2( , ,..., )na a a përcaktojmë një kusht të gjethes që
kjo i përket, duke e shënuar këtë kusht me vC . Pra
0 1 1 2 2( 1| , ,..., )n nP A A a A a A a do të shkruhet 0( 1| )vP A C
Në të njëjtën mënyrë për një bashkësi të dhënë 1 2, ,...,
ki i iA A A , ku
1 2( , ,..., ) (1,2,..., )ki i i n kemi :
1 2
1 2
1 2
0
0
( , , ,..., )( | , ,..., )
( , ,..., )
k
k
k
i i i
i i i
i i i
P A A A AP A A A A
P A A A
Për një shpërndarje probabilitare 0 1 2( , , ,..., )nP A A A A dhe një bashkësi arbitrare
(1,...., )L n , mund të llogaritim gjithmonë probabilitetin e kushtëzuar
0( | , )iP A A i L , i cili është i vetëm pasi përcakton një shpërndarje të plotë. Për një
bashkësi tjetër'L gjenden një numër i pafundëm shpërndarjesh
0 1 2( , , ,..., )nP A A A A ,
nga ku mund të nxjerrim '
0( | , )iP A A i L . I vetmi ndryshim në këtë shpërndarje
probabilitare të bashkuar është në '( , )iP A i L . Kemi pak ndryshime në 1 2( , )P A A dhe
'
1 2( , )P A A .
0A 1A 2A Probabiliteti i kushtëzuar i bashkuar.
0 0 0 0.08
0 0 1 0.16
0 1 0 0.20
0 1 1 0.03
1 0 0 0.09
1 0 1 0.18
1 1 0 0.20
1 1 1 0.06
65
A1 A2 0 1 2( 1| , )P A A A
0 0 9/17
0 1 9/17
1 0 ½
1 1 2/3
A1 0 1( 1| )P A A
0 9/17
1 26/49
A2 0 2( 1| )P A A
0 29/57 1 24/43
0( 1)P A
53/100
Tabela 3.5 Probabilitetet e shpërndarjes P
Së pari probabiliteti kalon nga :
1 2( 1, 0) 0.20 0.20 0.40P A A në 1 2( 1, 0) 0.11 0.11 0.22P A A . Së dyti
1 2( 1, 1) 0.03 0.06 0.09P A A kalon në 1 2( 1, 1)P A A = 0.09 0.18 0.27 .
A0 A1 A2 'P 0 0 0 0.08
0 0 1 0.16
0 1 0 0.11
0 1 1 0.09
1 0 0 0.09
1 0 1 0.18
1 1 0 0.11
1 1 1 0.18
Tabela 3.6 Probabilitetet e shpërndarjes 'P
Le të marrim në konsideratë situatën e mëposhtme: të parashikojmë suksesin për
nxënësit në një provim. Për djemtë, suksesi varet tek njohuritë, kurse për vajzat
suksesi varet nga zelli i të mësuarit. Dihet se njohuritë dhe zelli i të mësuarit janë
fortësisht të korreluara.
Ndërtojmë një pemë për këtë rast si në figurën e mëposhtme:
66
Figura 3.12 Pemët me shpërndarje
Pemët e vendimit janë me të njëjtin klasifikim, por me numër të ndryshëm gjethesh.
Variabli i etiketuar është Kalon/ Nuk kalon ku (Kalon=1, Nuk kalon=0). Z tregon
zell, Nj tregon njohuritë, V/D tregon vajzë/djalë.
Le të jetë P një shpërndarje 0 1 2( , , ,..., )nP A A A A dhe *T një pemë optimale që
përfaqëson shpërndarjen P, atëherë gjendet një varg n me pemë 1 2 1, ,..., , ...,i i nT T T T T
të
tilla që:
1. 1T është një pemë me një kulm të vetëm.
2. iT është pemë që përfaqëson P.
3. 1,2,..., 1k i pema 1kT ndërtohet nga kT me një shkallë të ID3 algorithm.
4. , 1,..., 1k i i n pema 1kT ndërtohet nga kT nga një iteracion këmbimi
prind-fëmijë.
5. nT = T
Nëse v është një kulm prind, me fëmijë 1 2,v v tregohet se:
1 20 0 0( 1| ) ( | ) ( | )v v vP A C P A C P A C
Jemi munduar të gjejmë pemën optimale minimale, duke ndërhyrë në fazën pas
ndarjeve në nivele, duke testuar kur mund të gjejmë një pemë minimale në kushte
supozimi të arsyeshme. Hapi tjetër është përmirësimi i algoritmit ID3 në fazat e
ndarjeve në nivele.
Algoritmi i përmirësuar ID3.
Faza ndarëse
- Ndaj kulmet derisa grupet janë shumë të vogla
Faza e ndalimit
Përsërit
67
- Gjej := Gjej dy gjethe 1 2,v v
- me probabilitet të njëjtë tek gjethja e etiketuar
- të cilat mund të jenë fqinje
- Nqs u gjet atëherë
- etiketo 1 2,v v
Derisa nuk u gjet
Kemi përzgjedhur pak të dhëna nga punëtorët e një biznesi në lidhje me mënyrën e
transportit për në punë. Ata janë përgjigjur me Po ose Jo për alternativat tona, që i
kemi peshuar me variabla 0 dhe 1, për të ndërtuar pemën binare. Alternativat janë 1.
Eshtë kamion? 2. Pesha e madhe e automjetit 3. Pesha e madhe e motorrit 4. Ia vlen?
Tabela 3.7 Të dhënat e punëtorëve
I vetmi ndryshim me ID3 është se kemi zëvendësuar iteracionin “të cilat janë fqinje”
me atë që “të cilat mund të jenë fqinje”. E kemi të thjeshtë të testojmë nëse dy gjethe
mund të jenë fqinje, pasi shohim kushtin e caktuar për to, pasi të dyja do të jenë në të
njëjtën thellësi në pemë. Kemi aplikuar këtë algoritëm në të dhëna reale, duke
përdorur Wekën për ID3 dhe ID3 e modifikuar.
0A
Është
kamion?
1A
Pesha e madhe e
mjetit
2A
Pesha e madhe e
motorrit
3A
Ia vlen?
0 0 0 0
0 0 0 1
0 0 1 0
0 0 1 1
0 1 0 0
0 1 0 1
0 1 1 0
0 1 1 1
1 0 0 1
1 0 0 0
1 0 1 1
1 1 0 0
1 1 0 1
1 1 1 0
1 1 1 1
68
Figura 3.13 Pema binare e ndërtuar nga ID3
Figura 3.14 Pema binare e ndërtuar nga ID3 i modifikuar
Pra siç shihet versioni i modifikuar i ID3 ka vetëm 4 gjethe, krahasuar me versionin e
ID3 të zakonshëm që ka 7 gjethe. Kjo çel rrugën e re për të ndërtuar pemë vendimi
ekuivalente dhe për të gjetur një pemë vendimi optimale, që është shumë e thjeshtë
nëse përdorim probabilitetet e kushtëzuara në pemët binare.
69
KAPITULLI 4
TEORIA E RENDITJES NGA NIVELET E RRJETËS
4.1 Procesi i Analizës Hierarkike (AHP) .
Proçesi i Analizës Hierarkike (AHP) bën pjesë në teorinë gjenerale të matjeve.
Përdoret për të derivuar shanset e krahasimeve dy e nga dy, në rastin diskret dhe të
vazhdueshëm. Këto krahasime mund të merren nga një matje aktuale ose nga një
shkallëzim themelor i cili reflekton forcën relative të preferencave. Në formën e saj të
zakonshme AHP është një kornizë jolineare për të nxjerr mendime induktive dhe
deduktive, pa përdorimin e silogjizmit dhe nga marrja e faktorëve të ndryshëm në
konsideratë në mënyrë simultane, duke lejuar pavarësinë dhe duke bërë vlerësime
numerike për të arritur në një sintezë ose konkluzion. Për një kohë të gjatë njerëzit
janë shqetësuar për të matur ngjarjet fizike dhe psikologjike, ku me fizike kuptojmë
atë çfarë është shumë e njohur. Në kontrast është ngjarja psikologjike, që është fusha
e ideve subjektive dhe besimi i individëve për veten krahasuar me eksperiencën
botërore. [38]
Lind pyetja: A gjendet një teori koherente që mund të bëjë ujdi me të dy këto botë të
realiteteve të ndryshme , pa bërë kompromis me asgjë? AHP është metoda që mund
të stabilizojë masat në të dy këto botë. Duke përdorur AHP për të modeluar një
problem, duhet një hierarki ose një strukturë rrjetore që përfaqëson atë problem dhe
krahasimet dy e nga dy për të stabilizuar relatat në këtë strukturë. Në rastin diskret
këto krahasime çojnë në një matricë dominante dhe në rastin e vazhdueshëm në
operatorët e Fredholmit, nga të cilët shanset rrjedhin në formën e vektorëve të vetë
themelor. Këto matrica janë pozitive dhe reciproke, p.sh
Nga nevoja për gjykime të ndryshme, është bërë një punë e konsiderueshme për të
karakterizuar proçesin e sintetizimeve të gjykimeve të ndryshme. Zakonisht një
model hierarkik i rrjeteve sociale , mund të jetë ndonjë që del nga një fokus, nga një
kriter, nga nënkritere që janë ndarje të kritereve dhe së fundi nga alternativat nga të
cilat zgjedhja duhet të bëhet.
Parlamenti i Finlandës ishte në vështirësi në lidhje me problemin e ndërtimit të një
termocentrali. Anëtarët e parlamentit ishin të fokusuar në lidhje me mënyrën se si do
të ndikonte ndërtimi i tyre në ekonominë Finlandeze. Kishte disa faktorë kryesor nga
ana shëndetësore, e sigurisë dhe e zhvillimit për qytetarët finlandezë dhe faktorët
politikë e relatat e finlandezëve me U.S.S.R. Qëllimi ishte të ndërtohej një
termocentral që do i shërbente më së miri mbarë kombit.
70
Secili nga kriteret kryesore u nda në nënkritere, i ndjekur nga alternativat, llojet e
ndryshme të termocentralit. Një hierarki e thjeshtë e problemit tregohet në figurën e
mëposhtme:
Figura 4.1 Hierarkia e problemit të Finlandës
Është bërë një punë marramendëse për të strukturuar problemin praktik.Gjithë
problemet u pamë se binin në njërën ose tjetrën kategori. Elementet e hierarkisë janë
grupuar në klasa nga homogjeniteti ( sipas aksiomave te AHP) ku niveli konsiston në
një ose disa klasa homogjeniteti. Elementët e çdo niveli mund të shikohen si
dekompozime të elementëve më sipër, pasi për të qenë një hierarki e kompletuar
elementët e një niveli, i kanë elementët e nivelit tjetër si pasardhës. Në këto kushte
nivelet janë klasat e vetme homogjene, në të kundërt hierarkia nuk është e plotë.
Objekti i vendim-marrjes në përgjithësi është përzgjedhja e një alternative sa më
optimale, për tu vënë në jetë, por në situata të tjera kur është fjala për të planifikuar
investimet vjetore të një kompanie apo të një instance administrative buxhetore
shtetërore, si objektiv mund të jetë renditja për nga rëndësia e të gjitha alternativave.
Lind pyetja : Ku është përdorur kjo teori në jetën reale? Le të japim disa shembuj
kryesor të përdorimit në praktikë të AHP.
71
Në administratën publike ka pasur shumë aplikime.
Shteti i Karolinës së Veriut e përdori atë për të zhvilluar vlerësimin e kritereve dhe
shitjeve , lidhur me përzgjedhjen e vlerës më të mirë të shitësve, e pranueshme për
vendim-marrësit.Komisioni Rregullator Bërthamor (KRB) i SHBA me kaq shumë
kërkesa konkuruese të projekteve të tyre teknologjike, përdorën teorinë për të ndarë
100 milion dollarë të portofolit. Saaty pati vështirësi me prioritetet e kërkesave të
shumta konkuruese për të ndarë punën në IT, krahasuar me gjetjen e konsensusit
ndërmjet 35 vetëve. AHP jo vetëm që ndihmoi për të ndarë burimet kryesore të KRB,
por reduktoi edhe kohën e vendimeve nga 15-20 herë. Këshilli Federal i Ekzaminimit
të Institucioneve Financiare (FFIEC) është një trup qeverisëse në SHBA . Ata
përdorën AHP për të gjetur prioritetin e përmirësimit strategjik për aktivitetin që i
nevojitet trupit të njeriut. Ata bënë prioritare objektivat e tyre përmes kërkesave
konkurruese me një numër të limituar burimesh të mjedisit dhe ishin të aftë ta
kompletonin këtë në sesionin e një dite. Klubi i Vajzave dhe Djemve në SHBA si
pjese e planit të tyre strategjik , përdorën AHP për të përkufizuar “riskun e rinisë”
duke i vendosur prioritete relative faktorëve.Grupi arriti konsensus dhe standarte për
planin e tyre strategjik. Departamenti i Mbrojtjes në SHBA përdorën metodën shpesh
dhe frekuentivisht për të ndarë burimet e tyre në aktivitetet e ndryshme .
Administrimi i shërbimeve gjenerale në SHBA përdori AHP për të suportuar
Këshillin e Teknologjisë së Informacionit dhe Këshillin e Kontrollorëve për të bërë
prioritare iniciativat e tyre kryesore në IT. Ata e përdorën procesin për të përsosur
kuadrin e tyre analitik, t’i jepnin prioritet kritereve te tyre. Rezultati ishte prioritizimi
i gjerë i GSA , i iniciativave kryesore IT , që përfshinte një analizë të përftimit të
kostos dhe një analizë të përftimit të riskut.Në 2001 u përdor për të përcaktuar
rivendosjen më të mirë të sajtit, në lidhje me tërmetin që shkatërroi qytetin turk
Adapazari. Kompanitë Britanike të fluturimit e përdorën këtë teori në 1998 për të
zgjedhur sistemet e argëtimit për të gjithë flotën. Një kompani e përdori atë në 1987,
për të zgjedhur tipin më të mirë të platformës, për të shpuar për naftë në Atlantikun e
Veriut. Platforma kushton rreth 3 bilion dollar për tu ndërtuar, por kostoja e rrënimit
ishte edhe një faktor më i rëndësishëm për vendim-marrjen.Një libër u shkrua në 1990
nga Nagel dhe Mills: Metoda shumëkriterëshe për zgjidhje alternative të
mosmarrëveshjeve duke aplikuar konceptet e vendim-marrjes sasiore në
administrimin publik. Nga ekzaminimi i librit del se autorët sugjerojnë shkallëzim
numerik.
Konflikti i SHBA me Kinën
Ky proçes u aplikua në konfliktin midis Kinës dhe SHBA-ve në betejën e të drejtave
të pronësisë intelektuale të kopjimit të muzikës, videove dhe softuereve të vitit 1995
mbi individët kineze. Një analizë AHP përfshin tre hierarki të vendim-marrjes me 97
benefite në kosto dhe risk , tregoi se ishte më mirë për SHBA të mos e sanksiononte
72
Kinën. Personalisht Saatin e ftoi presidenti Klinton duke e pyetur : “ A je krenar që
nuk e sanksionuam Kinën?”. Një studim tjetër pasoi këtë pyetje duke u përgjigjur se
Kina duhej shtuar në Organizatën Botërore të Tregtisë.
Të tjera
Në 1999 Kompania e motorrëve Ford përdorën AHP për të vendosur
prioritetet për kriteret që përmirësojnë kënaqësinë e konsumatorit.
Në 1986 Instituti i Studimit të Strategjive në Pretoria përdori AHP për të
analizuar konfliktin në Afrikën e Jugut dhe rekomandoi aksione për lirimin e
Nelson Mandelës, në heqjen e aparteidit dhe dhënien e shtetësisë së plotë dhe
të drejtave të barabarta për shumicën e zezë. Gjithë këto aksione të
rekomanduara u implementuan shpejt.
AHP është përdorur në pranimin e studentëve , promocione të personelit
ushtarak etj.
Në sporte është përdorur në 1995 për të parashikuar cila skuadër futbolli do të
shkonte drejt fitores.
AHP është aplikuar në IBM për të dizenjuar në mënyrë të suksesshme
kompjutera të rangut të mesëm AS 400. Për këtë IBM fitoi çmimin prestigjoz
Malcolm Baldrige Ekselent.
Me interes themelor ishte analiza për të ndërtuar ose jo Mbrojtjen Kombëtare
të Raketave bërë dy vjet para kohës që vendimi ishte bërë në dhjetor 2002.
Vendimi ishte i njëjtë me studimin e rekomanduar në një konferencë për
ushtrinë e hershme në vitin 2002: duke ndërtuar atë përkundër skepticizmit të
disa shkencëtarëve.
4.2 Shkalla Saaty
Kryerja e një proçesi vendim-marrës kërkon një vështrim shumë të kujdesshëm
krahasues mbi të gjitha alternativat dhe kriteret në shqyrtim. [10] Por realizimi i
krahasimeve vështirësohet për dy arsye : së pari për shumë kritere që ndeshen në
praktikë vlerësimet jepen në trajtë opinionesh kualitative të shprehuara me gjuhën e
zakonshme prej ekspertëve, së dyti edhe kur disa kritere shprehen në mënyrë sasiore ,
ato jepen të matura në njësi të ndryshme përshtatur me natyrën e kriterit, për këtë
arsye shpesh herë nuk mund të përcaktohet ndonjë njësi matje e vlefshme për të
gjithë. Megjithatë, sipas çdo kriteri një opinion dhe vlerësim në terma cilësorë për
krahasimin e alternativave nga specialistët e fushave përkatëse, mund të bëhet. [13]
Në këto kushte çdo përqasje matematike për trajtimin e problemeve të vendim-
marrjes do të mundësohej nëse do të mund të përdornin “ekuivalentë” sasiorë të
shprehjeve gjuhësore krahasuese ndërmjet elementëve të ndryshëm të skemës
hierarkike. Pra për të avancuar ide përqasjesh të tilla, problemi që do të duhej
73
zgjidhur është sajimi i ndonjë mënyre për të shkallëzuar numerikisht karakterizimet e
shprehura me të folurit e zakonshëm të rëndësive relative të elemenetëve të krahasuar.
Ky është problemi më i rëndësishëm i analizës shumëkriterëshe të vendim-marrjes që
hap rrugën për çështjet e tjera teknike. Saaty më 1977 ofroi një zgjidhje të problemit
të shkallëzimit numerik dhe pas kësaj ndërtoi një model të plotë për trajtimin
hierarkik të renditjes së një bashkësie alternativash në shqyrtim lidhur me një skemë
vendim-marrje të dhënë.
Si bazë për ndërtimin e shkallës numerike të krahasimeve të shprehjeve gjuhësore të
opinioneve, Saaty shfrytëzoi konkluzionet e arritura prej disa eksperimenteve
shkencore në fushën e psikologjisë. Sipas ligjit të formuluar nga Weber(1846) një
ndryshim në objekte fizike të matshëm bëhet i ndjeshëm nëse vlerësimi i përmasave
që i është bërë paraprakisht rritet me një përqindje konstante të vetëvlerësimit. Nga
ana tjetër eksperimentet psikologjike kanë treguar se vetëm një njeri i vetëm nuk
mund të krahasojë dhe të operojë njëherësh me më shumë se 7 2 objekte (Miller
1956) . Për këto arsye Saaty përcaktoi numrin 9 si kufirin e sipërm të shkallës së vet
dhe numrin 1 si ndryshesë konstante ndërmjet hapave të njëpasnjëshëm në atë
shkallë.
Në këtë mënyrë pjesa e parë e numrave të shkallës Saaty është 1,2,3,4,5,6,7,8,9.
Pasqyrimi në bashkësinë e numrave bazë të shkallës Saaty i shprehjeve gjuhësore që
përdoren për krahasimin çift e çift të elementëve të çdo niveli të hierarkisë tregohen
në tabelën e mëposhtme:
Përcaktimi gjuhësor Rëndësia
relative
Elementët e krahasuar kanë rëndësi të
njëjtë
1
Rëndësi e dobët e një elementi ndaj tjetrit
3
Rëndësi thelbësore ose e fortë 5
Rëndësi e demonstruar 7
Rëndësi absolute 9
Vlera të ndërmjetme 2,4,6,8
Reciprokët e vlerave 2,3,4,5,6,7,8,9
ku vlen formula
1/2,1/3,1/4,1/5,
1/6,1/7,1/8,1/9
Tabela 4.1 Shkalla Saaty
Objekti i proçesit të analizës hierarkike është përcaktimi prej vendim-marrësit i një
renditjeje sa më të saktë të rëndësive thelbësore të alternativave . Një renditje e tillë
kërkon nje analizë të mënyrës sesi akumulohen masat e pjesshme të rëndësisë së
alternativave siaps kritereve të ndryshme në një tregues përmbledhës final. Është e
kuptueshme se në këndvështrimin e çdo kriteri alternativat kanë pesha të ndryshme
përkatëse me natyrën e kriterit. Këto të fundit quhen pesha lokale, të cilat caktohen
74
për elementet e nënbashkësive të hierarkisë të cilët varen nga një element i vetëm i
nivelit direkt më të lartë sipas vetë përmbajtjes së kriterit.
4.3 Aksiomatika e AHP
Principi i dekompozimit aplikohet nga strukturimi i një problemi të thjeshtë me
elemente në nivele që janë të pavarur nga ata të nivelit të pasuar, duke lëvizur nga
fokusi tek niveli në majë. Kriteret në fokus janë të niveleve të dyta, të treta e kështu
me radhë. Saaty bën një dallim midis dy llojeve të pavarësisë, të cilat ai i quan
strukturore dhe funksionale. Principi i gjykimeve krahasuese aplikohet për të ndërtuar
krahasimet dyshe të rëndësisë relative të elementëve në disa nivele, respektivisht edhe
me kriteret ose vetitë e niveleve të mësipërme. Më pas kemi edhe principin e
sintetizimit të prioriteteve. Tek AHP prioritetet sintetizohen nga niveli i dytë e më
poshtë duke shumëzuar prioritetet lokale me prioritetet e kritereve të tyre
korresponduese të niveleve të poshtme. Kjo i jep një prioritet global atyre elementëve,
që në kthim përdoren për të peshuar prioritet lokale të elementëve të nivelit më
poshtë, krahasuar ndërmjet tyre me atë si kriter, kështu me radhë deri tek niveli më i
fundit. Janë katër aksioma kryesore që dominojnë teorinë e AHP në lidhje me
nocionin e krahasimeve dyshe. [40]
Le të jetë U një bashkësi e fundme n-elementësh që quhen alternativa. Le të jetë C
një bashkësi vetish ose atributesh në lidhje me të cilën elementët e U krahasohen.
Elementëve të C do i referohemi si kritere. Një kriter mund ta quajmë edhe
primitivë. Tek elementët e U do të bëjmë krahasime binare, në akordancë me kriteret
e C . Shënojmë me C një relacion binar në U që përfaqëson “ më të preferuarin e”
në lidhje me kriteret c C . Le të jetë C një relacion binar “indiferent me” një kriter
c C . Keshtu për çdo dy elementë të dhënë ,i jA A A ku i C jA A ose
j C iA A
ose i C jA A , c C . Përdorim i C jA A për të treguar më shumë të preferuarin
ose indiferentin. Një familje binare relacionesh C në lidhje me kriterin c C është
një primitivë. Le të jetë një bashkësi pasqyrimesh të :UxU R dhe
:f C , ( )CP f c për c C ,CP cakton një numër real pozitiv për çdo çift
( , )i jA A UxU .
Në qoftë së kemi ( , )C i j ijP A A a R , ,i jA A U , për çdo c C , treshja
( , , )CUxU R P është një shkallë themelore ose primitive. Një shkallë themelore është
një pasqyrim i objekteve në një sistem numerik.
75
Përkufizim : Për ,i jA A U dhe c C
i C jA A ë ( , ) 1C i jP A A
i C jA A ë ( , ) 1C i jP A A
Nëse i C jA A , themi se iA dominon
jA në lidhje me c C . CP përfaqëson
intensitetin ose fortësinë e preferencave për një alternativë mbi të tjerat.
Aksioma 1 ( Aksioma e reciprocitetit)
Për ,i jA A U dhe c C kemi që :
1
( , )( , )
C i j
C j i
P A AP A A
Kjo aksiomë thotë se matricat e krahasimeve që kemi ndërtuar , janë formuar nga
çiftet e krahasimeve reciproke. P.sh nëse një gur gjykohet se është pesë herë më i
rëndë sesa një tjetër, atëherë tjetri është një e pesta herë më i rëndë sesa i pari. Është
pikërisht kjo relatë e thjeshtë por e fuqishme në bazë të AHP.
Le të jetë ( ) ( ( , ))ij C i jA a P A A bashkësia e krahasimeve dyshe të alternativave në
lidhje respektive me kriteret c C . Nga përkufizimi i CP dhe Aksioma 1, A është
matricë pozitive reciproke. Objektivi është të përftojmë një shkallë dominance
relative të alternativave nga krahasimet dyshe të dhëna në matricën A.
Do të tregojmë si do të përcaktohet dominanca relative të bashkësisë së alternativave
nga matrica A e krahasimeve dy e nga dy. Le të jetë ( )M nR bashkësia e matricave
reciproke pozitive ( ) ( ( , ))ij C i jA a P A A , c C dhe [0,1]n prodhimi kartezian n-
fish i segmentit [0,1] , ( ): [0,1]n
M nW R për ( )M nA R . ( )W A është një vektor n-
dimensional komponentët e të cilit janë në intervalin [0,1] . Treshja ( )( ,[0,1] , )n
M nR W
përfaqëso një pasqyrim midis dy sistemeve numerikë relativ.
Një aspekt i rëndësishëm i AHP është ideja e konsistencës. Nëse një atribut ka një
shkallë për një veti që zotëron nga disa objekte dhe e mat këtë veti në to, atëherë
peshat e tyre relative në lidhje me atë veti janë fikse. Në këtë rast nuk ka më
mospërputhje gjykimesh ( megjithëse në qoftë se njëri ka një shkallë fizike dhe e
aplikon atë në objektet dy e nga dy atëherë derivon qëndrimin relativ të objekteve në
shkallën nga matrica e krahasimeve dy e nga dy). Por duke krahasuar respektivisht
një veti për të cilën nuk ka shkallë të qëndrueshme ose masë, do të mundohemi të
derivojmë një shkallë përmes krahasimit të objekteve dy e nga dy. Përderisa objektet
76
mund të përfshihen në më shumë se një krahasim por nuk kemi një shkallë standarte,
ndaj caktojmë vlera relative si një mjet gjykimi. Konsistenca e AHP është përkufizuar
në mënyrën e mëposhtme.
Përkufizim : Pasqyrimi CP do të jetë konsistent nëse:
( , ) ( , ) ( , )C i j C j k C i kP A A P A A P A A . .i j k
Në mënyrë të ngjashme matrica A do të ishte konsistente nëse ij jk ika a a , . .i j k .
Do të shohim aksiomat hierarkike 2-4 dhe përkufizimet përkatëse.
Në një bashkësi pjesërisht të renditur, përkufizojmë x y në kuptimin që x y dhe
x y , thuhet se y mbulon x ose dominon x. Nëse x y atëherë x t y është e
mundur për një numër t. Le të shënojmë dhe
, për elementet x të bashkësisë së renditur.
Le të jetë H një bashkësi pjesërisht e renditur, atëherë H është një hierarki nëse
plotëson kushtet e mëposhtme:
(a) Gjendet një ndarje e H në dy bashkësi kL , 1,...,k h për disa h ku 1L b , b
është një element i vetëm.
(b) kx L
(c) kx L
Nocioni i shkallëve themelore dhe të derivuara mund të zgjerohet ne kx L dhe
1kx L
duke zëvendësuar C me A respektivisht. Shkalla e rezultuar nga krahasimi i
elementëve në x në lidhje me x, quhet një shkallë lokale e derivuar ose një prioritet
lokal i elementëve në x .
Përkufizim : Për një numër pozitiv real të dhënë 1p , një bashkësi jo boshe
1kx L
është p-homogjene në lidhje me kx L nëse për çdo çift elementësh kemi
se 1 2
1( , )cP y y p
p . Zakonisht aksioma reciproke implikon që ( , ) 1c i iP y y .
Aksioma 2. (Aksioma e homogjenitetit)
Për një hierarki H të dhënë, x H dhe kx L , 1kx L
, është p-homogjene për
. Homogjeniteti është themelor për të gjithë krahasimet, pasi mendja
nuk mund të krahasojë elementët gjerësisht të pangjashëm. Kur pabarazia është e
77
madhe, elementët duhet të vendosen në klastera të ndarë me madhësi të
krahasueshme.
Për kL , 1kL H , do të shënojmë shkallën lokale të derivuar me
1( / ) 1k y x ,
2,3,... 1k h . Duke marr në konsideratë matricën 1 1( / )k k kL L
, kolonat e së cilës
janë shkallë lokale të përftuara nga elementët në kL respektivisht me elementët e 1kL
Përkufizim: Një bashkësi A thuhet se është e varur së jashtmi në një bashkësi C, nëse
një shkallë themelore mund të përcaktohet në A respektivisht me çdo c C .
Proçesi i lidhjeve të elementëve (p.sh alternativa) me një nivel të hierarkisë sipas
elementëve të nivelit tjetër më sipër ( p.sh kriteret), shpreh varësinë ( që është varësia
së jashtmi) e elementëve më poshtë deri tek më lartë, ku krahasimet të mund të jenë të
ndryshme ndërmjet tyre. Hapat përsëriten deri në të gjitha nivelet. Elementet e një
niveli mund të varen edhe ndërmjet tyre, në lidhje me një veti që ndodhet në një nivel
tjetër.
Aksioma 3.( Aksioma e varësisë)
Le të jetë H një hierarki me nivele 1 2, ,..., hL L L , për çdo kL , 1,2,3,... 1k h .
a) 1kL është e varur së jashtmi në kL .
b) 1kL nuk është e varur së brendshmi respektivisht me gjithe kx L .
c) kL nuk është e varur së jashtmi ne 1kL .
Aksioma 4. (Aksioma e pritjeve)
hC H L , hA L
Kjo aksiomë është thjeshtësisht deklarata që i fut në mendime njerëzit të cilët kanë
arsye në besimet e tyre, duhet të sigurohemi se idetë e tyre janë përfaqësuar në
mënyrë adekuate në model. Gjithë alternativat, kriteret dhe pritjet duhet të jenë të
përfaqësuara në hierarkinë. Kjo aksiomë nuk supozon racionalitetin. Bazuar në
konceptin e aksiomes 3, mund të zhvillojmë një funksion peshë. Për secilin x H ,
gjendet një funksion i peshuar i përshtashëm ( natyra e të cilit varet nga fenomeni i
strukturimit hierarkik) :
të tillë që .
Vërejmë se është niveli i fundit për të cilin është jo-bosh. Bashkësitë iL
janë nivelet e hierarkisë dhe funksioni është funksioni prioritar i elementëve në
një nivel në lidhje me objektivin x. Vërejmë se edhe nëse ( për disa nivele
78
mund të përcaktohet për të gjithë , duke i vendosur të barabarta me zero
për të gjithë elementët në jo në x. Funksioni i peshës është një nga kontributet më
domethënëse në aplikimin e teorisë hierarkike.
Përkufizim: Një hierarki është e aplikuar nëse kx L , 1kx L
.
Lind një pyetje qëndrore :
Problemi bazë. Për një element të dhënë kx L dhe një nënbashkësi S L ( )
si do të përkufizojmë një funksion , : [0,1]x Sw S , i cili pasqyron vetite e
funksioneve prioritare në nivelet , .
Specifikisht , çfarë është funksioni , : [0,1]
kb L kw L ?
Pra më ndryshe le të themi se: Për një sistem social të dhënë me një objektiv major b
dhe bashkësia kL e aktiviteteve bazë, të tilla që sistemi mund të modelohet si një
hierarki me elemente nga b deri tek niveli më i ulët kL . Cilat janë prioritetet e
elementëve të ndonjë niveli dhe në veçanti ato të kL në lidhje me b?
Le të tregojmë një metodë për të zgjidhur problemin bazë. Supozojmë se
1,...., km kY y y L dhe 11 1,....,
km kX x x L . Mund të supozojmë se 1kX L
dhe se gjendet një element kz L i tillë që . Marrim në konsideratë
funksionin probabilitar:
dhe
dhe ndërtojmë funksionin prioritar të elementëve në X në lidhje me z, duke e shënuar
me : 0,1w X me anë të formulës :
Duket se kjo nuk është më shumë sesa një proçes i peshimit të influencës së
elementëve në prioritet të , duke shumëzuar atë me rëndësinë e në lidhje me
z. Mund të thjeshtojmë zgjidhjen duke kombinuar brenda në një matricë B
duke vendosur . Zëvendësojmë bashkësitë dhe
atëherë formula e mësipërme shkruhet :
.
79
Pra kemi vektorin prioritar w dhe në të vërtetë një matricë prioritare B të nivelit
(k+1)-të, që formulën finale :
Teoremë : Le të jetë H një hierarki e kompletuar, me elemente me gjerësi b dhe nivele
h. Shënojmë kB matricën prioritare të nivelit të k-të, . Nëse është
vektori prioritar i nivelit të p-të respektivisht me disa elemente z të nivelit (p-1)-të,
atëherë vektori prioritar w i nivelit të q-të, ( )p q respektivisht me z jepet nga
Vektori prioritar i nivelit më të ulët respektivisht me elementin b jepet nga:
ku 1L ka vetëm një element të vetëm Vërejmë se proçesi i krahasimeve dy e
nga dy merr në konsideratë jo-linearitetin. Këto jo-linearitete kapen nga kompozimi i
proçesit të peshimeve. Zakonisht alternativat varen nga kriteret dhe kriteret në
alternativa ku gjendet një cikël që i bashkon të dyja këto, i cili më saktësisht studiohet
me përgjasime të rrjetave.
Një rrjetë është një bashkësi kulmesh (secili nga ata ka një bashkësi elementësh) dhe
një bashkësi harqesh, që tregojnë rregullin e bashkëveprimit përgjatë komponenteve.
Prioritetet e elementëve në çdo kulm janë komponente të vektorit të vetë të matricës
së krahasimeve dy e nga dy, të impaktit relativ të këtyre elemenetëve. Bashkëveprimi
jepet me anë të një harku të rrjetës. Të gjithë këta vektor të vetë përkufizojnë një
matricë globale të prioriteteve me impakt. Formalisht kemi këtë përkufizim:
Përkufizim: Një bashkësi pjesërisht e renditur S është një sistem rrjetor nëse
a) Gjendet një ndarje e S në bashkësitë
b) Gjendet një renditje në , e tillë që implikon që ose
ose është në për ndonjë ose të dy , .
c) Për çdo , gjendet një funksion i peshuar i përshtatshëm
i tillë që dhe për
gjendet një funksion pesh ku
80
4.4 Matrica e krahasimeve
Alternativat në përgjithësi nuk janë të matshme, por edhe kur ato janë të matshme
mund të mos kenë ekuivalentë në një njësi të përbashkët matjeje. E njëjta vërejtje
vlen edhe për kriteret dhe nënkriteret. Pra ështe praktikisht e pamundur që të
përcaktohen peshat e këtyre elementëve të skemës së hierarkisë, pasi ajo që vendim-
marrësi ka mundësi të bëjë është të krahasojë çift e çift elementët e alternativave ose
të bashkësive të nënkritereve e kritereve sipas ndonjë shkallëzimi numerik. Nëse
bashkësia në shqyrtim ka n elemente, atëherë do të bëhen n2 krahasime çift e çift të
elementëve të saj. Rezultatet e krahasimeve të shprehura numerikisht mund të
sistemohen në trajtën e një matrice katrore A, ku nga shkalla Saaty matrica ka veçori:
A quhet maricë e krahasimeve, ku elementët e diagonales kryesore janë njësha.
Le të marrim parasysh një kriter të caktuar dhe bashkësinë prej n alternativash në një
problem vendim-marrje me të dhëna të përcaktuara. Nga këndvështrimi i atij kriteri
çdo alternativë e ka një peshë lokale por tani ato pesha janë të panjohura. Le t’i
shënojmë peshat përkatësisht me , ku në funksion të këtyre peshave
sidoqë të jenë të panjohura, rëndësia relative e një alternative “i” ndaj një tjetre “j”
jepet nga raporti
. Kështu matrica e krahasimit merr trajtën:
1 1
2
2 2
1
1 2
1 ....
1 ....
.... ..... ..... .....
.... 1
n
n
n n
A
Shohim se në matricën A të gjithë rreshtat e saj janë të përpjesshëm me rreshtin e
parë. Vërtet po të shumëzojmë elementët e rreshtit të parë me 1
i
përftohen me radhë
të gjithë rreshtat e tjerë. Zgjedhim në rreshtin “k” elementin akk dhe një element tjetër
çfarëdo akj , në një rresht tjetër “i” marrim korresponduesit e tyre sipas shtyllave, pra
jemi duke shqyrtuar katërshen e elementëve , , ,kk kj ik ija a a a . Nga vetia e
pjesëtueshmërisë së rreshtave të matricës A mund të shkuhet barazimi:
81
kjkk
ik ij
aa
a a dhe meqë kka =1 atëherë kemi
ij ik kja a a
Pra në mënyrë të përmbledhur matrica A ka këto veti:
iia =1 , i=1,2,3,…n
i,j=1,….,.n
ij ik kja a a i,j,k=1,…..n
Çdo matricë që gëzon këto veti do të quhet konsistente.
Vektorët e vetë
Nëse ija përfaqëson rëndësinë e alternativës i ndaj alternativës j,
jka përfaqëson
rëndësinë e alternativës j ndaj alternativës k, atëherë ika tregon rëndësinë e
alternativës i ndaj asaj k, duhet barazuar ij jka a për vlerësimet që të jenë konsistente.
Nëse nuk kemi një shkallë të caktuar, nuk mund të japim vlera fikse të
por vetëm
një vlerësim. Problemi ynë kalon në
ku
është vlera e vetë
principale e vlerat pas krahasimit të me
. Për të
thjeshtësuar shënimet do të përdorim
. Zgjidhja më tej përftohet nga
rritja e matricës, më pas shumimi sipas rreshtave dhe normalizimi i vektorit prioritar
të peshave 1( ,...., )nw w w . Proçesi ndalon kur diferenca midis komponenteve të
vektorit prioritar është më e vogël se disa vlera të paracaktuara. Një rrugë e thjeshtë
për të përafruar prioritet është normalizimi i mesatares gjeometrike të rreshtave. Një
tjetër rrugë për të përftuar një përafrim është normalizimi i mesatares së elementëve
të secilës kolonë të matricës krahasuese .
Nga matrica A dihet se të llogaritet vlera e vetë kryesore max si rrënjë e polinomit
karakteristik të kësaj matrice , është e vështirë. Për të hapur një rrugë më të lehtë
Saaty ndjek një drejtim të kundërt, ai realizon një vlerësim të vektorit dhe mbi këtë
bazë kryen më thjesht përllogaritjen e max . Sipas tij vektori me komponent të
mesmet gjeometrike të elementëve të çdo rreshti është:
1 2. .......ni i i ina a a
82
dhe përcaktohet si një vektor i vetë i nënhapësirës vektoriale të përcaktuar nga max .
Për arsye të linearitetit të nënhapësirës së përcaktuar nga autovlerat, edhe i normuari i
vektorit , që po e shënojmë me , mbetet një vektor i vetë korrespondues i max .
Komponentet e janë:
Pikërisht këto komponente janë vlerësime të peshave lokale të elementëve në
shqyrtim kur matrica e krahasimeve rezulton me konsistencë të pranueshme. Në
ekuacionin maxA
le të vendosim si koordinata të vektorit vlerat e llogaritura
nga barazimi i mësipërm, atëherë do të kemi:
1 1 2 2 max.....i i in n ia a a
Le të shënojmë me js shumën e elementëve të shtyllës j të matricës A:
Duke ndryshuar indeksin i nga barazimet e mësipërme, koeficintët pranë peshave
1,...., n në anën e majtë do të jenë përkatësisht 1,...., ns s . Nga fakti se shuma e të
gjitha i është 1, rrjedh se shuma e anëve të djathta do të jetë vlera e vetëmax
kryesore. Pra kemi :
max
1
n
j j
j
s
4.5 Qëndrueshmëria Saaty
Vetitë e mësipërme të matricave të krahasimit u bazuan në supozimin se elementët e
atyre matricave janë përcaktuar nga raporti i peshave objektive të alternativave apo
kritereve. Por në praktikë janë ato pesha që vendim-marrësi kërkon të njohë.
Ekspertët nuk mund të përcaktojnë menjëherë peshat i të matricave. Ajo që ata
mund të bëjnë drejtpërdrejt është të vlerësojnë rëndësinë relative ija për çdo çift
alternativash ,i jA A . Pra problemi në praktikë ka kahen e kundërt : në kushtet kur janë
të disponueshme vlerësimet ija të raporteve i
j
të peshave, kërkohet një vlerësim i
83
pranueshëm i komponentëve i të vektorit të peshave . Problemi tjetër është se sa
mirë është vlerësuar vektori i vetë w? Na duhet që matrica A në vetvete të jetë
konsistente ose e qëndrueshme. Nëse matrica nuk është e qëndrueshme na duhet një
mase gabimi për jo qëndrueshmërinë. Del se A është e qëndrueshme nëse max n
dhe se gjithnjë kemi që max n . Kjo sugjeron të përdorim indeksin
max n si një
zhvendosje nga qëndrueshmëria. Por
max
2
n
i
i
n
, max i
ku i , 1,...,i n janë vlerat e veta të A. Për të ecur teknikisht përpara në trajtimin e
këtij problemi Saaty konsideroi si pikë mbështetje Indeksin e konsistencës ose
qëndrueshmërisë IC që përcaktohet nga herësi:
max
1
nIC
n
Ky raport tregon një mesatare të shmangies së vlerave të veta të matricës nga zeroja.
Saaty mori 500 matrica me elementë nga shkalla e tij 1/9,….,9, ku llogariti IC për
secilën matricë dhe u vlerësua mesatarja e tyre. Kjo mesatare quhet RC, indeksi
rastësor i qëndrueshmërisë. Tabela e mëposhtme tregon vlerat e RC për matrica deri
në rendin e dhjetë
Tabela 4.2 Indeksi rastësor i qëndrueshmërisë
Si shprehje sasiore e masës së tolerancës është marrë i ashtuqujturi koefiçient i
qëndrueshmërisë që është :
ICRI
RC
Lind pyetja: Pse të tolerojmë 10% jo konsistencë? Prioriteti i konsistencës për të
përftuar një shpjegim koherent të bashkësisë së fakteve , duhet të ndryshojë në bazë
të jo konsistencës, e cila është një masë gabimi e konsistencës. Pra, në një shkallë nga
0-1, jo konsistenca nuk e tejkalon 0.10 shumë. Ky kufizim nuk duhet të bëhet më i
vogël se 1% ose 0.1%. Arsyeja ështe se jo konsistenca në vetvete është e
rëndësishme, ku pa atë njohuritë e reja të cilat ndryshojnë rendin e preferencave nuk
mund të pranohen. Kështu objektivi i zhvillimit të një konsistence të spektrit të gjerë
varet nga pranimi i jo konsistencës. Kjo kërkon që numri i elementëve të krahasuar të
N 1 2 3 4 5 6 7 8 9 10
RC(n) 0 0 0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49
84
jetë i vogël, pasi po qe numër i madh atëherë prioritet relative të elementëve do të
jenë të vogla saqë gabimi mund të devijojë prioritetet. Nëse numri i elementëve është
i vogël dhe prioritetet janë të krahasueshme , një gabim i vogël nuk ndikon në lidhje
me përgjigjet përfundimtare. Për të ndodhur kështu duhet që elementët të jenë më të
vegjël se 10, që vlerat e tyre në tërësi të jenë më të mëdha se 10% secili , ku ngelen
me 1% gabim. Konsistenca e gjithë hierarkisë (IC) jepet nga
1
, 1
1 1
i jn
h
h ij i j
j i
C w
ku 1ijw , për 1j dhe është numri i elementëve të nivelit j+1 , në lidhje me
kriterin i, tregon indeksin e konsistencës të nivelit i në lidhje me kriterin j+1.
4.6 Një veti e matricave të qëndrueshme.
Shënojmë nR vektorin me komponente peshat shoqëruese të alternativave të
menduara si më lart. Le të shumëzojmë matricën A nga e djathta me vektorin shtyllë
:
1 1
2
2
1
1 2
1 ....
1 ....
.... ..... ..... .....
.... 1
n
i
n
n n
A
1
2
...
n
=
1
2
...
n
n
n
n
=
1
2
...
n
n
Barazimi i gjetur tregon se n është një zgjidhje e ekuacionit: A .
Nga fakti që rreshtat e matricës A janë të përpjesshme mund të shohim lehtë se
minorët kryesor të saj kanë këto vlera: 11 221, 0,...., 0nnM M M . Pra matrica A
është gjysëm e përcaktuar pozitivisht.
4.7 Përcaktimi i peshave globale
Qëllimi final i vendim-marrësit është që të arrijë në një vlerësim të peshave globale të
alternativave që në fakt janë tregues sintetizues të të gjitha niveleve e gjykimeve që
përmban skema hierarkike e çdo problemi konkret. Për të paraqitur edhe këtë hap të
AHP, vendim-marrësi i bazon gjykimet në kriteret që ka zgjedhur, por vetë ato kritere
nuk kanë të njëjtën rëndësi. Këto vlerësime janë po ashtu në shkallë lokale edhe për
këtë arsye kryen me po atë proçedurë që u përdor për peshat lokale të alternativave
85
lidhur me kritere të ndryshme. Pesha globale e një alternative përmbledh peshat e saj
sipas kritereve në përpjesëtim me peshën që ka vetë kriteri në vendim-marrje. [20]
Numerikisht pesha globale e një alternative të caktuar merret si shumatore e
prodhimeve të peshave, që ajo ka sipas çdo kriteri të veçantë të shumëzuar me peshën
e vetë të kriterit. Shënojmë 1 2 3 4, , , vektorët shtyllë të peshave të alternativave
sipas kritereve në shqyrtim. Me këta vektorë ndëertojmë një matricë B që ka aq
rreshta sa është numri i alternativave dhe shtylla sa numri i kritereve. Shënojmë ij
komponenten e i-te të vektorit j , j=1,2,34 dhe ( )j K komponenten e j-të të
vektorit të normuar të peshave të kritereve ( )K . Shënojmë me * vektorin e
peshave globale, që është:
4*
1
( )i ij j
j
K
Mbi këtë bazë mund të përdorim shumëzimin e matricës B me shtyllën ( )K
rezultati i të cilit është *
* ( )B K
11 12 13 14
21 22 23 24
31 32 33 34
41 42 43 44
11
2
2
3
34
( )
( )
( )
( )
K
K
K
K
Në qoftë se skema hierarkike përmban 4 nivele , bashkë me nivelin zero të
alternativave, atëherë peshat globale gjenden hap pas hapi . për secilin kriter të nivelit
të dytë përcaktojmë vektorin e peshave globale si më sipër. Më pas këto pesha
globale të përkohshme shihen si pesha lokale të alternativave lidhur me kriteret.
Prodhimi i matricës B me vektorin shtyllë të peshave përcakton prodhimin
përfundimtar të peshave globale që vendim-marrësi u atribuon alternativave.
4.8 Strukturimi i informacionit. Matjet absolute dhe relative.
Në përgjithësi ne njohim dy lloje krahasimesh absolute dhe relative. Në krahasimet
absolute alternativat krahasohen me një standart të dikujt që ka në memorie nga
eksperienca e tij, në krahasimet relative alternativat krahasohen në çift lidhur me një
atribut të përbashkët.[18] Metoda AHP është përdorur me të dy llojet e krahasimeve
për të derivuar shkallët racionale të matjeve. Këto shkallë i quajmë shkallë matje
absolute dhe relative. Matja relative në AHP është e mirë zhvilluar , zgjedhja eksperte
përfshin këtë metodë matjeje duke i quajtur “raporte”. Matjet absolute aplikohet për
86
të renditur alternativat në lidhje me kriteret ose ndryshe në terma të raporteve të
kritereve.
Duke përdorur matjet absolute , nuk ka rëndësi sa shumë alternativa të reja futen, ose
të vjetra fshihen, renditja e alternativave nuk ndryshon. Ideja është përdorur për të
renditur qytetet në SH.B.A , në lidhje me nëntë kritere të gjykuara nga 6 njerëz. Një
shembull tjetër i përdorimit të matjeve absolute është ai i shkollave që pranojnë
studentë. [28]
Shumë shkolla vendosin kriteret e tyre për të pranuar studentë në mënyrë të pavarur,
prioritetet e tyre përdoren më pas për të caktuar kur një student arrin një bashkësi
standartesh për një kualifikim. Në këtë rast matjet absolute përdoren për të caktuar
cili student kualifikohet për pranim. Por kjo masë absolute kërkon edhe standarte,
zakonisht vendoset nga shoqëria për thjeshtësi të saj dhe në problemet e reja të
vendimit , ose në të vjetrat ku nuk ka standarte të fiksuara, ne duhet të vazhdojmë të
përdorim matjet relative duke krahasuar alternativat për të gjetur më të mirën. Pyetja
tani është : “Ҫfarë ndodh me renditjen kur përdorim masat relative dhe kur
alternativat shtohen ose fshihen?”
Kur matjet relative përdoren për shembull për të blerë një makinë, edhe kur prioritetet
e kritereve janë vendosur pavarësisht alternativave, makina që kualifikohet në fund
varet nga numri i makinave të ekzaminuara. Duke shtuar një makinë të re në
koleksion, nga ekzaminimi mund të ndryshohet renditja e makinave origjinale. Ky
fenomen mund të llogaritet duke konsideruar operacionin e normalizimit si një kriter
strukturimi , që ka të bëjë me informacion në proçesin e matjeve. Me matjet relative
prioriteti në të cilin ndryshon ky kriter , kur alternativat e reja shtoheshin ose kur ato
të vjetra fshiheshin, atëherë një tjetër renditje mund të përshkojë alternativat e vjetra.
Analogjia mund të bëhet me modelet matematikë të programimit linear , kur shtohet
një variabël i ri. Nuk është nevoja për një relacion midis zgjidhjeve të reja të
problemit me ato të vjetra.[14]
Megjithatë renditja finale mund të ndryshojë edhe kur gjykimet janë konsistente , kur
një alternativë dominon mbi një kriter , por dominohet nga ai nën një tjetër. Le të
marrim një shembull për të ilustruar situatën në strukturimin e kritereve.
Shembull. Për një vendim-marrje në lidhje me investimet le të përdorim vetëm dy
kritere KTHIM dhe RISK I VOGËL, për të përcaktuar se kur është më mirë të
investohet. Le të supozojmë se ata janë njëlloj të rëndësishëm, pra me prioritete 0.5
dhe 0.5. Së pari marrim dy alternativa, lidhja e taksave pa pagesë (A) dhe letra me
vlerë (B), i krahasojmë ato së bashku sipas preferencave së pari të preferencës
KTHIM dhe më pas atë RISK I VOGËL, duke marr edhe peshat e këtyre
kompozimeve.
87
Renditja finale është:
: 0.5 0.75 0.5 0.33 0.54A : 0.5 0.25 0.5 0.67 0.46B
A është më e preferuar se B. Duke vëzhguar proiritetet e alternativave nën secilin
kriter, mund të rishkruajmë operacionet e mësipërme aritmetike për të treguar se
normalizimi aplikohet për të rishkallëzuar prioritetet e kritereve dhe përdor ato për të
peshuar prioritetet e alternativave para se ato të normalizoheshin. Kështu po të
shkruajmë 0.75=3/4, 0.25=1/4, 0.33 = 1/3, 0.67=2/3, vërejmë se 4 është faktori i
normalizimit për KTHIM-in dhe 3 është faktori i normalizimit për RISK I VOGEL ,
nga më sipër mund të shkruajmë:
Me fjalë të tjera, normalizimi mund të konsiderohet si një operacion që transformon
peshat e kritereve nga shkalla origjinale (0.5,0.5) në shkallën e re (0.5/4, 0.5/3) që
kur normalizohen bëhen
të cilat janë prioritetet e rishkallëzuara të kritereve. Pra, masa relative mund të
konsiderohet si një operacion që fut gjithmonë një kriter të ri që operon me kriterin
ekzistues duke modifikuar prioritetet e tyre. Këtë gjë e quajtëm kriteri
strukturor.Është e njohur në teorinë e vendim-marrjes që ndryshimi i renditjes mund
të ndodh kur një kriter i ri futet dhe ku kemi hasur një lloj të ri kriteri themelor që
është gjithmonë prezent kur performojmë masat relative. Le të shohim sesi ndodh
ndryshimi i renditjes duke futur alternativat e reja LLOGARI KURSIMI (C), me
rezultatet e krahasimeve dyshe të treguara më poshtë:
KTHIM A B C Prioriteti
A
B
C
1 3 1/2 0.30
1/3 1 1/6 0.10
2 6 1 0.60
KTHIM A B Prioriteti
A
B
1 3 0.75
1/3 1 0.25
RISK I VOGËL A B Prioriteti
A
B
1 1/2 0.33
2 1 0.67
88
RISK I VOGEL A B C Prioriteti
A
B
C
1 1/2 4 0.31
2 1 8 0.08
1/4 1/8 1 0.62
Si më sipër do të kemi :
Prezenca e alternativës C ka shkaktuar ndryshim renditje midis A dhe B, ku B del më
e preferuar se C, e cila është më e preferuar se A. Në këtë rast do të injorojmë
renditjen e parë dhe do të marrim të dytën. Vërejmë se ky proçes i ndryshimit të
renditjes nuk është kontradiktor me ndonjë fakt ekzistues, ku nuk kemi precedent
historik në teorinë shumë kriterëshe të mirë-zhvilluar, për ta kontrolluar atë sërish.
Në teorinë e masave relative, AHP kërkon që elementët të jenë homogjenë për tu
krahasuar me njëri-tjetrin. Në një punim të papublikuar të Th.Saaty , sigurohet një
principël në lidhje me renditjen dhe ndryshimin.“Ka pasiguri të madhe rreth renditjes
optimale me rritjen e përqindjes së ndryshimit të informacionit”
Le të japim një shembull konkret të zbatimit të teorisë AHP që vetë autori Saaty e ka
përdorur për djalin e tij adoleshent, i cili mbaroi kolegjin me rezultate shumë të larta,
në përzgjedhjen e një universiteti për studimet e larta. Përdorim metodën AHP për të
bërë një përzgjedhje.Ai ishte përzgjedhur nga universitetet Svarthmore, Northvestern,
Miçigan Vanderbilt dhe Mellon. Meqë kostoja e studimeve të secilit ishte pothuajse e
njëjtë, ajo nuk u përfshi si një kriter në hierarki.
Qëllimi
Kritere Vendndodhja Reputacioni Akademikët Ambjenti
Alternativa Svarthmore Northvestern Miçigan Vanderbilt Mellon
Figura 4.2 Hierarkia e universiteteve
Universiteti më i mirë
89
Në Northvestern ai zgjodhi një dhomë fjetjeje përballë liqenit Miçigan, duke
kombinuar një palë pushime 4-vjeçare bashkë me studimet e tij.
U morën në kosideratë 4 kritere themelore : Vendndodhja –perceptohet që shkolla të
jetë sa më larg shtëpisë, Reputacioni – tregon renditjen që ka universiteti ,
Akademikët –tregojnë përqëndrimin e personalizuar klasat e vogla kundrejt atyre të
mëdha, Ambjenti- sa mirë ndihet një student në atë universitet. Hierarkia e mësipërme
e tregon këtë situatë. Djali kishte një temperament artistik, shkrim kaligrafik në
pozicion të përkulur dhe me këtë natyrë ai zgjodhi universitetin Northvestern pasi
reputacioni dhe akademikët e tij janë pak më pak të preferuar sesa ai Svarthmore.
Për një çift elementësh ( , )i j të një niveli të hierarkisë i krahasojmë respektivisht me
elementët e një niveli poshtë tyre, në lidhje me një kriter, i përdorur për të gjykuar
cila ka më shumë rëndësi. Një pyetje tipike për të vendosur një element në matricën e
krahasimeve është: kur të marrim në konsideratë dy elemente në pozicionin i dhe j,
cili e plotëson më shumë kriterin, ose cili konsiderohet më i rëndësishëm për atë
kriter? [16]
Kjo pyetje në lidhje me krahasimet influencon në gjykimet e bëra. Duhet të jetë e
qartë që në fillim se cili është qëllimi i hierarkisë dhe si kombinohen elementët e
nivelit të dytë me të tretë. Matrica e krahasimeve e kritereve në lidhje me qëllimin
është :
Vendndodhja Reputacioni Akademikët Ambjenti
Vendndodhja 1 1/5 1/5 1/7
Reputacioni 5 1 1 1/2
Akademikët 5 1 1 1/3
Ambjenti 7 2 3 1
Pyetja është : Sa më shumë preferohet Vendndodhja në krahasim me Ambjentin?
Ambjenti preferohet në fakt 7 herë më shumë sesa Vendndodhja. Vlera reciproke 1/7
shënohet në pozicionin (1,4). Kështu vlera 7 vendoset në pozicionin (4,1)
automatikisht. Nga përkufizimi i konsistencës kemi që elementët e saj duhet të
plotësojnë këtë veti: ij jk ika a a . Por kjo matricë nuk është konsitente, pasi për
shembull (Ambjenti, Reputacioni)=2 kurse (Reputacioni, Akademikët)=1, atëherë
(Ambjenti, Reputacioni)x(Reputacioni, Akademikët)=2 ndërsa vlera (Ambjenti,
Akademikët)=3.
Pra kjo vlerë është më e madhe se 2 për të qenë konsistente. Por kemi futur vlerën 1/3
në pozicionin (4,2) e cila është . Rëndësia e këtij vëzhgimi është se kur
një vlerë tejkalon vlerën korresponduese konsistente, reciprokja e saj është më e
vogël se reciprokja e vlerës konsistente, pra ka një tendencë kompensimi. [24] Në
qoftë se një matricë e rendit n është konsistente, vlera e vetë kryesore ka vlerën n. Kur
90
është jo konsistente vlera e vetë kryesore tejkalon n dhe ky kalim shërben si një masë
e jo konsistencës, me anë të një raporti që është indeksi i konsistencës. Hapi tjetër
është llogaritja e peshave, duke gjetur vektorin e vetë të matricës dhe duke e
normalizuar atë. Kjo quhet shkalla lokale para peshimit sipas prioriteteve të kritereve
të mëparshme. Pas peshimit quhet vlera globale e shkallëzuar.
Përftojmë vektorin me këto pesha relative:
(Vendndodhja, Reputacioni, Akademikët, Ambjenti) = (0.053, 0.238, 0.213, 0.491)
me një shkallë të jo konsistencës 0.02 . Hapi tjetër është vendosja e matricave të
krahasimit për universitetet e nivelit 3 krahasuar me kriteret e nivelit 2.
Janë katër matrica të tilla ku secili nga universitetet krahasohet me kriteret. Të pestë
universitetet në lidhje me vendndodhjen kanë këtë tabelë krahasimi:
Venndodhja Svarth North Miçig Vander Mell
Svarth 1 ¼ 1/3 1/3 7 0.115
North 4 1 2 3 7 0.402
Miç 3 ½ 1 3 6 0.283
Vander 3 1/3 1/3 1 4 0.163
Mell 1/7 1/7 1/6 ¼ 1 0.037
Tabela 4.3 Universitetet në varësi të kriterit vendndodhje
Si më sipër kemi këto vlera për këtë matricë:
(1) ( Svarth, North, Miç, Vander, Mell)=(0.115, 0.402, 0.283, 0.163, 0.037)
Për kriteret e tjera (2) Reputacioni , (3) Akademikët dhe (4) Ambjentet kanë këto
vlera :
(2) ( Svarth, North, Miç, Vander, Mell)=(0.521, 0.235, 0.147, 0.038, 0.059)
(3) ( Svarth, North, Miç, Vander, Mell)=(0.564, 0.209, 0.132, 0.040, 0.055)
(4) ( Svarth, North, Miç, Vander, Mell)=(0.034, 0.539, 0.250, 0.121, 0.056)
91
Shënoj B matricën e përbërë nga peshat lokale të kritereve dhe vektorin e peshave
globale të firmave . Shënoj ,
Kjo i jep një prioritet final me vlerë o.387 për universitetin Northvestern, si një
shkollë më e preferuar se Svarthermore me prioritet 0.270.
4.9 Klasifikimi i firmave pjesëmarrëse në një tender. (Zbatim)
Le të shohim rastin e klasifikimit të katër firmave në një tender. Pasi kemi mbledhur
të dhëna për ato, F1: Zbogo, F2: Teuta konstruksion, F3: Kontakt shpk, F4: The best
Construction, kemi vlerësuar në bazë të 5 kritereve kryesore , K1, K2, K3, K4, K5 ,
firmën që është më e përshtatshme për projektin tonë. [34]
Firma
Kritere
F1
Zbogo F2 Teuta
konstruksion
F3 Kontakt shpk
F4 The best
Construction
K 1
Eksperienca
5 vjet përvojë 10 vjet
përvojë
8 vjet përvojë 3 vjet përvojë
K 2 Kualiteti
i punimeve
Organizim i
mirë
Organizim
mesatar
Organizim i mirë Organizim
mesatar
K 3 Fuqia
punetore
50 punëtorë, 10 specialistë
60 punëtorë, 15 specialistë
35 punëtorë, 5 specialistë
40 punëtorë,10
specialistë
K 4 Pajisjet e
punës
4 betoniera,1 ekskavator
2 betoniera,2 ekskavator
6 betoniera,1 ekskavator
3 betoniera ,2 ekskavator
K 5 Ngarkesa aktuale e
punës
1 projekt i madh në
përfundim,2
në proces
2 projekte në përfundim
1 projekt i mesëm i filluar, 2 në
përfundim
2 projekte të vogla,3
projekte në
mbarim
Tabela 4.4 Kriteret e firmave
Kriteret janë : K1 eksperienca, K2 kualiteti i punimeve, K3 fuqia punëtore, K4 pajisjet
e punës, K5 ngarkesa aktuale e punës. Duke u bazuar në shkallëzimin AHP gjejmë
një renditje për këto firma.Të dhënat e grumbulluara për firmat e ndërtimit të
mësipërme , i kemi grumbulluar në tabelën e mësipërme.
Skema hierarkike është:
92
Figura 4.3 Struktura hierarkike e firmave
Matrica e krahasimit për kriteret e mësipërme, duke u nisur nga rëndësia që japin
ekspertët , mbi bazën e shanseve bazë që kanë vlerësuar ata në bazë të tabelës 24
kemi :
Tabela 4.5 Krahasimet e kritereve
dhe vektori i peshave = . Pra kemi
1 3 4 2 4
11 2 4 5
3
1 11 3 2
4 2
1 1 11 2
2 4 3
1 1 1 11
4 5 2 2
A
K1 K2 K3 K4 K5
K1 1 3 4 2 6
K2 1/3 1 2 6 5
K3 ¼ ½ 1 3 2
K4 ½ 1/6 1/3 1 2
K5 1/6 1/5 1/2 ½ 1
93
Llogaritim
ku
Llogaritim shumën e elementëve të shtyllës “j” të matricës dhe kemi :
2.33
Llogaritim tani
Nga tabela standarte për vlerën , ndërsa vlera jonë
5.384
Pra kemi , që tregon se matrica e krahasimit është
konsistente dhe vektori i peshave është vektor i vetë i kësaj matrice.
që në bazë të tabelës 2 , jemi në vlera kufitare të pranueshme.Më pas ndërtohen me
radhë matricat të krahasimit të firmave
sipas secilit prej 5 kritereve. Në çdo rast do të llogaritim vlerën
duke parë për konsistencën apo jo të matricave e më pas do gjejmë ku B
është matrica që ka për shtylla vektorët e peshave lokale. Pikërisht këtu është edhe
renditja jonë e firmave. Në bazë të ekspertëve matrica e krahasimit për kriterin
është si më poshtë:
1
1 11 2
3 2
3 1 3 2
( ) 12 1 2
3
1 1 11
2 2 2
A K
41 1
1 23 2
4 3.1.3.2
41
2. .1.23
41 1 1
. . 12 2 2
94
Llogaritim shumën e elementëve të shtyllës “j” të matricës dhe kemi :
Llogaritim tani
Nga tabela standarte për vlerën , ndërsa vlera jonë
4.138
, që tregon se matrica e krahasimit është
konsistente dhe vektori i peshave është vektor i vetë i kësaj matrice. Për kriterin e
dytë kemi :
2
1 4 3 2
1 1 11
4 4 2( ) 1 1
4 13 3
12 3 1
2
A K
,
, ,
Nga tabela standarte për vlerën , ndërsa vlera jonë
4.17
, që tregon se matrica e krahasimit është
konsistente dhe vektori i peshave është vektor i vetë i kësaj matrice.
95
Shohim për kriterin e tretë.
3
11 7 2
3
1 1 11
( ) 7 5 4
3 5 1 4
1 14 1
2 4
A K
,
, ,
Nga tabela standarte për vlerën , ndërsa vlera jonë
4.219
, që tregon se matrica e krahasimit është
konsistente dhe vektori i peshave është vektor i vetë i kësaj matrice.
Llogaritim për kriterin e katërt.
4
1 11 2
6 8
16 1 5
( ) 4
8 4 1 9
1 1 11
2 5 9
A K
, ,
Nga tabela standarte për vlerën , ndërsa vlera jonë
4.133
, që tregon se matrica e
krahasimit është konsistente dhe vektori i peshave është vektor i vetë i kësaj
matrice.
96
5
1 11 2
2 4
12 1 5
( ) 3
4 3 1 4
1 1 11
2 5 4
A K
, ,
Shënoj B matricën e përbërë nga peshat lokale të kritereve dhe vektorin e peshave
globale të firmave . Shënoj ,
0.450.168 0.46 0.27 0.068 0.138
0.190.45 0.088 0.054 0.25 0.26
0.1960.23 0.171 0.517 0.62 0.518
0.0940.132 0.275 0.156 0.049 0.07
0.063
B
=
0.214
0.265
0.32
0.15
Ky vektor tregon se preferencat janë në këtë rend : Kontakt shpk, Teuta
konstruksion, Zbogo, The best construction.
Në përdorimin e AHP për të modeluar një problem, na duhet hierarkia e një strukture
rrjetore që përfaqëson problemin vendimmarrës dhe shkalla Saaty për të bërë
krahasimet në këtë strukturë. [25], [27]
4.10 Vlerësimi i faktorëve të riskut për të qenë i sëmurë me anë të AHP.
(Zbatim)
Në ditët e sotme diskutimet më të shumta janë fokusuar në zhvillimet shkencore të
sëmundjeve kanceroze. [32] Pavarësisht kërkimeve të gjata për faktorët që shkaktojnë
këto sëmundje, ata janë gjithmonë të ndryshëm dhe jo të fiksuar. Shkenca ka
konkluduar se numri i faktorëve që shkaktojnë kancer varet nga llojet e kancerit. Për
shembull sëmundjet e hundëve janë shkaktuar nga duhani, puna në ventilim të paktë,
drogat e ndryshme etj. Faktorët më të shumtë janë ekspozimet kimike, historitë
familjare, alkoli, duhani etj. Ky studim është fokusuar në të dhënat e Spitalit të
Tiranës, për të vlerësuar riskun e të paturit kancer bazuar në disa faktorë siç janë
duhanpirja, alkoli, obeziteti, historia familjare. Bashkësia e të dhënave është marr nga
vitet 2010-2015, ku llojet më të ndeshur të kancerit janë : kancer i mushkrisë, kancer i
97
fytit, kancer i gjoksit dhe kancer i prostatës. Do të ndërtojmë strukturën hierarkike ku
vendim-marrësi konsiderohet risku i kancerit, si nivel i parë i strukturës.
Figura 4.4 Struktura hierarkike e sëmundjeve kanceroze
Të dhënat janë marr për n=150 pacientë, ku kemi katër faktorë për person. Kemi
kryer edhe një pyetësor për doktorët e spitalit për të kuptuar ndërtimin e matricës
krahasuese, të bazuar në shanset e këtyre faktorëve kryesor. [1]
Tabela 4.6 Krahasimet dy e nga dy të faktorëve
1 2 4 5
1/ 2 1 2 6( )
1/ 4 1/ 2 1 4
1/ 5 1/ 6 1/ 4 1
A faktoret
Llogaritim vlerën max për këtë matricë:
.
41 1 2 4 5 2.5 4
2
11 2 6 1.56
2
43
1 11 4 0.84
4 2 4
4
1 11 4 0.3
5 6
1,4
5.2i
i
Vektori i normalizuar është:
Faktorët e riskut Duhani Alkoli Obeziteti Histori familjare
Duhani 1 2 4 5
Alkoli ½ 1 2 6
Obeziteti ¼ 172 1 4
Histori familjare 1/5 1/6 ¼ 1
Shuma 1.95 3.66 7.25 16
98
2.5 1.56 0.84 0.3
, , , 0.48,0.3,0.16,0.065.2 5.2 5.2 5.2
max
1,4
0.48 1.95 0.3 3.6 0.16 7.25 0.06 16 4.1i i
i
s
.
Matrica është konsistente pasi max max4.1 4.270 . Ndërtojmë matricën e
krahasimit të llojeve të sëmundjes sipas faktorit duhan.
Tabela 4.7 Krahasimet e sëmundjeve me faktorin duhan.
Faktori Alkol Mushkëri Prostate Gjoksi Fyti
Mushkëri 1 3 7 9
Prostate 1/3 1 5 7
Gjoksi 1/7 1/5 1 3
Fyti 1/9 1/7 1/3 1
Shuma 1.58 4.34 13.33 20
Tabela 4.8 Krahasimet e sëmundjeve me faktorin alkol.
Faktori Obeziteti Mushkëri Prostate Gjoksi Fyti
Mushkëri 1 3 ¼ 2
Prostate 1/3 1 1/7 2
Gjoksi 4 7 1 6
Fyti ½ ½ 1/6 1
Shuma 5.83 11.5 1.4 11
Tabela 4.9 Krahasimet e sëmundjeve me faktorin obeziteti.
Faktori Histori familjare Mushkëri Prostate Gjoksi Fyti
Mushkëri 1 4 6 7
Prostate ¼ 1 3 4
Gjoksi 1/6 1/3 1 2
Fyti 1/7 ¼ ½ 1
Shuma 1.55 5.58 10.5 14
Tabela 4.10 Krahasimet e sëmundjeve me faktorin histori familjare.
Për secilën nga të dhënat në tabela kemi llogaritur vektorët e normalizuar dhe vlerat
përkatëse të max për secilën, duke i pasqyruar në tabelën e mëposhtme:
Faktori Duhan Mushkëri Prostate Gjoksi Fyti
Mushkëri 1 3 1/5 1/9
Prostate 1/3 1 3 1/3
Gjoksi 5 1/3 1 3
Fyti 9 3 1/3 1
Shuma 15.33 7.33 4.53 4.44
99
Tabelat max ( )vektor
Tab 26 3.96 =(0.11,0.16, 0.33, 0.38)
Tab 27 4.26 ( )prostate =(0.58,0.29,0.085, 0.04)
Tab 28 3.8 ( )gjoksi =(0.19, 0.096, 0.63, 0.078)
Tab 29 3.9 ( )fyti =(0.61, 0.22, 0.09, 0.06)
Tab 25 4.1 ( )faktoret =(0.48, 0.3, 0.16, 0.06 )
Tabela 4.11 Peshat lokale për çdo tabelë
0.11 0.58 0.19 0.61
0.16 0.29 0.096 0.22
0.33 0.085 0.63 0.09
0.38 0.04 0.078 0.06
mush pros gji fyt
0.48
0.3
0.16
0.06
faktor
=
0.286
0.185
0.280
0.207
rezultate
1
4
2
3
Renditja
Kjo renditje i jep një prioritet final kancerit të mushkërisë me vlerën 0.285, pastaj
kancerit të gjoksit me vlerën 0.280, kancerit të fytit me vlerën 0.207 dhe në fund
kancerit të prostatës me vlerë 0.185.
Kemi klasifikuar kështu llojet e kancerit, sipas faktorëve të përfshirë në nivelin 2,
duke përdorur metodën e krahasimeve dyshe të AHP. Nga të dhënat e marra në
spitalin QSUT Tiranë, tregohet se kanceri i mushkërisë është më shumë i përhapur tek
individët me riskun më të lartë ndërsa kanceri i prostatës është më pak i përhapuri tek
individët me riskun më të vogël. [26], [23]
100
PËRFUNDIME
Në këtë tezë doktorature u paraqitën probleme të optimizimit në rrjeta si dhe zbatime
të tyre, të aplikuara në softuerin WEKA. Një proçes i rëndësishëm i optimizimit ishte
klasifikimi, duke e paraqitur atë në detaje deri në grupime klasash. Ndër to kemi
kërkuar atribute ose vlera cilësore që “peshojnë” më shumë se vlerat e tjera, për të
klasifikuar këtë sasi të dhënash në formën e një peme vendimi. Klasifikimi i rrjetave
të vendimit u aplikua për një sasi të kufizuar të dhënash, duke ndihmuar kështu
vendim-marrësin për të përzgjedhur një alternativë të caktuar sa më optimale. Janë
marr kriteret cilësore dhe janë shprehur numerikisht, me anë të algoritmeve përkatëse,
pasi kriteret nuk kanë njësi matëse të përbashkëta.
Vështruam se problemet tona të vendimit gjetën zgjidhje të ndërthurura sasiore edhe
cilësore me anë të algoritmave përkatës siç ishin : ID3, CART, C4.5 etj. U paraqit një
krahasim midis ID3 dhe C4.5 në lidhje me ndërtimin e dy pemëve të vendimit për
secilin algoritëm dhe u pa se C4.5 e ndërtonte më shpejt dhe me më pak të dhëna të
njëjtën pemë vendimi me ID3. Në fakt në ndihmë kishim një program që e ka të
implementuar paketën e këtyre algoritmave i cili ishte WEKA Tushar 3.7.12 .
Programi paraqiti klasifikime me përqindje gabimi ose jo, ndërtoi vijën regresive të
lidhjeve ndërmjet cilësive për nga rëndësia. Gjethet e vendimit ishin pikat kyçe nga të
cilat zgjodhëm alternativën më të mirë, ku gjetja e tyre ishte sa e thjeshtë aq edhe e
vështirë. Në studimin e kryer në lidhje me klasifikimin e statusit ekonomik të
familjeve shqiptare u gjet si rrënjë e pemës atributi “madhësia e familjes” me
rëndësinë më të madhe, në nivelin e parë dhe të dytë e më pas atributet e tjera. Pragu i
parë ishte numri i familjareve më i madh ose më i vogël se 4.5; pra bëhej fjalë për
familje me më shumë ose më pak se 4 persona efektivisht. Rezultoi se familjet me më
pak se 4 persona ishin “jo të varfër” sipas kriterit. U ndërtua një pemë ekuivalente me
të binare që optimizonte klasat e vendimit të kësaj peme dhe u vu re se ajo kishte
numër më të vogël gjethesh vendimi. Një zbatim të gjerë gjeti kjo teori në
klasifikimin e faktorëve të sëmundjeve tek njerëzit. Tek studimi i faktorëve për të
qenë obezë u gjet gjithashtu se faktori kryesor ndër ata të studiuar ishte “duhanpirja”
e më pas vinin “aktiviteti fizik” dhe “ushqimi me fruta” në nivelin e dytë. Duke
përmirësuar një hap tek ID3, në fazën e kërkimit të elementëve gjatë fazës ndarëse,
optimizuam një pemë binare në lidhje me gjethet e vendimit ku pema e re doli me një
numër minimal gjethesh vendimi.
Një teori paralele e zhvilluar në fund të shekullit të kaluar ishte edhe Proçesi i
Analizës Hierarkike, nga Thomas Saaty. U paraqitën sërish probleme rrjetore me
vlera cilësore, por në këtë rast u gjet një aksiomatikë që pasqyron krieteret cilësore në
ato sasiore. Duke pasur vendim-marrësin në krye, ndërtuam një hierarki dhe
klasifikuam atributet për nga rëndësia e tyre. Principi i dekompozimit u aplikua nga
101
strukturimi i një problemi të thjeshtë, me elemente në nivele që janë të pavarur nga
ata të nivelit të pasuar, duke lëvizur nga fokusi tek niveli në majë. Përdorimi i kësaj
teorie gjeti vend në shumë problema praktike dhe të limituara në alternativa. U arrit
të renditim për nga rëndësia katër firma pjesëmarrëse në një tender, të cilat kishin
atribute te ndryshme cilësore dhe sasiore, ku u aplikua shkalla Saaty si bazë e
krahasimeve. Proçesi i ndërtimit të hierarkisë i ngjante një rrjete vendimi nga ku
duhej gjetur një pemë vendimi. Po ashtu u arrit të renditeshin edhe faktorët që
ndikonin në një semundje të caktuar, për nga rëndësia e tyre. Pamë se nga të dhënat
kanceri i mushkrive ishte ai më i rëndësishmi me shpërhapje më të madhe ndërsa
kanceri i prostatës ishte më pak i shpërhapuri.
102
LITERATURA
[1] Abdullah L., Taib I., Salleh R. (2009) : Public perceptions of cancer risk using
Analytic Hierarchy Process , Journal of applied sciences, volume 12, nr 9, 2319-2324.
[2] Ahuya R.K., Magnanti T.L. (1993) : Network flows theory, algorithms and
applications.
[3] Al-Alawi MA.(1991) : A computerized model for public projects in Bahrain.
Master thesis, King Fahd University of Petroleum and Minerals, KFUPM, Dhahran,
30-45.
[4] Al-Subhi Al-Harbi K. (2001) : Application of the AHP in project management,
International Journal of Project Management, 19, 19-27.
[5] Alexander, E. R (1970) : "The limits of uncertainty: A note", Theory and Decision
6:363-370.
[6] Arora S. and Barak B. (2009): Computational Modern Approach, Cambridge
University Press, 13, 60-113.
[7] Ankur Sh., Vijai Ch. (2012): Comparison betwën ID3 and C4.5 in contrast to
IDS Surbhi Hardikar, VSRD-IJCSIT, Vol 2, 659-667.
[8] Bellacicco A, Labella A (1979): Le strutture matematiche dei dati, Feltrineli
Edittore Italiano , 124-200.
[9] Belton V. (1990) : Multiple Criteria Decision Analysis- practically the only way
to choose. Operational research tutorial papers , 53-102.
[10] Belton V., Gear T. (1985) : The legitimacy of rank reversal- a comment. Omega
13. 143-144.
[11] Chapman C.B, Cooper D.F. (1983) : Risk Analysis, Testing Some Prejudices.
European Journal of Operational Research 14, 238-247.
[12] Cook S.A. (1972) : A hierarchy for nondeterministic time complexity. ACM
symposium on the theory of computing , 187-192.
[13] Dyer JS. (1990) : Remarks on the analytical hierarchy process, 249-258
[14] Dyer J.S., Wendel R.E (1985) : A critique of the analytical hierarchy process,
working paper, Department of Management , The University of Texas , 84-85.
[15] Dilworth J.B. (2000): Providing value in Goods and Services, Operations
Management, 14, 201-210.
103
[16] Elsworth A. (2014) : Expert Choise Software Manual , Usa.
[17] Freeling, A. (1984) : "A philosophical basis for decision aiding", Theory and
Decision 16:179-206.
[18] Harker PT., Vargas LG. (1987) : The theory of ratio scale estimation: Saaty’s
analytic hierarchy process. Mangement Science, 33, 1383-1403.
[19] Hastad J. (2009): Complexity theory, Royal Institute of Technology, 100-120
[20] Irvin R.A., Stansbury J. (2004) : Citizen participation in decision making: is it
worth the effort? Public administration review, 64, 55-65.
[21] Johnson, E. J., Payne, J. W. (1985). Effort and accuracy in choice. Management
Science, 31(4), 395-414.
[22] Kedhi V. (2000): Grafet dhe rrjedhat në rrjeta, 255-341
[23] Kosova,R.,Xhafaj, E.,Qendraj,D.,“A probability approach to Hubbert method of
oil production and reserves estimation. Applications in some albanians oilfields.
International Conference on Statistic Probability and Numerical Analysis, SPNA
2015.
[24] McCaffrey J. (2005). "Test Run: The Analytic Hierarchy Process". MSDN
Magazine.
[25] Moore M.J. (1985) : Selecting a contractor for Fast truck projects: Part I,
principles of contractor evaluation, 39, 74-76
[26] Metkalfe K.A, Narod S.A (2002): Breast cancer risk perception among woman
who have undergone prophylactic bilateral mastectomy, 94, 1564-1569.
[27] Perez J. (1995) : Some comments on Saaty’s AHP, Management Science, 41,
1091-1095
[28] Peterson, C. R (1965) : "Internal consistency of subjective probabilities", Journal
of Experimental Psychology 70:526-533.
[29] Quinlan J.R.(1986) : Induction of decision trës, Machine Learning, 4, 81-106.
[30] Quinlan J.R. (2009) : C4.5 programms for machine learning. Online google.
[31] Qendraj D., Xhafaj E. (2015) : Evaluating risk factors of being obeseby using
ID3 algorithm in Weka sofware, European Scientific Journal, Vol 11, No 24, 261-
267.
104
[32] Qendraj D, Muca M. (2015) : The analytic hierarchic process: A model to
evaluate the risk of getting cancer, Proceedings UBT Annual International
Conference on Business, Technology and Innovation, 4, 36-41.
[33] Qendraj, D., Xhafaj, E.,Mukli,L. “Klasifikimi i statusit ekonomik me anё tё
pemёve vendim-marrёse, njё rast studimi i familjeve shqiptare”, Buletini i Shkencave
tё Natyrёs, nr 20, 2015 ISSN 2305 882X, FSHN, UT.
[34] Qendraj (Halidini), D., Mitre, TH., Xhafaj, E. “Optimizimi nё rrjetat vendim-
marrёse me anё tё Proçesit tё Analizёs Hierarkike tё shkallёs Saaty” , Optime-
Buletini Shkencor i Albanian University, Nr 6, 2015, ISSN 2220-461X
[35] Qendraj (Halidini )D.,Halidini, E. “A new way for finding the optimal decision
tree by using a modified iteration of ID3 algorithm”, ICRAE (International
Conference on: “Research and Education Challenges Towards the Future) 23-24
november 2015 (me proceeding, proçes botimi).
[36] Qendraj (Halidini )D., Mitre, Th.,Halidini,E. “An application of decision tree in
technology”, ISTI ( Information Systems and Technology Innovations Inducting
Modern Business Solutions), 5-6 june, 2015 ( Proceeding online)
[37] Salleh R., Taib I., Abdullah L. (2012): Comparison of C5.0 and cart,
International Journal of enginnniering research and Technology IJERT, Vol 1, Issue
4, ISSN 2278-0181
[38] Saaty TH. (1980): The analytic hierarchy process, New York: McGraw Hill
[39] Saaty TH. (1985): Decision making for liders, belmont california: Life Time
Leaning Publications.
[40] Saaty Th.;Peniwati K.(2008): Group Decision Making: Drawing out and
Reconciling Differences. Pittsburgh, Pennsylvania: RWS Publications. ISSN 978-1-
888603-08-8.
[41] Stewart J. Cohen, Dessai S. Lammel A., Lempert R.J (2010): Foundation of
decision making, Cambridge University Press, 195-229.
[42] Stewart N., Oaksford M. (2008): A decision-by-sampling account of decision
under risk. In: The Probabilistic Mind: Prospects for Bayesian Cognitive Science,
Oxford University Press, 261-276.
[43] Stana, A. (2016): E-Commerce, nr 11, 173-248.
[44] Shannon, C. E. (1948): A mathematical theory of communication, Bell System
Technical Journal 27: 379–423 and 623–656.
105
[45] Witten, I., Frank, E.(2000) : Practical Machine Learning Tools and Techniques
with Java Implementations, Weka machine learning algorithm,13, 262-310.
http://www.cs.waikato.ac.nz/ml/weka/
http://en.wikipedia.org/wiki/Weka_(machine_learning)