54102010330 weka

Post on 15-Aug-2015

41 views 4 download

Transcript of 54102010330 weka

นายธนาวั�ฒน� บุญเกลี้��ยง 54102010330 สาขาวั�ชาวั�ทยาการคอมพิ�วัเตอร� คณะวั�ทยาศาสตร�

มหาวั�ทยาลี้�ยศร�นคร�นทรวั�โรฒ

WEKA7-11

CP463 : ARTIFICIAL INTELLIGENT

ข"อม#ลี้ท�$น%ามาใช"

CLUSTER

CLUSTER• Instances : 41

• Attributes : 18

• Algorithm : Simple K Means

เม'$อท%าการแบุ)ง 2 กลี้)ม

เม'$อท%าการแบุ)ง 4 กลี้)ม

เม'$อท%าการแบุ)ง 8 กลี้)ม

เม'$อท%าการแบุ)ง 12 กลี้)ม

เม'$อท%าการแบุ)ง 16 กลี้)ม

เม'$อท%าการแบุ)ง 20 กลี้)ม

เม'$อท%าการแบุ)ง 24 กลี้)ม

หลี้�งจากแบุ)ง 2-24 กลี้)ม แลี้"วัท%าการหาค)า KNEE OF THE CURVE จะได้"

แบ่�ง 13 กลุ่��ม

0 5 10 15 20 25 300

10

20

30

40

50

60

70

80

90

sqError

Knee curve

RESULT Clustered Instances0 6 (15%)1 3 (7%)2 6 (15%)3 4 (10%)4 3 (7%)5 5 (12%)6 1 (2%)7 1 (2%)8 3 (7%)9 2 (5%)

10 2 (5%)11 1 (2%)12 4 (10%)

สรุ�ป CLUSTER• Knee of Curve ท�$ม�ค)าเหมาะสมมากท�$สด้ค'อ 13 กลี้)ม

CLASSIFY

CLASSIFY• ต"องการท%านายวั)าลี้#กค"าท�$มาซื้'�อส��นค"าเลี้)นก�ฬาหร'อไม)

DATA TRAIN• Instances : 41

• Attributes : 22

• Class : sport

• Algorithm : Multilayer Perceptron

• Test Option Cross Validation Folds = 10

DATA DEPLOY• Instances : 10

• Attributes : 22

การเตร�ยมไฟลี้� น%าไฟลี้�ข"อม#ลี้มา 2 ไฟลี้� ได้"แก)

1. ไฟลี้� customers ม�ท��งหมด้ 41 records

2. ไฟลี้� deploy โด้ยเลี้'อก records จาก customers มา 10 records

ไฟลี้�ท�$ใช"เป็2นไฟลี้� CSV 2 ไฟลี้� ค'อ CUSTOMER.CSV แลี้ะ DEPLOY.CSV โด้ยไฟลี้� DEPLOY ให"ต�ด้ ข"อม#ลี้ของคอลี้�มน�ท�$ต"องการท%านายออก แลี้"วัเพิ�$ม ? เข"าไป็แทน

ไฟลี้�ท�$ใช"ในการทด้สอบุได้"แก) CUSTOMERS.ARFF แลี้ะ DEPLOY.ARFF จากการแป็ลี้งจากไฟลี้� CSV โด้ยใช" ZEROR ผ่)าน TEST OPTION : USE TRAINING SET แลี้"วัเป็4ด้ VISUALIZE CLASSIFIER ERRORS จากน��นท%าการ SAVE เป็2น (.arff)

ท%าการแก"ไขไฟลี้� ARFF โด้ยใช" NOTEPAD++1. ลี้บุ ATTRIBUTE ท�$ถู#กเพิ�$มเข"ามา

2. น%าข"อม#ลี้จากไฟลี้� CSV มาใส) ARFF โด้นลี้บุข"อม#ลี้ออกก)อน

3.ค�ด้ลี้อก ATTRIBUTE จาก CUSTOMER.ARFF ไป็ย�ง DEPLOY.ARFF

4. น%าข"อม#ลี้จาก DEPLOY.csv ไป็ท�$ไฟลี้� DEPLOY.arff

5.ท%าการสร"างMODEL โด้ยเป็4ด้ CUSTOMER.ARFF ส)วันของ CLASSIFY>CHOOSE>FUNCTIONS> MULTILAYER PERCEPTRON เลี้'อก CROSS-VALIDATION FOLDS 10 กด้ START แลี้"วัคลี้�กขวัาเพิ'$อ SAVE MODEL

6. เป็4ด้ไฟลี้� CUSTOMER.ARFF ท%าการ LOAD MODEL จากน��นเลี้'อก MODEL ท�$ได้" SAVE ไวั"ก)อนหน"าน��

7. เลี้'อก MULTILAYER PERCEPTRON แลี้"วัเลี้'อก SUPPLIED TEST SET จากน��นเลี้'อกไฟลี้� DEPLOY.ARFF รวัมถู6ง CLASS ท�$ต"องการท%านาย

8. จากน��นคลี้�กขวัาเลี้'อก RE-EVALUATE MODEL ON CURRENT TEST SET แลี้"วั SAVE เป็2นไฟลี้� ARFF ในท�$น��ต"องช'$อวั)า RESULT.ARFF

9. เป็4ด้ไฟลี้�ท�$ได้"โด้ยเป็4ด้จากหน"าแรกของ WEKA ไป็ท�$ Tools> ArffViewer>เลี้'อกเป็4ด้ไฟลี้�ผ่ลี้ลี้�พิธ�จากข"อ 8 ส�งเกตท�$คอลี้�มเก'อบุสด้ท"าย จะพิบุผ่ลี้การท%านาย

ผ่ลี้ลี้�พิธ�ท�$ได้" ม�ควัามแม)นย%า 100% แต)ก7ไม)แน)นอนเน'$องจากข"อม#ลี้ม�ป็ร�มาณน"อย

ASSOCIATE APRIORI

การเตร�ยมไฟลี้�• จ�ด้ให"แถูวัแรกเป็2นรายการส�นค"าท��งหมด้• ท%าการแป็ลี้งเป็2น .arff

เป็4ด้ไฟลี้� เลี้'อก ASSOCIATE > APRIORI > NUM RULES = 10 จะผ่ลี้ลี้�พิธ�ท��ง 10 กฎ พิร"อมท��งค)าควัามเช'$อม�$น (CF)

ผ่ลี้ลี้�พิธ�กฎท�$ได้"