Ch09_WEKA (1)

Post on 23-Oct-2014

324 views 10 download

Tags:

Transcript of Ch09_WEKA (1)

บทท�� 9ซอฟต์แวร์ว�ก้�า

ต์อนท�� 9.1 บทนำ��

ต์อนท�� 9.2 ชุ�ดข้�อมู�ลและก�รมูองเห็�นำข้องข้�อมู�ลห็ล�ยมู�ติ�เร��องท�� 9.2.1 ชุ�ดข้�อมู�ล (DataSets)

เร��องท�� 9.2.2 ก�รมูองเห็�นำข้องข้�อมู�ลห็ล�ยมู�ติ� (Visualization of Multidimensional Data)

9.1 บทน�าปั�จจ�บ!นำเทคโนำโลย�ท�งคอมูพิ�วเติอร&มู�คว�มูก��วห็นำ��อย'�ง

รวดเร�ว ก'อให็�เก�ดข้�อมู�ลเพิ��มูข้)*นำอย'�งมูห็�ศ�ล ไมู'ว'�จะเปั-นำข้�อมู�ลก�รซื้�*อสิ�นำค��ติ�มูห็��งสิรรพิสิ�นำค�� ข้�อมู�ลเอกสิ�รติ'�งๆ ห็ร�อข้�อมู�ลท�งก�รแพิทย& ข้�อมู�ลเห็ล'�นำ�*อ�จไมู'ก'อให็�เก�ดปัระโยชุนำ&ใดๆ ห็�กแติ'ละองค&กร เพิ�ยงแค'เก�บร!กษ�ข้�อมู�ลไว�โดยไมู'ได�นำ��มู�ท��ก�รว�เคร�ะห็& เทคนำ�คก�รท��เห็มู�องข้�อมู�ล ห็ร�อ data mining เปั-นำเทคนำ�คห็นำ)�งในำก�รชุ'วยว�เคร�ะห็&ข้�อมู�ล ซื้)�งผลล!พิธ์&ท��ได�จ�กก�รว�เคร�ะห็&ข้�อมู�ลด�วยเทคนำ�คท�ง data mining ค�อ คว�มูร� �และคว�มูเข้��ใจท��เก��ยวข้�องก!บข้�อมู�ล สิ�มู�รถนำ��ไปัเปั-นำแนำวท�งในำก�รว�งแผนำและปัฏิ�บ!ติ�ได� ในำชุ�ว�ติปัระจ��ว!นำข้องเร�มู�ติ!วอย'�งซื้)�งเปั-นำผลล!พิธ์&จ�กก�รว�เคร�ะห็&ข้�อมู�ลด�วยเทคนำ�ค data mining เชุ'นำ ก�รได�ร!บโปัรโมูชุ!�นำร�ยก�รสิ�นำค��ท��ติรงก!บคว�มูติ�องก�รข้องล�กค�� เปั-นำติ�นำท!*งนำ�*จ)งมู�ซื้อฟติ&แวร& weka ซื้)�งจะชุ'วยในำก�รว�เคร�ะห็&ข้�อมู�ลเห็ล'�นำ�*ให็�ง'�ยย��งข้)*นำ

Weka ย' อ มู � จ � ก The Waikato Environment for

Knowledge Analysis โดย Waikato เปั-นำชุ��อข้องมูห็�ว�ทย�ล!ยท��มู�ชุ��อเสิ�ยงแห็'งห็นำ)�งข้องปัระเทศนำ�วซื้�แลนำด& ซื้)�งเปั-นำสิถ�บ!นำท��พิ!ฒนำ�ซื้อฟติ&แวร& weka ข้)*นำมู� ซื้อฟติ&แวร& weka เปั-นำโปัรแกรมูท��ถ�กพิ!ฒนำ�ข้)*นำมู�จ�กภ�ษ� Java ปัระกอบไปัด�วย ชุ�ดข้องเคร��องมู�อ และ

ก�รท��เห็มู�องข้�อมู�ล - 1 - ซื้อฟติ&แวร&ว�ก��

อ!ลกอร�ท)�มูสิ��ห็ร!บก�รว�เคร�ะห็&ข้�อมู�ลและก�รสิร��งแบบจ��ลองเพิ��อใชุ�ในำก�รท��นำ�ย(predictive modeling) โดยโปัรแกรมูจะมู�ก�รติ�ดติ'อก!บผ��ใชุ�โดยใชุ� graphical user interfaces เพิ��อให็�ง'�ยติ'อก�รเข้��ถ)งฟ�งก&ชุ!นำก�รท��ง�นำติ'�งๆ ซื้อฟติ&แวร& weka จะสินำ!บสินำ�นำง�นำท�งด��นำเทคนำ�คก�รท��เห็มู�องข้�อมู�ล(data mining) เปั-นำสิ'วนำใ ห็ ญ่' ซื้)� ง ไ ด� แ ก' ก � ร ท�� preprpcessing, clustering,

classification, regression, visualization แ ล ะ feature

selection ซื้)�งเทคนำ�คท!*งห็มูดข้องซื้อฟติ&แวร& weka จะอย�'บนำพิ�*นำฐ�นำข้องก�รติ!*งสิมูมูติ�ฐ�นำข้�อมู�ลท��สิ�มู�รถเปั-นำไปัได�

โปัรแกรมูห็ล!กข้องซื้อฟติ&แวร& weka จะปัระกอบไปัด�วย 1. Simple CLI(Command Line Interface) เ ปั- นำ

โปัรแกรมูร!บค��สิ!�งก�รท��ง�นำผ'�นำก�รพิ�มูพิ&

2. Explorer เปั-นำโปัรแกรมูท��ออกแบบในำล!กษณะ GUI

3. Experimenter เปั-นำโปัรแกรมูท��ออกแบบก�รทดลองและก�รทดสิอบผล

4. KnowledgeFlow เปั-นำโปัรแกรมูออกแบบผ!งก�รไห็ลข้องคว�มูร� �

5. ArffViewer เปั-นำโปัรแกรมูท��ใชุ�สิ��ห็ร!บแก�ไข้แฟ<มูปัระเภท Arff

6. Log เปั-นำโปัรแกรมูท��ใชุ�อ'�นำข้�อคว�มูบ!นำท)กเก�บระห็ว'�งก�รท��ง�นำ

สิ��ห็ร!บสิ��งสิ��ค!ญ่อ�กปัระก�รห็นำ)�งท��เร�ควรท��คว�มูเข้��ใจก'อนำจ!เร��มูใชุ�ซื้อฟติ&แวร& ค�อ ก�รท��คว�มูเข้��ใจในำเร��องข้องข้�อมู�ลท��จะนำ��มู�ทดสิอบ ซื้)�งจะได�อธ์�บ�ยในำบทติ'อไปั

9.2 ชุ�ดข้�อมู�ลและก�รมูองเห็�นำข้องข้�อมู�ลห็ล�ยมู�ติ�

ก�รท��เห็มู�องข้�อมู�ล - 2 - ซื้อฟติ&แวร&ว�ก��

9.2.1 ชุ�ดข้�อมู�ล(DataSets)

บทน�าเปั-นำเวล�ห็ล�ยปั=แล�วท��นำ!กว�จ!ยก�รท��เห็มู�องข้�อมู�ลมู�ก�รเก�บชุ�ด

ข้�อมู�ลจ�กแห็ล'งติ'�งๆเพิ��อว!ติถ�ปัระสิงค&ในำก�รว�จ!ย และเปั-นำเวล�ห็ล�ยปั=ท��ชุ�ดข้�อมู�ลเห็ล'�นำ�*กล�ยเปั-นำชุ�ดข้�อมู�ลมู�ติรฐ�นำสิ��ห็ร!บก�รเปัร�ยบเท�ยบและมู�ก�รจ!ดมู�ติรฐ�นำให็�แก'ก�รเร�ยนำร� �ข้อง algorithm

ท��แติกติ'�งก!นำข้องเคร��องท��แติกติ'�งก!นำ ชุ�ดข้�อมู�ลท��แติกติ'�งก!นำมู�แนำวโนำ�มูท��จะสิ!มูผ!สิก!บปั�ญ่ห็�และคว�มูท��ท�ยให็มู'ๆ ซื้)�งเปั-นำท��นำ'�สินำใจและเปั-นำก�รแนำะนำ��ปั�ญ่ห็�ท��มู�คว�มูห็ล�กห็ล�ย ในำก�รสิ!งเกติเมู��อพิ�จ�รณ�ก�รเร�ยนำร� �ว�ธ์�ก�ร ซื้)�งในำบทนำ�*ได�มู�ก�รแสิดงติ!วอย'�งข้องชุ�ดข้�อมู�ล ซื้)�งพิบว'�เปั-นำปัระโยชุนำ&สิ��ห็ร!บก�รเร�ยนำร� �และเปั-นำติ!วอย'�งท��ง'�ยติ'อคว�มูเข้��เก��ยวก!บเร��องข้องชุ�ดข้�อมู�ล(datasets) โดยติ!วอย'�งท��จะนำ��เสินำอในำบทนำ�*มู�ด!งนำ�*

1. Contact lenses2. Iris plants database3. Breast cancer database4. Wage data5. Credit database6. Housing database7. 1985 auto imports database8. Badge problem

ต์�วอย่�างข้องชุ�ดข้�อมู�ล (Datasets) 1. CONTACT LENSES ชุ��อ : ฐ�นำข้�อมู�ลสิ��ห็ร!บก�รเล�อกใชุ�คอนำแทคเลนำสิ&ท��เห็มู�ะสิมู ท��มูา : J. Cendrowska,PRISM : An algorithm

for inducing modular rules,International Journal of Man-Machine Studies, 27, 349-370, 1987.

จำ�านวนข้องต์�วอย่�าง : 24

ก�รท��เห็มู�องข้�อมู�ล - 3 - ซื้อฟติ&แวร&ว�ก��

จำ�านวนข้อง attribute : 4 (เปั-นำข้�อมู�ล nominal ค�อ เปั-นำข้�อมู�ลท��บอกจ��นำวนำ)

ข้�อมู�ลข้อง attribute :

ติ!วแปัรเปั<�ห็มู�ย ค�อ คอนำแทคเลนำสิ& (มู� 3 class)

ด!งนำ�* 1. ผ��ปั>วยเห็มู�ะท��จะใสิ'คอนำแทคเลนำสิ&ชุนำ�ดแข้�ง (hard contact lenses)

2. ผ��ปั>วยเห็มู�ะท��จะใสิ'คอนำแทคเลนำสิ&แบบนำ��มู (soft contact lenses) 3. ผ��ปั>วยท��ย!งไมู'ติ�องใสิ'คอนำแทคเลนำสิ&

ต์�วแปร์พย่าก้ร์ณ์ : 1. อ�ย�ข้องผ��ปั>วย (Age of patient)

(ก) ห็นำ�'มูสิ�ว (young)

(ข้) ก'อนำภ�วะสิ�ยติ�ย�ว (pre-presbyopic)

(ค) สิ�ยติ�ย�ว (presbyopic)

2. ระด!บสิ�ยติ� (Spectacle prescription)

(ก) สิ�ยติ�สิ!*นำ (myope)

(ข้) สิ�ยติ�ย�ว (hypermetrope)

3. สิ�ยติ�เอ�ยง (Astigmatic)

(ก) ใชุ'(no)

(ข้) ไมู'ใชุ'(yes)

4. อ!ติร�ก�รผล�ตินำ�*�ติ� (Tear production rate)

(ก) ลดลง (reduced)

(ข้) ปักติ� (normal)

จำ�า นวนข้�อมู�ลท�� ข้าดหาย่ไป(Number of Missing Attribute Values): 0

ก้าร์ก้ร์ะจำาย่ต์� วข้อง Class (Class Distribution):

ก�รท��เห็มู�องข้�อมู�ล - 4 - ซื้อฟติ&แวร&ว�ก��

1. ค อ นำ แ ท ค เ ล นำ สิ& ชุ นำ� ด แ ข้� ง (Hard contact lenses): 4 2. คอนำแทคเลนำสิ&แบบนำ��มู (Soft contact lenses): 5 3. ย! ง ไ มู' ติ� อ ง ใ สิ' ค อ นำ แ ท ค เ ล นำ สิ& (No contact lenses): 15

ข้�อสั�งเก้ต์ : ชุ�ดข้�อมู�ล (Datasets) อ�จถ�กเก�บเปั-นำไฟล& excel

ห็ร�อบ!นำท)กในำร�ปัแบบ .ARFF โดยไฟล& ARFF ย'อมู�จ�ก (Attribute Relation File Format) ในำไฟล& .ARFF

เคร��องห็มู�ย % ห็มู�ยถ)ง comment และ เร��มูติ�นำไฟล& .ARFF

ด�วยค��ว'� @relation บรรท!ดติ'อไปัจะติ�มูด�วย @attribute เพิ��อบอกว'�มู� attribute อะไรบ��ง โดย attribute ท��เปั-นำปัระเภท Nominal จะถ�กเก�บค'�ไว�ภ�ยในำเคร��องห็มู�ย { } สิ'วนำชุ�ดข้�อมู�ลท��จะนำ��มู�ว�เคร�ะห็&ใชุ� @data ด!งนำ�*

เพิ��อบอกว'�เปั-นำไฟล&ท��ใชุ�ในำก�รว�เคร�ะห็&เก��ยวก!บเร��องคอนำแทคเลนำสิ&

เพิ��อบอกว'�มู� attribute อะไรบ��ง

ก�รเข้�ยนำ comment

young,myope,no,reduced,noneyoung,myope,no,normal,soft

ก�รท��เห็มู�องข้�อมู�ล - 5 - ซื้อฟติ&แวร&ว�ก��

young,myope,no,reduced,noneyoung,myope,yes,normal,hardyoung,hypermetrope,no,reduced,noneyoung,hypermetrope,no,normal,soft young,hypermetrope,yes,reduced,none ติ!วข้�อมู�ลyoung,hypermetrope,yes,normal,hard pre-presbyopic,myope,no,reduced,nonepre-presbyopic,myope,no,normal,softpre-presbyopic,myope,yes,reduced,nonepre-presbyopic,myope,yes,normal,hardpre-presbyopic,hypermetrope,no,reduced,nonepre-presbyopic,hypermetrope,no,normal,softpre-presbyopic,hypermetrope,yes,reduced,nonepre-presbyopic,hypermetrope,yes,normal,nonepresbyopic,myope,no,reduced,nonepresbyopic,myope,no,normal,none presbyopic,myope,yes,reduced,nonepresbyopic,myope,yes,normal,hard ติ!วข้�อมู�ลpresbyopic,hypermetrope,no,reduced,nonepresbyopic,hypermetrope,no,normal,softpresbyopic,hypermetrope,yes,reduced,nonepresbyopic,hypermetrope,yes,normal,none

ก�รท��เห็มู�องข้�อมู�ล - 6 - ซื้อฟติ&แวร&ว�ก��

เมู��อนำ��ไฟล&นำ�*เข้��ไปัว�เคร�ะห็&ในำ Software Weka แล�ว จะได�

ติ�นำไมู�ติ!ดสิ�นำใจ ด!งนำ��ร�ปัท�� 9.1 ติ�นำไมู�ติ!ดสิ�นำใจสิ��ห็ร!บข้�อมู�ลคอนำแทคเลนำสิ&

จ�กติ�นำไมู�ติ!ดสิ�นำใจนำ�* อธ์�บ�ยได�ว'� - ถ��อ!ติร�ก�รผล�ตินำ�*�ติ�ลดลง ไมู'เห็มู�ะท��จะใสิ'คอนำแทคเลนำสิ&ถ)ง

12 record- ถ��อ!ติร�ก�รผล�ตินำ�*�ติ�เปั-นำปักติ� และสิ�ยติ�ไมู'เอ�ยง เห็มู�ะท��จะ

ใสิ'คอนำแทคเลนำสิ&แบบนำ�' มู (soft contact lenses) ถ)ง 6.0/1.0 record ห็ ล! ง จ � ก ผ' � นำ ก � ร ท�� pruning แ ล� ว ห็มู�ยคว�มูว'� ในำ 6 record ท��อ!ติร�ก�รผล�ตินำ�*�ติ�เปั-นำปักติ� และสิ�ยติ�ไมู'เอ�ยงนำ!*นำ มู�ผ��ปั>วยท��เห็มู�ะจะใสิ'คอนำแทคเลนำสิ&แบบนำ�'มู 6 record และถ�กปันำเปั?* อนำไปัด�วย ผ��ปั>วยท��ไมู'เห็มู�ะจะใสิ'คอนำแทคเลนำสิ&ไปัด�วย 1 record ด!งนำ�*

young,myope,no,normal,soft young,hypermetrope,no,normal,soft

pre-presbyopic,myope,no,normal,soft pre-presbyopic,hypermetrope,no,normal,soft presbyopic,myope,no,normal,none presbyopic,hypermetrope,no,normal,soft

ก�รท��เห็มู�องข้�อมู�ล - 7 - ซื้อฟติ&แวร&ว�ก��

- ถ��อ!ติร�ก�รผล�ตินำ�*�ติ�เปั-นำปักติ� สิ�ยติ�เอ�ยง และเปั-นำผ��ท��สิ�ยติ�สิ!*นำแล�วเห็มู�ะท��จะใสิ'คอนำแทคเลนำสิ&ชุนำ�ดแข้�ง (hard

contact lenses) ถ)ง 3 record

- ถ��อ!ติร�ก�รผล�ตินำ�*�ติ�เปั-นำปักติ� สิ�ยติ�เอ�ยง และเปั-นำผ��ท��สิ�ยติ�ย�วแล�วไมู'เห็มู�ะท��จะใสิ'คอนำแทคเลนำสิ&ถ)ง 3.0/1.0

record ห็ล!งจ�กผ'�นำก�รท�� pruning แล�ว ห็มู�ยคว�มูว'� ในำ 3 record ท��อ!ติร�ก�รผล�ตินำ�*�ติ�เปั-นำปักติ� สิ�ยติ�เอ�ยง แ ล ะ เ ปั- นำ ผ�� ท�� สิ � ย ติ � ย � ว นำ!* นำ มู� ผ�� ปั> ว ย ท�� ไ มู' เ ห็ มู � ะ จ ะ ใ สิ'คอนำแทคเลนำสิ& 3 record และถ�กปันำเปั?* อนำไปัด�วยผ��ปั>วยท��เ ห็ มู � ะ จ ะ ใ สิ'ค อ นำ แ ท ค เ ล นำ สิ& ชุ นำ� ด แ ข้� ง (hard contact

lenses)ไปัด�วย 1 record ด!งนำ�* presbyopic,hypermetrope,yes,normal,none pre-presbyopic,hypermetrope,yes,normal,none young,hypermetrope,yes,normal,hard

2. IRIS PLANTS DATABASE

ก�รท��เห็มู�องข้�อมู�ล - 8 - ซื้อฟติ&แวร&ว�ก��

ท��มูา : Creator R.A. Fisher, The use of multiple measurements in taxonomic problems Annual Eugenics,7,Part II,179-88, 1936, also in Contributions to Mathematical Statistics, John Wiley, NY, 1950.ปร์ะเด(นสั�าคั�ญ : นำ��อ�จจะเปั-นำฐ�นำข้�อมู�ลท��ร� �จ!กก!นำด�ท��สิ�ดท��จะพิบได�จ�กก�รจดจ��ร�ปัแบบบทปัระพิ!นำธ์&ข้อง Fisher’s ซื้)�งเปั-นำบทปัระพิ!นำธ์&ด!*งเด�มู และมู�ก�รอ��งถ)งบ'อยคร!*งในำว!นำนำ�* ชุ�ดข้�อมู�ลนำ�*มู� 3 คล�สิ โดยท��แติ'ละคล�สิจะอ��งถ)งชุนำ�ดพิ!นำธ์�&ข้องดอก Iris

Attribute สั�า ห ร์� บ ท�า น า ย่ (Predicated Attribute): Class of iris plant. จำ�านวนต์�วอย่�าง : 150 (คล�สิละ 50 ติ!วอย'�ง)

จำ�านวนข้อง attribute: 4 จ��นำวนำ มู� attribute ท��ใชุ�พิย�กรณ& และ Class Attribute Information : 1. Sepal length in cm (กล�บเล�*ยง)

2. Sepal width in cm (กล�บเล�*ยง)

3. Petal length in cm (กล�บดอก)

4. Petal width in cm (กล�บดอก)

5. Class(พิ!นำธ์�&ข้องดอก Iris): - Iris setosa - Iris versicolour - Iris virginica จำ�านวนข้�อมู�ลท��ข้าดหาย่ไป (Number of Missing Attribute Values): None Summary Statistics:

Min

Max

Mean SD

Class correla

tionSepal 4.3 7.9 5.8 0.8 0.7826

ก�รท��เห็มู�องข้�อมู�ล - 9 - ซื้อฟติ&แวร&ว�ก��

length 4 3Sepal width

2 4.4 3.05

0.43

-0.4194

Petal length

1 6.9 3.76

1.76

0.949 (hight!)

Petal width

0.1 2.5 1.2 0.76

0.9565 (hight!)

ต์�วข้�อมู�ลน�าเข้�า เพิ��อบอกว'�เปั-นำไฟล&ท��ใชุ�ว�เคร�ะห็&ชุนำ�ดข้องดอก IRIS

เ พิ�� อ บ อ ก ว' �มู� attribute

อะไรบ��ง โดย REAL จะบอกว'� attribute

นำ�* เ ปั- นำ ติ! ว เล ข้ชุ นำ� ดจ��นำวนำจร�ง

@data เพิ��อบอกว'�ติ!*งแติ'นำ�*ไปัเปั-นำชุ�ดข้�อมู�ลท��จะนำ��มู�ว�เคร�ะห็& ซื้)�งในำท��นำ�*เปั-นำเพิ�ยงบ�งสิ'วนำข้องข้�อมู�ลจร�งเท'�นำ!*นำ

5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa 5.4,3.9,1.7,0.4,Iris-setosa 4.6,3.4,1.4,0.3,Iris-setosa 5.0,3.4,1.5,0.2,Iris-setosa 4.4,2.9,1.4,0.2,Iris-setosa

ก�รท��เห็มู�องข้�อมู�ล - 10 - ซื้อฟติ&แวร&ว�ก��

4.9,3.1,1.5,0.1,Iris-setosa 7.0,3.2,4.7,1.4,Iris-versicolor 6.4,3.2,4.5,1.5,Iris-versicolor 6.9,3.1,4.9,1.5,Iris-versicolor 5.5,2.3,4.0,1.3,Iris-versicolor 6.5,2.8,4.6,1.5,Iris-versicolor 5.7,2.8,4.5,1.3,Iris-versicolor 6.3,3.3,4.7,1.6,Iris-versicolor 4.9,2.4,3.3,1.0,Iris-versicolor 6.6,2.9,4.6,1.3,Iris-versicolor 5.2,2.7,3.9,1.4,Iris-versicolor 6.3,3.3,6.0,2.5,Iris-virginica 5.8,2.7,5.1,1.9,Iris-virginica 7.1,3.0,5.9,2.1,Iris-virginica 6.3,2.9,5.6,1.8,Iris-virginica 6.5,3.0,5.8,2.2,Iris-virginica 7.6,3.0,6.6,2.1,Iris-virginica 4.9,2.5,4.5,1.7,Iris-virginica 7.3,2.9,6.3,1.8,Iris-virginica 6.7,2.5,5.8,1.8,Iris-virginica 7.2,3.6,6.1,2.5,Iris-virginica

เมู��อนำ��ไฟล&นำ�*เข้��ไปัว�เคร�ะห็&ในำ Software Weka แล�ว จะได�ติ�นำไมู�ติ!ดสิ�นำใจ ด!งนำ�*

ก�รท��เห็มู�องข้�อมู�ล - 11 - ซื้อฟติ&แวร&ว�ก��

ร�ปัท�� 9.2 ติ�นำไมู�ติ!ดสิ�นำใจสิ��ห็ร!บข้�อมู�ลคอนำแทคเลนำสิ&

จ�กติ�นำไมู�ติ!ดสิ�นำใจนำ�* อธ์�บ�ยได�ว'� - ถ� �คว�มูกว��งข้องกล�บดอก นำ�อยกว'�ห็ร�อ เท' �ก!บ 0.6

เซื้นำติ�เมูติร แล�วจะเปั-นำดอก Iris

พิ!นำธ์�& setosa ถ)ง 50 record

- ถ��คว�มูกว��งข้องกล�บดอกมู�กกว'� 0.6 เซื้นำติ�เมูติร แล�วติ�องด�อ�กว'�คว�มูกว��งข้องกล�บดอกนำ!*นำมู�กกว'� 1.7 เซื้นำติ�เมูติรห็ร�อไมู'ถ��มู�กกว'�แล�วจะเปั-นำดอก Iris พิ!นำธ์�& virginica ถ)ง 46 record แติ'ถ�กปันำเปั?* อนำไปัด�วยพิ!นำธ์�&อ��นำ 1 record

- ถ��คว�มูกว��งข้องกล�บดอกมู�กกว'� 0.6 เซื้นำติ�เมูติร แติ'ไมู'เก�นำ 1.7 เซื้นำติ� เมูติรและคว�มูย�วข้องกล�บดอกไมู' เก�นำ 4.9

เซื้นำติ�เมูติรแล�วจะเปั-นำดอก Iris พิ!นำธ์�& versicolor ถ)ง 48

record แติ'ถ�กปันำเปั?* อนำไปัด�วยพิ!นำธ์�&อ��นำ 1 record

- ถ��คว�มูกว��งข้องกล�บดอกมู�กกว'� 0.6 เซื้นำติ�เมูติร แติ'ไมู'เก�นำ 1.7 เซื้นำติ�เมูติร และคว�มูย�วข้องกล�บดอกมู�กกว'� 4.9

เซื้นำติ�เมูติร แล�วติ�องด�อ�กว'�คว�มูกว��งข้องกล�บดอกนำ!*นำนำ�อยกว'�ห็ร�อเท'�ก!บ 1.5 เซื้นำติ�เมูติรห็ร�อไมู' ถ��นำ�อยกว'� 0.5

เซื้นำติ�เมูติรจร�งแสิดงว'�เปั-นำดอก Iris พิ!นำธ์�& virginica ถ)ง 3 record

- ถ��คว�มูกว��งข้องกล�บดอกมู�กกว'� 0.6 เซื้นำติ�เมูติร แติ'ไมู'เก�นำ 1.7 เซื้นำติ�เมูติร และคว�มูย�วข้องกล�บดอกมู�กกว'� 4.9

เซื้นำติ�เมูติร แล�วติ�องด�อ�กว'�คว�มูกว��งข้องกล�บดอกนำ!*นำมู�กกว'� 1.5 เซื้นำติ�เมูติรห็ร�อไมู' ถ��มู�กกว'� 1.5 เซื้นำติ�เมูติรจร�งแสิดงว'�เปั-นำดอก Iris พิ!นำธ์�& versicolor ถ)ง 3 record

แติ'ถ�กปันำเปั?* อนำไปัด�วยพิ!นำธ์�&อ��นำ 1 record

ก�รท��เห็มู�องข้�อมู�ล - 12 - ซื้อฟติ&แวร&ว�ก��

ซื้)�งในำก�รว�เคร�ะห็&ออกมู� พิบว'�ในำติ�นำไมู�ติ!ดสิ�นำใจ ( dicition tree) นำ�*ไมู'มู�ก�รนำ��สิ'วนำข้องกล�บเล�*ยง (Sepal)

มู�พิ�จ�รณ� นำ!�นำห็มู�ยคว�มูว'� กล�บเล�*ยง (Sepal) ไมู'สิ�มู�รถนำ��มู�จ��แนำกได�ว'�เปั-นำดอก Iris สิ�ยพิ!นำธ์�&ใด

3. BREAST CANCER DATABASEBreast Cancer Database เปั-นำฐ�นำข้�อมู�ลท��ใชุ�ในำ

ก�รว�เคร�ะห็&ถ)งก�รแพิร' กระจ�ยข้องเซื้ลล&มูะเร�งว'� อย�'ในำระยะเร��มูติ�นำค�อย!งไมู'ถ)งข้!*นำเลวร��ย และระยะท��จ!ดว'�ร��ยแรงก�อนำเนำ�*อร��ยอ�จมู�ก�รแพิร'กระจ�ยไปันำ!�นำเองTitle : Wisconsin Breast Cancer Databaseท��มูา :

- Dr. William H. Wolberg(physician) University of Wisconsin Hospitals Madison, Wisconsin USA- Donor: Olvi

Mangasarian(mangasarian@cs.wisc.edu) Received by David W. Aha

(aha@cs.jhu.edu)- Date: 15 July 1992

ก�รท��เห็มู�องข้�อมู�ล - 13 - ซื้อฟติ&แวร&ว�ก��

จำ�านวนข้องต์�วอย่�าง : 699 ติ!วอย'�ง (จ�ก 15 กรกฏิ�คมู ค.ศ. 1992)

จำ�านวนข้อง attribute : มู�กกว'� 10 attributeAttribute Information :

S. No

Attribute Domain

1 Sample code number

Id_number

2 Clump thickness 1_103 Uniformity of

cell size 1_10

4 Uniformity of cell shape

1_10

5 Marginal adhesion

1_10

6 Single epithelial cell size

1_10

7 Bare nuclei 1_108 Bland chromatin 1_109 Normal nucleoli 1_1010 Mitoses 1_1011 Class (2 สิ��ห็ร!บข้!*นำท��ไมู'ร�นำแรง (benign),4

สิ��ห็ร!บข้!*นำท��ร�นำแรง (malignant)) จำ�า นวนข้�อมู�ลท�� ข้าดหาย่ไป (Number of Missing Attribute Values) : 16

ในำท��นำ�*มู� 16 กรณ� ท�� 1 ถ)ง 6 กล�'มูนำ�*มู�ค'�ข้อง attribute ห็นำ)�งห็�ยไปั (เชุ'นำ ไมู'สิ�มู�รถใชุ�ง�นำได�) 9 ติอนำนำ�*จะใชุ�เคร��องห็มู�ย “ ?

” แทนำค'�ท��ห็�ยไปันำ!*นำ ก้าร์ก้ร์ะจำาย่ต์�วข้อง Class (Class Distribution):

Benign: 458 ค�ดเปั-นำ 65.5%

ก�รท��เห็มู�องข้�อมู�ล - 14 - ซื้อฟติ&แวร&ว�ก��

Malignant: 241 ค�ดเปั-นำ 34.5%

ข้�อมู�ลน�าเข้�า เพิ��อบอกว'�เปั-นำไฟล&ท��ใชุ�ว�เคร�ะห็&ก�รแพิร'กระจ�ยข้องมูะเร�ง

เพิ�� อบอกว'�มู� attribute

อ ะ ไ ร บ� � ง ท�� จ ะ นำ�� ไ ปั ว� เ ค ร � ะ ห็& ซื้)� ง ค' �ภ�ยในำ {} เปั-นำชุนำ�ด Numeric

@data ติ!วข้�อมู�ลท��จะนำ��มู�ว�เคร�ะห็& ซื้)�งในำท��นำ�*เปั-นำเพิ�ยงบ�งสิ'วนำข้องข้�อมู�ลจร�งเท'�นำ!*นำ

1 0 0 0 0 0 1 0 0 21 2 2 2 2 2 1 1 0 20 0 0 0 0 1 1 0 0 22 2 2 0 1 2 1 2 0 20 0 0 0 0 2 1 0 0 20 0 1 0 0 0 1 0 0 20 0 0 0 0 0 0 0 2 21 1 0 0 0 0 0 0 0 20 0 0 0 0 0 1 0 0 22 2 2 1 2 2 1 2 2 42 2 2 0 0 1 0 0 2 41 1 1 2 0 2 1 2 0 42 1 2 1 1 2 2 2 2 41 2 2 2 2 2 2 2 2 42 2 2 2 2 2 2 0 0 4

ก�รท��เห็มู�องข้�อมู�ล - 15 - ซื้อฟติ&แวร&ว�ก��

2 2 2 1 2 2 1 2 0 42 2 2 0 1 2 1 2 0 42 1 2 0 2 0 2 2 2 41 1 1 0 2 2 2 0 0 4

เมู��อนำ��ไฟล&นำ�*เข้��ไปัว�เคร�ะห็&ในำ Software Weka แล�ว จะได�ติ�นำไมู�ติ!ดสิ�นำใจ ด!งนำ�*

ร�ปัท�� 9.3 ติ�นำไมู�ติ!ดสิ�นำใจข้อง Breast Cancer Dataset

จ�กติ�นำไมู�ติ!ดสิ�นำใจนำ�* อธ์�บ�ยได�ว'� - ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 0 แสิดงว'�

อ�ก�รย!งไมู'เลวร��ยพิบถ)ง 373 record แติ'ปันำเปั?* อนำไปัด�วยอ�ก�รท��ร ��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปัมู� 4 record

ก�รท��เห็มู�องข้�อมู�ล - 16 - ซื้อฟติ&แวร&ว�ก��

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 2 แสิดงว'�ร��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปั พิบ 213 record แติ'ปันำเปั?* อนำไปัด�วยอ�ก�รท��ย!งไมู'เลวร��ยมู� 11 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 0 แสิดงว'�อ�ก�รย!งไมู'เลวร��ยพิบถ)ง 50 record แติ'ปันำเปั?* อนำไปัด�วยอ�ก�รท��ร ��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปัมู� 1 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 2 แสิดงว'� ร��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปัมู� 29 record แติ'ปันำเปั?* อนำไปัด�วยอ�ก�รท��ย!งไมู'เลวร��ยมู� 3 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 1 และ Clump_thickness อย�'ในำระด!บ 0 แสิดงว'� อ�ก�รย!งไมู'เลวร��ยพิบถ)ง 7 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 1 และ Clump_thickness อย�'ในำระด!บ 1 แล�ว Normal_nucleoli อย�'ในำระด!บ 0 แสิดงว'� อ�ก�รย!งไมู'เลวร��ยพิบถ)ง 2 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 1 และ Clump_thickness อย�'ในำระด!บ 1 แล�ว Normal_nucleoli อย�'ในำระด!บ 1 แสิดงว'� อ�ก�รย!งไมู'เลวร��ยพิบถ)ง 1 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 1 และ Clump_thickness อย�'ในำระด!บ 1 แล�ว Normal_nucleoli อย�'ในำระด!บ 2 แสิดงว'�ร��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปัมู� 3 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 1 และ Clump_thickness อย�'

ก�รท��เห็มู�องข้�อมู�ล - 17 - ซื้อฟติ&แวร&ว�ก��

ในำระด!บ 2 แล�ว Uniformity_of_cell_shape อย�'ในำระด!บ 0 แสิดงว'�ร��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปัซื้)�งจ�กข้�อมู�ลนำ�*ไมู'พิบ record ใด

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 1 และ Clump_thickness อย�'ในำระด!บ 2 แล�ว Uniformity_of_cell_shape อย�'ในำระด!บ 1 แสิดงว'�อ�ก�รย!งไมู'เลวร��ยพิบถ)ง 3 record แติ'ปันำเปั?* อนำไปัด�วยอ�ก�รท��ร ��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปัมู� 1 record

- ถ�� Uniformity_of_cell_size อย�'ในำระด!บ 1 และ Bare_nuclei อย�'ในำระด!บ 1 และ Clump_thickness อย�'ในำระด!บ 2 แล�ว Uniformity_of_cell_shape อย�'ในำระด!บ 2 แสิดงว'�ร��ยแรงก�อนำเนำ�*อร��ยอ�จแพิร'กระจ�ยไปัพิบถ)ง 2 record4.WAKE DATA

ข้�อมู�ลน�าเข้�า@relation wages เพิ��อบอกว'�เปั-นำไฟล&ท��ใชุ�ในำก�รว�เคร�ะห็&เก��ยวก!บเร��องค'�จ��ง

@attribute educ real@attribute south real@attribute nonwh real@attribute hispanic real@attribute gender real@attribute married real@attribute marrfem real @attribute exper real@attribute expersq real@attribute union real@attribute Inwage real @attribute age real@attribute manuf real

ก�รท��เห็มู�องข้�อมู�ล - 18 - ซื้อฟติ&แวร&ว�ก��

@attribute constr real@attribute manag real@attribute sales real@attribute clerical real@attribute service real@attribute prof real@attribute cps85 {Year_1978,Year_1985}

@data

12,0,0,0,0,0,0,8,64,0,1.22,25,0,0,0,0,0,1,0,Year_197812,0,0,0,1,1,1,30,900,1,1.61,47,0,0,0,0,1,0,0,Year_1978 6,0,0,1,0,1,0,38,144,1,2.14,49,0,1,0,0,0,0,0,Year_197812,0,0,0,0,1,0,19,361,1,2.07,36,0,0,0,1,0,0,0,Year_197812,0,0,0,0,1,0,11,121,0,1.65,28,0,0,0,0,0,0,0,Year_19788,0,0,0,0,1,0,43,1849,0,1.71,56,0,0,0,0,0,0,0,Year_197811,0,0,0,0,0,0,2,4,0,1.1,18,1,0,0,0,0,0,0,Year_197815,0,0,0,1,0,0,9,81,0,1.83,29,0,0,1,0,0,0,0,Year_197816,0,0,0,1,0,0,17,289,0.36,38,0,0,0,0,0,0,1,Year_197815,0,0,0,0,1,0,23,529,1,2.15,43,0,0,0,0,1,0,0,Year_197815,0,0,0,0,1,0,39,1521,1,1.99,59,1,0,0,0,0,0,1,Year_197812,0,0,1,1,1,1,5,25,1,1.7,22,0,0,0,0,1,0,0,Year_197811,0,0,1,0,1,0,27,729,1,2.11,43,1,0,0,0,0,0,0,Year_1978 12,0,0,1,0,1,0,29,841,0,1.83,46,1,0,0,0,0,0,0,Year_1978

ก�รท��เห็มู�องข้�อมู�ล - 19 - ซื้อฟติ&แวร&ว�ก��

12,0,0,1,0,0,0,7,49,0,1.31,24,1,0,0,0,0,0,0,Year_197812,0,0,0,1,0,0,42,1764,1,2.23,59,0,0,0,0,0,1,0,Year_197818,0,0,0,0,1,0,35,1225,1,2.53,58,0,0,0,0,0,0,1,Year_197818,0,0,0,1,1,1,31,961,1,2.4,54,0,0,0,0,0,0,1,Year_19786,0,0,1,0,1,0,24,576,0,1.25,35,1,0,0,0,0,0,0,Year_197814,0,1,0,0,1,0,14,196,1,2.08,33,0,0,0,0,0,0,0,Year_197812,0,0,0,1,0,0,40,1600,1,2.01,57,0,0,0,0,0,0,Year_1978

เมู��อนำ��ไฟล&นำ�*เข้��ไปัว�เคร�ะห็&ในำ Software Weka แล�ว จะได�

ติ�นำไมู�ติ!ดสิ�นำใจ ด!งนำ�*

ร�ปัท�� 9.4 ติ�นำไมู�ติ!ดสิ�นำใจข้องชุ�ดข้�อมู�ล Weka

จ�กติ�นำไมู�ติ!ดสิ�นำใจนำ�* อธ์�บ�ยได�ว'�

ก�รท��เห็มู�องข้�อมู�ล - 20 - ซื้อฟติ&แวร&ว�ก��

- ถ�� Inwage มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 2.15 แล�ว Sales มู�ค'�มู�กกว'� 0 จะสิร�ปัได�ว'�เปั-นำ Year_1985 จ��นำวนำ 6 record

แติ'ถ�กปันำเปั?* อนำด�วย Year_1978 จ��นำวนำ 2 record

- ถ�� Inwage มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 2.15 แล�ว Sales มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 0 แล�ว Nonwh นำ�อยกว'�ห็ร�อเท'�ก!บ 0

จะสิร�ปัได�ว'�เปั-นำ Year_1978 จ��นำวนำ 22 record แติ'ถ�กปันำเปั?* อนำด�วย Year_1985 จ��นำวนำ 3 record

- ถ�� Inwage มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 2.15 แล�ว Sales มู�ค'�มู�กกว'� 0 แล�ว Nonwh ก�มู�กกว'� 0 ด�วย จะสิร�ปัได�ว'�เปั-นำ Year_1985 จ��นำวนำ 3 record แติ'ถ�กปันำเปั?* อนำด�วย Year_1978 จ��นำวนำ 1 record

- ถ�� Inwage มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 2.15 แล�ว Educ มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 17 จะสิร�ปัได�ว'�เปั-นำ Year_1985 จ��นำวนำ 17 record แติ'ถ�กปันำเปั?* อนำด�วย Year_1978 จ��นำวนำ 1 record

- ถ�� Inwage มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 2.15 แล�ว Educ มู�ค'�มู�กกว'� 17 จะสิร�ปัได�ว'�เปั-นำ Year_1978 จ��นำวนำ 2 record

ก�รท��เห็มู�องข้�อมู�ล - 21 - ซื้อฟติ&แวร&ว�ก��

5.CREDIT DATABASEข้�อมู�ลน�าเข้�า

@relation credit เพิ��อบอกว'�เปั-นำไฟล&ท��ใชุ�ในำก�รว�เคร�ะห็&เก��ยวก!บเร��องเครด�ติ

@attribute credit_r {yes,no}@attribute class real@attribute pay_week real @attribute age real@attribute amex real

@data

Yes,2,2,2,1No,2,1,2,0No,4,1,1,1Yes,2,2,2,0Yes,3,2,1,0Yes,1,2,1,1Yes,2,2,3,0No,2,2,1,0No,2,1,1,0 No,3,1,1,0No,5,1,1,0No,4,1,1,1No,2,2,1,1No,2,1,1,1No,3,1,1,1No,2,2,2,1No,4,1,1,1No,2,2,1,0No,3,1,1,1

ก�รท��เห็มู�องข้�อมู�ล - 22 - ซื้อฟติ&แวร&ว�ก��

No,5,1,1,0No,4,1,1,1

เมู��อนำ��ไฟล&นำ�*เข้��ไปัว�เคร�ะห็&ในำ Software Weka แล�ว จะได�

ติ�นำไมู�ติ!ดสิ�นำใจ ด!งนำ�*ร�ปัท�� 9.5 ติ�นำไมู�ติ!ดสิ�นำใจข้องชุ�ดข้�อมู�ล Credit

จ�กติ�นำไมู�ติ!ดสิ�นำใจนำ�* อธ์�บ�ยได�ว'�- ถ�� Pay_week มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 1 แล�ว Age มู�ค'�

นำ�อยกว'�ห็ร�อเท'�ก!บ 1 จะสิร�ปัได�ว'� credit ไมู'ผ'�นำ (No)

จ��นำวนำ 138 record แติ'ถ�กปันำเปั?* อนำด�วย credit ท��ผ'�นำ (Yes) จ��นำวนำ 11 record

- ถ�� Pay_week มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 1 แล�ว Age มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 1 แล�ว Age มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 2

จะสิร�ปัได�ว'� credit ไมู'ผ'�นำ (No) จ��นำวนำ 20 record แติ'ถ�กปันำเปั?* อนำด�วย credit ท��ผ'�นำ (Yes) จ��นำวนำ 4 record

- ถ�� Pay_week มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 1 แล�ว Age มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 1 แล�ว Age มู�ค'�มู�กกว'� 2 จะสิร�ปัได�ว'� credit ผ'�นำ (Yes) จ��นำวนำ 70 record

ก�รท��เห็มู�องข้�อมู�ล - 23 - ซื้อฟติ&แวร&ว�ก��

- ถ�� Pay_week มู�ค'�มู�กกว'� 1 แล�ว Age มู�ค'�มู�กกว'� 1 จะสิร�ปัได�ว'� credit ผ'�นำ (Yes) จ��นำวนำ 109 record แติ'ถ�กปันำเปั?* อนำด�วย credit ท��ไมู'ผ'�นำ (No) จ��นำวนำ 1 record

- ถ�� Pay_week มู�ค'�มู�กกว'� 1 แล�ว Age มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 1 แล�ว Class มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 2 จะสิร�ปัได�ว'� credit ไมู'ผ'�นำ (No) จ��นำวนำ 43 record แติ'ถ�กปันำเปั?* อนำด�วย credit ท��ผ'�นำ (Yes) จ��นำวนำ 19 record

- ถ�� Pay_week มู�ค'�มู�กกว'� 1 แล�ว Age มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 1 แล�ว Class มู�ค'�มู�กกว'� 2 จะสิร�ปัได�ว'� credit

ผ'�นำ (Yes) จ��นำวนำ 6 record6.HOUSING DATABASEท��มูา:

ต์�นก้�าเน+ด : ด�ติ��เซื้ติชุ�ดนำ�*ถ�กนำ��มู�จ�ก StatLib

library ซื้)�งย!งคงถ�กเก�บร!กษ�ไว�ท�� มูห็�ว�ทย�ล!ย Carnegie Mellon

ผู้��สัร์�าง : D. Harrison, and D.L. Rubinfeld, Hedonic prices and the demand for clean air, J. Environ. Economics and Management, vol. 5,81-102, 1978.

ว�นท�� : 7 กรกฎ�คมู ค.ศ. 1993

ปร์ะเด(นสั�าคั�ญ : เก��ยวข้�องก!บก�รจ!ดผ!งเมู�องในำชุ�นำเมู�องข้อง Boston

จำ�านวนข้องต์�วอย่�าง : 200

จำ�านวนข้อง Attribute : มู� 13 attribute เปั-นำข้�อมู�ลแบบติ'อเนำ��อง (รวมูท!*ง “class” และ

attribute “MEDV” ด�วย) มู� 1 attribute เปั-นำข้�อมู�ลชุนำ�ด binary

Attribute Information :1. CRIM อ!ติร�อ�ชุกรรมูติ'อห็!วในำเมู�อง

ก�รท��เห็มู�องข้�อมู�ล - 24 - ซื้อฟติ&แวร&ว�ก��

2. ZN สิ!ดสิ'วนำข้องบร�เวณท��พิ!กอ�ศ!ยท��พิ�*นำท��มู�กกว'� 25,000 ติ�ร�งฟ�ติ

3. INDUS สิ!ดสิ'วนำข้องร��นำข้�ยปัล�กและไมู'ข้�ยสิ'ง ห็นำ'วยเปั-นำ acers ติ'อเมู�อง

4. CHAS Charles River (=1 ถ��เปั-นำข้อบเข้ติข้องแมู'นำ�*� อ��นำๆ =0)

5. NOX คว�มูเข้�มูข้�นำข้องสิ�ร nitric oxides (สิ'วนำติ'อ 10 ล��นำ)

6. RM จ��นำวนำเฉล��ยข้องห็�องติ'อก�รพิ!กอ�ศ!ย7. AGE สิ!ดสิ'วนำข้องบ��นำท��มู�ผ��อ�ศ!ยอย�'ท��สิร��งมู�ก'อนำ

จนำถ)งปั= 1940

8. DIS ระยะท�งไปัถ)ง 5 ศ�นำย&กล�งก�รจ��งง�นำข้อง Boston

9. RAD ด!ชุนำ�ข้องก�รเข้��ถ)งร!ศมู�ท�งห็ลวง10. TAX อ!ติร�ค'�ภ�ษ�ติ'อ $10,000

11. PTRATION อ!ติร�สิ'วนำระห็ว'�งนำ!กเร�ยนำและค�ณคร�ติ'อเมู�อง

12. B

โดยท�� ค�อสิ!ดสิ'วนำข้องคนำผ�วด��ติ'อเมู�อง

13. LSTAT % lower status ข้องปัระชุ�กร14. MEDV ค'�กล�งข้องบ��นำท��มู�ผ��อ�ศ!ยอย�' ในำ

$1000’sจำ�านวนข้�อมู�ลท��ข้าดหาย่ไป : ไมู'มู�

ข้�อมู�ลน�าเข้�า

ก�รท��เห็มู�องข้�อมู�ล - 25 - ซื้อฟติ&แวร&ว�ก��

@relation housing เพิ��อบอกว'�เปั-นำไฟล&ท��ใชุ�ในำก�รว�เคร�ะห็&เก��ยวก!บเร��องก�รจ!ดผ!งเมู�อง

@attribute crim real@attribute zn real@attribute indus real@attribute chas {Category_1, Category_2}

@attribute nox real@attribute rm real@attribute age real@attribute dis real@attribute rad real@attribute tax real@attribute ptration real@attribute b real@attribute lstat real@attribute mdev real

@data

0.01,18,2.31,Category_1,0.54,6.58,65.2,4.09,1,296,15.3,396.9,4.98,240.03,0,7.07,Category_1,0.47,6.42,78.9,4.97,2,242,17.8,396.9,9.14,21.60.03,0,7.07,Category_1,0.47,7.19,61.1,4.97,2,242,17.8,392.83,4.03,34.70.03,0,2.18,Category_1,0.46,7,45.8,6.06,3,222,18.7,394.63,2.94,33.4 0.07,0,2.18,Category_1,0.46,7.15,54.2,6.06,3,222,18.7,396.9,5.33,36.20.03,0,2.18,Category_1,0.46,6.43,58.7,6.06,3,222,18.7,394.12,5.21,28.7 0.09,12.5,7.87,Category_1,0.52,6.01,66.6,5.56,5,311,15.2,395.6,12.43,22.9

ก�รท��เห็มู�องข้�อมู�ล - 26 - ซื้อฟติ&แวร&ว�ก��

0.14,12.5,7.87,Category_1,0.52,6.17,96.1,5.95,5,311,15.2,396.9,19.15,27.10.21,12.5,7.87,Category_1,0.52,5.63,100,6.08,5,311,15.2,386.63,29.93,16.50.17,12.5,7.87,Category_1,0.52,6,85.9,6.59,5,311,15.2,386.71,17.1,18.90.22,12.5,7.87,Category_1,0.52,6.38,94.3,6.35,5,311,15.2,392.52,20.45,150.12,12.5,7.87,Category_1,0.52,6.01,82.9,6.23,5,311,15.2,396.9,13.27,18.90.09,12.5,7.87,Category_1,0.52,5.89,39,5.45,5,311,15.2,390.5,15.71,21.70.63,0,8.14,Category_1,0.54,5.95,61.8,4.71,4,307,21,396.9,8.26,20.40.64,0,8.14,Category_1,0.54,6.1,84.5,4.46,4,307,21,380.02,10.26,18.20.63,0,8.14,Category_1,0.54,5.83,56.5,4.5,4,307,21,395.62,8.47,19.91.05,0,8.14,Category_1,0.54,5.94,29.3,4.5,4,307,21,386.85,6.58,23.1 0.78,0,8.14,Category_1,0.54,5.99,81.7,4.26,4,307,21,386.75,14.67,17.50.8,0,8.14,Category_1,0.54,5.46,36.6,3.8,4,307,21,288.99,11.69,20.2 0.73,0,8.14,Category_1,0.54,5.73,69.5,3.8,4,307,21,390.95,11.28,18.21.25,0,8.14,Category_1,0.54,5.57,98.1,3.8,4,307,21,376.57,21.02,13.60.85,0,8.14,Category_1,0.54,5.97,89.2,4.01,4,307,21,392.53,13.83,19.61.23,0,8.14,Category_1,0.54,6.14,91.7,3.98,4,307,21,396.9,18.72,15.20.99,0,8.14,Category_1,0.54,5.81,100,4.1,4,307,21,394.54,19.88,14.50.75,0,8.14,Category_1,0.54,5.92,94.1,4.4,4,307,21,394.33,16.3,15.6

ก�รท��เห็มู�องข้�อมู�ล - 27 - ซื้อฟติ&แวร&ว�ก��

ก�รท��เห็มู�องข้�อมู�ล - 28 - ซื้อฟติ&แวร&ว�ก��

เมู��อนำ��ไฟล&นำ�*เข้��ไปัว�เคร�ะห็&ในำ Software Weka แล�ว จะได�

ติ�นำไมู�ติ!ดสิ�นำใจ ด!งนำ�*ร�ปัท�� 9.6 ติ�นำไมู�ติ!ดสิ�นำใจข้องชุ�ดข้�อมู�ล Housing

จ�กติ�นำไมู�ติ!ดสิ�นำใจนำ�* อธ์�บ�ยได�ว'� - ถ�� Indus มู�ค'�อ!ติร�สิ'วนำท��นำ�อยกว'�ห็ร�อเท'�ก!บ 6.09 แสิดง

ว'�จ!ดอย�'ในำปัระเภทท�� 1 (Category_1) จ��นำวนำ 163

record แติ'ถ�กปันำเปั?* อนำด�วยปัระเภทท�� 2 (Category_2)

จ��นำวนำ 2 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 18.6 แล�ว จะจ!ดอย�'ในำปัระเภทท�� 1

ก�รท��เห็มู�องข้�อมู�ล - 29 - ซื้อฟติ&แวร&ว�ก��

(Category_1) จ��นำวนำ 223 record แติ'ถ�กปันำเปั?* อนำด�วยปัระเภทท�� 2 (Category_2) จ��นำวนำ 8 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำนำ�อยกว'�ห็ร�อเท'�ก!บ 18.6 แล�ว dis มู�ระยะห็'�งมู�กกว'� 4.86 จะจ!ดอย�'ในำปัระเภทท�� 1 (Category_1)

จ��นำวนำ 23 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำนำ�อยกว'�ห็ร�อเท'�ก!บ 18.6 แล�ว dis มู�ระยะห็'�งนำ�อยกว'�ห็ร�อเท'�ก!บ 4.86 แล�ว tax มู�อ!ติร�มู�กกว'� 289 จะจ!ดอย�'ในำปัระเภทท�� 1 (Category_1) จ��นำวนำ 69 record แติ'ถ�กปันำเปั?* อนำด�วยปัระเภทท�� 2 (Category_2) จ��นำวนำ 12 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำนำ�อยกว'�ห็ร�อเท'�ก!บ 18.6 แล�ว dis มู�ระยะห็'�งนำ�อยกว'�ห็ร�อเท'�ก!บ 4.86 แล�ว tax มู�อ!ติร�นำ�อยกว'�ห็ร�อเท'�ก!บ 289 แล�ว age มู�ค'�สิ!ดสิ'วนำท��มู�กกว'� 86.5 จะจ!ดอย�'ในำปัระเภทท�� 2 (Category_2) จ��นำวนำ 5 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำนำ�อยกว'�ห็ร�อเท'�ก!บ 18.6 แล�ว dis มู�ระยะห็'�งนำ�อยกว'�ห็ร�อเท'�ก!บ 4.86 แล�ว tax มู�อ!ติร�นำ�อยกว'�ห็ร�อเท'�ก!บ 289 แล�ว age มู�ค'�สิ!ดสิ'วนำท��นำ�อยกว'�ห็ร�อเท'�ก!บ 86.5 แล�ว mdev มู�ค'�มู�กกว'� 32.2 จะจ!ดอย�'ในำปัระเภทท�� 2

(Category_2) จ��นำวนำ 4 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำนำ�อยกว'�ห็ร�อเท'�ก!บ 18.6 แล�ว dis มู�ระยะห็'�งนำ�อยกว'�ห็ร�อเท'�ก!บ 4.86 แล�ว tax มู�อ!ติร�นำ�อยกว'�ห็ร�อเท'�ก!บ 289 แล�ว age มู�ค'�สิ!ดสิ'วนำท��นำ�อยกว'�ห็ร�อเท'�ก!บ 86.5 แล�ว mdev มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 32.2 แล�ว lstat มู�ค'�นำ�อย

ก�รท��เห็มู�องข้�อมู�ล - 30 - ซื้อฟติ&แวร&ว�ก��

กว'�ห็ร�อเท'�ก!บ 13.22 จะจ!ดอย�'ในำปัระเภทท�� 1

(Category_1) จ��นำวนำ 13 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำนำ�อยกว'�ห็ร�อเท'�ก!บ 18.6 แล�ว dis มู�ระยะห็'�งนำ�อยกว'�ห็ร�อเท'�ก!บ 4.86 แล�ว tax มู�อ!ติร�นำ�อยกว'�ห็ร�อเท'�ก!บ 289 แล�ว age มู�ค'�สิ!ดสิ'วนำท��นำ�อยกว'�ห็ร�อเท'�ก!บ 86.5 แล�ว mdev มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 32.2 แล�ว lstat มู�ค'�มู�กกว'� 13.22 แล�ว crim มู�อ!ติร�นำ�อยกว'�ห็ร�อเท'�ก!บ 0.32

จะจ!ดอย�'ในำปัระเภทท�� 2 (Category_2) จ��นำวนำ 4 record

- ถ�� Indus มู�ค'�อ!ติร�สิ'วนำมู�กกว'� 6.09 แล�ว ptration มู�ค'�อ!ติร�สิ'วนำนำ�อยกว'�ห็ร�อเท'�ก!บ 18.6 แล�ว dis มู�ระยะห็'�งนำ�อยกว'�ห็ร�อเท'�ก!บ 4.86 แล�ว tax มู�อ!ติร�นำ�อยกว'�ห็ร�อเท'�ก!บ 289 แล�ว age มู�ค'�สิ!ดสิ'วนำท��นำ�อยกว'�ห็ร�อเท'�ก!บ 86.5 แล�ว mdev มู�ค'�นำ�อยกว'�ห็ร�อเท'�ก!บ 32.2 แล�ว lstat มู�ค'�มู�กกว'� 13.22 แล�ว crim มู�อ!ติร�มู�กกว'� 0.32 จะจ!ดอย�'ในำปัระเภทท�� 1 (Category_1) จ��นำวนำ 2 record

7. 1985 AUTO IMPORTS DATABASEข้�าวสัาร์แหล�งข้�อมู�ล :

Creator/Donor: Jeffrey C. Schlimmer (Jeffrey . Schlimmer@a.gp.cs.cmu.edu) Date 19 May 1987

แหล�งข้�อมู�ล :1. 1985 Model Import Car and Truck

Specification, 1985 Ward’s Automotive Yearbook.

ก�รท��เห็มู�องข้�อมู�ล - 31 - ซื้อฟติ&แวร&ว�ก��

2. Personal Auto Manuals, Insurance Service Office, 160 Water Street, New York, NY 10038.

3. Insurance Collision Report, Insurance Institute for Highway Safety, Watergate 600, Washington, DC 20037.

สัาร์ะสั�าคั�ญร์าย่ละเอ�ย่ด : dataset นำ�* ปัระกอบไปัด�วย เอกล!กษณ& 3

ชุนำ�ด ค�อ : (a) สิเปัคข้องรถยนำติ&ในำล!กษณะติ'�งๆ (b) ก��ห็นำดระด!บคว�มูเสิ��ยงข้องก�รปัระก!นำ (c) ก�รสิ�ญ่เสิ�ยจ�กก�รใชุ�เมู��อเท�ยบก!บรถยนำติ&อ��นำๆ ปั�จจ!ยท��สิอง ก�รให็�คะแนำนำท��สิอดคล�อง ก!บระด!บข้องรถยนำติ&ท��มู�คว�มูเสิ��ยงมู�กกว'�ร�ค�ท��ระบ� รถยนำติ&นำ!*นำจะถ�กก��ห็นำดร�ค� ซื้)�งจะข้)*นำอย�'ก!บคว�มูเสิ��ยงว'� มู�คว�มูเสิ��ยงมู�ก ห็ร�อ นำ�อย สิ!ญ่ล!กษณ&นำ�*จะมู�ก�รปัร!บ โดยก�รเล��อนำข้)*นำ(ห็ร�อ ลง) ข้องระด!บ Actuarians เร�ยกว'�กระบวนำก�รนำ�*ว'� “symboling” ค'� +3 แสิดงว'�รถยนำติ&เปั-นำคว�มูเสิ��ยง -3 แสิดงว'�มู�คว�มูปัลอดภ!ย

ปั�จจ!ยท��สิ�มู ค�อ ก�รชุ��ระเง�นำค'�เฉล��ยข้องก�รสิ�ญ่เสิ�ย ติ'อปั= เมู��อเท�ยบก!บ ย�นำพิ�ห็นำะข้องผ��ปัระก!นำตินำ ค'�นำ�*จะถ�กจ��แนำกจ�กล!กษณะเฉพิ�ะข้องรถยนำติ& ( 2 ปัระติ� , รถบรรท�ก , อ��นำๆ ) และแสิดงถ)งก�รสิ�ญ่เสิ�ยเฉล��ยติ'อรถ 1 ค!นำ ติ'อปั=

ข้�อสั�งเก้ต์� : ห็ล�ยค�ณล!กษณะในำฐ�นำข้�อมู�ลสิ�มู�รถจะใชุ�ล!กษณะเปั-นำ "คล�สิ"

จำ�านวนต์�วอย่�าง : 205

จำ�านวนข้อง Attributes : 26 total- 15 continuous- 1 integer- 10 nominal

ก�รท��เห็มู�องข้�อมู�ล - 32 - ซื้อฟติ&แวร&ว�ก��

Attribute Information :

Attributes Attributes range1. symboling -3 , -2 , -1, 0 , 1, 2 , 32. normalized – losses Continuous from 65 to

2563. make Alfa-romero, audi , bmw,

Chevrolet , dodge , Honda , isuzu , jaguar , mazda , Mercedes- benz , mercury , mitsutbishi , Nissan , peugot , Plymouth , Porsche, Renault ,saab , Toyota , Volkswagen , volvo

4. fuel – type diesel ,gas5. aspiration std, turbo6. num – of – doors Four , two7. body – style harstop, wagon , sedan,

hatchback , convertible8. drive – wheels 4wd , fwd , rwd9. engine – location front , rear10. wheel – base Continuous from 86.6

to 120.911. length Continuous from 141.1

to 208.112. width Continuous from 60.3

to 72.313. height Continuous from 47.8

to 59.814. curb – weight Continuous from 1488

to 406615. engine – type dohc , dohcv , l , ohc ,

ohcf , ohcv , rotor 16. num – of – cylinders eight , five , four, six ,

three ,twelve , two

ก�รท��เห็มู�องข้�อมู�ล - 33 - ซื้อฟติ&แวร&ว�ก��

17. engine – size Continuous from 61 to 326

18. fuel - system 1bbl , 2bbl , 4bbl , idi , mfi , mpfi , spdi , spfi

Attributes Attributes range19 . bore Continuous from 2.54

to 3.9420. stroke Continuous from 2.07

to 4.1721. compression - ratio Continuous from 7 to

2322. horsepower Continuous from 48 to

28823. peak – rpm Continuous from 4150

to 660024. city – mpg Continuous from 13 to

4925 highway – mpg Continuous from 16 to

5426. price Continuous from 5118

to 45400

Attribute No. Number of instances missing a value

2 41 6 2 19 4 20 4 22 2 23 2 26 4

@relation 'autoPrice.names'@attribute symboling real@attribute normalized-losses real@attribute wheel-base real@attribute length real

ก�รท��เห็มู�องข้�อมู�ล - 34 - ซื้อฟติ&แวร&ว�ก��

@attribute width real@attribute height real@attribute curb-weigth real@attribute engine-size real@attribute bore real@attribute stroke real@attribute compression-ratio real@attribute horsepower real@attribute peak-rpm real@attribute city-mpg real@attribute highway-mpg real@attribute class real

@data2,164,99.8,176.6,66.2,54.3,2337,109,3.19,3.4,

10,102,5500,24,30,139502,164,99.4,176.6,66.4,54.3,2824,136,3.19,3.4,

8,115,5500,18,22,174501,158,105.8,192.7,71.4,55.7,2844,136,3.19,3.

4,8.5,110,5500,19,25,177101,158,105.8,192.7,71.4,55.9,3086,131,3.13,3.

4,8.3,140,5500,17,20,238752,192,101.2,176.8,64.8,54.3,2395,108,3.5,2.8,

8.8,101,5800,23,29,164300,192,101.2,176.8,64.8,54.3,2395,108,3.5,2.8,

8.8,101,5800,23,29,169250,188,101.2,176.8,64.8,54.3,2710,164,3.31,3.

19,9,121,4250,21,28,209700,188,101.2,176.8,64.8,54.3,2765,164,3.31,3.

19,9,121,4250,21,28,211052,121,88.4,141.1,60.3,53.2,1488,61,2.91,3.03,

9.5,48,5100,47,53,51511,98,94.5,155.9,63.6,52,1874,90,3.03,3.11,9.6

,70,5400,38,43,62950,81,94.5,158.8,63.6,52,1909,90,3.03,3.11,9.6

,70,5400,38,43,6575

ก�รท��เห็มู�องข้�อมู�ล - 35 - ซื้อฟติ&แวร&ว�ก��

1,118,93.7,157.3,63.8,50.8,1876,90,2.97,3.23,9.41,68,5500,37,41,5572

1,118,93.7,157.3,63.8,50.8,1876,90,2.97,3.23,9.4,68,5500,31,38,6377

1,118,93.7,157.3,63.8,50.8,2128,98,3.03,3.29,7.6,102,5500,24,30,7957

1,148,93.7,157.3,63.8,50.6,1967,90,2.97,3.23,9.4,68,5500,31,38,6229

1,148,93.7,157.3,63.8,50.6,1989,90,2.97,3.23,9.4,68,5500,31,38,6692

1,148,93.7,157.3,63.8,50.6,1989,90,2.97,3.23,9.4,68,5500,31,38,7609

1,110,103.3,174.6,64.6,59.8,2535,122,3.34,3.46,8.5,88,5000,24,30,8921

3,145,95.9,173.2,66.3,50.2,2811,156,3.6,3.9,7,145,5000,19,24,12964

2,137,86.6,144.6,63.9,50.8,1713,92,2.91,3.41,9.6,58,4800,49,54,6479

2,137,86.6,144.6,63.9,50.8,1819,92,2.91,3.41,9.2,76,6000,31,38,6855

1,101,93.7,150,64,52.6,1837,79,2.91,3.07,10.1,60,5500,38,42,5399

1,101,93.7,150,64,52.6,1940,92,2.91,3.41,9.2,76,6000,30,34,6529

1,101,93.7,150,64,52.6,1956,92,2.91,3.41,9.2,76,6000,30,34,7129

Linear regression model(using Weka tool) : เมู��อ class เปั-นำแบบติ'อเนำ��อง ติ!วอย'�งข้อง Linear regression

สิ�มู�รถใชุ� Linear model i.e ท��ได�ศ)กษ�มู� ค�อ สิมูก�รข้องเสิ�นำติรงท��อย�'ใกล�ท��สิ�ดก!บติ!วอย'�งท!*งห็มูด ยกติ!วอย'�ง จ�ก autoPrice dataset, โดยใชุ�เคร��องมู�อจ�ก Linear regression ท��ได�ศ)กษ�มู�

ก�รท��เห็มู�องข้�อมู�ล - 36 - ซื้อฟติ&แวร&ว�ก��

Price = -59400 + 79.8 symboling + 7.14 normalized-losses + 198 wheel-base

-92.5 length + 767 width + 38.9 height + 5.09 curb-weight + 49.9 engine-size

-1810 bore - 1840 stroke + 104 compression-ratio + 26.1 horsepower

+ 0.753 peak-rpm + 18.9 city-mpg - 13.5 highway-mpg

Regession tree model (using Weka tool) : regession tree เปั-นำติ�นำไมู�ชุ'วยในำก�รติ!ดสิ�นำใจ ซื้)�งจะมู�ใบท��จะบอกค'�เฉล��ยข้องแติ'ละชุ!*นำ ท��เปั-นำติ!วเลข้ลงมู�ในำแติ'ละระด!บ โห็นำดภ�ยในำข้องติ�นำไมู�ด!งกล'�วมู�ล!กษณะท��เปั-นำ non-class สิ��ห็ร!บ autoPrice dataset โดยก�รใชุ�เคร��องมู�อจ�ก ว�ธ์� regession

tree ท��ได�ศ)กษ�

curb-weight <= 2660 :curb-weight <= 2290 :

curb-weight <= 2090 :length <= 161 :

price=6220length > 161 :

price=7150curb-weight > 2090 :

price=8010curb-weight > 2290 :

length <= 176 : price=9680length > 176 :

normalized-losses <= 157 :price=10200

normalized-losses > 157 :price=15800curb-weight > 2660 :

width <= 68.9: price=16100

ก�รท��เห็มู�องข้�อมู�ล - 37 - ซื้อฟติ&แวร&ว�ก��

width > 68.9: price=25500

Model tree : model tree เปั-นำติ�นำไมู�ท��ชุ'วยในำก�รติ!ดสิ�นำใจ ซื้)�ง ภ�ยในำข้องติ�นำไมู�นำ!*นำ จะมู�ค�ณล!กษณะท��เปั-นำ non- class

และ ใบจะเปั-นำ linear models ก��งข้องติ�นำไมู�จะคอยบอกว'�อะไรท�� ใชุ�ในำปัระมูวลผล สิ��ห็ร!บ autoPrice dataset โดยก�รใชุ�เคร��องมู�อจ�ก ว�ธ์� regession tree ท��ได�ศ)กษ�

curb-weight <= 2660 :curb-weight <= 2290 : LM1curb-weight > 2290 :

length <= 176 : LM2length > 176 : LM3

curb-weight > 2660 :width <= 68.9: LM4width > 68.9: LM5

whereLM1: price = -5280 + 6.68normalized-

losses + 4.44curb-weight + 22.1horsepower -85.8city-mpg +

98.6highway –mpgLM2: price = 9680LM3: price = -1100 + 91normalized-

lossesLM4: price = 9940 + 47.5horsepowerLM5: price = -19000 + 13.2curb-weight

Regession tree model for Housing data (using Xlminer)เร�จะสิ�มู�รถศ)กษ�ติ�นำไมู�ด!งติ'อไปันำ�* LSAT( % ข้องปัระชุ�กรท��มู�สิถ�นำะติ���กว'� ) ถ�กเล�อกเปั-นำติ!วแปัรติ!วนำ)ง ถ�� อ!ติร�ร�อยละนำ�* > 9.65% (124 cases) ด!งนำ!*นำ LSTAT จะถ�กเล�อกเปั-นำติ!วแปัรอ�กคร!*ง ถ�� LSTAT

<= 14.805 (48 cases) MEDV สิ�มู�รถค�ดเด�ได�ว'�เปั-นำ

ก�รท��เห็มู�องข้�อมู�ล - 38 - ซื้อฟติ&แวร&ว�ก��

$20.89 ด!งนำ!*นำกฎข้�อแรก ค�อ ถ�� LSTAT <=

9.65 และ LSTAT <= 14805 ด!งนำ!*นำ MEDV = $20.89

ถ�� LSTAT <= 9.65% ด!งนำ!*นำ เร� สิ�มู�รถท��จะ ย��ย RM

(Average no. of rooms per dwelling) เพิ��อไปัห็�รก!บติ!วติ'อไปั ถ�� RM > 7.141 (19 cases) MEDV เปั-นำติ!วท��สิ�มู�รถท��นำ�ยได�ว'�จะเปั-นำ $40.44 ($40.44 จะเปั-นำ terminal

node ติ!วอ��นำ) ด!งนำ!*นำกฎข้�อสิอง ค�อ ถ�� LSTAT <= 9.775 และ

RM > 7.141 ด!งนำ!*นำ MEDV = $40.44

ร�ปัท�� 9.7 Regession tree สิ��ห็ร!บ Housing dataset8. BADGE PROBLEM

เปั-นำอ�กห็นำ)�งว�ธ์�ท��ด�ข้อง machine learning ข้องชุ�ดข้�อมู�ล( ftp://ftp.ics.uci.edu/pub/machine-learning-

database) สิ'วนำนำ�*จะปัระกอบด�วย เร�ยกว'� Badge Problem

ว�ธ์�ก�รแก�ปั�ญ่ห็�นำ�* โดย Hakan Kjellerstrand8.1 Presentation of the Problem

ก�รท��เห็มู�องข้�อมู�ล - 39 - ซื้อฟติ&แวร&ว�ก��

ข้�อมู�ลสิ'วนำให็ญ่'จะไมู'ค'อยมู�ปั�ญ่ห็� (ซื้)�งมู!นำจะท��ให็�เร�สินำ�ก ) แติ'ละ object จะปัระกอบด�วย ชุ��อข้องสิ��งนำ!*นำ และ เคร��องห็มู�ย +

ห็ร�อ -ห็!วเร��อง : ML94/COLT94 Badge Problem

แห็ล'งข้องข้�อมู�ล :- Creator : Haym Hirsh, after an idea by

Rob Schapire

- Donor : Haym Hirsh (hirsh@cs.rutgers.edu)

- Date : September , 1994

ข้�อมู�ลท��เก้��ย่วข้�อง : สิ'วนำห็นำ)�งข้องปั�ญ่ห็�ในำก�รใชุ�โปัรแกรมูอ!ติโนำมู!ติ�เพิ��อค�นำพิบฟ�งก&ชุ!�นำเปั<�ห็มู�ยท��ไมู'ร� �จ!กค�อก�รติ!ดสิ�นำใจว'�จะเข้��รห็!สิชุ��อด!งกล'�วว'� โปัรแกรมูจะสิ�มู�รถนำ��มู�ใชุ� ข้�อมู�ลด��นำล'�งจะถ�กนำ��เสินำอในำร�ปัข้อง + / -- ติ�มูด�วยชุ��อข้อง๖บ�คคลนำ!*นำ สิ��งนำ�*จะข้)*นำอย�'ก!บผ��ใชุ�ระบบก�รเร�ยนำร� �ท��จะติ!ดสิ�นำใจว'�จะแปัลงข้�อมู�ลนำ�*เปั-นำสิ��งท��สิ�มู�รถใชุ�ง�นำได� โดยระบบ( สิ��งท��ค�ณล!กษณะท��จะใชุ�ถ��ค�ณชุ��นำชุอบก�รเร�ยนำร� � ค�ณสิ�มู�รถศ)กษ�โดยใชุ�ข้�อมู�ลท�มู�ค�ณล!กษณะเปั-นำเวกเติอร& )

8.2 Partial List of DataSet+Naoki Abe-Myriam Abramson+David W.Aha+Kamal M.Ali-Eric Allender+Dana Angluin-Chidanand Apte+Minoru Asada

ก�รท��เห็มู�องข้�อมู�ล - 40 - ซื้อฟติ&แวร&ว�ก��

+Lars Asker+Javed Aslam+Haralabos Athanassiou+Jose L. Balcazar+Timothy P. Barber+Michael W. Barley-Cristina Baroglio+Peter Bartlett-Eric Baum+Welton Becket-Shai Ben-David+George Berg+Neil Berckman+Malini Bhandaru+Bir Bhanu+Reinhard Blasig-Avrim Blum-Anselm Blumer+Justin Boyan+Carla E. Brodley+Nader Bshouty-Wray Buntine-Andrey Burago+Tom Bylander+Bill Byrne-Claire Cardie+Richard A. Caruana+John Case+Jason Catlett+Nicolo Cesa-Bianchi-Philip Chan+Mark Changizi+Pang-Chieh Chen-Zhixiang Chen+Wan P. Chiang-Steve A. Chien+Jeffery Clouse

ก�รท��เห็มู�องข้�อมู�ล - 41 - ซื้อฟติ&แวร&ว�ก��

+William Cohen

Hakan Kjellstrand’s สิ�มู�รถใชุ�แก�ปั�ญ่ห็�ด!งติ'อไปันำ�*สิ��งแรกท��ติ�องติระห็นำ!ก ค�อ แค'ข้�อมู�ลในำแฟ<มูติ�นำฉบ!บนำ!*นำ

ในำท�งย�วนำ!*นำ อ�จจะใชุ�ไมู'ได�ในำ machine learning จะเสิร�จสิ�*นำก�ติ'อเมู��อมู�ค�ณล!กษณะอ��นำ ๆ เชุ'นำ คว�มูแติกติ'�งข้องคว�มูย�ว , ก�รนำ!บจ��นำวนำ เปั-นำติ�นำ แติ' สิ��งท��มู� คว�มูย�ว ห็ร�อ ก�รนำ!บจ��นำวนำ แนำ'นำอนำ ก�รท��เร�จะได�นำ!�งลงแก�ไข้ (ถ�อว'�เปั-นำสิ��งท��เปั-นำได�ด�) แติ' object นำ!*นำจะใชุ� เคร��องมู�อ machine learning

ห็มู�ยเห็ติ� : เร� จะสิ�มู�รถแก�ปั�ญ่ห็�นำ!*นำได� โดยก�รแก� ชุ��อ นำ!*นำ ให็�อย�'ในำร�ปัแบบข้อง string

Attribute name, and type

Explanation

name {…..}length numericeven_odd { 0,1 }first_char_vowel { 0,1)second_char_vowel { 0,1)vowels numericconsonants numericvowel_consonants_ratio numericspaces numericdots numericwords numericclass { +,- )

ชุ��อท!*งห็มูด (รวมูถ)งชุ��อเด�มู)

คว�มูย�วข้องชุ��อคว�มูย�วข้องชุ��อ เปั-นำ ค�' ห็ร�อ ค��ติ!วอ!กข้ระติ!วแรกเปั-นำสิระใชุ'ห็ร�อไมู'ติ!วอ!กข้ระติ!วท��สิองเปั-นำสิระใชุ'ห็ร�อไมู'จ��นำวนำสิระในำชุ��อ

จ��นำวนำพิย!ญ่ชุนำะอ!ติร�สิ'วนำข้องสิระ / พิย!ญ่ชุนำะ

ก�รท��เห็มู�องข้�อมู�ล - 42 - ซื้อฟติ&แวร&ว�ก��

จ��นำวนำข้องชุ'องว'�งจ��นำวนำ “ .“ ในำชุ��อจ��นำวนำค�� , จ��นำวนำชุ��อ , รวมูท!*งชุ��อเร��มูติ�นำชุ��อปั<�ย

ผลล!พิธ์&ท��ได�จ�กใชุ� Weka: ผลล!พิธ์&ท��ได� :J48 pruned tree

..............................second_char_vowel = 0 : - (84.0)second_char_vowel = 1 : + (210.0)………=== Error on training data ===Correctly Classified Instances 294

100%………….=== Confusion Matrix === a b <- classified as 84 0 | a = -

0 210 | b = +…..ด!งนำ!*นำ จ�งได� กฎ ว'� :

“ถ��อ!กข้ระติ!วท��สิองข้องชุ��อนำ!*นำเปั-นำสิระ จะก��ห็นำดให็�มู�ค'�เปั-นำ + ถ��ไมู'ใชุ' จะเปั-นำ ค'� - “

ก�รท��เห็มู�องข้�อมู�ล - 43 - ซื้อฟติ&แวร&ว�ก��

9.2.2 ก้าร์แสัดงผู้ลข้�อมู�ลในมู�มูมูองหลาย่มู+ต์+(Visualization of Multidimensional Data)

บทน�า ก�รแสิดงผลเปั-นำเทคนำ�คท��สิ��ค!ญ่สิ��ห็ร!บก�รท��เห็มู�องข้�อมู�ลเพิร�ะคนำเก'งห็ล�ยคนำๆท��ท��ก�รปัระมูวลผลข้�อมู�ล เข้�สิ�มู�รถด)งเอ�ล!กษณะสิ��ค!ญ่ข้องคว�มูซื้!บซื้�อนำเก��ยวก!บก�รมูองเห็�นำแติ'ละฉ�กได�ในำระด!บห็นำ)�งในำพิ!นำข้องว�นำ�ท� (millisecond) เทคนำ�คก�รแสิดงผลท��ด� นำ! *นำอ�จติ�องใชุ�แรงก�ยเข้��มู�ชุ'วยเพิ��อแสิดงให็�เห็�นำถ)งคว�มูซื้!บซื้�อนำข้องข้�อมู�ลในำร�ปัแบบท��สิ�มู�รถปัระมูวลผลได�อย'�งรวดเร�วโดยใชุ�มู!นำสิมูองข้องมูนำ�ษย& ก�รแสิดงผลถ�กใชุ�ก!บจ��นำวนำข้องเห็ติ�ก�รณ&ติ'�งๆในำกระบวนำท��เห็มู�องข้�อมู�ลและถ�กนำ��มู�ใชุ�เปั-นำเคร��องมู�อสิ��ห็ร!บก�รเล�อกและจ!ดเติร�ยมูข้�อมู�ล โดยจ!ดให็�มู�ข้อบเข้ติท��ด�ในำบ�งร'องรอยท��ท��เห็มู�อง

ก�รท��เห็มู�องข้�อมู�ล - 44 - ซื้อฟติ&แวร&ว�ก��

ข้�อมู�ล ท��ๆนำ!*นำจะสิ�มู�รถแสิดงให็�เห็�นำถ)งผลล!พิธ์&ข้องเห็มู�องข้องข้�อมู�ลในำท�งท��เข้��ใจได�มู�กจนำกระท!�งผ��ใชุ�คนำท��ยสิ�ด ยกติ!วอย'�งเชุ'นำ ผ��เชุ��ยวชุ�ญ่ด��นำนำ�* ล'�สิ�ดสิ�มู�รถท��เห็มู�องข้�อมู�ลได�โดยติรงผ'�นำท�งก�รสิ��อสิ�รระห็ว'�งก!นำ ก�รสิ��รวจ และก�รว�เคร�ะห็&ข้�อมู�ล เทคนำ�คก�รแสิดงผลข้�อมู�ลในำมู�มูมูองห็ล�ยมู�ติ� มู�ปัระโยชุนำ&มู�กก!บก�รใชุ�ง�นำในำเก�อบท�กๆสิ�ข้�ว�ชุ� โดยสิ'วนำให็ญ่'แล�วสิ�ข้�ว�ชุ�เห็ล'�นำ!*นำก�จะใชุ�แบบจ��ลองเพิ��อท��ให็�เข้��ใจได�ง'�ยข้)*นำจ�กระบบท��ซื้!บซื้�อนำ เพิ��อให็�มูองเห็�นำพิฤติ�กรรมูข้องระบบได�ด�ข้)*นำสิ��ห็ร!บเทคโนำโลย�สิมู!ยให็มู' คอมูพิ�วเติอร&ข้ณะนำ�*สิ�มู�รถท��ง�นำเพิ��อให็�เห็�นำภ�พิข้องร�ปัแบบท��ซื้!บซื้�อนำ และเปั-นำก�รแก�ปั�ญ่ห็�ข้องมู�มูมูองห็ล�ยมู�ติ�ท��เข้��ใจได�ง'�ยสิ��ห็ร!บห็ล�ยๆปั�ญ่ห็�ท��ซื้!บซื้�อนำ ก�รแสิดงผลไมู'ใชุ'เทคโนำโลย�ท��เพิ��งจะเก�ดข้)*นำมู�ให็มู' ยกติ!วอย'�งเชุ'นำ ร�ปัว�ดถ�*�ท��ถ�กค�นำพิบในำปัระเทศฝร!�งเศสิ ท��มู�อ�ย�มู�กกว'� 20,000 ปั=มู�แล�ว ชุ�วจ�นำท��ได�สิร��งคว�มูร� �เร��องแผนำท��ข้)*นำเปั-นำคร!*งแรกในำศติวรรษท�� 12 ถ)งอย'�งไรก�ติ�มู ก�รนำ��เสินำอในำเร��องข้องข้�อมู�ลในำห็ล�ยมู�ติ�นำ�*ก�ไมู'ได�เร��มูติ�นำปัร�กฏิให็�เห็�นำอย'�งชุ!ดเจนำ จนำกระท!�งในำปั=ศติวรรษท�� 19 ดร.จอห็&นำ สิโนำว& และ ค�ร&เลสิ โจเซื้ปั ไมูนำ�ร&ด ได�ค�ดค�นำติ!วอย'�งสิองติ!วอย'�งซื้)�งเปั-นำติ!วอย'�งท��ด�เลยท�เด�ยว ในำปั= 1854 ดร.จอห็&นำ สิโนำว& ได�คบค�ดเร��องก�รติ�ยจ�กอห็�ว�ติกโรคในำใจกล�งเมู�องลอนำดอนำ เข้�ได�ท��เคร��องห็มู�ยท��ติ��แห็นำ'งข้องก�รติ�ยโดยแติ�มูจ�ดเล�กๆท��เคร��องสิ�บนำ�*�และท��เปั-นำเคร��องห็มู�ยก�กบ�ท เข้�ได�สิ!งเกติอห็�ว�ติกโรคท��เก�ดข้)*นำเก�อบท!*งห็มูดท'�มูกล�งผ��คนำท��อ�ศ!ยอย�'ใกล�ก!บเคร��องสิ�บนำ�*�ท��ถนำนำบอร&ดและได�ด��มูนำ�*�จ�กเคร��องสิ�บนำ�*�ท��ถนำนำบอร&ด จ�กก�รสิ!งเกติข้!*นำพิ�*นำฐ�นำ เข้�ได�ด�แลเคร��องสิ�บนำ�*�และเคล��อนำย��ยไปัย!งท��ท��ห็'�งไกลจนำในำท��สิ�ดก�รระบ�ดข้องอห็�ว�ติกโรคก�ห็มูดไปั สิ��งห็นำ)�งท��ท��ให็�คนำสิ'วนำมู�กปัระห็ล�ดใจในำก�รนำ��เสินำอง�นำกร�ฟฟEคท��มู�ห็ล�ยมู�ติ�ข้องผ��คนำท��ค�ดไมู'ถ)งได�ถ�กสิร��งมู�ปัระมู�ณ

ก�รท��เห็มู�องข้�อมู�ล - 45 - ซื้อฟติ&แวร&ว�ก��

150 ปั=ก'อนำ โดย ชุ�ร&ลเลสิ โจเซื้ปั ไมูนำ�ร&ด นำ!กว�ศวกรรมูชุ�วฝร!�งเศสิและผ��ติรวจติร�ท!�วไปัเก��ยวก!บสิะพิ�นำและถนำนำ บ�งท�เข้�จะกล'�วว'� ง“

�นำท�งด��นำสิถ�ติ�ท��ด�นำ! *นำจะติ�องมู�ง�นำกร�ฟฟEคปัระกอบข้)*นำด�วย และ”

ง�นำนำ!*นำ จะติ�องไมู'ห็ว!�นำไห็วไปัก!บผลง�นำข้องนำ!กปัระว!ติ�ศ�สิติร&คนำ“

ก'อนำ ไมูนำ�ร&ดได�ท��ก�รว�ด ก�รเด�นำท�งข้องแผนำท�� บรรย�ยเปั-นำ”

ภ�พิโศกนำ�ฏิกรรมูติ�มูโชุคชุะติ�ข้องกองท!พิ นำโปัเล�ยนำท��ให็ญ่'โติในำก�รปัฏิ�บ!ติ�ก�รท�งทห็�รท��ร ��ยแรงข้องชุ�วร!สิเซื้�ย ในำปั= 1812 โดยใชุ�ปั�กก�และนำ�*�ห็มู)ก ไมูนำ�ร&ด ได�ว�ดภ�พิจ�กท��เปั-นำภ�พิสิองมู�ติ�ให็�กล�ยมู�เปั-นำร�ปัภ�พิท��ไมู'ติ���กว'�ร�ปัห็กมู�ติ� สิ��ห็ร!บก�รอธ์�บ�ยข้�อมู�ล เอ�ดเว�ร&ด ท!ฟฟF เปั-นำนำ!กออกแบบข้�อมู�ลกว'� 3 ทศวรรษ เข้�ได�ร!บก�รปัล�กฝ�งท�งด��นำศ�ลปัะและว�ทย�ศ�สิติร&มู�คว�มูร� �คว�มูเข้��ใจเก��ยวก!บข้�อมู�ล และใชุ�ว�ทศ�ลปัFในำก�รอธ์�บ�ยแผนำท��ข้อง ไมูนำ�ร&ด ก�รรวมูกล�'มูอย'�งห็นำ�แนำ'นำใจกล�งในำก�รบรรย�ยมู�ติ�ข้องก�รปัฏิ�บ!ติ�ก�รท�งก�รทห็�รข้องนำโปัเล�ยนำ มู�ผ��คนำกว'� 422,000 คนำ เมู��อเข้�เร��มูท��ก�รบ�กร�ก ปัระเทศร!สิเซื้�ยในำเด�อนำมู�ถ�นำ�ยนำ ปั= 1812

จ�กชุ�วโปัแลนำด&และชุ�วร!สิเซื้�ยโดยมู�ข้อบเข้ติท��ติ�ดก!บแมู'นำ�*�นำ�เมูนำ กองท!พิได�ก��วไปัสิ�'เสิ�นำท�งท��มู�คว�มูห็นำ�แนำ'นำ อ!นำสิะท�อนำให็�เห็�นำถ)งข้นำ�ดข้องปัระชุ�กร คว�มูค!บแคบลงสิะท�อนำให็�เห็�นำถ)งก�รถดถอยจ�กก�รทรมู�นำระห็ว'�งก�รก��วเข้��ไปัสิ�'กร�งมูอสิโคว& ในำเวล�ติ'อมู�กองท!พิก�ได�ผ'�นำมู�ถ)งย!งกร�งมูอสิโคว&(คล��ยก!บด��นำข้��งๆข้องร�ปัว�ด)

จ��นำวนำผ��คนำได�ลดลงไปัเห็ล�ออย�'เพิ�ยง 100,000 คนำ เท�ยบได�ก!บห็นำ)�งในำสิ��ข้องข้นำ�ดปัระชุ�กรเร��มูติ�นำ เข้ติท��ติ���กว'�เสิ�นำสิ�ด��อธ์�บ�ยถ)งภ�พิก�รถดถอยข้องกองท!พิ นำโปัเล�ยนำ และผลกระทบภ!ยว�บ!ติ�จ�กคว�มูห็นำ�วเย�นำข้องชุ�วร!สิเซื้�ยในำฤด�ห็นำ�ว เสิ�นำท�งข้องก�รถดถอยได�ถ�กรวมูไปัก!บว!นำเวล�และอ�ณห็ภ�มู�ท��สิ'วนำล'�งสิ�ดข้องภ�พิกร�ฟฟEค คว�มูห็นำ�วท��ร�นำแรงท��ให็�กองท!พิลดลงเห็ล�อเพิ�ยง 10,000 คนำ ในำเวล�นำ!*นำกองท!พิก�ข้��มูผ'�นำมู�ย!งโปัแลนำด& ย��งไปักว'�นำ!*นำกองท!พิห็ล!กย!งมู� ไมูนำ�ร&ด เข้�มู�บ�คล�กล!กษณะพิ�เศษท��ชุ'วยรวมูกล�'มู เปั-นำคนำท��ชุ'วย

ก�รท��เห็มู�องข้�อมู�ล - 46 - ซื้อฟติ&แวร&ว�ก��

ปั<องก!นำและเคล��อนำปั=กกองท!พิห็ล!กให็�ร�กไปัข้��งห็นำ�� แผนำท��ข้องไมูนำ�ร&ด ค�อ ก�รเด�นำท�งร'วมูไปัก!บกองท!พิข้องติ!วแทนำข้�อมู�ล ห็ล�กเล��ยงพิ�*นำท��ร�บ เข้�ล��เล�ยงกองท!พิไปัติ�มูใจกล�งคว�มูเปั-นำจร�งข้องโลก มู�ห็ล�ยสิ��งท��นำ'�สินำใจก�ค�อคว�มูห็ล�กห็ล�ยมู�ติ� ไมูนำ�ร&ด ย)ดและคบค�ด ถ)ง 6 สิ��งท��แปัรปัรวนำ จ�กข้นำ�ดข้องกองท!พิ (1)จ�กติ��แห็นำ'งข้องกองท!พิผ�วเผ�นำแล�วมูองเปั-นำแบบสิองมู�ติ� (2,3)

ท�ศท�งข้องกองท!พิท��เคล��อนำท��ไปัข้��งห็นำ�� (4)อ�ณห็ภ�มู�ท��แติกติ'�งข้องแติ'ละว!นำระห็ว'�งก�รถอยกองท!นำจ�กกร�งมูอสิโคว& ปั�จจ�บ!นำนำ�*ว�ทย�ก�รคอมูพิ�วเติอร&ได�จ!ดเติร�ยมูเคร��องมู�อท��สิ�มู�รถแสิดงข้�อมู�ลได�อย'�งท��เห็�นำ เปั-นำคว�มูสิ�มู�รถท��จะแสิดงข้�อมู�ลได�อย'�งชุ!ดเจนำโดยมู�แรงด)งด�ดจ�กว�ด�โอเกมูในำท�กว!นำนำ�* ข้ณะท��ก�รอธ์�บ�ยเร��องเล'�ข้อง mayhem และก�รท��ล�ยล��ง สิ��งท��ล'อลวงและท��ให็�ติะล)งถ)งก�รเปัร�ยบเท�ยบให็�เห็�นำถ)งมู�มูมูอง 3 มู�ติ� ก�รว�ดภ�พิในำว�ด�โอเกมูสิ&ติ'�งๆ อย'�งท��เห็�นำในำร�ปัแบบให็มู'ๆ ซื้)�งก�ค�อคว�มูสิ�มู�รถท��จะนำ��ข้�อมู�ลในำว!นำข้��งห็นำ��ท��มู�ร�ปัแบบห็ล�ยมู�ติ�ให็�นำ��เสินำอเปั-นำร�ปัแบบข้องข้�อมู�ล ท��จร�งแล�ว Visualization นำ!*นำมู�คว�มูห็มู�ยว'�อย'�งล'ะ ? ผ��สิร��งพิจนำ�นำ�กรมู Lexicon ร� 'นำให็มู' ฉบ!บภ�ษ�อ!งกฤษ [ปั= 1989,ห็นำ��ท�� 1100] ได�นำ�ย�มู Visualization ค�อ นำ)กภ�พิ “

ห็ร�อ ห็ล!บติ�นำ)กถ)งภ�พิ ;ภ�พิท��มู�จ�กภ�ยใติ�จ�ติใจ แล�วอะไรค�อ”

คว�มูห็มู�ยข้อง “being visualized?” เนำ��องจ�ก พิจนำ�นำ�กรมูข้อง Random House ฉบ!บภ�ษ�อ!งกฤษ [ปั= 1987,ห็นำ��ท�� 2127] กล'�วว'� visualized ค�อ ก�รนำ)กถ)งภ�พิ ห็ร�อ เปั-นำภ�พิ“

ท��มู�จ�กภ�ยใติ�จ�ติใจ เก��ยวก!บก�รเห็�นำ ห็ร�อ สิ��งท��ได�เห็�นำ ร�ปัแบบข้องภ�พิท��มู�จ�กภ�ยใติ�จ�ติใจ ท��ให็�สิ�มู�รถร!บร� �ถ)งจ�ติใจห็ร�อจ�นำตินำ�ก�ร” ค��นำ�ย�มูเห็ล'�นำ�*ได�บอกเปั-นำนำ!ยๆ ว'� Visualization ค�อภ�พิจ�กบ�งเห็ติ�ก�รณ& ค��นำ�ย�มูท��เห็มู�ะสิมูก!บค��นำ�*มู�กได�ถ�กระบ�ในำ พิจนำ�นำ�กรมู Computer Graphic และ Virtual reality ได�นำ�ย�มู

ก�รท��เห็มู�องข้�อมู�ล - 47 - ซื้อฟติ&แวร&ว�ก��

Visualization ค�อ กระบวนำก�รข้องก�รแสิดงผลข้�อมู�ลให็�เห็�นำในำ“

ร�ปัแบบข้องภ�พิ[2]” คว�มูสิ��ค!ญ่ข้องข้�อมู�ลอ�จแสิดงให็�เห็�นำเปั-นำร�ปัธ์รรมู ข้อง ว!ติถ�ติ'�งๆ เชุ'นำ ห็�อง ห็ร�อ รถ ห็ร�อ อ�จเสินำอแบบ นำ�มูธ์รรมู เชุ'นำ ผลก��ไร ก�รลดร�ค�สิ�นำค�� ห็ร�อก�รข้)*นำร�ค� ถ��ห็�กข้�อมู�ลอย�'ในำร�ปัแบบนำ�มูธ์รรมู ก�รเปัร�ยบเท�ยบก!นำข้องข้�อมู�ลก�จะเก�ดข้)*นำ โดยท!�วไปัแล�วก�รเปัร�ยบเท�ยบข้�อมู�ลในำท��นำ�*ก�ค�อก�รใชุ� กร�ฟวงกลมูห็ร�อกร�ฟเสิ�นำ จ�ดปัระสิงค&ข้องก�รแสิดงผลข้�อมู�ลก�ค�อจะไมู'แทนำปัร�มู�ณท��ว�เคร�ะห็&ด�อย�'แล�วแติ'จะแทนำปัร�มู�ณก�รว�เคร�ะห็&ท��ติรงเปั<�ห็มู�ย ข้�อติกลงในำก�รแสิดงผลข้�อมู�ล - ใชุ�ปัระโยชุนำ&จ�กระบบก�รมูองเห็�นำข้องมูนำ�ษย&เพิ��อด)งข้'�วสิ�รจ�กข้�อมู�ล - มูองภ�พิรวมูข้องชุ�ดข้�อมู�ลท��ซื้!บซื้�อนำ - ระบ�โครงสิร��ง ร�ปัแบบ คว�มูท!นำสิมู!ย คว�มูผ�ดปักติ� และ คว�มูสิ!มูพิ!นำธ์&ข้องข้�อมู�ล - ชุ'วยระบ�ถ)งข้อบเข้ติข้องสิ��งท��สินำใจ นำอกจ�กนำ�*แล�วก�รแสิดงผล อนำ�ญ่�ติให็�ผ��ติ!ดสิ�นำใจใชุ�พิ�*นำท��ธ์รรมูชุ�ติ�ข้องก�รมูองเห็�นำในำก�รติ!ดสิ�นำใจสิ��ห็ร!บก�รสิ��รวจท��ไกลออกไปัท��อ�จเก�ดข้)*นำได� บอกเปั-นำนำ!ยว'� ก�รแสิดงผลจะถ�กใชุ�อย'�งเห็มู�ะสิมูและเปั-นำยอมูร!บในำก�รติ!ดสิ�นำใจเพิ��อค�นำห็�ข้'�วสิ�รจ�กข้�อมู�ล เทคโนำโลย�ก�รแสิดงผลข้�อมู�ลถ�กจ!ดไปัอย�'ในำกล�'มูโดยท!�วไปัมู� 3

กล�'มู ค�อ กล�'มูข้องศ�สิติร&ก�รแสิดงผลข้�อมู�ล , กล�'มูข้องก�รแสิดงผลข้�อมู�ลและข้'�วสิ�ร และ กล�'มูคว�มูเสิมู�อนำจร�ง กล�'มูข้องศ�สิติร&ก�รแสิดงผลข้�อมู�ลบอกเปั-นำนำ!ยๆว'�ห็มู�ยถ)งชุ��อ เก��ยวข้�องก!บก�รเปัล��ยนำแปัลงก�รสิร��งข้�อมู�ลติ�มูห็ล!กว�ทย�ศ�สิติร&ห็ร�อว�ศวกรรมูก�รค��นำวณห็ร�อเปัล��ยนำจ�กก�รทดลองมู�เปั-นำร�ปัภ�พิ ติ!วอย'�งเชุ'นำ กระแสิลมูท��เคล��อนำท��อย'�งรวดเร�ว กล�'มูข้องก�รแสิดงผลข้�อมู�ลและข้'�วสิ�ร ค�อก�รเปัล��ยนำแปัลงท��

ก�รท��เห็มู�องข้�อมู�ล - 48 - ซื้อฟติ&แวร&ว�ก��

อย�'อ!นำจะไมู'เก��ยวข้�องก!บพิ�*นำท��ห็ร�อพิฤติ�กรรมูข้องข้�อมู�ลเพิ��อให็�มูองเห็�นำภ�พิ แสิดงให็�เห็�นำถ)งก�รเปัร�ยบเท�ยบ ห็ร�อก�รอ�ปัมู�ข้องปั�ญ่ห็�ลอยๆ เชุ'นำ เง�นำลงท�นำในำก�รว�เคร�ะห็&แฟ<มูปัระว!ติ� ในำบร�บทข้องก�รท��ธ์ร�ก�จก�รแสิดงผลข้�อมู�ลข้'�วสิ�รเสิมู�อนำคว�มูเปั-นำจร�งเปั-นำว�ธ์�ท��ง'�ยสิ��ห็ร!บก�รท��ง�นำด��นำ 3 มู�ติ�ข้องคอมูพิ�วเติอร&ท!�วไปั ก�รกระติ��นำติ'อสิภ�พิแวดล�อมูให็�แสิดงผลในำเวล�จร�งเนำ��องมู�จ�กพิฤติ�กรรมูข้องผ��ใชุ� คว�มูเสิมู�อนำจร�งจะถ�กอ��งอ�งมู�จ�กสิ��งท��สิร��งข้)*นำจ�กคว�มูเปั-นำจร�ง โลกไซื้เบอร&และเห็มู�อนำสิ��งแวดล�อมูท��แท�จร�ง ในำเนำ�*อห็�สิ'วนำนำ�* ได�อธ์�บ�ยถ)งติ!วอย'�งข้องก�รนำ��เสินำอข้�อมู�ลให็�สิ�มู�รถมูองเห็�นำได� ถ�กสิร��งโดยนำ!กออกแบบ ก�รแสิดงผลข้องข้�อมู�ล

ก�รท��เห็มู�องข้�อมู�ล - 49 - ซื้อฟติ&แวร&ว�ก��

แผู้นภาพสั�าหร์�บก้าร์แสัดงภาพหลาย่มู+ต์+ (DIAGRAM FOR MULTIDIMENSIONAL VISUALIZATION)

Kiviat Diagrams Kiviat Diagrams ได�ถ�กใชุ�มู�ห็ล�ยปั=แล�วในำก�รปัระมู�ณ

ร�ค�ด�วยคอมูพิ�วเติอร& แผนำภ�พิ Kivat จะอธ์�บ�ยถ)งก�รเปัล��ยนำแปัลงข้องข้�อมู�ล ค'�ข้องแติ'ละห็นำ'วยก�รว!ดจะแสิดงบนำแกนำนำ!*นำๆ เชุ'นำ ถ��มู� 5 ห็นำ'วยก�รว!ดท��ติ'�งก!นำ แผนำภ�พิ Kivat จะปัระกอบด�วย 5 แกนำ

ร�ปัท�� 9.8

แผนำภ�พิ Kiviat

ก�รท��เห็มู�องข้�อมู�ล - 50 - ซื้อฟติ&แวร&ว�ก��

ร�ปัท�� 9.9

ร�ปัแบบข้องแผนำภ�พิ Kivat ซื้)�งสิ�มู�รถแสิดงได�ห็ล�ยร�ปัแบบค'�ท��นำ'�สินำใจข้องแติ'ละห็นำ'วยก�รว!ดจะถ�กแสิดงบนำแกนำท��เห็มู�ะ

สิมู จ�ดแติ'ละจ�ดจะถ�กเชุ��อมูติ'อก!นำ และเก�ดเปั-นำร�ปัแบบท��ท��ให็�มูองเห็�นำข้�อมู�ลท��ชุ!ดเจนำ เพิ��อเปัร�ยบเท�ยบข้�อมู�ล แผนำภ�พิชุนำ�ดนำ�*ปัระกอบด�วย เรด�ร&(radar) ติ�ร�งข้�อมู�ล(charts) กร�ฟร�ปัด�ว(star

graphs) กร�ฟร�ปัใยแมูงมู�มู(spider graphs) และสิ!ญ่ล!กษณ&ร�ปัด�ร(star glyphs)

ก้าร์ปร์ะสัานก้�นข้องเสั�น (Parallel Coordinates) ก�รปัระสิ�นำก!นำข้องเสิ�นำ (ร�ปัท�� 8.10) เปั-นำเทคนำ�คก�ร

เปัล��ยนำแปัลงห็นำ)�งท��ใชุ�สิ��ห็ร!บเวล�ท��มู�ก เมู��อไมู'นำ�นำมู�นำ�* ว�ธ์�ก�รนำ�*ได�ถ�กใชุ�แสิดงให็�เห็�นำก�รท��เห็มู�องข้�อมู�ล ด!งแสิดงในำภ�พิ Fig. 12.4

คล��ยแผนำภ�พิ Kivat แติ'ละห็นำ'วยก�รว!ดจะแสิดงบนำแกนำข้องตินำเอง ในำกรณ�นำ�* ร�ปัแบบนำ�*จะใชุ'เสิ�นำแทนำท��โพิล�กอนำ ท��ให็�ออกมู�คล��ยก!บเสิ�นำไข้ว�ก!นำไปัมู�

ก�รท��เห็มู�องข้�อมู�ล - 51 - ซื้อฟติ&แวร&ว�ก��

ร�ปัท�� 9.10 ก�รปัระสิ�นำก!นำ

ข้องเสิ�นำ

3D Scattergram 3D scattergram(ร�ปัท�� 9.11) เปั-นำติ!วแทนำข้องก�รข้ย�ยออกข้องจ�ดแบบ 2 มู�ติ� ซื้)�งสิ'วนำให็ญ่'พิบในำก�รรวมูกล�'มูข้องสิถ�ติ� ในำกรณ�นำ�*สิ�มู�รถแสิดงได� 4 ห็นำ'วยก�รว!ดท��แติกติ'�งก!นำ มู�แกนำ x,y และ z และสิ� อย'�งไรก�ติ�มู ว�ธ์�ก�รนำ�*ย!งมู�ปั�ญ่ห็�ค�อ มู�แนำวโนำ�มูว'�จะย�กท��จะได�ติ��แห็นำ'งท��ถ�กติ�องข้องแติ'ละค'� ในำห็ล�ยกรณ�จ��เปั-นำ

ก�รท��เห็มู�องข้�อมู�ล - 52 - ซื้อฟติ&แวร&ว�ก��

ท��จะติ�องเพิ��มูข้�อมู�ลอ��งอ�ง เสิ�นำจ�กแติ'ละค'�จะแสิดงติ�มูแกนำและเพิ��มูสิ�ลงไปัด�วย อย'�งไรก�ติ�มูก�รแสิดงข้อง scattergram ก�อ�จจะเปั-นำปั�ญ่ห็�ก้ร์าฟเสั�น 3 มู+ต์+ (3D Line Graph)

กร�ฟเสิ�นำ 3 มู�ติ� (ร�ปัท�� 9.12) เปั-นำติ!วแทนำข้องก�รข้ย�ยออกข้องกร�ฟเสิ�นำ 2 มู�ติ� กร�ฟชุนำ�ดนำ�*จะแสิดง 4 ห็นำ'วยก�รว!ดข้�อมู�ลท��นำ'�สินำใจท��แติกติ'�งก!นำ ในำกรณ�นำ�* เสิ�นำข้ดเปั-นำวง 3 ท�ศท�ง x,y,z

ในำ 4 ห็นำ'วยก�รว!ด สิ�ข้องเสิ�นำมู�ก�รเปัล��ยนำแปัลง ในำกรณ�นำ�* ห็นำ)�งข้�อมู�ลเท'�นำ!*นำท��จะแสิดงในำห็นำ)�งเวล� ซื้)�งผลล!พิธ์&จะง'�ยกว'�ก�รแสิดง

แบบ 3D scattergram อย'�งไรก�ติ�มู ก�รแสิดงด�วยกร�ฟเสิ�นำ 3

มู�ติ� ติ�องเพิ��มูข้�อมู�ลอ��งอ�งและแผนำท��สิ�เพิ��อคว�มูเห็มู�ะสิมู

ร�ปัท�� 9.11 แผนำภ�พิ 3D scatter

ก�รท��เห็มู�องข้�อมู�ล - 53 - ซื้อฟติ&แวร&ว�ก��

ร�ปัท�� 9.12 กร�ฟเสิ�นำ 3 มู�ติ�

Volume renderingVloume rendering เปั-นำกระบวนำก�รท��เร�ติ�องใชุ�ข้�อมู�ล

สิ�มูมู�ติ� ว�ธ์�ก�รนำ�*มู!กจะถ�กใชุ�เปั-นำเทคนำ�คในำก�รสิร��งภ�พิท�งว�ทย�ศ�สิติร& อย'�งไรก�ติ�มู Becker ผ��ท��ก�รค�นำคว��เก��ยวก!บเร��อง Volume rendering สิ��ห็ร!บ คว�มูคว�มูสิ!มูพิ!นำธ์&ข้องข้�อมู�ล ซื้)�งในำกรณ�นำ�* เข้�ได�ท��ก�ร plot ข้�อมู�ลรวมูรวบมู�ไมู'ว'�จะในำเร��องข้อง ก�รศ)กษ� อ�ชุ�พิ และระยะเวล�ก�รท��ง�นำ ในำร�ปัแบบข้องภ�พิสิ�มูมู�ติ� รวมูถ)ง มู�ก�รก��ห็นำดสิ�ในำติ!วแปัรติ�มู (ผลท��ติ�มูมู� เชุ'นำ เง�นำเด�อนำ)

คว�มูท)บแสิงข้องก�รสิร��งภ�พิจะข้)*นำอย�'ก!บจ��นำวนำข้องค'�สิ!งเกติท��อย�'ในำติ��แห็นำ'งนำ!*นำ นำอกจ�กนำ�* เข้�ย!งได�ก��ห็นำดติ!วแปัรเพิ��มูเติ�มู เชุ'นำ อ�ย� เพิ��อใชุ�เปั-นำพิ�*นำฐ�นำสิ��ห็ร!บก�รค�นำห็�ภ�พิ ซื้)�งในำ Volume

rendering อ�จกล�ยเปั-นำท�งเล�อกท��เห็มู�ะสิมูสิ��ห็ร!บก�รนำ��เสินำอติ!วแปัรท��มู�ห็ล�ยๆติ!ว

ก�รท��เห็มู�องข้�อมู�ล - 54 - ซื้อฟติ&แวร&ว�ก��

ร�ปัท�� 9.13 Vloume renderingFloors and walls

Floors and walls เปั-นำร�ปัแบบก�รนำ��เสินำอท��มู�ล!กษณะคล��ยก!บห็�องเปัร�ยบเท�ยบ ซื้)�งในำก�รนำ��เสินำอนำ!*นำ ข้�อมู�ลจะเปั-นำติ!วก��ห็นำด และจะถ�กนำ��เสินำอออกมู�ในำสิ'วนำข้องผนำ!งห็�อง ห็ร�อในำสิ'วนำข้องพิ�*นำห็�อง ก�รนำ��เสินำอในำร�ปัแบบนำ�*จะชุ'วยให็�ข้�อมู�ลท��เร�มู�อย�'อย'�งมู�กมู�ย ถ�กนำ��เข้��มู�รวมูไว�ในำห็�องเพิ�ยงห็�องเด�ยว นำอกจ�กนำ!*นำแล�ว ในำสิ'วนำข้องร�ปัแบบก�รติ!ดสิ�นำใจท��จะถ�กนำ��เสินำอออกมู�ในำร�ปัแบบกร�ฟฟEกนำ!*นำ เร�สิ�มู�รถเล�อกได�ว'�จะให็�แสิดงออกมู�เปั-นำ pie

charts, bar charts, line graphs และร�ปัแบบอ��นำๆ

ร�ปัท�� 9.14 Floors and wallsChernoff Faces

ในำปั= 1973 Herman Chernoff ได�แนำะนำ��เทคนำ�กก�รสิร��งภ�พิเพิ��อก�รนำ��เสินำอข้�อมู�ลท��มู�ห็ล�ยมู�ติ� ร�ปัแบบก�รนำ��เสินำอข้องเข้�นำ!*นำ มู�ปัระสิ�ทธ์�ภ�พิโดยเฉพิ�ะอย'�งย��ง เพิร�ะว'�เปั-นำก�รนำ��เสินำอให็�ข้�อมู�ลมู�คว�มูสิ!มูพิ!นำธ์&ก�รก!นำ ผ'�นำก�รแสิดงออกท�งสิ�ห็นำ�� โดยในำแติ'บ'ะสิ'วนำเชุ'นำ ติ� ห็� ปั�ก จมู�ก จะห็มู�ยถ)งค'�ข้องติ!วแปัรติ'�งๆ โดยก�รก�รสิ!งเกติร�ปัร'�ง ข้นำ�ติ ติ��แห็นำ'ง รวมูถ)งร�ปัแบบก�รว�งติ��แห็นำ'ง ร�ปัแบบนำ�*จะเปั-นำท��จ��ได�ง'�ยเพิร�ะใชุ�ใบห็นำ��ข้องมูนำ�ษย&ในำก��นำ��เสินำอ อ�กท!*งเมู��อมู�ก�รเปัล��ยนำแปัลงถ)งแมู�เพิ�ยงเล�กนำ�อยเร�ย!งสิ�มู�รถสิ!งเกติโดยง'�ย ร�ปัแติ'ร�ปัข้อง Chernoff Faces จะไมู'เห็มู�อนำก!นำเพิร�ะค�ณสิมูบ!ติ�ข้องใบห็นำ��จะมู�คว�มูแติกติ'�งก!นำ

ก�รท��เห็มู�องข้�อมู�ล - 55 - ซื้อฟติ&แวร&ว�ก��

ร�ปัท�� 9.15 Chernoff Faces

Virsual data mining ห็ล�กห็ล�ยเคร��องมู�อท��ท!นำสิมู!ยได�รวบรวมูก�รแสิดงข้�อมู�ลท��จะ

แสิดงภ�พิท��ทรงพิล!งพิร�อมูใชุ�ก�รใชุ�ง�นำท��ง'�ยและก�รควบค�มูก�รแสิดงผลข้�อมู�ล โดยฟ�งก&ชุ!นำเห็ล'�นำ�*ชุ'วยให็�ผ��เชุ��ยวชุ�ญ่สิ��รวจข้�อมู�ลได�อย'�งมู�ปัระสิ�ทธ์�ภ�พิเพิ��อท��พิวกเข้�จะสิ�มู�รถห็�ข้�อมู�ลท��นำ'�สินำใจร�ปัแบบอ!ติโนำมู!ติ�โดยไมู'ติ�องใชุ�ข้! *นำติอนำว�ธ์�ก�รท��เห็มู�องข้�อมู�ล ซื้)�งปัระเภทข้องก�รท��เห็มู�อข้�อมู�ลในำล!กษณะนำ�* บ�งคร!*งเร�เร�ยกว'� Virsual

data mining และเคร��องมู�อเก��ยวก!บก�ร Virsual data

mining ท��ด�นำ! *นำ จะติ�องมู�ฟ�งก&ชุ!�นำ ด!งติ'อไปันำ�*- คว�มูสิ�มู�รถในำก�รติอบสินำองข้องภ�พิก�รแสิดงผล ไมู'ว'�

จะเปั-นำซื้�มูร�ปัภ�พิ ก�รห็มู�นำร�ปัภ�พิ และมู�ก�รว�เคร�ะห็&ข้�อมู�ลได�มู�กกว'�ท��แสิดงออกไปั

- คว�มูสิ�มู�รถในำก�รติอบสินำองในำเร��องข้องก�รควบค�มูก�รแสิดงผล รวมูถ)งค�ณล!กษณะข้องภ�พิท��เร� แสิดงออกมู�

ก�รท��เห็มู�องข้�อมู�ล - 56 - ซื้อฟติ&แวร&ว�ก��

- คว�มูสิ�มู�รถในำก�รติอบสินำอง ในำเร��องข้องก�รควบค�มูค'�อ!ติร�ซื้)�งได�ก�รค��นำวณระห็ว'�งข้�อมู�ล นำอกจ�กนำ!*นำย!งชุ'วยให็�ผ��เชุ��ยวชุ�ญ่ท��จะมูองจ�กมู�มูมูองในำระด!บสิ�งห็ร�อเจ�ะลงไปัย!งชุ�ดข้�อมู�ลเฉพิ�ะ สิ�มู�รถท��ว�เคร�ะห็&ร�ปัภ�พิท��ให็ญ่'ๆห็ร�อก��ห็นำดเปั<�ห็มู�ยข้องร�ยละเอ�ยด และล!กษณะพิ�เศษข้องข้อ�มู�ลท��จะแสิดงออกมู�

Animationเคร��องมู�อสิ��ห็ร!บก�รแสิดงข้�อมู�ลในำปั�จจจ�บ!นำนำ�* ได�มู�ค�ณสิมูบ!ติ�

ข้องก�รแสิดงข้�อมู�ลในำล!กษณะข้องภ�พิเคล��อนำไห็ว เทคนำ�คก�รสิร��งภ�พิแบบนำ�* จะใชุ�คว�มูสิ�มู�รถข้องมูนำ�ษย&สิ��ห็ร!บก�รปัระมูวลผลท��ซื้!บซื้�อนำ โดยติรวจจ!บก�รเคล��อนำไห็วข้องข้�อมู�ลภ�พิ ด�วยเห็ติ�นำ�* animation จ)งมู�ปัระสิ�ทธ์�ภ�พิในำก�รว�เคร�ะห็&ข้�อมู�ล

ข้�อมู�ลแบบ Animation มู!กจะท��ง�นำโดยก�รเล�อกติ!วแปัรมู�เปั-นำเกณฑ์& รวมูไปัถ)งแสิดงพิฤติ�กรรมูข้�อมู�ลท��มู�ค'�แติกติ'�งก!นำในำแติ'ล'ะติ!วแปัร

ก�รท��เห็มู�องข้�อมู�ล - 57 - ซื้อฟติ&แวร&ว�ก��

เอก้สัาร์อ�างอ+ง1. M. Kantardzic. Data Mining Concepts, Models,

Methods, and Algorithms. Wiley-InterScience, ISBN: 0-471-22852-4, 2001.

2. E.R. Tufte,The Visual Display Of Quantitative Information, Graphic,Press,Chesire,Conn.,1983.

3. R. Latham, The Dictionary of Computer Graphic and Virtual Reality, 2nd ed.,Springer-Verlag,New York, 1995.

4. C.E.Loeffler and T.Anderson(Eds.),The Virtual Reality Casebook,Van Nostrand Reinhold,New York,1994.

5. B.Becker,Research Report: Volume rendering for relational data, in Proceedings information Visualization, John Dill and Nahum Gershonn(Eds.), IEEE-CS Press, Los Alimitos, CA, 124, pp.87-90,1997.

6. H.Chernoof,The use of faces to represent points in k-dimensional space graphically, Journal of the American Statistical Association,68, pp. 361-368, 1973

ก�รท��เห็มู�องข้�อมู�ล - 58 - ซื้อฟติ&แวร&ว�ก��