O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression...

12
การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22 6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร O-E&T049 หนา 1-12 เปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอร ระหวางการวิเคราะหการจําแนกแบบพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุA Comparison of Performance Prediction in The Computer Professional Groups between Multiple Discriminant Analysis and Multinomial Logistic Regression Analysis ณัฐภัทร แกวรัตนภัทร (Nutthapat Kaewrattanapat) 1 และ สมชาย ปราการเจริญ (Somchai Prakancharoen) 2 บทคัดยอ งานวิจัยนี้มีวัตถุประสงคเพื่อสรางสมการพยากรณและเปรียบเทียบประสิทธิภาพการทํานาย ความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอรดวยวิธีการวิเคราะหทางสถิติ 2 ลักษณะ คือ การ วิเคราะหการจําแนกแบบพหุ (Multiple Discriminant Analysis: MDA) และ การวิเคราะหความ ถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic Regression Analysis: MLR) เพื่อพยากรณ ประเภทงานในสายงานวิชาชีพคอมพิวเตอร 3 สายงาน และใชขอมูลแบบสอบถามเชิงจิตวิทยา ตาม แนวทางของ จอหน แอล ฮอลแลนด (John L. Holland) 3 เพื่อวัดความถนัด 3 ดาน คือ ดานขอมูล (Data) ดานบุคคล (Person) และดานเครื่องมือ (Tool) โดยนําไปทดสอบกับผูที่ทํางานในสายงาน คอมพิวเตอร จํานวน 89 คน ซึ่งผลการวิเคราะหพบวาการวิเคราะหทางสถิติทั้ง 2 ลักษณะกับกลุอาชีพทั้ง 3 สายงาน มีคาความแมนยําสรุปรวมเทากัน คือ 66.7% และ ผลการวิเคราะหทางสถิติทั้ง 2 ลักษณะกับกลุมอาชีพโปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร มีคาความแมนยําสรุปรวมเทากัน คือ 93.1% ซึ่งเหตุผลที่ไมนํากลุมนักวิเคราะหระบบมาวิเคราะหเนื่องจากมีความคาบเกี่ยวในทักษะสูง คําสําคัญ: การพยากรณ, วิชาชีพคอมพิวเตอร, การวิเคราะหขอมูลหลายตัวแปร , การวิเคราะห การจําแนกแบบพหุ และ การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุ1 สาขาวิชาการจัดการสารสนเทศ ภาควิชาสังคมศาสตร คณะมนุษยศาสตรและสังคมศาสตร มหาวิทยาลัยราชภัฏสวนสุนันทา 2 ภาควิชาวิทยาการคอมพิวเตอรและสารสนเทศ คณะวิทยาศาสตรประยุกต มหาวิทยาลัยเทคโนโลยีพระจอมเกลาพระนครเหนือ 3 จอหน แอล ฮอลแลนด (John L. Holland), http://en.wikipedia.org/wiki/John_L._Holland

Transcript of O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression...

Page 1: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 1-12

เปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอร ระหวางการวิเคราะหการจําแนกแบบพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม

A Comparison of Performance Prediction in The Computer Professional Groups between Multiple Discriminant Analysis and Multinomial Logistic Regression Analysis

ณัฐภัทร แกวรัตนภัทร (Nutthapat Kaewrattanapat)1 และ

สมชาย ปราการเจริญ (Somchai Prakancharoen)2

บทคัดยอ

งานวิจัยนี้มีวัตถุประสงคเพ่ือสรางสมการพยากรณและเปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอรดวยวิธีการวิเคราะหทางสถิติ 2 ลักษณะ คือ การวิเคราะหการจําแนกแบบพหุ (Multiple Discriminant Analysis: MDA) และ การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic Regression Analysis: MLR) เพ่ือพยากรณประเภทงานในสายงานวิชาชีพคอมพิวเตอร 3 สายงาน และใชขอมูลแบบสอบถามเชิงจิตวิทยา ตามแนวทางของ จอหน แอล ฮอลแลนด (John L. Holland)3 เพ่ือวัดความถนัด 3 ดาน คือ ดานขอมูล (Data) ดานบุคคล (Person) และดานเครื่องมือ (Tool) โดยนําไปทดสอบกับผูท่ีทํางานในสายงานคอมพิวเตอร จํานวน 89 คน ซ่ึงผลการวิเคราะหพบวาการวิเคราะหทางสถิติท้ัง 2 ลักษณะกับกลุมอาชีพท้ัง 3 สายงาน มีคาความแมนยําสรุปรวมเทากัน คือ 66.7% และ ผลการวิเคราะหทางสถิติท้ัง 2 ลักษณะกับกลุมอาชีพโปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร มีคาความแมนยําสรุปรวมเทากัน คือ 93.1% ซ่ึงเหตุผลท่ีไมนํากลุมนักวิเคราะหระบบมาวิเคราะหเนื่องจากมีความคาบเกี่ยวในทักษะสูง

คําสําคัญ: การพยากรณ, วิชาชีพคอมพิวเตอร, การวิเคราะหขอมูลหลายตัวแปร, การวิเคราะห การจําแนกแบบพหุ และ การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม 1 สาขาวิชาการจัดการสารสนเทศ ภาควิชาสังคมศาสตร คณะมนุษยศาสตรและสังคมศาสตร มหาวิทยาลัยราชภัฏสวนสุนันทา 2 ภาควิชาวิทยาการคอมพิวเตอรและสารสนเทศ คณะวิทยาศาสตรประยุกต มหาวิทยาลัยเทคโนโลยีพระจอมเกลาพระนครเหนือ 3 จอหน แอล ฮอลแลนด (John L. Holland), http://en.wikipedia.org/wiki/John_L._Holland

Page 2: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 2-12 ABSTRACT

The purpose of this study was to create the equation and compare the accuracy of predicting to be the computer profession. There are two statistic analyses in this article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article for classifying 3 aspects: data, person, and tool. 89 persons, who work in computer field, participated in the study. The result of this study showed that the overall accuracy is 66.7%. Furthermore, programmer and IT Support has the overall accuracy is 93.1% and System Analyst is not used in this study because it is a high overlapping. Key Words: Prediction, Computer Profession, Multivariate Analysis, Multiple Discriminant Analysis, and Multinomial Logistic Regression Analysis.

บทนํา ปจจุบันมีจํานวนผูวางงานและผูมีงานทําจํานวนไมนอยท่ีใชอินเทอรเน็ตสรรหางานท่ีตรงตอ

ความตองการ และระดับการศึกษาของตน รวมถึงนักบริหารงานบุคคลขององคกรตางๆ ไดใชส่ือออนไลนนี้ เพ่ือเปนส่ือกลางเช่ือมโยงไปยังกลุมผูสรรหางาน ซ่ึงพฤติกรรมแรงงานในปจจุบันมีการเลือกงานมากขึ้น และเว็บไซตหางานตางๆ พยายามแนะนําขอมูลงานใหแกผูใช จากการสังเกตหนาเว็บเพจและอีเมลลท่ีมีการจัดสงขอมูลงานใหแกผูสมัครงานนั้น เปนเพียงขอมูลงานท่ีถูกแนะนําโดยการนําวุฒิการศึกษา สาขาท่ีสําเร็จการศึกษา และการเลือกประเภทงานท่ีสนใจมาใชในการสืบคนงานในฐานขอมูลเพ่ือแนะนํามายังผูสมัครเทานั้น โดยประเภทในสายงานทางดานคอมพิวเตอรนั้นมีความแตกตางกัน เชน โปรแกรมเมอร (Programmer) นักวิเคราะหระบบ (System Analyst) และ ผูใหบริการดูแลระบบคอมพิวเตอร (IT Support/Help Desk) เปนตน แตการแนะนําขอมูลงานใหแกผูสมัครไมมีการคํานึงถึงโครงสรางพ้ืนฐานความถนัดในอาชีพเชิงจิตวิทยา (Basic Vocational

Orientation) ซ่ึงอาจลดโอกาสการไดงานท่ีตรงตอความสามารถและพ้ืนฐานความถนัดในอาชีพเชิงจิตวิทยาได

ดังนั้น วัตถุประสงคของงานวิจัยนี้ คือ การสรางสมการพยากรณและเปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอรจากวิธีการวิเคราะหทางสถิติ 2 ลักษณะ คือ การวิเคราะหการจําแนกแบบพหุ (Multiple Discriminant Analysis: MDA) และ การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic Regression

Analysis: MLR) สําหรับพยากรณประเภทงานในสายงานวิชาชีพคอมพิวเตอร 3 สายงาน และใชขอมูลแบบสอบถามเชิงจิตวิทยา ตามแนวทางของ จอหน แอล ฮอลแลนด (John L. Holland) ซ่ึงเปนแบบสอบถามจํานวน 18 ขอ เพ่ือวัดความถนัด 3 ดาน คือ ดานขอมูล (Data) ดานบุคคล (Person) และดานเครื่องมือ (Tool) โดยนําไปทดสอบกับผูท่ีทํางานในสายงานคอมพิวเตอรประเภทตางๆ จํานวน 89 คน ซ่ึงผลของการวิจัยนี้จะสามารถนําไปใชประโยชนในการพัฒนาระบบแนะนําขอมูลงาน (Career Path Recommended System) หรือการใชเปนเครื่องมือหนึ่งในการ

Page 3: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 3-12

คัดเลือกผูสมัครงานได รวมถึงเพ่ิมโอกาสในการสมัครงานท่ีตรงตอความสามารถและพ้ืนฐานความถนัดในอาชีพเชิงจิตวิทยาไดมากขึ้น

การตรวจเอกสาร

การวิจัยเพ่ือเปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอร ระหวางการวิเคราะหการจําแนกแบบพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม เพ่ือใหไดขอมูลสําหรับนํามาวิเคราะหการจําแนกดวยตัวแบบทางสถิติ ผูวิจัยจึงไดทําการศึกษาและคนควาขอมูลแนวทางการวิจัย รวมถึงทฤษฎีและเทคโนโลยีท่ีเกี่ยวของกับการวิจัย ดังรายละเอียดตอไปนี ้

1. การวิเคราะหการจําแนกแบบพหุ (Multiple Discriminant Analysis: MDA) เปนเทคนิคการวิเคราะหทางสถิติท่ีใชในการจัดกลุมขอมูล โดยมีการนําตัวแปรอิสระ (Independent

Variable) หลายตัวในมาตรวัดอันตรภาคหรืออัตราสวนไปวิเคราะหรูปแบบเพ่ือจัดกลุมหรือทํานายตัวแปรตาม (Dependent Variable) หรืออาจเรียกวาตัวแปลกลุม (Categorical Variable) หรือคลาสลาเบล (Class Label) ก็ได การวิเคราะหการจําแนกมี 2 ลักษณะ คือ การจําแนกสองกลุม (Two-Group Dicriminant Analysis) และการวิเคราะหการจําแนกแบบพหุ หรือมากกวา 2 กลุม (Multiple Discriminant Analysis: MDA) (กัลยา, 2552)

ในการวิเคราะหการจําแนกแบบพหุ ผูวิเคราะหจําเปนตองทราบจํานวนกลุมกอนและตองทราบวาขอมูลของตัวแปรอิสระแตละชุดนั้นอางอิงถึงกลุมใด เม่ือทําการวิเคราะหแลวจะทําใหทราบสมการแสดงความสัมพันธของตัวแปร ซ่ึงสามารถนํามาใชในการคํานวณพยากรณเพ่ือการจัดกลุมไดโดยสมการจะอยูในรูปแบบเชิงเสน ดังแสดงในสมการท่ี 1 (Garson, 2008) 푌 = 푎 + 푏 푋 + 푏 푋 + … + 푏 푋

푌 = 푎 + 푏 푋 + 푏 푋 + … + 푏 푋 . . 푌 = 푎 + 푏 푋 + 푏 푋 + … + 푏 푋 (1)

โดยท่ี 푌 คือ ตัวแปรตาม หรือตัวแปรกลุม หรือคาคะแนนจําแนก (Dicriminant Score)

푏 คือ สัมประสิทธ์ิของตัวแปรอิสระ หรือคาน้ําหนักของตัวแปรอิสระ

푋 คือ ตัวแปรอิสระ

a คือ คาคงท่ี (Constant)

푝 คือ จํานวนของตัวแปรอิสระ

푖 คือ จํานวนของตัวแปรตาม หรือตัวแปรกลุม

Page 4: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 4-12

2. การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic Regression Analysis: MLR) เปนวิธีการทางสถิติท่ีสามารถแสดงความสัมพันธของตัวแปรอิสระและตัวแปรตามได และยังทราบวาตัวแปรอิสระใดท่ีมีอิทธิพลหรือมีผลกระทบตอตวัแปรตาม ซ่ึงการวิเคราะหความถดถอยโลจิสติกท่ีตองการวิเคราะหตัวแปรตามจํานวน 2 กลุม จะเรียกวา การวิเคราะหความถดถอยโลจิสติก 2 กลุม (Binary Logistic Regression Analysis) หากมีการวิเคราะหตัวแปรตามท่ีมากกวา 2 กลุม จะเรียกวา การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic Regression Analysis: MLR) (กัลยา, 2552) โดยท่ีการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุมจะใชคาของความนาจะเปนในการจําแนก ดังแสดงในสมการท่ี 2 และ 3 (Garson, 2008)

푌 = ∑

(2)

푢 = 훽 + 훽 푋 + 훽 푋 + ⋯ 훽 푋 (3)

โดยท่ี 푌 คือ คาความนาจะเปนของการเกิดเหตุการณ 푌

훽 คือ สัมประสิทธ์ิความถดถอยโลจิสติก

푒 คือ Exponential Function 푖 คือ ลําดับท่ีของตัวแปรตาม 푗 คือ จํานวนตัวแปรตามท้ังหมด

3. การตรวจสอบความแมนยํา (Accuracy) เปนวิธีการท่ีใชในการเปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอร ระหวางการวิเคราะหการจําแนกแบบพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม ดังแสดงในสมการท่ี 4 (ปฐมาภรณ, 2554) 퐴푐푐푢푟푎푐푦 = (4)

โดยท่ี 퐴푐푐푢푟푎푐푦 คือ คาความแมยํา 푇푃 คือ คาทํานายถูกทางบวก 푇푁 คือ คาทํานายถูกทางลบ 퐹푃 คือ คาทํานายผิดทางบวก 퐹푁 คือ คาทํานายผิดทางลบ

4. เครื่องมือทดสอบวัดพ้ืนฐานความถนัดในสายงานวิชาชีพคอมพิวเตอรซ่ึงเปนแบบทดสอบมีลักษณะเปนขอสอบถาม จํานวน 18 ขอ สามารถแปลผลออกมาเปนความถนัดทาง

Page 5: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 5-12

อาชีพเชิงจิตวิทยาได โดยมีการใหคะแนนท้ังหมด 3 ดาน คือ ความถนัดดานขอมูล (Data) ความถนัดดานบุคคล (Personal) และความถนัดดานเครื่องมือ (Tool)

1. คุณทํารายงานสงอาจารย 1.1 คนควาขอมูลจากหองสมุด 1.2 ทํารวมกับเพื่อน ๆ 1.3 ทําดวยตนเอง เชน พิมพดีด หรือ พิมพดวยคอมพิวเตอร

ช หมายถึงชอบ/ตองการ (2 คะแนน) ค หมายถึงคิดดูกอน/ไมแนใจ (1 คะแนน) ม หมายถึงไมชอบ/ไมตองการ (0 คะแนน)

ขอ ความถนัดแบบ P ความถนัดแบบ D ความถนัดแบบ T 1 1.1 1.2 1.3 2 2.1 2.2 2.3 3 3.1 3.2 3.3 คะแนนรวมแตละแบบ (ในแนวตั้ง) ตองไมมากกวา 36 คะแนน คะแนนรวมทั้งหมด (ทั้ง3แบบ) ตองเทากับ 54 คะแนน คะแนนรวมแตละขอ (ในแนวนอน) ตองเทากับ 3 คะแนน)

ภาพที่ 1 แสดงตัวอยางของขอคําถามและกระดาษคําตอบสําหรับเก็บคะแนน

วิธีดําเนินการวิจัย วิธีการวิจัยเพ่ือเปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพ

คอมพิวเตอร ระหวางการวิเคราะหการจําแนกแบบพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุมมีขั้นตอนการนําเดินงานดังนี้

1. เตรียมเครื่องมือทดสอบวัดพ้ืนฐานความถนัดในสายงานวิชาชีพคอมพิวเตอร 2. การทดสอบกลุมตัวอยางและเก็บคะแนน โดยการนําแบบทดสอบไปสอบถามและเก็บ

คะแนนจากกลุมตัวอยางจํานวน 99 ราย ซ่ึงท้ังหมดทํางานอยูในสายงานคอมพิวเตอร และหลังจากการสอบถามไดรับแบบสอบถามคืน จํานวน 87 ราย จําแนกเปนสายงานโปรแกรมเมอร 29 ราย นักวิเคราะหระบบ 29 ราย และ ผูใหบริการดูแลระบบคอมพิวเตอร 29 ราย

3. การเตรียมขอมูลเพ่ือการประมวลผล โดยในการวิเคราะหนี้มีการใชขอมูลจากตัวแปรจํานวน 4 ตัวแปร จําแนกเปนตัวแปรอิสระ 3 ตัวแปร และตัวแปรตาม 1 ตัวแปร ดังตารางท่ี 1

Page 6: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 6-12

ตารางที ่1 แสดงตัวแปรท่ีใชในการวิจัย

ลําดับ ช่ือตัวแปร ชนิดของขอมูล ประเภทของตัวแปร คําอธิบาย

1 Data Numeric Scale Independent Variable คะแนนความสามารถทางดานขอมูล 2 Person Numeric Scale Independent Variable คะแนนความสามารถทางดานบุคคล 3 Tool Numeric Scale Independent Variable คะแนนความสามารถทางดานเคร่ืองมือ 4 Position Nominal Scale Dependent Variable

(Class Label) ตําแหนงของสายงานคอมพิวเตอร โดยที่ 1 แทน Programmer, 2 แทน System Analyst และ 3 แทน IT Support

4. การทดลองวิเคราะหขอมูลและปรับวิธีการดวยการวิเคราะหการจําแนกแบบพหุ โดยแบงการทดสอบ 2 ลักษณะ คือ

4.1 ลักษณะท่ี 1 ทดสอบทุกสายวิชาชีพงาน (โปรแกรมเมอร นักวิเคราะหระบบ และ

ผูใหบริการดูแลระบบคอมพิวเตอร) และสังเกตผล หากผลท่ีทําทายมีความคลาดเคล่ือนมาก หรือมีความคาบเกี่ยวในสายวิชาชีพ อาจทดสอบในลักษณะท่ี 2 เพ่ือสังเกตผล

4.2 ลักษณะท่ี 2 ทดสอบเฉพาะสายงานท่ีไมมีความคาบเกี่ยวกันมาก และสังเกตผล เพ่ือใหไดโมเดลท่ีใชในการพยากรณอีกรูปแบบ

5. การทดลองวิเคราะหขอมูลและปรับวิธีดวยการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม โดยแบงขั้นตอนการทดสอบ 2 ลักษณะ เชนเดียวกันกับขั้นตอนท่ี 4 ดังท่ีกลาวไปแลว

6. เปรียบเทียบผลการทดลองและสรุปผล

ผลของการวิจัย ผลการทดลองของการเปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงาน

วิชาชีพคอมพิวเตอร ระหวางการวิเคราะหการจําแนกแบบพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม สามารถสรุปไดดังนี ้

1. ผลของการวิเคราะหการจําแนกเชิงพหุ (Multiple Discriminant Analysis: MDA) 1.1 ผลของการวิเคราะหการจําแนกเชิงพหุ (Multiple Discriminant Analysis: MDA)

โดยใชวิธีการ Enter Independent Together กับท้ัง 3 สายอาชีพงาน มีความถูกตอง 66.7% ซ่ึงสังเกตไดวา ความถูกตองในการทํานายสายวิชาชีพโปรแกรมเมอร เทากับ 89.7% และ ผูดูแลระบบคอมพิวเตอร เทากับ 82.8% สวนนักวิเคราะหระบบมีความถูกตอง เทากับ 27.6% ซ่ึงมีความถูกตองนอยโดยอาจเปนเพราะวาสายวิชาชีพนักวิเคราะหระบบ (System Analyst) จําเปนตองมีทักษะท่ีหลากหลายทําใหเกิดความคาบเกี่ยวในทักษะได โดยผลความแมนยําแสดงในตารางท่ี 2

Page 7: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 7-12

ตารางที ่2 แสดงผลความแมนยําของการวิเคราะหการจําแนกเชิงพหุท้ัง 3 สายอาชีพ

Classification Resultsa

Position

Predicted Group Membership

Total Programmer System Analyst IT Support

% Programmer 89.7 .0 10.3 100.0

System Analyst 24.1 27.6 48.3 100.0

IT Support .0 17.2 82.8 100.0 a. 66.7% of original grouped cases correctly classified.

ตารางที ่3 แสดงคาสัมประสิทธ์ิของฟงกช่ันการจําแนก

Classification Function Coefficients

Programmer System Analyst IT Support

Data Skill 636.575 637.568 635.798

Person Skill 632.106 633.428 631.918

Tool Skill 625.388 626.637 624.980

(Constant) -17058.215 -17122.241 -17033.977

จากตารางท่ี 3 ทําใหทราบโมเดลฟงกช่ันการจําแนกท่ีประกอบไปดวยคาสัมประสิทธ์ิและคาคงท่ี ซ่ึงสามารถนํามาสรางสมการเชิงเสนไดดังนี ้

Programmer = -17058.215 + 636.575(Data Skill) + 632.106(Person Skill) + 625.388(Tool Skill) (5)

System Analyst = -17122.241 + 637.568(Data Skill) + 633.428(Person Skill) + 626.637(Tool Skill)

(6)

IT Support = -17033.977 + 635.798(Data Skill) + 631.918(Person Skill) + 624.980(Tool Skill)

(7) จากสมการเชิงเสนดังกลาว สามารถนํามาใชทํานายผลเพ่ือการจัดกลุมได โดยเม่ือแทนคาตัวแปร Data Skill, Person Skill และ Tool Skill แลว หากสมการใดท่ีไดคาคํานวณมากท่ีสุดจะถือวาขอมูลชุดนั้นถูกจัดอยูในกลุมสายงานอาชีพนั้น

1.2 ผลของการวิเคราะหการจําแนกเชิงพหุ (Multiple Discriminant Analysis: MDA)

โดยใชวิธีการ Enter Independent Together กับ 2 สายอาชีพงาน คือ โปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร โดยมีการตัดสายอาชีพนักวิเคราะหระบบออก เนื่องจากมีความคาบเกี่ยวในทักษะทําใหเกิดความคลาดเคล่ือนสูง ดังนั้นจึงทดลองกับขอมูลเฉพาะ 2 สายอาชีพ โดยใหผลลัพธท่ีมีความถูกตอง 93.1% ซ่ึงสังเกตไดวา ความถูกตองในการทํานายสายวิชาชีพโปรแกรมเมอร เทากับ 89.7%

Page 8: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 8-12

และ ผูดูแลระบบคอมพิวเตอร เทากับ 96.6% ซ่ึงจะมีความถูกตองมากขึ้น แตไดสายงานสําหรับการพยากรณลดลง โดยท่ีอาจนําผลไปใชประโยชนไดสําหรับการพยากรณอาชีพโปรแกรมเมอรและผูดูแลระบบคอมพิวเตอรได โดยผลความแมนยําแสดงในตารางท่ี 4

ตารางที ่4 แสดงผลความแมนยําของการการวิเคราะหการจําแนกเชิงพหุกับอาชีพโปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร

Classification Resultsa

Position

Predicted Group Membership

Total

Programmer IT Support

% Programmer 89.7 10.3 100.0

IT Support 3.4 96.6 100.0 a. 93.1% of original grouped cases correctly classified.

ตารางที่ 5 แสดงคาสัมประสิทธ์ิของฟงกช่ันการจําแนกกับอาชีพโปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร

Classification Function Coefficients

Programmer IT Support

Data Skill 4.597 3.797 Person Skill 2.192 2.339 (Constant) -66.452 -55.206

จากตารางท่ี 5 ทําใหทราบโมเดลฟงกช่ันการจําแนกท่ีประกอบไปดวยคาสัมประสิทธ์ิและคาคงท่ี ซ่ึงสามารถนํามาสรางสมการเชิงเสนไดดังนี ้

Programmer = -66.452 + 4.597(Data Skill) + 2.192(Person Skill) (8) IT Support = -55.206 + 3.797(Data Skill) + 2.339(Person Skill) (9) 2. ผลของการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic

Regression Analysis: MLR) 2.1 การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic Regression

Analysis: MLR) กับอาชีพท้ัง 3 กลุม โดยผลการวิเคราะหแสดงในตารางท่ี 6 และ ตารางท่ี 7

Page 9: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 9-12

ตารางที ่6 แสดงผลการวิเคราะหความแมนยําถดถอยโลจิสติกแบบพหุกลุมท้ัง 3 สายอาชีพ Classification

Observed

Predicted

Programmer System Analyst IT Support Percent Correct

Programmer 26 0 3 89.7%

System Analyst 7 10 12 34.5%

IT Support 0 7 22 75.9%

Overall Percentage 37.9% 19.5% 42.5% 66.7%

ตารางที ่7 แสดงคาสัมประสิทธ์ิของการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม Parameter Estimates

Positiona B Std. Error Wald df Sig. Exp(B)

95% Confidence Interval for Exp(B)

Lower Bound Upper Bound

Programmer Intercept -22.673 8149.919 .000 1 .998

Data .749 150.925 .000 1 .996 2.115 7.212E-129 6.200E128

Person .167 150.924 .000 1 .999 1.182 4.032E-129 3.465E128

Tool .385 150.924 .000 1 .998 1.470 5.013E-129 4.308E128

System Analyst Intercept -323.086 2.634 15050.504 1 .000

Data 6.155 .094 4278.492 1 .000 471.122 391.773 566.541

Person 5.829 .087 4526.351 1 .000 339.953 286.862 402.869

Tool 6.013 .000 . 1 . 408.670 408.670 408.670 a. The reference category is: IT Support.

จากตารางท่ี 7 ทําใหทราบโมเดลฟงกช่ันการจําแนกท่ีประกอบไปดวยคาสัมประสิทธ์ิและคาคงท่ี ซ่ึงสามารถนํามาสรางสมการเชิงเสนไดดังนี ้

IT Support = 0 (10)

Programmer = -22.673 + .749(Data Skill) + .167(Person Skill) + .385(Tool) (11)

System Analyst = -323.086 + 6.155(Data Skill) + 5.829(Person Skill) + 6.013(Tool Skill) (12)

2.2 การวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม (Multinomial Logistic Regression

Analysis: MLR) กับกลุมอาชีพ 2 กลุม (โปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร) โดยผลการวิเคราะหแสดงในตารางท่ี 8 และ ตารางท่ี 9

Page 10: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 10-12

ตารางที ่8 แสดงผลการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุม(MLR) กับอาชีพโปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร

Classification

Observed

Predicted

Programmer IT Support Percent Correct

Programmer 26 3 89.7%

IT Support 1 28 96.6%

Overall Percentage 46.6% 53.4% 93.1%

ตารางที่ 9 แสดงคาสัมประสิทธ์ิของการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุมกับอาชีพโปรแกรมเมอรและผูดูแลระบบคอมพิวเตอร

Parameter Estimates

Positiona B Std.

Error Wald df Sig. Exp(B)

95% Confidence Interval for Exp(B)

Lower Bound Upper Bound

IT Support Intercept 8.381 4.329 3.749 1 .053

Data -.622 .178 12.220 1 .000 .537 .379 .761

Person .129 .106 1.500 1 .221 1.138 .925 1.400

Tool 0b . . 0 . . . . a. The reference category is: Programmer. b. This parameter is set to zero because it is redundant.

จากตารางท่ี 9 ทําใหทราบโมเดลฟงกช่ันการจําแนกท่ีประกอบไปดวยคาสัมประสิทธ์ิและคาคงท่ี โดยท่ีใชเพียงแคตัวแปร Data กับ Person ซ่ึงสามารถนํามาสรางสมการเชิงเสนไดดังนี ้

Programmer = 0 (13)

IT Support = 8.381 + (-.622)(Data Skill)+ (.129)(Person Skill) + (0)(Tool Skill) (14)

3. ผลการเปรียบเทียบประสิทธิภาพการทํานายความเปนสมาชิกกลุมสายงานวิชาชีพคอมพิวเตอร ระหวางการวิเคราะหการจําแนกแบบพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกลุมกับขอมูลท้ัง 3 กลุมอาชีพงาน ดังแสดงในตารางท่ี 10 และผลการวิเคราะหเฉพาะ 2 กลุมอาชีพงาน ดังแสดงในตารางท่ี 11

Page 11: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 11-12

ตารางที่ 10 แสดงผลความแมนยําของการวิเคราะหการจําแนกเชิงพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุกับขอมูลท้ัง 3 กลุมอาชีพงาน มีความแมนยําโดยรวมเทากัน คือ 66.7%

Position Programmer System Analyst IT Support Total Statistic MDA MLR MDA MLR MDA MLR

Programmer % 89.7% 89.7% 0% 0% 10.3% 10.3% 100% Count 26 26 0 0 3 3 29

System Analyst % 24.1% 24.1% 27.6% 34.5%* 48.3%* 41.1% 100% Count 7 7 8 10** 14** 12 29

IT Support % 0% 0% 17.2% 24.1%* 82.8%* 75.9% 100% Count 0 0 5 7** 24** 22 29

ตารางที ่11 แสดงผลความแมนยําการวิเคราะหการจําแนกเชิงพหุ และการวิเคราะหความถดถอยโลจิสติกแบบพหุ กับขอมูลเฉพาะสายงานโปรแกรมเมอรและสายงานผูดูแลระบบคอมพิวเตอรเทานั้น มีความแมนยําเทากัน คือ 93.1%

Position Programmer IT Support Total Statistic MDA MLR MDA MLR Programmer % 89.7% 89.7% 10.3% 10.3% 100%

Count 26 26 3 3 29 IT Support % 3.4% 3.4% 96.6% 96.6% 100%

Count 1 1 28 28 29

บทสรุป วิจารณ และขอเสนอแนะ 1. การวิเคราะหเพ่ือพยากรณกลุมในสายงานวิชาชีพคอมพิวเตอรนี้ มีความแมนยําท่ี 66.7%

ซ่ึงถือวามีความแมนยําไมสูง อาจเปนเพราะสายงานท้ัง 3 สายวิชานั้น มีความเกี่ยวของกันสูง และอยูในสายวิชาชีพคอมพิวเตอรเชนเดียวกัน ดังนั้นทักษะแตละดานอาจคาบเกี่ยวกันมาก จึงยากท่ีจะจําแนกกลุมไดแมนยํา

2. ในการพยากรณจําเปนตองมีการเฝาระวัง หรือ ตองมีการเก็บขอมูลและวิเคราะหผลอยูเสมอ เนื่องจาก ยุคสมัย เครื่องมือและวิธีการของศาสตรคอมพิวเตอรมีการเปล่ียนแปลงไปอยางรวดเร็ว อาจทําใหเกิดการปรับเปล่ียนดานพฤติกรรมได ซ่ึงอาจสงผลตอความแมนยําของการพยากรณ โดยอาจพัฒนาระบบท่ีมีการแลกเปล่ียนขอมูลดวยเทคโนโลยีเว็บเซอรวิส (Web Services Technology) จากผูเช่ียวชาญในสายงานเพ่ือความเปนอัตโนมัติในการพยากรณ

3. บางกรณีอาจนําประเภทงานท่ีถูกพยากรณซ่ึงมีคาความนาจะเปนในอันดับท่ีสอง มาใชในการพิจารณาแนะนําขอมูลงานประกอบกับอันดับแรกดวยก็ได เนื่องจากเพ่ิมความหลากหลายของสายงานท่ีตองการแนะนํา

4. ฝายทรัพยากรมนุษยอาจใชแนวคิดนี้ไปวิเคราะหเพ่ือจัดกลุมพนักงานและหากพนักงานคนใดมีจิตวิทยาในความถนัดเชิงอาชีพนอยกวาท่ีควรจะเปน อาจมีการฝกอบรมเพ่ิมเติมได

Page 12: O-E&T049 · article: Multiple Discriminant Analysis: MDA and Multinomial Logistic Regression Analysis: MLR. The psychology questionnaire by John L. Holland is used in this article

การประชุมเสนอผลงานวิจัยระดับบัณฑิตศึกษาแหงชาติ ครั้งที่ 22

6-7 ตุลาคม 2554 บัณฑิตวิทยาลัย มหาวิทยาลัยเกษตรศาสตร

O-E&T049 หนา 12-12

เอกสารอางอิง

กัลยา วานิชยบัญชา. 2552. การวิเคราะหขอมูลหลายตัวแปร. ธรรมสาร, กรุงเทพฯ.

คอดารียะห เสกเมธี. 2553. การวิเคราะหการจําแนกกลุม Discriminant Analysis. แหลงท่ีมา: http://www.saruthipong.com/port/document/299-705/299-705-6.pdf, 10 มิถุนายน 2554.

ปฐมาภรณ เภาวพัน และสมชาย ปราการเจริญ. 2554. การจําแนกประเภทของเห็ดท่ีกินไดและเห็ดท่ีมี พิษโดยวิธีการวิเคราะหความถดถอยโลจิสติก. การประชุมวิชาการมหาวิทยาลัยเกษตรศาสตร วิทยาเขตกําแพงแสน ครั้งท่ี 7.

สุทธิมา ชํานาญเวช. 2551. การวิเคราะหเชิงปริมาณเพ่ือการจัดการและการตัดสินใจ. วิทยพัฒน, กรุงเทพฯ.

สมประสงค เสนารัตน. 2553. การจําแนกกลุมดวยเทคนิค Discriminant Analysis. แหลงท่ีมา: http://www.thai-hrd.com/images/column_1278864116/Discriminant%20analysis.pdf, 10 มิถุนายน 2554.

G. David Garson. 2008. Discriminant Function Analysis. Available Source : http://faculty.chass.ncsu.edu/garson/PA765/discrim.htm, June 25, 2011.

G. David Garson. 2008. Logistic Regression. Available Source: http://faculty.chass. ncsu.edu/garson/PA765/logistic.htm, June 25, 2011.