คำ นำ...1 คำ นำ เอกสารประกอบการสอน ว ชาซอฟต แวร ประย กต ง20216 เร อง ไมโครซอฟต
IMPROVEMENT THE EFFICIENCY OF CRUDE OIL...
Transcript of IMPROVEMENT THE EFFICIENCY OF CRUDE OIL...
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 1
การเพมประสทธภาพสาหรบการวเคราะหสถานการณตลาดนามนดบโดย
ประยกตใชเทคนคการสกดขอมลและพจนานกรมขอมล
IMPROVEMENT THE EFFICIENCY OF CRUDE OIL MARKET TREND
ANALYSIS BY USING INFORMATION EXTRACTION AND DATA DICTIONARY
พรพล สทธวจารณ1, อนรทธ ขนธสะอาด2, ยทธนา สมสอน3 และ ณฐชย ตงวจนะโยบาย4
1อาจารย, สาขาการจดการโลจสตกส คณะโลจสตกส มหาวทยาลยบรพา
169 ถนนลงหาดบางแสน ต.แสนสข อ.เมอง จ.ชลบร 20131, [email protected] 2อาจารย, สาขาการคาระหวางประเทศฯ คณะโลจสตกส มหาวทยาลยบรพา
169 ถนนลงหาดบางแสน ต.แสนสข อ.เมอง จ.ชลบร 20131, [email protected] 3กปตน, บรษท ชรอน จากด, 292/12 หมบานวสตาปารค ถ.วภาวดรงสต แขวงตลาดบางเขน
เขตหลกส กทม. 10210, [email protected] 4นกวเคราะหและวางแผน, บรษท ปตท. จากด (มหาชน), 555 ถ.วภาวดรงสต แขวงจตจกร
เขตจตจกร กทม. 10900, [email protected]
Peerapol Sittivijan1, Anirut Kantasa-ard2, Yuthana Somsorn3 and Nuttachai Tangwatjanayobai4
1Instructor, Logistics Management program, Faculty of Logistics Burapha University
169 Long-Haad Bangsaen Rd. Saensuk Subdistrict, Muang District, Choburi 20131,
Thailand, [email protected] 2Instructor, International Trade and Logistics Management program, Faculty of
Logistics Burapha University, 169 Long-Haad Bangsaen Rd. Saensuk Subdistrict,
Muang District, Chonburi 20131, Thailand, [email protected] 3Captain, Cheiron Office, 292/12 Village Vista Park Vibhavadi, Vibhavadi Rangsit Rd,
Talat Bang Khen, Lak Si, Bangkok 10210, [email protected] 4Analyst, PTT Public Company Limited, 555 Vibhavadi Rangsit Rd, Chatuchak,
Bangkok 10900, Thailand, [email protected]
บทคดยอ
งานวจยนนาเสนอการพฒนาระบบฐานขอมลสาหรบรวบรวมและจดเกบขอมลขาวจากสอประเภท
ตางๆ รวมกบการใชเทคนคการสกดขอมล (Information Extraction) และการกาหนดขอบเขต
กลมคาดวยพจนานกรมขอมล (Data Dictionary) ซงประกอบดวยกลมคาทระบแนวโนมการขนลง
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
2 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
ของราคา (Behavior Trend) และกลมคาทระบปจจยทเกยวของกบความรสกผซอขาย
(Sentimental Factor) เพอชวยใหนกวเคราะหตลาดนามนดบสามารถทางานไดรวดเรวขน ทงนใน
สวนของการสกดขอมลและการใชพจนานกรมขอมลสงผลใหการวเคราะหขาวใชเวลาเรวขนและผล
การพยากรณสถานการณราคานามนดบสอดคลองกบราคานามนดบทเกดขนประมาณรอยละ 60
โดยใชกลมตวอยางขาวจานวน 30 วน รวมถงมการนาเสนอสมการแบบจาลองสาหรบแนวทางการ
พยากรณแนวโนมการขนลงของราคานามนดบและประยกตใชผานระบบ Web application ทผวจย
พฒนาขน ซงจากขอมลดงกลาวจะเปนแนวทางในการพฒนาแบบจาลองสาหรบการพยากรณ
แนวโนมราคานามนดบแบบอตโนมตในลาดบตอไป
คาสาคญ: การสกดขอมล, พจนานกรมขอมล, แบบจาลองการพยากรณ, ฐานขอมลเชงโครงสราง,
ตลาดนามนดบ
ABSTRACT
This research demonstrates the data collection system for gathering and collecting a
number of news and articles in crude oil market and presents how to analyze the trend of
crude oil market by using the concept of Information Extraction and Data Dictionary, which
consists of Behavior Trend and Sentimental Factor contexts. The following concepts will
help analyst to predict the oil market trend faster even though the prediction process still
be semi-automated. The precision rate is approximately 60 percent after comparing with
the actual crude oil price due to the sample news in 30 days. In addition, this paper
illustrates the prediction equation model to proof how to predict the trend of oil price and
implement the model via the web application. The researchers believe that both information
extraction and data dictionary could be a prospect direction to improve the prediction model
of crude oil price being more automation.
KEYWORDS: Information Extraction, Data Dictionary, Prediction Model, Textual Database
Structure, Crude Oil Market
1. บทนา
การคาดการณราคานามนดบในตลาดโลกเปนสงทไดรบความสนใจจากภาคธรกจทมการ
ลงทนทเกยวของกบธรกจนามนดบ เชน โรงกลนนามนดบ ธรกจการขนสง เปนตน อยางไรกตาม
การคาดการณราคานามนดบในตลาดโลกคอนขางมความซบซอน เนองจากมปจจยทเกยวของ
หลายดานดวยกน ไดแก
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 3
- ปจจยพนฐาน (Fundamental Factors) ซงเปนปจจยทกาหนดอปสงค (Demand) และ
อปทาน (Supply) ของนามนดบในตลาดโลก ปจจยทมผลตอระดบอปสงคของนามนดบในตลาดโลก
ไดแก การเจรญเตบโตในภาคเศรษฐกจ สภาพภมอากาศทเปลยนแปลงไป ซงจะมผลกระทบตอ
ความตองการใชนามนดบในตลาดโลกโดยตรง ในสวนของปจจยทมผลตอระดบอปทานของ
นามนดบในตลาดโลก ไดแก นโยบายและกาลงการผลตของกลมผผลตนามนดบหลายใหญของโลก
(OPEC) ปรมาณนามนดบสารองของประเทศผบรโภครายสาคญของโลก ระดบการใชพลงงาน
ทดแทน เปนตน
- ปจจยทางความรสกของผซอขายในตลาดนามนดบ (Sentimental Factor) เปนปจจยทไมได
มผลกระทบโดยตรงตอระดบอปสงคและอปทานของนามนดบในตลาดโลกในปจจบน แตมผลตอ
ความรสกและการคาดการณระดบของอปสงคและอปทานของนามนดบในอนาคตของผเกยวของ
หลก และทาใหเกดการเปลยนแปลงของราคานามนดบในปจจบน ตวอยางหนงของปจจยทาง
ความรสกของผซอขายในตลาดนามนดบสามารถแสดงไดตามรปท 1 ซงแสดงใหเหนถงการเพมขน
และลดลงของราคานามนดบในตลาดโลกจากขาวภาวะสงครามในภมภาคตะวนออกกลางและ
เหตการณอนๆ ในระยะเวลา 6 ป (ป 2010-2016) ทผานมา
รปท 1 การเพมขนและลดลงของราคานามนดบในตลาดโลกอางองจากราคา BRENT
และ WTI [1]
- ปจจยทางเทคนค (Technical Factor) เชน สถตรายงานคาเฉลยยอนหลงของราคานามนดบ
และขอมลการซอขายนามนดบลวงหนา (future market) เปนตน
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
4 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
- ปจจยอนๆ (Miscellaneous Factor) เชน อตราแลกเปลยนเงนตรา โดยเฉพาะคาเงน
ดอลลารสหรฐ ซงใชเปนสกลเงนมาตรฐานในการซอขายนามนดบในตลาดโลก
โดยสวนใหญแบบจาลองทใชในการพยากรณราคานามนดบในตลาดโลกจะใชขอมล
ปจจยพนฐานและปจจยทางเทคนคเปนหลกในการคาดการณราคานามนดบในตลาดโลก โดย
แบบจาลองจะใชปจจยเหลานในการคาดการณระดบอปสงคและอปทานในอนาคตของนามนดบใน
ตลาดโลก และพยายามคานวณจดสมดล (Equilibrium) ระหวางระดบของอปสงคและอปทานใน
อนาคต เพอใชในการคาดการณราคานามนดบในอนาคต โดยขอมลปจจยพนฐานและปจจยทาง
เทคนคโดยสวนใหญจะเปนขอมลเชงปรมาณ (Quantitative) และอย ในร ปแบบมาตรฐาน
(Structured Data) ซงทาใหงายตอการนามาใชเปนขอมลนาเขา (Input data) ของแบบจาลอง
สาหรบปจจยทางความรสกของผซอขายในตลาดนามนดบ (Sentimental factors) เปนปจจยท
ยากตอการนามาพจารณารวมในแบบจาลองเนองจากโดยสวนใหญเปนขอมลเชงคณภาพ
(Qualitative) และไมอยในรปแบบมาตรฐานของขอมล (Unstructured Data) จงไมคอยไดมการ
นาเขามารวมใชงานในการพยาการณราคานามนดบในตลาดโลกมากนก อยางไรกตามปจจยทาง
ความรสกของผซอขายในตลาดนามนดบมผลตอระดบราคานามนดบในตลาดโลกเปนอยางมาก
และมกทาใหเกดการเปลยนแปลงในลกษณะทรนแรง (Radical Change) ตอราคานามนดบใน
ตลาดโลกอยบอยครง ทาใหแบบจาลองทใชเฉพาะขอมลเชงปรมาณมความผดพลาดในการ
พยากรณในกรณน ตวอยางในรปท 2 แสดงผลของการพยากรณราคานามนดบในตลาดโลก โดย
ใชแบบจาลอง Stepwise Regression Model ทใชเฉพาะขอมลปจจยพนฐานและปจจยเทคนคซง
เปนขอมลแบบโครงสรางเชงปรมาณเปนตวแปร ในการอธบายราคานามนดบ โดยจะเหนไดวาผล
การพยากรณของบรษทกรณศกษาในเดอนมนาคมและพฤษภาคมมความผดพลาดในลกษณะท
ตรงกนขามกบการลดลงของราคานามนดบในตลาดโลกจรงๆ ซงขอมลในรปท 2 ไดมาจากการ
วเคราะหรวมกบ บรษท ปตท. จากด (มหาชน) และผวจยโดยกระบวนการสมภาษณและเกบ
ขอมลจากรายงานของบรษท
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 5
รปท 2 ความผดพลาดจากการพยากรณราคานามนดบโดยใชแบบจาลอง step-wise
regression
สาหรบงานวจยนจะมงเนนทการพฒนาระบบฐานขอมลทเหมาะสมสาหรบการจดเกบขอมล
ปจจยทางความรสกผานขาวประเภทตางๆ โดยจะมการนาเทคนคการสกดขอมล (Information
Extraction) และพจนานกรมขอมล (Data Dictionary) มาชวยในการสรางแบบจาลองเพอใช
วเคราะหขอมลปจจยทางความรสกของผซอขายในตลาดนามนดบ ซงขอมลดงกลาวอยในรปแบบ
ของขอมลเชงคณภาพ ทงน เทคนคดงกลาวสามารถสกดขอมลปจจยทางความรสกของผซอขายใน
เบองตนสาหรบชวยวเคราะหสถานการณตลาดนามนดบในตลาดโลกได
2. วตถประสงค
1) วเคราะหหาความสมพนธระหวางขอมลปจจยทางความรสกของผซอขายในตลาดนามนดบ
ประเภทตางๆ กบการเปลยนแปลงราคานามนดบในตลาดโลก ไดแก ขาวเกยวกบกลมผคา
นามนดบรายใหญของโลกและปจจยทมผลตอการผลตนามนดบ กลมผใชนามนดบรายใหญของ
โลกและปจจยทมผลตอการผลตนามนดบ และปจจยอนๆ เปนตน
2) พฒนาระบบฐานขอมลทเหมาะสมและมประสทธภาพเพอใชในการดงและเกบรวบรวม
ขอมลเกยวกบปจจยทางความรสกของผซอขายในตลาดนามนดบจากแหลงขาวทเกยวของกบราคา
นามนดบในตลาดโลก เพอนามาวเคราะหราคานามนดบผานเทคนคการสกดขอมลและพจนานกรม
ขอมล
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
6 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
3. กรอบแนวคด
ในการวจยนผวจยไดกาหนดกรอบแนวคดในการวจยไวดงน
รปท 3 รายละเอยดกรอบแนวคดการวจย
สาหรบกรอบแนวคดการวจยนน มองคประกอบทงหมด 3 สวนคอ ปจจยนาเขา กระบวนการ
และผลลพธ สาหรบปจจยนาเขาทมนามาพจารณาในกระบวนการวจยครงนประกอบดวยเนอหา
ขาวทเกยวของกบสถานการณการขนลงของราคานามน ซงเนอหาขาวดงกลาวมาจากแหลงขอมล
ออนไลนและอยในรปของ Text File สาหรบกระบวนการทนามาใชในการวเคราะหคอ การสกด
ขอมลขาว (Information Extraction) และพจนานกรมขอมล (Data Dictionary) ซงหลกการดงกลาว
จะนาเสนอรายละเอยดในหวขอวธการวจย และสวนสดทายคอผลลพธทคาดวาจะไดรบ คอสมการ
และปจจยดานความรสก(Sentimental Factor) สาหรบนาไปใชพยากรณแนวโนมราคานามนดบ
4. ทฤษฎและงานวจยทเกยวของ
จากทไดมการศกษา พบวาองคความรทเกยวของกบแนวทางการพฒนาระบบจดเกบขอมล
ขาวทจะนามาใชเปนฐานขอมลสาหรบสกดและวเคราะหปจจยทางความรสกของผซอขายนามนดบ
มทฤษฎและงานวจยทเกยวของแบงออกเปน 3 สวน คอ แบบจาลองทใชในการพยากรณ
สถานการณนามนดบในปจจบน (Existing Crude Oil Price Prediction Model) เทคนคการสกด
ขอมล (Information Extraction) และ พจนานกรมขอมล (Data Dictionary) โดยมรายละเอยด
ตามทอธบายดานลางดงน
4.1 แบบจาลองดงเดมทใชในการพยากรณสถานการณราคานามนดบ (Existing Crude Oil
Price Prediction Model)
สถานการณราคาของนามนดบปจจบนคอนขางมความผนผวนสงและเปลยนแปลงเรว ทงใน
สวนของขอมลราคานามนดบและขาวสารตางๆ ทเกยวของกบตลาดนามนดบ โดยความทาทาย
ปจจยนาเขา
เนอขาวจาก
แหลงขาวออนไลนท
อยในรป Text file
กระบวนการ
การสกดขอมล
(Information Extraction)
การกรองขาวดวย
พจนานกรมขอมล (Data
Dictionary)
ผลลพธ
ปจจยดานความรสก
สาหรบนาไป
พยากรณแนวโนม
ของราคานามนดบ
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 7
ของการพยากรณราคานามนดบคอ ความผนผวนทสามารถเกดขนไดตลอดเวลา ทงความผนผวน
ของราคานามนดบระยะสนและระยะยาว ทงนไดมงานวจยอยจานวนไมนอยทพฒนาแบบจาลอง
สาหรบการพยากรณราคานามนดบ อาท
Abdullah SN ไดทาการวจยในเรองของการพฒนาแบบจาลองสาหรบการพยากรณราคา
นามนดบ โดยมการนาแบบจาลองแนวคดลาดบชน (Hierarchical Conceptual Model) มาใชในการ
พยากรณขอมลเชงปรมาณ เชน กาลงการผลตนามนดบในกลมประเทศ OPEC และ Non-OPEC,
อตราการใชนามนดบในจนและอนเดย, ระดบนามนดบคงคลงในสหรฐอเมรกา, และปจจยทางดาน
เศรษฐศาสตร นอกจากน งานวจยดงกลาวยงไดพฒนาแบบจาลองสาหรบการพยากรณขอมลเชง
คณภาพดวย อาท การพฒนาแบบจาลองตามหลกการ Rule-Base Expert Model, การนาหลกการ
ของ Fuzzy Grammar Extraction มาใชในการสรางขอกาหนดสาหรบการพยากรณแนวโนมราคา
ซงประเภทของขอมลทนามาใชในการพยากรณจะประกอบดวย เนอหาขาวทเกยวของกบ
สถานการณตลาดนามนดบผาน Google News รวมถงบทความวเคราะหราคานามนดบในสอ
ออนไลนตางๆ โดยสงสาคญทจะทาใหการพยากรณเชงคณภาพมความแมนยามากขน คอการแบง
ประเภทของกลมคา ซงจะใชการนบคาความถของประเภทกลมคาทเกดขนมาเปนปจจยชวดวา
แนวโนมราคานามนดบจะเพมขนหรอลดลง เชน กลมคานาม (Core Term) ทเปนปจจยทางตรง
ของราคานามนดบ (Supply, Oil Price, Demand, Refinery) และกลมคากรยา (Content Category)
ทเปนตวกาหนดแนวโนมการขนลงของราคานามนดบ เปนตน [2] นอกจากนงานวจยดงกลาวยงได
มการพฒนาแบบจาลองสาหรบพยากรณขอมลราคานามนดบแบบผสมระหวางขอมลเชงปรมาณ
และขอมลเชงคณภาพ (Linguistic-Quantitative Hybrid Model) เพอใหเกดความแมนยามากขนใน
การพยากรณราคานามนดบ
4.2 เทคนคการสกดขอมล (Information Extraction)
งานวจยของ Gupta ทไดมการประยกตใชเทคนคเหมองขอความ (Text Mining) กบเนอความ
ประเภทตางๆ ซงหนงในเทคนคทนาสนใจและถกนามาประยกตใชมากทสดคอ เทคนคการสกด
ขอมล (Information Extraction) โดยมหลกการคอ ระบความสมพนธของตวแปรตางๆ อาท บคคล,
สถานท, ชวงเวลาทมความเกยวของกน ผานคาหรอวลในเนอความนนๆ และนาความสมพนธ
ดงกลาวมาสรางเงอนไขในการพยากรณแนวโนม (Pattern Matching) [3] นอกจากนยงมงานของ
Mittermayer ทไดนาเสนอเกยวกบการประยกตใชเทคนค การเตรยมความพรอมกอนประมวลผล
ขอความ(Text Preprocessing) ซงเปนหนงในเทคนคของ การทาเหมองขอความรวมกบขอมลขาว
ในตลาดหน เพอทาการวเคราะหและพยากรณการขนลงของราคาหน โดยประเภทของขาวจะถก
จาแนกออกเปน 3 รปแบบคอ กลมขาวด (Good News) กลมขาวราย (Bad News) และกลมขาวท
ไมมผลตอการขนลงของราคาหน (No Mover) [4] นอกจากนยงมงานวจยบางงานทมการพยากรณ
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
8 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
ขอมลโดยใชทฤษฎแบบผสมผสานระหวางกระบวนการทาเหมองขอมลเชงปรมาณ(Data Mining)
และการทาเหมองขอมลแบบวเคราะหโครงสรางเนอความ (Text Mining) อาท Kloptchenko ได
นาเสนอเกยวกบการวเคราะหสถานการณการเงนโดยใชเทคนคเหมองขอมล (Data Mining)
รวมกนกบเทคนคเหมองขอความ (Text Mining) โดยการวเคราะหสถานการณดานการเงนจะ
พจารณาทงขอมลเชงปรมาณและขอมลเชงคณภาพ ซงเทคนคยอยทนามาใชในการพยากรณคอ
Text Clustering และ Self-Organization Mapping [5] หรองานวจยของ Larsen ทมการนา
หลกการจดกลมขอมล (Clustering Concept) มาใชในการทาเหมองขอมลแบบวเคราะหโครงสราง
เนอความ (Text Mining) โดยวธการทา Cluster จะแบงเปน 2 สวนคอ Feature Extraction จะทา
หนาทในการสกดเนอหาและคาทอยในบทความ และมการใสคานาหนกตามเนอหาทพบ รวมถง
การเลอกวเคราะหเนอหาหรอกลมคาตามคานาหนกจากมากไปนอย, และ Clustering จะหนาทจบ
กลมเนอหาทมคานาหนกใกลเคยงกนมากทสดมาเปนขอมลพยากรณแนวโนม [6] รวมถงหนงสอ
บางเลมทมการนาเสนอเทคนคตางๆทใชในการทาเหมองขอมลแบบวเคราะหโครงสรางเนอความ
(Text Mining) โดยหนงในวธทนยมนามาประยกตใชกบงานวจย คอ เทคนคการสกดกลมคาหรอวล
(Information Extraction) จากบทความ โดยสงสาคญทจะทาใหวธนมประสทธภาพยงขน คอ ผวจย
จะตองดาเนนการสรางความสมพนธระหวางกลมคาใหถกตอง และสามารถแสดงผลลพธไดอยางม
ประสทธภาพ [7]
4.3 พจนานกรมขอมล (Data Dictionary)
ในการพฒนาระบบฐานขอมลสาหรบจดเกบและรวบรวมปจจยทางความรสกของผซอขายนน
จะตองมการสรางพจนานกรมขอมล (Data Dictionary) สาหรบจดเกบคาสาคญและขอบเขตของคา
ทเกยวของกบปจจยทางความรสกของผซอขาย เพอใชเปนขอมลตงตนสาหรบการพฒนา
แบบจาลองพยากรณแนวโนมการขนลงของราคานามนดบสาหรบขอมลเชงคณภาพในอนาคต ทงน
ไดมงานวจยทมการนาเสนอเกยวกบการประยกตใชพจนานกรมขอมล อาท Clifton และ
Thuraisingham ไดนาเสนอขอมลทนาสนใจวา หนงในปจจยทจะทาใหการทาเหมองขอมล
(Data Mining) มความแมนยาในการวเคราะหผลเพมมากขนคอการสรางพจนานกรมขอมลสาหรบ
จดเกบปจจยนาเขา ขอบเขตของตวแปร และผลลพธทคาดวาจะเกดขน ซงหากขอมลทนาเขามา
ไมไดอยในขอบเขตทถกระบไวในพจนานกรมขอมล เหมองขอมลชดนนกจะทาการปฏเสธผลลพธ
หรอแสดงผลลพธเฉพาะขอมลนาเขาทอยในขอบเขตของตวแปรทระบไว [8] หรออกงานวจยของ
Edge ทไดกลาวถงการประยกตใชพจนานกรมขอมลสาหรบจดเกบขอมลอาการของโรคมะเรงใน
ระยะตางๆ เพอใชในการวนจฉยโรคและวางแผนในการรกษาในแตละระยะทเกดขน [9] จาก
งานวจยทง 2 งานเปนตวอยางของการนาพจนานกรมขอมลมาใชในการพยากรณทศทางหรอ
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 9
ผลลพธทจะเกดขนในอนาคตซงสอดคลองกบทศทางของงานวจยชนนทตองการสรางพจนานกรม
ขอมลสาหรบเกบขอบเขตของปจจยนาเขาทเกยวของกบการวเคราะหสถานการณนามนดบ
5. ขอบเขตการวจย
จากการศกษาในงานวจยและบทความทเกยวของกบการพยากรณสถานการณราคานามนดบ
รวมถงเทคนคทใชในการวเคราะหขอมลทงขอมลเชงปรมาณและขอมลเชงคณภาพนน พบวา
งานวจยสวนใหญจะทาการวเคราะหขอมลในระยะยาว เชน การพยากรณขอมลลวงหนารายไตร
มาสหรอรายป [10] หรอ การสรางขอกาหนดในการพยากรณขอมลแบบตายตว (Fixed Rule-Base
Expert System) [11] ดงนน งานวจยนจะมการนาหลกการจากงานวจยขางตนมาพฒนาตอยอด
โดยมรายละเอยดของขอบเขตการวจยดงน
5.1 ผวจยดาเนนการแบงกลมของขอมลปจจยทางความรสกของผซอขายในตลาดนามนดบ
ออกไดเปน 3 ประเภทในเบองตน ไดแก กลมขาวด (Positive News) กลมขาวราย (Negative
News) และกลมทไมมการเคลอนไหว (No Movers) โดยผวจยไดทาการสมภาษณเจาหนาท/
นกวเคราะหของบรษท ปตท. จากด (มหาชน) และผเชยวชาญทมประสบการณดานการซอขาย
นามนดบในตลาดโลก เพอใหสามารถสรปปจจยทางความรสกของผซอขายในตลาดนามนดบและ
ความสมพนธของปจจยเหลานทมผลตอการเพมขนและลดลงของราคานามนดบในตลาดโลก
5.2 ผวจยดาเนนการพฒนาระบบจดเกบขอมลขาวโดยใชเทคนคการสกดขอมล (Information
Extraction) และพจนานกรมขอมล (Data Dictionary) ซงพฒนาในรปแบบ Web application โดย
ใชภาษา PHP และ R มาใชในการนาเขาและวเคราะหขอมลขาว และรองรบการสรางแบบจาลอง
สาหรบการพยากรณขอมลราคานามนดบในระยะสน เชน การพยากรณราคานามนดบรายวนและ
รายสปดาห ซงแบบจาลองทใชในการพยากรณจะใชตวแบบการตดสนใจแบบแผนภมตนไม
(Decision Tree Classification Model) ซงเปนหนงในแบบจาลองสาหรบการวเคราะหขอมลของ
Supervised Machine Learning และขอมลขาวจะในอยในรปแบบของขอความแจงเตอน (Pop-up
Message) จากแหลงทมาของขาวตงแต 2 แหลงขาวขนไป
5.3 หลงจากนนผวจยดาเนนการสรางเงอนไขในการกรองคา (Text Filtering) ของคาทระบ
ในพจนานกรมขอมลใหมความยดหยนมากขน เพอใหการพยากรณแนวโนมราคานามนดบเกด
ความแมนยาและถกตองมากทสด
6. วธการวจย
ผวจยไดรวมกบเจาหนาทบรษท ปตท. จากด (มหาชน) ตงแตเดอนพฤษภาคม พ.ศ. 2560
เพอพฒนาแบบจาลองทใชขอมลปจจยความรสกแบบ Unstructured โดยในขอบเขตของงานวจยน
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
10 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
จะเนนในเรองของการพฒนาระบบฐานขอมลเพอจดเกบขาว ตลอดจนการใชเทคนคสกดขอมลและ
พจนานกรมขอมลในการสกดเอาปจจยทเกยวของกบความรสกผซอขายมาเปนขอมลตงตน เพอจะ
แสดงใหเหนถงความเปนไปไดในการสรางแบบจาลองเพอใชในการคาดการณราคานามนดบใน
ตลาดโลกโดยใชขอมลปจจยความรสกผซอขาย โดยมรายละเอยดดงน
6.1 การสกดขอมลและพฒนาระบบสาหรบจดเกบขาว (Information Extraction and
Textual Structured Platform)
สาหรบงานในสวนนผวจยไดทาการพฒนาในเบองตนถงอลกอรทมเพอใชในการสกด ขอมล
จากขาวทเกยวกบราคานามนดบในตลาดโลกทอย ในรปแบบของขอความและประโยค
(Unstructured Data) ใหมาอยในรปของขอมลเชงโครงสราง (Textual Structured Databases) ซง
การสกดขอมลไดมการใชภาษา R ผานโปรแกรม RStudio ในการพฒนาเทคนคสวนน โดยม
รายละเอยดตามทแสดงในดานลางตามรปท 4 และ 5 รวมถงแผนผงของการสกดขอมล
(Information Extraction Flow Chart) ดงรปท 6 ซงแผนผงดงกลาวจะอธบายแนวทางการสกด
ขอมล โดยเรมจากการนาเขาขอมลในรปแบบ Corpus จากนนจะมการตรวจสอบรปแบบของขอมล
ทนาเขามาหรอทเรยกวา Data Cleaning อาท การเปลยนรปแบบตวอกษรใหมขนาดเลกทงหมด
การลบเครองหมายและชองวางระหวางคาออกไป รวมถงการแปลงคาๆนนใหอยในรปของรากศพท
(Root Word) จากนนจะมการแปลงขอมล Corpus ใหอยในรปของโครงสรางขอมลเชงเมทรกซ และ
คอยดาเนนการวเคราะหขอมลตามแนวคดเหมองขอความ (Text Mining) ในลาดบถดไป
รปท 4 ขนตอนการสกดขอมลและรปแบบขอมลเชงโครงสราง
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 11
รปท 5 ขาวทถกแปลงใหอยในรปของขอมลเชงโครงสราง
Import Document as corpus
Clean the corpus
- Lower alphabet
- Remove number
- Remove Punctuation
- Remove ending word
- Strip white space
- Stem document
Document term
Matrix
Transform the corpus to
document-term matrix
รปท 6 Information Extraction Flow Chart
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
12 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
นอกจากน ทางผวจยไดดาเนนการพฒนาระบบฐานขอมลสาหรบการจดเกบขาว (User
Interface) โดยฐานขอมลดงกลาวจะถกแบงการใชงานออกเปน 2 สวนคอ สวนทนาเขาขอมลขาว
(Back-End Interface) และสวนทแสดงผลลพธ (Front-End Interface) ตามทแสดงในรปท 7 ถงรป
ท 10
รปท 7 หนาจอสาหรบ Login เขาระบบ
รปท 8 หนาจอสาหรบนาเขาขอมลขาว
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 13
รปท 9 หนาจอแสดงผลการนาเขาขอมลขาว
รปท 10 หนาจอแสดงผลลพธ feed ขาว
จากระบบดงกลาว ปจจบนผใชงานสามารถนาเขาขอมลขาวไดเพยง 1 รปแบบ คอ การนาเขา
ขาวในรปแบบ Text File ทงนผใชงานจะตองดาเนนการเลอกวนทในการนาเขาขาวและประเภท
การนาเขา จากนนผใชงานทาการกดป มบนทกทมมขวาลาง ระบบกจะดาเนนการบนทกขอมลขาว
ทเรานาเขาเรยบรอย
6.2 การสรางพจนานกรมขอมล (Data Dictionary Platform)
นอกจากน ทางผวจยไดดาเนนการพฒนาในสวนของพจนานกรมขอมลเพอจดเกบและระบ
กลมคา รวมถงความสมพนธระหวางกลมคาทจะใชในการพยากรณสถานการณราคานามนดบ โดย
พจนานกรมขอมลจะถกแบงรปแบบการจาแนกขอมลออกเปน 2 กลม ประกอบดวย กลมคาทระบ
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
14 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
แนวโนมการขนลงของราคา (Behavior Trend) และกลมคาทระบปจจยทเกยวของกบความรสกผ
ซอขาย (Sentimental Factor) สาหรบกลมแรกนนจะแบงแนวโนมการขนลงของราคานามนดบ
ออกเปน 3 กลมยอย อาท กลมแนวโนมราคาเพมขน (Increasing), กลมแนวโนมราคาลดลง
(Decreasing) และกลมทไมมการเปลยนแปลงราคา (Neutral) นอกจากนหากตองการทจะเพมคา
นาหนกของขอมลเชนราคาเพมขนสงหรอลดลงเลกนอย กจะมการนากลมคาทอยใน Placing มา
วเคราะหรวมกบแนวโนมตามกลมตางๆ ดวย โดยในแตละกลมจะมการระบกลมคาทเกยวของดง
แสดงในรปท 11
รปท 11 กลมคาทระบแนวโนมการขนลงของราคา (Behavior Trend)
สาหรบกลมตอมาคอ กลมคาทระบปจจยทเกยวของกบความรสกผซอขาย โดยกลมดงกลาว
จะแบงปจจยออกเปนทงหมด 9 กลมยอย ประกอบดวยปจจยดานการผลต, ความตองการผบรโภค,
หนวยงานควบคมระดบนามนดบคงคลง, ผลตภณฑมวลรวมภายในประเทศ (GDP), ดชน
ภาคอตสาหกรรม, ดชนดานฤดกาล, กลมประเทศ OPEC, กลมประเทศ Non-OPEC ทผลต
นามนดบ, และดชนภมศาสตรการเมอง (Geopolitics) โดยแตละกลมจะมการกาหนดขอบเขตของ
คาทเกยวของตามทแสดงในรปท 12 ซงขอมลเหลานไดมาจากการสมภาษณเชงลกกบนกวเคราะห
การซอขายนามนดบ
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 15
รปท 12 ปจจยทเกยวของกบความรสกผซอขาย (Sentimental Factor)
สาหรบพจนานกรมขอมลนน สามารถเปลยนแปลงคาทบรรจอยในฐานขอมลไดตามความ
เหมาะสม ขนอยกบบรบทของการวเคราะหและประเภทของกลมคาทพบเจอบอยครงจากแหลงขาว
โดยสงททาใหการบรรจคาในพจนานกรมมความแมนยาเพมขน จะเปนในเรองของความถของคา
และประเภทของเนอขาวทเกยวของกบการขนลงของราคานามนดบ ทงนในสวนของตวแบบจาลองท
ใชในการพยากรณแนวโนมการขนลงของราคานามนดบนนไมสามารถเปดเผยไดเนองจากเปนขอมล
ความลบระหวางผวจยกบบรษท แตเบองตนสามารถนาเสนอตวอยางของแนวทางการวเคราะห
แนวโนมการขนลงของราคานามนดบได โดยสมการทใชในการวเคราะห แสดงดงสมการท (1)
Prediction Trend = Key of Behavior Trend + Sentimental Factor (1)
หมายถง แนวโนมการขนลงของราคานามนดบจะมาจากความสมพนธของกลมคาทระบ
แนวโนมการขนลงของราคา (Behavior Trend) เชอมกบกลมคาทระบปจจยทเกยวของกบ
ความรสกผซอขาย (Sentimental Factor) โดยการพยากรณจะมการเชอมกลมคาระหวาง 2 ตาราง
น ตงแต 2 เงอนไขขนไป เพอวเคราะหวาจากเงอนไขดงกลาวสงผลใหราคานามนดบมแนวโนม
เพมขนหรอลดลง
7. ผลการวจยและบทสรป
จากทไดมการพฒนาระบบฐานขอมลสาหรบการจดเกบขาว รวมถงการนาเทคนคการสกด
ขอมล (Information Extraction)และพจนานกรมขอมล(Data Dictionary) มาใชในการสกดปจจย
ทางดานความรสกของผซอขาย พบวาผใชงานสามารถลดระยะเวลาในการวเคราะหขาวไดสนลง
จากเดมใชเวลาประมาณ 3 นาทตอขาว เหลอใชเวลาเพยง 0.26 นาทตอขาว (คดจากการวเคราะห
ขาวจานวน 30 ขาวใชเวลาเฉลยประมาณ 8 นาท) หรอคดเปนระยะเวลาทส นลงรอยละ 90
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
16 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
นอกจากนเมอผใชงานไดดาเนนการนาเขาขาวเขาไปในระบบจานวน 30 วนและทาการวเคราะห
ผลลพธออกมา พบวาโปรแกรมดาเนนการวเคราะหแนวโนมของขาวตรงกบแนวโนมของราคา
นามนดบจานวน 17 วนหรอคดเปนความแมนยาของการพยากรณรอยละ 60 โดยหลกในการ
พยากรณจะยดตามขอบเขตของคาทพบในพจนานกรมขอมลและรปแบบคาทไดจากเทคนคการ
สกดขอมล ซงผลการเปรยบเทยบระหวางการวเคราะหแนวโนมของราคานามนดบผานเนอขาวใน
ระบบทผวจยพฒนาขนกบราคานามนดบในตลาดจรงแสดงผลตามรปท 13 ถงรปท 14 โดยคาวา
Bull แทนการเพมขนของราคานามนดบ (กาหนดคา factor มากกวา 0) และคาวา Bare แทนการ
ลดลงของราคานามนดบ (กาหนดคา factor นอยกวา 0)
รปท 13 แนวโนมของราคานามนดบในตลาดโลก
รปท 14 ผลการพยากรณแนวโนมการขนลงของราคานามนดบทไดจากโปรแกรม
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 17
ทงน การทผวจยไดดาเนนการพฒนาระบบฐานขอมลสาหรบรวบรวมขาวและสกดขอมลขาว
เพอวเคราะหแนวโนมการขนลงของราคานามนดบผาน Web application นน ทาใหนกวเคราะห
ของบรษทใชเวลาในการวเคราะหขาวไดเรวขน ตลอดจนนกวเคราะหสามารถเปรยบเทยบการ
วเคราะหขาวกบการขนลงของราคานามนดบไดดข นผานการแสดงผลของกราฟในระบบ โดยทใน
อดตทผานมายงไมไดมการพฒนาโปรแกรมลกษณะดงกลาวออกมาอยางแพรหลายในเรองของการ
พยากรณแนวโนมของราคานามนดบในรปแบบขอความ Text File สาหรบการซอขายนามนดบของ
เมองไทย อยางไรกตามระบบดงกลาวยงคงพบขอจากดซงจะนาเสนอในหวขอถดไป
8. ขอจากดและอปสรรค
ทงนในระหวางทมการเกบขอมลและดาเนนการวจยนน ทางผวจยพบปญหาและอปสรรคท
เกยวของกบการสกดขอมลและการกาหนดขอบเขตของคาในพจนานกรมขอมลโดยมรายละเอยด
ดงน
1) ในสวนของการกาหนดขอบเขตของคาในพจนานกรมขอมล บางกลมคายงไมถกบรรจลง
ในพจนานกรมแตพบกลมคาดงกลาวในเนอหาขาว สงผลใหการสกดขอมลเพอไปพยากรณ
แนวโนมราคานามนดบเกดความคาดเคลอน
2) การเพมปรมาณคาศพทหรอกลมคาเขาไปในพจนานกรมขอมลยงเปนลกษณะการเพม
แบบ Manual หมายถง ผพฒนาระบบตองเขามาปรบปรงกลมคาในพจนานกรมขอมลดวยตนเอง
3) สาหรบการพยากรณแนวโนมสถานการณราคานามนดบเปนลกษณะกงอตโนมต
(Semi-Auto Prediction) กลาวคอ มการใชนกวเคราะหชวยในการพยากรณรวมกบการสกดขอมล
และการเปรยบเทยบขอบเขตของคาตามทระบในพจนานกรมขอมลในระบบ ซงทางนกวเคราะหยง
มความจาเปนตองตรวจสอบการวเคราะหอกครง
4) ขอมลทไดยงไมสามารถนาไปใชวเคราะหแนวโนมไดอยางเตมประสทธภาพ
9. ขอเสนอแนะ
จากทไดมการนาเสนอขอจากดและอปสรรคทพบในงานวจยนน ทางผวจยมขอเสนอแนะ
เพมเตม โดยมรายละเอยดดงน
1) กรณแรกและกรณทสอง ควรมการนาแนวคดการเรยนรของเครองจกร (Machine
Learning) ในรปแบบอนๆ มาประยกตใชในการเกบขอมลกลมคาทพบบอยครง ทงกลมคาทพบ
ใหมและกลมคาทคาความถมอทธพลตอทศทางการขนลงของราคานามนดบ เพอทระบบจะได
สามารถปรบปรงจานวนคาทพบไดอยางเหมาะสมมากขน
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
18 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
2) กรณทสามและส ในสวนของการพยากรณแนวโนม ควรมการตอยอดเรองการพฒนา
แบบจาลองสาหรบพยากรณราคานามนดบแบบอตโนมต (Automated Prediction Model) โดยนา
หลกการของปญญาประดษฐ (Artificial Intelligence) อาท หลกการโครงขายประสาทเทยม
(Artificial Neural Network) มาชวยกระบวนการวเคราะหแนวโนมแบบอตโนมตตามคานาหนกของ
ขาวทนาเขาระบบ เพอลดเวลาในการทางานของนกวเคราะห ตลอดจนปรบปรงความแมนยาในการ
พยากรณใหเพมสงขนจากเดม
นอกจากนทางผวจยมขอเสนอแนะเพมเตมเกยวกบการนาผลลพธทไดจากการวเคราะหขอมล
เชงคณภาพมาพยากรณแบบบรณาการรวมกบขอมลเชงปรมาณ เชน พยากรณการเปลยนแปลง
ของราคานามนดบในตลาดเพอใหไดผลลพธทแมนยาขนในลาดบถดไป
กตตกรรมประกาศ
สาหรบงานวจยฉบบนไดร บการสนบสนนทนจากกระทรวงวทยาศาสตรและเทคโนโลย
ตลอดจนไดรบการสนบสนนขอมลจากทางบรษท ปตท. จากด (มหาชน) ทงนผวจยขอขอบพระคณ
สาหรบรายละเอยดขอมลตางๆ ทเปนประโยชนตอการวเคราะหและการพฒนาตนแบบสาหรบการ
พยากรณแนวโนมการขนลงของราคานามน ตลอดจนขอเสนอแนะทเปนประโยชนตอการพฒนา
ตนแบบเพอการพยากรณทดข นในอนาคต
References
[1] EIA.gov [Internet]. Washington: U.S. Energy Information Administration. Crude oil prices
increased in 2016, still below 2015 averages; c2015-2016 [updated 2017 Jan 4;cited
2018 Jan 1]. Available from: https://www.eia.gov/todayinenergy/detail.php?id=29412
[2] Abdullah SN. Machine Learning Approach For Crude Oil Price Prediction [Doctoral
dissertation]. Manchester: The University of Manchester; 2013.
[3] Gupta V, Lehal G. A survey of text mining techniques and applications. Journal of
emerging technologies in web intelligence 2009;1(1):60-76.
[4] Mittermayer MA. Forecasting intraday stock price trends with text mining techniques. In:
system sciences, 2004. Proceedings of the 37th Hawaii international conference on
system sciences; 2004 January 5-8; Hawaii, USA. Hawaii: USA; 2004. p. 10-9.
[5] Kloptchenko A, Eklund T, Karlsson J, Back B, Vanharanta H, Visa A. Combining data
and text mining techniques for analysing financial reports. Intelligent systems in
accounting, finance and management 2004;12(1):29-41.
Faculty of Engineering, Kasem Bundit University Research Article
วศวกรรมสารเกษมบณฑต ปท 9 ฉบบท 1 มกราคม-เมษายน 2562 19
[6] Larsen B, Aone C. Fast and effective text mining using linear-time document clustering.
Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery
and data mining; 1999 August; Verginia, USA. California: USA; 1999. p. 16-22.
[7] Aggarwal CC, Zhai C (Eds.). Mining text data. Springer Science & Business Media;
2012.
[8] Clifton C, Thuraisingham B. Emerging standards for data mining. Computer Standards
& Interfaces 2001;23(3):187-93.
[9] Edge SB, Compton CC. The American Joint Committee on Cancer: the 7th edition of
the AJCC cancer staging manual and the future of TNM. Annals of surgical oncology
2010;17(6):1471-4.
[10] Kilian Lutz. Not all oil price shocks are alike: Disentangling demand and supply shocks
in the crude oil market. American Economic Review 2009; 99(3): 1053-69.
[11] Wang Shouyang, Lean Yu, Kin Keung Lai. A novel hybrid AI system framework for
crude oil price forecasting. Data Mining and Knowledge Management. Springer, Berlin,
Heidelberg; 2005. p. 233-42.
ประวตผเขยนบทความ
ดร.พรพล สทธวจารณ อาจารยสาขาการจดการโลจสตกส คณะโลจสตกส
มหาวทยาลยบรพา 169 ถ.ลงหาดบางแสน ต.แสนสข อ.เมอง จ.ชลบร
20131 โทรศพท 087-7907920 อเมล [email protected]
Interested Field: Operation Research and Warehouse Management
อนรทธ ขนธสะอาด อาจารยสาขาการคาระหวางประเทศฯ คณะโลจสตกส
มหาวทยาลยบรพา 169 ถ.ลงหาดบางแสน ต.แสนสข อ.เมอง จ.ชลบร
20131 โทรศพท 086-8587863 อเมล [email protected]
Interested Field: Operation Research and Supply Chain Management
คณะวศวกรรมศาสตร มหาวทยาลยเกษมบณฑต บทความวจย
20 Kasem Bundit Engineering Journal Vol.9 No.1 January-April 2019
ยทธนา สมสอน กปตน บรษท ชรอน จากด 292/12 หมบานวสตาปารค
ถ.วภาวดรงสต แขวงตลาดบางเขน เขตหลกส กทม. 10210 อเมล
Interested Field: Crude Oil Maritime, Logistics Management
ณฐชย ตงวจนะโยบาย นกวเคราะหและวางแผน บรษท ปตท. จากด
(มหาชน) 555 ถ.วภาวดรงสต แขวงจตจกร เขตจตจกร กทม. 10900 อเมล
Interested Field: Crude Oil Market, Import-Export in Petroleum business
Article History:
Received: August 7, 2018
Revised: February 28, 2019
Accepted: March 4, 2019
Faculty of Engineering, Kasem Bundit University Research Article