Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ...
Transcript of Usability and Security of Dot Captcha · ป ท 10 ฉบ บท 1 มกราคม - ม ถ...
บทความวจยบทความวจย
1วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal
การใชงานไดและความปลอดภยของดอทแคปทชาUsability and Security of Dot Captcha
บทคดยอ
งานวจยนเสนอแนวคดการสรางดอทแคปทชา (Dot
Captcha) ซงเปนแคปทชาแบบตวอกษร โดยไดนำาแนวคด
Gestalt Theoryมาใชรวมในการออกแบบเพอใหไดแคปทชา
ทมนษยเขาใจไดงายในขณะทยากตอการถกตรวจจบจาก
โปรแกรมอตโนมตหรอบอท (Bot) ดอทแคปทชาไดถกนำา
มาทดลองเปรยบเทยบกบรแคปทชา และไมโครซอฟต
แคปทชา กบผเขารวมทดลองจำานวน 10 คน ผลลพธทาง
ดานการใชงานได (Usability) ผเขารวมทดลองสามารถทำา
แบบทดสอบดอทแคปทชาไดถกตองมากทสดโดยผดพลาด
เพยง5ครงเทานนจากการทดลองทงหมด50ครงสวน
ผลลพธในการทดสอบความทนทาน (Robustness) ตอการ
ถกตรวจจบของดอทแคปทชาดวยOCR แสดงใหเหนวา
ดอทแคปทชามความทนทานสง เพราะไมมดอทแคปทชา
ถกจบไดดวยOCRทใชทดสอบไดเลย
คำ�สำ�คญ: แคปทชา แคปชาทตวอกษร การใชงานได
ความทนทาน
Abstract
This research proposed a new text-based CATPCHA,
called Dot CAPTCHA which was designed based upon the
Gastalt Theory in order to create the CAPTCHA which was
simple for users to understand and hard to automatic programs
or BOTs to detect. Dot CAPTCHAs were tested against with
Recaptcha and Microsoft CAPTCHA with 10 participants.
The result of usability was that participants were able to
identify Dot CAPTCHA most accurately and made only five
errors in 50 tests. The result regarding the robustness of Dot
พงศธรแพมณ(Pongthorn Paemanee)*และณฐธนนท หงสวรทธธร (Nuttanont Hongwarittorrn)*
CAPTCHA by being tested against three OCR showed that
Dot CAPTCHAs were very robust since there were no
characters that could be detected by those OCRs.
Keyword: Captcha, Text Captcha, Usability, Robustness.
1. บทนำา
การสรางแคปทชา (CAPTCHA) ในปจจบนมมากมาย
หลากหลายรปแบบโดยจดมงหมายสำาคญของการนำาไปใช
กคอการปองกนความปลอดภยของระบบจากบอท แตการ
พยายามเพมความทนทาน(Robustness) ใหสงขนอาจทำาให
สงผลกระทบตอการใชงานได(Usability)ของมนษยดงนน
ผใชบางคนอาจรสกไมดตอการเขาใชงานของระบบทมแบบ
ทดสอบแคปทชาทยาก
ในงานวจยนผวจยไดสรางดอทแคปทชา(Dot Captcha)
ขนมรปแบบเปนแคปทชาตวอกษร ซงเปนทนยมตาม
เวบไซตทวไป ผใชหลายคนจะพบเหนและคนเคยมากกวา
แคปทชาแบบอนๆ และผใชสามารถใชงานไดโดยงายกวา
แตแคปทชาตวอกษรเปนรปแบบทมความทนทานไดไมสง
มากนกเนองจากเปนแคปทชาทเขาใจไดงายทงตอมนษย
และบอท เทคโนโลยการรจำาอกขระทางภาพหรอโอซอาร
(Optical Character Recognition: OCR) [1]มความกาวหนา
ไปมากทำาใหแคปทชาตวอกษรมโอกาสทจะถกตรวจจบจาก
โปรแกรมไดงาย ดงนน ผวจยจงมการนำาแนวคดของ
Gestalt Theory [2]มาเพมประสทธภาพความทนทานใหกบ
แคปทชาตวอกษรโดยทยงคงการใชงานทงายตอมนษยอย
OCR คอ กระบวนการทางกลไกหรอทางอเลกทรอนกส
เพอแปลภาพของขอความจากการเขยนหรอจากการพมพ
ไปเปนขอความทสามารถแกไขไดโดยเครองคอมพวเตอร
* ภาควชาวทยาการคอมพวเตอร คณะวทยาศาสตรและเทคโนโลย มหาวทยาลยธรรมศาสตร
2 ว�รส�รเทคโนโลยส�รสนเทศ ปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014Information Technology Journal
บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา
และดวยความสามารถและหลกการทำางานของOCRทำาให
กลมคนบางกลมไดนำาความสามารถนมาใชเพอชวยในการ
ตรวจจบการปองกนของเวบไซตทไดใชแคปทชาตวอกษร
เพอหาขอความทถกตองจากการอานรปภาพแคปทชา
Gestalt Theoryเปนทฤษฎการรบรความเขาใจของมนษย
ทมลกษณะเปนเชงนามธรรม ไมมรปแบบทชดเจนแนนอน
มนษยจะเรยนรจากสงเราทเปนสวนรวมไดดกวาสวนยอยซง
หลกการจดระบบการรบรทสำาคญของGestalt Theory เชน
กฎของความใกลชด (Proximity) กฎของความคลายคลง
(Similarity)กฎของความตอเนอง(Continuity)กฎของการ
ตอเตมใหสมบรณ (Closure) มสวนชวยใหดอทแคปทชา
สามารถเพมความทนทานไดมากขนโดยทการใชงานได
สำาหรบมนษยไมสญเสยไปมากเหตผลหลกกคอการขาดหาย
ไปบางสวนของตวอกษรแตยงคงโครงสรางตวอกษรในภาพ
รวมไวได ทำาใหมนษยสามารถทจะรบรและเขาใจตวอกษร
เหลานนไดไมตางจากเดม ในทางกลบกนคอมพวเตอรจะ
มองในเชงลกลงไปอยางละเอยดทำาใหสามารถรบรรายละเอยด
ไดอยางชดเจนแตไมสามารถทจะเขาใจในภาพรวมไดวาสง
นนคออะไร และในสวนของหลกการภาพและพนหลง
(Figure-Ground) จะชวยใหการออกแบบดอทแคปทชาม
ความปลอดภยสงขนเพราะใชสเพยง2สนนคอสขาวและ
สดำา ดงนนหากบอททำาการตรวจจบดอทแคปทชาโดยมอง
สดำาเปนภาพและสขาวเปนพนหลงไมสำาเรจ กเปนไปไดวา
บอทจะกลบการทำางานเปนตรงกนขามเพอหาผลลพธใหม
โดยมองสขาวเปนภาพและสดำาเปนพนหลงแทน ซงการ
ตรวจจบในลกษณะนจงเปนเรองยากตอบอท แตสำาหรบ
มนษยกยงสามารถทอานขอความนนไดโดยไมยาก ดงนน
ดอทแคปทชาถกออกแบบมาใหมความทนทาน และการใช
งานไดทดไมแตกตางกนแมวาจะใชสดำาเปนภาพสขาวเปน
พนหลงหรอสดำาเปนพนหลงสขาวเปนภาพกตาม
2. งานวจยทเกยวของ
Ahmad Salah El Ahmad และคณะ [3] ทำาการทดสอบ
ประสทธภาพความทนทานของแคปทชาตวอกษรในเวบไซต
Megaupload โดยใชการโจมตดวยกระบวนการ Segmentation
เปนสวนสำาคญ กระบวนการนจะแยกชนสวนของภาพตว
อกษรในแคปทชาซงมลกษณะเปนตวอกษรทซอนทบกน
โดยจะแยกเปนชนสวนทมพนทซอนทบกน และชนสวนทไม
เปนสวนซอนทบ จากนนจะนำาชนสวนทมความสมพนธกน
มาหาจดเชอมตอเพอทำาการประกอบกลบเปนตวอกษรปกต
โดยมอตราความสำาเรจ 82%
ขอสงเกตทนาสนใจของแคปทชาใน Megaupload คอ
การใชจำานวนตวอกษรคงทและมเพยง 4 ตวอกษรเทานน
ทำาใหมโอกาสทจะถกคาดเดาไดงาย และการซอนทบกนของ
ตวอกษรนนยงคงมเสนขอบเขตของตวอกษรอย ทำาใหบอท
สามารถทจะรบรรปทรงลกษณะขอบเขตของตวอกษรได
Ahmad Salah El Ahmad และคณะ [4] ทำาการทดสอบ
ประสทธภาพความทนทานของแคปทชาตวอกษร เวบไซต
ทอยภายใตบรษท Google ซ งยงคงใชกระบวนการ
Segmentation เปนสวนสำาคญ แตไดมการปรบปรงเพมเตม
โดยแบงขนตอนการทำางานเปน 3 ระดบ ขนตอนแรกจะ
ทำาการแปลงภาพใหเหลอเพยง 2 ส คอสของภาพสงทสนใจ
กบสของพนหลง ทำาการขจดสงรบกวนขนาดเลกทไมม
โอกาสเปนตวอกษรไดออก โดยแปลงใหเปนสเดยวกนกบ
พนหลง และการใช Zhangs’ Algorithm ทำาใหความหนาของ
พกเซลรปภาพตวอกษรลดลงเหลอเพยง 1 พกเซล ความ
ซบซอนของรปภาพกจะลดนอยลง กระบวนการกำาหนด
คณลกษณะรปทรงตวอกษรในขนตอนทสองกจะทำาไดงาย
ขน ซงในขนตอนนจะทำาการแบงกลมตวอกษรเพอหาวาม
ตวอกษรอยกตว ตรงไหนบาง เปนตวอกษรประเภทใด แบง
เปน 4 กลมคอ Dot Shape เปนลกษณะตวอกษรทมจดอย
ดานบน (เชน i, j) Loop Shape เปนลกษณะตวอกษรทม
ชองวางอยตรงกลาง (เชน A, e, O) Cross Shape เปนลกษณะ
ตวอกษรทมเครองหมายบวกอยดานบนตวอกษร (เชน t)
S Shape เปนลกษณะตวอกษรทมความหนาแนนในแนวตง
(เชน S) ในขนตอนสดทายกจะใชผลลพธจากขนตอน
กอนหนา ระบลกษณะโครงสรางของตวอกษรแตละกลมเพอ
ใชทำาการกำาหนดตำาแหนงทจะทำาการตดแบงสวนตวอกษร
แตละตวออกจากกน โดยมอตราความสำาเรจ 68%
ขอสงเกตทนาสนใจของแคปทชา ใน Google คอ แคปทชา
จะถกทำาใหเหลอเพยง 2 สเทานน โดยสดำาเปนสงทเราสนใจ
และสขาวคอพนหลง ดงนนการใชสทหลากหลายเกนไปกไม
เปนประโยชนตอการปองกนจากบอท เสนหรอสงรบกวน
ตางๆ ทมขนาดเลกเกนกวาจะเปนตวอกษรได จะถกทำาการ
ลบออก และในขนตอนการแบงกลมประเภทตวอกษรเปน
ขนตอนสำาคญทเพมเขามา ทำาใหสามารถระบลกษณะ
3วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal
บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา
โครงสรางของตวอกษรแตละแบบ และทำาการตดแยกออก
มาเปนตวอกษรแตละตวได แมวาตวอกษรของแคปทชาใน
Google จะมลกษณะเปนตวอกษรเอยงและอยชดตดกนกตาม
Recaptcha [5] พฒนาขนโดย Luis von Ahn ผใหกำาเนด
แคปทชาทมใชกนอยางกวางขวางในปจจบน และถกซอไป
ในป 2009 โดย Google จดมงหมายสำาคญของรแคปทชา
นอกจากปองกนเวบไซตจากบอทแลว ยงมสวนชวยในการ
แปลเอกสารตางๆ ทถกสแกนเขามาเปนขอมลรปภาพใน
คอมพวเตอร ซง Ahmad Salah El Ahmad และคณะ อาศย
กระบวนการเชนเดมในการตรวจจบรแคปทชา แตได
ปรบปรงกระบวนการเพมเตมสำาหรบกลมของขอความทไม
สามารถระบแยกตวอกษรออกมาอยางชดเจนได ดวยการใช
ชวงความกวางของตวอกษรแตละตว ทมขนาดคงทเกอบจะ
เทากนชวยในการแบงตวอกษรแตละตวออกมา โดยมอตรา
ความสำาเรจ 46%
ขอสงเกตทนาสนใจของแคปทชาใน รแคปทชา คอ การ
ใชชดตวอกษรทมหมายเลขและสญลกษณอนๆ รวมอยดวย
และภาพตวอกษรทใชไดจากการสแกนหนงสอเกาๆ เขามา
เปนไฟลรปภาพในคอมพวเตอร ทำาใหรแคปทชามความ
ทนทานทสงขน แตนนกทำาใหการใชงานไดตอมนษยกลดตำา
ลงดวย รวมถงการแบงภาพแคปทชาออกเปนสองสวน และ
ขอความในรแคปทชาบางคำามขนาดทยาวมาก อาจสราง
ความสบสนและการใชงานทยากตอมนษยได แตอยางไร
กตาม รแคปทชา กมคำาโดยสวนใหญเปนคำาทมความหมาย
ตามพจนานกรม รวมถงการตอบแบบทดสอบของรแคปทชา
ไมจำาเปนตองทำาถกตองทงหมดครบทกตวอกษรกได
เปนการเพมการใชงานไดตอมนษยในขณะทความทนทานก
ลดตำาลง
Cody Sutherland [6] ไดพจารณาและกลาวสรปโดยรวม
ถงขอดขอเสยของคณลกษณะในแคปทชาตวอกษรทควรนำา
มาปรบใชเพอใหเกดประสทธภาพสงสดของแคปทชาตวอกษร
เกษรนทร และ วรพล [7] สราง Thai CAPTCHA ซงใช
ตวอกษรทเปนภาษาไทยรวมถงกระบวนการทาง Semantic
วธการ คอ สมตวเลขขนมาแลวแปลงเปนขอความภาษาไทย
โดยคำาตอบทถกตอง คอ การคำานวณตวเลขทแสดงออกมา
ในรปแบบขอความ ซงเปาหมายหลกของการปองกนคอ
บอทจากภายนอกประเทศทไมสามารถเขาใจรปแบบภาษา
ไทย แตนนกจะทำาใหการใชงานไดถกจำากดเพยงผใชทร
ภาษาไทยเทานน
Elie Bursztein และคณะ [8] ทำาการวเคราะหความทนทาน
และจดออนของแคปทชา จำานวน 15 รปแบบทพบเหนตาม
Internet ผลการทดสอบสามารถทจะรบรแคปทชาไดเกอบ
ทกรปแบบ โดยท 7 ใน 15 รปแบบสามารถทจะรบรไดทนท
โดยไมตองทำาการปรบปรงอลกอรธมใดๆ เพมเตม ยกเวน
Google แคปทชา และรแคปทชา ทไมสามารถตรวจจบได
3. ก�รสร�งดอทแคปทช�
การสรางดอทแคปทชา อาศยหลกทฤษฎของ Gestalt
เปนสวนสำาคญในการนำามาตอตานกลไกการตรวจจบตว
อกษร โดยการทำาใหตวอกษรไมสมบรณ แตยงคงสภาพ
โดยรวมของตวอกษรอย ทำาใหมนษยยงพอรบรและเขาใจได
แตจะยากตอการตรวจจบของบอท รวมถงอาศยกลไกการสม
เขามาชวยในหลากหลายรปแบบ เชน ขนาด ระยะหาง หรอ
จำานวนซงทำาใหบอทตรวจจบและคาดเดาไดยากในการรบร
รปรางและขอบเขตทแนนอน
3.1 ดอทแคปทช�โดยทฤษฎของ Gestalt
สรางตวอกษรสดำาขนมาเขยนลงบนพนหลงสขาว จากนน
สรางวงกลมสขาว เขยนลงบนตวอกษรในลกษณะสลบไป
สลบมา เพอใหเกดเปนรอยเวาแหวงขาดหายไปบางสวนของ
ตวอกษร สของวงกลมจะเปนสเดยวกนกบพนหลงทำาใหภาพ
สวนทขาดหายกลมกลนไปกบพนหลง ซงวงกลมเปนรปทรง
ทหาเหลยมหามมหาขอบเขตไดยากกวารปทรงอนๆ
การเรยงลำาดบการสรางดอทแคปทชา โดยเรมดวยการ
กำาหนดสพนหลง ตามดวยการสรางขอความตวอกษรใหเปน
คนละสกบพนหลง และสดทายสรางวงกลมทมสเดยวกนกบ
พนหลงทบลงบนตวอกษร จะทำาใหการพลกกลบสกน
ระหวางตวอกษรและพนหลง แสดงผลออกมาไมแตกตางกน
มากและยงคงความทนทานตอการถกตรวจจบตวอกษรได
ดงภาพท 1
ภาพท 1 ผลลพธการกลบคาสกนระหวางสขาวและสดำา
4 ว�รส�รเทคโนโลยส�รสนเทศ ปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014Information Technology Journal
บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา
3.2 การสม
กลไกการสมเปนกระบวนการสรางรปแบบทจะทำาใหบอท
คาดเดาไดยาก โดยการสมจะมการแทรกในกระบวนการ
สรางดอทแคปทชาในหลากหลายรปแบบ เชน ตวอกษรทนำา
มาแสดง ขนาดตวอกษร จำานวนตวอกษร ตำาแหนงตวอกษร
ขนาด และตำาแหนงของวงกลมทใชในการลบบางสวนของ
ตวอกษรออก รปแบบ ขนาด และตำาแหนงของสงรบกวน
ตวอกษรทใชจะมตงแต a-z, A-Z, 0-9 แตจะงดเวนตวอกษร
บางตวทมความคลายคลงกนเพอประโยชนในการปรบแตง
ตวอกษรอนๆ ทจะสามารถทำาไดเพมมากขนนนคอ I, O, Q,
f, i, j, l, o, r, t, 1, 0 ซงตวอกษรเหลานหากถกปรบแตงมาก
เกนไปอาจทำาใหผใชบางคนแยกแยะไมออกกบตวอกษรท
ใกลเคยงกน
การใชสงรบกวนจะใหมการแสดงผลเพยงสวนดานบน
หรอดานลางของดอทแคปทชาเทานน เพอไมใหเกดการปด
ทบหรอปะปนกบตวอกษรจนเกดเปนลกษณะทผดแปลกไป
จากเดมจนผใชงานเกดการเขาใจผดได และรปแบบของสง
รบกวนจะหลกเลยงลกษณะทคลายตวอกษร ซงการสรางสง
รบกวนขนมาเพอสรางความสบสนใหกบบอท จากการทตว
อกษรในดอทแคปทชาถกลบออกไปบางสวนทำาเกดเปนกลม
ของพกเซล (Pixel) ขนาดเลก จะทำาใหสงรบกวนไมถกตด
ออกไปจากการทำางานของบอทดวยการวเคราะหหาปรมาณ
ของกลมพกเซลทมขนาดเลก เนองดวยตวอกษรในดอท
แคปทชาบางตวกมสวนประกอบของกลมพกเซลขนาดเลก
ดวยเชนกน
4. การดำาเนนการทดสอบ
การทดลองใชปจจยควบคมคอรปแบบแคปทชาทม
ทงหมด 3 รปแบบ ไดแก ดอทแคปทชา รแคปทชา และ
ไมโครซอฟตแคปทชา ผทดลอง 1 คนจะทำาทกรปแบบบน
หนาเวบไซตทสรางขนมาโดยเรมจาก ดอทแคปทชา 5 ภาพ
รแคปทชา 5 ภาพ และ ไมโครซอฟตแคปทชา 5 ภาพ ตาม
ลำาดบ ซงแตละรปแบบจะแสดงรปภาพขนมาทละภาพ และ
จะเปลยนไปภาพถดไปเมอผทดลองกดยนยนคำาตอบ โดย
ทำาจนครบทง 5 ภาพ และทำาการบนทกเวลาโดยอตโนมต
ทนท โดยนบเวลาเรมตนตงแตรปภาพของแคปทชาแสดง
ขนมาเรยบรอย และสนสดทนทหลงจากกดยนยนคำาตอบ
จำานวนผทดลองทงหมด 10 คนแบงเปนเพศชาย 4 คน
หญง 6 คน โดยแบงผทดลองทงหมดตามอาย มนอยกวา
15 ป 1 คน อายระหวาง 15 ถง 60 ป 8 คน และอายมากกวา
60 ป 1 คน และแบงผทดลองทงหมดตามอาชพ มโบรกเกอร
1 คน พนกงานออฟฟศ 3 คน นกเรยน 1 คน พนกงานดาน
IT 5 คน
รแคปทชา และไมโครซอฟตแคปทชา ทใชทดสอบไดมา
จากเวบไซต รแคปทชา 50 รป และเวบไซต Hotmail 30 รป
โดยแตละภาพของ รแคปทชา และไมโครซอฟตแคปทชาได
รบการทดสอบและบนทกคำาตอบทถกตองเอาไว ซงแตละ
รปภาพของ รแคปทชา และ ไมโครซอฟตแคปทชา จะถก
เลอกสมออกมาแสดง
แคปทชาทกรปแบบจะแสดงออกมาทละภาพไมใหซำากบ
รปภาพเดมตลอดการทดสอบทง 5 ภาพ ในแตละรปแบบ
ของผทดลองแตละคน เมอผทดลองทำาการทดสอบ แคปทชา
ทง 3 รปแบบเสรจ กจะไดรบแบบสอบถามใหประเมน
แคปทชาทง 3 รปแบบ โดยแบบสอบถามมทงหมด 8 ขอ
สำาหรบแคปทชาทกแบบ และมเกณฑการใหคะแนนในแตละ
ขอ 5 ระดบ
งานวจยนพฒนาโดยใช Microsoft Visual Studio 2010
สราง Project เปน Web Application และใชภาษา VB โดย
เกบขอมลลงใน Database ของ Microsoft SQL Server 2008
R2 Express
5. ผลการทดลอง
ผเขารวมทดลองมทงหมด 13 คน แตมปญหาเกดขนจาก
การสมภาพแคปทชาในชดของรแคปทชา และไมโครซอฟต
แคปทชา ทำาใหมผทดลองจำานวน 3 คน ไดรบภาพจากการ
ภาพท 2 ดอทแคปทชา รแคปทชา และ ไมโครซอฟต
แคปทชา
5วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal
บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา
สมเลอกภาพซำากบภาพเดมทไดทดสอบไปกอนหนา จงทำา
ใหขอมลตางๆ ทไดจากการทดสอบของผทดลองทง 3 คน
ไมเหมาะสมทจะนำามาเปรยบเทยบ ดงนนผลลพธทไดจาก
การทดลองจะตดขอมลของผทดลองทง 3 คนนแยกออก
แตจะนำาขอมลมาใชในการวเคราะหดานอนๆ ในภายหลง
สวนการสมเลอกแคปทชา มการปรบปรงใหมและสามารถใช
ทำาการทดลองไดเปนปกต
การตรวจสอบความถกตองของคำาตอบใหถอวาผทดสอบ
ใชตวพมพใหญหรอพมพเลกมความหมายเดยวกน เพราะ
ในรแคปทชาและไมโครซอฟตแคปทชากมลกษณะเชน
เดยวกนและผลลพธทไดจากการทดลอง จะนำาไปคำานวณหา
คาทางสถตโดย ความถกตอง (Correctness) คอ จำานวนท
ผทดลองตอบแคปทชาไดถกตอง ความเรว (Speed) คอ เวลา
ทใชในการทดลองแคปทชาแตละแบบ และ คะแนนความพง
พอใจ (Satisfaction) คอ คะแนนทผทดลองใหในแบบสอบถาม
สำาหรบแคปทชาแตละแบบ ตวอยางในตารางท 1
ผลการทดลองดานความถกตองของแคปทชาทง 3
รปแบบเปนอสระตอกน
จากตารางท 2 สรปไดวาผทดลองสามารถทำาการ
ทดสอบในดอทแคปทชา ไดถกตองมากกวา รแคปทชา
และ ไมโครซอฟตแคปทชา โดยทในไมโครซอฟตแคปทชา
ผทดลองสามารถทำาไดถกตองมากกวา รแคปทชา
ผลการทดลองดานความเรวของแคปทชา ทง 3 รปแบบ
ใหผลลพธไมแตกตางกน แตขอมลทไดมความไมเปนอสระ
ตอกน เนองจากไมมการสมลำาดบในการทำาแบบทดสอบ
แคปทชาแตละรปแบบ โดยผทดลองทกคนจะมลำาดบการทำา
แบบทดสอบแคปทชาเหมอนกน คอเรมจากอนดบแรก
ดอทแคปทชา อนดบทสอง รแคปทชา และอนดบสดทาย
ไมโครซอฟตแคปทชา ดงนนในการทดลองอาจทำาใหการทำา
แบบทดสอบของผทดลองในแคปทชาทง 3 รปแบบไมเทา
เทยมกน
ผลการทดลองดานความพงพอใจตอแคปทชาทง 3
รปแบบเปนอสระตอกน และใหผลลพธไมแตกตางกน
ตารางท 1 รายละเอยดผลการทดลอง
N Mean S.D. Min Max
Correct
ดอทแคปทชา 10 4.50 0.707 3 5
รแคปทชา 10 2.90 1.663 0 5
ไมโครซอฟต
แคปทชา10 3.80 1.135 1 5
Total 30 3.73 1.363 0 5
Speed
ดอทแคปทชา 10 63.90 22.590 36 121
รแคปทชา 10 67.90 40.018 35 163
ไมโครซอฟต
แคปทชา10 60.70 23.669 29 117
Total 30 64.17 28.952 29 163
Satisfaction
ดอทแคปทชา 10 28.60 5.502 19 35
รแคปทชา 10 28.80 4.872 23 36
ไมโครซอฟต
แคปทชา10 27.50 6.519 16 35
Total 30 28.30 5.503 16 36
ตารางท 2 เปรยบเทยบผลลพธในดานความถกตอง
(I) ชนดของ
แคปทช�
(J) ชนดของ
แคปทช�
Mean Difference
(I - J)Sig.
ดอทแคปทชา รแคปทชา 1.600 0.077
ดอทแคปทชาไมโครซอฟต
แคปทชา0.700 0.134
รแคปทชาไมโครซอฟต
แคปทชา- 0.900 0.440
ตารางท 3 ผลคะแนนแบบสอบถามจากผทดลองแยก
ตามกลมคำาถาม
คำ�ถ�ม ดอทแคปทช� รแคปทช�ไมโครซอฟต
แคปทช�
1. ความเขาใจในแบบทดสอบ 34 36 36
2. ความงายในการทำาแบบทดสอบ 40 38 36
3. ความสะดวกรวดเรวในการทำา
แบบทดสอบ38 37 34
4. ความชดเจนของขอความท
แสดงในแบบทดสอบ35 37 31
5. ความเหมาะสมในการจดวาง
ขอความในแบบทดสอบ33 35 36
6. ความเหมาะสมของลกษณะ
ตวอกษรทใชในแบบทดสอบ33 33 32
7. ความเหมาะสมของภาพทแสดง
ในแบบทดสอบ35 36 35
8. ความพงพอใจในแบบทดสอบ 38 36 35
6 ว�รส�รเทคโนโลยส�รสนเทศ ปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014Information Technology Journal
บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา
ผลการทดลองในสวนของความทนทาน ไดทำาการ
ทดสอบแคปทชาทง3แบบดวยOCRชอOCR Image to
Text Conversion ToolซงเปนDemo Version โดยผลลพธท
ไดจากการทดสอบคอOCRไมสามารถใหคำาตอบทถกตอง
ในทกแบบแตมขอนาสงเกตในรแคปทชาและไมโครซอฟต
แคปทชา สามารถรบรตวอกษรไดบางสวน ในขณะทดอท
แคปทชาใหผลลพธออกมาประกอบดวยสญลกษณตางๆท
ไมไดอยบนคยบอรด นอกจากนยงไดทดสอบกบเวบไซต
ชอ free-ocr.com และ i2ocr.com พบวาในรแคปทชา และ
ไมโครซอฟตแคปทชา สามารถรบรตวอกษรไดบางสวน
เชนกน แตสำาหรบดอทแคปทชาไมพบตวอกษรทสามารถ
รบรไดโดยแสดงขอความเตอนวา“Sorry, we could not find
any text in your image.”ในfree-ocr.comและ“Error-The
requested service could not be completed for technical reasons.
Please contact [email protected]”ในi2ocr.com
6. บทวเคราะห
6.1 ขอผดพลาดทเกดขน
จากการทดสอบของผทดลองจำานวน 10 คน ในการทำา
แบบทดสอบดอทแคปทชา คนละ 5 รปภาพ มการตอบผด
เกดขนทงหมด 5 รปภาพ จากทงหมด 50 ครง
จากภาพท 3 ผทดลองไดตอบออกมาวา ua6qvvaha ซง
คำาตอบทถกตองคอ ua6qvvaha7 อาจเกดจากการทผทดลอง
ทำาแบบทดสอบทรวดเรวมากเกนไป จงขาดความรอบคอบ
พมพ 7 ขาดไปหนงตวอกษร
จากภาพท 4 ผทดลองไดตอบออกมาวา gqhpekvau ซง
คำาตอบทถกตองคอ gqhpekvdu เกดจากการทตวอกษร d ถก
ลบออกไปบางสวน จนทำาใหตวอกษร d มลกษณะทคลาย a
จากภาพท 5 ผทดลองไดตอบออกมาวา 2gP.aBqS ซงคำา
ตอบทถกตองคอ 2gPaBqS เกดจากการทมสงรบกวน
ลกษณะคลายตวอกษรจดบนคยบอรดแทรกอยใกลๆ กบ
กลมของตวอกษร
จากภาพท 6 ผทดลองไดตอบออกมาวา C5nb3yMLAA
ซงคำาตอบทถกตองคอ C5nb3vMLAA อาจเกดจากการท
ตวอกษร v ถกลบออกไปบางสวน จนเวาแหวงทำาใหผทดลอง
เกดความสบสนไดวาเปน y
จากภาพท 7 ผทดลองไดตอบออกมาวา p8ADFh JP4N
ซงคำาตอบทถกตองคอ p8ADFhJP4N เกดจากการทระยะ
หางตวอกษรมมากจนทำาใหผทดลองมองเปนชองวาง และ
ไดทำาการพมพใสมาในคำาตอบดวย
6.2 ขอสงเกตอนๆ
การแบงคำาเปน 2 สวนของ รแคปทชา ทำาใหผทดสอบ
บางคนเขาใจผดจากการพมพขอความลงไปเพยงสวนเดยว
เทานน และในบางรปภาพทขอความยาวมากๆ และแสดง
ผลไมชดเจนของ รแคปทชา ผทดลองบางคนพมพตวอกษร
ซงอยตดกน 5 ตวอกษรขาดหายไป และผทดลองบางคนอาจ
ใชความคนเคยกบคำาในการทำาแบบทดสอบ จนสงผลใหตอบ
แบบทดสอบผดได เชน lypvkhtlm เปน LYPVKHtml
ขอความทยาวมากๆ ในแคปทชา ผทดลองบางคนอาจ
ตอบแบบทดสอบผดจากการพมพทเรวเกนไป ทงทควรจะ
ถก เชน oliesvi twenty-five เปน oliesvi tewenty-five
บางกรณการพมพตวอกษรผดเกดจากการกดปมตว
อกษรซงอยตดกนบนคยบอรดแทน เชน xt5ppxxp เปน
Zt5PPXxp
ภาพท 3 ดอทแคปทชา ทผทดลองตอบผดแบบท 1
ภาพท 4 ดอทแคปทชา ทผทดลองตอบผดแบบท 2
ภาพท 5 ดอทแคปทชา ทผทดลองตอบผดแบบท 3
ภาพท 7 ดอทแคปทชา ทผทดลองตอบผดแบบท 5
ภาพท 6 ดอทแคปทชา ทผทดลองตอบผดแบบท 4
7วารสารเทคโนโลยสารสนเทศปท 10 ฉบบท 1 มกราคม - มถนายน 2557Vol. 10, No. 1, January - June 2014 Information Technology Journal
บทความวจย : การใชงานไดและความปลอดภยของดอทแคปทชา
นอกจากนดอทแคปทชาไดทำาการทดสอบกบชายอาย 72
ซงมภาวะทางสายตาเปนตอหนบางสวน โดยใหทำาการ
ทดสอบดวยการอานใหฟงเพยงอยางเดยว และตอบออกมา
ดวยการพดคำาตอบทยนยนแลว เนองจากภาวะทางสายตา
ไมสามารถทจะอานตวอกษรบนคยบอรดได โดยทำาการอาน
ภาพทงหมด 3 รปแบบ รปแบบละ 5 รปภาพเทาๆ กนกบ
ผทดลองคนอนๆ ซงผลปรากฏวา ในไมโครซอฟตแคปทชา
ตอบผดหมดทกรป ในขณะทรแคปทชากตอบผดหมดเชน
กน โดยทการอานทำาไดลำาบากมาก
สำาหรบการอานดอทแคปทชา สามารถทำาไดดเทยบเทา
คนปกตโดยตอบผดเพยงตวอกษรเดยว นนคอตอบ e เปน
8 แตเปนทนาสงเกตวาในภาพอนๆ ทรปแบบเดยวกน โดย
มตวอกษร e เชนเดยวกน แตกลบสามารถตอบไดถกตอง
7. สรป
งานวจยนตองการสรางแคปทชาตวอกษร ใหมการใชงาน
ไดทงายตอมนษยและยงคงมความทนทานทดอย การนำา
ทฤษฎของ Gestalt มาใชจงเปนสงสำาคญ รวมถงกลไก
การสมทชวยใหดอทแคปทชาประสบความสำาเรจไดตาม
เปาหมาย โดยผทดลองมการตอบผดเพยง 5 ครง จาก
ทงหมด 50 ครง ซงดกวารแคปทชา และไมโครซอฟต
แคปทชา ในขณะทความทนทานของดอทแคปทชา จากการ
ทดสอบกบ OCR ผลลพธคอ OCR ไมสามารถใหคำาตอบท
ถกตองได
งานวจยนไมเพยงนำาเสนอแคดอทแคปทชาเทานน แตยง
แสดงใหเหนวาการใชทฤษฎ Gestalt กบแคปทชารปแบบ
ตวอกษร ซงหากใชไดอยางถกตองกจะสามารถใหประโยชน
ไดอยางมาก โดยการสญเสยการใชงานไดจะเกดขนนอยลง
ในขณะทความทนทานมความแขงแรงมากขน
งานวจยนเปนเพยงการศกษาเบองตน ในอนาคตผวจย
มแนวคดในการเพมประสทธภาพความทนทานใหกบ
ดอทแคปทชาขนไปอก โดยทไมใหกระทบกบการใชงานได
ของมนษย ซงลกษณะตวอกษรของดอทแคปทชาทอานได
งายสามารถทจะเพมเทคนคอนๆ เพอใหความทนทานม
ความแขงแรงมากขนได เชน Semantic และเพมการทดสอบ
แคปทชากบเครองมอ หรอกระบวนการอนๆ ใหมากขน
8. เอกส�รอ�งอง
[1] วศน สนธภญโญ. “Thai OCR Technology.” LibCamp#1
Book Digitization, กรงเทพมหานคร: ประเทศไทย
30 เมษายน 2552.
[2] วจตพาณ เจรญขวญ. ระบบและทฤษฎทางจตวทยา,
ภาควชาจตวทยา คณะศกษาศาสตร มหาวทยาลย
รามคำาแหง.
[3] A.S. El Ahmad, J. Yan and L. Marshall. “The robustness
of a new CAPTCHA.” In Proceedings of the Third
European Workshop on System Security, Paris, France,
pp. 36-41, 2010.
[4] A.S. El Ahmad, J. Yan and M. Tayara. “The Robustness
of Google CAPTCHAs.” Computing Science, Newcastle
University, UK, September 2011.
[5] L. V. Ahn, B. Maurer, C. McMillen, D. Abraham and
M. Blum. “reCAPTCHA: Human-Based Character
Recognition via Web Security Measures.” Science
Magazine, Vol. 321, No. 5895, pp. 1465-1468,
September 2008.
[6] C. Sutherland. “Usability and Security of Text-based
CAPTCHAs.” UMM CSci Senior Seminar Conference,
Morris, May 2012.
[7] เกษรนทร ชาวเกวยน และ วรพล ลลาเกยรตสกล.
“Thai CAPTCHA: Construction and Analysis.”
Journal of Information Science and Technology,
Vol. 2, Issue 2, pp. 56-64, July-December 2011.
[8] E. Bursztein, M. Martin and J. C. Mitchell. “Text-based
CAPTCHA Strengths and Weaknesses.” In Proceedings
of the 18th ACM conference on Computer and
communications securi ty , New York, USA,
pp. 125-138, 2011.