อาจารย์ผู้สอน อติโรจน์ วงษ์วัช ... ·...

22
อาจารย์ผู้สอน อติโรจน์ วงษ์วัชรศักดิคณะบริหารศาสตร์ สาขาวิชาคอมพิวเตอร์ธุรกิจ มหาวิทยาลัยเฉลิมกาญจนา

Transcript of อาจารย์ผู้สอน อติโรจน์ วงษ์วัช ... ·...

อาจารย์ผู้สอน อติโรจน์ วงษ์วัชรศักดิ์คณะบริหารศาสตร์ สาขาวิชาคอมพิวเตอร์ธุรกิจ

มหาวิทยาลัยเฉลิมกาญจนา

ข้อมูล (Data) คือ ข้อเท็จจริงที่มีการรวบรวมไว้และมีความหมาย อาจเกี่ยวข้องกับคน สิ่งของหรือเหตุการณ์อื่นๆ ในการประมวลผลของคอมพิวเตอร์ นิยมใช้เป็นส่วนน าเข้าพื้นฐานเพื่อให้ได้สารสนเทศส าหรับการช่วยตัดสินใจและน าเอาไปใช้ประโยชน์อื่นๆ อีกได้ตามต้องการ

2

แหล่งข้อมูลภายใน เป็นแหล่งก าเนิดของข้อมูลที่อยู่ภายในองค์กรทั่วไป ข้อมูลที่ได้มานั้นอาจมาจากพนักงานหรือมีอยู่แล้วในองค์กร เช่น ยอดขายประจ าปี ข้อมูลผู้ถือหุ้น รายงานก าไรขาดทุน รายชื่อพนักงาน ฯลฯ

แหล่งข้อมูลภายนอก เป็นแหล่งก าเนิดข้อมูลที่มาจากภายนอกองค์กร โดยทั่วไปแล้วสามารถน าข้อมูลต่างๆ เหล่านั้นมาใช้ประโยชน์ในองค์กร หรือน ามาใช้กับการประมวลผลด้วยคอมพิวเตอร์ เพื่อให้ได้ระบบงานที่สมบูรณ์ขึ้น เช่น ข้อมูลลูกค้า เจ้าหนี้ อัตราดอกเบี้ยสถาบันการเงิน

3

• ความถูกต้อง (Accuracy) ข้อมูลที่ดีต้องมีความถูกต้องเพื่อให้สามารถน าเอาไปใช้ประโยชน์ได้

• มีความเป็นปัจจุบัน (Update) ข้อมูลที่ดีต้องมีการปรับปรุงแก้ไขให้มีความเป็นปัจจุบันอยู่เสมอ

• ตรงตามความต้องการ (Relevance) ควรมีการส ารวจขอบเขตของข้อมูลที่จะน ามาใช้ เพื่อให้สอดคล้องและตรงกับความต้องการของหน่วยงานให้ได้มากที่สุด

• ความสมบูรณ์ (Complete) ข้อมูลจะต้องมีความสมบูรณ์มากพอ จึงจะน าเอาไปใช้ให้เกิดประโยชน์อย่างเต็มที่

4

• สามารถตรวจสอบได้ (Verifiable) ข้อมูลที่มีอยู่ในปัจจุบันอาจได้มาจากแหล่งข้อมูลหลายๆ ที่ ซึ่งอาจมีทั้งข้อมูลที่เชื่อถือได้หรือข้อมูลซึ่งเป็นกลลวงของคู่แข่งขัน ดังนั้นหากต้องการน ามาประมวลผลจึงควรเลือกข้อมูลที่สามารถตรวจสอบแหล่งที่มาได้ หรือแหล่งที่มีหลักฐานอ้างอิงได้ เพื่อป้องกันข้อมูลที่ไม่เกิดประโยชน์และอาจน าผลเสียหายมาได้

5

• บิต (Bit) เป็นล าดับชั้นของหน่วยข้อมูลที่เล็กที่สุด• ไบต์ (Byte) เมื่อน าบิตมารวมกันหลายๆ บิต จะได้หน่วยข้อมูลกลุ่มใหม่ที่

เรียกว่า ไบต์ (Byte)• ฟีลด์ (Filed) ฟีลด์ หรือเขตของข้อมูล ประกอบด้วยกลุ่มของไบต์หรือตัวอักษร

ตั้งแต่ 1 ตัวขึ้นไป มาประกอบกันเป็นหน่วยของข้อมูลที่ใหญ่ขึ้น แล้วแสดงลักษณะหรือความหมายอย่างใดอย่างหนึ่ง

6

• เรคอร์ด (Record) เป็นกลุ่มของฟีลด์หรือเขตข้อมูลที่มีความสัมพันธ์กัน และน ามาจัดเก็บรวมกันเป็นหน่วยใหม่ที่ใหญ่ขึ้น ปกติในการจัดการข้อมูลใดๆ มักประกอบด้วยเรคอร์ดหลายๆ เรคอร์ด ทั้งนี้ข้ึนอยู่กับขนาดของข้อมูลเป็นหลัก

• ไฟล์ (File) ไฟล์ หรือแฟ้มตารางข้อมูล เป็นการน าเอาข้อมูลทั้งหมดหรือหลายๆ เรคอร์ด ที่ต้องการจัดเก็บมารวมอยู่ในรูปแบบของแฟ้มตารางข้อมูลเดียวกัน

7

ฐานข้อมูลเกิดจากการวบรวมเอาแฟ้มตารางข้อมูลหลายๆ แฟ้มที่มีความสัมพันธ์กันมาเก็บรวบรวมกันไว้ที่เดียว โดยจะมีการเก็บค าอธิบายเกี่ยวกับโครงสร้างฐานข้อมูลหรือที่เรียกว่า พจนานุกรมข้อมูล (Data Dictionary) ซึ่งใช้อธิบายลักษณะของข้อมูลที่เก็บไว้

8

1. โครงสร้างของแฟ้มข้อมูลแบบเรียงล าดับ (Sequential File Structure)เป็นโครงสร้างของแฟ้มข้อมูลชนิดพื้นฐานที่สามารถใช้งานได้ง่ายที่สุด เนื่องจากมี

ลักษณะการจัดเก็บข้อมูลแบบเรียงล าดับเรคอร์ดต่อเนื่องกันไปเรื่อยๆ การอ่านหรือสืบค้นข้อมูลจะข้ามล าดับไปอ่านตรงต าแหน่งใดๆ ที่ต้องการโดยตรงไม่ได้ เมื่อต้องการอ่านข้อมูลที่เรคอร์ดใดๆ โปรแกรมจะเริ่มอ่านตั้งแต่เรคอร์ดแรกไปเรื่อยๆ จนกว่าจะพบเรคอร์ดที่ต้องการ จึงจะเรียกค้นคืนเรคอร์ดนั้นขึ้นมา

9

2. โครงสร้างของแฟ้มข้อมูลแบบสุ่ม (Direct/Random File Structure)เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่เข้าถึงได้โดยตรง เมื่อต้องการอ่านค่าเร

คอร์ดใดๆ สามารถเลือกหรืออ่านค่านั้นได้ทันที ไม่ต าเป็นต้องอ่านเรคอร์ดแรกๆ เหมือนกับแฟ้มข้อมูลแบบเรียงล าดับ ซึ่งท าให้การเข้าถึงข้อมูลท าได้รวดเร็วกว่า แบ่งตามลักษณะการท างานได้เป็น 2 ประเภทคือ

10

2.1 แบบแฮชไฟล์ (Hash File) เป็นลักษณะโครงสร้างที่มีการเข้าถึงแบบสุ่มซึ่งอาศัยอัลกอริทึมที่เรียกว่า แฮชชิ่ง (Hashing) ในการค านวณหาค่าคีย์ฟีลด์ให้เป็นต าแหน่งที่ใช้จัดเก็บข้อมูล

2.2 แบบดรรชนี (Indexed File) โครงสร้างของแฟ้มข้อมูลชนิดนี้จะใช้วิธีเข้าถึงข้อมูลโดยมีการสร้างแฟ้มดรรชนี (Index) เพื่อช่วยในการค้นหาหรือเข้าถึงข้อมูลโดยตรงให้รวดเร็วและสะดวกขึ้น

11

3. โครงสร้างของแฟ้มข้อมูลแบบล าดับเชิงดรรชนี (Index Sequential File Structure)เป็นลักษณะของโครงสร้างแฟ้มข้อมูลที่อาศัยกระบวนการที่เรียกว่า ISAM

(Index Sequential Access Method) ซึ่งรวมเอาความสามารถในการเข้าถึงข้อมูลแบบสุ่มและแบบเรียงตามล าดับเข้าไว้ด้วยกัน

12

แบบเรียงล าดับ (Sequential File Structure)ข้อดี• มีค่าใช้จ่ายน้อยและใช้งานได้ง่ายกว่าวิธีอื่นๆ• เหมาะกับงานประมวลผลที่มีการอ่านข้อมูลแบบเรียงล าดับและในปริมาณมาก• สื่อที่ใช้เก็บเป็นเทปบันทึกข้อมูลซึ่งมีราคาถูก

13

แบบเรียงล าดับ (Sequential File Structure)ข้อเสีย• การท างานเพื่อค้นหาข้อมูลจะต้องเริ่มท าตั้งแต่ต้นไฟล์เรียงล าดับไปเรื่อย

จนกว่าจะหาข้อมูลนั้นเจอ ท าให้เสียเวลาค่อนข้างมาก• ข้อมูลที่ใช้ ต้องมีการจัดเรียงล าดับก่อนเสมอ• ไม่เหมาะสมกับงานที่ต้องแก้ไข/เพิ่ม/ลบข้อมูลเป็นประจ า เช่น งานธุรกรรม

ออนไลน์ (Online Transaction Processing)

14

แบบสุ่ม (Random File)ข้อดี• สามารถท างานได้เร็ว เพราะเข้าถึงข้อมูลเรคอร์ดแบบเร็วมาก เนื่องจากไม่ต้อง

เรียงล าดับข้อมูลก่อนเก็บลงไฟล์• เหมาะกับการใช้งานธุรกรรมออนไลน์ (Online Transaction Processing)

หรืองานที่ต้องแก้ไข/เพิ่ม/ลบรายการ เป็นประจ า

15

แบบสุ่ม (Random File)ข้อเสีย• ไม่เหมาะกับงานประมวลผลที่ต้องอ่านข้อมูลในปริมาณมาก• การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน• ไม่สามารถเข้าถึงข้อมูลแบบเรียงล าดับได้

16

แบบล าดับเชิงดรรชนี (Indexed Sequential File) ข้อดี• สามารถรองรับการประมวลผลได้ทั้ง 2 แบบคือ แบบเรียงล าดับ และแบบสุ่ม• เหมาะกับงานธุรกรรมออนไลน์ (Online Transaction Processing)

17

แบบล าดับเชิงดรรชนี (Indexed Sequential File) ข้อเสีย• สิ้นเปลืองเนื้อที่ในการจัดเก็บดรรชนีที่ใช้อ้างอิงถึงต าแหน่งของข้อมูล• การเขียนโปรแกรมเพื่อค้นหาข้อมูลจะซับซ้อน• การท างานช้ากว่าแบบสุ่ม และมีค่าใช้จ่ายสูง

18

แฟ้มข้อมูลต่างๆ เช่น แฟ้มข้อมูลลูกค้า แฟ้มข้อมูลสินค้า แฟ้มข้อมูลพนักงาน สามารถน ามาประมวลผลเพื่อเอาไปใช้งานอื่นๆ ได้ แต่มีข้อเสียคือท าให้ข้อมูลมีความซ้ าซ้อมกัน (Data Redundancy) โดยเฉพาะในหน่วยงานที่จัดเก็บข้อมูลแยกกันไว้ต่างหาก และมีการจัดการข้อมูลกันเอง

19

ระบบฐานข้อมูล สามารถใช้งานได้ทั้งกับเครื่องคอมพิวเตอร์เครื่องเดียว (Stand Alone) เช่น ระบบฐานข้อมูลสินค้าคงคลังส าหรับองค์กรขนาดเล็กที่ต้องจัดเก็บฐานข้อมูลสินค้าไว้เฉพาะในคอมพิวเตอร์ที่พนักงานบัญชีใช้เพียงเครื่องเดียวหรือจะประยุกต์ใช้กับเครื่องคอมพิวเตอร์แบบแม่ข่าย (Server) ผ่านระบบ LAN หรืออินเทอร์เน็ตก็ได้ ทั้งนี้ขึ้นอยู่กับลักษณะของงานที่ต้องการเป็นหลัก

20

21

แนวคิดการใช้ฐานข้อมูล

รักษาความคงสภาพข้อมูล (Improved Data Integrity)

ใช้ข้อมูลร่วมกัน (Shared Data)

ง่ายต่อการเข้าถึงข้อมูล (Easier Access)

ลดเวลาพัฒนาระบบงาน (Reduced Development Time)

ลดความซ้ าซ้อนของข้อมูล (Reduced

Data Redundancy)

ลดความขัดแย้งของข้อมูล (Reduced

Data Inconsistency)

โดยปกติในการจัดการฐานข้อมูลด้วยคอมพิวเตอร์นั้นจะมีโปรแกรมที่เรียกว่า ระบบจัดการฐานข้อมูล หรือ DBMS (Database Management System) ซึ่งเปรียบเสมือนเป็นผู้จัดการฐานข้อมูลนั่นเอง โปรแกรมประเภทนี้มีจ าหน่ายอยู่ในตลาดหลายระบบด้วยกัน แต่ที่ได้รับความนิยมและเป็นที่รู้จักกันดีคือ ระบบจัดการฐานข้อมูลเชิงสัมพันธ์ หรือ RDBMS (Relational Database Management System) เช่น Oracle, Sybase, Microsoft SQL Server, Microsoft Access, MySQL หรือ DB2 เป็นต้น

22